#1244430
Сопоставьте понятия и их описания:
Варианты ответа:
  • Введение в обучение с подкреплением
  • Policy gradients
  • Подкрепление
  • область исследования машинного обучения, связанная с разработкой алгоритмов для обучения интеллектуальных агентов на основе обратной связи
  • метод обучения, основанный на оптимизации функции направленного градиента политики
  • техника формирования ловушек с целью обучения агента, использующая систему наград и штрафов
Курсы в категории: Экономика и управление