#1244430
Сопоставьте понятия и их описания:
Варианты ответа:
- Введение в обучение с подкреплением
- Policy gradients
- Подкрепление
- область исследования машинного обучения, связанная с разработкой алгоритмов для обучения интеллектуальных агентов на основе обратной связи
- метод обучения, основанный на оптимизации функции направленного градиента политики
- техника формирования ловушек с целью обучения агента, использующая систему наград и штрафов
Курсы в категории:
Экономика и управление