#1249592
Во время обучения машинному обучению размер мини-партии предпочтительно равен степени двойки, например 256 или 512. В чем причина этого?
Варианты ответа:
  • Когда мини-пакет является четным, алгоритм градиентного спуска обучается быстрее
  • Для Mini-Batch установлено значение 2, чтобы удовлетворить требования к памяти процессора и графического процессора и облегчить параллельную обработку
  • Функция потерь нестабильна, когда четные числа не используются
  • С четными числами проще работать
Курсы в категории: Информационные технологии