#1249592
Во время обучения машинному обучению размер мини-партии предпочтительно равен степени двойки, например 256 или 512. В чем причина этого?
Варианты ответа:
- Когда мини-пакет является четным, алгоритм градиентного спуска обучается быстрее
- Для Mini-Batch установлено значение 2, чтобы удовлетворить требования к памяти процессора и графического процессора и облегчить параллельную обработку
- Функция потерь нестабильна, когда четные числа не используются
- С четными числами проще работать
Курсы в категории:
Информационные технологии