Луо Фули из Xiaomi о посттренировочной эре больших моделей

Ло Фули, руководитель команды по большим моделям в Xiaomi, объявил о значительном сдвиге в ландшафте больших моделей — от эпохи Chat к эпохе Agent, с акцентом на постобучение. Этот переход изменил стратегии распределения вычислительных ресурсов: теперь соотношение вычислений на этапах предобучения и постобучения среди ведущих команд достигло 1:1. Ранее в эпоху Chat это соотношение было 3:5:1. Ло отметил, что теперь внимание сосредоточено на масштабировании обучения с подкреплением для агентов, что требует изменений в архитектуре системы для поддержки сложных рабочих процессов и гетерогенного планирования кластеров.

Вам также может понравиться