NVIDIA AI расширила свою платформу Megatron Core, добавив поддержку продвинутых оптимизаторов, таких как Muon, а также исследовательских оптимизаторов, таких как MOP и REKLS. Эта разработка направлена на повышение эффективности обучения крупномасштабных моделей, включая модели масштаба Kimi K2 и Qwen3 30B. В объявлении подчеркивается необходимость использования методов, выходящих за рамки стандартных методов параллельной обработки данных, для достижения эффективного обучения моделей. Однако конкретные показатели производительности или детали реализации не были предоставлены.