Meituan запустила свою новую модель с триллионом параметров, LongCat-2.0, которая будет открытым исходным кодом, согласно сообщениям от 30 июня. Данные для предварительного обучения модели превышают 30 триллионов токенов и включают китайский, английский, несколько других языков и код. Команда LongCat решила проблемы обучения на отечественных вычислительных мощностях, такие как сбои оборудования и аномалии связи, улучшив стабильность, точность и эффективность. Они достигли снижения ежемесячного уровня сбоев на 70% благодаря обработке исключений HCCL и автоматическому восстановлению после сбоев. Кроме того, они обеспечили точность обучения с помощью детерминированных операторов и проверки параметров, одновременно оптимизируя точность ключевых модулей и логику Reduce.