Meituan запустила свою новую модель с триллионом параметров, LongCat-2.0, которая будет открытым исходным кодом, согласно сообщениям от 30 июня. Данные для предварительного обучения модели превышают 30 триллионов токенов и включают китайский, английский, несколько других языков и код. Команда LongCat решила проблемы обучения на отечественных вычислительных мощностях, такие как сбои оборудования и аномалии связи, улучшив стабильность, точность и эффективность. Они достигли снижения ежемесячного уровня сбоев на 70% благодаря обработке исключений HCCL и автоматическому восстановлению после сбоев. Кроме того, они обеспечили точность обучения с помощью детерминированных операторов и проверки параметров, одновременно оптимизируя точность ключевых модулей и логику Reduce.
Meituan представила модель LongCat с 2 триллионами параметров
Отказ от ответственности: Контент, представленный на сайте Phemex News, предназначен исключительно для информационных целей.Мы не гарантируем качество, точность и полноту информации, полученной из статей третьих лиц.Содержание этой страницы не является финансовым или инвестиционным советом.Мы настоятельно рекомендуем вам провести собственное исследование и проконсультироваться с квалифицированным финансовым консультантом, прежде чем принимать какие-либо инвестиционные решения.
