A Meituan lançou seu novo modelo de trilhões de parâmetros, LongCat-2.0, que será de código aberto, segundo relatos de 30 de junho. Os dados de pré-treinamento do modelo ultrapassam 30 trilhões de tokens, abrangendo chinês, inglês, múltiplos idiomas e código. A equipe LongCat enfrentou desafios no treinamento com poder computacional doméstico, como falhas de hardware e anomalias de comunicação, melhorando a estabilidade, precisão e eficiência. Eles alcançaram uma redução de 70% nas taxas mensais de falhas por meio do tratamento de exceções HCCL e recuperação automática de falhas. Além disso, garantiram a precisão do treinamento com operadores determinísticos e verificações de parâmetros, enquanto otimizavam a precisão dos módulos-chave e a lógica Reduce.
Meituan Lança Modelo LongCat-2.0 com 2 Trilhões de Parâmetros
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
