A Meituan lançou seu novo modelo de trilhões de parâmetros, LongCat-2.0, que será de código aberto, segundo relatos de 30 de junho. Os dados de pré-treinamento do modelo ultrapassam 30 trilhões de tokens, abrangendo chinês, inglês, múltiplos idiomas e código. A equipe LongCat enfrentou desafios no treinamento com poder computacional doméstico, como falhas de hardware e anomalias de comunicação, melhorando a estabilidade, precisão e eficiência. Eles alcançaram uma redução de 70% nas taxas mensais de falhas por meio do tratamento de exceções HCCL e recuperação automática de falhas. Além disso, garantiram a precisão do treinamento com operadores determinísticos e verificações de parâmetros, enquanto otimizavam a precisão dos módulos-chave e a lógica Reduce.