Meituan presenta el modelo LongCat-2.0 de dos billones de parámetros

Meituan ha lanzado su nuevo modelo de un billón de parámetros, LongCat-2.0, que será de código abierto, según informes del 30 de junio. Los datos de preentrenamiento del modelo superan los 30 billones de tokens, abarcando chino, inglés, múltiples idiomas y código. El equipo de LongCat ha abordado desafíos en el entrenamiento con potencia informática nacional, como fallos de hardware y anomalías de comunicación, mejorando la estabilidad, precisión y eficiencia. Lograron una reducción del 70 % en las tasas mensuales de fallos mediante el manejo de excepciones HCCL y la recuperación automática de fallos. Además, aseguraron la precisión del entrenamiento con operadores deterministas y verificaciones de parámetros, mientras optimizaban la precisión de módulos clave y la lógica Reduce.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.