Meituan hat sein neues Billionen-Parameter-Modell LongCat-2.0 vorgestellt, das laut Berichten vom 30. Juni als Open Source verfügbar sein wird. Die Pre-Training-Daten des Modells umfassen über 30 Billionen Tokens und beinhalten Chinesisch, Englisch, mehrere Sprachen sowie Code. Das LongCat-Team hat Herausforderungen beim Training mit inländischer Rechenleistung, wie Hardwareausfälle und Kommunikationsanomalien, durch Verbesserungen in Stabilität, Genauigkeit und Effizienz bewältigt. Sie erreichten eine Reduzierung der monatlichen Ausfallraten um 70 % durch HCCL-Ausnahmebehandlung und automatische Fehlerbehebung. Zusätzlich stellten sie die Trainingsgenauigkeit durch deterministische Operatoren und Parameterprüfungen sicher und optimierten dabei die Präzision wichtiger Module sowie die Reduce-Logik.