Meituan stellt LongCat-2,0-Billionen-Parameter-Modell vor

Meituan hat sein neues Billionen-Parameter-Modell LongCat-2.0 vorgestellt, das laut Berichten vom 30. Juni als Open Source verfügbar sein wird. Die Pre-Training-Daten des Modells umfassen über 30 Billionen Tokens und beinhalten Chinesisch, Englisch, mehrere Sprachen sowie Code. Das LongCat-Team hat Herausforderungen beim Training mit inländischer Rechenleistung, wie Hardwareausfälle und Kommunikationsanomalien, durch Verbesserungen in Stabilität, Genauigkeit und Effizienz bewältigt. Sie erreichten eine Reduzierung der monatlichen Ausfallraten um 70 % durch HCCL-Ausnahmebehandlung und automatische Fehlerbehebung. Zusätzlich stellten sie die Trainingsgenauigkeit durch deterministische Operatoren und Parameterprüfungen sicher und optimierten dabei die Präzision wichtiger Module sowie die Reduce-Logik.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.