DeepSeek stellt neues KI-Modell 'MODEL1' mit erweiterten Funktionen vor

DeepSeek hat anlässlich des ersten Jahrestages seines Vorgängers DeepSeek-R1 ein neues KI-Modell namens „MODEL1“ vorgestellt. Die Ankündigung erfolgte nach Updates am FlashMLA-Code auf GitHub, wo „MODEL1“ in 114 Dateien insgesamt 28 Mal erwähnt wurde, was auf seine Unterscheidung vom bestehenden V32-Modell, bekannt als DeepSeek-V3.2, hinweist. Das neue Modell weist bedeutende Fortschritte auf, darunter Änderungen im Layout des Schlüssel-Wert-Caches, verbesserte Handhabung von Sparsität und FP8-Dekodierung sowie verschiedene Techniken zur Speicheroptimierung.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.

Das könnte Ihnen auch gefallen