DeepSeek hat anlässlich des ersten Jahrestages seines Vorgängers DeepSeek-R1 ein neues KI-Modell namens „MODEL1“ vorgestellt. Die Ankündigung erfolgte nach Updates am FlashMLA-Code auf GitHub, wo „MODEL1“ in 114 Dateien insgesamt 28 Mal erwähnt wurde, was auf seine Unterscheidung vom bestehenden V32-Modell, bekannt als DeepSeek-V3.2, hinweist. Das neue Modell weist bedeutende Fortschritte auf, darunter Änderungen im Layout des Schlüssel-Wert-Caches, verbesserte Handhabung von Sparsität und FP8-Dekodierung sowie verschiedene Techniken zur Speicheroptimierung.