DeepSeek a présenté un nouveau modèle d'IA nommé « MODEL1 » à l'occasion du premier anniversaire de son prédécesseur, DeepSeek-R1. L'annonce a été faite suite à des mises à jour du code FlashMLA sur GitHub, où « MODEL1 » a été mentionné 28 fois dans 114 fichiers, ce qui indique sa distinction par rapport au modèle V32 existant, connu sous le nom de DeepSeek-V3.2. Le nouveau modèle présente des avancées significatives, notamment des modifications dans la disposition du cache clé-valeur, une meilleure gestion de la parcimonie, et le décodage FP8, ainsi que diverses techniques d'optimisation de la mémoire.