DeepSeek представила новую модель ИИ под названием «MODEL1» в честь первой годовщины своего предшественника, DeepSeek-R1. Объявление было сделано после обновлений кода FlashMLA на GitHub, где «MODEL1» упоминалась 28 раз в 114 файлах, что указывает на её отличие от существующей модели V32, известной как DeepSeek-V3.2. Новая модель обладает значительными улучшениями, включая изменения в структуре кэша ключ-значение, улучшенную обработку разреженности и декодирование FP8, а также различные методы оптимизации памяти.