DeepSeek lançou um novo modelo de IA chamado 'MODEL1' no primeiro aniversário de seu predecessor, DeepSeek-R1. O anúncio foi feito após atualizações no código FlashMLA no GitHub, onde 'MODEL1' foi referenciado 28 vezes em 114 arquivos, indicando sua distinção do modelo V32 existente, conhecido como DeepSeek-V3.2. O novo modelo apresenta avanços significativos, incluindo mudanças na disposição do cache chave-valor, melhor manuseio da esparsidade e decodificação FP8, além de várias técnicas de otimização de memória.