DeepSeek ha presentado un nuevo modelo de IA llamado 'MODEL1' en el primer aniversario de su predecesor, DeepSeek-R1. El anuncio se realizó tras las actualizaciones del código FlashMLA en GitHub, donde 'MODEL1' fue mencionado 28 veces en 114 archivos, lo que indica su distinción respecto al modelo V32 existente, conocido como DeepSeek-V3.2. El nuevo modelo presenta avances significativos, incluyendo cambios en la disposición de la caché clave-valor, mejor manejo de la esparsidad y decodificación FP8, junto con diversas técnicas de optimización de memoria.