DeepSeek ha presentado un nuevo modelo de IA llamado 'MODEL1' en el primer aniversario de su predecesor, DeepSeek-R1. El anuncio se realizó tras las actualizaciones del código FlashMLA en GitHub, donde 'MODEL1' fue mencionado 28 veces en 114 archivos, lo que indica su distinción respecto al modelo V32 existente, conocido como DeepSeek-V3.2. El nuevo modelo presenta avances significativos, incluyendo cambios en la disposición de la caché clave-valor, mejor manejo de la esparsidad y decodificación FP8, junto con diversas técnicas de optimización de memoria.
DeepSeek presenta el nuevo modelo de IA 'MODEL1' con funciones mejoradas
Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.
