DeepSeek presenta los modelos de código abierto V4 con 1.6 billones de parámetros

DeepSeek ha lanzado la versión preliminar de su serie V4 de modelos de código abierto, ahora disponibles bajo la licencia MIT en plataformas como Hugging Face y ModelScope. La serie V4 presenta dos modelos MoE: V4-Pro, con aproximadamente 1.6 billones de parámetros y 49 mil millones activados por token, y V4-Flash, con 284 mil millones de parámetros y 13 mil millones activados por token. Ambos modelos soportan una longitud de contexto de hasta 1 millón de tokens. Los nuevos modelos prometen un uso reducido de memoria y menor carga computacional en el razonamiento de textos largos en comparación con la versión anterior V3.2.

Fuente: Mostrar original

Aviso legal: El contenido de Phemex News es únicamente informativo.No garantizamos la calidad, precisión ni integridad de la información procedente de artículos de terceros.El contenido de esta página no constituye asesoramiento financiero ni de inversión.Le recomendamos encarecidamente que realice su propia investigación y consulte con un asesor financiero cualificado antes de tomar cualquier decisión de inversión.

También te podría gustar