DeepSeek dévoile le nouveau modèle d'IA 'MODEL1' avec des fonctionnalités améliorées

DeepSeek a présenté un nouveau modèle d'IA nommé « MODEL1 » à l'occasion du premier anniversaire de son prédécesseur, DeepSeek-R1. L'annonce a été faite suite à des mises à jour du code FlashMLA sur GitHub, où « MODEL1 » a été mentionné 28 fois dans 114 fichiers, ce qui indique sa distinction par rapport au modèle V32 existant, connu sous le nom de DeepSeek-V3.2. Le nouveau modèle présente des avancées significatives, notamment des modifications dans la disposition du cache clé-valeur, une meilleure gestion de la parcimonie, et le décodage FP8, ainsi que diverses techniques d'optimisation de la mémoire.

Source: Afficher l'original

Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.

Vous pourriez aussi aimer