DeepSeek Lança Novo Modelo de IA 'MODEL1' com Recursos Aprimorados

DeepSeek lançou um novo modelo de IA chamado 'MODEL1' no primeiro aniversário de seu predecessor, DeepSeek-R1. O anúncio foi feito após atualizações no código FlashMLA no GitHub, onde 'MODEL1' foi referenciado 28 vezes em 114 arquivos, indicando sua distinção do modelo V32 existente, conhecido como DeepSeek-V3.2. O novo modelo apresenta avanços significativos, incluindo mudanças na disposição do cache chave-valor, melhor manuseio da esparsidade e decodificação FP8, além de várias técnicas de otimização de memória.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar