DeepSeek lançou um novo modelo de IA chamado 'MODEL1' no primeiro aniversário de seu predecessor, DeepSeek-R1. O anúncio foi feito após atualizações no código FlashMLA no GitHub, onde 'MODEL1' foi referenciado 28 vezes em 114 arquivos, indicando sua distinção do modelo V32 existente, conhecido como DeepSeek-V3.2. O novo modelo apresenta avanços significativos, incluindo mudanças na disposição do cache chave-valor, melhor manuseio da esparsidade e decodificação FP8, além de várias técnicas de otimização de memória.
DeepSeek Lança Novo Modelo de IA 'MODEL1' com Recursos Aprimorados
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
