DeepSeek lançou a versão prévia de sua série V4 de modelos de código aberto, agora disponível sob a licença MIT em plataformas como Hugging Face e ModelScope. A série V4 apresenta dois modelos MoE: V4-Pro, com aproximadamente 1,6 trilhão de parâmetros e 49 bilhões ativados por token, e V4-Flash, com 284 bilhões de parâmetros e 13 bilhões ativados por token. Ambos os modelos suportam um comprimento de contexto de até 1 milhão de tokens. Os novos modelos prometem redução no uso de memória e na sobrecarga computacional em raciocínio de textos longos, em comparação com a versão anterior V3.2.
DeepSeek Lança Modelos Open-Source V4 com 1,6 Trilhões de Parâmetros
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
