DeepSeek lançou a versão prévia de sua série V4 de modelos de código aberto, agora disponível sob a licença MIT em plataformas como Hugging Face e ModelScope. A série V4 apresenta dois modelos MoE: V4-Pro, com aproximadamente 1,6 trilhão de parâmetros e 49 bilhões ativados por token, e V4-Flash, com 284 bilhões de parâmetros e 13 bilhões ativados por token. Ambos os modelos suportam um comprimento de contexto de até 1 milhão de tokens. Os novos modelos prometem redução no uso de memória e na sobrecarga computacional em raciocínio de textos longos, em comparação com a versão anterior V3.2.