A Hugging Face lançou o modelo Gemma-4-21B-REAP, que demonstra um desempenho forte em tarefas de raciocínio. O modelo, lançado em 6 de abril, apresenta uma precisão aprimorada nessas tarefas, segundo seus desenvolvedores. Ele é otimizado para eficiência, exigindo apenas 12GB de VRAM para operações com contexto limitado e 16GB para contexto completo. Os desenvolvedores estão convidando os membros das comunidades MLX e GGUF a explorarem suas capacidades.