Hugging Face đã ra mắt mô hình Gemma-4-21B-REAP, thể hiện hiệu suất mạnh mẽ trong các nhiệm vụ suy luận. Mô hình này, được phát hành vào ngày 6 tháng 4, cho thấy độ chính xác được cải thiện trong các nhiệm vụ này, theo các nhà phát triển của nó. Nó được tối ưu hóa để hiệu quả, chỉ yêu cầu 12GB VRAM cho các hoạt động ngữ cảnh giới hạn và 16GB cho ngữ cảnh đầy đủ. Các nhà phát triển đang mời các thành viên của cộng đồng MLX và GGUF khám phá khả năng của nó.