허깅페이스(Hugging Face)는 추론 작업에서 강력한 성능을 보여주는 Gemma-4-21B-REAP 모델을 출시했습니다. 4월 6일에 공개된 이 모델은 개발자들에 따르면 이러한 작업에서 향상된 정확도를 보여줍니다. 효율성을 위해 최적화되어 제한된 컨텍스트 작업에는 12GB의 VRAM만 필요하며, 전체 컨텍스트 작업에는 16GB가 필요합니다. 개발자들은 MLX 및 GGUF 커뮤니티 회원들이 이 모델의 기능을 탐색해 보길 초대하고 있습니다.