Gemini 3 Flash, OpenClaw 작업 성능 95.1% 성공률로 최고 기록

Gemini 3 Flash는 PinchBench 벤치마크 테스트에서 95.1%의 성공률을 기록하며 OpenClaw 에이전트 작업에서 선도적인 AI 모델로 부상했습니다. X 플랫폼에서 SlowMist CISO 23pads가 강조한 평가 결과, minimax-m2.1과 kimi-k2.5가 각각 93.6%와 93.4%의 성공률로 2위와 3위를 차지했습니다. Claude Sonnet 4.5는 92.7%로 그 뒤를 잇고 있으며, GPT-4o는 85.2%의 성공률을 기록했습니다.

출처: 원본 보기

면책 조항: Phemex 뉴스에서 제공하는 콘텐츠는 정보 제공 목적으로만 제공됩니다. 제3자 기사에서 출처를 얻은 정보의 품질, 정확성 또는 완전성을 보장하지 않습니다.이 페이지의 콘텐츠는 재무 또는 투자 조언이 아닙니다.투자 결정을 내리기 전에 반드시 스스로 조사하고 자격을 갖춘 재무 전문가와 상담하시기 바랍니다.