Gemini 3 Flash emergiu como o principal modelo de IA na tarefa do agente OpenClaw, alcançando uma taxa de sucesso de 95,1% de acordo com o teste de benchmark PinchBench. A avaliação, destacada pelo SlowMist CISO 23pads na plataforma X, coloca minimax-m2.1 e kimi-k2.5 em segundo e terceiro lugares, com taxas de sucesso de 93,6% e 93,4%, respectivamente. Claude Sonnet 4.5 segue com 92,7%, enquanto GPT-4o registra uma taxa de sucesso de 85,2%.