Gemini 3 Flash lidera desempenho da tarefa OpenClaw com taxa de sucesso de 95,1%

Gemini 3 Flash emergiu como o principal modelo de IA na tarefa do agente OpenClaw, alcançando uma taxa de sucesso de 95,1% de acordo com o teste de benchmark PinchBench. A avaliação, destacada pelo SlowMist CISO 23pads na plataforma X, coloca minimax-m2.1 e kimi-k2.5 em segundo e terceiro lugares, com taxas de sucesso de 93,6% e 93,4%, respectivamente. Claude Sonnet 4.5 segue com 92,7%, enquanto GPT-4o registra uma taxa de sucesso de 85,2%.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.