Gemini 3 Flash s'est imposé comme le modèle d'IA leader dans la tâche d'agent OpenClaw, atteignant un taux de réussite de 95,1 % selon le test de référence PinchBench. L'évaluation, mise en avant par SlowMist CISO 23pads sur la plateforme X, place minimax-m2.1 et kimi-k2.5 en deuxième et troisième positions avec des taux de réussite respectifs de 93,6 % et 93,4 %. Claude Sonnet 4.5 suit avec 92,7 %, tandis que GPT-4o enregistre un taux de réussite de 85,2 %.
Gemini 3 Flash dépasse la performance de la tâche OpenClaw avec un taux de réussite de 95,1 %
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
