Gemini 3 Flash đã trở thành mô hình AI hàng đầu trong nhiệm vụ tác nhân OpenClaw, đạt tỷ lệ thành công 95,1% theo bài kiểm tra chuẩn PinchBench. Đánh giá này, được SlowMist CISO 23pads làm nổi bật trên nền tảng X, xếp minimax-m2.1 và kimi-k2.5 ở vị trí thứ hai và thứ ba với tỷ lệ thành công lần lượt là 93,6% và 93,4%. Claude Sonnet 4.5 theo sau với 92,7%, trong khi GPT-4o ghi nhận tỷ lệ thành công 85,2%.