Sahara AI hat sich mit Microsoft zusammengetan, um MATHVISTA zu starten, einen Open-Source-Benchmark, der entwickelt wurde, um die Fähigkeiten von KI-Modellen wie GPT-4V, Claude und Gemini im Bereich des logischen Denkens und der Entscheidungsfindung zu bewerten. Der Benchmark, der bereits über 270.000 Downloads erreicht hat, liefert hochpräzise annotierte Daten, die entscheidend zur Verbesserung der KI-Leistung in realen Anwendungen beitragen. Wichtige Institutionen, darunter Microsoft, Amazon, Snap und das MIT, nutzen die Datenservices und Agentic AI-Lösungen von Sahara AI, was die Bedeutung des Benchmarks für den Fortschritt der KI-Technologie unterstreicht. MATHVISTA zielt darauf ab, die Zuverlässigkeit von KI-Agenten zu verbessern, die weltweit von Millionen genutzt werden.