A Sahara AI fez uma parceria com a Microsoft para lançar o MATHVISTA, um benchmark de código aberto projetado para avaliar as capacidades de raciocínio e tomada de decisão de modelos de IA como GPT-4V, Claude e Gemini. O benchmark, que já alcançou mais de 270.000 downloads, fornece dados anotados de alta precisão, cruciais para aprimorar o desempenho da IA em aplicações do mundo real. Grandes instituições, incluindo Microsoft, Amazon, Snap e MIT, estão utilizando os serviços de dados e as soluções de IA Agentic da Sahara AI, destacando a importância do benchmark no avanço da tecnologia de IA. O MATHVISTA tem como objetivo melhorar a confiabilidade dos agentes de IA usados por milhões de pessoas globalmente.