Google s'apprête à présenter son dernier modèle d'IA, Gemini 3.2 Flash, lors de la conférence I/O 2026 le 20 mai. Ce nouveau modèle est conçu pour rivaliser avec le GPT-5.5 d'OpenAI, atteignant environ 92 % de ses performances dans les tâches de codage et de raisonnement. Notamment, Gemini 3.2 Flash réduit considérablement les coûts d'inférence, les ramenant à un quinzième voire un vingtième de ceux du GPT-5.5, avec des latences de requête généralement inférieures à 200 millisecondes. Le développement du modèle s'appuie sur les techniques avancées de distillation et de sparsification de Google, lui permettant de maintenir de hautes performances tout en étant plus économe en ressources. Les premières fuites et tests suggèrent que Gemini 3.2 Flash excelle dans les tâches de codage créatif et dépasse son prédécesseur, Gemini 3.1 Pro, dans certains benchmarks. Ce lancement positionne Google comme un concurrent de poids dans le domaine de l'IA, défiant à la fois les offres d'OpenAI et d'Anthropic.