Google, Gemini 3 serisinde yer alan yeni bir model olan Gemini 3.1 Flash-Lite'ı tanıttı. Bu model, en hızlı ve en maliyet etkin seçenek olarak tasarlandı. Uzman Karışımı (Mixture of Experts - MoE) mimarisini kullanarak, yalnızca bir parametre alt kümesini etkinleştirerek çıkarım maliyetlerini azaltıyor. API fiyatlandırması, milyon başına giriş tokeni için 0,25 ABD doları ve milyon başına çıkış tokeni için 1,50 ABD doları olarak belirlenmiş olup, Gemini 3.1 Pro'ya kıyasla önemli ölçüde daha ucuzdur. Gemini 3.1 Flash-Lite, performans metriklerinde iyileşmeler sunuyor; ilk token gecikmesinde 2,5 kat azalma ve çıkış hızında %45 artışla saniyede 363 token hızına ulaşıyor. 1 milyon giriş tokeni ve 64.000 çıkış tokenine kadar destek veriyor ve metin, görüntü, ses ve video girişlerini işleyebiliyor. Dahili kıyaslamalarda, GPQA Diamond ve MMMU-Pro dahil olmak üzere on bir testin altısında GPT-5 Mini ve Claude 4.5 Haiku modellerini geride bıraktı. Modelin "düşünme seviyesi" özelliği, geliştiricilerin çıkarım derinliğini ayarlamasına olanak tanıyarak kalite ve maliyeti optimize ediyor. Önizleme erişimi Gemini API ve Vertex AI üzerinden sağlanmaktadır.