Google, Gemini 3 serisinde yer alan yeni bir model olan Gemini 3.1 Flash-Lite'ı tanıttı. Bu model, en hızlı ve en maliyet etkin seçenek olarak tasarlandı. Uzman Karışımı (Mixture of Experts - MoE) mimarisini kullanarak, yalnızca bir parametre alt kümesini etkinleştirerek çıkarım maliyetlerini azaltıyor. API fiyatlandırması, milyon başına giriş tokeni için 0,25 ABD doları ve milyon başına çıkış tokeni için 1,50 ABD doları olarak belirlenmiş olup, Gemini 3.1 Pro'ya kıyasla önemli ölçüde daha ucuzdur.
Gemini 3.1 Flash-Lite, performans metriklerinde iyileşmeler sunuyor; ilk token gecikmesinde 2,5 kat azalma ve çıkış hızında %45 artışla saniyede 363 token hızına ulaşıyor. 1 milyon giriş tokeni ve 64.000 çıkış tokenine kadar destek veriyor ve metin, görüntü, ses ve video girişlerini işleyebiliyor. Dahili kıyaslamalarda, GPQA Diamond ve MMMU-Pro dahil olmak üzere on bir testin altısında GPT-5 Mini ve Claude 4.5 Haiku modellerini geride bıraktı. Modelin "düşünme seviyesi" özelliği, geliştiricilerin çıkarım derinliğini ayarlamasına olanak tanıyarak kalite ve maliyeti optimize ediyor. Önizleme erişimi Gemini API ve Vertex AI üzerinden sağlanmaktadır.
Google, Maliyetleri Düşüren ve Rakiplerini Geride Bırakan Gemini 3.1 Flash-Lite'ı Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
