Googleは、Gemini 3シリーズの新モデルであるGemini 3.1 Flash-Liteを発表しました。これは最速かつ最もコスト効率の高いオプションとして設計されています。Mixture of Experts(MoE)アーキテクチャを活用し、パラメータの一部のみをアクティブにすることで推論コストを削減しています。APIの価格は、入力トークン100万あたり0.25ドル、出力トークン100万あたり1.50ドルに設定されており、Gemini 3.1 Proよりも大幅に安価です。 Gemini 3.1 Flash-Liteは、最初のトークンのレイテンシを2.5倍削減し、出力速度を45%向上させ、1秒あたり363トークンに達するなど、性能指標が改善されています。最大100万入力トークンと64,000出力トークンをサポートし、テキスト、画像、音声、動画の入力に対応しています。内部ベンチマークでは、GPQA DiamondやMMMU-Proを含む11のテストのうち6つでGPT-5 MiniやClaude 4.5 Haikuを上回りました。このモデルの「思考レベル」機能により、開発者は推論の深さを調整して品質とコストを最適化できます。プレビューアクセスはGemini APIおよびVertex AIを通じて利用可能です。