Запуск модели Gemini 3.2 на Google Cloud

Модель Gemini 3.2 в режиме реального времени теперь доступна в Google Cloud, предлагая экономичную альтернативу GPT-5.5. Модель под названием "gemini-3.2-flash-lite-live-preview" была добавлена в Google Cloud Console, что ознаменовало её публичный дебют на официальной платформе. Ранее она уже появлялась в пакетах приложений для iOS и в AI Studio. Gemini 3.2 Flash достигает 92% возможностей GPT-5.5 в области программирования и рассуждений, но при этом стоит всего одну двадцатую от стоимости вывода, благодаря передовым методам дистилляции и разрежения. Большинство задержек запросов составляет менее 200 миллисекунд, что делает её идеальной для сверхнизкой задержки в режиме реального времени. Инсайдеры отрасли ожидают её официального запуска на Google I/O 20 мая.

Вам также может понравиться