Modelo Gemini 3.2 Estreia no Google Cloud com Inferência Econômica

O modelo em tempo real Gemini 3.2 está agora disponível no Google Cloud, oferecendo uma alternativa econômica ao GPT-5.5. O modelo, chamado "gemini-3.2-flash-lite-live-preview", foi adicionado ao Google Cloud Console, marcando sua estreia pública em uma plataforma oficial. Isso segue aparições anteriores em pacotes de aplicativos iOS e no AI Studio. O Gemini 3.2 Flash alcança 92% das capacidades de codificação e raciocínio do GPT-5.5, mas com apenas um vigésimo do custo de inferência, graças a técnicas avançadas de destilação e esparsificação. A maioria das latências de consulta está abaixo de 200 milissegundos, tornando-o ideal para interações em tempo real com latência ultra baixa. Especialistas do setor esperam seu lançamento oficial no Google I/O em 20 de maio.

Fonte: Mostrar original

Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.

Você também pode gostar