O Google introduziu uma nova estratégia de preços escalonados para sua API Gemini, oferecendo cinco níveis distintos de serviço: Padrão, Flexível, Prioritário, Lote e Cache. Os níveis Flexível e Lote oferecem um desconto de 50% nas tarifas padrão, atendendo respectivamente a aplicações com baixa sensibilidade à latência e necessidades de processamento de dados em grande escala. O nível Cache é projetado para chamadas de instruções complexas e de alta frequência, com cobrança baseada na contagem de tokens e na duração do armazenamento.
O nível Prioritário, com preço entre 75% e 100% acima da tarifa padrão, garante tempos de resposta rápidos, que variam de milissegundos a segundos, tornando-o adequado para aplicações críticas como bots de atendimento ao cliente e detecção de fraudes em tempo real. Esse novo modelo de preços visa otimizar a alocação de recursos para serviços de inferência de IA, acomodando diferentes requisitos de latência e custo.
Google Revela Preços em Camadas para a API Gemini com Opções de Serviço Aprimoradas
Aviso Legal: O conteúdo disponibilizado no Phemex News é apenas para fins informativos. Não garantimos a qualidade, precisão ou integridade das informações provenientes de artigos de terceiros. Este conteúdo não constitui aconselhamento financeiro ou de investimento. Recomendamos fortemente que você realize suas próprias pesquisas e consulte um consultor financeiro qualificado antes de tomar decisões de investimento.
