Google stellt gestaffelte Preisgestaltung für Gemini API mit erweiterten Serviceoptionen vor

Google hat eine neue gestaffelte Preisstrategie für seine Gemini-API eingeführt, die fünf verschiedene Serviceebenen bietet: Standard, Flexibel, Priorität, Batch und Cache. Die Flexibel- und Batch-Stufen gewähren einen Rabatt von 50 % auf die Standardtarife und richten sich jeweils an Anwendungen mit geringer Latenzempfindlichkeit bzw. an groß angelegte Datenverarbeitungsanforderungen. Die Cache-Stufe ist für hochfrequente, komplexe Anweisungsaufrufe konzipiert, wobei die Abrechnung auf der Anzahl der Tokens und der Speicherdauer basiert. Die Prioritätsstufe, die 75 % bis 100 % teurer als der Standardtarif ist, gewährleistet schnelle Reaktionszeiten von Millisekunden bis Sekunden und eignet sich somit für kritische Anwendungen wie Kundenservice-Bots und Echtzeit-Betrugserkennung. Dieses neue Preismodell zielt darauf ab, die Ressourcenzuteilung für KI-Inferenzdienste zu optimieren und unterschiedliche Anforderungen an Latenz und Kosten zu berücksichtigen.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.