Gemini 3.2 Modell startet auf Google Cloud mit kosteneffizienter Inferenz

Das Echtzeitmodell Gemini 3.2 ist jetzt auf Google Cloud verfügbar und bietet eine kostengünstige Alternative zu GPT-5.5. Das Modell mit dem Namen "gemini-3.2-flash-lite-live-preview" wurde in die Google Cloud Console aufgenommen und feiert damit sein öffentliches Debüt auf einer offiziellen Plattform. Dies folgt auf frühere Auftritte in iOS-App-Bundles und AI Studio. Gemini 3.2 Flash erreicht 92 % der Codierungs- und Denkfähigkeiten von GPT-5.5, jedoch bei nur einem Zwanzigstel der Inferenzkosten, dank fortschrittlicher Destillations- und Sparsifizierungsverfahren. Die meisten Abfrageverzögerungen liegen unter 200 Millisekunden, was es ideal für ultra-niedrige Latenzzeiten bei Echtzeitinteraktionen macht. Brancheninsider erwarten die offizielle Einführung auf der Google I/O am 20. Mai.

Quelle: Original anzeigen

Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.

Das könnte Ihnen auch gefallen