Moondream hat Lens eingeführt, einen Fine-Tuning-Service, der darauf ausgelegt ist, die Genauigkeit von visuellen Sprachmodellen (VLMs) zu verbessern, wenn diese vom Labor in reale Anwendungen übergehen. Lens wurde am 21. April angekündigt und ist eine nutzungsabhängige API, die sowohl Reinforcement Learning als auch überwachtes Fine-Tuning unterstützt und mit minimalen Daten signifikante Verbesserungen erzielt. Beispielsweise verbesserte sich bei NBA-Liveübertragungen der F1-Score durch Fine-Tuning von 28 % auf 79 %, wobei die Anzahl der Fehlalarme deutlich reduziert wurde.
Der Service zeigte auch eine überlegene Leistung bei der Identifizierung von Ländern anhand von Street-View-Bildern sowie bei medizinischen Bildgebungsaufgaben und übertraf dabei bestehende Modelle wie GPT-5.4. Moondreams erster Partner, PTZOptics, wird Lens zur verbesserten Zielverfolgung und Anomalieerkennung integrieren. Dieser Start ergänzt die Photon-Inferenz-Engine von Moondream und adressiert sowohl Genauigkeits- als auch Geschwindigkeitsherausforderungen bei der Bereitstellung von VLMs.
Moondream stellt Lens zur Verbesserung der Genauigkeit visueller Sprachmodelle vor
Haftungsausschluss: Die auf Phemex News bereitgestellten Inhalte dienen nur zu Informationszwecken.Wir garantieren nicht die Qualität, Genauigkeit oder Vollständigkeit der Informationen aus Drittquellen.Die Inhalte auf dieser Seite stellen keine Finanz- oder Anlageberatung dar.Wir empfehlen dringend, eigene Recherchen durchzuführen und einen qualifizierten Finanzberater zu konsultieren, bevor Sie Anlageentscheidungen treffen.
