Moondream a lancé Lens, un service de réglage fin conçu pour améliorer la précision des modèles de langage visuel (VLM) lors de leur transition des environnements de laboratoire vers des applications réelles. Annoncé le 21 avril, Lens est une API à paiement à l'utilisation qui prend en charge à la fois l'apprentissage par renforcement et le réglage fin supervisé, obtenant des améliorations significatives avec un minimum de données. Par exemple, lors des retransmissions en direct de la NBA, le réglage fin a permis d'améliorer le score F1 de 28 % à 79 %, réduisant considérablement les faux positifs.
Le service a également démontré une performance supérieure dans l'identification des pays à partir d'images de vues de rue et dans les tâches d'imagerie médicale, surpassant des modèles existants comme GPT-5.4. Le premier partenaire de Moondream, PTZOptics, intégrera Lens pour améliorer le suivi des cibles et la détection d'anomalies. Ce lancement complète le moteur d'inférence Photon de Moondream, répondant aux défis de précision et de rapidité dans le déploiement des VLM.
Moondream dévoile Lens pour une précision améliorée des modèles de langage visuel
Avertissement : Le contenu proposé sur Phemex News est à titre informatif uniquement. Nous ne garantissons pas la qualité, l'exactitude ou l'exhaustivité des informations provenant d'articles tiers. Ce contenu ne constitue pas un conseil financier ou d'investissement. Nous vous recommandons vivement d'effectuer vos propres recherches et de consulter un conseiller financier qualifié avant toute décision d'investissement.
