Moondreamは、実験室環境から実世界の応用へと移行する際に視覚言語モデル(VLM)の精度を向上させるためのファインチューニングサービス「Lens」を開始しました。4月21日に発表されたLensは、強化学習と教師ありファインチューニングの両方をサポートする従量課金制のAPIで、最小限のデータで大幅な改善を実現します。例えば、NBAのライブ放送においては、ファインチューニングによりF1スコアが28%から79%に向上し、誤検出が大幅に減少しました。
このサービスはまた、ストリートビュー画像からの国の識別や医療画像処理のタスクにおいても優れた性能を示し、GPT-5.4のような既存モデルを上回りました。Moondreamの最初のパートナーであるPTZOpticsは、Lensを統合してターゲット追跡と異常検知の精度を高める予定です。このローンチは、MoondreamのPhoton推論エンジンを補完し、VLM展開における精度と速度の課題に対応します。
Moondream、視覚言語モデルの精度向上のためのレンズを発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
