Moondream、VLM精度向上のためのLensを発表

Moondreamは、実験室環境から実世界の応用へと移行する際に視覚言語モデル（VLM）の精度を向上させるためのファインチューニングサービス「Lens」を開始しました。4月21日に発表されたLensは、強化学習と教師ありファインチューニングの両方をサポートする従量課金制のAPIで、最小限のデータで大幅な改善を実現します。例えば、NBAのライブ放送においては、ファインチューニングによりF1スコアが28％から79％に向上し、誤検出が大幅に減少しました。このサービスはまた、ストリートビュー画像からの国の識別や医療画像処理のタスクにおいても優れた性能を示し、GPT-5.4のような既存モデルを上回りました。Moondreamの最初のパートナーであるPTZOpticsは、Lensを統合してターゲット追跡と異常検知の精度を高める予定です。このローンチは、MoondreamのPhoton推論エンジンを補完し、VLM展開における精度と速度の課題に対応します。