アリババ、Qwen3.5-Omniフルモーダル大型モデルを発表

アリババの千問（Qianwen）は、最新のフルモーダル大規模モデル「Qwen3.5-Omni」を発表しました。この高度なモデルシリーズには、Plus、Flash、Lightの各サイズのInstructバージョンが含まれており、256kの長文コンテキスト機能を備えています。10時間以上の音声入力と、720P（1FPS）で400秒以上の音声/映像入力をサポートしています。膨大なテキスト、視覚データ、および1億時間以上の音声/映像データで事前学習されており、Qwen3.5-Omniはフルモーダルの認識と生成に優れています。 Qwen3.5-Omniモデルは、前モデルのQwen3-Omniと比べて多言語対応能力が大幅に向上しています。現在、113の言語と方言の音声認識、および36の言語と方言の音声生成をサポートしており、アリババのAI技術の提供において大きな進歩を示しています。

出典: 原文を表示

免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。