アリババの千問(Qianwen)は、最新のフルモーダル大規模モデル「Qwen3.5-Omni」を発表しました。この高度なモデルシリーズには、Plus、Flash、Lightの各サイズのInstructバージョンが含まれており、256kの長文コンテキスト機能を備えています。10時間以上の音声入力と、720P(1FPS)で400秒以上の音声/映像入力をサポートしています。膨大なテキスト、視覚データ、および1億時間以上の音声/映像データで事前学習されており、Qwen3.5-Omniはフルモーダルの認識と生成に優れています。 Qwen3.5-Omniモデルは、前モデルのQwen3-Omniと比べて多言語対応能力が大幅に向上しています。現在、113の言語と方言の音声認識、および36の言語と方言の音声生成をサポートしており、アリババのAI技術の提供において大きな進歩を示しています。