GoogleはI/O 2026イベントで、AI駆動の動画制作と編集を強化する画期的なマルチモーダル生成モデル「Gemini Omni」を発表しました。この新しいモデルは、GoogleのGemini推論バックボーンとメディアエンジンを統合し、シンプルな入力から動画を作成できるようにしています。DeepMindのCEOデミス・ハサビスは、Omniを人工汎用知能への一歩と位置づけ、あらゆる入力からコンテンツを生成できる能力を強調しました。 最初の公開バージョンであるGemini Omni Flashは、GoogleのAI映画制作プラットフォーム「Flow」と音楽プロジェクト向けの「Flow Music」を通じて利用可能になります。このモデルは会話型編集をサポートし、ユーザーが自然言語で大幅な変更を行うことを可能にします。デモンストレーションでは、クレイメーションの解説動画や、視覚要素を追加した自撮り動画が紹介されました。暗号通貨やWeb3分野においては、OmniがNFT制作やオンチェーンストーリーテリングを変革する可能性がある一方で、出所の証明やコンテンツのモデレーションに関する課題も浮上しています。