Google đã giới thiệu Gemini Omni tại sự kiện I/O 2026, một mô hình tạo sinh đa phương thức đột phá được thiết kế để nâng cao việc tạo và chỉnh sửa video dựa trên AI. Mô hình mới này tích hợp nền tảng suy luận Gemini của Google với các động cơ truyền thông của họ, cho phép tạo video từ các đầu vào đơn giản. CEO của DeepMind, Demis Hassabis, mô tả Omni như một bước tiến tới trí tuệ nhân tạo tổng quát, nhấn mạnh khả năng tạo nội dung từ bất kỳ đầu vào nào. Gemini Omni Flash, phiên bản công khai đầu tiên, sẽ có sẵn thông qua nền tảng làm phim AI của Google, Flow, và Flow Music dành cho các dự án âm nhạc. Mô hình hỗ trợ chỉnh sửa theo cuộc trò chuyện, cho phép người dùng thực hiện các thay đổi rộng rãi bằng ngôn ngữ tự nhiên. Các buổi trình diễn bao gồm một video giải thích bằng kỹ thuật đất sét và một video selfie với các yếu tố hình ảnh được thêm vào. Đối với các lĩnh vực tiền điện tử và Web3, Omni có thể biến đổi sản xuất NFT và kể chuyện trên chuỗi, đồng thời cũng đặt ra những thách thức về nguồn gốc và kiểm duyệt nội dung.