
動画をチャットで編集する時代が始まりました。会話形式で動画の生成・編集ができるAIモデルファミリー「Gemini Omni」が、米Googleの開発者会議「Google I/O 2026」(5月19日、現地時間)で発表されました。テキスト・画像・音声・動画を組み合わせたマルチモーダルな入力に対応できます。
Google DeepMindが開発した「any-to-any」型の生成モデルで、物理法則を考慮した映像出力と、自然な文章による段階的な編集が特徴です。開発者向けセッションでは、石の彫刻を「泡で作った彫刻に」変えたり、鏡に液体のような波紋を加えたりといったデモが披露されました。従来は専門スキルが必要だった動画編集を、対話ベースで直感的に行える可能性を示しています。
第1弾の「Gemini Omni Flash」は同日、AIサブスクリプション「Google AI Plus」「Pro」「Ultra」向けにGeminiアプリとGoogle Flowで提供開始されました。YouTube ShortsとYouTube Createでも同週内に無料で順次展開。プロモーション動画やチュートリアル制作など、クリエイターや企業が手軽に試せる環境が整いつつあります。
生成・編集した動画にはGoogle独自の電子透かし「SynthID」が自動付加されます。国際規格「C2PA Content Credentials」との連携も進んでおり、GeminiアプリではC2PA検証が同日から利用可能です。SynthID検証はGoogle検索でも同日から対応しており、Chromeブラウザへの拡充も数週間以内に予定されています。
生成AIによるフェイク動画への懸念が高まるなか、コンテンツの透明性確保に向けた取り組みが本格化しています。
クリエイターと一般ユーザーに広がる活用の可能性
Gemini Omniの登場により、映像制作の現場では新たなワークフローが期待されています。広告制作やゲーム開発では、ディレクターが「もう少し明るい色調で」「カメラアングルを低めに」といった口頭に近い指示を出すだけで、AIが試作動画を次々と生成し、チーム全体でイメージを共有しやすくなる可能性があります。
既存映像の再編集機能は、過去素材の再利用や多言語展開でのテキスト差し替えにも有効です。一方、AI生成コンテンツと人間の制作物の線引きが曖昧になる懸念も指摘されており、SynthIDやC2PAによるラベリングの浸透が課題となっています。
Googleは、AIを「質問に答える道具」から「作業を進めるエージェント」へと進化させる戦略を掲げており、Gemini Omniはその中核といえるでしょう。利便性と表現の自由度が高まる一方で、著作権や個人情報保護など、倫理・法的枠組みの整備が急務となっています。












-300x169.jpg)