Google DeepMindがVeo 3.1を発表:動画生成の一貫性と制御性が飛躍的に向上
- •Google DeepMindが「Veo 3.1」を公開。強化された画像・画像変換(Image-to-Image)機能とキャラクターの一貫性を実現した。
- •モバイル向けの動画制作を支援するため、ネイティブな縦型出力と4K解像度へのアップスケーリングに新たに対応。
- •AI生成動画の検証を容易にするため、電子透かし技術「SynthID」の適用範囲をGeminiアプリ内でも拡大。
- •マルチモーダルAI:テキスト、画像、動画など、複数の形式にまたがる情報を理解・生成できる人工知能システム。
- •Image-to-Image:生成AIにおいて、入力された画像を参照元や起点として、新しいビジュアルやアニメーションを生成するプロセス。
Google DeepMindは、動画生成AIにおけるクリエイターの自由度と制御性を大幅に向上させた最新モデル「Veo 3.1」を発表した。今回のアップデートにおける中核的な新機能が「Ingredients to Video(材料から動画へ)」である。これは高度なImage-to-Image技術を駆使し、一枚の静止画を起点として、そこから滑らかでダイナミックな動画クリップを生成するものである。Google DeepMindでリード・プロダクト・マネージャーを務めるリッキー・ウォン氏は、本モデルがYouTubeショートといったモバイル向けプラットフォームに最適化されたネイティブな縦型出力をサポートしている点に言及した。さらに、プロフェッショナルな映像制作にも耐えうる1080pおよび4K解像度への業界最高水準のアップスケーリング機能も備わっている。
技術的な側面において最も注目すべき改善点は、キャラクターやオブジェクトの「アイデンティティの一貫性」である。これまでのAI動画生成では、カットが変わるたびに人物の顔立ちや背景の細部が微妙に変化してしまうという課題が根強く存在していたが、Veo 3.1ではシーンを跨いでも視覚的な要素が安定して維持されるようになった。この進化により、ストーリー性のある連続した映像制作が容易になる。これらの機能はGeminiアプリや開発者向けの各種ツールセットに順次統合されており、一般の愛好家から映像制作スタジオの専門職まで、あらゆる層がこの先端技術を利用できるようになっている。また、GoogleはAIの透明性についても配慮しており、生成された全てのメディアには電子透かし技術「SynthID」が適用され、ユーザーがAI生成物であることを容易に識別・検証できる体制を整えている。
今回の動画生成機能の飛躍的な向上は、Googleが継続的に取り組んでいる広範な技術研究の成果の一部に過ぎない。同社は最近、量子コンピューティング分野における大きな進展についても発表しており、こうした基礎研究への投資が、Veoのような複雑かつ高度なマルチモーダルAIを支えるコンピューティングパワーの源泉となっている。当面の間、Googleは映画制作者やソーシャルメディアで活躍するクリエイターに対し、異なる質感やキャラクターを一つのまとまりある物語へと融合させるための強力な支援ツールを提供することに注力する方針だ。AIによる一貫性の確保と高度な制御性は、デジタルストーリーテリングの未来を大きく変える可能性を秘めている。