DeepMind、対話型の世界を生成する「Project Genie」を発表
- •Google DeepMindが、AI生成による対話型の世界を構築・探索できる実験的プロトタイプ「Project Genie」を公開した。
- •Genie 3世界モデルを搭載し、テキストや画像から探索可能な環境をリアルタイムで生成する。
- •米国のGoogle AI Ultra加入者は、世界のスケッチや探索、リミックスなどの機能を早期利用できる。
Google DeepMindは、静的なプロンプトを無限に広がる対話型のデジタル環境へと変換する野心的な研究プロトタイプ「Project Genie」を正式に発表した。このシステムは基盤モデルであるGenie 3をベースに構築されており、従来の動画生成の枠を超え、ユーザーの操作に合わせて物理法則や因果関係をリアルタイムでシミュレーションする「世界モデル」として機能する。通常の3Dスナップショットとは異なり、Genie 3はユーザーの入力に基づいてその先の展開を予測し、あらゆる動きに適応する生成型ゲームエンジンのような役割を果たす。
現在、米国のGoogle AI Ultra加入者向けに提供が開始されているこのプロトタイプには、Geminiや「Nano Banana Pro」と呼ばれる新しいユーティリティを含む複数のモデルが統合されている。これにより、生成またはアップロードされた画像を通じて環境を微調整し、一人称または三人称視点でその世界に入り込める「ワールドスケッチ」機能が実現した。このシステムは創造の自由を重視しており、歩行や運転、飛行といったキャラクターの動作をユーザーが定義できるほか、それらの行動がデジタルエコシステムにどのような影響を与えるかもシミュレート可能である。
この技術は、システムに現実世界の動的な仕組みを学習させることで、汎用人工知能 (AGI) の実現に向けた大きな一歩となる。一方で、DeepMindは慎重な展開戦略を維持しており、現時点では生成時間が60秒に制限されているほか、物理法則の一貫性やプロンプトへの忠実さに課題が残る場合もある。しかし、既存の世界を「リミックス」し、探索体験を共有できるこの能力は、AIが単なる静的コンテンツの作成ツールから、インタラクティブな体験そのものを構築する存在へと進化する重要な転換点となるだろう。