Google、対話可能な世界を生成する「Genie 3」を公開
2026年1月25日 (日)
- •Google DeepMindが、テキストから720pの対話型環境を生成する汎用世界モデル「Genie 3」を発表した。
- •24fpsの滑らかな動作で、複雑な物理法則や生態系を数分間にわたり一貫性を保ってシミュレートできる。
- •多様な仮想環境での学習を通じ、汎用人工知能 (AGI) 開発を加速させる重要な基盤となる。
Google DeepMindが、世界モデルの分野で大きな飛躍を遂げた「Genie 3」を発表した。これは物理環境をシミュレートし、行動が環境をどう変えるかを予測するAIシステムである。前モデルを凌駕するGenie 3は、高精細な対話型世界を24fpsという滑らかな映像で生成する。利用者は720pで描画された環境を数分間にわたって自由に探索でき、水面の光の反射や火山岩を踏みしめるタイヤの音など、一貫した物理挙動と視覚的ディテールが維持される。 本モデルの真価はグラフィックスの美しさだけではない。これは汎用人工知能 (AGI) 開発における「基盤モデル」として機能する。無限に広がる多様なシミュレーションを作成することで、研究者はAIエージェントに対して「カリキュラム学習」を施すことが可能になる。現実世界でのテストに伴うリスクやコストを回避しながら、構造化された学習プロセスを通じて複雑なタスクを習得させられるのだ。これは、予測不可能な自然現象を扱うロボットや自律型システムの訓練において極めて重要な進歩と言える。 Genie 3は直感的な物理法則の把握において驚異的な能力を示している。ハリケーン並みの強風にしなるヤシの木から、深海に潜むクラゲの生物発光まで、あらゆる事象をリアルに再現した。先行するGenie 2が基礎を築いたのに対し、Genie 3はリアルタイムの相互作用に重点を置いている。人間やAIエージェントが生成された世界をまるでビデオゲームのように「プレイ」できるこの技術は、AIが物理世界を人間のような深さで視覚化し、推論する未来を現実のものにしつつある。