NAVER AI Lab、都市スケールの「ソウル世界モデル」を公開
2026年3月17日 (火)
- •NAVER AI Labが、現実世界の都市を忠実に再現する「Seoul World Model(SWM)」を発表した。
- •SWMは数百万枚のストリートビュー画像を用いた検索拡張生成を活用し、空間的な正確性を担保している。
- •新技術「Virtual Lookahead Sink」により、数キロメートルに及ぶ都市走行ルートの安定した動画生成が可能となった。
単に夢のような架空の都市を「幻覚(ハルシネーション)」として描き出すのではなく、現実のソウルの街並みを正確に再現する世界モデルを想像してみてほしい。NAVER AI Labが開発した「Seoul World Model(SWM)」は、純粋な合成データではなく、現実世界のデータに基づいた都市スケールのシミュレーションモデルである。従来の世界モデルは長距離の整合性を保つことが困難であったが、SWMは膨大なストリートビュー画像のデータベースを参照することで、ビデオ生成の精度を劇的に向上させた。
静止画である街頭写真から動的なビデオへと変換するために、研究チームは疎な画像データから滑らかな動画を作成する視点補間パイプラインを実装した。また、参照画像とターゲットシーンの間で発生する照明や交通状況の不一致を解決するため、「クロス・テンポラル・ペアリング」を導入している。これにより、元のデータが数年前のものであったり、撮影時間が異なっていたりする場合でも、視覚的な忠実度を維持することが可能となった。
今回の成果の中でも特に画期的な技術が、長時間の生成を安定させる「Virtual Lookahead Sink」である。このメカニズムは、AIを常に将来の地点の画像と結びつけ直すことで、AI生成動画に特有の「ドリフト(位置のずれ)」や歪みを防ぐ役割を果たす。ソウルと釜山での広範なテストを通じて、SWMは数百メートルに及ぶ空間的に忠実な動画を生成できることが証明された。この技術は、より現実的な自動運転車のトレーニング環境構築への道を切り拓くものである。