この記事の要点は？

AIが内部的な空間マップを構築する能力をテストする「Theory of Space」を導入。 GPT-5.2などの最新モデルでも、自律的な環境探索が求められると性能が大幅に低下する。物体が移動しても脳内マップを更新できない「信念の慣性」がAIの主要な課題として判明。

スタンフォード大学、AIの「空間認識能力」を測る新指標を発表

•AIが内部的な空間マップを構築する能力をテストする「Theory of Space」を導入。
•GPT-5.2などの最新モデルでも、自律的な環境探索が求められると性能が大幅に低下する。
•物体が移動しても脳内マップを更新できない「信念の慣性」がAIの主要な課題として判明。

スタンフォード大学の研究チームは、AIが物理環境のメンタルマップ（脳内地図）を構築・維持できるかを評価する新しいベンチマーク「Theory of Space」を発表した。これは認知科学の概念である「心の理論（Theory of Mind）」に着想を得たもので、従来の受動的な観察から「能動的探索」へと評価の焦点を移しているのが特徴だ。これにより、AIエージェントは単に静止画のログを処理するのではなく、周囲を理解するためにどこへ移動し、何を見るべきかを自ら判断することが求められる。

研究ではGPT-5.2やGemini 3 Proといった主要モデルを対象に、空間的な確信の構築、その確信を利用した課題解決、そして環境変化に伴う情報の修正という3つの側面でテストを行った。その結果、テキストベースの説明と比較して視覚データから判断する際の性能が著しく低い「モダリティ・ギャップ」が浮き彫りになった。特に、物体が移動した後も古い空間情報に固執してしまう「信念の慣性」は、最先端のシステムであっても克服が困難な課題として立ちはだかっている。

これらの知見は、現在の基盤モデルがデータ処理には長けている一方で、現実世界のロボット工学に不可欠な効率性と安定性が不足していることを示唆している。実際に、現在のAIエージェントが部屋のマップを作成するには、人間が作成したスクリプト版よりも大幅に多くの手順を要し、探索が不十分な領域が残ることも少なくない。内部的な認知マップを外部から評価可能にするTheory of Spaceは、AIが自身を取り巻く三次元世界を真に理解するための明確な指針となるだろう。

スタンフォード大学の研究チームは、AIが物理環境のメンタルマップ（脳内地図）を構築・維持できるかを評価する新しいベンチマーク「Theory of Space」を発表した。これは認知科学の概念である「心の理論（Theory of Mind）」に着想を得たもので、従来の受動的な観察から「能動的探索」へと評価の焦点を移しているのが特徴だ。これにより、AIエージェントは単に静止画のログを処理するのではなく、周囲を理解するためにどこへ移動し、何を見るべきかを自ら判断することが求められる。

研究ではGPT-5.2やGemini 3 Proといった主要モデルを対象に、空間的な確信の構築、その確信を利用した課題解決、そして環境変化に伴う情報の修正という3つの側面でテストを行った。その結果、テキストベースの説明と比較して視覚データから判断する際の性能が著しく低い「モダリティ・ギャップ」が浮き彫りになった。特に、物体が移動した後も古い空間情報に固執してしまう「信念の慣性」は、最先端のシステムであっても克服が困難な課題として立ちはだかっている。

これらの知見は、現在の基盤モデルがデータ処理には長けている一方で、現実世界のロボット工学に不可欠な効率性と安定性が不足していることを示唆している。実際に、現在のAIエージェントが部屋のマップを作成するには、人間が作成したスクリプト版よりも大幅に多くの手順を要し、探索が不十分な領域が残ることも少なくない。内部的な認知マップを外部から評価可能にするTheory of Spaceは、AIが自身を取り巻く三次元世界を真に理解するための明確な指針となるだろう。

スタンフォード大学、AIの「空間認識能力」を測る新指標を発表

タグ