Google DeepMind、AGIの進展を測る認知的枠組みを提案
2026年3月17日 (火)
- •Google DeepMindが、汎用人工知能(AGI)の能力を経験的に評価するための「認知的タクソノミー」を導入した。
- •メタ認知、社会認知、実行機能を含む、10個の核となる認知能力を特定する枠組みを提示している。
- •評価が困難なAIの特性を測定するベンチマーク開発に向け、賞金総額20万ドルのKaggleハッカソンを開始した。
Google DeepMindは、AI分野で最も定義が難しい問いの一つである「汎用人工知能(AGI)の達成をいかに定義し、測定するか」という課題に正面から取り組んでいる。現在のベンチマークは特定のタスクや限定的なデータセットの処理能力に集中しがちだが、同社の新論文「AGIへの進展を測定する:認知的タクソノミー」では、人間知能の根幹を支える基礎的な認知プロセスへと評価の焦点を移すことを提案している。
この枠組みは、論理的推論から社会認知、さらには自身の思考を客観視するメタ認知まで、10個の重要な能力を定義し、AIの進展をより包括的に捉える地図を作成するものだ。具体的には、機械の性能を人間の代表的なベースラインと比較することで、これまでの断片的な評価を脱却し、汎用知能における厳格かつ科学的な基準の確立を目指している。
この理論的枠組みを実用化するため、DeepMindはKaggleと提携し、賞金総額20万ドルのハッカソンを立ち上げた。この取り組みは、特に現在の評価手法が不十分とされる実行機能や社会的理解など、5つの領域に焦点を当てている。コミュニティ全体を巻き込んだこの共同アプローチは、次世代のベンチマーク構築を促すだけでなく、モデルの複雑化に合わせてその真の能力を正確に評価する技術を同期させる狙いがある。