구글 딥마인드, AGI 성능 측정 위한 인지 분류 체계 공개
2026년 3월 18일 (수)
- •구글 딥마인드, 범용 인공지능(AGI) 측정을 위한 10대 핵심 능력을 정의한 '인지 분류 체계' 도입
- •지각, 추론, 사회적 인지 등 인간의 기준과 AI 성능을 비교하는 새로운 벤치마크 프레임워크 구축
- •새로운 모델 평가 방법론 개발을 위해 캐글(Kaggle)과 협력하여 20만 달러 규모의 해커톤 개최
구글 딥마인드가 범용 인공지능(AGI)의 발전 경로를 정량화하기 위해 엄격한 인지 프레임워크를 도입하며 기술적 목표를 새롭게 정의했다. 그동안 업계에서는 개별적인 벤치마크에 의존하는 경향이 있었으나, 새롭게 공개된 '인지 분류 체계(Cognitive Taxonomy)'는 심리학과 뇌과학을 기반으로 지능의 10가지 핵심 기둥을 식별했다. 여기에는 지각 및 추론과 같은 기초 역량은 물론, 시스템이 스스로의 사고 과정을 모니터링하는 메타인지와 사회적 인지 등 고차원적인 특성들이 포함된다.
해당 제안은 단순한 통과 여부를 묻는 테스트에서 벗어나 AI의 결과물을 성인 인간의 표준 집단과 직접 비교하는 3단계 프로토콜을 지향한다. 연구진은 인간의 능력 분포를 기준으로 모델 성능을 매핑함으로써, 단일한 성공 지표가 아닌 지능의 다각적인 면모를 보여주는 '기상도'를 구축하고자 한다. 실제로 이러한 방식은 특정 시스템이 초인적인 논리력을 갖췄더라도 사회적 미묘함이나 계획 수립 능력에서는 한계를 보일 수 있다는 현실을 반영한다.
새로운 벤치마크 개발을 가속화하기 위해 구글 딥마인드는 총 20만 달러 규모의 캐글(Kaggle) 해커톤을 개최한다. 특히 실행 기능이나 경험적 학습과 같은 복합적인 분야의 '평가 격차'를 해소하는 데 집중할 계획이다. 연구 커뮤니티를 향한 이러한 공개적인 요청은 모델이 고도화될수록 지능 측정 방식 또한 안전과 투명성 확보를 위해 함께 진화해야 한다는 인공지능 개발의 필연적인 과제를 시사한다.