구글 DeepMind, 상호작용하는 AI 월드 'Project Genie' 공개
- •구글 DeepMind가 상호작용이 가능한 AI 생성 월드를 탐험할 수 있는 실험적 프로토타입 'Project Genie'를 발표했다.
- •Genie 3 월드 모델을 기반으로 한 이 시스템은 텍스트와 이미지를 통해 실시간으로 탐험 가능한 가상 환경을 구축한다.
- •미국 내 Google AI Ultra 구독자들을 대상으로 월드 스케칭, 탐험, 창의적 리믹스 기능에 대한 초기 액세스가 제공된다.
구글 DeepMind가 정적인 프롬프트를 무한하고 상호작용이 가능한 디지털 환경으로 변환하는 야심 찬 실험적 연구 프로토타입인 Project Genie를 공식 공개했다. 이 시스템은 Genie 3 파운데이션 모델을 기반으로 구축되었으며, 기존의 단순 비디오 생성을 넘어 사용자의 움직임에 따라 물리 법칙과 인과 관계를 실시간으로 시뮬레이션하는 '월드 모델'을 생성한다. 일반적인 3D 스냅샷과 달리 Genie 3는 사용자의 입력에 맞춰 실시간으로 앞길을 예측하며, 모든 움직임과 동작에 유연하게 대응하는 생성형 게임 엔진과 같은 역할을 수행한다.
현재 미국 내 Google AI Ultra 구독자들에게 배포 중인 이 프로토타입은 Gemini와 Nano Banana Pro라는 새로운 유틸리티를 포함한 여러 모델을 통합했다. 특히 이번에 도입된 '월드 스케칭(World Sketching)' 기능을 통해 사용자는 생성하거나 업로드한 이미지를 활용해 환경을 세밀하게 조정한 후, 1인칭 혹은 3인칭 시점으로 가상 공간에 진입할 수 있다. 또한 시스템은 캐릭터의 이동 방식인 걷기, 운전, 비행 등을 사용자가 직접 정의하도록 허용하며, 각 동작이 디지털 생태계에 미치는 영향까지 정교하게 묘사한다.
이번 기술은 시스템이 현실 세계의 역학을 이해하도록 학습시킴으로써 범용 인공지능 (AGI)을 향한 중대한 도약을 보여주지만, DeepMind는 신중한 배포 전략을 유지하고 있다. 현재는 영상 생성 시간이 60초로 제한되어 있으며, 때때로 물리 법칙에서 벗어나거나 프롬프트를 완벽하게 반영하지 못하는 한계도 존재한다. 다만 기존 월드를 '리믹스'하고 탐험 내용을 공유할 수 있게 됨에 따라, AI는 이제 단순한 콘텐츠 제작 도구를 넘어 완전한 상호작용 경험을 설계하는 단계로 진화했다.