구글, 다중 객체 추론으로 시각 검색의 새 장 연다
2026년 3월 5일 (목)
- •구글 검색이 고도화된 멀티모달 추론 기술을 활용해 여러 객체를 동시에 검색하는 기능을 선보였다.
- •새로운 팬아웃(Fan-out) 기술은 단 한 번의 이미지 쿼리만으로 수십 개의 웹 검색을 동시에 실행한다.
- •Gemini 모델과의 통합으로 '서클 투 서치'는 복잡한 시각적 장면을 전체적으로 해석할 수 있게 됐다.
구글은 단일 사물 식별을 넘어 장면 전체를 통합적으로 이해하는 방식을 통해 시각 세계와 상호작용하는 근본적인 변화를 이끌고 있다. 업데이트된 '서클 투 서치(Circle to Search)'와 'Lens'를 사용하면 사용자는 인테리어가 완성된 방이나 여러 겹으로 코디된 의상 등 이미지 전체를 캡처해 모든 구성 요소에 대한 결과를 동시에 얻을 수 있다. 특히 이는 과거의 번거로운 개별 검색 방식에서 벗어나 카메라를 능동적인 탐색 도구로 변화시킨 중대한 진화로 평가받는다.
이번 업그레이드의 핵심은 다중 객체 추론(Multi-object reasoning)이라 불리는 프로세스에 있다. AI는 단순히 데이터베이스와 픽셀을 대조하는 수준을 넘어, 이미지의 맥락을 살피고 사용자가 검색하는 의도를 파악하는 디지털 뇌의 역할을 수행한다. 실제로 정원 사진을 검색하면 시스템은 단순히 식물의 이름만 나열하는 데 그치지 않고, 여러 식물 종에 걸친 관리 방법, 기후 적합성, 유지 관리 수준 등을 한꺼번에 파악해 제시한다.
구글은 이러한 복잡성을 관리하기 위해 팬아웃(Fan-out) 기술을 활용한다. 이 방식은 단일 시각 입력에 기반해 인공지능이 수많은 검색을 동시에 수행하도록 지원하며, 결과적으로 수십 번의 수동 검색 과정을 단 몇 초 만에 완료한다. 이처럼 다양한 검색 결과를 하나의 응집된 답변으로 엮어냄으로써, 쇼핑이나 교육 등 다양한 분야에서 사용자가 얻은 영감을 실제 행동으로 옮길 수 있는 정보로 연결하는 기술적 가교 역할을 한다.