앤스로픽 범용 AI 에이전트 '클로드 코워크' 공개
- •앤스로픽은 가상화된 리눅스 환경에서 자율적으로 작업을 수행하는 범용 에이전트 '클로드 코워크'의 프리뷰 버전을 출시했다.
- •이 시스템은 애플 가상화 프레임워크를 기반으로 보안 격리를 구현하여 호스트 시스템에 대한 직접적인 접근과 손상을 방지한다.
- •전문가들은 샌드박싱 기술에도 불구하고 악의적인 데이터로 AI의 행동을 조작하는 프롬프트 인젝션 위험이 여전히 존재한다고 지적한다.
오픈소스 메인테이너이자 데이터 분석 도구인 데이터세트(Datasette)의 제작자로 유명한 사이먼 윌리슨은 앤스로픽이 새롭게 선보인 범용 에이전트 연구 프리뷰인 '클로드 코워크(Claude Cowork)'를 심층 분석했다. 클로드 코워크는 기존의 개발자용 도구인 '클로드 코드'를 보다 사용자 친화적으로 진화시킨 모델로, 클로드 데스크톱 앱 내에서 직접 로컬 파일 관리와 웹 검색 등 복잡한 업무를 자동화할 수 있도록 설계된 것이 특징이다. 실제로 윌리슨은 이 도구의 인터페이스가 내부의 복잡한 터미널 명령을 시각적으로 숨겨줌으로써, 전문적인 개발 지식이 없는 일반 사용자들도 고도의 자동화 기능을 손쉽게 경험할 수 있게 되었다는 점에 주목했다.
기술적 아키텍처를 살펴보면 클로드 코워크는 단순한 파일 접근 권한 부여를 넘어 애플 가상화 프레임워크(Apple Virtualization Framework)를 적극 활용하고 있다. 이 시스템은 맞춤형 리눅스 루트 파일 시스템을 가상으로 부팅하여 독립된 컨테이너 환경에서 에이전트를 구동함으로써 보안을 강화했다. 이에 따라 샌드박싱이라 불리는 보안 메커니즘이 작동하여 실행 중인 프로그램이 호스트 시스템의 핵심 영역에 접근하거나 손상을 입히는 것을 근본적으로 차단한다. 또한 에이전트 기반(Agentic) 시스템으로서 스스로 목표를 설정하고 계획을 수립하며 다양한 도구를 능동적으로 활용하는 자율적 문제 해결 능력을 보여준다.
다만 이러한 혁신적인 기능에도 불구하고 보안 취약점에 대한 우려는 여전히 해소되지 않은 과제로 지적된다. 앤스로픽 소속으로 클로드 코드를 직접 개발한 엔지니어인 보리스 체르니는 시스템이 웹페치(WebFetch) 기능을 통한 데이터 요약 단계를 거치며 프롬프트 인젝션 공격의 위험을 줄이고 있다고 밝혔다. 한편 가상화된 환경이 물리적인 시스템 침해를 방어하는 데에는 효과적이지만, 외부의 악의적인 데이터가 유입되어 에이전트의 판단과 동작을 비정상적으로 조작할 가능성은 여전히 존재한다. 특히 전문가들은 이러한 보안 허점이 향후 범용 AI 에이전트가 기업 환경에 본격적으로 도입되는 과정에서 반드시 극복해야 할 치명적인 한계가 될 수 있음을 경고했다.