앤스로픽, PC 조작 능력 강화한 'Claude Sonnet 4.6' 출시
- •앤스로픽이 100만 토큰의 컨텍스트 윈도우를 지원하는 Claude Sonnet 4.6 베타 버전을 공개했다.
- •새 모델은 컴퓨터 조작 능력이 대폭 향상되어 복잡한 웹 작업에서 인간 수준의 성능을 구현했다.
- •코딩 및 지시 이행 능력에서 이전 최상위 모델인 Opus 4.5를 능가하는 성과를 보였다.
앤스로픽(Anthropic)이 효율성과 고도의 추론 능력을 동시에 갖춘 주요 업데이트 모델인 Claude Sonnet 4.6을 전격 공개했다. 이번 버전은 현재 Claude.ai 사용자의 기본 모델로 설정되었으며, 특히 100만 토큰에 달하는 방대한 컨텍스트 윈도우를 제공하는 것이 특징이다. 컨텍스트 윈도우란 모델이 한 번에 기억하고 처리할 수 있는 정보량을 의미하는데, 이는 전체 소스 코드나 수십 편의 연구 논문을 단 하나의 프롬프트로 처리하기에 충분한 수준이다.
이번 업데이트에서 가장 돋보이는 기능은 한층 정교해진 '컴퓨터 조작(Computer Use)' 능력이다. Sonnet 4.6은 단순히 백엔드 연결에 의존하는 대신 인간처럼 화면을 시각적으로 해석하고 마우스 클릭이나 키보드 입력을 시뮬레이션하며 컴퓨터와 상호작용한다. 실제로 검증된 벤치마크에서 복잡한 스프레드시트 탐색 및 다단계 웹 양식 작성 등 인간 수준의 숙련도를 증명했으며, 이는 복잡한 실제 사무 워크플로우를 처리하는 자율 AI 에이전트 시대로의 중요한 진전으로 평가받는다.
개발자를 위한 편의 기능도 대폭 추가되었다. 대화의 오래된 내용을 자동으로 요약해 메모리 한계 도달을 방지하는 '컨텍스트 압축' 기능과 작업 난이도에 따라 추론 강도를 스스로 조절하는 '적응형 사고' 기능이 도입되었다. 초기 테스터들에 따르면 모델의 '태만함'이나 할루시네이션(환각) 현상이 눈에 띄게 줄어들었으며, 특히 복잡한 코딩 작업에서는 앤스로픽의 기존 플래그십 모델이었던 Opus 4.5의 성능을 자주 앞지르는 것으로 나타났다.
또한 엑셀(Excel)에 모델 컨텍스트 프로토콜을 통합하여, 사용자가 스프레드시트를 벗어나지 않고도 외부 금융 소스에서 데이터를 직접 불러올 수 있게 되었다. 이처럼 자율성이 크게 향상되었음에도 불구하고 앤스로픽은 안전을 최우선 순위로 두었음을 강조했다. 특히 악성 지시어를 웹사이트에 숨겨 모델의 동작을 가로채려는 프롬프트 인젝션 공격에 대해 더욱 강력한 방어 체계를 구축하며 보안성을 높였다.