Anthropic, 강력한 사이버 보안 AI 모델 공개 제한
- •Anthropic이 극도로 위험한 사이버 보안 공격 능력을 가진 'Claude Mythos'의 공개를 제한함.
- •해당 모델은 주요 운영체제 및 브라우저 인프라의 취약점을 자율적으로 탐색하고 공격할 수 있음.
- •Anthropic은 'Project Glasswing'을 통해 기술 기업들과 협력하여 선제적인 시스템 보안 패치를 진행 중임.
Anthropic이 최신 AI 모델인 'Claude Mythos'의 접근을 엄격히 통제하며 인공지능 발전의 전환점을 맞이했다. 많은 AI 기업들이 모델의 강력한 성능을 앞세워 홍보하는 것과 달리, 이번 결정은 Mythos가 인터넷 핵심 인프라의 심각한 취약점을 스스로 찾아내고 악용할 수 있다는 현실적인 위험성 때문이다. 단순히 버그를 찾는 수준을 넘어, 모델이 여러 취약점을 연결해 시스템 전체를 장악하는 능력은 과거 전문 인력이 수년 동안 매달려야 했던 수준에 도달했다.
AI 기술을 추적해 온 이들에게 이번 변화는 매우 중대한 사건이다. 과거에는 저품질의 AI 생성 보고서가 보안 담론의 대부분을 차지했으나, 이제는 상황이 완전히 바뀌었다. 리눅스 커널이나 curl과 같은 주요 오픈소스 프로젝트 유지보수자들은 현재 frontier model이 생성한 매우 정확하고 즉시 실행 가능한 취약점 보고서가 쏟아져 나오고 있다고 전했다.
Anthropic은 'Project Glasswing'이라는 새로운 이니셔티브를 통해 이러한 새로운 위협에 대응하고 있다. 애플, 마이크로소프트, 리눅스 재단과 같은 주요 파트너들에게만 모델 접근 권한을 제한적으로 부여하여, 악의적인 공격자들이 위협을 가하기 전에 시스템을 선제적으로 방어하려는 목적이다. 또한, 오픈소스 보안에 대한 상당한 자금을 지원하며 현대 사회의 공격 표면이 이전보다 훨씬 넓어졌음을 인정하고 있다.
Mythos가 독보적으로 위험한 이유는 복잡한 공격 체인을 스스로 실행할 수 있기 때문이다. 이 모델은 KASLR과 같은 현대적인 보안 우회 기술을 뚫고 희귀한 레이스 컨디션을 찾아내 공격한다. 실험 결과, Mythos는 ROP chain을 구성하여 프로그램 흐름을 탈취하고 루트 권한을 얻어내는 능력을 입증했다. 또한 메모리를 과부하시켜 브라우저의 JIT 컴파일러가 악성 코드를 실행하도록 유도하는 JIT heap spray 공격도 수행할 수 있다.
이번 제한 조치를 마케팅 전략으로 보는 시각도 있지만, 실제로는 신중하고 계산된 경계의 신호로 해석하는 것이 타당하다. 우리는 '개발자'와 '해커' 사이의 경계가 AI 도구로 인해 허물어지는 시대를 살고 있다. 이는 AI 발전이 선형적이지 않으며, 그 위험 또한 가설에 불과하지 않다는 점을 시사한다. AI 시스템이 일상에 깊숙이 통합될수록, AI 기반 위협을 예측하고 방어하는 능력은 컴퓨터 공학 분야에서 가장 핵심적인 역량이 될 것이다.