Nvidia GPU 루트 권한 탈취하는 Rowhammer 공격 발견
- •연구진이 Nvidia Ampere GPU에서 전체 루트 권한을 획득하는 GDDRHammer 및 GeForge 공격 시연
- •메모리 Bit Flip을 활용해 보안 격리를 우회하고 호스트 CPU 메모리의 무단 제어권 획득
- •IOMMU 및 ECC 같은 완화책이 보호 기능을 제공하지만 성능 저하라는 기회비용 발생
보안 연구진이 현대 인공지능 기술의 중추적 역할을 하는 하드웨어인 GPU에서 심각한 물리적 취약점을 발견했다. GDDRHammer와 GeForge로 명명된 두 가지 새로운 공격 방식은 Nvidia의 Ampere 세대 그래픽 카드에 탑재된 고성능 메모리(GDDR)가 Rowhammer 공격에 취약함을 입증한다. 특히 해당 기법은 메모리의 특정 행에 매우 빠른 속도로 접근하여 전기적 간섭을 일으키고, 결과적으로 인접한 데이터 비트가 0에서 1로 혹은 그 반대로 뒤바뀌는 현상을 유도한다.
기존의 Rowhammer 공격은 주로 표준 컴퓨터 메모리(DRAM)에서만 유효한 것으로 알려졌으나, 이번 연구를 통해 그래픽 카드 역시 유사한 보안 위협에 노출되어 있음이 확인됐다. 공격자는 Memory Massaging이라 불리는 정밀한 조작 과정을 통해 의도적인 Bit Flip을 유도하고, 시스템의 데이터 구조를 관리하는 내부 '페이지 테이블'을 오염시킨다. 이로 인해 공유 클라우드 서버를 이용하는 악성 사용자가 할당된 보안 영역을 이탈하여 호스트 PC의 중앙 처리 장치와 메모리에 대한 모든 권한인 루트 권한을 장악할 수 있게 된다.
GPU는 비용 효율을 위해 데이터 센터에서 여러 사용자가 공유하는 경우가 많기에 이러한 취약점은 AI 인프라 전반에 걸쳐 중대한 함의를 갖는다. 물론 장치의 메모리 통신을 제어하는 IOMMU나 오류 교정 코드인 ECC와 같은 보안 기능을 통해 공격을 어느 정도 차단할 수는 있다. 다만 이러한 조치들은 실제 사용 환경에서 눈에 띄는 성능 저하를 초래한다는 명확한 한계가 존재한다. 결국 이번 발견은 소프트웨어 중심의 보안을 넘어 현재의 AI 열풍을 뒷받침하는 특수 하드웨어 자체의 물리적 결함에 주목해야 할 필요성을 상기시킨다.