Amazon SageMaker AI, 추론용 GPU 예약 용량 제공
- •Amazon SageMaker AI가 훈련용 플랜을 확장하여 기간 한정 추론 작업에 전용 GPU 용량을 예약할 수 있게 지원한다.
- •새로운 기능을 통해 모델 평가나 일시적인 트래픽 급증 시에도 특정 GPU 인스턴스에 대한 예측 가능한 컴퓨팅 가용성을 보장한다.
- •사용자는 배포 범위를 예약된 리소스로만 엄격히 제한하여 프로젝트 종료 후 예기치 못한 비용이 발생하는 것을 방지할 수 있다.
대규모 모델을 배포할 때는 흔히 고성능 컴퓨팅 리소스의 예측 불가능한 가용성이라는 문제에 직면하게 된다. Amazon SageMaker AI는 기존의 훈련용 플랜을 추론 엔드포인트 지원용으로 재구성하여 이러한 문제를 해결하고 나섰다. 이번 업데이트를 통해 개발 팀은 AI 처리에 사용되는 고성능 하드웨어인 특정 GPU 인스턴스를 일정 기간 미리 예약할 수 있게 되었다. 이에 따라 일주일 단위의 평가나 한 달간의 프로덕션 테스트 등 기간에 관계없이 피크 시간대의 리소스 부족 걱정 없이 필요한 하드웨어를 안정적으로 확보할 수 있다.
이러한 워크플로우는 Amazon Resource Name이라는 고유 식별자를 통해 기존 설정에 직접 통합된다. 시스템은 해당 예약을 엔드포인트 구성에 연결함으로써 모델이 사전에 할당된 하드웨어에서만 실행되도록 보장한다. 특히 용량 선호도를 엄격하게 설정할 수 있는 기능이 핵심이다. 만약 프로젝트가 특정 기간에만 한정되어 있다면, 예약 만료 시 배포가 자동으로 중단되도록 구성할 수 있다. 이러한 안전장치 덕분에 개발 팀은 보장된 사용 기간이 종료된 후 실수로 높은 비용이 발생하는 상황을 방지할 수 있다.
추론을 위한 예약 컴퓨팅으로의 이러한 변화는 AI 라이프사이클 전반에서 안정적인 하드웨어 접근이 얼마나 중요한지를 잘 보여준다. 데이터 과학자들에게 이는 벤치마크 및 테스트를 일정한 일정에 맞춰 진행할 수 있음을 의미한다. 하드웨어 가용성을 무작정 기다리는 대신 특정 시간대를 구매하여 해당 범위 내에서 배포를 확장할 수 있기 때문이다. 결과적으로 모델의 미세 조정을 마친 후 안정적인 환경에서 성능을 테스트하는 과정이 한층 간소화될 전망이다.