NVIDIA, Amazon Bedrock에 'Nemotron 3 Super' 전격 출시
- •NVIDIA Nemotron 3 Super가 Amazon Bedrock에서 관리형 서버리스 모델로 출시되어 에이전트형 애플리케이션 구축을 지원한다.
- •1,200억 개의 파라미터를 갖춘 이 모델은 Transformer와 Mamba의 하이브리드 아키텍처를 채택해 기존 모델 대비 5배 높은 처리량을 자랑한다.
- •새로운 Latent MoE 설계를 통해 추론 비용을 늘리지 않고도 전문가 모델 수를 4배 확장하며 복잡한 추론 능력을 강화했다.
NVIDIA가 Amazon Bedrock에 Nemotron 3 Super를 출시하며 AWS에서의 생성형 AI 입지를 대폭 확장했다. 1,200억 개의 파라미터를 보유한 이 모델은 다단계 워크플로우를 독립적으로 계획하고 실행하는 '에이전트형(agentic)' 작업에 특화되어 설계되었다. 특히 AWS는 이를 완전 관리형 서버리스 서비스로 제공하여, 개발자들이 하드웨어 관리의 번거로움 없이 고성능 추론 기능을 애플리케이션에 손쉽게 통합할 수 있도록 돕는다.
이 모델의 핵심 차별점은 독특한 하이브리드 Transformer-Mamba 아키텍처에 있다. 일반적인 모델은 데이터 시퀀스가 길어질수록 효율성이 떨어지는 경향이 있지만, 이 방식은 기존 Transformer의 강점과 긴 정보를 효율적으로 처리하는 Mamba의 장점을 결합했다. 또한 Latent Mixture of Experts(MoE) 기술을 활용해 특정 작업마다 최적화된 '전문가' 네트워크 일부만 활성화한다. 결과적으로 거대 모델의 강력한 성능을 유지하면서도 소형 모델 수준의 속도와 경제성을 동시에 확보했다.
아울러 한 번에 여러 단어나 코드 조각을 동시에 예측하는 Multi-token prediction(MTP) 기술을 도입하여 복잡한 소프트웨어 코드 생성이나 정밀한 재무 분석 속도를 획기적으로 높였다. 약 두꺼운 소설 한 권 분량에 해당하는 256,000 토큰의 광대한 문맥 창을 지원하는 Nemotron 3 Super는 향후 사이버 보안, 리테일, 분산 시스템 엔지니어링 등 다양한 기업용 자동화 분야의 핵심 동력으로 자리 잡을 전망이다.