NVIDIA, 추론 모델 ‘Nemotron 3 Super’ 전격 공개
- •NVIDIA가 1,200억 개(120B)의 파라미터를 갖춘 하이브리드 Mamba-Transformer 추론 모델인 Nemotron 3 Super를 출시했다.
- •새로운 아키텍처를 통해 기존 오픈 가중치 경쟁 모델 대비 GPU당 처리량(throughput)을 11% 향상시켰다.
- •훈련 데이터와 방법론을 완전히 공개하며 모델 개방성 측면에서 높은 점수를 기록했다.
NVIDIA가 고도의 추론 능력과 최상의 연산 효율성을 동시에 지향하는 1,200억 개(120B) 파라미터 규모의 추론 모델, Nemotron 3 Super를 공개했다. 이 모델은 하이브리드 Mamba-Transformer 아키텍처를 채택함으로써 기존 AI의 강력한 패턴 인식 성능과 최신 설계의 빠른 속도를 조화롭게 결합해냈다. 특히 Nemotron 3 라인업의 중급형 핵심 모델로서, 소형 에지 모델과 거대 데이터 센터용 시스템 사이의 간극을 효과적으로 메워주는 중추적인 역할을 수행한다.
기술적인 핵심은 Mixture of Experts (MoE) 구조의 통합에 있다. 전체 1,200억 개의 파라미터 중 연산 시에는 오직 일부(약 12.7B)만을 활성화하는 이 방식은, 대규모 시스템의 막대한 연산 비용을 들이지 않고도 풍부한 지식을 유지할 수 있게 해준다. 실제로 진행된 성능 테스트에서 이 모델은 유사한 오픈 가중치 모델 대비 월등히 높은 데이터 처리량(throughput)을 기록했으며, 이에 따라 비용 효율적인 모델 배포를 원하는 개발자들에게 매우 매력적인 대안이 될 것으로 보인다.
한편, NVIDIA는 모델 가중치는 물론 훈련 데이터와 상세 방법론까지 투명하게 공개하며 모델의 신뢰도를 높였다. 이러한 '오픈 가중치' 전략 덕분에 연구자들은 모델의 구축 원리를 명확히 이해하고 상세 설계를 파악할 수 있게 되었다. 또한 100만 토큰에 달하는 방대한 컨텍스트 창을 제공하여 복잡한 코드나 방대한 문서군을 한 번에 처리할 수 있으며, 그 결과 에이전트 기반 워크플로우와 다양한 산업 현장의 애플리케이션에서 최상급 도구로서의 입지를 공고히 했다.