이 기사의 핵심 내용은?

NVIDIA가 1,200억 개(120B)의 파라미터를 갖춘 하이브리드 Mamba-Transformer 추론 모델인 Nemotron 3 Super를 출시했다. 새로운 아키텍처를 통해 기존 오픈 가중치 경쟁 모델 대비 GPU당 처리량(throughput)을 11% 향상시켰다. 훈련 데이터와 방법론을 완전히 공개하며 모델 개방성 측면에서 높은 점수를 기록했다.

NVIDIA, 추론 모델 ‘Nemotron 3 Super’ 전격 공개

•NVIDIA가 1,200억 개(120B)의 파라미터를 갖춘 하이브리드 Mamba-Transformer 추론 모델인 Nemotron 3 Super를 출시했다.
•새로운 아키텍처를 통해 기존 오픈 가중치 경쟁 모델 대비 GPU당 처리량(throughput)을 11% 향상시켰다.
•훈련 데이터와 방법론을 완전히 공개하며 모델 개방성 측면에서 높은 점수를 기록했다.

•엔비디아가 아주 똑똑하면서도 일 처리가 엄청나게 빠른 새로운 인공지능 '네모트론 3 슈퍼'를 만들었습니다.
•뇌 전체를 다 쓰지 않고 필요한 부분만 골라 쓰는 효율적인 방식 덕분에 다른 인공지능보다 11%나 더 빨리 일합니다.
•인공지능을 어떻게 만들었는지 비법과 재료를 모두 공개해서 누구나 믿고 연구할 수 있게 했습니다.

NVIDIA가 고도의 추론 능력과 최상의 연산 효율성을 동시에 지향하는 1,200억 개(120B) 파라미터 규모의 추론 모델, Nemotron 3 Super를 공개했다. 이 모델은 하이브리드 Mamba-Transformer 아키텍처를 채택함으로써 기존 AI의 강력한 패턴 인식 성능과 최신 설계의 빠른 속도를 조화롭게 결합해냈다. 특히 Nemotron 3 라인업의 중급형 핵심 모델로서, 소형 에지 모델과 거대 데이터 센터용 시스템 사이의 간극을 효과적으로 메워주는 중추적인 역할을 수행한다.

기술적인 핵심은 Mixture of Experts (MoE) 구조의 통합에 있다. 전체 1,200억 개의 파라미터 중 연산 시에는 오직 일부(약 12.7B)만을 활성화하는 이 방식은, 대규모 시스템의 막대한 연산 비용을 들이지 않고도 풍부한 지식을 유지할 수 있게 해준다. 실제로 진행된 성능 테스트에서 이 모델은 유사한 오픈 가중치 모델 대비 월등히 높은 데이터 처리량(throughput)을 기록했으며, 이에 따라 비용 효율적인 모델 배포를 원하는 개발자들에게 매우 매력적인 대안이 될 것으로 보인다.

한편, NVIDIA는 모델 가중치는 물론 훈련 데이터와 상세 방법론까지 투명하게 공개하며 모델의 신뢰도를 높였다. 이러한 '오픈 가중치' 전략 덕분에 연구자들은 모델의 구축 원리를 명확히 이해하고 상세 설계를 파악할 수 있게 되었다. 또한 100만 토큰에 달하는 방대한 컨텍스트 창을 제공하여 복잡한 코드나 방대한 문서군을 한 번에 처리할 수 있으며, 그 결과 에이전트 기반 워크플로우와 다양한 산업 현장의 애플리케이션에서 최상급 도구로서의 입지를 공고히 했다.

엔비디아가 아주 똑똑하게 생각하면서도 일을 엄청나게 빨리 처리하는 인공지능 '네모트론 3 슈퍼'를 세상에 내놓았습니다. 이 인공지능은 1,200억 개의 지식 조각(파라미터)을 가지고 있는데, 기존의 똑똑한 방식과 새로운 빠른 방식을 섞어서(하이브리드 맘바-트랜스포머 구조) 아주 효율적으로 작동합니다. 이 모델은 너무 크지도 작지도 않은 적당한 크기라, 우리 주변의 기기들과 커다란 컴퓨터 센터 사이를 연결해 주는 든든한 일꾼 역할을 합니다.

이 인공지능의 가장 놀라운 점은 '필요한 부분만 골라 쓰는 방식(전문가 혼합, MoE)'을 사용한다는 것입니다. 1,200억 개가 넘는 뇌 세포 중에서 실제 일할 때는 약 127억 개 정도만 깨워서 사용합니다. 마치 도서관의 모든 책을 다 꺼내지 않고 필요한 책만 골라 읽는 것과 같아서, 힘은 덜 들면서도 깊은 지식은 그대로 유지할 수 있습니다. 덕분에 다른 비슷한 인공지능들보다 정보 처리 속도(처리량)가 11%나 더 빨라졌고, 돈도 적게 들면서 더 많은 일을 할 수 있게 되었습니다.

엔비디아는 단순히 인공지능만 공개한 것이 아니라, 이 인공지능을 어떤 재료로 어떻게 가르쳤는지(학습 데이터 및 방법론) 그 비법을 모두 투명하게 공개(오픈 웨이트)했습니다. 그래서 연구자들은 이 인공지능이 어떻게 만들어졌는지 속 시원히 들여다볼 수 있습니다. 또한, 이 모델은 한 번에 읽을 수 있는 정보의 양(컨텍스트 윈도우)이 엄청나게 많아서, 책 수천 권 분량의 서류나 복잡한 컴퓨터 코드도 한꺼번에 읽고 이해할 수 있습니다. 이는 앞으로 스스로 일하는 로봇이나 복잡한 공장 시스템 등 다양한 산업 현장에서 아주 유용하게 쓰일 것입니다.

NVIDIA, 추론 모델 ‘Nemotron 3 Super’ 전격 공개

엔비디아, 생각하는 힘이 엄청나고 속도까지 빠른 새로운 인공지능 공개

태그