NVIDIA、Amazon BedrockでNemotron 3 Nanoを公開
2026年3月9日 (月)
- •NVIDIAの300億パラメータモデル「Nemotron 3 Nano」が、Amazon Bedrockでサーバーレスエンドポイントとして提供開始された。
- •TransformerとMambaを統合し、Mixture-of-Experts(MoE)を採用した革新的なハイブリッド・アーキテクチャにより、高効率な推論を実現している。
- •コーディング(SWE-bench)や数学(AIME 2025)の主要なベンチマークにおいて、極めて高いスコアを記録した。
NVIDIAは、高性能なエンタープライズアプリケーション向けに設計された300億パラメータの高度なモデル「Nemotron 3 Nano」を導入し、Amazon Bedrockにおけるポートフォリオを拡充した。従来の密な(Dense)モデルとは異なり、このモデルはMixture-of-Experts(MoE)アーキテクチャを採用しており、推論時にアクティブになるのはそのうち30億パラメータのみである。この設計により、モデルは高い精度を維持しつつ、各回答に必要な計算リソースを劇的に削減することに成功した。
技術的バックボーンには、TransformerとMambaを融合させた革新的なハイブリッド設計が採用されている。構造的な推論や複雑な計画を得意とするTransformerと、メモリ負荷を抑えつつ長距離の情報を扱うMambaの組み合わせは、強力な相乗効果を生む。さらに、数百ページ分のテキストに相当する25万6,000トークンの広大なコンテキストウィンドウを備えており、複雑なソフトウェア開発や膨大な金融データの解析において、その真価を発揮する。
Amazon Bedrockを通じた提供により、開発者は完全に管理されたサーバーレス環境下でこれらの機能を活用できる。これによりインフラ管理の手間が省かれ、開発チームは本来の目的である機能開発にリソースを集中させることが可能だ。また、AWSのセキュリティツールやデータ検索システムとのシームレスな連携も実現しており、企業の内部文書に基づいた、安全で信頼性の高いAIアシスタントの構築を強力に支援する。