NVIDIAのNemotron 3 Super、Amazon Bedrockに登場
2026年3月19日 (木)
- •NVIDIA Nemotron 3 SuperがAmazon Bedrockで公開。エージェント型AI向けのマネージド・サーバーレスモデルとして登場した。
- •1,200億パラメータを誇る本モデルは、TransformerとMambaのハイブリッド構成により、従来比5倍のスループットを実現している。
- •新たな「潜在的混合専門家(Latent MoE)」設計により、推論コストを維持したままエキスパート数を4倍に増やし、高度な推論を可能にした。
NVIDIAはAWS上での生成AI展開を大幅に拡大し、Amazon Bedrockにて「Nemotron 3 Super」の提供を開始した。1,200億ものパラメータを持つこのモデルは、自律的にワークフローを計画・実行する「エージェント型」タスクに特化して設計されている。完全マネージド型のサーバーレスサービスとして提供されるため、開発者は基盤となるインフラ管理の負担に悩まされることなく、高性能な推論機能を自身のアプリケーションへ迅速に統合できる。
特筆すべきは、独自の「Transformer-Mamba」ハイブリッドアーキテクチャの採用である。標準的なモデルはデータ量が増えるほど処理効率が低下する傾向にあるが、本手法は従来のTransformerの汎用性と、長距離情報の処理に長けたMambaの利点を巧みに融合させた。加えて、潜在的混合専門家(Latent MoE)技術を導入したことで、特定の処理に最適な「専門家」ユニットのみを動的に呼び出し、モデルの巨大なパワーを維持しながら高いコスト効率を実現している。
さらに、複数の単語やコードを同時に予測する「Multi-token prediction(MTP)」の実装も大きな進歩といえる。これにより、ソフトウェア開発や複雑な財務分析といった作業における出力スピードが劇的に向上した。25万6,000トークンという、分厚い小説一冊分に相当する広大なコンテキストウィンドウを備えたNemotron 3 Superは、サイバーセキュリティから小売まで、エンタープライズ領域における自動化の強力な基盤となるだろう。