この記事の要点は？

NVIDIAが、1200億パラメータを備えたMambaとTransformerのハイブリッド推論モデル「Nemotron 3 Super」をリリースした。新アーキテクチャの採用により、既存のオープンウェイトモデルと比較してGPUあたりの処理効率が11%向上している。学習データや手法を完全に公開しており、高い透明性とオープン性を備えたモデルとして評価されている。

NVIDIA、推論特化モデル「Nemotron 3 Super」を発表

•NVIDIAが、1200億パラメータを備えたMambaとTransformerのハイブリッド推論モデル「Nemotron 3 Super」をリリースした。
•新アーキテクチャの採用により、既存のオープンウェイトモデルと比較してGPUあたりの処理効率が11%向上している。
•学習データや手法を完全に公開しており、高い透明性とオープン性を備えたモデルとして評価されている。

NVIDIAは、高度な推論能力と圧倒的な効率性を両立させた1200億パラメータの最新モデル「Nemotron 3 Super」を発表した。このモデルは、MambaとTransformerを組み合わせたハイブリッド設計を採用しており、従来のAIが持つ強力なパターン認識能力と最新設計による高速な処理を高い次元で融合させている。Nemotron 3シリーズの中で、この「Super」版は、エッジ向けモデルと大規模データセンター向けシステムの中間を担う強力なラインナップとして位置づけられている。

技術面でのハイライトは、Mixture of Experts (MoE) の統合だ。これはモデル全体のパラメータ（1206億）のうち、特定の処理には一部（127億）のみを稼働させる仕組みである。これにより、大規模な知見を維持しながら、大規模システムに特有の膨大な計算コストを大幅に削減することに成功した。実際の性能テストでは、同等のオープンウェイトモデルと比較して極めて高いスループットを実証しており、コスト効率を重視する開発者にとって非常に魅力的な選択肢となっている。

また、NVIDIAはモデルの重みだけでなく、学習データや詳細な手法も公開することで透明性を高めた。この徹底したオープンアプローチにより、研究者はAIがどのように構築されたのかを正確に把握することが可能だ。さらに、100万トークンという膨大なコンテキストウィンドウをサポートしており、大量の文書や複雑なコードを一括で処理できるため、自律型エージェントや高度な産業利用において真価を発揮するだろう。

NVIDIA（エヌビディア）という会社が、新しいAI「Nemotron 3 Super」を発表しました。このAIは、とても賢く考える力がありながら、動くスピードも非常に速いのが特徴です。2つの異なる仕組み（ハイブリッド Mamba-Transformer アーキテクチャ）を組み合わせることで、パターンを見つけるのが得意なAIの良さと、計算が速いAIの良さを両立させました。これは、小さなAIと巨大なAIのちょうど真ん中にあたる、使い勝手の良いモデルです。

このAIのすごいところは、「必要な知識だけを呼び出す」という仕組み（混合専門家：MoE）を使っている点です。AIの脳には1206億個の知識の種（パラメーター）がありますが、実際に一度に使うのはそのうちの約10分の1である127億個だけです。これにより、物知りなのに、動かすための電気や計算の手間（計算コスト）を低く抑えることができました。他の似たようなAIと比べても、情報を処理するスピード（スループット）が11%も速くなっています。

また、NVIDIAはこのAIをどのように作ったのか、どんなデータで勉強させたのかという「秘密のレシピ」をすべて公開（オープンウェイト）しました。さらに、一度に読み込める情報の量（コンテキストウィンドウ）が、なんと本一冊どころか図書館にあるような大量の書類や複雑なプログラミングまで一気に読み込めるほど大きくなっています。これにより、人間のように自分から動くAI（エージェント）や、工場の複雑なシステムなどで活躍することが期待されています。

NVIDIA、推論特化モデル「Nemotron 3 Super」を発表

NVIDIA（エヌビディア）が発表！頭が良くて動きも速い、新しいAI「Nemotron 3 Super」

タグ