この記事の要点は？

NVIDIAが1200億パラメータのハイブリッドモデル「Nemotron 3 Super」を発表。自律型エージェントの処理能力を5倍に向上させた。 MambaとTransformerを融合した新アーキテクチャとLatent MoEにより、計算コストを大幅に削減した。 100万トークンの広大なコンテキストウィンドウを備え、Blackwellハードウェアへの最適化と重みの公開が行われた。

NVIDIA、高速AIエージェント向け「Nemotron 3 Super」をリリース

•NVIDIAが1200億パラメータのハイブリッドモデル「Nemotron 3 Super」を発表。自律型エージェントの処理能力を5倍に向上させた。
•MambaとTransformerを融合した新アーキテクチャとLatent MoEにより、計算コストを大幅に削減した。
•100万トークンの広大なコンテキストウィンドウを備え、Blackwellハードウェアへの最適化と重みの公開が行われた。

NVIDIAは、次世代の自律型AIエージェントを支えるために設計された、1200億パラメータのオープンモデル「Nemotron 3 Super」を公開した。企業が単純なチャットボットから複雑なマルチエージェントシステムへと移行する中で、エージェント間で交換される膨大なデータがパフォーマンスを低下させる「コンテキスト爆発」が課題となっている。Nemotron 3 Superは100万トークンのコンテキストウィンドウを活用することで、この問題に対処した。これは分厚い小説数冊分に相当する膨大な情報を、本来の目的を見失うことなく記憶できることを意味している。

このモデルの高い効率性は、2つの異なるニューラルネットワーク設計を融合させた高度なハイブリッドアーキテクチャに由来する。具体的には、長いデータ列の処理に長けたMambaレイヤーと、複雑なタスクに必要な深い推論能力を提供する従来のTransformerレイヤーを組み合わせている。さらに「Mixture-of-Experts（混合エキスパート）」手法を採用したことで、総パラメータ数は1200億にのぼるものの、実際に稼働するのは一度につき120億パラメータのみとなり、各回答に必要なエネルギーと計算リソースを劇的に削減することに成功した。

さらなる高速化を実現するため、NVIDIAは「Multi-token prediction」を導入した。これはAIが次の単語を一つずつ予測するのではなく、複数の単語を同時に推測する技術である。最新のBlackwellハードウェアへの最適化と相まって、推論速度は前世代の最大4倍に達した。NVIDIAはモデルの重みをオープンに公開することで、サイバーセキュリティや財務分析といった専門分野における高精度なツール利用を支援する。これにより、大規模な推論モデルにありがちな「思考コスト（Thinking Tax）」を支払うことなく、高度なエージェントの構築が可能になるのだ。

NVIDIA（エヌビディア）という会社が、「Nemotron（ネモトロン） 3 Super」という新しいAIを発表しました。これは、人間が細かく指示しなくても、自分で考えて動く「自律型AI（エージェント型AI）」のために作られた特別なAIです。これまでのAIは、たくさんの情報を一度に扱うと頭がパンクして動きが遅くなる「情報の爆発（コンテキスト・エクスプロージョン）」という問題がありました。しかし、このAIは分厚い小説を何冊も一度に覚えられるくらいの「巨大な記憶スペース（100万トークンのコンテキストウィンドウ）」を持っているので、長いお仕事でも目標を忘れずに最後までやり遂げることができます。

このAIが速くて賢い理由は、2つの異なる「脳の仕組み（ニューラルネットワーク）」を組み合わせた「ハイブリッド構造」にあります。長いお話を整理するのが得意な仕組み（Mambaレイヤー）と、深く考えるのが得意な仕組み（Transformerレイヤー）を合体させたのです。さらに、1200億個もある「知識のパーツ（パラメータ）」のうち、その時に必要な120億個だけを動かす「専門家チーム方式（混合エキスパート：MoE）」を採用しました。これにより、使うエネルギーやコンピューターの力を節約しながら、素早く答えを出せるようになりました。

さらにスピードを上げるために、次の言葉を1つずつではなく、一度にいくつも予想して書き出す「まとめ書き技術（マルチトークン予測）」も取り入れました。最新の強力な「AI専用マシン（Blackwellハードウェア）」と一緒に使うことで、これまでの4倍もの速さで動きます。NVIDIAはこのAIの「脳の設計図（モデルの重み）」をみんなに公開しました。これによって、世界中の開発者がサイバー攻撃を防いだり、お金の計算をしたりする「超得意分野を持つAI」を、これまでにない正確さとスピードで作れるようになるのです。

NVIDIA、高速AIエージェント向け「Nemotron 3 Super」をリリース

エヌビディアが発表！何でも自分でこなす「超スピードAI」

タグ