国産初、思考プロセスを持つ生成AI「PLaMo 3.0 Prime β」公開
- •Preferred Networksが国産初となる推論(Reasoning)対応モデル「PLaMo 3.0 Prime β」を公開。
- •YaRN技術によりコンテキスト長を64Kトークンへ拡張し、数学や医療等の専門領域で性能が飛躍。
- •思考過程(Thinking Process)を生成する機能を備え、複雑な論理パズルも正確に解く能力を獲得。
Preferred Networks(PFN)が、同社のフラグシップモデルとなる「PLaMo 3.0 Prime β版」をリリースしました。このモデルの最大の特徴は、日本国内でフルスクラッチ開発されたモデルとして初めて「推論(Reasoning)能力」を備えている点にあります。従来のモデルが直接回答を生成するのに対し、本モデルは複雑な問題を解く際に内部でステップごとに思考を整理してから最終的な答えを導き出す「思考過程」を出力することが可能です。
技術面では、学習パイプラインを全面的に刷新しました。従来のSFT(教師ありファインチューニング)やDPO(直接選好最適化)に加え、今回新たに強化学習(RL)を導入しています。これにより、数学的推論を測るベンチマーク「AIME 2024」などで従来のPLaMo 2.2を大きく上回るスコアを記録しました。さらに、YaRNと呼ばれる技術を用いた継続事前学習によって、一度に扱える情報の長さ(コンテキスト長)を従来の2倍にあたる64Kトークンまで拡張することに成功しています。
実際のデモンストレーションでは、有名な「川渡りパズル」のような、条件が複雑に絡み合う論理問題に対しても、自ら状況を整理し、安全な組み合わせをチェックしながら完璧な回答手順を提示しています。現在は思考過程の多くが英語で生成されていますが、今後は日本語での思考を可能にすることで、より効率的な処理と精度の向上を目指すとしています。
PFNは、自社開発のチップからインフラ、モデルまでを一貫して手がける「垂直統合」の強みを活かし、今後もコンテキスト長のさらなる拡張や高度な推論能力の獲得に注力する構えです。現在はモニター企業を募集しており、日本の産業界における生成AIの実用化を加速させる存在として期待が高まっています。