StepFunが11Bモデル「Step 3.5 Flash」を公開
2026年2月12日 (木)
- •StepFunが、110億の有効パラメータで最先端の知能を実現した「Step 3.5 Flash」をリリースした。
- •混合専門家モデル (MoE) アーキテクチャを採用し、MathArenaなどの数学・コーディングベンチマークでトップクラスの成績を記録。
- •マルチトークン予測とアテンション機構の最適化により、AIエージェントの遅延とコストを劇的に削減した。
中国のAIスタートアップであるStepFunは、高度な推論能力と実用的な処理速度を両立させた新モデル「Step 3.5 Flash」を発表した。本モデルは、1,960億個の総パラメータのうち、特定のタスクに対して110億個のみを稼働させる「混合専門家モデル (MoE)」を採用している。これにより、計算リソースの効率を維持しながら、業界最高水準のパフォーマンスを実現することに成功したのである。
エージェントとしての機能を強化するため、構造面でも独自の最適化が施された。特に注目すべきは、スライディングウィンドウとフルアテンションを3対1の比率で組み合わせた手法だ。これにより、メモリ消費を抑えつつ長文のコンテキスト処理が可能になった。また、一度に複数の単語を予測する「マルチトークン予測(MTP-3)」の導入により、複雑なやり取りにおける生成速度の向上とコスト削減を同時に達成している。
さらなる推論能力の向上のため、研究チームはスケーラブルな強化学習フレームワークを構築した。数学の正解のような検証可能な信号と人間の好みをフィードバックとして組み合わせ、モデルの自己改善を促す仕組みだ。その結果、Step 3.5 FlashはMathArenaで首位を獲得したほか、Gemini 3.0 ProやGPT-5.2 xHighといった競合モデルに匹敵する、極めて高いコーディング・数学能力を証明している。