DeepSeek-V3.2登場:GPT-5級の推論性能と革新的エージェント機能を搭載
- •DeepSeek-V3.2が正式リリースされ、推論ベンチマークにおいてGPT-5に匹敵する性能を達成
- •思考プロセスと外部ツールの呼び出しを並行実行する、世界初の高度なエージェント機能を統合
- •特化型モデル「Speciale」がIMO 2025やICPCで金メダル級の成績を収め、圧倒的な論理力を証明
中国の最先端AIスタートアップであるDeepSeek(深度求索)は、最新のフラグシップモデル「DeepSeek-V3.2」の正式版を全世界に向けてリリースした。この新モデルは、先行公開された実験版からのフィードバックを基に、推論の正確性と出力スピードの最適化を極限まで突き詰めている。最大かつ革新的な特徴は、モデル内部の論理的思考プロセス(Chain-of-Thought)を維持しつつ、並行して外部の検索エンジンや計算ツール、APIを自律的に呼び出す機能を備えた点である。これにより、AIが単なる回答者から、複雑なタスクを主体的に実行する「自律型エージェント」へと進化した実用性を示している。
開発の要となったのは、正解への到達は難解だが検証は容易であるという特性を持つ1,800以上のシミュレーション環境を活用した、大規模な強化学習(Reinforcement Learning)の実施だ。8万5,000件を超える高度な指示データを通じた学習により、特定の専門領域に縛られない驚異的な汎用性を獲得するに至った。その推論性能は、米OpenAI社の最新世代モデルに匹敵するスコアを叩き出しており、オープンソースベースのモデルが最高峰のクローズドモデルに肩を並べるという歴史的な転換点を証明したといえる。
さらに、推論に特化した膨大な計算資源を投入する長考型モデル「DeepSeek-V3.2-Speciale」も同時に公開された。このモデルは、国際数学オリンピック(IMO 2025)や国際大学生プログラミングコンテスト(ICPC)ワールドファイナルといった、人間の知性の限界が試される競技において、金メダル相当の圧倒的な成績を記録した。日常のチャットボットのような応答よりも、数学的証明や高度なシステム設計といった、厳密な論理的裏付けが求められる極めて困難な知的労働においてその真価を発揮するように設計されている。
現在、DeepSeek-V3.2シリーズは公式ウェブサイト、モバイルアプリ、およびAPIを通じて全面的に公開されている。また、開発現場で広く利用されるコーディング支援ツール「Claude Code」との標準的な統合も実現しており、エンジニアの開発ワークフローを劇的に高速化させることが期待されている。Sparse Attention(稀疏注意力)メカニズムによる効率的な情報処理によって、膨大なコンテキストを扱いながらも低コスト・低遅延での運用を可能にした。DeepSeekは、この技術革新を通じて次世代のエージェント型AIの新たな業界標準を提示したのである。