Anthropicが高性能推論を備えたClaude Sonnet 4.6を公開
- •Claude Sonnet 4.6がIntelligence Indexで第2位を獲得し、最上位モデルのOpus 4.6に肉薄した。
- •GDPval-AAおよびTerminalBenchで最高スコアを記録し、エージェンティックAI(自律型AI)タスクにおいて競合を圧倒した。
- •新機能「アダプティブ・シンキング」の導入により、精度は向上したものの、トークンの消費量は最大3倍に増加した。
Anthropicは、複雑なマルチステップ操作、いわゆるエージェンティックAI(自律型AI)の実行能力を大幅に強化した「Claude Sonnet 4.6」を発表した。最新の評価指標であるIntelligence Indexにおいて、本モデルは51点を獲得。これは前モデルから8ポイントもの飛躍的な向上であり、フラッグシップモデルであるOpus 4.6とほぼ同等の性能に達している。この性能差の縮小は、多くの高度な実務アプリケーションにおいて、「プロ」ティアと「プレミアム」ティアの境界が曖昧になりつつあることを示唆している。
特に注目すべきは、従来の拡張思考モードに代わり導入された「アダプティブ・シンキング(適応型思考)」機能である。これにより、ユーザーが指定する「低」から「最大」までのエフォートレベル(努力量)に基づき、モデルが内部の推論プロセスを自律的に調整できるようになった。この機能はコーディングや実世界のタスクシミュレーションにおける精度を劇的に向上させる一方で、出力トークン数が大幅に増加するという側面も持つ。最大エフォート設定時、Sonnet 4.6は従来比で3倍のトークンを生成するため、1トークンあたりの単価は変わらなくても、実質的な運用コストは上昇することになる。
ターミナルコマンドを駆使するAIエージェントの構築や、高度な業務フローの自動化を目指す開発者にとって、Sonnet 4.6は現時点で市場最高のパフォーマンスを誇る選択肢だ。現在はベータ版として、100万トークンの巨大なコンテキストウィンドウをサポートしており、膨大なドキュメントやソースコードを一度に読み込み、文脈を維持したまま処理することが可能となっている。この深い推論能力と広大なメモリの組み合わせは、自律的なソフトウェアエンジニアリングや複雑なデータ解析において、極めて強力な武器となるだろう。