Anthropic
Anthropic

Claude Sonnet 4

Model ID
2025-05-22商用モデル

Claude Sonnet 4は、前モデルであるSonnet 3.7の機能を大幅に強化し、コーディングと推論の両タスクにおいて、より高い精度と制御性を実現しました。SWE-benchで72.7%という最高水準のパフォーマンスを達成したSonnet 4は、優れた能力と計算効率のバランスが取れており、日常的なコーディングから複雑なソフトウェア開発プロジェクトまで、幅広い用途に適しています。主な改善点として、自律的なコードベース探索機能の向上、エージェント駆動型ワークフローにおけるエラー率の低減、そして複雑な指示に従う際の信頼性が強化されました。Sonnet 4は実用的な日常利用に最適化されており、多様な社内外のシナリオにおいて、効率性と応答性を維持しながら高度な推論能力を提供します。詳細は

API
学習完了日
2025-01-31
入力形式 → 出力形式
処理容量
200KIN64KOUT
単価(100万文字)
$3IN$15OUT

AI性能評価

Arena 総合点数
1399
±4
集計日 2026-04-07
総合ランク
94位
35,444 投票数
Arena 能力別スコア
日本語能力
1344±2362位
複雑な質問
1431±675位
専門知識
1435±1467位
指示遂行
1414±760位
会話記憶
1419±866位
創造力
1395±960位
コード作成
1473±851位
数学力
1402±1388位
Arena 職種別スコア
文学·創作
1397±770位
生活·社会
1418±887位
エンタメ
1388±868位
経営·金融
1385±8109位
医学·保健
1420±1396位
法律·行政
1409±1388位
ソフト開発
1443±678位
数学·統計
1409±1391位
総合
AA Intelligence Index
39%↑0%
ForecastBench
59%↓1%
推論·数学
AA Math Index
74%↑1%
GPQA Diamond
78%↓3%
HLE
9.6%↓7%
MMLU-Pro
84%↑3%
AIME 2025
74%↑1%
MATH-500
99%↑6%
コーディング
AA Coding Index
34%↑0%
LiveCodeBench
66%↑1%
TAU2
65%↓7%
TerminalBench
31%↑0%
SciCode
40%↓1%
言語·指示
IFBench
55%↓1%
AA-LCR
65%↑3%
幻覚率 (HHEM)
10%↑0%
事実一貫性 (HHEM)
90%↑0%
出力速度
標準モード
45tok/s↓35
出力開始 0.80s
推論モード
51tok/s↓80
出力開始 8.64s