Claude
Claude

Claude Opus 4

Model ID:claude-opus-4-20250514
2025-05-22商用モデル

Claude Opus 4は、リリース時点で世界最高性能のコーディングモデルとして評価されており、複雑で長時間にわたるタスクやエージェントワークフローにおいて一貫したパフォーマンスを発揮します。ソフトウェアエンジニアリングの分野で新たな基準を打ち立て、SWE-bench(72.5%)およびTerminal-bench(43.2%)で業界トップクラスの成果を達成しました。Opus 4は拡張性の高いエージェントワークフローをサポートしており、数千ステップに及ぶタスクを数時間にわたって性能を落とすことなく継続的に処理可能です。

API
学習完了日
2025-01-31
入力形式 → 出力形式
処理容量
200KIN32KOUT
単価(100万文字)
$15IN$75OUT

AI性能評価

Arena 総合点数
1424
±4
集計日 2026-04-02
総合ランク
56位
37,191 投票数
Arena 能力別スコア
日本語能力
1386±2330位
複雑な質問
1456±644位
専門知識
1447±1450位
指示遂行
1442±727位
会話記憶
1437±846位
創造力
1431±926位
コード作成
1498±830位
数学力
1418±1261位
Arena 職種別スコア
文学·創作
1429±730位
生活·社会
1440±861位
エンタメ
1420±831位
経営·金融
1412±871位
医学·保健
1447±1356位
法律·行政
1435±1256位
ソフト開発
1467±644位
数学·統計
1423±1363位
総合
AA Intelligence Index
39%↑0%
ForecastBench
61%↑1%
推論·数学
AA Math Index
73%↓1%
GPQA Diamond
80%↓2%
HLE
12%↓5%
MMLU-Pro
87%↑5%
AIME 2025
73%↓1%
MATH-500
98%↑4%
コーディング
AA Coding Index
34%↓2%
LiveCodeBench
64%↓2%
TAU2
73%↑4%
TerminalBench
31%↓3%
SciCode
40%↓2%
言語·指示
IFBench
54%↓4%
AA-LCR
34%↓30%
幻覚率 (HHEM)
12%↑1%
事実一貫性 (HHEM)
88%↓1%
出力速度
標準モード
34tok/s↓48
出力開始 1.33s
推論モード
37tok/s↓73
出力開始 7.54s