Claude

Claude Opus 4

Model ID:claude-opus-4-20250514

2025-05-22商用モデル

Claude Opus 4は、リリース時点で世界最高性能のコーディングモデルとして評価されており、複雑で長時間にわたるタスクやエージェントワークフローにおいて一貫したパフォーマンスを発揮します。ソフトウェアエンジニアリングの分野で新たな基準を打ち立て、SWE-bench（72.5%）およびTerminal-bench（43.2%）で業界トップクラスの成果を達成しました。Opus 4は拡張性の高いエージェントワークフローをサポートしており、数千ステップに及ぶタスクを数時間にわたって性能を落とすことなく継続的に処理可能です。

API

学習完了日

2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

200KIN32KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$15IN$75OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1424

±4

集計日 2026-04-02

総合ランク

56位

37,191 投票数

Arena 能力別スコア

日本語能力

1386±2330位

複雑な質問

1456±644位

専門知識

1447±1450位

指示遂行

1442±727位

会話記憶

1437±846位

創造力

1431±926位

コード作成

1498±830位

数学力

1418±1261位

Arena 職種別スコア

文学·創作

1429±730位

生活·社会

1440±861位

エンタメ

1420±831位

経営·金融

1412±871位

医学·保健

1447±1356位

法律·行政

1435±1256位

ソフト開発

1467±644位

数学·統計

1423±1363位

出典:Arena Intelligence

総合

AA Intelligence Index

39%↑0%

ForecastBench

61%↑1%

推論·数学

AA Math Index

73%↓1%

GPQA Diamond

80%↓2%

HLE

12%↓5%

MMLU-Pro

87%↑5%

AIME 2025

73%↓1%

MATH-500

98%↑4%

コーディング

AA Coding Index

34%↓2%

LiveCodeBench

64%↓2%

TAU2

73%↑4%

TerminalBench

31%↓3%

SciCode

40%↓2%

言語·指示

IFBench

54%↓4%

AA-LCR

34%↓30%

幻覚率 (HHEM)

12%↑1%

事実一貫性 (HHEM)

88%↓1%

出力速度

標準モード

34tok/s↓48

出力開始 1.33s

推論モード

37tok/s↓73

出力開始 7.54s

出典:Artificial Analysis ForecastBench Vectara HHEM

← AIモデル一覧へ