Claude

Claude Opus 4.1

Model ID:claude-opus-4-1-20250805

2025-08-05商用モデル

API

総合12位

人気31位

Claude Opus 4.1はAnthropicのフラッグシップモデルのアップデート版であり、コーディング、推論、エージェントタスクにおけるパフォーマンスが向上しています。SWE-bench Verifiedで74.5%のスコアを達成し、複数ファイルにわたるコードのリファクタリング、デバッグの精度、詳細な推論能力において顕著な進歩を見せています。最大64Kトークンまでの拡張思考をサポートしており、リサーチ、データ分析、ツールを活用した推論タスクに最適化されています。

学習完了日

2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

200KIN32KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$15IN$75OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1449

±3

集計日 2026-04-02

総合ランク

31位

50,176 投票数

Arena 能力別スコア

日本語能力

1409±2521位

複雑な質問

1480±523位

専門知識

1483±1223位

指示遂行

1459±616位

会話記憶

1473±719位

創造力

1445±816位

コード作成

1513±715位

数学力

1443±1133位

Arena 職種別スコア

文学·創作

1445±621位

生活·社会

1471±728位

エンタメ

1433±722位

経営·金融

1448±730位

医学·保健

1480±1223位

法律·行政

1461±1127位

ソフト開発

1492±524位

数学·統計

1450±1231位

出典:Arena Intelligence

推論能力

AA Intelligence Index

42%↑3%

MMLU-Pro

88%↑5%

GPQA Diamond

81%↓1%

HLE

12%↓5%

数学

AA Math Index

80%↑6%

AIME 2025

80%↑6%

コーディング力

AA Coding Index

37%↑0%

LiveCodeBench

65%↑0%

SciCode

41%↓1%

TerminalBench

34%↑0%

指示遂行

IFBench

55%↓2%

환각률 (HHEM)

12%↑1%

사실 일관성 (HHEM)

88%↓1%

長文理解

AA-LCR

66%↑3%

エージェントAI能力

TAU2

71%↑0%

速度

標準モード

34tok/sec↓44

出力開始 1.33s

Artificial Analysis

推論モード

35tok/sec↓38

出力開始 8.29s

Artificial Analysis

出典:Artificial Analysis Vectara HHEM

← AIモデル一覧へ