Claude
Claude Opus 4.1
Model ID:claude-opus-4-1-20250805
2025-08-05商用モデル
API
総合12位
人気31位
Claude Opus 4.1はAnthropicのフラッグシップモデルのアップデート版であり、コーディング、推論、エージェントタスクにおけるパフォーマンスが向上しています。SWE-bench Verifiedで74.5%のスコアを達成し、複数ファイルにわたるコードのリファクタリング、デバッグの精度、詳細な推論能力において顕著な進歩を見せています。最大64Kトークンまでの拡張思考をサポートしており、リサーチ、データ分析、ツールを活用した推論タスクに最適化されています。
学習完了日
2025-01-31
このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。
入力形式 → 出力形式
このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。
処理容量
200KIN32KOUT
1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。
単価(100万文字)
$15IN$75OUT
このAIを直接連携して使用する際にかかる費用です。テキスト100万単位(トークン)あたりのドル換算で表示されます。
AI性能評価
Arena 総合点数
1449
±3集計日 2026-04-02
総合ランク
31位
50,176 投票数
Arena 能力別スコア
日本語能力
1409±2521位
複雑な質問
1480±523位
専門知識
1483±1223位
指示遂行
1459±616位
会話記憶
1473±719位
創造力
1445±816位
コード作成
1513±715位
数学力
1443±1133位
Arena 職種別スコア
文学·創作
1445±621位
生活·社会
1471±728位
エンタメ
1433±722位
経営·金融
1448±730位
医学·保健
1480±1223位
法律·行政
1461±1127位
ソフト開発
1492±524位
数学·統計
1450±1231位
推論能力
AA Intelligence Index
42%↑3%
MMLU-Pro
88%↑5%
GPQA Diamond
81%↓1%
HLE
12%↓5%
数学
AA Math Index
80%↑6%
AIME 2025
80%↑6%
コーディング力
AA Coding Index
37%↑0%
LiveCodeBench
65%↑0%
SciCode
41%↓1%
TerminalBench
34%↑0%
指示遂行
IFBench
55%↓2%
환각률 (HHEM)
12%↑1%
사실 일관성 (HHEM)
88%↓1%
長文理解
AA-LCR
66%↑3%
エージェントAI能力
TAU2
71%↑0%
速度
標準モード
34tok/sec↓44
出力開始 1.33s
Artificial Analysis
推論モード
35tok/sec↓38
出力開始 8.29s
Artificial Analysis