ChatGPT
GPT-4.1
Model ID:gpt-4.1-2025-04-14
2025-04-14상용 모델
API
종합26위
인기197위
GPT-4.1은 고도의 지시 이행, 실무 수준의 소프트웨어 엔지니어링, 그리고 긴 문맥 추론에 최적화된 플래그십 대규모 언어 모델입니다. 100만 토큰의 컨텍스트 윈도우를 지원하며, 코딩(SWE-bench Verified 54.6%), 지시 이행(IFEval 87.4%), 멀티모달 이해도 평가에서 GPT-4o와 GPT-4.5를 능가하는 성능을 보여줍니다. 정밀한 코드 차이 분석, 에이전트 신뢰성, 대규모 문서에서의 높은 리콜 성능에 맞춰 튜닝되었으며, AI 에이전트, IDE 도구, 기업용 지식 검색 시스템에 최적화된 모델입니다.
학습 완료일
2024-06-30
이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.
입력 형식 → 출력 형식
이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.
처리용량
1.0MIN33KOUT
한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.
개별 비용(백만 글자)
$2IN$8OUT
이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.
AI 성능 평가
Arena 종합 점수
1312
±4집계일 2026-04-02
종합 순위
197위
100,105 투표수
Arena 능력별 점수
한국어 능력
1254±21144위
복잡한 질문
1311±6204위
전문 지식
1285±12196위
지시 이행
1293±6195위
대화 기억
1297±8196위
창의력
1286±8185위
코딩 실력
1338±7204위
수학 능력
1302±8174위
Arena 직군별 점수
문학·창작
1306±6177위
생활·사회과학
1322±8202위
엔터·미디어
1289±8172위
경영·금융
1282±9216위
의학·보건
1307±12202위
법률·행정
1316±11205위
소프트웨어·IT
1324±6211위
수학·통계
1308±8174위
추론 능력
AA Intelligence Index
26%↓13%
MMLU-Pro
81%↓2%
GPQA Diamond
67%↓15%
HLE
4.6%↓12%
수학
AA Math Index
35%↓40%
MATH-500
91%↓3%
AIME 2024
44%↓16%
AIME 2025
35%↓40%
코딩 실력
AA Coding Index
22%↓15%
LiveCodeBench
46%↓20%
SciCode
38%↓4%
TerminalBench
14%↓20%
지시 이행
IFBench
43%↓14%
장문 이해
AA-LCR
61%↓3%
에이전틱 AI 능력
TAU2
47%↓24%
속도
일반 모드
128tok/sec↑50
출력 시작 0.56s
Artificial Analysis