ChatGPT

GPT-4.1

Model ID:gpt-4.1-2025-04-14

2025-04-14상용 모델

API

종합26위

인기197위

GPT-4.1은 고도의 지시 이행, 실무 수준의 소프트웨어 엔지니어링, 그리고 긴 문맥 추론에 최적화된 플래그십 대규모 언어 모델입니다. 100만 토큰의 컨텍스트 윈도우를 지원하며, 코딩(SWE-bench Verified 54.6%), 지시 이행(IFEval 87.4%), 멀티모달 이해도 평가에서 GPT-4o와 GPT-4.5를 능가하는 성능을 보여줍니다. 정밀한 코드 차이 분석, 에이전트 신뢰성, 대규모 문서에서의 높은 리콜 성능에 맞춰 튜닝되었으며, AI 에이전트, IDE 도구, 기업용 지식 검색 시스템에 최적화된 모델입니다.

학습 완료일

2024-06-30

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

1.0MIN33KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$2IN$8OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1312

±4

집계일 2026-04-02

종합 순위

197위

100,105 투표수

Arena 능력별 점수

한국어 능력

1254±21144위

복잡한 질문

1311±6204위

전문 지식

1285±12196위

지시 이행

1293±6195위

대화 기억

1297±8196위

창의력

1286±8185위

코딩 실력

1338±7204위

수학 능력

1302±8174위

Arena 직군별 점수

문학·창작

1306±6177위

생활·사회과학

1322±8202위

엔터·미디어

1289±8172위

경영·금융

1282±9216위

의학·보건

1307±12202위

법률·행정

1316±11205위

소프트웨어·IT

1324±6211위

수학·통계

1308±8174위

출처:Arena Intelligence

추론 능력

AA Intelligence Index

26%↓13%

MMLU-Pro

81%↓2%

GPQA Diamond

67%↓15%

HLE

4.6%↓12%

수학

AA Math Index

35%↓40%

MATH-500

91%↓3%

AIME 2024

44%↓16%

AIME 2025

35%↓40%

코딩 실력

AA Coding Index

22%↓15%

LiveCodeBench

46%↓20%

SciCode

38%↓4%

TerminalBench

14%↓20%

지시 이행

IFBench

43%↓14%

장문 이해

AA-LCR

61%↓3%

에이전틱 AI 능력

TAU2

47%↓24%

속도

일반 모드

128tok/sec↑50

출력 시작 0.56s

Artificial Analysis

출처:Artificial Analysis

← AI 모델 목록으로