Google
Google

Gemini 3.1 Pro

Model ID:gemini-3.1-pro-preview
2026-02-19상용 모델
Google AI PlusGoogle AI ProGoogle AI Ultra|API
종합🥇 1위
인기🥉 3위

Gemini 3.1 Pro Preview는 Google의 최첨단 추론 모델로, 향상된 소프트웨어 엔지니어링 성능과 개선된 에이전트 신뢰성, 그리고 복잡한 워크플로우 전반에서 더욱 효율적인 토큰 사용을 제공합니다. Gemini 3 시리즈의 멀티모달 기반을 바탕으로 텍스트, 이미지, 비디오, 오디오, 코드 전반에 걸친 고정밀 추론 능력과 1M 토큰의 컨텍스트 윈도우를 결합했습니다. 다중 턴 도구 호출 사용 시 'Reasoning Details'를 유지해야 하며, 자세한 내용은 다음 문서를 참조하십시오: https://openrouter.ai/docs/use-cases/reasoning-tokens#preserving-reasoning. 이번 3.1 업데이트는 SWE 벤치마크 및 실제 코딩 환경에서 측정 가능한 성능 향상을 가져왔으며, 금융 및 스프레드시트 기반 워크플로우와 같은 구조화된 도메인에서 더욱 강력한 자율 작업 실행 능력을 선보입니다. 고급 개발 및 에이전트 시스템을 위해 설계된 Gemini 3.1 Pro Preview는 토큰 효율성을 높이는 동시에 장기적인 안정성과 도구 오케스트레이션을 개선했습니다. 또한 비용, 속도, 성능의 균형을 최적화하기 위해 새로운 중간 수준의 사고(medium thinking level) 기능을 도입했습니다. 이 모델은 에이전트 코딩, 구조화된 계획, 멀티모달 분석 및 워크플로우 자동화에 탁월하여 자율 에이전트, 금융 모델링, 스프레드시트 자동화 및 높은 컨텍스트가 필요한 엔터프라이즈 작업에 최적화되어 있습니다.

학습 완료일
2025-01-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
1.0MIN66KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$2IN$12OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

AI 성능 평가

Arena 종합 점수
1494
±5
집계일 2026-04-02
종합 순위
🥉 3위
18,090 투표수
Arena 능력별 점수
한국어 능력
1490±34🥇 1위
복잡한 질문
1517±7🥉 3위
전문 지식
1520±164위
지시 이행
1490±9🥉 3위
대화 기억
1506±114위
창의력
1486±12🥈 2위
코딩 실력
1533±9🥉 3위
수학 능력
1508±184위
Arena 직군별 점수
문학·창작
1487±10🥈 2위
생활·사회과학
1511±12🥉 3위
엔터·미디어
1475±11🥈 2위
경영·금융
1483±107위
의학·보건
1513±175위
법률·행정
1512±17🥉 3위
소프트웨어·IT
1523±8🥉 3위
수학·통계
1499±205위
추론 능력
AA Intelligence Index
57%↑18%
GPQA Diamond
94%↑12%
HLE
45%↑28%
코딩 실력
AA Coding Index
56%↑19%
SciCode
59%↑17%
TerminalBench
54%↑20%
지시 이행
IFBench
77%↑20%
환각률 (HHEM)
10%↑0%
사실 일관성 (HHEM)
90%↑0%
장문 이해
AA-LCR
73%↑9%
에이전틱 AI 능력
TAU2
96%↑24%
속도
일반 모드
122tok/sec↑44
출력 시작 23.97s
Artificial Analysis

다국어 역량

다국어 벤치마크

MGSM 🇰🇷
94%
MGSM 🇯🇵
94%
KMMLU 🇰🇷
82%
JMMLU 🇯🇵
82%
KnowAI 최종 리뷰: 2026-03-23