이 기사의 핵심 내용은?

구글 딥마인드가 아파치 2.0 라이선스 하에 네 가지 크기로 구성된 Gemma 4 제품군을 출시했다. 새로운 31B 조밀 모델(dense model)은 아레나 AI 리더보드의 오픈 모델 부문에서 전 세계 3위를 기록했다. 에이전틱 AI 워크플로, 확장된 문맥 창, 멀티모달 시각 및 오디오 기능을 기본적으로 지원한다.

구글 딥마인드, 오픈 모델 'Gemma 4' 전격 공개

•구글 딥마인드가 아파치 2.0 라이선스 하에 네 가지 크기로 구성된 Gemma 4 제품군을 출시했다.
•새로운 31B 조밀 모델(dense model)은 아레나 AI 리더보드의 오픈 모델 부문에서 전 세계 3위를 기록했다.
•에이전틱 AI 워크플로, 확장된 문맥 창, 멀티모달 시각 및 오디오 기능을 기본적으로 지원한다.

Gemma 4는 일반 소비자용 하드웨어에서도 최상위권의 추론 성능을 발휘할 수 있도록 '파라미터당 지능'을 극대화하며 오픈 소스 AI 분야에서 큰 도약을 이뤄냈다. 특히 Gemini 3와 동일한 핵심 아키텍처를 활용하여 개발자들이 막대한 인프라 비용 부담 없이도 고성능 시스템에 필적하는 정교한 애플리케이션을 구축할 수 있도록 지원한다.

라인업은 'Effective' 엣지 모델(2B, 4B)과 고용량 모델(26B, 31B)로 구분된다. 이 가운데 소형 변체 모델은 모바일 및 IoT 기기에 최적화되어 장치 자체에서 실시간 오디오 및 비전 처리를 수행할 수 있다. 한편, 26B 모델은 혼합 전문가 모델 (MoE) 방식을 채택하여 작업 시 전체 파라미터의 일부만 활성화함으로써 논리적 추론 품질을 유지하면서도 처리 속도를 비약적으로 높였다.

무엇보다 Gemma 4는 에이전틱 AI 워크플로를 염두에 두고 설계되어, 모델이 독자적으로 외부 도구를 사용하고 구조화된 데이터(JSON)를 생성하며 복잡한 다단계 계획을 수행할 수 있다. 단순한 채팅 인터페이스에서 자율 에이전트로 진화한 결과 128K에서 최대 256K 토큰에 달하는 방대한 문맥 창을 제공하며, 이를 통해 전체 코드 저장소나 복잡한 문서를 한 번에 처리하는 역량을 확보했다.

Gemma 4는 일반 소비자용 하드웨어에서도 최상위권의 추론 성능을 발휘할 수 있도록 '파라미터당 지능'을 극대화하며 오픈 소스 AI 분야에서 큰 도약을 이뤄냈다. 특히 Gemini 3와 동일한 핵심 아키텍처를 활용하여 개발자들이 막대한 인프라 비용 부담 없이도 고성능 시스템에 필적하는 정교한 애플리케이션을 구축할 수 있도록 지원한다.

라인업은 'Effective' 엣지 모델(2B, 4B)과 고용량 모델(26B, 31B)로 구분된다. 이 가운데 소형 변체 모델은 모바일 및 IoT 기기에 최적화되어 장치 자체에서 실시간 오디오 및 비전 처리를 수행할 수 있다. 한편, 26B 모델은 혼합 전문가 모델 (MoE) 방식을 채택하여 작업 시 전체 파라미터의 일부만 활성화함으로써 논리적 추론 품질을 유지하면서도 처리 속도를 비약적으로 높였다.

무엇보다 Gemma 4는 에이전틱 AI 워크플로를 염두에 두고 설계되어, 모델이 독자적으로 외부 도구를 사용하고 구조화된 데이터(JSON)를 생성하며 복잡한 다단계 계획을 수행할 수 있다. 단순한 채팅 인터페이스에서 자율 에이전트로 진화한 결과 128K에서 최대 256K 토큰에 달하는 방대한 문맥 창을 제공하며, 이를 통해 전체 코드 저장소나 복잡한 문서를 한 번에 처리하는 역량을 확보했다.

구글 딥마인드, 오픈 모델 'Gemma 4' 전격 공개

태그