Moonshot AI, 시각적 에이전틱 AI 'Kimi K2.5' 공개
2026년 2월 3일 (화)
- •Moonshot AI가 시각적 에이전틱 작업에 최적화된 오픈소스 멀티모달 모델 Kimi K2.5를 전격 출시했다.
- •새로운 '에이전트 스웜' 프레임워크를 통해 병렬 실행을 구현했으며, 작업 지연 시간을 최대 4.5배까지 단축하는 데 성공했다.
- •코딩, 추론, 복잡한 시각 기반 문제 해결 등 주요 지표에서 세계 최고 수준의 성능을 기록하며 기술력을 입증했다.
Moonshot AI가 보는 것과 행동하는 것 사이의 간극을 좁힌 정교한 오픈소스 모델 Kimi K2.5를 공개했다. 기존 모델들이 텍스트와 이미지를 별개로 처리했던 것과 달리, K2.5는 '공동 최적화' 방식을 전격 채택했다. 이에 따라 모델은 초기 학습 단계부터 강화 학습을 통해 인간의 선호도에 맞추는 최종 단계까지 텍스트와 시각 정보를 동시에 학습하며 더욱 통합적인 사고가 가능해졌다.
특히 이번 발표에서 가장 주목받는 혁신은 병렬 작업 관리를 위해 설계된 프레임워크인 '에이전트 스웜(Agent Swarm)'의 도입이다. 이는 마치 오케스트라를 지휘하는 지휘자와 같은 역할을 수행한다. 하나의 AI 에이전트가 복잡한 문제를 순차적으로 해결하던 기존 방식에서 벗어나, 에이전트 스웜은 문제를 작은 단위로 쪼개어 동시에 실행한다. 실제로 이러한 분할 정복 방식은 워크플로우 처리 속도를 획기적으로 높였으며, 그 결과 지연 시간을 4.5배나 단축하는 성과를 거두었다.
Moonshot AI는 이번 모델의 체크포인트를 일반에 공개함으로써 연구 커뮤니티가 에이전틱 AI의 가능성을 깊이 있게 탐구할 수 있도록 지원한다. 에이전틱 AI는 단순히 대화에 그치지 않고, 디지털 환경을 스스로 탐색하며 능동적으로 과업을 수행하는 지능을 의미한다. 코딩 챌린지 해결부터 시각적 데이터 추론까지 탁월한 성능을 보이는 Kimi K2.5는 더욱 유능하고 자율적인 디지털 비서 시대로 나아가는 중요한 도약이 될 전망이다.