Alibaba, 고성능 소형 모델 Qwen3.5 전격 공개
- •Alibaba가 Apache 2.0 라이선스 하에 0.8B에서 9B 매개변수 규모의 Qwen3.5 소형 모델 제품군을 출시했다.
- •특히 9B 모델은 10B 이하 체급에서 가장 뛰어난 성능을 기록하며, 기존 동급 선두 모델들보다 2배 높은 지능을 입증했다.
- •이 모델들은 네이티브 비전 기능과 262K 컨텍스트 윈도우를 지원하며, 일반 소비자용 하드웨어에서의 로컬 실행에 최적화되었다.
Alibaba가 고효율 추론 작업을 위해 설계된 4종의 고밀도 소형 모델을 도입하며 Qwen3.5 생태계를 대폭 확장했다. 0.8B에서 9B 매개변수까지 아우르는 이번 라인업은 이전 세대인 Qwen3와 비교해 지능 측면에서 비약적인 도약을 이루어냈다. 특히 9B 모델은 현재 10B 미만 체급에서 선두를 달리고 있으며, Falcon이나 NVIDIA의 Nemotron과 같은 경쟁 모델들을 상당한 격차로 앞서고 있다. 해당 모델들은 답변을 내놓기 전 방대한 양의 내부 토큰을 생성해 복잡한 문제를 해결하는 통합형 '사고' 방식을 채택했다는 점이 특징이다.
이 모델들은 컴팩트한 크기임에도 불구하고 별도의 어댑터 없이 텍스트와 이미지를 동시에 처리할 수 있는 네이티브 비전 지원 멀티모달 구조를 갖췄다. 실제로 멀티모달 추론 능력을 측정하는 MMMU-Pro 벤치마크에서 9B와 4B 모델은 각각 69%와 65%의 점수를 기록하며 15B 미만 모델 중 최고 수준의 표준을 제시했다. 이러한 역량 덕분에 메모리 자원이 제한적이면서도 시각적 이해가 필수적인 엣지 컴퓨팅 애플리케이션 분야에서 매우 강력한 도구가 될 것으로 보인다.
다만 이러한 지능적 성능은 높은 토큰 소모량이라는 구체적인 기회비용을 수반한다. 소형 모델임에도 불구하고 문제를 해결하기 위해 '사고'하는 과정에서 대형 플래그십 모델이나 GPT-5.1과 같은 최상위 모델보다 훨씬 더 많은 출력 토큰을 사용하기 때문이다. 또한 추론 능력은 예리하지만, AA-Omniscience 벤치마크에서 높은 환각률을 보이는 등 사실 관계의 정확성 측면에서는 여전히 한계가 존재한다. 그럼에도 Apache 2.0 라이선스와 낮은 메모리 요구 사양을 바탕으로, 이제 개발자들은 일반적인 노트북이나 스마트폰에서도 고성능 AI 모델을 로컬 환경에서 자유롭게 실행할 수 있게 되었다.