이 기사의 핵심 내용은?

Alibaba가 Apache 2.0 라이선스 하에 0.8B에서 9B 매개변수 규모의 Qwen3.5 소형 모델 제품군을 출시했다. 특히 9B 모델은 10B 이하 체급에서 가장 뛰어난 성능을 기록하며, 기존 동급 선두 모델들보다 2배 높은 지능을 입증했다. 이 모델들은 네이티브 비전 기능과 262K 컨텍스트 윈도우를 지원하며, 일반 소비자용 하드웨어에서의 로컬 실행에 최적화되었다.

Alibaba, 고성능 소형 모델 Qwen3.5 전격 공개

•Alibaba가 Apache 2.0 라이선스 하에 0.8B에서 9B 매개변수 규모의 Qwen3.5 소형 모델 제품군을 출시했다.
•특히 9B 모델은 10B 이하 체급에서 가장 뛰어난 성능을 기록하며, 기존 동급 선두 모델들보다 2배 높은 지능을 입증했다.
•이 모델들은 네이티브 비전 기능과 262K 컨텍스트 윈도우를 지원하며, 일반 소비자용 하드웨어에서의 로컬 실행에 최적화되었다.

Alibaba가 고효율 추론 작업을 위해 설계된 4종의 고밀도 소형 모델을 도입하며 Qwen3.5 생태계를 대폭 확장했다. 0.8B에서 9B 매개변수까지 아우르는 이번 라인업은 이전 세대인 Qwen3와 비교해 지능 측면에서 비약적인 도약을 이루어냈다. 특히 9B 모델은 현재 10B 미만 체급에서 선두를 달리고 있으며, Falcon이나 NVIDIA의 Nemotron과 같은 경쟁 모델들을 상당한 격차로 앞서고 있다. 해당 모델들은 답변을 내놓기 전 방대한 양의 내부 토큰을 생성해 복잡한 문제를 해결하는 통합형 '사고' 방식을 채택했다는 점이 특징이다.

이 모델들은 컴팩트한 크기임에도 불구하고 별도의 어댑터 없이 텍스트와 이미지를 동시에 처리할 수 있는 네이티브 비전 지원 멀티모달 구조를 갖췄다. 실제로 멀티모달 추론 능력을 측정하는 MMMU-Pro 벤치마크에서 9B와 4B 모델은 각각 69%와 65%의 점수를 기록하며 15B 미만 모델 중 최고 수준의 표준을 제시했다. 이러한 역량 덕분에 메모리 자원이 제한적이면서도 시각적 이해가 필수적인 엣지 컴퓨팅 애플리케이션 분야에서 매우 강력한 도구가 될 것으로 보인다.

다만 이러한 지능적 성능은 높은 토큰 소모량이라는 구체적인 기회비용을 수반한다. 소형 모델임에도 불구하고 문제를 해결하기 위해 '사고'하는 과정에서 대형 플래그십 모델이나 GPT-5.1과 같은 최상위 모델보다 훨씬 더 많은 출력 토큰을 사용하기 때문이다. 또한 추론 능력은 예리하지만, AA-Omniscience 벤치마크에서 높은 환각률을 보이는 등 사실 관계의 정확성 측면에서는 여전히 한계가 존재한다. 그럼에도 Apache 2.0 라이선스와 낮은 메모리 요구 사양을 바탕으로, 이제 개발자들은 일반적인 노트북이나 스마트폰에서도 고성능 AI 모델을 로컬 환경에서 자유롭게 실행할 수 있게 되었다.

알리바바라는 회사가 크기가 작으면서도 일을 아주 잘하는 4가지 종류의 '미니 인공지능(소형 모델)'을 만들었습니다. 이 인공지능들은 아주 작은 것부터 조금 큰 것까지 크기가 다양하며, 예전에 나온 모델들보다 훨씬 더 똑똑해졌습니다. 특히 가장 성능이 좋은 모델은 비슷한 크기의 다른 인공지능들보다 2배나 더 영리합니다. 이 인공지능들은 정답을 말하기 전에 마치 사람처럼 속으로 깊이 고민하는 '생각하는 방식(통합형 사고 방식)'을 사용해서 어려운 문제도 척척 풀어냅니다.

이 인공지능들은 몸집은 작지만, 글자뿐만 아니라 사진이나 그림도 아주 잘 이해합니다. 별도의 도움 없이도 시각 정보를 직접 처리할 수 있는 능력(네이티브 비전 지원 멀티모달 구조)을 가졌기 때문이죠. 실제로 그림을 얼마나 잘 이해하는지 시험해 본 결과, 비슷한 체급의 인공지능들 중에서 가장 높은 성적을 받았습니다. 덕분에 저장 공간이 부족한 작은 기기(엣지 컴퓨팅)에서도 눈으로 보는 것처럼 정보를 처리할 때 아주 유용하게 쓰일 것입니다.

하지만 똑똑한 만큼 치러야 할 대가도 있습니다. 문제를 풀기 위해 너무 깊게 고민하다 보니, 아주 많은 양의 단어 조각(토큰)을 사용하게 됩니다. 엄청나게 큰 형님 인공지능들보다도 더 많은 말을 내뱉으며 고민하는 셈이죠. 또한, 추리력은 뛰어나지만 가끔 사실이 아닌 것을 진짜처럼 말하는 '가짜 답변(환각)' 현상이 나타나기도 합니다. 그래도 누구나 자유롭게 사용할 수 있는 규칙(Apache 2.0 라이선스) 덕분에, 이제 누구나 자신의 노트북이나 스마트폰에서 이 똑똑한 인공지능을 마음껏 실행해 볼 수 있게 되었습니다.

Alibaba, 고성능 소형 모델 Qwen3.5 전격 공개

알리바바의 똑똑한 '꼬마 인공지능' 공개! 작지만 실력은 최고

태그