InCoder-32B, 오픈소스 산업용 코딩의 새로운 기준 제시
- •InCoder-32B는 칩 설계 및 임베디드 시스템을 포함한 하드웨어 인지형 프로그래밍에 특화되어 있다.
- •방대한 코드베이스 분석을 위해 모델의 컨텍스트 윈도우를 128,000 토큰까지 대폭 확장했다.
- •특수 산업 및 CAD 벤치마크에서 상용 모델인 Claude Sonnet 4.6을 능가하는 성능을 입증했다.
연구 커뮤니티가 산업용 소프트웨어 개발에 특화된 320억 매개변수 규모의 파운데이션 모델, InCoder-32B를 전격 공개했다. 기존 AI 모델들은 일반적인 웹 개발 분야에서 뛰어난 능력을 보였으나, 마이크로칩 설계나 고성능 GPU의 Kernel Optimization 같은 하드웨어 인지형 작업에서는 한계를 드러내곤 했다. InCoder-32B는 하드웨어 의미론과 특수 시스템 구조를 단일 오픈소스 프레임워크 내에서 통합하여 이러한 기술적 공백을 성공적으로 메웠다.
이 모델은 복잡한 산업용 코드베이스를 처리하기 위해 정교한 'Code-Flow' 훈련 파이프라인을 활용했다. 특히 학습 중간 단계에서 모델의 '단기 기억'이라 할 수 있는 컨텍스트 윈도우를 8,000 토큰에서 무려 128,000 토큰까지 점진적으로 확장했다. 이러한 확장을 통해 AI는 전체 시스템의 로직을 유기적으로 연결하고 분석할 수 있게 되었으며, 이는 수만 줄의 코드 속에 깊이 숨겨진 버그를 식별하는 데 결정적인 역할을 한다.
실질적인 신뢰성을 확보하기 위해 최종 학습 단계에서는 Execution-Grounded Verification 데이터를 도입했다. 즉, 성공적으로 컴파일되고 실행이 확인된 코드만을 학습에 활용하여 기능적 정확성을 극대화한 것이다. 그 결과 InCoder-32B는 특정 전문 영역에서 Claude Sonnet 4.6과 같은 주요 상용 모델의 성능을 뛰어넘는 성과를 거두었다. 이로써 임베디드 시스템과 컴파일러 최적화 등 핵심 인프라를 다루는 엔지니어들에게 강력한 오픈소스 대안이 마련되었다.