톰슨 로이터, 법률 특화 AI 모델 'Thomson' 공개
- •톰슨 로이터가 방대한 독자적 법률 및 뉴스 데이터셋으로 학습된 거대언어모델(LLM) 'Thomson'을 발표했다.
- •오픈소스 모델 가중치를 기반으로 구축된 이 모델은 주요 법률 작업 벤치마크의 40%에서 범용 AI의 성능을 앞질렀다.
- •온프레미스 배포를 지원하여 로펌이 계약서 검토 시 보안과 데이터 프라이버시를 강화할 수 있도록 돕는다.
톰슨 로이터가 법률 연구와 계약 분석의 혁신을 목표로 설계된 최초의 독자적 거대언어모델(LLM) 'Thomson'의 출시를 준비하고 있다. 일반적인 인터넷 데이터로 학습하는 범용 모델과 달리, Thomson은 톰슨 로이터가 보유한 방대한 판례, 법령 및 전문가 검증을 거친 법률 문서 저장소를 통해 사전 학습과 미세 조정을 거쳤다. 이러한 깊이 있는 도메인 전문성 덕분에, 일반 AI 시스템이 흔히 겪는 할루시네이션(환각) 현상을 방지하고 복잡한 법률적 뉘앙스를 정확하게 파악할 수 있다.
Thomson의 아키텍처는 독보적인 유연성을 자랑한다. 특정 기초 시스템에 종속되는 대신, 톰슨 로이터는 Meta나 Mistral 같은 제공업체의 오픈소스 모델 가중치를 활용했다. 이 가중치를 자사의 고품질 데이터로 미세하게 조정함으로써 '이식 가능한' 모델을 만들어낸 것이다. 이러한 전략을 통해 기초 AI 기술이 발전하더라도 법률적 정밀도를 유지하며 최신 아키텍처로 전문 학습 내용을 손쉽게 이전할 수 있게 되었다.
높은 수준의 보안이 요구되는 환경에서 가장 큰 장점 중 하나는 온프레미스 배포 옵션이다. 대형 로펌이 자체 보안 네트워크 내에서 Thomson을 실행할 수 있게 함으로써, 데이터 프라이버시와 의뢰인 비밀 유지에 대한 법조계의 핵심적인 우려를 해결했다. 실제로 내부 벤치마크 결과에 따르면, 이 모델은 이미 10개 주요 법률 카테고리 중 4개 분야에서 범용 모델을 능가했다. 또한 모든 법률 및 세무 자문 업무에서 압도적인 우위를 점하기 위해 지속적인 학습이 진행 중이다.
이러한 전략적 행보는 톰슨 로이터를 단순한 콘텐츠 제공자를 넘어 핵심 기술 파트너로 격상시킨다. 전문가급 지식 전달 기능을 AI 모델에 직접 내장함으로써 법률 전문가들에게 견고한 인프라를 제공하게 된 것이다. 톰슨 로이터는 주요 AI 연구소들과의 협력을 이어가는 동시에, 타의 추종을 불허하는 독자적인 고품질 법률 데이터를 활용해 특화된 수직적 솔루션으로서 Thomson의 가치를 증명하고 있다.