HyTRec 아키텍처, 대규모 사용자 데이터 추천 성능 혁신
- •HyTRec 아키텍처는 선형 어텐션과 소프트맥스 어텐션을 결합하여 1만 건 이상의 상호작용을 효율적으로 처리한다.
- •이 시스템은 사용자의 장기적 취향과 갑작스러운 단기적 관심 변화를 분리하여 추천 정확도를 높였다.
- •산업 환경 테스트에서 빠른 추론 속도를 유지하면서도 적중률(Hit Rate)을 8% 향상시키는 성과를 거두었다.
인공지능 추천 엔진 분야에서 수천 건에 달하는 사용자 상호작용을 분석하며 속도와 정확도 사이의 균형을 맞추는 일은 오랜 난제였다. 이에 우한 대학교(Wuhan University) 연구진은 이른바 ‘효율성-정밀도’ 딜레마를 세련되게 해결한 하이브리드 아키텍처인 HyTRec을 공개했다. 이 모델은 데이터 흐름을 이원화하여 방대한 과거 이력은 연산 효율이 높은 선형 어텐션(Linear attention)으로 처리하고, 최근의 밀도 높은 상호작용에는 고정밀 소프트맥스 어텐션(Softmax attention)을 적용한다. 이러한 이중 경로 전략 덕분에 시스템은 데이터 양이 급증해도 속도 저하 없이 사용자의 장기적 습관을 정확히 기억할 수 있다.
이번 연구에서 특히 주목받는 요소는 ‘관심사 표류(Interest drift)’ 현상에 대응하기 위해 설계된 시계열 인지 델타 네트워크(TADN) 메커니즘이다. TADN은 동적인 가중치 조절 장치 역할을 수행하며, 현재와 무관해진 과거의 ‘노이즈’는 억제하고 최근의 신선한 행동 신호는 증폭시킨다. 예컨대 사용자가 신발을 구경하다가 갑자기 노트북 검색으로 전환할 경우, 시스템은 과거 데이터 패턴에 머물지 않고 이러한 관심사의 변화를 즉각적으로 포착해낸다.
실제 대규모 산업 환경에서 진행된 테스트 결과, HyTRec 아키텍처는 시스템이 사용자의 다음 행동을 정확히 예측했는지를 나타내는 적중률(Hit Rate)을 기존보다 8%나 끌어올렸다. 무엇보다 놀라운 점은 이러한 탁월한 성과를 선형적인 추론 속도를 유지하며 달성했다는 사실이다. 결과적으로 이 모델은 서버 성능을 해치지 않으면서도 사용자당 수만 건의 상호작용을 거뜬히 처리할 수 있어, 대규모 트래픽이 발생하는 서비스의 실시간 개인화 추천을 위한 실질적인 해법이 될 것으로 기대된다.