아마존, 근거 기반 AI 영상 생성을 위한 VRAG 출시
- •아마존 Bedrock이 특정 참조 이미지를 바탕으로 영상을 생성하는 VRAG 기능을 도입했다.
- •이 멀티모달 파이프라인은 OpenSearch 벡터 엔진을 활용해 고정밀 시각 정보 검색과 맞춤형 제작을 지원한다.
- •자동화된 배치 처리를 통해 개인화된 마케팅 및 교육용 영상 콘텐츠를 대규모로 제작할 수 있다.
아마존 웹 서비스(AWS)가 기존 영상 모델의 고질적인 문제인 지식 컷오프 현상을 해결하기 위해 정교한 VRAG(Video Retrieval Augmented Generation) 파이프라인을 공개했다. 아마존 Bedrock과 Amazon Nova Reel 모델을 결합한 이 시스템을 통해, 제작자들은 이제 비공개 데이터베이스에서 불러온 특정 참조 이미지에 엄격히 기반한 고품질 영상을 생성할 수 있게 되었다.
이 시스템은 Amazon OpenSearch Service의 벡터 엔진 내에 이미지 라이브러리를 색인화하는 방식으로 작동한다. 사용자가 텍스트 프롬프트를 입력하면 시스템이 가장 관련성 높은 이미지를 찾아내 시각적 앵커로 활용하며, 이러한 과정을 거치면 일반적인 AI가 생성한 모호한 형상이 아닌 특정 브랜드의 제품처럼 구체적인 사물이나 배경이 포함된 영상이 완성된다.
특히 이러한 멀티모달 접근 방식은 시각적 일관성이 무엇보다 중요한 광고 및 교육 분야에서 혁신적인 변화를 불러올 것으로 기대된다. 구조화된 텍스트 템플릿을 활용하는 이 솔루션은 일괄 처리를 지원하여 수백 개의 맞춤형 영상 시퀀스를 자동으로 생성할 수 있도록 돕는다. 사용자는 시계 방향 회전이나 아래로 팬(pan)하는 등의 카메라 움직임을 직접 정의할 수 있으며, 이는 검색된 시각적 맥락에 적용되어 영화 같은 연출 결과를 만들어낸다.
단순한 텍스트 기반 영상 생성을 넘어 VRAG 프레임워크는 인페인팅(in-painting)과 같은 고급 기능도 포함하고 있다. 이를 통해 사용자는 이미지를 애니메이션화하기 전 특정 영역을 수정할 수 있으며, 이러한 세밀한 제어 기능은 AWS를 단순한 생성적 무작위성보다는 데이터 기반의 정확성을 우선시하는 기업용 AI 미디어 제작 도구 분야의 선두주자로 자리매김하게 한다.