구글, Gemini 3.1 및 Lyria 3 음악 모델 전격 공개
- •구글이 과학적 추론과 복잡한 문제 해결을 위한 Deep Think 모드를 탑재한 Gemini 3.1을 정식 출시했다.
- •Lyria 3 음악 모델은 텍스트나 이미지 프롬프트를 통해 30초 분량의 오디오 트랙을 생성하는 멀티모달 기능을 제공한다.
- •다국어 텍스트 렌더링 능력과 실물 묘사 정확도가 대폭 향상된 Nano Banana 2 이미지 모델이 새롭게 등장했다.
구글이 2026년 2월을 맞아 최신 'Gemini Drop'을 통해 일련의 대대적인 업데이트를 발표했다. 이번 업데이트의 핵심은 단연 Gemini 3.1의 출시다. 특히 이 모델에는 연구자와 엔지니어를 지원하기 위해 특별히 설계된 'Deep Think' 모드가 포함되어 고차원적인 과학적 논리 구현이 가능해졌다. 복잡한 문제에 대해 더욱 체계적인 접근 방식을 제공하는 이 모드는 현대 과학 및 엔지니어링 워크플로우에서 정밀함을 요구하는 사용자들을 효과적으로 지원한다.
창작 영역에서는 Lyria 3 음악 모델이 베타 버전으로 출시되어 사용자가 텍스트나 시각적 입력을 활용해 30초 길이의 오디오 트랙을 생성할 수 있게 되었다. 이러한 멀티모달 기능은 AI가 단순한 채팅 인터페이스를 넘어 정교한 예술적 도구로 진화하며 미디어 제작의 협업 파트너 역할을 수행하는 최신 트렌드를 반영한다. 또한 새롭게 도입된 Veo Templates는 비디오 제작을 위한 구조화된 시작점을 제공하며, 사용자는 이를 통해 전문적인 스타일에 개인적인 디테일을 더해 완성도 높은 결과물을 만들 수 있다.
시각적 측면에서 Nano Banana 2 이미지 모델은 생성형 AI의 고질적 과제였던 정확한 텍스트 렌더링 문제를 해결했다. 이 모델은 모든 언어의 텍스트를 높은 정밀도로 지원하며, 이에 따라 생성된 이미지의 글로벌 마케팅 및 커뮤니케이션 활용도가 대폭 개선됐다. 아울러 Gemini는 이제 답변 내에 검증된 과학적 인용구를 직접 통합하여 연구자들에게 소스 논문으로 연결되는 직접 링크를 제공한다. 데이터 투명성을 높이려는 이러한 행보는 정보의 정확성을 높이고 연구 보조 도구로서 AI의 신뢰성을 공고히 하는 데 기여할 것으로 보인다.