Google DeepMind、音楽生成モデル「Lyria 3」を発表
2026年3月25日 (水)
- •Google DeepMindが高忠実度な音楽生成を可能にする「Lyria 3 Pro」と「Lyria 3 Clip」をリリースした。
- •新たなマルチモーダル機能により、テキストだけでなく画像からも音楽を生成できるようになった。
- •生成された楽曲には、AIコンテンツの透明性を確保するための電子透かし「SynthID」が埋め込まれる。
Google DeepMindは、最新の音楽生成技術「Lyria 3」のパブリックプレビューを開始し、開発者への提供を本格化した。今回のリリースには、最大3分のフル楽曲を構成できる「Lyria 3 Pro」と、30秒のループ音源やSNS向け素材の制作に特化した「Lyria 3 Clip」という2つのモデルが含まれている。これらのモデルは音楽的な一貫性が大幅に向上しており、楽曲の冒頭から末尾まで構造を調和させた状態で維持することが可能だ。
テキストプロンプトによる生成に加え、Lyria 3では出力を詳細に制御するための高度な操作系が導入された。例えば、「テンポコンディショニング」によって特定のBPMを指定したり、「タイムアラインド歌詞」を用いてボーカルが入るタイミングを正確に指示したりできる。特に注目すべきはマルチモーダル入力への対応である。画像から楽曲のムードや雰囲気を読み取ることが可能になり、視覚的なインスピレーションをそのまま聴覚的な表現へと繋げる橋渡し役を担っている。
また、安全性と透明性を確保するため、電子透かし技術「SynthID」が統合されている。これはオーディオ内に知覚不可能な識別情報を埋め込むもので、ファイルの編集や圧縮が行われた後でもAI生成物かどうかを容易に検証できる。Googleは、創造的な自由と適切な帰属のバランスを追求することで、Lyria 3をアーティストの代替ではなく、その創作活動を拡張する存在として位置づけている。現在、これらのモデルはGemini APIおよびGoogle AI Studioを通じてアクセス可能だ。