DeepMindのAlphaGenome、DNA100万塩基をAIで地図化
2026年2月17日 (火)
- •Google DeepMindのAlphaGenomeは、100万個のDNA塩基にわたる生物学的活性を単一塩基の解像度で予測する。
- •従来のベンチマークと比較してコンテキストウィンドウを2倍に拡大し、長距離の遺伝的相関の特定に成功した。
- •新たなアンサンブル蒸留技術により、11の生物学的タスクを単一のゲノム基盤モデルへと統合した。
Google DeepMindは、ヒトDNAという極めて複雑な「設計図」をかつてない規模で解読する深層学習モデル、AlphaGenomeを発表した。従来の主要モデルは一度に最大50万塩基までしか解析できなかったが、AlphaGenomeはこのコンテキストウィンドウを2倍の100万塩基へと拡張している。この進化により、ある領域の遺伝子変異が遠く離れた場所にある遺伝子の変化を引き起こす「遠隔相関」の特定が可能となった。これは、希少疾患やがんの原因となる変異を解明する上で、極めて重要な要素である。
大規模な解析能力に加え、このモデルは単一塩基レベルでのピンポイントな予測精度を誇る。32塩基単位でグループ化していた前身のBorzoiとは異なり、AlphaGenomeはゲノム配列内のわずか一文字の「誤字」が、11種類の異なる生物学的プロセスに与える影響を予測できる。これにはタンパク質とDNAの相互作用や、細胞がタンパク質合成前に遺伝情報を編集するRNAスプライシングなどが含まれる。これらの機能を一つのインターフェースに集約したことで、研究者はゲノムの帰結を理解するために複数の専門ツールを使い分ける必要がなくなった。
このモデルの成功の鍵は、アンサンブル蒸留(Ensemble distillation)と呼ばれる手法にある。これは、変異データで学習した複数の「教師」モデルから、単一の「生徒」モデルが合意形成を学ぶプロセスだ。現在は臨床診断よりも基礎的な生物学研究に最適化されている段階だが、AlphaGenomeはDNAの汎用的な表現に向けた大きな一歩を記したと言える。個々のあらゆる遺伝的変異が引き起こす複雑な連鎖反応をAIが予測する未来へ、私たちはまた一つ近づいたのだ。