Google DeepMind、7100万個の遺伝子変異を分類するAIを公開
- •Google DeepMindが、タンパク質の機能に影響を与える7100万個の遺伝子変異を分類する「AlphaMissense」を発表した。
- •このモデルは、ミスセンス変異の89%を90%の精度で「病原性」または「良性」として分類することに成功している。
- •研究の加速と希少疾患の診断を支援するため、予測データとモデルのコードは無料で公開された。
Google DeepMindは、ヒトの遺伝子変異の全体像を解明するための専門的なAIツール「AlphaMissense」を発表した。アミノ酸を変化させるDNAの1文字の違いである「ミスセンス」変異に焦点を当てることで、ゲノム医療における大きな空白を埋めることが期待されている。
専門家がこれまでその影響を確認できたのは、全変異のわずか0.1%に過ぎない。対照的に、AlphaMissenseは考えうる7100万通りの変異のうち、89%の分類を完了した。手作業から自動予測へのこの飛躍は、嚢胞性線維症や鎌状赤血球貧血などの疾患の根本原因を特定しようとする研究者にとって、重要なロードマップとなるだろう。
本システムは、ほぼすべての既知のタンパク質の3次元構造を予測した画期的なモデル「AlphaFold」のアーキテクチャをベースに構築されている。単に構造を見るだけでなく、専用の言語モデルと霊長類集団からの進化データを利用して、変異が害を及ぼす可能性をスコアリングするのが特徴だ。
いわば「生命の言語」を読み解き、特定の遺伝的なタイポ(打ち間違い)が生体機能を損なう(病原性)か、あるいは無害(良性)であるかを判断する。さらに、集団の出現頻度データを用いたファインチューニングにより、一般的で無害な変異と、希少で危険な可能性のある変異を高い精度で区別している。
DeepMindはコードをオープンソース化し、予測結果を無料で公開することで、高度なゲノム知見へのアクセスを民主化することを目指している。科学者はAIの予測をまず参照することで、莫大な費用がかかる実験の優先順位をつけられるようになる。現時点では単独の臨床ツールではないが、ClinVarなどの評価指標における最先端のパフォーマンスは、希少疾患の診断や2型糖尿病のような複雑な病態の解明方法に大きな変革をもたらすはずだ。