AIの活用で、自閉症スペクトラム研究に新たな道を切り拓く

ステファン・チン氏:自閉症スペクトラムは遺伝的要因が強いことが明らかになっています。自閉症スペクトラムの特性のうち、56パーセントから95パーセントが遺伝的要因により説明がつきますが、現時点では具体的な要因を特定することは非常に困難です。このたび『Nature Genetics』誌上で発表された研究によりますと、これまで研究対象とされていたものとは異なるDNAが要因だからではないかとされています。

今週明け、ある研究チーム(注:プリンストン大学Jian Zhou氏の研究グループ)が、自閉症スペクトラムに関連性のある、遺伝子間にあるDNA鎖の突然変異の解明に、人工知能(AI)を活用したことを発表しました。これは、自閉症スペクトラム研究にまったく新たな道を切り拓くものです。

自閉症スペクトラム(ASD)とは、幼児期に判明する症状で、社会的行動や対人コミュニケーションの難しさ、反復行動などを伴います。一口に自閉症スペクトラムといっても、個人により幅広く異なる症状があります。

例えば、知的障害がやや見られても、社会的行動には問題が無い人がいる一方で、天才的な知能を持っていても、対人コミュニケーションに困難を抱える人もいます。そのため、遺伝的要因が強いとわかってはいても、具体的にどのDNA変異が原因かを突き止めることは、非常に難しかったのです。

従前の自閉症スペクトラム研究の多くは、ゲノムの中でも、タンパク質に翻訳される「遺伝子のコーディング領域」の変異のみを対象としており、多くの発見がありました。数百種類の遺伝子の特定の変異形が、自閉症スペクトラムと関連づけられていました。しかし、はっきりと自閉症スペクトラムの原因だと明証されていたものはわずかでした。

明証を受けた一例として、親から子へと受け継がれる、ある遺伝子が挙げられます。しかしこういった例は、自閉症スペクトラムの症例のうち、わずか10パーセントにも満たないものでした。

その理由として、自閉症スペクトラムを引き起こしている要因が、多くの場合「新規突然変異(注:de novo mutation)」であることが挙げられます。新規突然変異とは(注:その人から初めて見られるようになった)、親とは異なる遺伝子変異を指し、受精前の卵子もしくは精子や、胚形成の早期に生じます。

とはいえこの新規突然変異も、両親が定型発達である場合の自閉症スペクトラムの発症要因としては、わずか30パーセント程度と考えられています。

自閉症スペクトラムの遺伝学を解明するカギになる「ジャンクDNA」

さて、ここで『Nature Genetics』誌の論文が登場します。研究グループは、なんとゲノム全体の新規突然変異を調べたのです。タンパク質に翻訳される「遺伝子のコーディング領域」も重要な要素ですが、ヒトゲノムのわずか1パーセントを占めるにすぎません。

残りのゲノムには、どんな機能があるのか全貌が明らかにされておらず、かつて「ジャンクDNA」と呼ばれていました。現在では、「ジャンク」どころではなく、遺伝子の活動を調節する、非常に重要な役割を担っていることがわかっています。

「ジャンクDNA」の役割の一例として、タンパク質の一種である「転写因子」と結びつくことが挙げられます。転写因子とは、その名が示すとおり、遺伝子発現の最初のステップである「転写」を促進、あるいは逆に抑制するものです。

また「ジャンクDNA」は、「非コードDNA」という別名にもかかわらず、遺伝子配列の転写後の工程に重要な役割を果たすRNAをコードする役割も担っています。つまり、自閉症スペクトラムの遺伝学を解明するには、この「ジャンクDNA」を隅々まで探る必要があるのです。

ところで、この新たに発表された研究は別段に目新しいものではなく、こうした研究を行うこと自体は、以前から有望とされてきました。ただ単に、実践が極めて困難だったのです。

個々の人間のDNA配列の差異を見つけるのは、何も難しいことではありません。しかし、差異があったとしても、それがどんな影響を及ぼすかまではよくわかっていないのです。

例えば、同一のDNAを持つ2人の人がいたとして、DNA配列が1つ変化したとしても、変異が起こらないのか、もしくは特異な特徴やコンディションを生じるのかはわかりません。

特有のコンディションを生じる「遺伝子」を特定する場合、タンパク質の配列に異変を起こす遺伝情報を使えば、特定範囲を狭めることができます。しかし、「非コードDNA」の変異により、どのような症例が出るかについては、調べる手段はありませんでした。「非コードDNA」の変異を探す場合には、データのノイズがあまりにも膨大であるため、判別できなかったのです。

AIによる膨大なゲノムデータの分析がもたらす可能性

今週月曜に発表された件の研究では、この膨大なゲノムデータを分析するために、ある新しい手段が使われました。人口知能、つまりAIです。研究チームは、DNA機能による2, 200件の症例の特徴を、ニューラルネットワーク(注:AI)に学習させ、DNAのどの部分の変異が、どのような影響を及ぼすかを予測しました。

また「非コードDNA」についても、既知の領域の変異が、どのような機能的影響を及ぼすのかについてAIに学習させました。そして、それぞれの突然変異の機能的影響力の順にスコアを割り当てたのです。ある変異が、自閉症スペクトラムの表現型に寄与している遺伝子発現をどれほど担っているか、というものです。

そこで実際に人から集めたデータを、AIに検証させました。このデータは、1,800人近くの自閉症の子どもとその家族、つまり定型発達の兄弟姉妹と定型発達の両親から集められたゲノムが丸ごと保管されたリポジトリである『The Simons Simplex Collection』(注:Simons Foundation Autism Research Initiative (SFARI)によるデータ)から提供されたものでした。

その結果、自閉症スペクトラムは、予想通り「非コードDNA」の突然変異と明らかな関連性があることがわかりました。「非コードDNA」の突然変異にも、遺伝子のコーディング領域での変異と同様の関連性が見られたのです。そしてもうおわかりかと思いますが、このような突然変異は、脳機能の遺伝子発現に異変を起こすことが予測されました。

さて、この実験で注目するべきなのは、「非コードDNA」の突然変異が、遺伝子の転写ステージ後の、遺伝子発現に影響があるらしいことがわかったことです。つまり、メッセンジャーRNAが生成され、まさに転写をはじめる段階です。その実態については、まだ研究があまりなされてはおらず、今後はこのプロセスの研究が必須だとされています。

また「非コードDNA」の突然変異は、自閉症スペクトラムに関連性のある「コーディング領域」の突然変異と、同じ経路や同じ遺伝子にも影響があることがわかりました。「非コードDNA」と「コーディング領域」の双方における突然変異を研究することで、もっとも影響力のある遺伝子を絞り込める可能性があります。さらには、そもそもなぜ自閉症スペクトラムが発症するのかということの解明につながるかもしれません。

ゆくゆくは、このような分析により「非コードDNA」の突然変異が自閉症スペクトラムのどの特性に関連性があるのかが解明できる可能性もあります。

いずれにせよ、研究チームによりますと、次に予定されているステップは、アルゴリズムの精度を上げ拡張することだそうです。また同研究チームは、この実験はヒトの複雑なコンディションが、「非コードDNA」の突然変異が原因である可能性を立証した、初めての実例であるとしています。

さらに「非コードDNA」の突然変異が、どのような遺伝子発現につながるかを正確に紐付けできれば、ヒトのすべてのコンディションについて、これまで知られていなかった遺伝的要因を見つけることができるかもしれません。これまで知られていた「遺伝する」ものは、単体の遺伝子にコピーすることはできないとされていたので、これはたいへん画期的なことです。

私たちの前には、これまで見過ごされてきた膨大なゲノムに記録された、おどろくべき量の情報が眠っているのかもしれないのです。