ページバナー

ニュース

今年のラスカー基礎医学研究賞は、アミノ酸の一次配列に基づいてタンパク質の三次元構造を予測するAlphaFold人工知能システムの開発に貢献したデミス・ハサビス氏とジョン・ジャンパー氏に授与されました。

 

彼らの研究成果は、科学界を長らく悩ませてきた問題を解決し、生物医学分野全体の研究を加速させる道を開くものです。タンパク質は疾患の発症において極めて重要な役割を果たします。アルツハイマー病ではタンパク質が折り畳まれて凝集し、がんではタンパク質の制御機能が失われ、先天性代謝疾患ではタンパク質の機能不全が起こり、嚢胞性線維症では細胞内の誤った領域にタンパク質が移動します。これらは、疾患を引き起こす多くのメカニズムのほんの一部に過ぎません。詳細なタンパク質構造モデルは、原子配列を提供し、高親和性分子の設計や選択を促進し、創薬を加速させることができます。

 

タンパク質の構造は、一般的にX線結晶構造解析、核磁気共鳴、クライオ電子顕微鏡法によって決定されます。これらの方法は費用と時間がかかります。そのため、既存の3Dタンパク質構造データベースには約20万件の構造データしかありませんが、DNAシーケンシング技術では800万以上のタンパク質配列が生成されています。1960年代、Anfinsenらは、アミノ酸の1D配列が自発的かつ繰り返し折り畳まれて機能的な3次元構造を形成すること(図1A)、そして分子「シャペロン」がこのプロセスを加速・促進できることを発見しました。これらの観察結果は、分子生物学における60年にわたる課題、すなわちアミノ酸の1D配列からタンパク質の3D構造を予測することにつながっています。ヒトゲノムプロジェクトの成功により、1Dアミノ酸配列を取得する能力は大幅に向上し、この課題はさらに緊急性を増しています。

ST6GAL1タンパク質構造

タンパク質構造の予測は、いくつかの理由から困難です。第一に、あらゆるアミノ酸中のあらゆる原子のあらゆる可能な三次元位置を探索するには、膨大な探索が必要です。第二に、タンパク質は化学構造の相補性を最大限に活用して、原子を効率的に配置します。タンパク質には通常、数百の水素結合「供与体」(通常は酸素)があり、これらは水素結合「受容体」(通常は水素に結合した窒素)の近くにあるはずなので、ほぼすべての供与体が受容体の近くにある立体配座を見つけるのは非常に困難です。第三に、実験手法のトレーニング用の例は限られているため、関連するタンパク質の進化に関する情報を用いて、1D配列に基づいてアミノ酸間の潜在的な三次元相互作用を理解する必要があります。

 

物理学は、最適な立体配座を探索するための原子相互作用をモデル化するために最初に使用され、タンパク質の構造を予測する手法が開発されました。Karplus、Levitt、Warshelは、タンパク質の計算シミュレーションに関する研究により、2013年のノーベル化学賞を受賞しました。しかし、物理学に基づく方法は計算コストが高く、近似処理を必要とするため、正確な3次元構造を予測することはできません。もう1つの「知識ベース」アプローチは、既知の構造と配列のデータベースを使用し、人工知能と機械学習(AI-ML)によってモデルをトレーニングすることです。HassabisとJumperは物理学とAI-MLの両方の要素を適用していますが、このアプローチの革新性とパフォーマンスの飛躍的向上は、主にAI-MLに起因しています。2人の研究者は、大規模な公開データベースと産業グレードのコンピューティングリソースを独創的に組み合わせてAlphaFoldを開発しました。

 

構造予測パズルを「解いた」とどうやってわかるのでしょうか。1994年に、構造予測の進捗状況を追跡するために2年ごとに開催される構造予測の批判的評価 (CASP) コンペティションが設立されました。研究者たちは、最近構造を解明したが結果はまだ公表されていないタンパク質の1D配列を共有します。予測者はこの1D配列を使用して3次元構造を予測し、評価者は実験者が提供した3次元構造 (評価者のみに提供) と比較して、予測結果の品質を独自に判断します。CASPは真のブラインドレビューを実施し、方法論の革新に関連する定期的なパフォーマンスの向上を記録します。2020年の第14回CASPカンファレンスでは、AlphaFoldの予測結果がパフォーマンスの飛躍的な向上を示したため、主催者は3D構造予測の問題が解決されたと発表しました。ほとんどの予測の精度は実験測定の精度に近づきました。

 

より広い意義は、ハサビス氏とジャンパー氏の研究が、AI-MLが科学をどのように変革できるかを説得力を持って示していることです。彼らの研究は、AI-MLが複数のデータソースから複雑な科学的仮説を構築できること、ChatGPTと同様のアテンションメカニズムがデータソース内の重要な依存関係と相関関係を発見できること、そしてAI-MLが出力結果の品質を自己判断できることを示しています。AI-MLは本質的に科学を行っていると言えるでしょう。


投稿日時: 2023年9月23日