ある病気に対する効果的な治療法を開発するためには、その病気のメカニズムに関連する分子を見つけ出し、その構造を理解して、それらに付着してその挙動を修正できるような薬剤を設計する必要があります。例えば、細菌やウイルスに感染した場合、その病原体に特異的な分子の特性を把握し、その分子に薬剤を結合させて、どのようにその病原体の複製を阻止するかを検討する必要があります。これは
in silico(コンピュータ・シミュレーション)で行うこともできますが、多くの場合、
in vitro(生体内)での確認が必要です。
では、AIはどのようにしてこの開発パイプラインを早めることができるのでしょうか?そのために、ある分子によって破壊される可能性のある生物学システムのターゲットを特定する必要があります。今のところこの作業は、生物学のメカニズムの理解に依存する人間の仕事ですが、生物学の知識はまだ非常に初歩的なものです。他の物理システムとは異なり、1つのプロセスに関与する制御経路の特定の要素を分離することは困難です。なぜなら、自然選択は、高度に絡み合った、再利用性の高いシステムを作り出す傾向があり、特性を明らかにするのが難しい非常に複雑なシステムを作り出すからです。
このプロセスの理解を深めるために、AIシステムを用いて、実験データから
細胞内の制御ネットワークをリバースエンジニアリングすることができます。ハイスループットスクリーニングシステムを用いて複数の細胞培養を測定することで、データのバリエーションと量を十分に集め、そのデータを生成したと考えられる制御ネットワークのモデルを作成することができます。そのモデルを使って、ネットワークのどの部分が乱されると病気の進行に変化が生じるかを理解することが可能です。
薬剤を用いて分子経路のどこを阻害したいかがわかったら、それに関わるタンパク質の分子構造を知ることが有効です。多くの場合、タンパク質の遺伝子コードはわかっていても、細胞内での最終的な分子構造はわかっていません。この構造を知るには、分子を結晶化してX線で撮影するという複雑な実験が必要になるため、非常に困難です。このプロセスはタンパク質にダメージを与える場合もあり、研究者が1つのタンパク質の構造を正しく捉えるための適切なプロトコルを開発するまでには何年もかかることがあります。
AlphaFold 2のようなAI技術は、遺伝暗号からタンパク質の構造を予測することで、このプロセスを大幅に加速することができます。このモデルは、既知の遺伝子配列とそれに対応するタンパク質構造で学習されており、新規の未知の配列にも一般化することができます。100%正確ではないにしても、このような予測は、実験チームが結晶学実験によって新しいタンパク質の特性が明らかになるまで何年も待つ必要がなくなるため、発見プロセスを大幅に加速することができます。