AIによる医薬品開発のスピードアップ

AIによる医薬品開発のスピードアップ

現代医学の分野は、混乱の時期を迎えています。生体システムは複雑で高次元であり、従来の科学的手法では記述することが困難です。これまでは、一歩前進するごとに、人間の試行錯誤による深い調査が必要だったため、進歩が遅れていました。しかし、強力なコンピューターの出現により、生物システムの大規模なシミュレーションが可能になり、また、AIアルゴリズムを用いて過去のデータに基づく薬剤のターゲティングや発見を加速させることで、この分野に革命をもたらし始めています。

医薬品開発は、AIがイノベーション・パイプラインを端から端まで置き換えることができるツールではないことを示す興味深い事例です。むしろ、AIシステムに置き換えられる部分を特定するためには、パイプラインの目的とそのすべての異なるステップを考慮する必要があります。AIアルゴリズムは、データの隠れたパターンを発見するのに非常に強力で、定量的に定義できる特定の問題領域に適用するのが最適です。

医薬品開発のパイプライン

創薬のパイプラインは、AIのパターンマッチングや高次元な最適化が、人間の創造的な思考力や実世界の目標に基づいて創薬を導く能力を補完する優れた例です。このパイプラインを中核的な構成要素に分解すると、創薬にはいくつかの異なるステップがあることがわかります。
ターゲットの特定
ある病気に対する効果的な治療法を開発するためには、その病気のメカニズムに関連する分子を見つけ出し、その構造を理解して、それらに付着してその挙動を修正できるような薬剤を設計する必要があります。例えば、細菌やウイルスに感染した場合、その病原体に特異的な分子の特性を把握し、その分子に薬剤を結合させて、どのようにその病原体の複製を阻止するかを検討する必要があります。これはin silico(コンピュータ・シミュレーション)で行うこともできますが、多くの場合、in vitro(生体内)での確認が必要です。

では、AIはどのようにしてこの開発パイプラインを早めることができるのでしょうか?そのために、ある分子によって破壊される可能性のある生物学システムのターゲットを特定する必要があります。今のところこの作業は、生物学のメカニズムの理解に依存する人間の仕事ですが、生物学の知識はまだ非常に初歩的なものです。他の物理システムとは異なり、1つのプロセスに関与する制御経路の特定の要素を分離することは困難です。なぜなら、自然選択は、高度に絡み合った、再利用性の高いシステムを作り出す傾向があり、特性を明らかにするのが難しい非常に複雑なシステムを作り出すからです。

このプロセスの理解を深めるために、AIシステムを用いて、実験データから細胞内の制御ネットワークをリバースエンジニアリングすることができます。ハイスループットスクリーニングシステムを用いて複数の細胞培養を測定することで、データのバリエーションと量を十分に集め、そのデータを生成したと考えられる制御ネットワークのモデルを作成することができます。そのモデルを使って、ネットワークのどの部分が乱されると病気の進行に変化が生じるかを理解することが可能です。

薬剤を用いて分子経路のどこを阻害したいかがわかったら、それに関わるタンパク質の分子構造を知ることが有効です。多くの場合、タンパク質の遺伝子コードはわかっていても、細胞内での最終的な分子構造はわかっていません。この構造を知るには、分子を結晶化してX線で撮影するという複雑な実験が必要になるため、非常に困難です。このプロセスはタンパク質にダメージを与える場合もあり、研究者が1つのタンパク質の構造を正しく捉えるための適切なプロトコルを開発するまでには何年もかかることがあります。

AlphaFold 2のようなAI技術は、遺伝暗号からタンパク質の構造を予測することで、このプロセスを大幅に加速することができます。このモデルは、既知の遺伝子配列とそれに対応するタンパク質構造で学習されており、新規の未知の配列にも一般化することができます。100%正確ではないにしても、このような予測は、実験チームが結晶学実験によって新しいタンパク質の特性が明らかになるまで何年も待つ必要がなくなるため、発見プロセスを大幅に加速することができます。

分子設計と最適化

次に、特定した分子経路と相互作用して、病気を予防したり、病気の経過を変えたりする可能性のある化合物を見つけなければなりません。その有効性は、さまざまな分子を合成し、in silicoまたはin vitroでテストすることによって経験的に検証しなければなりません。有望な医薬品候補を特定した後は、副作用を最小限に抑え、体内での半減期を最大にするために、薬理学的特性を最適化する必要があります。

候補となる化合物の同定は、いくつかのメカニズムによって迅速に行うことができます。

  • 分子ベースの生成モデルは、人間の助けなしで新規の分子候補を提案することができます。これらのAIシステムは、既存の薬物分子の構造を予測することを学習し、既知の化合物と類似した特性を持つ新規分子の構成を予測するように一般化します。このようなシステムは、抗生物質の新規候補を生成するために使用されています。
  • より直接的には、制御パスウェイを明示的にモデル化することなく、単一細胞レベルで摂動を予測するモデルを設計することができます。つまり、機械学習モデルは、類似の分子に対する細胞応答のデータセットを学習することで、ある摂動に対する細胞応答のモデル化を行います。十分に精度の高いシステムがあれば、どの化合物が効果を発揮する可能性が高く、どの化合物がそうでないかを迅速に計算機上でスクリーニングすることができます。
  • また、機構的な理解をあまりせずに、統計学に頼って薬剤と標的の相互作用のモデル化を進めているグループもあります。既存の薬物とその標的に関するデータを活用することで、薬物と標的のペアの親和性を予測するモデルを学習することができます。このようなモデルを用いることで、既知の分子の未開拓のターゲットを特定したり、特定のターゲットを想定した新規分子の設計を行うことができます。

AIシステムは、新薬の候補となる分子を提案するだけでなく、分子設計パイプラインの他の部分を最適化するのにも役立ちます。例えば、分類モデルを使って、体内での半減期や副作用、薬物相互作用などの薬理特性を、分子構造から直接予測することができます。強化学習は、実験データを自動的に統合し、過去の実験結果に基づいてテストするための新しい構成を提案することで、in vitroテストの実験デザインを自動化するエージェントを作成するための有用なツールとなります。

臨床試験

薬剤候補がin vitroや動物モデルで成功を収めれば、臨床試験の段階に進むことができます。臨床試験は、安全性を確認する第1フレーズ、予備的な有効性をテストする第2フレーズ、そして承認のために大規模な集団での有効性を示す必要がある第3フレーズの3つの段階に分かれています。承認後は、稀な効果やリスクとベネフィットのトレードオフがないか、継続的な監視が行われます。

AIシステムは、さまざまな方法で臨床試験の加速に貢献します。NLPやコンピュータビジョンシステムを用いたデータ収集・記録システムの改善により、ヒューマンエラーを防ぎ、データ入力を迅速に行うことができます。有害事象は即座にフラグを立てて報告することができ、予期せぬ副作用が発生した場合にさらなる被害を防ぐことができます。

民族やその他の多様性を考慮して母集団を十分にサンプリングすることで、参加者の募集を改善することができます。ハイスループット・シーケンシングなどの技術を用いた遺伝的ターゲティングや疾患のフェノタイピングにより、薬剤が効果を発揮する可能性の高い対象者を絞り込むことができ、より少ないサンプル数でより早く効果を示すことができます。また、このようなターゲティングを行うことで、従来は効果がないとされていた薬でも、特定の集団に絞って使用することで効果を確認できる可能性があり、個別化医療の実現につながると考えています。
薬剤の再利用
すでに膨大な数の有効な化合物が市場に出回っていることを考えると、新しい治療法を見つけるための比較的安価で効率的な方法は、薬剤の再利用です。前述のように薬物-標的親和性モデルを用いることで、安全性が高く、大きな副作用がないことが既に知られている既存の医薬品の新たな標的候補を特定することができます。これにより、創薬サイクルが短縮されるだけでなく、特定の薬剤の臨床試験を行うまでの期間が大幅に短縮されます。

最近では、COVID-19パンデミックに対する創薬を進める上で、薬剤の再利用が有効であることが示されています。従来の医薬品研究のパイプラインでは、新たな流行に迅速かつ効果的に対応するための結果を得るのに間に合いませんでしたが、機械学習技術を用いた医薬品の再利用は、数年ではなく数ヶ月のスパンで有望な治療法を見出すための生命線となりました。現在の取り組みではさまざまな結果が出ていますが、最近の研究では、今回の流行から得られた教訓が今後の薬剤再利用の取り組みを大きく加速させることが示されています。

全体として、AIによる医薬品開発の促進は、今後数十年にわたってヘルスケア分野を変革する可能性を秘めていると考えています。それは、より多くの医薬品候補の実験とデザインのサイクルを迅速化し、病気と治療のメカニズムプロセスをより深く理解し、より的を絞った個別化医療を主流にすることです。
Contact
ご不明な点がございましたら、お問い合わせください