Microsoft Azureのハイパフォーマンスコンピューティング(HPC)活用による医薬品開発やゲノム解析の効率化・加速化
Executive Summary
- 医薬品開発に係る各種計算、シミュレーションにはハイパフォーマンスコンピューティング(HPC)を実現するIT基盤が必要不可欠であり、より柔軟にリソースが提供可能なクラウド上での利用が注目されています。
- クラウドベースのHPC環境はオンデマンド性、スケーラビリティ、AI等の最新技術との連携等、これまでない様々なメリットを提供可能です。
- 既に国内外の製薬企業様や研究機関様において、化合物のスクリーニングやゲノム解析の期間短縮にMicrosoft AzureのHPCソリューションが活用されており、新薬開発プロセスの改善や、迅速な医療への応用に繋がる基盤構築が実現されております。
- 今後はHPCと量子コンピューティングとの統合や研究のオープン化等が期待され、次世代の研究開発をリードするための重要な鍵となる要素と考えられます。
1. ゲノム解析、創薬領域で爆発的に増大する計算需要
昨今アンメットメディカルニーズが高まる一方で、製薬企業が新薬を開発する期間、費用は年々増加の一途を辿っています。具体的には、国内では約9~16年もの時間と、数百-数千億円が必要と言われています [1][2]。さらにそれだけ費やしても、新薬の開発の成功率は約23,000分の1しかないと言われています。可能な限り開発期間、コストの両方を押さえながら革新的な新薬を開発し続ける必要があります。
医薬品開発において、ハイパフォーマンスコンピューティング(HPC)はゲノム解析、スクリーニング、分子動力学シミュレーション等、様々な計算リソースとして利用されてきました[3]。そして昨今では、その膨大な計算量に対して柔軟に対応可能なパブリッククラウド上でのHPC活用が検討、採用されるケースが増加しております[4]。
昨今、特にゲノム解析と創薬領域において、医療技術やバイオテクノロジーの進化に伴い、解析の計算量、データ量が急速に増加しています。本解析処理では、単なる統計データや診療記録に留まらず、ゲノムシーケンスデータやバイオマーカー情報、分子構造データなど、きわめて多様でかつ複雑なデータを扱う必要があります。これらのデータを解析し、有用な知見を得るためには、大規模な計算能力が必要とされます。特に創薬分野とゲノム解析領域における計算需要が増大しています[6]。
創薬分野における計算需要
創薬のプロセスは、初期段階の化合物スクリーニングから始まり、その後の薬理試験や臨床試験を経て、新薬が開発されるという一連の流れを辿ります。この過程においては、非常に多くの化合物を対象に、その生物学的な効果や副作用を評価していきます。実際には数百万から数億に及ぶ化合物を対象にシミュレーションを行い、その中から有望な候補を絞り込むために、膨大な計算リソースが必要になります[7]。
従来は、これらのプロセスの多くが実験室で行われていましたが、実験には時間とコストがかかり、その数にも限界があるため、近年ではHPCやAIを活用し、シミュレーションとデータ解析によって効率的にスクリーニングを行うアプローチが主流となりつつあります。分子動力学シミュレーションや量子化学計算を駆使し、分子の構造や相互作用を精密に解析することで、実験では捉えきれない微細な変化を予測し、候補化合物の絞り込みを迅速に行うことが可能になります [8][9]。
ゲノム解析分野における計算需要
一方、ゲノム解析の分野でも、次世代シーケンシング(NGS)技術の発展により、個人の全ゲノム解析が可能になりつつあります。全ゲノム解析とは、ヒトのDNA全体を解析するもので、そのデータ量は膨大です。たとえば、ヒトゲノムには膨大な数の塩基対が存在し、その全てを解析するには大規模な計算リソースが必要です。このような膨大なデータを処理し、解析結果を得るためには、従来のコンピュータ環境では対応が難しくなってきています。
ゲノム解析は、遺伝子発現のパターン解析、エピジェネティクス研究、遺伝子関連疾患の解明など、多岐にわたる解析を必要とします。これらの解析には、精緻なアルゴリズムと膨大な計算パワーが要求され、また、解析結果を迅速に提供するための高速処理も求められます。クラウドベースのHPCソリューションは、こうした高度な要求に対応するための強力な基盤になり得ることから、その活用が注目されています [9][10]。
2. 近年のトレンド
近年、創薬やゲノム解析の分野においてクラウドHPCの活用が進んでいる背景には、クラウドコンピューティング技術の進化とその利便性、コスト効率の高さがあります。これに加え、これらの分野における計算需要が急激に高まっていることも、大きな要因になっています。
従来のオンプレミス環境でのHPCは、初期導入コストが高く、維持管理にも多大な労力を必要とするため、特に中小規模の研究機関や企業にとっては大きな負担となっていました。しかし、クラウドベースのHPCは、こうした負担を大幅に軽減します。オンデマンドで必要な計算リソースを利用できるため、初期投資が不要であり、さらに解析ニーズに応じてスケーラブルな計算環境を構築することが可能です。これにより、プロジェクトの規模や進捗に応じて柔軟にリソースを調整できるため、効率的な研究開発が可能になります。また、クラウド環境では、最新の計算リソース(CPUのみならずGPU、FPGAなど)の調達が容易であることから、計算の速度の向上も期待できます[5][11]。特に、AIや機械学習技術との連携が容易であり、これにより、従来の手法では難しかったデータ解析やパターン認識が可能になっています。
さらに、クラウドは、地理的に分散した研究チームがリアルタイムでデータにアクセスし、共同で研究を進めることができるため、国際的な共同研究が容易に行えるようになります。クラウドHPCは、データの保存と管理にも優れており、大規模なデータセットを効率的に扱うことが可能です。これにより、ゲノム解析におけるビッグデータの処理や、創薬における大規模な化合物ライブラリの管理が容易になっています[9]。
こうしたクラウドHPCの利点は、創薬とゲノム解析の両分野において広く受け入れられ、今後もその利用が拡大することが予想されます。
3. 創薬・ゲノム解析において求められるクラウドサービスとその効果
クラウドベースのHPCやその他サービスは、特に創薬とゲノム解析の分野において、その多様な利点が評価されています。主なメリットとして、以下の点が挙げられます[12]。
- 計算需要にオンデマンドで対応: 必要なときに必要なだけの計算リソースを利用できるため、研究の進行に合わせて柔軟にリソースを調整できます。これにより、プロジェクトの進行を遅らせることなく、計算資源を効率的に活用できます。
- 高いスケーラビリティ: クラウド環境では、プロジェクトの規模に応じて計算リソースをスケールアップ・スケールダウンできるため、大規模な計算が必要な場合でも短期間で大量のリソースを確保することが可能です。これにより、研究のスピードが大幅に向上します。
- 個別ニーズに即した開発環境: クラウドHPCでは、研究者のニーズに応じてカスタマイズされた計算環境を構築することが可能です。例えば、特定のアプリケーションや解析ツールを組み込んだ環境を簡単にセットアップできるため、研究者は自分たちの研究に最適化された環境を手軽に構築し、作業を進めることができます。これにより、導入や設定にかかる時間を削減し、研究に集中することが可能となります。
- 最新の計算リソースが利用可能(CPU/GPU、FPGAなど): クラウドHPCでは、最新の計算技術が常に利用可能です。特に、GPUやFPGAといったハードウェアアクセラレータを活用することで、大規模なデータ解析や複雑なシミュレーションを高速かつ効率的に実行できます。これにより、研究の質が向上し、成果がより迅速に得られるようになります。
- AI連携、Data連携: クラウド環境では、AI技術との連携が容易であり、機械学習やディープラーニングを活用した高度なデータ解析が可能です。従来の手法では難しかった洞察や予測が可能となり、研究の方向性を大きく広げることができます。また、クラウド上でのデータ連携により、異なるプロジェクト間でのデータ共有がスムーズに行えるため、効率的な研究開発が可能となります。
- CICDを実現する開発プラットフォームを活用することで、正確なプロジェクト管理、高速な開発ライフサイクル、自動テストによるヒューマンエラーの削減等にも寄与することが可能です。Microsoftからは、Azure DevOpsやGitHubといった複数のプラットフォームを提供しています。
- 統合認証/セキュリティ基盤で社内外の連携を促進: クラウドHPCは、セキュリティ対策が強化されており、特に医療データやゲノムデータのような機密性の高いデータを安全に取り扱うことが可能です。統合認証基盤により、異なる組織やチーム間での安全なデータアクセスが実現し、共同研究を円滑に進めることができます。
Microsoft Azureは、創薬やゲノム解析など、ヘルスケア分野に特化したHPC基盤を提供しています。AzureのHPCサービスは、CycleCloud[13]やAzure Batch[14]といったツールを通じて、研究者が必要とする計算リソースを迅速にプロビジョニングし、効率的に利用できる環境を提供しています。これにより、研究者は物理的なインフラの制約を受けることなく、大規模な計算をクラウド上で自由に実行することができます。
Azureは、AIやビッグデータとの連携に優れており、研究プロセス全体を支援する統合プラットフォームを提供しています。例えば、ディープラーニングを活用したゲノムデータの解析や、自然言語処理を用いた文献情報の解析など、多岐にわたるAI技術を組み合わせることで、より深い洞察を得ることができます。また、Azure上でのデータ保存と管理は、厳格なセキュリティ基準に準拠しているため、研究データの保護と共有が安心して行えます。
さらに、Azureは、分子動力学(MD)などの計算化学アプリケーションを統合した基盤の提供も計画しており、これにより、研究者はクラウド上で包括的な計算環境を利用できるようになるでしょう。これらAzureにおけるHPCサービスの充実により、創薬やゲノム分野でのクラウドHPC活用が日々増加しており、研究開発の基盤として不可欠な存在となっています[16]。
4. 活用例
クラウドHPCの活用は、国内外の多くの研究機関や企業で成功を収めており、その有効性が実証されています。以下に、創薬とゲノム解析の分野での具体的な事例を紹介します。
創薬分野での実例
欧州に本社を構える大手製薬会社は、クラウドHPCを活用して新薬開発のプロセスを大幅に効率化しました。従来、数ヶ月を要していた化合物スクリーニングのプロセスが、クラウドHPCの導入によりわずか数日で完了するようになりました。このプロジェクトでは、数億の化合物を対象に、分子動力学シミュレーションを実行し、AIを用いてデータ解析を行うことで、有望な候補を迅速に絞り込むことができました [16]。
特に注目すべき点は、クラウドHPCのスケーラビリティを活かし、大量の計算リソースを短期間で動員できたことです。これにより、開発サイクル全体が短縮され、製薬会社は新薬の市場投入を大幅に早めることができました。さらに、クラウドHPCを利用することで、研究者はより創造的なアプローチを採ることができ、結果として開発成功率の向上にもつながっています[17]。
ゲノム解析分野での実例
日本では政府主導で大学、研究機関との連携により、クラウドHPCを利用して大規模なゲノム解析プロジェクトを推進しています。このプロジェクトでは、数十人分の全ゲノムデータを解析する必要があり、そのデータ量は数ペタバイトにも及びます。従来のオンプレミス環境では、この規模のデータを処理するのは非常に困難でしたが、クラウドHPCを活用することで、データの迅速な処理が可能となり、解析結果を短期間で提供し医療への活用を促進する基盤構築を進めています[18]。
また、クラウド環境を活用したことで、国内外の複数の研究チームがリアルタイムでデータにアクセスし、共同で解析を進めることができます。これにより、研究プロジェクトの効率が大幅に向上し、国際的な協力体制の下で、迅速かつ高精度な解析を実現することができます。このような活用が可能になれば、クラウドHPCがゲノム解析の分野でいかに強力なツールであるかを示すものであり、データ解析の可能性を大きく拡大します。
5. 今後の展望
クラウドHPCの利用は、今後もヘルスケア分野での重要性を増していくことが予想されます。特に、AI技術やビッグデータ解析の進展に伴い、クラウドHPCはこれらの技術を支える基盤として、研究開発の効率化と革新を促進する役割を果たしていくでしょう。加えて、今後期待される分野では、量子コンピューティングの実用化が挙げられます。量子コンピューティングは、従来のコンピューティング技術では不可能だった高度な計算を可能にし、創薬やゲノム解析の分野に革命的な変化をもたらすと期待されています。クラウドHPCプラットフォームに量子コンピューティングが統合されることで、これまでの研究開発の枠を超えた新たな可能性が広がるでしょう。
また、クラウドHPCの普及は、研究のオープン化にも寄与すると考えられます。クラウドを活用することで、研究成果をより広範なコミュニティと共有し、協力して研究を進めることが容易になります。これにより、異なる分野の知識や技術を融合させた革新的な研究が進展し、科学全体の発展に寄与することが期待されます。特に、国際的な研究プロジェクトにおいては、クラウドHPCを利用することで、地理的な制約を超えてリアルタイムでのデータ共有と解析が可能となり、グローバルな研究協力が促進されるでしょう。これにより、世界中の研究者が共同で取り組むことで、より迅速かつ大規模な研究が可能となり、科学の進展に大きく貢献することができます。
今後、クラウドHPCの活用が加速する中で、研究者にとって重要なのは、この技術を効果的に使いこなすスキルの習得です。クラウドHPCの特性や操作方法を理解し、適切に利用することで、研究の効率化と精度向上が図れます。特に、複雑な解析やそこで生成された大量のデータを扱う場面では、クラウドHPCの効果的な利用が研究の成否を左右することになることが予想され、また、クラウドHPCのスキルを習得することで、研究者自身のキャリアにもプラスの影響を与えることが予想されます。新しい技術を取り入れることで、研究の幅が広がり、革新的なアプローチを採用することが可能になります。
6. 最後に
ヘルスケア領域におけるクラウドHPCの活用は、今後ますます重要性を増していくと考えられます。創薬やゲノム解析の分野では、膨大なデータを迅速かつ精緻に解析するための計算資源が求められており、クラウドHPCはそのニーズを満たすための理想的なソリューションです。クラウドHPCを活用することで、研究のスピードと効率を向上させ、革新的な成果を生み出すことが可能となります。
今後も、クラウドHPCはさらなる進化を遂げ、AIや量子コンピューティングとの連携が進むことで、より高度な解析とシミュレーションが可能になるでしょう。研究者は、これらの新技術を積極的に取り入れ、クラウドHPCを効果的に活用することで、次世代の研究開発をリードしていくことが期待されます。
参考文献
- 医薬品産業ビジョン2021, 000831974.pdf (mhlw.go.jp)
- Perspective of drug design with high-performance computing, Perspective of drug design with high-performance computing – PMC (nih.gov)
- Pharma companies are counting on cloud computing and AI to make drug development faster and cheaper, Pharma companies are counting on cloud computing and AI to make drug development faster and cheaper | ZDNET
- Microsoft announces collaboration with NVIDIA to accelerate healthcare and life sciences innovation with advanced cloud, AI and accelerated computing capabilities, Microsoft announces collaboration with NVIDIA to accelerate healthcare and life sciences innovation with advanced cloud, AI and accelerated computing capabilities – Stories
- HPC Market Update 2024, Hyperion-Research-SC23-Briefing-Novermber–2023_Combined.pdf (hyperionresearch.com)
- 理研創薬・技術基盤プログラム, https://www2.riken.jp/dmp/cli_dev.html
- Introducing two powerful new capabilities in Azure Quantum Elements: Generative Chemistry and Accelerated DFT, Introducing two powerful new capabilities in Azure Quantum Elements: Generative Chemistry and Accelerated DFT – Microsoft Azure Quantum Blog
- 国際連携によるがん全ゲノムの大規模解析、理科学研究所, 国際連携によるがん全ゲノムの大規模解析 | 理化学研究所 (riken.jp)
- ゲノム解析とは、製品評価機構, ゲノム解析とは? | バイオテクノロジー | 製品評価技術基盤機構 (nite.go.jp)
- DRAGEN二次解析、イルミナ社, https://jp.illumina.com/products/by-type/informatics-products/dragen-secondary-analysis.html
- Azureでのハイパフォーマンスコンピューティング, https://learn.microsoft.com/ja-jp/azure/architecture/topics/high-performance-computing
- Azure CycleCloudについて, https://learn.microsoft.com/ja-jp/azure/cyclecloud/concepts/core?view=cyclecloud-8
- Azure Batchについて, https://azure.microsoft.com/ja-jp/products/batch
- Introducing Azure Quantum Elements, https://youtu.be/JkQGM5ZuXO4
- Accelerating Drug Discovery with Supercomputing Scale Biomolecular Simulations on Azure, Accelerating Drug Discovery with Supercomputing Scale Biomolecular Simulations on Azure – Microsoft Community Hub
- Preparing for future health emergencies with Azure HPC, Preparing for future health emergencies with Azure HPC | Microsoft Azure Blog |
- 厚生科学審議会科学技術部会全ゲノム解析等の推進に関する専門委員会, 厚生科学審議会科学技術部会 全ゲノム解析等の推進に関する専門委員会 |厚生労働省 (mhlw.go.jp)