ヘルスケア業界の未来　〜バイオインフォマティクスの発展を支援するデータ＆ AI〜

By 石川智之, 日本マイクロソフト株式会社デジタルヘルス推進室長

2024年3月28日

2022 年度の診療報酬改定で「人工知能技術（AI）を用いた画像診断補助に対する加算（単純・コンピュータ断層撮影）」が保険適用され、厚生労働省の「保健医療分野 AI 開発加速コンソーシアム」で AI 開発促進のための工程表が策定されるなど、ヘルスケア業界では AI 技術の活用拡大への期待が膨らんでいます。

ただし、消化器系内視鏡分野や MRI の補助診断装置などですでに AI が活用されている一方で、データの主体や正確性の担保をどのように考えるのかといった課題も指摘されています。

これからのヘルスケア業界において AI とデータはどのような役割を期待され、どのように活用されるべきなのでしょうか。日本マイクロソフト株式会社 Chief Security Officer 河野省二が、ヘルスケア業界におけるデジタル変革のキーパーソンをお招きして「Data & AI」をテーマに実施した対談の模様をお届けします。

東京大学医科学研究所ヒトゲノム解析センターの井元清哉氏は統計科学，ゲノム情報学，システム生物学を専門とする日本のバイフォインフォマティクス分野の第一人者であり、政府が推進する全ゲノム解析等実行計画において AMED（国立研究開発法人日本医療研究開発機構）研究班の解析班責任者として活躍しています。

井元清哉氏（東京大学医科学研究所ヒトゲノム解析センターセンター長）

河野省二（日本マイクロソフト株式会社 Chief Security Officer）

黎明期からゲノム領域に携わり、常に最前線をリード

河野　井元先生が現在取り組まれているプロジェクトと、そこに至るまでの経歴をお聞かせいただけますか？

井元　私は、2001 年から東京大学医科学研究所ヒトゲノム解析センターに博士研究員として着任し、DNAや転写産物の情報解析の研究に取り組み始めました。

ゲノムは私たちの体の設計図がゲノムです。私が、ゲノムの異常によって生じる疾患である「がん」のゲノムデータ解析に私が取り組み始めたのが、2007 年頃のことでした。ゲノム配列を読み取るシークエンス解析にかかるコストが下がり始めた時期です。その頃はまだ一人分のゲノム配列を取得するのに数千万円が必要でしたが、2010 年代に入ると100 万円くらいまで下がってきました。そこで私たちは、これからはゲノム情報に基づくがん医療のパーソナライズ化が爆発的に増えていくことだろうと予測し、がん患者さんからがん細胞の全ゲノム情報を取得して、がん細胞に生じたゲノム変異を見いだして医療に還元するための研究を始めました。

2019 年には、がんに関連する数百の遺伝子を調べ、一人ひとりに適した治療法の手がかりを見つける「がん遺伝子パネル検査」が保健収載され、実際にシークエンス解析によって得られるゲノム情報が医療の役に立つ段階に入ってきました。同年、厚生労働省によって「全ゲノム解析等実行計画」が策定され、全ゲノム情報を用いてゲノム医療の飛躍的な精度向上と、これまで治療法の無かった患者さんに新たな医療を届ける組織を2025年度に発足させる、という決定がなされたことを受けて、私は今、AMED（国立研究開発法人日本医療研究開発機構）の全ゲノムプロジェクトの解析班の責任者として、その組織の基盤となる研究事業に携わっています。

河野　まさにゲノム領域の最前線で活躍されているのですね。2025 年に発足する組織でさらに我が国のゲノム医療が前進するのでしょうね。

井元　AMED 全ゲノムプロジェクトのがん領域では、希少がん、難治がんを中心とした患者さんの全ゲノムデータと詳細な臨床情報を解析班に集約し、患者さんのゲノム変異情報を抽出して、その結果を研究班（医療施設）に戻すといった作業を行なっています。解析されたデータは、データベース化されて新たな創薬研究に活用されます。2021 年の段階では前向き症例（治療中の症例）は年間 600 症例でした。2022、2023年は、それぞれ2,000症例を解析しました。新しく発足する組織では、まずは 2 万症例まで増やすことを目標としており、今はそれを可能にするための情報インフラを構築しているところです。

ゲノム解析におけるデータ活用の現状と理想

河野　以前、全ゲノムデータを収集しようとすると、そのデータ量は莫大なものになるとお聞きしました。ましてやそれが年間 2 万人分となると、この膨大なデータをどのように管理するかは大きな課題だと思うのですが。

井元　おっしゃる通りです。がんの患者さんから得られるデータも、全ゲノムデータだけでなく、さまざまなオミクス情報、臨床情報を組み合わせて解析するため、多様なコンピューティングリソースを必要に応じて使い分けることが必要です。そのため、クラウドサービスの活用は必須だと思っています。

河野　私の専門であるセキュリティ分野では、以前はセキュリティに関わるデータだけを解析して攻撃に備えていたのですが、最近はなりすましによる攻撃が増えてきたこともあり、すべての活動データを解析しなければいけないのが現状なのですが、ゲノム解析でも同じ状況なのですね。

井元　そうですね。がん細胞というのはいわば故障した細胞です。その故障の原因を突き止めるためには、がん細胞だけを解析するだけではなく、患者さんの正常な細胞との比較を行う必要があります。さらに言えば、なぜゲノムが変異してしまったのかは、その患者さんが生まれてからこれまでに暴露したあらゆる刺激を加味しなければ正確に把握できません。つまり、がんを生じる前の情報やがんを罹患していない方の情報をたくさん集める必要があるわけです。より高い精度でゲノム医療を提供するためには、セキュリティ解析と同じく、がんゲノムデータに加えて健常な方のデータ、健常な状態にある細胞のデータをいかに集めるかも、ポイントになると考えています。

我が国には優れたコホート研究（曝露群と非曝露群の追跡比較研究）が多数存在しています。ゲノムデータや臨床データは、さまざまな形式で得られ、また品質にもバラツキがあります。さらに、データ解析手法は日進月歩ですので、単なるデータの集約をゴールにするのではなく、AIをはじめとする最新技術による解析結果も合わせて統合的に利用できる枠組みが必要です。

個人の健康情報を集約・解析できれば世界は大きく変わる

河野　となると、PHR（Personal Healthcare Record）データの収集というテーマも重要になるでしょうか。最近はスマートウォッチやアプリから PHR データを入力して健康管理するようなソリューションも増えていますよね。

井元　そうですね。海外では、PHR データの提供に対して報酬を得られるような枠組みも見られます。PHR 活用を促進するために肝心なのは、データが活用されることで提供者もなんらかの報酬が受け取れる仕組みをつくることと、提供者が研究に参加している実感を持てる建て付けを考えることだと思います。先ほどコホート研究のことを申し上げましたが、自分がどのコホート研究に入っているのか、参加者が自覚されていないことは多くあるという調査結果を聞いたことがあります。この状況では価値ある PHR データの集積は望めないと思います。

河野　私たちが進んで PHR データを提供できるようなわかりやすい仕組みがあるといいですよね。私はウェアラブルデバイスには大きな可能性を感じています。

井元　研究参加者のデータが参加者や研究者を煩わせることなく自動的にデータベースに登録され、解析できる形が理想です。常に装着しているデバイスから自動でデータがアップロードされるウェアラブルデバイスの活用は、仕組みとして優れていると思います。医療の領域においては、時系列で取得されたデータは極めて大切です。スナップショットの数値だと、その人にとって高いのか低いのか判断できませんからね。こうしたデータが、未解明のゲノム変異に医学的な解釈を付けることに繫がります。そういった点でも PHR の活用には期待したいところです。

河野　PHR 活用が進むには、先ほどの報酬の話もひとつの方策だと思いますが、どのような仕組みが必要だと思われますか？

井元　大切なのは、医療機関がデータを集めたいときだけ集めるのではなく、個人の情報がほぼ自動的に集まる仕組みと、その管理やデータ提供の権利を本人が有していることだと思います。本人がその権利のもとにデータ提供を承認できて、今まで蓄積されてきた個人のデータも含めて、必要とする研究者や機関に提供できること。かつ、そのデータがどのように活用されているかが公開され、提供者が確認できること。このフレームワークを実現するためにも、電子カルテがインターネットと切り離され、臨床情報を手書きで写し取ったり電子カルテの画面を見ながら別のデータ入力端末に再度入力しなければいけないといった旧態依然とした状況は、早期に新しいあるべき姿に見直されるべきだと思います。

一方で、我が国で公的データの活用が進みつつあることも確かです。DPC データはすでに連結解析が可能になっていますし、がん分野で言うと、全国がん登録のデータベースなどは今後連結できるよう検討されてます。マイナンバーカードの活用促進もそうした動きの一環ですよね。死亡統計やレセプト情報などの公的データベースがインターネットを介して安全に突合できるようになれば、医療分野の研究の世界はずいぶん変わると思います。

医療業界の外にいる IT 人材も活躍できるゲノム領域

河野　ゲノム分野におけるデータ活用や情報基盤の整備といった点を鑑みると、プロジェクト推進のためには IT の知見も必要になってくると思うのですが、人材の確保はどのように行われていますか？

井元　私たちが必要とする能力は、大きくは解析アルゴリズムを考えるといったソフト面と、IT 分野の知識を持つハード面に分けられます。もちろん両面の知識を併せ持っている人材がベストでしょう。でも、なかなかそういう人は少ないのが現状です。特に、ゲノム領域における IT 系人材は、他の分野と比べて大きく不足しています。メディカルの知識を備えた、医療分野に貢献する志を持つ IT 系人材を、国を挙げて育成する必要があると感じています。

河野　今のお話を聞いて思ったのですが、日本の教育システム上、医学を志しても医学部入学の壁に跳ね返されて情報や工学の道に進んだ人材も多いと思うんです。そういった人材のなかには、IT の知見を活かして医療の分野に貢献できることがわかれば、興味を持つ方もいるのではないでしょうか？

井元　そうですね。いまや医療・医学は情報工学の知見なしでは成り立たない分野になっています。そのことをもっと多くの人に知ってもらいたいですね。

解析だけでなく医療者を支援する AI の可能性

河野　ゲノム領域における AI 活用についてはどのようにお考えでしょうか。

井元　私の研究で言うと、AI 活用のポイントはふたつあります。ひとつは、データの解析行為そのものに AI が活躍するケースです。これまで解析が及ばなかった複雑な構造のデータに対する AI による解析は、今のバイオインフォマティクス分野におけるホットトピックのひとつです。画像とゲノム情報を同時に解析できるフレームワークの研究も進んできているので、AI 活用によって新たな知見も得られると考えています。

もうひとつは、解析結果のサマライズです。全ゲノム解析で得られた膨大な変異情報をデータベースに照合して、医療に役立つものに絞り込む必要があります。しかしながら、検出した変異をデータベースに登録されている情報と完全一致で検索してしまうと、多くの重要な変異を見逃してしまいます。データベースに登録されている病因性の変異と類似の影響のある変異は、医師などの専門家が論文を精読し、論理的に考えることで抽出できることが多くあります。しかし、すべての怪しい変異について、医師が論文を確認することは現実的ではありません。この部分を AI が解釈できれば、大きな進歩になるはずです。

それから生成 AI は、解釈の結果をレポートにまとめることができますよね。レポートを AI が生成する、もしくは人が作ったレポートを AI がチェックして人為的ミスを見つける。どちらも AI の得意分野だと思います。

河野　最後に、私たちマイクロソフトへの期待をお聞かせください。

井元　最先端の生成系 AI をクラウドや OS に実装して個人個人のパフォーマンスを底上げしようとしていらっしゃる点は、素晴らしい取り組みだと感じています。この仕組みは研究面にも活用できるものだと思うので、ぜひ継続してほしいですね。もちろん私も大いに活用させてもらいます。これからも、最先端の AI 研究をリードし続けていただければと思います。

「ヘルスケア業界 Data & AI 対談〜医療現場での AI 普及シナリオ〜」記事

「ヘルスケア業界 Data & AI 対談〜今まさに顕現化しつつある AI 活用の課題と可能性〜」記事

「【対談】ゲノム＆ AI から見えてくるヘルスケア業界の未来　〜情報基盤の整備から見える医療 DX のかたち〜」記事

「【対談】ゲノム＆AI から見えてくるヘルスケア業界の未来　〜医療現場から見た医療 DX と AI〜」記事