0
会員になると、いいね!でマイページに保存できます。
製薬業界は機械学習の活用が活発な業界の1つです。本稿では、DataRobot社のデータサイエンティストを務める筆者が、製薬企業の「薬の新規開発」「薬の生産」「薬の販売とマーケティング」「既存薬の価値向上」という4つのプロセスにおける業務課題と機械学習の活用シーンを解説します。
創薬プロセス(薬の新規開発)での機械学習活用
新しい薬が患者さんへ届けられるまでに、どれくらいの時間やコストがかかっているかご存じでしょうか? 基礎研究、前臨床試験、臨床試験、を経て、厚生労働省からの承認が降りるまでの期間は平均でおよそ13~14年、費用は約1000億円かかると言われています。
- 基礎研究段階ではターゲットとする病原を定め、2~3万にも及ぶ候補物質から新しい「リード化合物」を生成・スクリーニング・最適化します。
- 前臨床試験段階では薬効、薬物動態や毒性が評価されます。
- 臨床試験段階ではヒトを対象とした三相に渡る試験が行われます。
2~3万に及ぶ候補化合物から評価しても、絞り込みの過程でほとんどが脱落してしまいます。つまり膨大な時間とコストをかけても最終承認まで進む薬はごくわずかに限られるのです。そのため製薬企業の新薬開発にかかる負担はとても大きく、成功確率と開発効率を上げることが業界共通の課題となっています。
これらの課題に対して、機械学習が貢献できる余地は大いにあると考えられ、実際に適用例(ユースケース)が生まれています。
たとえば、がんの治療薬を開発する場合を考えてみましょう。
基礎研究段階における候補物資の絞り込みでは、「がん細胞に影響を与えられる物質を効率よく知りたい」というニーズがあります。
そこで、過去から蓄積してある創薬ターゲット(あるタンパク質)とさまざまな化合物との実験結果をまとめた実績データから機械学習モデルを生成します。そして、モデルに新たな化合物候補のデータを入力して、その化合物が創薬ターゲットと結合して活性を発現するかどうかを予測するのです。すると大半の化合物は発現確率0ですが、中には0でない化合物が見つかることがあります。
このように、今まで膨大な時間を使っていた候補化合物スクリーニングのプロセスが機械学習モデルで大きく効率化されます。それによって生まれた時間を使ってさらにより多くのPDCAをまわすことができるようになるため、成功率向上も期待できます。
別の例として、前臨床試験段階で行われる実験の1つで、服用した薬がどのように体内に吸収、浸透、代謝されていくかを評価する「薬物動態試験」と呼ばれるプロセスがあります。
「薬物動態」とは、一言で言えば薬が体内に取り込まれてから排せつされるまでの動きのことです。薬は体の中で溶けなければ吸収できませんし、狙っているターゲットに浸透しなければいけません。また、役目を終えたら速やかに体から排出されて体の中に蓄積されないようにすることも重要です。これらの機能性を総称して「薬物動態」と呼んでいます。
この薬物動態や毒性は評価する必要がありますが、そのために実際に化合物を作成して実験を行うと大きなコストがかかるため、あらかじめ対象となる化合物を成功しそうなものだけに絞り込んでおきたいところです。
そこで、過去から蓄積した評価実験結果などの実績データと化合物の構造データ(フィンガープリントなど)を使ってさまざまな薬物動態指標を予測する機械学習モデルを生成。モデルを用いたシミュレーションによって、候補化合物のスクリーニングや最適な配合の推定を行うことが可能になります。
製薬プロセス(薬の生産)での課題と機械学習の活用
医薬品はその使命から、高品質を維持しながら安定して供給されなければなりません。そのため「医薬品及び医薬部外品の製造管理及び品質管理の基準」(GMP:Good Manufacturing Practice)という厳しいレギュレーションにのっとり、厳密な管理下で製造されていますが、製薬企業ではさらに高いレベルで管理をしたいというニーズがあります。
そのために、たとえば、複雑な薬品製造工程のパラメーターをもう一段チューニングして、品質のばらつきをさらに抑制。安定した供給を図るために機械学習を適用します。
活用シーンとしては、薬物含量均一性や溶出速度などの品質特性と工程パラメーターとの関係性をモデル化。そのモデルを利用して要因分析や最適化を行うユースケースがあります。また、一般の製造業と同様に、生産需要予測、設備故障予測、異常検知、不良品予測などにも機械学習を適用できます。
【次ページ】営業・育薬プロセスでの課題と機械学習の活用
関連タグ