ボストンのダウンタウンにある公立植物園のラグーンに架かる歩道橋で二人は巡り会いました。一人は著名な生物学者、もう一人は情熱的な人工知能の代表的人物でした。近隣のシーポート地区にあるケンブリッジコンサルタンツの同僚として、初めは彼らの昼食時の偶然の出会いについて他愛もない会話を交わしました。しかし話題はすぐに仕事のことになりました。ここで繰り広げられた交流が、命を救う細胞・遺伝子治療において重要な意味を持つ共同研究のきっかけとなったのです。この生物学者がカレン・ウィジンガー、AI専門家がラム・ナイドゥであり、この会話こそがバイオプロセシング機械学習の架け橋となるものでした。

カレン ウィジンガー:
ラム、あの日あなたに会えてよかったです。私たちがそれぞれ異なる角度から課題に取り組むことで何か本当の進歩を引き起こすかもしれないことに、お互いすぐに気づいたのだと思います。

1人の生物学者として、細胞療法の出現には期待しています。つまりここで明確にしておきたいのは、細胞を改良して我々の体に移植することで病気を治せるかもしれないという考えは医学において最もわくわくする重要な進歩です。しかし他の多くの人と同様に、製造のコストが高すぎるという現実に需要が妨げられてしまうことに懸念を抱いています。

ラム ナイドゥ:
カレン、その通りです。あの日は確かに心が通じ合っていました。このような新しい治療の大規模な開発には、低分子医薬品の製造とは根本的に異なるアプローチが必要なことは明らかです。第一に、これらは生きた治療なのです!大規模な生物学的処理における品質保証の高速化と効率化に機械学習を適用可能であるということを私達の共同研究が既に示している点について、大変嬉しく思います。

カレン ウィジンガー:
大規模なバイオプロセシングにおける品質保証の高速化―いい響きですね。そしておっしゃる通り、生体治療を扱うというのは非常に特殊な障害を伴います。患者さんやドナーから細胞を分離し、それを操作して体外で成長・増殖させて治療上適切な用量の生物学的製剤を製造しなければなりません。更に複雑なことに、製造のバッチサイズは一般的に小さいです。生細胞は標準化もされていなければ特性もあまり明らかになっておらず、これらの培養は複雑で手間がかかる上に技術開発には何年もかかります。

ラム ナイドゥ:
もちろんこれらのことは課題の核心に触れるものです。世界中の患者に真の効果を与える有意義なレベルまで細胞治療薬へのアクセスを広げるには、規模の拡大に対応できる自動化された製造プロセスの実現が必要です。研究室での心躍るような新たな成果を、生活をより良くする商業的な治療へと結びつける方法を見つけ出さなければなりません。

カレン ウィジンガー:
確かに、これらはプロジェクトの初期に考えていた全体像の基になったテーマです。非常に複雑な生体治療を必要とする人全員のため再現性良く製造するにはどうしたら良いでしょうか?製品の安全性や有効性、採用した製造工程に障害がないことをどのように確認するのでしょうか?現在のやり方では不可能なことは明らかでした。今は全ての段階で熟練した専門家が最新情報を共有している状況です。我々がまだ先進的技術がもたらす可能性を活用できていないがゆえに、彼らは手作業の、非実用的なステップの泥沼にはまっています。

ラム・ナイドゥ:
まさにその通りです。そして多くの複雑な問題と同様、この問題の本質は比較的少数の基本的な問題に集約されます。重要なことは例えば、品質を保証しつつも実際にどこまで自動化ができるか、どのように人間の専門家に常時情報提供を行い介入が必要なタイミングを把握してもらうか、そして最も重大なのはどのようにほぼリアルタイムで進捗を監視できるかということです。

カレンウィジンガー:
細胞治療薬におけるバイオプロセスの自動化の実際の内容を理解するには、我々の科学者仲間が細胞を注意深く育てる過程を観察するのが一番だと考えました。彼らは各段階で、工程の無菌性の評価やスポット測定による細胞生存率の評価、また様々なパフォーマンス指標の変化率の評価も行っています。各段階を工程や細胞レベルといった複数レベルで特徴づけています。全ての段階と測定値はプロセスに固有のものであり、確立された重要な工程パラメータ(CPP)として用いられる前に経験的に発見し徹底的に評価する必要があります。

ラム ナイドゥ:
そこが面白い点だと思います―カレン、そのプロセスでのリスクをどのように推測しているか教えてください。異なる方法や具体的な測定値はあるのでしょうか?

カレン ウィジンガー:
科学者は生成される代謝物の測定によって、生存率に対するリスクを推測することがあります。また核酸アッセイやタンパク質アッセイ、シークエンスデータを利用することもあります。彼らは常に巧妙な論理や推論を利用し、介入して予防措置や是正措置を取るかとらないかを継続的に判断しているのです。

ラム ナイドゥ:
この階層化された問題のなかで情報がどのように位置づけられるかを理解することが、抽出、合成、実行を自動化するカギとなります。この解決策には従来の制御システム以上のものが必要となります。どんな解決策も予期せぬ事態に積極的かつ確実に対応し、そこから学習しなければなりません。また、あらゆる状況下でパフォーマンスを監視し最適化する人間・機械チームの一員でなければなりません。これは言うは易く行うは難しです。

カレン ウィジンガー:
このようなシステムには、製造のバイオプロセスにおける複数レベルでの見識の創出が必要だと気づきました。これを可能にするためには、生物学、高度なインライン非接触型計測、動的な適応制御システムでリアルタイムに処方的洞察を生成する人工知能といった分野が融合する必要があります。インラインセンシングにより、ほぼリアルタイムで変化を追跡することが可能です。理想としては、これをなるべく直接的かつ最小限の侵襲に抑えたいと考えています。しかしインラインセンシングは汚染のリスクを伴います。そこで、非接触型方式、場合によっては“At-line”方式を可能にする必要があります。

 ラム ナイドゥ:
非侵襲的なセンシングというと聞こえは良いですが、その結果は生物学者の直接解釈できない数字の集合です。そこで、様々なレベルで測定結果をプロセスにおける現段階の品質と健康な細胞数等の望んだ結果に関連付ける洞察へと変換するステップが必要になります。ここでもAIは測定値された変数の包括的なセットと、必要に応じて更新されるべきプロセスパラメータ値のセットとの間をリンクを作成することができます。これらを統合することで、我々は未来のバイオプロセスの青写真を描くことができました。

Bioprocessing meets machine learning

図1-上図と下図は現在のアプローチ方法と、AIがバイオプロセスに組み込まれたときのビジョンを比較しています。AIがない場合(上図)、バイオプロセスは高度なスキルを持つ技術的専門知識に依存しています。これでは、科学者の時間を有効に活用できません。このような作業形態が続くと不満の種となり、別の機会を求めて退職してしまうこともありますし、会社にとって不利益になります。また、専門的な知識を必要とするため、分析には時間がかかり、オペレーターのミスが発生しやすくなります。これらすべてが、コスト、時間、労力の増加、および品質の低下につながります。

Bioprocessing meets machine learning

図2 – AIがプロセスを監視している場合(上図)、人間の専門知識は、MLのトレーニングや開発、重要な最終決定を下すための新しいプロセスに使用されます。この方が精神的により刺激的です。科学者は会社を戦略的改善により多くの時間を割くことができ、生産性と人材確保は最適化されます。バイオプロセスの分析と検証は、より速く、より正確になります。AIの統合により、高度なスキルを持つ人材が平凡なタスクをする必要性が最小限になり、さらなる領域で革新的な活動を行うことができるようになります。製品開発、製品品質、生産性、作業環境、企業文化の全てにおいて、恩恵を受けることが可能になります。

カレン ウィジンガー:
ここで鍵となる疑問は、このプロセスにおいてAIを利用する本当の意味は何なのかという点です。AIや機械学習は、今やことあるごとに投げかけられる決まり文句となっています。誰もが自らのシステムにAI/機械学習を使いたい、あるいは使うことを主張しています。しかし私たちはもっと具体的なものを求めなければなりません―それが実際に何を意味し、私たちのバイオプロセスをより賢く速くするために何ができるのでしょうか?更に、AIや機械学習をどのようにして実際にシステムに組み込むのでしょうか?私たち人間(つまりAIでない人々)にとっては、AIや機械学習は(筋肉増強の)ステロイド剤を使った実験計画法(DOE)と考えるのが良いのかもしれません。

ラム ナイドゥ:
その考えを紐解いてみましょう。具体的には、AIシステムは測定値を分析し任意の瞬間でバイオプロセスの状態について洞察を生み出せる数学モデルの集合体です。更にこの洞察を解釈し、製造プロセスを軌道に乗せるためにバイオプロセスのパラメータを調整するための推奨事項のセットを決定することが可能です。

そのためには、どのデータが正常なプロセスを示しどのデータがそうでないかを理解するようモデルに学習させる必要があります。専門家によってデータをラベル又はタグ付けし、測定値と既知の結果及び対応するプロセスパラメータを関連付けなければなりません。この作業は大変ですが、努力に見合うだけの価値があります。学習過程の一環として、これらのよく特徴化されたデータセットでモデルを評価し、データと入力パラメータ及び出力品質を正しく関連付けられるようにそのパラメータを調整します。学習プロセスは慎重に精選されたデータ、データハイジーン(正確性、完全性、信頼性が高いデータ)、センサー較正に依存しています。またセンサーの測定値にノイズが入ったり破損したりした場合、異常または不規則な傾向を示す場合など、熟練した専門家によるより高度なレビューが必要な場合に、誤った解釈からプロセスを保護するガードレール(防止処理)や例外処理も用意されています。

カレン ウィジンガー:
そこで重要となるのが、どんな実験が学習トレーニングに活かされるかという点です。ケンブリッジコンサルタンツの生物学研究室では、概念実証を行うことでまさにこの疑問に答えようとしています。目標は生物学的プロセスのパターンを識別し、出力品質を確保するための推奨事項や見識を作成するためにAIモデルに学習させることが可能だと実証することです。

ラム ナイドゥ:
まったくその通りです。まずは手作業で細胞(浮遊または接着)を培養します。その各段階で、当社の生物学者たちは細胞の性質を測定し、顕微鏡画像を集め、マクロ、ミクロ、細胞レベルでの健康状態を示すマーカーとして使うものを説明します。彼らは当社の機械学習科学者やエンジニアと協力してこれらのデータをラベル付けし、検出した変化を識別して見識に結びつけます。このデータと見識はセンサーデータを消費し、情報抽出のための処理を行い、プロセスの状態を正常、境界、高リスクと分類するアルゴリズムを教えるために用いられます。そしてこれを基に、プロセスパラメータの調整や試薬の追加、細胞操作等を推奨します。

カレン ウィジンガー:
機械学習は与えられたバイオプロセスから情報を取得し、アルゴリズムを利用してこれを有用なデータに変換するものです。これを超並列処理で行うため、どんな人間よりもはるかに高速での処理となります。全体の結果として多くの有用なデータを非常に短時間で得られ、画期的なものとなる可能性があります。これまでの歩みから、私たちは機械学習とバイオプロセシング双方の将来に対する展望を再構築しています。しかし、はっきりさせておきたいのは、現在の最新技術はまだ初期段階に過ぎないということです。私たちの取り組みは続き、橋渡しはまだ始まったばかりです!

単にAIを持つことでは不十分なようです。AIがシステムを測定するための適切なCQA(重要品質特性)を決定するにはまだ、生物学的システムの優れた特性評価を行う必要があります。さらに優れた特性評価を行うことは、CQAに向けたプロセスを確実に推進するためのCPP(重要工程パラメータ)を定義するのにも役立ちます。

ラム ナイドゥ:
現在、私たちはCQAを多くのレベルでプロセスの品質を示すものだと考えています。しかし、何の品質基準が適切で何がそうでないか見極めるのは決して簡単ではありません。ここでも、AIは洞察を生み出すのに役立つ可能性を秘めています。各基準を見て、プロセスを反映するだけでなくパラメータ変化にも反応する有意な基準を特定できる手法が存在するのです。これは科学専門家の支援に役立つと思いますか?

カレン ウィジンガー:
これが意味することは、私たちのバイオプロセス開発のために行っている実験の一部を機械学習プロセスに組み込む必要があるということです。これらの別々の概念は効率的かつ有益となるために並行して行われ、互いに情報提供をしなければなりません。もう一つ思いついたことがあります。我々生物学者は、バイオプロセスの特性を明らかにするために偏りのないアッセイを用いることが非常によくあります。偏りのないアッセイとは、仮説にとらわれない方法で自らのシステムに疑問を投げかける方法論のことを指します。

一般的な疑問も必要ではありますが、現在の考え方に縛られたくない場合や問うているプロセスが新しい又はまだ文献化されていない場合にはこの方法が一般的だと思います。これは新規のバイオプロセスに取り組む際、CPPやCQAを定義する方法として非常によく使われます。教師あり機械学習と教師なし機械学習というのを聞いたことがありますが、これは生物学者が不偏と呼ぶものに対応しているのでしょうか?どこで登場し、また今回のケースと関連するのでしょうか?

ラム ナイドゥ:
素晴らしい質問です!優れた科学的プロセスの特徴を示すために実験データにラベル付けを行うことについての議論を覚えていますか?ラベル付けされたデータから学習するAIは、何が良くて何が悪いかを教えてくれる専門家がいるため教師あり学習と呼ばれます。逆にラベルの付いていないデータのパターンをAIの手法を用いて学習することができれば、これは素晴らしいことだと思います。このようなラベルのないデータからの教師無し学習は当社の科学者の負担を減らしてくれるでしょう。彼らは既に“ループの中”にいることでとても忙しいのです。しかし、そのプロセスのアウトプットを信頼する必要があるでしょう。この場合は、まず小さなデータセットに丁寧にラベル付けをし、後に残りのデータにAIを用いた自動ラベル付けを行えば良いと思います。これを半教師付き学習と呼びますが、これを生物学研究室で集めているデータで試してみるのは素晴らしいことだと思います。

カレン ウィジンガー:
機械学習アルゴリズムがバイオプロセスをよく知っていて、自律的なシステムの調整を引き起こせるような仕組みがあればそれもまた素晴らしいと思いませんか?そうすればCQAを最後に測定して基準に達しているか見る代わりに、求めるCQAを満たすために常に微調整をすることが可能になるのです。

ラム ナイドゥ:
これこそ私たちの向かうべき方向です。もはや夢物語ではありません。この旅を進めるのに最良の方法は、今あるものから始め、実験して学びながら時間をかけて取り組み方に磨きをかけていくことです―アジャイル方法論とでも言いましょうか

カレン ウィジンガー:
私が思うに、望むことを全て実現するには大規模な育成セットを揃える必要があります。将来の展望として、機械学習の導入のための信頼できる育成セットを皆で組み合わせるという情報の分散を考えています。このことの意味するものと今後の展開について想像してみてください。だからこの話題は尽きることがないと言ったじゃないですか!

Karen Weisinger
Author
カレン ウィジンガー
メディカルテクノロジー事業本部 細胞生物学G グループリーダー

iPS細胞、神経変性疾患モデリング、心臓再生、がん免疫療法のための合成バイオなど、複数の分野で15年以上の経験を持つ。現在、ボストンを拠点に、細胞治療分野においてお客様に有益なアイデアを市場での成功へと転換することに注力している。

日本オフィスへお問い合わせ

Author
ラム ナイドゥ
ワイヤレス&デジタルサービス事業本部 機械学習G グループリーダー

北米地域AIチームの責任者。AIを活用した世界トップクラスのイノベーションを社会実装するため、卓越したリーダーシップを発揮してきました。困難な問題を解決し、優れた製品とサービスを構築することに専念するチームをインスパイアして指導することに情熱を注いできました。Questrom School of BusinessでMBAを、Boston University College of Engineeringで博士号を取得し、製品戦略や商品化、イノベーションマネジメント、AIに関する重要な専門知識を有しています。

日本オフィスへお問い合わせ