2023.11.17 生成AIの化学研究への適用可能性検証 東工大が実験の効率化や成功確率の向上へ

GPT-4活用のイメージ

自然言語による実験指示をGPT-4が解釈し、プログラムコードを出力する例自然言語による実験指示をGPT-4が解釈し、プログラムコードを出力する例

 東京工業大学は、米オープンAIの大規模言語モデル(LLM)「GPT-4」の化学研究への適用可能性について検証を行った。化学事象の認識・分析・予測・計画の4領域でのベンチマークタスクで検証した結果、種々の作業に対して有用な知識や洞察を効果的に提供し得ること、実験操作用のロボットアーム制御などにも応用され得ることが確認できた。ただ、先端知識の不足や情報の認識エラーなどの問題も確認され、これらの克服が今後の課題だ。AI(人工知能)と化学研究の連携がさらに進めば新手法・プロセス開発が促され、化学・材料研究の加速が期待される。

 東工大物質理工学院材料系の畠山歓助教と早川晃鏡教授らの研究チームが取り組んでいる。内容は「Science and Technology of Advanced Materials」にオンライン掲載された。

今後の影響を俯瞰

 GPT-4は多岐にわたる知識を持つだけでなく、多彩なタスクの実行能力も示しており、人間と同等以上の知識や認識力を持つことが確認されている。また、スケーリング則やムーアの法則の下、LLMはさらなる性能向上が期待され、諸分野での応用が見込まれる。

 そのため、LLMが諸領域で今後どのような影響を与え得るか、解決すべきタスクが何かについて、俯瞰(ふかん)して検証する作業が喫緊の課題となっている。化学・材料分野も例外ではなく、これまで研究されてきたデータ科学手法(ケモインフォマティクス、マテリアルズインフォマティクス〈MI〉)との連携法や解くべきタスクを、先端の研究知見も踏まえつつ整理する必要があった。

強みとなる能力

 畠山助教らは最近の研究で、GPT-4の化学知識を活用することで、従来法よりも高性能な物性予測の機械学習モデルを構築可能な事例を報告。化学研究、特に有機材料分野に焦点を当てながら、より広い視点からGPT-4の能力を検証した。化学事象の認識・分析・予測・計画の4領域でベンチマークタスクを推進した結果、原理的には化学分野での種々のタスクをサポート可能であり、言語モデルに特有の解釈性や汎用(はんよう)性が大きな強みになることが分かった。

 GPT-4は種々の化合物の物性データや特徴に関する知識データを有しており、大学院レベルの問題にも回答可能。物質の分子構造も一部認識できた。典型的な化学反応の種類やメカニズムを認識したり、反応条件や生成物に関する質問にも迅速に対応できた。一方で複雑な分子構造の認識や先端レベルの化学反応では誤答が目立った。

 例えば酸化還元電位の分子の物性値を官能基の有無と関連付けて説明できたほか、未知の化合物の物性を、GPT-4が持つ化学知識に基づいて理由付きで予測できた。数件程度の小さなデータベースからでも構造-物性相関の予測モデルを構築できる事例があることも判明。言語モデルが化学的な背景知識に基づいて推論できるためという。

 モデル反応系では、所望の収率を得るために必要な化合物の仕込み量や反応時間などを提案できた。例えば、「反応時間が長すぎると望ましくない副反応が進行するので、少し早めに反応を終了する」という判断を下せる。一方、従来の化学知識を持たない非言語型のモデルにはその能力がないため、探索の初期段階では完全にランダムな提案しかできなかった。

 また、GPT-4は自然言語での指示をもとに、実験操作を行うロボットアームの制御プログラムを出力できた。具体的な実験手順や反応条件の最適化に関する提案も可能で、実験の効率化や成功確率の向上に貢献する可能性が示された。

予測誤差の解決

 実践的運用に向けた課題も明らかになりつつある。学術論文レベルの先端知識をほとんど持っていなかったことに加え、一部タスクでは物性の予測誤差の問題などが顕在化。解決策として、今後は専門知識に特化した言語モデルの構築や既存のインフォマティクス手法との融合が必要になる。

 研究開発の業務を効率化できる可能性があることが分かり、未知の問題や現象に対して新しい示唆を得られることが期待される。今回の結果を踏まえ、最先端の化学研究や科学知識にも適合したモデル開発に取り組むとともに、自動実験のためのロボットアームの制御など、化学研究を幅広くサポートするためのLLMシステムの構築も検討中という。

 畠山助教は取材に「生成AIには適用範囲が狭いという課題も指摘されるが、MIやロボティクスなどとの親和性が高い。半導体製造関連など応用が期待できる」との見方を示した。

 スケーリング則 LLMの性能がモデルのサイズや訓練データ、計算資源が増加するにつれて一貫して向上する傾向を示す経験則を指す。