機械犬のまなび:化学×機械学習

ケモインフォマティクスを活用する化学企業の研究者です。新しい分野のため、ネット上に勉強しやすい情報が少なく感じました。そんな悩みを持つ方に向けて「化学×機械学習」に関連した話題を提供します!

化学領域で機械学習を用いるということ

はじめまして。

化学メーカーで研究に携わる傍ら、機械学習を適用できないかと考えて仕事に(半ば無理やり)持ち込むようになりました。

今後の投稿では具体的に機械学習を用いる場合について記載していこうと考えていますが、今回は化学に機械学習を使うということについて個人的な考えを述べていこうと思います。

 

化学×機械学習で何ができるのか

化学での機械学習では学術研究から企業での製造プロセスまで、多くの領域に適用できます。既に産業・学術の領域において様々な検討例が報告されています。

有名な例を挙げると

  • 新規薬剤のターゲット分子の探索
  • 高性能ポリマーの探索
  • 全固体電池の電解液組成の検討
  • 工場におけるアンモニア排出量の変化を事前に予測→製造条件変更によるアンモニア排出の事前防止

などなど、、、ここには挙げきれないほどの応用例が既に知られています。

 

ざっくりまとめると、やっていることは容易に手に入る情報(実験前に分かる情報や計器のデータなど)から手に入れるのが容易でない情報(実験しないと分からない情報や)を予測することと言える例も多いかと思います。

これによって実験回数の大幅な減少や通常では見逃していた組成の発見、工場では危険物質の放出を防いだり歩留りを向上させたりすることも期待できます。

あなたの携わる領域ではどのようなことが出来るようになるのでしょうか。

 

化学メーカーで機械学習をやる利点

化学に機械学習を用いる分野はケモインフォマティクスと呼ばれる、学術的にもかなり新しい領域にあたります。

最先端の学術領域を化学メーカーで適用できる機会はそう多くありませんが、本分野については企業でも、企業だからこそ利用しやすい側面もあると考えています。

 

1. 機械学習の適用範囲があまりにも広い

機械学習を用いることで過去のデータを利用して、未来の予測や新しい情報の抽出ができます。

道や障害物のパターンを学習する自動運転や、顧客の行動パターンを学習する広告、最近では人間の顔の特徴を学習して写真の人物の性別を変えたり若返らせたりするアプリも登場していますよね。

化学の領域では未知の薬剤の活性や望む性能をもつ新規ポリマー構造の予測、数学的に最適な実験の計画、新規触媒の設計などの研究に近い領域への適用が思い浮かびます。しかし、直接測定できない分子量などを計器類の情報から予測するソフトセンサーなどの製造への応用も目立ちます。

つまり、蓄積してきたデータさえあれば何でも求められる可能性を秘めた手段であると言えます。

 

2. 蓄積してきた膨大なデータ

データは宝です。最近はこのような言葉も耳にするようになりました。

機械学習は世界中で精力的に検討が進められていますが、あらゆるデータを予測できる最高のアルゴリズムやデータセットなどは存在しません。

 

目的ごとに調整が必要になるのです。

つまり、それまでの研究・製造活動の中で得られたあらゆるデータが未来の予測に役立つ可能性を秘めています。

企業では一つのテーマを複数人で扱うことが多いなど、多くのデータが得られる環境が整っていると言えますよね。

そのようなデータをうまく活用して精度の良い予測ができれば、新しい知見が人類にもたらされるとともに、望みの化合物を最短ルートで手にできるかもしれません。

今、化学×機械学習をやる利点

新しい領域なので化学×機械学習を使いこなせる人材が明らかに少ない状態です。この状態でスキルを身につけるだけでも大きな市場価値があると言えると思います。特に、経験豊富な年長者で詳しい方は非常に少ないです。

主観ですが、化学業界にいる人間は他分野に比べて数字に強い人が少ないように思います。その一方で、機械学習を用いた研究開発は企業人であっても今後は必須になってくる領域が増えてくるのはほぼ確実に思われます。

大手化学メーカーの動きを見ても、明らかにここ数年で機械学習を適用しようという動きが活発化しています。近い内にどんどん成果が出てくるのではないでしょうか。

 

大きな流れが来る日はそう遠くないと思います。

ご興味ある方はぜひ挑戦してみてはいかがでしょうか!