非線形atomicクラスター展開による原子間力ポテンシャル構築のためのツール。pandasとASEを使ったデータフォーマットを用いるが、VASPの出力ファイルから学習データを自動で抽出することもできる。学習したポテンシャルはLAMMPSに対応しており、分子動力学計算と同時に、出現した構造の学習範囲からの逸脱度合い(extrapolation grade)も計算可能。
有効模型をベイズ最適化を用いて有効模型を導出するツール(BEEMs =Bayesian optimization tool of Effective Models )。
与えられたハミルトニアンから磁化曲線を求める順問題ソルバーとして、量子格子模型ソルバーHΦが使われている。ターゲットの磁化曲線と計算で得られた磁化曲線の差がコスト関数として用いられ、ベイズ最適化ライブラリPHYSBOによって、コスト関数を最小にするよう次の候補ハミルトニアンが提案される。
化学物質データベースPubChemをPUG REST API経由で取り扱えるPythonラッパー。PubChemにあるデータを化合物名や構造情報から検索することができる。Pandas dataframeとして出力を受け取ることも可能。
物質データマイニングのためのオープンソースPythonパッケージ。数十を超えるデータベースからデータを抽出し、前処理や可視化をすることができる。scikit-learnなどと組み合わせることにより、抽出したデータを元に作成した記述子で機械学習モデルを構築できる。
文献から化学物質の情報を自動抽出するPythonツール。英語で書かれた論文などから自然言語処理アルゴリズムに基づき、物質名とそれに関連した融点やスペクトルなどの物性情報を抽出できる。
タンパク質の立体構造を予測するためのAIシステム。タンパク質の一次配列(アミノ酸配列)からその三次元構造(折りたたみ構造)を予測することが可能。過去の数十万のタンパク質構造データベースを学習し、DeepMindを基盤とするディープラーニング技術を活用して、新しいタンパク質のアミノ酸配列からその立体構造を予測する。
汎用機械学習ポテンシャルを評価するためのベンチマークフレームワークおよび、その評価に基づくリーダーボード。物質の生成エネルギーや、構造緩和の精度、熱伝導度の予測精度を総合的に勘案した評価をもとに順位付けを行っている。最近では大学などの公的研究機関に加えて、Meta、Microsoft、Googleなどの大企業も汎用ポテンシャルの開発に参画し、リーダーボードの上位を賑わしている。
機械学習のためのオープンソースライブラリ。ニューラルネットワークに基づく深層学習に関する様々な機能を提供する。特に画像認識の処理を得意としており、サンプルコードが充実しているほか、学習済みモデルがCaffe Model Zooで公開されている。C++による実装のため高速で動作する。
遺伝的アルゴリズムに基づく構造予測を行うアプリケーション。結晶、分子、原子クラスターなどの安定な構造・組成を、第一原理計算や分子動力学を用いて予測する。VASP、LAMMPS、MOPAC、GULP、JDFTxなどの様々なコードとのインターフェイスを持ち、並列化されたアーキテクチャにおいても効率的に動作する。
化学組成の情報から安定・準安定構造を予測するオープンソースアプリケーション。多数の第一原理計算アプリケーション(VASP、GULP、Quantum Espresso、CASTEP)のエネルギー計算を利用し、進化的アルゴリズムを用いて構造予測を行う。