ChemSpiderは、1億を超える構造、物性、および関連情報への高速アクセスを提供する無料の化学構造データベースで、Royal Society of Chemistryが運営している。
ChemSpiderは、何百もの高品質なデータソースから化合物を統合しリンクすることで、オンライン検索で自由に利用できる化学データを多様なデータソースから簡単に見つけることができる。また、ユーザーはwikipediaのようにデータを追加したり管理したりすることが可能。一方でRoyal Society of Chemistryによる手動キュレーションによって継続的にデータ品質の向上が行われている。
第一原理計算データベースOpen Quantum Materials Databaseに対応したPythonライブラリ。結晶構造や相図などの解析ツールの他に、VASPを使った自動計算機能も備えている。
米国立衛生研究所(NIH)の下で2004年より運用され始めた化学物質データベース。小さな分子を主に対象としているが、脂質やペプチドなどの大きな分子のデータも収集されている。構造や物性、毒性などの化合物の性質だけでなく特許や文献情報も含んださまざまな情報を調べることが可能。WebブラウザやPUG REST APIを介したアクセスだけでなくFTPサイトからのデータのダウンロードにも対応している。
化学物質データベースPubChemをPUG REST API経由で取り扱えるPythonラッパー。PubChemにあるデータを化合物名や構造情報から検索することができる。Pandas dataframeとして出力を受け取ることも可能。
量子情報・量子多体系のシミュレーションのための使いやすく高速なPythonライブラリ。Tensor networkシミュレーションのためのTensorモジュールと、「厳密な」量子計算のためのMatrixモジュールを提供する。
物質データマイニングのためのオープンソースPythonパッケージ。数十を超えるデータベースからデータを抽出し、前処理や可視化をすることができる。scikit-learnなどと組み合わせることにより、抽出したデータを元に作成した記述子で機械学習モデルを構築できる。
文献から化学物質の情報を自動抽出するPythonツール。英語で書かれた論文などから自然言語処理アルゴリズムに基づき、物質名とそれに関連した融点やスペクトルなどの物性情報を抽出できる。
第一原理モンテカルロ法パッケージ TurboRVBに実装された機能をPython経由で制御・実行できるPythonラッパー。ワークフロー管理アプリであるTurboWorkflowsと組み合わせることにより、ハイスループット計算を実行することもできる。
科学データを分析するためのオープンソースソフトウェア。一次元から三次元まで様々な次元でプロットができ、異なるタイプのデータを重ねてマッピングすることも可能。可視化だけでなく、ピーク検出のためのフィッティングといったデータ処理も行える。テキストファイルやHDF5といった一般的なフォーマットからX線実験などで用いられるNeXusといったデータ形式にも対応している。
分子モデリング・可視化のためのアプリケーション。TINKER, MSMS, Firefly, GAMESS, MOPAC, Gaussianなどのアプリと連携しており、特にGAMESSによるFMO計算の可視化には必要不可欠なアプリである。グラフィカルユーザーインターフェースによる各種入力ファイルの作成、基準振動の動画表示、遷移状態近傍のエネルギー・構造の可視化などが可能。