2021 Volume 20 Issue 2 Pages A26-A40
日本コンピュータ化学会(SCCJ)は,日本化学プログラム交換機構(JCPE)と化学ソフトウェア学会(CSSJ)が合併して2002年1月1日に設立され,まもなく創立20周年を迎える.この記事では,コンピュータ化学に関連する文献を紹介することにより,SCCJの過去20年間を振り返りる.まず,化学,物理学,工学,材料科学,生化学などの研究分野ごとに文献数を比較する.次に,引用数の多い上位100位の文献のいくつかを,方法論,ソフトウェア,データベース,およびトピックに分類して説明する.
The Society of Computer Chemistry, Japan (SCCJ) was established on January 1, 2002 by merging the Japan Chemistry Program Exchange (JCPE) and the Chemical Software Society of Japan (CSSJ), and will soon celebrate its 20th anniversary. This article looks back on the past 20 years of SCCJ by introducing literatures related to computer chemistry. First, the numbers of literatures are compared by individual research fields such as chemistry, physics, engineering, materials science, and biochemistry. Next, some of highly cited literatures with top 100 rankings are explained with categorizing into methodologies, software, database, and topics.
2002年1月1日に日本化学プログラム交換機構(JCPE)と化学ソフトウェア学会(CSSJ)が合併する形で日本コンピュータ化学会(SCCJ)が設立されて,間もなく20周年を迎える.まずは学会運営に携わってこられた方々に敬意を表したい.本稿ではSCCJが歩んできたこの20年がコンピュータ化学という学問分野にとってどのような時代であったか,我々のグループの研究紹介も交えて振り返ってみたい.
私は講演や記事 [1]の中で,量子化学の歴史を3つの時期に分類することがよくある.第1期(1920-1940年代)を創成期と位置付け,"quantum"(量子)をキーワードとして挙げている.第2期(1950-1980年代)の確立期では"ab initio"(非経験),第3期(1990-2000年代)の発展期では"computation"(計算)をキーワードとしている.この分類からみても,2002年のSCCJの設立は必然であったと言えるであろう.
もう少し客観的に見るために,学術情報検索サイトWeb of ScienceTMでキーワード"comput* AND chem*",出版年2002-2020年としてコンピュータ化学(計算化学)に関する文献がどれだけ出版されたかを調べた.2021年1月14日現在,114,431件の文献が出版されており,年代別に見ても右肩上がりである(Figure 1).もちろん,コンピュータ化学に直接は関係しない文献も含まれているであろう.また,このキーワード以外のコンピュータ化学関連の文献は数倍あるいは数十倍あると想像される.
Number of publications related with computational chemistry during 2002 and 2020, which are searched by Web of ScienceTM with the keyword for topics "comput* AND chem*".
分野別でみると,化学,物理,工学,材料科学,生化学・分子生物学と続いている(Table 1).5位の生化学・分子生物学,16位の数学・計算生物学,18位の生物物理などを見ると,コンピュータ化学が生物分野にとって重要な寄与をしてきたことが伺える.より踏み込んだ分野では9位の薬学があり,実際,SCCJ春季・秋季年会でも薬学に関する講演を聞くことがある.6位の腫瘍学,10位の放射線学・核医学・医療画像処理,15位の外科など医療分野に関しては,画像処理としてのコンピュータ利用と化学物質・化学療法に関連した内容であり,直接はコンピュータ化学と関係のない文献が多い.11位のエネルギー・燃料および17位の天文学・天体物理学では,ニュートリノやダークマターなどコンピュータ化学とは関連が薄い記事も多く見られたが,星間分子に関する量子化学計算も少なからず確認できた.2020年出版の論文でも,星間分子と氷との相互作用 [2, 3],星間有機分子であるアセトアルデヒドや尿素の形成反応 [4, 5],生体分子形成の窒素源であるシアン化水素の生成 [6]などがある.これらの論文において,密度汎関数理論(DFT)の汎関数としてB3LYP-D3 [7,8,9,10,11,12]やM06-2X [13],波動関数理論としてはCCSD(T)/CBS,そして,階層モデルのONIOM [14]などの手法が普通に用いられていることは興味深い.19位の分光学分野では,コンピュータ化学は確固たる地位を築いている.赤外・ラマンスペクトルに対する振動数計算,紫外・可視吸収スペクトルに対する励起状態計算,そして1Hや13CのNMR計算など日常的に行われている.SCCJ論文賞に名前を残されている早世の吉田弘博士は,我が国における計算振動分光学の先駆者と言える.
Ranking | Research Field | Number of Literatures |
1 | Chemistry | 45,946 |
2 | Physics | 19,866 |
3 | Engineering | 13,876 |
4 | Materials Science | 8,961 |
5 | BiochemistryMolecular Biology | 7,342 |
6 | Oncology | 6,882 |
7 | Science Technology Other topics | 6,797 |
8 | Computer Science | 6,183 |
9 | Pharmacology, Pharmacy | 5,534 |
10 | Radiology, Nuclear Medicine,Medical Imaging | 4,212 |
11 | Energy Fuels | 3,798 |
12 | Mathematics | 3,793 |
13 | Environmental Science, Ecology | 3,194 |
14 | Thermodynamics | 2,938 |
15 | Surgery | 2,281 |
16 | Mathematical ComputationalBiology | 2,211 |
17 | Astronomy, Astrophysics | 1,949 |
18 | Biophysics | 1,941 |
19 | Spectroscopy | 1,797 |
上記の114,431件の中で1,103件が高被引用文献に選ばれている.上位100件に関して,独断で本稿に関係する文献を選び,Table 2にランキング,見出し語,内容の種別,文献の分類,被引用回数,文献番号 [[11, 15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59]をまとめた.以下,ランキングの順位を記して文献を紹介するが,あくまでも統計処理の結果と捉えていただきたい.実際,出版年によって引用される期間が異なる.また,文献の内容によって,引用されやすさも大きく異なる.このようなことからランキングの順位は,文献の甲乙とは必ずしも一致しないことにご注意いただきたい.ただ,本稿の目的であるコンピュータ化学のトレンドは概観できると考える.
Ranking | Heading | Category-I | Category-II | Citation | Ref. |
1 | DFT-D | Methodology | Original Paper | 16,191 | 11 |
2 | AutoDoc Vina | Software | Technical Report | 9,234 | 15 |
4 | Multinwfn | Software | Technical Report | 6,715 | 16 |
5 | CSD | Database | Technical Report | 3,911 | 17 |
8 | Avogadro | Software | Technical Report | 2,699 | 18 |
9 | NWChem | Software | Technical Report | 2,628 | 19 |
11 | Open Babel | Software | Technical Report | 2,486 | 20 |
12 | CHARMM | Software | Technical Report | 2,427 | 21 |
13 | Electrocatalyst | Topics | Review | 2,241 | 22 |
21 | COF | Topics | Review | 1,602 | 23 |
22 | Q-Chem4 | Software | Technical Report | 1,500 | 24 |
24 | ToposPro | Software | Technical Report | 1,481 | 25 |
25 | LIB | Topics | Review | 1,468 | 26 |
27 | NCIPLOT | Software | Technical Report | 1,435 | 27 |
28 | MOF | Topics | Review (Conspectus) | 1,401 | 28 |
29 | Machine learning | Topics | Original Paper | 1,398 | 29 |
34 | SIB | Topics | Review | 1,232 | 30 |
36 | AMER | Software | Original Paper | 1,164 | 31 |
37 | PSC | Topics | Original Paper | 1,158 | 32 |
39 | GPAW | Software | Technical Report | 1,125 | 33 |
40 | GMTKN30 | Database | Original Paper | 1,122 | 34 |
47 | Electrocatalyst | Topics | Review | 958 | 35 |
50 | COVID-19 | Topics | Original Paper | 948 | 36 |
51 | CRYSTAL | Software | Technical Report | 946 | 37 |
52 | PLUMED 2 | Software | Technical Report | 944 | 38 |
53 | PaDEL Descriptor | Software | Technical Report | 940 | 39 |
56 | Quantum simulation | Topics | Review | 898 | 40 |
57 | Gabedit-A | Software | Technical Report | 896 | 41 |
59 | pymatgen | Software | Technical Report | 881 | 42 |
62 | AMBER | Software | Technical Report | 866 | 43 |
63 | QSAR | Methodology | Review | 866 | 44 |
64 | Li-S Battery | Topics | Review | 842 | 45 |
65 | AMBER | Software | Technical Report | 838 | 46 |
67 | Molcas 8 | Software | Technical Report | 820 | 47 |
69 | Jaguar | Software | Technical Report | 765 | 48 |
71 | TDDFT | Methodology | Review | 754 | 49 |
72 | AMOEBA | Methodology | Original Paper | 750 | 50 |
74 | NBO | Methodology | Review | 749 | 51 |
78 | MDAnalysis | Software | Technical Report | 725 | 52 |
80 | ESM | Methodology | Review (Conspectus) | 715 | 53 |
81 | Free energy perturbation | Methodology | Original Paper | 712 | 54 |
88 | QSAR | Methodology | Review (Perspective) | 688 | 55 |
90 | MOF | Topics | Original Paper | 685 | 56 |
96 | DFT | Methodology | Review (Perspective) | 653 | 57 |
97 | Martini model | Methodology | Review (Perspective) | 652 | 58 |
100 | VASP | Methodology | Original Paper | 635 | 59 |
第1位にランキングされた文献は,DFTにおける分散力補正に関するGrimmeらの原著論文 [11]である.DFTの基本定理であるHohenberg-Kohnの定理 [60]が1964年に示され,まず固体物理の分野に取り入れられた.1980-1990年代に,B88交換 [7],LYP相関 [8],PBE交換相関 [61]などの一般化勾配近似(GGA)に基づく汎関数やB3LYP [9, 10],PBE0 [62,63,64,65]などの混成汎関数が提案され,DFTの精度が電子相関を考慮した波動関数理論と遜色が無くなり,量子化学の分野でも瞬く間に普及した.また,Runge-Grossの定理 [66]によりDFTが励起状態にも適用可能であることが示され,更にCasida形式の時間依存DFT (TDDFT)方程式が導かれた [67, 68]ことにより,広く量子化学の分野で用いられるようになった.TDDFTに関するAdamo-Jacqueminの解説 [49]も71位にランキングされている.TDDFTの落とし穴なども示されており,興味深い記事である.DFTにおいて残る問題として2000年代に注目されたのが,水素結合やファンデルワールス力などの弱い相互作用の記述であった.我々の研究 [69, 70]も含めていくつかの理論が提案されたが,実用面などの理由からかGrimmeらのDFT-D法が最も普及し,被引用回数も16,191回と群を抜いている.Table 2に挙げなかったが,DFT-D法に関する文献が他にも高被引用文献にいくつか入っている.第一原理計算のデファクトスタンダードプログラムVASPにDFT-D法が導入されたという文献 [59]も100位である.
DFT汎関数の構築・検証には様々なデータセットが用いられる.これはPopleが1990年ごろに提唱したモデルケミストリーの考え,すなわち,「様々な近似レベルの量子化学計算は十分に較正(キャリブレーション)して応用すべきである」ということに起源がある.そして,G1法 [71]に改良を加えたG2法 [72],さらにG3法 [73]とより厳しい較正が課された.G2およびG3の論文で用いられたデータセットが,汎関数を構築する際の学習データになり,既存の汎関数を検証するテストセットとして用いられるようになった.その後も種々のテストセットが提案され,弱い相互作用に関するHobzaらのS22 [74]およびS66 [75]セットは有名である.DFT-D法もこれらのテストセットによって精度検証が行われてきた.Grimmeらは種々のテストセットをまとめて大規模なテストセット群GMTKN30 [76]を作成した.40位にランキングされた原著論文 [34]では,GMTKN30を用いて47種類の汎関数がテストされている.
DFTの今後の発展に興味のある読者には,96位にランキングされたBurkeによるDFTの展望記事 [57]を薦める.最近,我々は2成分相対論法に基づくDFTについて研究しており,電子密度の描像変化補正(PCC)が重要であることを示している [77,78,79].
2位以降にはソフトウェアの解説記事が多くランキングされている.ソフトウェアを使用した研究が引用するため必然的に被引用数が増えるのであろう.ソフトウェアと言っても,量子化学計算や分子シミュレーションなどを実行するためのプログラムから,特定の演算や処理を行うライブラリ,そして,グラフィカルユーザインターフェイス(GUI)機能などを駆使して入力支援や結果の解析を行うユーティリティなどさまざまである.
量子化学計算プログラムとして,NWChem (9位) [19],Q-Chem 4 (22位) [24],CRYSTAL 14 (51位) [37],Molcas 8 (67位) [47],Jaguar (69位) [48]の記事が見られる.第一原理計算プログラムとして,GPAW (39位) [33]の記事が見られる.分子動力学(MD)シミュレーションプログラムの双璧のCHARMM (12位) [21]とAMBER (65位) [46]も見られる.ドッキングシミュレーションプログラムのAutoDoc Vinaは2位にランキングされている.これらのプログラムの機能や更新内容に興味がある読者はこれらの文献を参考されたい.
我々のグループでも,科学技術振興機構(JST)戦略的創造研究推進事業(CREST)『元素戦略』領域(玉尾皓平研究総括) [80]において,相対論的量子化学計算プログラムRAQET [81]の開発を行った.RAQETプログラムの特長は,無限次2成分相対論(IOTC) [82, 83]法に対する局所ユニタリー変換(LUT) [84, 85]を適用し,さらに分割統治(DC)法 [86,87,88,89,90]を組み合わせることで,一連の計算が線形スケーリングになっていることである [91].RAQETプログラムは,2019年よりアカデミックに公開している [92].
我々のグループでは,文部科学省ポスト「京」開発事業重点課題5 [93]において,大規模量子MD (QMD)シミュレーションプログラムDCDFTBMD [94]の開発を行った.DCDFTBMDプログラムの特長は,密度汎関数強束縛(DFTB)法 [95, 96]にDC法 [86,87,88,89,90]を組み合わせ,さらに超並列環境に適したアルゴリズムを導入していることである [97].DCDFTBMDプログラムは,2018年よりアカデミックに公開しており [98],2021年1月1日現在,世界16ヶ国50グループで利用されている.
画像処理用演算プロセッサ(GPU)の演算資源を活用する技術もこの20年間で大いに注目された.実際,東京工業大学のスーパーコンピュータTSUBAMEにNVIDIA®のGPUが搭載されたことは記憶に新しい.AMBERプログラムをGPU上で実行するための実装を解説した記事が36位 [31]と62位 [43]にランキングされている.我々のグループで開発しているDCDFTBMDプログラム [94]もGPU化に取り組んでいる [97].
量子化学計算プログラムのインターフェイスのGabedit-A (57位) [41],自然結合軌道(NBO)法による化学結合の解析ツール(74位) [51],波動関数の解析ツールMultiwfn (4位) [16]や非共有結合領域の描画ツールNCIPLOT (27位) [27],MDプログラムのインターフェイスPLUMED 2 (52位) [38]や解析ツールMDAnalysis (78位) [52]などの文献が100位までにランキングされていた.
上記のプログラムには様々な理論的手法が実装されている.MDシミュレーションの結果を用いて溶媒和自由エネルギーを算出する自由エネルギー摂動法(81位) [54],MDシミュレーション分極力場の一つであるAMOEBA (72位) [50],生体分子シミュレーションのための粗視化力場のMartiniモデル(97位) [58]などの注目度は高いようである.
3.1.2 インフォマティクス21世紀に入って,機械学習(ML)をはじめとする人工知能(AI)技術が様々な分野を席巻した.ビッグデータを入手しやすい環境が整ったこと,深層学習の登場によって柔軟な表現が可能となったことなどの背景があり,第3次AIブームと言われている.1週間にわたりYouTubeビデオを人工ニューラルネットワークに見せたところ,猫の写真を識別することを学習したという「Googleの猫」のニュースは,この象徴である.MLの普及には,オブジェクト指向の汎用プログラム言語PythonTMが登場したことも大きい.PythonコードのライブラリのNumPy (基本演算),SciPy (科学技術計算),pandas (データ処理・解析),matplotlib (可視化),そして,scikit-learn (機械学習)を用いることで,様々な分野においてMLを用いたデータ処理が可能となる.
科学でいち早くこの波を取り入れようとしたのは,材料科学分野であろう.2011年に当時のオバマ政権主導のもと推進されたマテリアルズゲノムイニシアティブ(MGI)がその火付け役となり,EUのNOMADプロジェクト,スイスのMARVELプロジェクト,中国版MGIなどに拡がった.その後,我が国でも関連した国家プロジェクトがいくつか推し進められている.2015年に始まったJSTさきがけ(PRESTO)『マテリアルズ・インフォマティクス』領域(常行真司研究総括) [100]もその一つであり,私もアドバイザーとして参画してきた.
AI技術には,データベースは不可欠である.材料のデータベースとしてその先駆けはケンブリッジ結晶構造データベース(CSD)である.CSD自体の解説記事 [17]は5位にランキングされている.CSDを用いたトポロジー解析のプログラムToposProの解説記事(24位) [25]も高い被引用回数となっている.マテリアルズインフォマティクス(MI)では,単に材料の結晶構造だけでなく,様々な物性のデータが用いられる.Perssonらによる世界最大規模の材料科学の第一原理計算データベースMaterials Project [101]では,結晶構造に加えて,バンド構造,熱力学量,相図,磁気モーメントなどが収納されている.このデータベースを利活用するPythonコードライブラリがpymatgen (59位) [42]である.
AIブームの波はケモインフォマティクスにも大きな影響を与えた.50年の歴史を持つ定量的構造活性相関(QSAR)は,ケモインフォマティクスにおいて中心的な手法の一つである.63位にランキングされた2010年の総説 [44]では,その成熟した技術を大いに称賛する内容になっている.一方,QSARはその方法論自体に分子構造に由来する記述子を用いるという原則がある.もちろん,分子式(1D),分子構造(2D),立体構造(3D),さらには動的な構造変化(4Dまたは高次元)など,その範囲は拡張されてきた.しかし,MIでは第一原理計算に基づく様々な物理量(非物理量も含む)がデータベース化され,必要に応じて記述子として用いることができる.2014年のQSARに関する展望記事(88位) [55]では,その歴史を振り返るとともに,MLの技術とどのように対峙すべきかが述べられている.結論において,『トムソーヤの冒険』などで知られる米国の小説家Mark Twainの有名な言葉「私の死亡記事は誇張である」("The Report Of My Death Was An Exaggeration")を言い換えて,「QSARの…」と著者が述べている点は興味深い.
AIブームの中,ケモインフォマティクスのプラットフォームも整備された.SMILESをはじめとする様々な分子ファイル形式の変換ツールOpen Babel (11位) [20],種々の計算化学プログラムのクロスプラットフォームとして設計された分子エディタAvogadro (8位) [18],分子記述子・分子指紋を計算するPaDEL Descriptor (53位) [39]などが該当する.
以上のことからも,この20年で最も大きな変革があった化学の分野は,ケモインフォマティクスであることは間違いない.しかし,AIブームの波はさらに量子化学や分子シミュレーション,そして,広く化学分野全体にも影響を及ぼしつつある.Ruppらの速報(29位) [29]では,これまで量子化学計算によってのみ高精度に計算できると思われていた分子の原子化エネルギーがMLによって高速かつ高精度に計算できると報告された.7,165個の有機分子の原子化エネルギー(−800 –−2,000 kcal/mol)に対して,交差検証されたカーネルリッジ回帰で∼10 kcal/mol未満の誤差が報告された.衝撃的なこの結果に対して,精度についての懸念がコメントとして出された [102]が,Ruppらによって正当性が示された [103].
我々のグループでも,DFTで最も寄与が大きい運動エネルギー汎関数を,電子密度の3次微分までを記述子として用いてMLにより構築するスキームを提案した [104].そして,1927年のThomas-Fermi [105, 106]以降90年かけて改良されてきた37個の運動エネルギー汎関数のどれよりも高精度の結果を与えることを示した.また,電子密度,密度勾配,運動エネルギー密度,Hartree-Fock交換エネルギー密度などを記述子として用いることで,CCSD(T)/CBSレベルの相関エネルギーを再現するMLのスキームを提案した [107, 108].私は最近では,冒頭で述べた3つの量子化学の歴史的な区分に加えて,2010年以降を第4期の変革期と捉え,"informatics"(情報学)をキーワードとして挙げている [109].
3.2 応用研究高被引用文献には,これまでに述べたような理論的手法やソフトウェアに関するもの以外に,さまざまな系に計算化学の手法を応用したものも多く含まれる.もちろん,それらの文献における計算化学が占める割合はまちまちである.以下では,計算化学がどのように応用されているかを中心に見ていくとしよう.
3.2.1 リチウムイオン二次電池(LIB)およびポストLIB2019年に吉野彰博士らがノーベル化学賞を受賞したリチウムイオン二次電池(LIB)は,コンピュータ化学の分野でも注目度が高い.LIBの解説記事(25位) [26]では,LIBの歴史的背景と現状,次世代LIB,そして,電池材料設計におけるコンピュータ化学の活用が記されている.次世代LIBの節では,高電位正極としてスピネル型LiMn1.5Ni0.5O4とオリビン型LiMPO4,大容量正極としてxLi2MnO3·(1−x) LiMO2前駆体,シリコン負極,金属リチウム負極などが紹介されている.そして,コンピュータ化学の活用の節では,DFTなどの量子化学計算による材料特性(電圧・結晶構造・リチウム拡散・電子特性・反応性など)評価の実績が述べられ,さらにハイスループットDFT計算によるスクリーニングの例が示されている.これこそが,上記のMaterials Project [101]による成功例である.そして,最後にはハイスループットDFT計算によるスクリーニングと実験による検証結果のフィードバックによる反復法に言及されている.
ナトリウムイオン二次電池(SIB)は,元素戦略的観点からポストLIB候補として注目されている.SIBに関する総説(34位) [30]では,SIBを概観した後,高性能SIBのための正極材料,ナトリウムイオン伝導度の計算化学研究,負極材料,電解質という順で記載されている.注目すべきは,ナトリウムイオン伝導度に関するDFT計算がSIBの特性評価や材料設計で重要な役割を果たしているという点である.実際,電圧,相安定性・イオン移動障壁に関する計算による知見に基づいて,SIBとLIBの比較が行われている.
リチウム硫黄電池は,高い重量エネルギー密度をもち,全固体電池への可能性も注目されているポストLIB候補である.リチウム硫黄電池の正極活物質S8は,放電時には多硫化リチウム(Li2Sx)を経てLi2Sになる.Li2Sx中間体(特にLi2S8やLi2S6)は,従来のLIBで利用してきた有機電解液に溶解するという問題がある.リチウム硫黄電池に関する総説(64位) [45]では,この正極活物質溶解の問題に焦点を当て,実験・計算研究の両面から議論している.
我々のグループでも,京都大学触媒・電池元素戦略研究拠点(ESICB)(田中庸裕拠点長) [110]において,LIBおよびポストLIBに関する理論的研究を行っている.量子化学計算による電解液とキャリアイオンとの相互作用 [111, 112]や濃厚電解液を用いたSIBにおけるキャリアイオン拡散 [113]などを報告している.
3.2.2 ペロブスカイト太陽電池(PSC)有機-無機ハロゲン化物ペロブスカイト太陽電池(PSC)は2009年に宮坂力博士ら [114]によってはじめて報告され,その高い太陽エネルギー変換効率のため注目を集めている.米国エネルギー省(DOE)国立再生可能エネルギー研究所(NREL) [115]によると,2020年1月4日の時点で変換効率が25.5%に達している.ハイブリッドヨウ化鉛PSCにおけるイオン輸送に関する原著論文(37位) [32]では,電流-電圧ヒステリシスや低周波の巨大誘電応答などの異常な動作に寄与する要因として理論・実験の両面からイオン輸送が調査されている.第一原理計算から,ヨウ化メチルアンモニウム鉛(CH3NH3PbI3)において,ヨウ化物イオンが空孔の助けにより容易に移動することを見出している.
我々のグループでもDCDFTBMDプログラム [94]を用いたPSCの理論的研究を行い,光吸収直後の励起子分離 [116],その後のポーラロン形成 [117]に関して報告した.
3.2.3 電極触媒および熱触媒電極触媒に関する総説(13位) [22]では,酸素還元反応(ORR),酸素発生反応(OER),水素発生反応(HER)などのクリーンエネルギー変換反応を対象として,理論的および実験的な観点から電気化学特性と電極触媒活性に迫っている.電極電位を変化させた場合の反応自由エネルギーダイアグラム,酸素や水素の吸着エネルギーとdバンドとの相関関係などが紹介されている.同著者らによるHERに関する総説(47位) [35]では,計算化学の役割がより強調されている.たとえば,DFT計算由来の火山型プロットなどの有用性が示されている.
均一系および不均一系触媒に対しても数多く計算化学による研究がなされてきた.それらの中には,「構造最適化をして,エネルギーダイアグラムを描いて,特定の反応の活性化エネルギーが下がった.これで触媒作用が解明された.」という論調の文献をしばしば目にする.確かに複雑な分子の反応になれば,中間体や遷移状態を求めるだけでそれなりに労力を要し,結果としてそれ以上踏み込んだ議論にならないのも分からなくはない.しかし,得られた計算結果がどの程度真実を再現しているのか,また,そのことをどのようにすれば実験的に検証できるのか,議論すべきである.
Kozuch-Shaikが提案した触媒サイクルに対するエネルギースパンモデルの解説(80位) [53]は,この点に関する一つの解決策を示している.触媒サイクルに対して,計算は状態エネルギー(E表現),実験は速度定数(k表現)を与えるものであるが,遷移状態理論に基づくとこれらは同等の表現であると述べている.オームの法則の類推から,触媒化学の電流に相当する触媒回転頻度(TOF)は,反応メカニズムに依存しない化学ポテンシャルを反応メカニズムや触媒の性質に依存する化学抵抗で割ることで定義される.実際,エネルギースパンモデルではTOFを決定する遷移状態と中間体のエネルギー差と反応自由エネルギーから触媒サイクルの見かけの活性化エネルギーに相当するエネルギースパンを求め,それよりTOFを見積っている.TOFを決定する遷移状態と中間体は隣接する必要がないことから,触媒サイクルには律速段階はなく,むしろ律速状態があるという著者らの主張は興味深い.
我々のグループでも,第一原理計算によるエネルギーダイアグラムだけでなく,速度論解析により温度や圧力に対する依存性まで検討するようにしている [118,119,120].Rh(111)面上の吸着NO分子の昇温脱離スペクトル(TDS)に関する研究 [119]では,吸着エネルギーの被覆率依存性を考慮しないと実験スペクトルを再現できないことを示した.Rh(111)面におけるNO-CO-O2反応に関する研究 [120]では,TOFの温度およびO2分圧依存性を調べた.そして,TOFが最大となる温度が存在すること,全反応速度に対するN+N機構およびN+NO機構の寄与がおよそ720 − 740 Kで切り替わることを明らかにした.
3.2.4 金属有機構造体(MOF)および共有結合性有機構造体(COF)金属有機構造体(MOF),さらに,共有結合性有機構造体(COF)は,この20年で大いに注目された材料である.MOFは,金属と有機化合物のリンカーが周期的につながった多孔質材料である.これらをモジュール式の分子ビルディングブロックと考えると,ほぼ無制限の数のMOFを形成することができ,既報のMOF材料は可能な組み合わせのごく一部にすぎないことになる.MOFに関する原著論文(90位) [56]では,既知のMOFの構造に基づいたビルディングブロックの化学ライブラリから,考えられるすべてのMOFを生成し,それらを迅速にスクリーニングして特定の応用に最適な候補を見つけるための計算アプローチを示している.実際,102個のビルディングブロックのライブラリから,137,953個の仮想的なMOFを生成し,それぞれについて,細孔径分布,表面積,およびメタン貯蔵容量の計算が行われている.そして,既知の材料よりも優れたメタン貯蔵容量が予測される新規MOF材料として300個が提案されている.MLは使われていないが,ハイスループット計算化学スクリーニングと言って良いであろう.
COFに関する総説(21位) [23]では,計算化学の取り扱いの割合は比較的少ない.COFに対する計算化学の適用の多くは構造に関するモデリングが中心であるが,なかには水素吸蔵能などの物性予測を行った理論研究もあると紹介されている.粉末X線回折パターンに対する分子モデリングソフトの活用は,特に複雑な3D COFの場合,構造決定の不確実性を減らすのに役立つと述べられている.結論の最後に,「COF材料の計算モデリングに関する継続的な取り組みは,予測的な方法でCOF材料の特性評価と適用に役立つ情報を提供する」と述べられており,著者らの計算化学に対する期待が伺える.
3.2.5 量子コンピュータ"Quantum simulation"と題する総説(56位) [40]は,33ページに及ぶ量子コンピュータの解説記事である.緒言では量子コンピュータの歴史が述べられ,量子計算が古典計算に対し指数関数的に有効ではないかと推測したFeynmanの1982年の言葉「コンピュータ自体を量子力学的法則に従う量子力学的要素を使って構築しよう」("Let the computer itself be built of quantum mechanical elements which obey quantum mechanical laws.")が紹介されている.続いて,量子計算が必要となる背景および定義が述べられた後に,デジタル型量子計算(DQS)について詳しく解説されている.原子・イオン,核・電子スピン,超伝導回路,光子などを利用する種々の量子コンピュータの得失が述べられている.次に量子計算の応用例が解説されている.そこには,量子化学への応用についても述べられている.たとえば,Aspuru-Guzikらが2005年に行ったDQSを用いたエネルギー計算の研究 [121]が紹介されている.DQSでは,波動関数を2進数ビット文字列(|11010>のような第二量子化の数表示)の重ね合わせに対応させ,初期波動関数を時間発展させて目的波動関数を得る.時間発展は複雑で多くの量子ビット間のユニタリー変換であるが,単一あるいは2つの量子ビットに対するゲートの積で表現できる.エネルギー計算で必要な量子ビット数は基底関数の数に比例して増加し,ゲート数は量子ビット数に応じて多項式的に増加する.そのため,数十または100キュービットの量子計算は古典コンピュータよりも優れた結果を与える.量子コンピュータはハード・ソフトともに進歩しており,今後ますますその勢いは増すであろう.
我々もチェコのグループとの共同研究という形で量子コンピュータに関する研究を行った [122].そこでは,我々が開発した核・電子軌道(NOMO)法 [123,124,125]に対する完全配置間相互作用(FCI)計算に,チェコのグループが開発した量子コンピュータのアルゴリズムを適用した.私自身,これを機に量子コンピュータに興味を持ち,2018年10月には研究室が主催する電子状態理論シンポジウムを「量子コンピュータとその量子化学計算への応用」というトピックスで開催し,4名の新進気鋭の研究者に講演を依頼した [126].2019年には,量子コンピューティング基盤の創出を戦略目標としたJSTさきがけ研究領域 [127]が立ち上がり,量子化学分野の研究者も参画している.電子状態理論シンポジウムの講師で,さきがけ研究者の一人でもある杉﨑研司氏の近著 [128]は,この分野に興味がある研究者にとっての入門書として注目に値する.
3.2.6 新型コロナウイルス(COVID-19)最後に,やはり新型コロナウイルスCOVID-19について触れないわけにはいかない.COVID-19に関連する高被引用文献は5件あった.このうち最も引用数が多い文献(50位) [36]は,台湾の研究者が発表した「重症急性呼吸器症候群コロナウイルス2 (SARS-CoV-2)およびコロナウイルス病-2019 (COVID-19):エピデミックと課題」(Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) and coronavirus disease-2019 (COVID-19): The epidemic and the challenges)というタイトルの原著論文で,実に1年弱で948回引用されている.2020年2月11日に投稿され,翌2月12日に受理されている.この迅速な発表には,2020年1月30日に世界保健機関(WHO)がCOVID-19を国際的に懸念される6番目の公衆衛生上の緊急事態として宣言した背景がある.ただし,この文献はコンピュータ化学とは関係なく,COVID-19の症状や感染拡大などの分析を伝えるものである.
2020年2月21日に投稿され4月21日に受理された原著論文 [129]では,主要なウイルスタンパク質の詳細な3D構造が解明された後は,コンピュータ支援ドラッグデザイン技術を適用して,有望なドラッグ転用候補を迅速に特定することが非常に効率的であると述べられている.そして,2月5日にタンパク質構造データバンク(PDB)に登録された共有結合阻害剤N3と結合したSARS-CoV-2メインプロテアーゼの結晶構造(6LU7)を用いて,承認された薬剤および薬剤候補の仮想ドッキングを実施された.前者は薬物データベースDrugBankを用いて準備され,後者には化合物データベースPubChemの中からロピナビルと類似した構造をもつ化合物が用いられた.ロピナビルとは,HIV-1プロテアーセ阻害剤で,COVID-19の患者に投与して一定の効果が確認された薬剤である.さらに,上位のドッキングヒットに対してはAMBERを用いたMDシミュレーションが行われた後,結合自由エネルギーが見積られた.そして,カルフィルゾミブ,エラバサイクリン,バルルビシン,ロピナビル,エルバスビルなどが,SARS-CoV-2メインプロテアーゼの潜在的な阻害剤であると報告している.
2020年4月7日に投稿され5月1日に受理された原著論文 [130]では,ドッキングシミュレーションプログラムAutoDoc Vinaを用いてSARS-CoV-2の構造・非構造タンパク質部位との分子ドッキングにより潜在的な薬物のスクリーニングが行われた.対象は,一般的な抗ウイルス薬であるリバビリン,レムデシビル,クロロキン,ルテオリン,さらに伝統的な漢方薬で抗ウイルス効果があるスイカズラであった.そして,ルテオリンはSARS-CoV-2のメインプロテアーゼの対象分子と同じ部位に高い親和性で結合すること,クロロキンはメインプロテアーゼに結合することが示された.ただこの論文では,MDシミュレーションによる検証は行われていない.
本稿ではコンピュータ化学に関連した文献を紹介する形でSCCJが歩んできたこの20年を振り返ってみた.まず,分野別の文献数を比較した後,高被引用文献の上位100件のうちのコンピュータ化学に関連した文献を選んで,理論的手法・ソウトウェア・データベースと応用研究に分けて紹介した.
コンピュータ化学の分野にとってソフトウェアが重要であることは,今後も変わらないであろう.ただし,PythonTM言語の普及に見るように,開発環境は大きく変わり,必然的にソフトウェアの使用法も変化するであろう.これまでのような大型のプログラムではなく,単一の処理を目的とした小型のライブラリもGitHubなどを通してますます公開されるであろう.大型プログラムの維持管理は,それに携わる研究者にとって研究者人生に大きく影響するため,これまでもしばしば議論されてきた.ソフトウェアの小型化は,プログラム開発に携わる研究者のマインドに少なからず変化をもたらすであろう.結果として,理論的手法の開発と同時に,その機能を有したソフトウェアを開発者自らが公開できる.このような環境が,理論的手法とソフトウェア開発を行う研究者のモチベーション向上に繋がってくれることを願う.
生物分野,特に薬剤開発においては,COVID-19に対する迅速な対応を見てもわかるように,コンピュータ化学を用いた研究開発のプロトコルはほぼ完成していると言えるであろう.もちろん,人の健康や生命にかかわることなので,予測精度は今後も高めていかなければならない.一方,物質・材料開発におけるコンピュータ化学は,やはり対象に依存したアプローチが必要であろう.私はよく「レシピ」という表現を用いる.汎用性のあるプログラムを使って,標準的なプロトコルに従って研究するが,最後は個々の問題に対応したレシピが必要である.ちょうどガスオーブンや電子レンジが汎用プログラム,煮物や揚げ物の調理方法がプロトコル,しかし,実際にカレーや肉じゃがを作るときにはより詳しいレシピが必要となる.コンピュータ化学に携わる研究者には,質の良い計算化学研究のレシピを数多く作成していただきたい.そして,そのようなレシピ本が書店に並ぶことを期待したい.私の場合,隠し味を探しながらレシピ本を楽しく読むような気がする.
MIをはじめとするMLの利用は今がまさに旬である.MIは,物質・材料開発の標準的なプロトコルとしての地位を築けるか注目したい.MLはその根本が数学,特に数理統計学である.データ整理の基礎知識は,大学生の一般教養として修得すべきである.私が所属する学科でも,そのようなカリキュラムを導入すべく,検討が始まっている.量子コンピューティングは,今後のハードウェア進歩により,ますます発展することが期待され,これからも目が離せない分野である.
最後に,SCCJに所属する一会員として一言.私はSCCJのほかに,日本化学会(CSJ)理論・情報・計算化学(TIC)ディビジョン,理論化学会(JSTC),分子シミュレーション学会(MSSJ)などの関連学会会員でもある.特に,JSTCにおいては,理論化学研究会からの学会化に携わったメンバーの一人である.学会化に際しては,「50年-100年先の学問としての理論化学の将来を考え,分野の次の展開を主導する機能をもたせる」ことを基本方針とした.今後,これらの関連学会が連携をより一層強めることで,分野のさらなる発展につながることを大いに期待したい.
AI | Artificial Intelligence |
B3 | Becke-three-parameter (Hybrid Functional) |
B88 | Becke-88 (Exchange Functional) |
CBS | Complete Basis Set (Limit) |
CCSD(T) | Coupled Cluster with Singles, Doubles, and Perturbative Triples (Method) |
COF | Covalent Organic Framework |
COVID-19 | Coronavirus Disease-2019 |
CREST | Core Research for Evolutional Science and Technology |
CSD | Cambridge Structural Database |
CSJ | Chemical Society of Japan |
CSSJ | Chemical Software Society of Japan |
DC | Divide-and-Conquer (Method) |
DFT | Density Functional Theory |
DFTB | Density Functional Tight-Binding (Method) |
DOE | Department of Energy |
ESICB | Elements Strategy Initiative for Catalysts and Batteries |
FCI | Full Configuration Interaction (Method) |
GGA | Generalized Gradient Approximation |
GMTKN30 | A database for General Main group Thermochemistry, Kinetics, and Non-covalent interactions |
GPU | Graphics Processing Unit |
GUI | Graphical User Interface |
HER | Hydrogen Evolution Reaction |
HIV-1 | Human Immunodeficiency Virus Type 1 |
IOTC | Infinite-Order Two-Component (Relativistic Method) |
JCPE | Japan Chemistry Program Exchange |
JST | Japan Science and Technology Agency |
JSTC | Japan Society of Theoretical Chemistry |
LIB | Lithium-Ion Battery |
LUT | Local Unitary Transformation (Method) |
LYP | Lee-Yang-Parr (Correlation Functional) |
M06-2X | Minnesota-06 (Hybrid Functional) |
MD | Molecular Dynamics |
MGI | Materials Genome Initiative |
MI | Materials Informatics |
ML | Machine Learning |
MOF | Metal Organic Framework |
MSSJ | Molecular Simulation Society of Japan |
NOMAD | Novel Materials Discovery |
NOMO | Nuclear Orbital plus Molecular Orbital (Method) |
NREL | National Renewable Energy Laboratory |
OER | Oxygen Evolution Reaction |
ONIOM | Our own N-layered Integrated molecular Orbital and molecular Mechanics |
ORR | Oxygen Reduction Reaction |
PBE | Perdew-Burke-Ernzerhof (Functional) |
PCC | Picture Change Correction |
PDB | Protein Data Bank |
PRESTO | Precursory Research for Embryonic Science and Technology |
PSC | Perovskite Solar Cell |
QMD | Quantum Molecular Dynamics |
QSAR | Quantitative Structure-Activity Relationship |
RAQET | Relativistic And Quantum Electronic Theory (Program) |
SARS-CoV-2 | Severe Acute Respiratory Syndrome Coronavirus 2 |
SCCJ | Society of Computer Chemistry, Japan |
SIB | Sodium-Ion Battery |
TDDFT | Time-Dependent Density Functional Theory |
TIC | Theoretical Chemistry, Information Chemistry, and Computational Chemistry (Division) |
VASP | Vienna Ab initio Simulation Package |
WHO | World Health Organization |