結晶構造のクラスタリング
結晶構造探索により得られた構造は、粉末X線回折パターンの類似度に基づいて、グループ分けすることできます。同じグループに所属する結晶構造は、似た原子配置を示すと考えらえれます。
ここでは、 「構造式からの結晶構造探索」で行った、5-Cyano-3-hydroxythiophene(II)の結晶構造探索の結果を用いて、得られた構造のグループ分けを行います。なお、類似度の計算はGELDER法(R. de Gelder et al, J Comput Chem 22: 273–289, 2001.)を採用しています。
実行済みの結晶構造探索結果を用いてグループ分けを行う場合、「結晶構造探索計算の再実行」を利用します。
[Interfaceから実行した場合]
計算に利用したII-c2.molとII-c2.iniファイル、計算後に出力されたII-c2.cptファイルを同じフォルダに格納します。次に、II-c2.molをCONFLEX Interfaceを用いて開きます。
Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログの
をクリックします。詳細設定ダイアログが表示されます。結晶構造探索計算を再実行するために、詳細設定ダイアログの「Crystal Search」ダイアログの下部にある「Restart calculation」チェックボックスにチェックを入れてください。
次に、「Crystal Search」ダイアログの「Grouping」タブを選択します。
まず、結晶構造のグループ分けを行うために「Crystal Structure Grouping」チェックボックスにチェックを入れます。また、「Energy Limit (kcal/mol):」を2.0にします。これは、最小結晶エネルギー値から、2.0kcal/mol以内の構造を対象に、グループ分けを行うことを設定しています。「Grouping Limit:」の0.8は、その値よりも大きい粉末X線回折パターンの類似度値を持つ結晶構造群をグループ化するように設定しています。本値の最大は1であり、この場合、比較する2つの回折パターンが完全に一致することを意味します。この値を変更することで、グループ化される結晶構造間の類似度が変わります。
設定が終わりましたら
II分子の結晶構造探索計算を から実行し、手動にてキーワードを追加している場合は、 をクリックして、同じキーワードを追加した後、 をクリックしてください。
探索に関する設定が一致していないと、探索計算を正しく再実行できない場合があります。
なお、再実行を利用せず、結晶構造探索計算とグループ分けを行いたい場合、「Crystal Search」ダイアログの「Search」タブでの探索計算設定と併せて、「Grouping」タブで各種設定を行ってください。
[コマンドラインから実行した場合]
計算に利用したII-c2.molとII-c2.iniファイル、計算後に出力されたII-c2.cptファイルを同じフォルダに格納します。II-c2.cptファイルの拡張子をrstに変更し、II-c2.rstファイルを作成します。
次に、iniファイル内に「CSP_RESTART」キーワードとグループ分けに関する計算設定キーワードを設定します。
II-c2.iniファイル
MMFF94S
CRYSTAL_SEARCH
CSP_SPGP=(P21/C,P-1,C2/C,P212121,P21,PBCA,PNA21,PNMA,CC,P1)
CSP_ROT_MODE=RANDOM
CSP_AUS_MODE=RANDOM
CSP_MAX_CRYSTAL=10000
CRYSTAL_OPTIMIZATION=ALL
CSP_RESTART
CSP_GROUPING=YES
CSP_GROUPING_ELIMIT=2.0
CSP_GROUPING_GLIMIT=0.8
赤色で示した部分が、追加したキーワードになります。
「CSP_GROUPING=YES」は、結晶構造のグループ分けを行うためのキーワードです。
「CSP_GROUPING_ELIMIT=2.0」は、最小結晶エネルギー値から、2.0kcal/mol以内の構造を対象に、グループ分けを行うことを設定しています。
また、「CSP_GROUPING_GLIMIT=0.8」は、0.8よりも大きい粉末X線回折パターンの類似度値を持つ結晶構造群をグループ化するように設定しています。本値の最大は1であり、この場合、比較する2つの回折パターンが完全に一致することを意味します。この値を変更することで、グループ化される結晶構造間の類似度が変わります。
なお、探索に関する設定は、変更しないように注意してください。設定が一致していないと、正しく再実行ができない場合があります。
入力ファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\flex9a_win_x64.exe -par C:\CONFLEX\par II-c2enter
上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
なお、再実行を利用せず、結晶構造探索計算とグループ分けを行いたい場合、II-c2.iniから「CSP_RESTART」を削除したiniファイルを用意します。実行時、rstファイルは必要ありません。
計算結果
実行後、出力されるII-c2.cspファイル内の「*** GROUPS OF PREDICTED CRYSTAL STRUCTURES:」部に、結晶構造探索計算より見つかったIIの結晶構造をグループ分けした結果が出力されます。
*** GROUPS OF PREDICTED CRYSTAL STRUCTURES: IDX CID E_RNK CRYST INTRA INTER VOL DES A B C ALPHA BETA GAMMA SPGP NCALMOL NCALATM DMAX NNEV GID 268 28 10 -15.2940 4.7263 -20.0203 612.5302 1.3554 8.3759 18.2972 8.8552 90.0000 26.8303 90.0000 P21/C 365 4015 20.00 0 1 275 47 11 -15.2939 4.7218 -20.0156 612.7425 1.3549 4.0159 18.2092 9.2919 90.0000 64.3935 90.0000 P21/C 357 3927 20.00 0 1 2886 3616 116 -13.8613 4.6233 -18.4847 616.0985 1.3476 9.2116 4.0045 16.7017 90.0000 90.0000 90.0000 P212121 357 3927 20.00 0 1 3011 155 117 -13.8590 4.6056 -18.4646 616.7098 1.3462 3.9972 9.2213 16.7316 90.0000 90.0000 90.0000 P21/C 361 3971 20.00 0 1 3149 2017 126 -13.7981 4.7360 -18.5342 1323.1051 1.2550 8.3032 21.6640 8.3517 90.0000 118.2722 90.0000 C2/C 349 3839 20.00 0 1 2230 5291 79 -14.1961 4.6744 -18.8705 329.3236 1.2605 6.8715 8.3276 5.7551 90.0000 90.0000 90.0000 P21 339 3729 20.00 0 2 2347 3628 84 -14.1273 4.6739 -18.8012 663.6963 1.2509 5.7731 8.3220 13.8144 90.0000 90.0000 90.0000 P212121 329 3619 20.00 0 2 2368 8317 87 -14.1173 4.6624 -18.7798 663.4689 1.2513 13.7941 8.3164 5.7835 90.0000 90.0000 90.0000 PNA21 325 3575 20.00 1 2 2375 62 88 -14.1158 4.6803 -18.7961 652.6047 1.2722 8.3470 4.0014 21.6032 90.0000 115.2492 90.0000 P21/C 348 3828 20.00 0 3 2397 7 89 -14.1142 4.6720 -18.7862 652.8180 1.2718 10.4957 3.9890 16.6948 90.0000 69.0638 90.0000 P21/C 350 3850 20.00 0 3 3099 3753 123 -13.8057 4.6746 -18.4803 658.9316 1.2600 4.0148 19.6744 8.3420 90.0000 90.0000 90.0000 P212121 349 3839 20.00 0 3 3139 7266 125 -13.7995 4.6615 -18.4610 659.0917 1.2597 19.7653 8.3393 3.9986 90.0000 90.0000 90.0000 PNA21 343 3773 20.00 1 3 125 3622 4 -15.6125 4.7219 -20.3344 614.2783 1.3515 4.3718 19.8181 7.0899 90.0000 90.0000 90.0000 P212121 373 4103 20.00 0 4 205 404 6 -15.5986 4.7162 -20.3147 614.9313 1.3501 4.3234 7.1069 20.0163 90.0000 89.0064 90.0000 P21/C 371 4081 20.00 0 4 220 51 7 -15.4618 4.7170 -20.1789 618.7977 1.3417 4.3746 7.0720 20.4156 90.0000 78.4425 90.0000 P21/C 374 4114 20.00 0 4 409 7257 13 -15.1231 4.7333 -19.8564 631.5499 1.3146 20.5400 4.3360 7.0912 90.0000 90.0000 90.0000 PNA21 369 4059 20.00 0 4 1178 288 36 -14.5729 4.6738 -19.2467 636.8605 1.3036 7.2675 8.3269 10.8484 90.0000 75.9503 90.0000 P21/C 365 4015 20.00 0 5 1711 2255 56 -14.3662 4.7116 -19.0778 1229.9412 1.3500 14.4499 8.1645 11.3343 90.0000 113.1034 90.0000 C2/C 374 4114 20.00 0 5 1866 169 62 -14.3340 4.7252 -19.0592 640.2877 1.2966 5.7650 8.3713 14.5549 90.0000 114.2815 90.0000 P21/C 363 3993 20.00 0 5
各グループは空行で分けられて出力されており、それぞれのグループには番号がつけられます(GID)。例えば、グループ4は、エネルギー順位4、6、7、13の構造が含まれており、それぞれが似た原子配置を持つことがわかります(下図)。