配座のクラスタリング:類似した異性体構造の分類
【配座クラスタリングとは】
配座異性体をいくつかの意味のあるグループに分類することを、配座クラスタリングと呼びます。
例えば、構造パラメーターを指標として構造的に似ている配座をグループ分けすることで、最安定構造やX線結晶構造に近い配座がどの程度のエネルギーの範囲でどのくらい存在するかを見積もることが出来ます。
配座クラスタリングを行うためには、配座異性体を関係付ける指標が必要となります。ある配座に対してどの配座がどのくらい似ているかを評価する指標は配座間距離と呼ばれ、CONFLEXでは構造パラメーターとして2面角かデカルト座標のRMSD値を選択してクラスタリングすることが出来ます。以下の例では、2面角のRMSD値を配座間距離としたクラスタリングを示します。
【n-pentaneの全配座異性体のクラスタリング】
n-pentaneの全ての配座異性体についてクラスタリングを行う方法を説明します。
まず、n-pentaneの配座探索を行います。
n-pentane.mol
n-pentane 17 16 0 0 0 0 0 0 0 0999 V2000 -1.2316 -1.9901 -0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0.0874 -1.2286 -0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -0.1902 0.2689 -0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.1288 1.0304 -0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0.8512 2.5279 -0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -1.0288 -3.0844 -0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0 -1.8145 -1.7213 0.9093 H 0 0 0 0 0 0 0 0 0 0 0 0 -1.8151 -1.7211 -0.9088 H 0 0 0 0 0 0 0 0 0 0 0 0 0.6703 -1.4973 -0.9093 H 0 0 0 0 0 0 0 0 0 0 0 0 0.6709 -1.4976 0.9088 H 0 0 0 0 0 0 0 0 0 0 0 0 -0.7731 0.5377 0.9093 H 0 0 0 0 0 0 0 0 0 0 0 0 -0.7737 0.5379 -0.9088 H 0 0 0 0 0 0 0 0 0 0 0 0 1.7117 0.7617 -0.9093 H 0 0 0 0 0 0 0 0 0 0 0 0 1.7123 0.7614 0.9088 H 0 0 0 0 0 0 0 0 0 0 0 0 1.8151 3.0844 -0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0 0.2683 2.7967 0.9093 H 0 0 0 0 0 0 0 0 0 0 0 0 0.2677 2.7969 -0.9088 H 0 0 0 0 0 0 0 0 0 0 0 0 1 2 1 0 1 6 1 0 1 7 1 0 1 8 1 0 2 3 1 0 2 9 1 0 2 10 1 0 3 4 1 0 3 11 1 0 3 12 1 0 4 5 1 0 4 13 1 0 4 14 1 0 5 15 1 0 5 16 1 0 5 17 1 0 M END
[Interfaceから実行する場合]
n-pentane.molファイルをCONFLEX Interfaceを用いて開きます。
Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログの
をクリックします。詳細設定ダイアログの「General settings」ダイアログにある「Calculation Type:」のプルダウンメニューから「Conformation Search」を選択します。
次に、詳細設定ダイアログの「Conforamtion Search」ダイアログにある「Search Limit:」の値を「4.0」に変更します。
設定が終わりましたら、 をクリックします。
ここで、「CHECK=(TORSION,NOENERGY)」キーワードを追加します。本キーワードは、配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用することを意味します。
設定が終わりましたら
をクリックしてください。計算が始まります。[コマンドラインから実行する場合]
計算設定は、n-pentane.iniファイルにキーワードを記述することで行います。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY)
それぞれのキーワードの意味は、次の通りです。
キーワード | 説明 |
---|---|
MMFF94S | MMFF94s力場を使う |
CONFLEX | 配座空間探索を行なう |
SEL=4.0 | 配座探索のエネルギー上限値は、4.0 kcal/molとする |
CHECK=(TORSION,NOENERGY) | 配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用する |
n-pentane.molとn-pentane.iniの二つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\flex9a_win_x64.exe -par C:\CONFLEX\par n-pentaneenter
上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
計算の終了後、11種類の配座異性体が得られます。それぞれの配座異性体でのC-C-C-C2面角の値は以下の通りです。
表:各配座のC-C-C-C2面角
No. | Steric E | Dihedral angle | |
---|---|---|---|
1-2-3-4 | 2-3-4-5 | ||
1 | -5.2718 | -180.00 | 180.00 |
2 | -4.4419 | 175.69 | 65.65 |
3 | -4.4419 | -65.65 | -175.69 |
4 | -4.4419 | 65.65 | 175.69 |
5 | -4.4419 | -175.69 | -65.65 |
6 | -3.8487 | 60.27 | 60.27 |
7 | -3.8487 | -60.27 | -60.27 |
8 | -1.5718 | -64.48 | 95.34 |
9 | -1.5718 | 95.34 | -64.48 |
10 | -1.5718 | -95.34 | 64.48 |
11 | -1.5718 | 64.48 | -95.34 |
次に、得られた配座異性体をC2-C3結合周りの2面角を配座間距離の指標としてクラスタリングします。
[Interfaceから実行する場合]
n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログの
その後、詳細設定ダイアログの をクリックします。
ダイアログの内容を下記のように編集し
をクリックします。計算が始まります。それぞれのキーワードの意味は、次の通りです。
キーワード | 説明 |
---|---|
NOSEARCH | 配座探索を行わない |
CLUSTER | クラスタリングの実行 |
CCLUS_DISTANCE=TORSION | 配座間距離の算出に2面角を使用する |
CCLUS_LIMIT=10.0 | 配座間距離が10.0以内の配座を一つのグループにする指定 |
CCLUS_NREF=1 | クラスタリングの指標とする結合の数 |
CLUS_IREF=(2,3) | クラスタリングの指標とする結合の番号 |
[コマンドラインから実行する場合]
n-pentane.iniファイル内容を以下の通り編集します。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY) NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=10.0 CCLUS_NREF=1 CCLUS_IREF=(2,3)
それぞれのキーワードの意味は、次の通りです。
キーワード | 説明 |
---|---|
NOSEARCH | 配座探索を行わない |
CLUSTER | クラスタリングの実行 |
CCLUS_DISTANCE=TORSION | 配座間距離の算出に2面角を使用する |
CCLUS_LIMIT=10.0 | 配座間距離が10.0以内の配座を一つのグループにする指定 |
CCLUS_NREF=1 | クラスタリングの指標とする結合の数 |
CLUS_IREF=(2,3) | クラスタリングの指標とする結合の番号 |
n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\flex9a_win_x64.exe -par C:\CONFLEX\par n-pentaneenter
上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
計算の終了後、クラスタリングの結果が「.clu」という拡張子の付いたファイルに出力されます。 このファイルでは、最初に配座数やクラスタリングの指標となる2面角のインデックスなどの情報が表示されます。
=-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-= CONFLEX CONFORMATIONAL CLUSTERING FILE =-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-= ============================================================================== # CLUSTERING INFORMATION ============================================================================== CLUSTERING METHOD: SINGLE LINKAGE NUMBER OF CONFORMERS CLUSTERED = 11 CONFORMERS (TOTAL 11 CONFORMERS) DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE DISTANCE DEFINITIONS: 1 TORSIONS 1: 1- 2- 3- 4 ==============================================================================
次に、各配座間距離の一覧が出力されます。
ここで、「SORTED NUMBER」はエネルギーの安定な順、「CID NUMBER」は配座探索中に見出された順に対応します。この出力から、例えば4番と9番の配座のC1-C2-C3-C4の2面角の差が1.1717であることがわかります。
============================================================================== # DISTANCE MATRIX ELEMENTS ============================================================================== NUMBER OF DISTANCE MATIRX ELEMENTS = 55 SORTED NUMBER CID NUMBER DISTANCE ------------------ ------------------ ---------------------------- I J I J RMSD MAXD DRMSD 4 9 3 9 1.1717 -1.1717 0.0000 3 8 2 6 1.1717 1.1717 0.0000 6 9 7 9 4.2046 4.2046 3.0329 7 8 8 6 4.2046 -4.2046 0.0000 1 2 1 5 4.3141 -4.3141 0.1095
最後に、設定した閾値(CCLUS_LIMIT=10.0)に対応したクラスタリングの結果が出力されます。ここで出力されている番号はCID NUMBERで、エネルギーの低い順に出力されます。
============================================================================== # RESULT - 1 IN CID NUMBER # MIN= 1, MAX= 3, AVERAGE= 2.00, DISPERSION= 5.640 ============================================================================== DISTANCE THRESHOLD= 10.00 NCLUSTERS= 5 SIZE= 3 1 5 4 SIZE= 3 2 8 6 SIZE= 3 3 7 9 SIZE= 1 11 SIZE= 1 10 ==============================================================================
今度は、同じ配座探索の結果を用いて、2つのC-C-C-C2面角を指標にしたクラスタリングを行います。
[Interfaceから実行する場合]
n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログの
その後、詳細設定ダイアログの をクリックします。
ダイアログの内容を下記のように編集し
をクリックします。計算が始まります。
ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。
[コマンドラインから実行する場合]
n-pentane.iniファイル内容を以下の通り編集します。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY) NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=70.0 CCLUS_NREF=2 CCLUS_IREF=(2,3) CCLUS_IREF=(3,4)
ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。
n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\flex9a_win_x64.exe -par C:\CONFLEX\par n-pentaneenter
上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
設定の変更によって、各配座間距離は以下のように変わります。
============================================================================== # CLUSTERING INFORMATION ============================================================================== CLUSTERING METHOD: SINGLE LINKAGE NUMBER OF CONFORMERS CLUSTERED = 11 CONFORMERS (TOTAL 11 CONFORMERS) DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE DISTANCE DEFINITIONS: 2 TORSIONS 1: 1- 2- 3- 4 2: 2- 3- 4- 5 ============================================================================== # DISTANCE MATRIX ELEMENTS ============================================================================== NUMBER OF DISTANCE MATIRX ELEMENTS = 55 SORTED NUMBER CID NUMBER DISTANCE ------------------ ------------------ ---------------------------- I J I J RMSD MAXD DRMSD 9 11 9 11 30.8622 30.8622 0.0000 8 10 6 10 30.8622 -30.8622 0.0000 4 9 3 9 62.9213 88.9765 32.0591 3 8 2 6 62.9213 -88.9765 0.0000 2 10 5 10 62.9213 88.9765 0.0000 5 11 4 11 62.9213 -88.9765 0.0000
閾値を70.0(CCLUS_LIMIT=70.0)に設定していますので、CID NUMBER 5,10,2,6および3,9,4,11がそれぞれ同じグループに分類されます。
============================================================================== # RESULT - 1 IN CID NUMBER # MIN= 1, MAX= 4, AVERAGE= 2.00, DISPERSION= 6.840 ============================================================================== DISTANCE THRESHOLD= 70.00 NCLUSTERS= 5 SIZE= 1 1 SIZE= 4 5 10 2 6 SIZE= 4 3 9 4 11 SIZE= 1 7 SIZE= 1 8 ==============================================================================
【β-Glucoseの全配座異性体のクラスタリング】
β-Glucoseの全配座異性体について、6員環部分の2面角から配座感距離を求めクラスタリングを行います。
入力ファイルclus-BGLU.mol、clus-BGLU.ini、clus-BGLU.fxfファイルを一つのフォルダに格納します。
各ファイルは、CONFLEXのインストールフォルダ内のSample_Filesフォルダにあります (Sample_Files\CONFLEX\clustering\b-glucose)。
[Interfaceから実行する場合]
clus-BGLU.molファイルをCONFLEX Interfaceを用いて開きます。
Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログの
をクリックします。その後、詳細設定ダイアログの
をクリックします。計算設定のキーワードが記述されたダイアログが表示されます。下記のようにキーワードを追加して
をクリックしてください。計算が始まります。[コマンドラインから実行する場合]
計算設定は、clus-BGLU.iniファイルにすでに記述されています。
clus-BGLU.iniファイル
MMFF94S CONFLEX NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=10.0 CCLUS_NREF=6 CCLUS_IREF=(1,2) CCLUS_IREF=(2,10) CCLUS_IREF=(10,11) CCLUS_IREF=(11,3) CCLUS_IREF=(3,4) CCLUS_IREF=(4,1)
clus-BGLU.molとclus-BGLU.ini、clus-BGLU.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\flex9a_win_x64.exe -par C:\CONFLEX\par clus-BGLUenter
上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
クラスタリングの結果、環の配座の違いにより7つのグループに分類されました。
============================================================================== # RESULT - 1 IN CID NUMBER # MIN= 1, MAX= 122, AVERAGE= 31.00, DISPERSION= 2499.816 ============================================================================== DISTANCE THRESHOLD= 10.00 NCLUSTERS= 7 SIZE= 122 22 3 1 28 21 4 12 13 2 59 14 127 40 35 64 131 20 68 57 33 74 58 82 88 135 75 54 106 56 34 92 5 55 65 97 139 67 144 90 102 116 133 39 101 72 132 111 83 79 94 134 161 45 46 103 86 151 100 167 80 118 108 121 145 73 155 149 173 126 95 140 49 113 87 66 51 107 62 98 52 125 61 142 124 156 141 112 168 53 123 89 117 166 122 160 60 105 154 93 148 170 78 150 115 96 176 153 171 157 143 165 162 169 164 175 158 163 177 172 182 178 180 SIZE= 33 76 31 29 99 137 104 119 109 26 114 17 188 9 23 38 192 6 77 146 37 91 110 210 48 44 174 43 15 69 42 181 203 47 SIZE= 31 50 16 30 130 138 85 71 84 147 159 129 41 152 136 179 120 36 186 70 25 128 195 81 185 184 201 63 191 8 194 193 SIZE= 4 32 24 10 7 SIZE= 26 205 214 190 197 208 207 218 189 202 212 187 198 183 199 216 211 209 220 217 204 215 196 213 206 200 219 SIZE= 3 27 19 11 SIZE= 1 18 ==============================================================================
各グループの最安定構造を示します。