配座のクラスタリング:類似した異性体構造の分類
【配座クラスタリングとは】
            配座異性体をいくつかの意味のあるグループに分類することを、配座クラスタリングと呼びます。
            例えば、構造パラメーターを指標として構造的に似ている配座をグループ分けすることで、最安定構造やX線結晶構造に近い配座がどの程度のエネルギーの範囲でどのくらい存在するかを見積もることが出来ます。
            配座クラスタリングを行うためには、配座異性体を関係付ける指標が必要となります。ある配座に対してどの配座がどのくらい似ているかを評価する指標は配座間距離と呼ばれ、CONFLEXでは構造パラメーターとして2面角かデカルト座標のRMSD値を選択してクラスタリングすることが出来ます。以下の例では、2面角のRMSD値を配座間距離としたクラスタリングを示します。
          
【n-pentaneの全配座異性体のクラスタリング】
            n-pentaneの全ての配座異性体についてクラスタリングを行う方法を説明します。
            まず、n-pentaneの配座探索を行います。
          
n-pentane.mol
n-pentane
 17 16  0  0  0  0  0  0  0  0999 V2000
   -1.2316   -1.9901   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.0874   -1.2286   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.1902    0.2689   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.1288    1.0304   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.8512    2.5279   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -1.0288   -3.0844   -0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.8145   -1.7213    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.8151   -1.7211   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.6703   -1.4973   -0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.6709   -1.4976    0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7731    0.5377    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7737    0.5379   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.7117    0.7617   -0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.7123    0.7614    0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.8151    3.0844   -0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.2683    2.7967    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.2677    2.7969   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  1  0      
  1  6  1  0      
  1  7  1  0      
  1  8  1  0      
  2  3  1  0      
  2  9  1  0      
  2 10  1  0      
  3  4  1  0      
  3 11  1  0      
  3 12  1  0      
  4  5  1  0      
  4 13  1  0      
  4 14  1  0      
  5 15  1  0      
  5 16  1  0      
  5 17  1  0      
M  END
          [Interfaceから実行する場合]
n-pentane.molファイルをCONFLEX Interfaceを用いて開きます。
          Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのをクリックします。
          詳細設定ダイアログの「General settings」ダイアログにある「Calculation Type:」のプルダウンメニューから「Conformation Search」を選択します。
          
            次に、詳細設定ダイアログの「Conforamtion Search」ダイアログにある「Search Limit:」の値を「4.0」に変更します。
            設定が終わりましたら、をクリックします。
          
          
            をクリックすると、計算設定のキーワードが記述されたダイアログが表示されます。
            ここで、「CHECK=(TORSION,NOENERGY)」キーワードを追加します。本キーワードは、配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用することを意味します。
          
          設定が終わりましたらをクリックしてください。計算が始まります。
[コマンドラインから実行する場合]
計算設定は、n-pentane.iniファイルにキーワードを記述することで行います。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY)
それぞれのキーワードの意味は、次の通りです。
| キーワード | 説明 | 
|---|---|
| MMFF94S | MMFF94s力場を使う | 
| CONFLEX | 配座空間探索を行なう | 
| SEL=4.0 | 配座探索のエネルギー上限値は、4.0 kcal/molとする | 
| CHECK=(TORSION,NOENERGY) | 配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用する | 
n-pentane.molとn-pentane.iniの二つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\conflex-10a.exe  -par  C:\CONFLEX\par  n-pentaneenter
          上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
計算の終了後、11種類の配座異性体が得られます。それぞれの配座異性体でのC-C-C-C2面角の値は以下の通りです。
表:各配座のC-C-C-C2面角
| No. | Steric E | Dihedral angle | |
|---|---|---|---|
| 1-2-3-4 | 2-3-4-5 | ||
| 1 | -5.2718 | -180.00 | 180.00 | 
| 2 | -4.4419 | 175.69 | 65.65 | 
| 3 | -4.4419 | -65.65 | -175.69 | 
| 4 | -4.4419 | 65.65 | 175.69 | 
| 5 | -4.4419 | -175.69 | -65.65 | 
| 6 | -3.8487 | 60.27 | 60.27 | 
| 7 | -3.8487 | -60.27 | -60.27 | 
| 8 | -1.5718 | -64.48 | 95.34 | 
| 9 | -1.5718 | 95.34 | -64.48 | 
| 10 | -1.5718 | -95.34 | 64.48 | 
| 11 | -1.5718 | 64.48 | -95.34 | 
          次に、得られた配座異性体をC2-C3結合周りの2面角を配座間距離の指標としてクラスタリングします。
[Interfaceから実行する場合]
            n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのをクリックします。
            その後、詳細設定ダイアログのをクリックします。
          
          ダイアログの内容を下記のように編集しをクリックします。計算が始まります。
          それぞれのキーワードの意味は、次の通りです。
| キーワード | 説明 | 
|---|---|
| NOSEARCH | 配座探索を行わない | 
| CLUSTER | クラスタリングの実行 | 
| CCLUS_DISTANCE=TORSION | 配座間距離の算出に2面角を使用する | 
| CCLUS_LIMIT=10.0 | 配座間距離が10.0以内の配座を一つのグループにする指定 | 
| CCLUS_NREF=1 | クラスタリングの指標とする結合の数 | 
| CLUS_IREF=(2,3) | クラスタリングの指標とする結合の番号 | 
[コマンドラインから実行する場合]
n-pentane.iniファイル内容を以下の通り編集します。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY) NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=10.0 CCLUS_NREF=1 CCLUS_IREF=(2,3)
それぞれのキーワードの意味は、次の通りです。
| キーワード | 説明 | 
|---|---|
| NOSEARCH | 配座探索を行わない | 
| CLUSTER | クラスタリングの実行 | 
| CCLUS_DISTANCE=TORSION | 配座間距離の算出に2面角を使用する | 
| CCLUS_LIMIT=10.0 | 配座間距離が10.0以内の配座を一つのグループにする指定 | 
| CCLUS_NREF=1 | クラスタリングの指標とする結合の数 | 
| CLUS_IREF=(2,3) | クラスタリングの指標とする結合の番号 | 
n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\conflex-10a.exe   -par   C:\CONFLEX\par   n-pentaneenter
          上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
計算の終了後、クラスタリングの結果が「.clu」という拡張子の付いたファイルに出力されます。 このファイルでは、最初に配座数やクラスタリングの指標となる2面角のインデックスなどの情報が表示されます。
=-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-=
     CONFLEX CONFORMATIONAL CLUSTERING FILE
=-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-=
==============================================================================
# CLUSTERING INFORMATION
==============================================================================
CLUSTERING METHOD: SINGLE LINKAGE
NUMBER OF CONFORMERS CLUSTERED =     11 CONFORMERS (TOTAL      11 CONFORMERS)
DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE
DISTANCE DEFINITIONS:      1 TORSIONS
     1:    1-   2-   3-   4
==============================================================================
          
            次に、各配座間距離の一覧が出力されます。
            ここで、「SORTED NUMBER」はエネルギーの安定な順、「CID NUMBER」は配座探索中に見出された順に対応します。この出力から、例えば4番と9番の配座のC1-C2-C3-C4の2面角の差が1.1717であることがわかります。
          
==============================================================================
# DISTANCE MATRIX ELEMENTS
==============================================================================
NUMBER OF DISTANCE MATIRX ELEMENTS =     55
       SORTED NUMBER        CID NUMBER                   DISTANCE         
    ------------------  ------------------    ----------------------------
           I       J           I       J        RMSD      MAXD     DRMSD
           4       9           3       9        1.1717   -1.1717   0.0000
           3       8           2       6        1.1717    1.1717   0.0000
           6       9           7       9        4.2046    4.2046   3.0329
           7       8           8       6        4.2046   -4.2046   0.0000
           1       2           1       5        4.3141   -4.3141   0.1095
          最後に、設定した閾値(CCLUS_LIMIT=10.0)に対応したクラスタリングの結果が出力されます。ここで出力されている番号はCID NUMBERで、エネルギーの低い順に出力されます。
==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=     3, AVERAGE=    2.00, DISPERSION=     5.640
==============================================================================
DISTANCE THRESHOLD=   10.00
NCLUSTERS=     5
SIZE=     3
           1           5           4
SIZE=     3
           2           8           6
SIZE=     3
           3           7           9
SIZE=     1
          11
SIZE=     1
          10
==============================================================================
          今度は、同じ配座探索の結果を用いて、2つのC-C-C-C2面角を指標にしたクラスタリングを行います。
[Interfaceから実行する場合]
            n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのをクリックします。
            その後、詳細設定ダイアログのをクリックします。
          
          ダイアログの内容を下記のように編集しをクリックします。計算が始まります。
          
            ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
            また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。
          
[コマンドラインから実行する場合]
n-pentane.iniファイル内容を以下の通り編集します。
n-pentane.iniファイル
MMFF94S CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY) NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=70.0 CCLUS_NREF=2 CCLUS_IREF=(2,3) CCLUS_IREF=(3,4)
            ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
            また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。
          
n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\conflex-10a.exe   -par   C:\CONFLEX\par   n-pentaneenter
          上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
設定の変更によって、各配座間距離は以下のように変わります。
==============================================================================
# CLUSTERING INFORMATION
==============================================================================
CLUSTERING METHOD: SINGLE LINKAGE
NUMBER OF CONFORMERS CLUSTERED =     11 CONFORMERS (TOTAL      11 CONFORMERS)
DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE
DISTANCE DEFINITIONS:      2 TORSIONS
       1:    1-   2-   3-   4
       2:    2-   3-   4-   5
==============================================================================
# DISTANCE MATRIX ELEMENTS
==============================================================================
NUMBER OF DISTANCE MATIRX ELEMENTS =     55
       SORTED NUMBER        CID NUMBER                   DISTANCE         
    ------------------  ------------------    ----------------------------
           I       J           I       J        RMSD      MAXD     DRMSD
           9      11           9      11       30.8622   30.8622   0.0000
           8      10           6      10       30.8622  -30.8622   0.0000
           4       9           3       9       62.9213   88.9765  32.0591
           3       8           2       6       62.9213  -88.9765   0.0000
           2      10           5      10       62.9213   88.9765   0.0000
           5      11           4      11       62.9213  -88.9765   0.0000
          閾値を70.0(CCLUS_LIMIT=70.0)に設定していますので、CID NUMBER 5,10,2,6および3,9,4,11がそれぞれ同じグループに分類されます。
==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=     4, AVERAGE=    2.00, DISPERSION=     6.840
==============================================================================
DISTANCE THRESHOLD=   70.00
NCLUSTERS=     5
SIZE=     1
           1
SIZE=     4
           5          10           2           6
SIZE=     4
           3           9           4          11
SIZE=     1
           7
SIZE=     1
           8
==============================================================================
          【β-Glucoseの全配座異性体のクラスタリング】
β-Glucoseの全配座異性体について、6員環部分の2面角から配座感距離を求めクラスタリングを行います。
          
            入力ファイルclus-BGLU.mol、clus-BGLU.ini、clus-BGLU.fxfファイルを一つのフォルダに格納します。
            各ファイルは、CONFLEXのインストールフォルダ内のSample_Filesフォルダにあります (Sample_Files\CONFLEX\clustering\b-glucose)。
          
[Interfaceから実行する場合]
clus-BGLU.molファイルをCONFLEX Interfaceを用いて開きます。
          Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのをクリックします。
          その後、詳細設定ダイアログのをクリックします。計算設定のキーワードが記述されたダイアログが表示されます。
          下記のようにキーワードを追加してをクリックしてください。計算が始まります。
          [コマンドラインから実行する場合]
計算設定は、clus-BGLU.iniファイルにすでに記述されています。
clus-BGLU.iniファイル
MMFF94S CONFLEX NOSEARCH CLUSTER CCLUS_DISTANCE=TORSION CCLUS_LIMIT=10.0 CCLUS_NREF=6 CCLUS_IREF=(1,2) CCLUS_IREF=(2,10) CCLUS_IREF=(10,11) CCLUS_IREF=(11,3) CCLUS_IREF=(3,4) CCLUS_IREF=(4,1)
clus-BGLU.molとclus-BGLU.ini、clus-BGLU.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。
C:\CONFLEX\bin\conflex-10a.exe   -par   C:\CONFLEX\par   clus-BGLUenter
          上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。
計算結果
クラスタリングの結果、環の配座の違いにより7つのグループに分類されました。
==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=   122, AVERAGE=   31.00, DISPERSION=  2499.816
==============================================================================
DISTANCE THRESHOLD=   10.00
NCLUSTERS=     7
SIZE=   122
          22           3           1          28          21           4
          12          13           2          59          14         127
          40          35          64         131          20          68
          57          33          74          58          82          88
         135          75          54         106          56          34
          92           5          55          65          97         139
          67         144          90         102         116         133
          39         101          72         132         111          83
          79          94         134         161          45          46
         103          86         151         100         167          80
         118         108         121         145          73         155
         149         173         126          95         140          49
         113          87          66          51         107          62
          98          52         125          61         142         124
         156         141         112         168          53         123
          89         117         166         122         160          60
         105         154          93         148         170          78
         150         115          96         176         153         171
         157         143         165         162         169         164
         175         158         163         177         172         182
         178         180
SIZE=    33
          76          31          29          99         137         104
         119         109          26         114          17         188
           9          23          38         192           6          77
         146          37          91         110         210          48
          44         174          43          15          69          42
         181         203          47
SIZE=    31
          50          16          30         130         138          85
          71          84         147         159         129          41
         152         136         179         120          36         186
          70          25         128         195          81         185
         184         201          63         191           8         194
         193
SIZE=     4
          32          24          10           7
SIZE=    26
         205         214         190         197         208         207
         218         189         202         212         187         198
         183         199         216         211         209         220
         217         204         215         196         213         206
         200         219
SIZE=     3
          27          19          11
SIZE=     1
          18
==============================================================================
          各グループの最安定構造を示します。