CONFLEX Tutorials

配座のクラスタリング:類似した異性体構造の分類

【配座クラスタリングとは】

配座異性体をいくつかの意味のあるグループに分類することを、配座クラスタリングと呼びます。
例えば、構造パラメーターを指標として構造的に似ている配座をグループ分けすることで、最安定構造やX線結晶構造に近い配座がどの程度のエネルギーの範囲でどのくらい存在するかを見積もることが出来ます。
配座クラスタリングを行うためには、配座異性体を関係付ける指標が必要となります。ある配座に対してどの配座がどのくらい似ているかを評価する指標は配座間距離と呼ばれ、CONFLEXでは構造パラメーターとして2面角かデカルト座標のRMSD値を選択してクラスタリングすることが出来ます。以下の例では、2面角のRMSD値を配座間距離としたクラスタリングを示します。

【n-pentaneの全配座異性体のクラスタリング】

n-pentaneの全ての配座異性体についてクラスタリングを行う方法を説明します。
まず、n-pentaneの配座探索を行います。

n-pentane.mol

n-pentane


 17 16  0  0  0  0  0  0  0  0999 V2000
   -1.2316   -1.9901   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.0874   -1.2286   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.1902    0.2689   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.1288    1.0304   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.8512    2.5279   -0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -1.0288   -3.0844   -0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.8145   -1.7213    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.8151   -1.7211   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.6703   -1.4973   -0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.6709   -1.4976    0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7731    0.5377    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7737    0.5379   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.7117    0.7617   -0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.7123    0.7614    0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.8151    3.0844   -0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.2683    2.7967    0.9093 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.2677    2.7969   -0.9088 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  1  0      
  1  6  1  0      
  1  7  1  0      
  1  8  1  0      
  2  3  1  0      
  2  9  1  0      
  2 10  1  0      
  3  4  1  0      
  3 11  1  0      
  3 12  1  0      
  4  5  1  0      
  4 13  1  0      
  4 14  1  0      
  5 15  1  0      
  5 16  1  0      
  5 17  1  0      
M  END

[Interfaceから実行する場合]

n-pentane.molファイルをCONFLEX Interfaceを用いて開きます。

Interface n-pentane

Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのDetail Settingsをクリックします。

Basic Settings

詳細設定ダイアログの「General settings」ダイアログにある「Calculation Type:」のプルダウンメニューから「Conformation Search」を選択します。

General Settings Dialog

次に、詳細設定ダイアログの「Conforamtion Search」ダイアログにある「Search Limit:」の値を「4.0」に変更します。
設定が終わりましたら、Edit & Submitをクリックします。

Conformation Search Dialog

Edit & Submitをクリックすると、計算設定のキーワードが記述されたダイアログが表示されます。
ここで、「CHECK=(TORSION,NOENERGY)」キーワードを追加します。本キーワードは、配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用することを意味します。

Edit Submit Dialog

設定が終わりましたらSubmitをクリックしてください。計算が始まります。

[コマンドラインから実行する場合]

計算設定は、n-pentane.iniファイルにキーワードを記述することで行います。

n-pentane.iniファイル

MMFF94S  CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY)

それぞれのキーワードの意味は、次の通りです。

キーワード 説明
MMFF94S MMFF94s力場を使う
CONFLEX 配座空間探索を行なう
SEL=4.0 配座探索のエネルギー上限値は、4.0 kcal/molとする
CHECK=(TORSION,NOENERGY) 配座間の類似性を計る指標をエネルギーではなく、骨格となる結合周りのねじれ角のRMSDを採用する

n-pentane.molとn-pentane.iniの二つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。

C:\CONFLEX\bin\flex9a_win_x64.exe  -par  C:\CONFLEX\par  n-pentaneenter

上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。

計算結果

計算の終了後、11種類の配座異性体が得られます。それぞれの配座異性体でのC-C-C-C2面角の値は以下の通りです。

表:各配座のC-C-C-C2面角

No. Steric E Dihedral angle
1-2-3-4 2-3-4-5
1 -5.2718 -180.00 180.00
2 -4.4419 175.69 65.65
3 -4.4419 -65.65 -175.69
4 -4.4419 65.65 175.69
5 -4.4419 -175.69 -65.65
6 -3.8487 60.27 60.27
7 -3.8487 -60.27 -60.27
8 -1.5718 -64.48 95.34
9 -1.5718 95.34 -64.48
10 -1.5718 -95.34 64.48
11 -1.5718 64.48 -95.34
n-pentane with numbers

次に、得られた配座異性体をC2-C3結合周りの2面角を配座間距離の指標としてクラスタリングします。

[Interfaceから実行する場合]

n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのDetail Settingsをクリックします。
その後、詳細設定ダイアログのEdit & Submitをクリックします。

Edit and Submit

ダイアログの内容を下記のように編集しSubmitをクリックします。計算が始まります。

Cluster Settings

それぞれのキーワードの意味は、次の通りです。

キーワード 説明
NOSEARCH 配座探索を行わない
CLUSTER クラスタリングの実行
CCLUS_DISTANCE=TORSION 配座間距離の算出に2面角を使用する
CCLUS_LIMIT=10.0 配座間距離が10.0以内の配座を一つのグループにする指定
CCLUS_NREF=1 クラスタリングの指標とする結合の数
CLUS_IREF=(2,3) クラスタリングの指標とする結合の番号

[コマンドラインから実行する場合]

n-pentane.iniファイル内容を以下の通り編集します。

n-pentane.iniファイル

MMFF94S  CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY)
NOSEARCH
CLUSTER
CCLUS_DISTANCE=TORSION
CCLUS_LIMIT=10.0
CCLUS_NREF=1
CCLUS_IREF=(2,3)

それぞれのキーワードの意味は、次の通りです。

キーワード 説明
NOSEARCH 配座探索を行わない
CLUSTER クラスタリングの実行
CCLUS_DISTANCE=TORSION 配座間距離の算出に2面角を使用する
CCLUS_LIMIT=10.0 配座間距離が10.0以内の配座を一つのグループにする指定
CCLUS_NREF=1 クラスタリングの指標とする結合の数
CLUS_IREF=(2,3) クラスタリングの指標とする結合の番号

n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。

C:\CONFLEX\bin\flex9a_win_x64.exe   -par   C:\CONFLEX\par   n-pentaneenter

上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。

計算結果

計算の終了後、クラスタリングの結果が「.clu」という拡張子の付いたファイルに出力されます。 このファイルでは、最初に配座数やクラスタリングの指標となる2面角のインデックスなどの情報が表示されます。

=-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-=
     CONFLEX CONFORMATIONAL CLUSTERING FILE
=-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-==-=

==============================================================================
# CLUSTERING INFORMATION
==============================================================================
CLUSTERING METHOD: SINGLE LINKAGE
NUMBER OF CONFORMERS CLUSTERED =     11 CONFORMERS (TOTAL      11 CONFORMERS)
DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE
DISTANCE DEFINITIONS:      1 TORSIONS
     1:    1-   2-   3-   4

==============================================================================

次に、各配座間距離の一覧が出力されます。
ここで、「SORTED NUMBER」はエネルギーの安定な順、「CID NUMBER」は配座探索中に見出された順に対応します。この出力から、例えば4番と9番の配座のC1-C2-C3-C4の2面角の差が1.1717であることがわかります。

==============================================================================
# DISTANCE MATRIX ELEMENTS
==============================================================================
NUMBER OF DISTANCE MATIRX ELEMENTS =     55
       SORTED NUMBER        CID NUMBER                   DISTANCE         
    ------------------  ------------------    ----------------------------
           I       J           I       J        RMSD      MAXD     DRMSD
           4       9           3       9        1.1717   -1.1717   0.0000
           3       8           2       6        1.1717    1.1717   0.0000
           6       9           7       9        4.2046    4.2046   3.0329
           7       8           8       6        4.2046   -4.2046   0.0000
           1       2           1       5        4.3141   -4.3141   0.1095

最後に、設定した閾値(CCLUS_LIMIT=10.0)に対応したクラスタリングの結果が出力されます。ここで出力されている番号はCID NUMBERで、エネルギーの低い順に出力されます。

==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=     3, AVERAGE=    2.00, DISPERSION=     5.640
==============================================================================
DISTANCE THRESHOLD=   10.00
NCLUSTERS=     5
SIZE=     3
           1           5           4
SIZE=     3
           2           8           6
SIZE=     3
           3           7           9
SIZE=     1
          11
SIZE=     1
          10

==============================================================================

今度は、同じ配座探索の結果を用いて、2つのC-C-C-C2面角を指標にしたクラスタリングを行います。

[Interfaceから実行する場合]

n-pentane.molファイルをCONFLEX Interfaceを用いた状態で、Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのDetail Settingsをクリックします。
その後、詳細設定ダイアログのEdit & Submitをクリックします。

Edit and Submit Init

ダイアログの内容を下記のように編集しSubmitをクリックします。計算が始まります。

Edit and Submit modified

ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。

[コマンドラインから実行する場合]

n-pentane.iniファイル内容を以下の通り編集します。

n-pentane.iniファイル

MMFF94S  CONFLEX SEL=4.0 CHECK=(TORSION,NOENERGY)
NOSEARCH
CLUSTER
CCLUS_DISTANCE=TORSION
CCLUS_LIMIT=70.0
CCLUS_NREF=2
CCLUS_IREF=(2,3)
CCLUS_IREF=(3,4)

ここでは、「CCLUS_LIMIT=70.0」とし、配座間距離が70.0以内の配座を一つのグループにします。
また、「CCLUS_NREF=2」とし、「CCLUS_IREF=(3,4)」を加え、C3-C4結合周りの2面角も配座間距離の指標に追加しています。

n-pentane.molとn-pentane.ini、n-pentane.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。

C:\CONFLEX\bin\flex9a_win_x64.exe   -par   C:\CONFLEX\par   n-pentaneenter

上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。

計算結果

設定の変更によって、各配座間距離は以下のように変わります。

==============================================================================
# CLUSTERING INFORMATION
==============================================================================
CLUSTERING METHOD: SINGLE LINKAGE
NUMBER OF CONFORMERS CLUSTERED =     11 CONFORMERS (TOTAL      11 CONFORMERS)
DISTANCE (SIMILARITY) INDEX: TORSIONAL DISTANCE
DISTANCE DEFINITIONS:      2 TORSIONS
       1:    1-   2-   3-   4
       2:    2-   3-   4-   5

==============================================================================
# DISTANCE MATRIX ELEMENTS
==============================================================================
NUMBER OF DISTANCE MATIRX ELEMENTS =     55
       SORTED NUMBER        CID NUMBER                   DISTANCE         
    ------------------  ------------------    ----------------------------
           I       J           I       J        RMSD      MAXD     DRMSD
           9      11           9      11       30.8622   30.8622   0.0000
           8      10           6      10       30.8622  -30.8622   0.0000
           4       9           3       9       62.9213   88.9765  32.0591
           3       8           2       6       62.9213  -88.9765   0.0000
           2      10           5      10       62.9213   88.9765   0.0000
           5      11           4      11       62.9213  -88.9765   0.0000

閾値を70.0(CCLUS_LIMIT=70.0)に設定していますので、CID NUMBER 5,10,2,6および3,9,4,11がそれぞれ同じグループに分類されます。

==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=     4, AVERAGE=    2.00, DISPERSION=     6.840
==============================================================================
DISTANCE THRESHOLD=   70.00
NCLUSTERS=     5
SIZE=     1
           1
SIZE=     4
           5          10           2           6
SIZE=     4
           3           9           4          11
SIZE=     1
           7
SIZE=     1
           8

==============================================================================

【β-Glucoseの全配座異性体のクラスタリング】

β-Glucoseの全配座異性体について、6員環部分の2面角から配座感距離を求めクラスタリングを行います。

Interface beta-Glucose numbered

入力ファイルclus-BGLU.mol、clus-BGLU.ini、clus-BGLU.fxfファイルを一つのフォルダに格納します。
各ファイルは、CONFLEXのインストールフォルダ内のSample_Filesフォルダにあります (Sample_Files\CONFLEX\clustering\b-glucose)。

[Interfaceから実行する場合]

clus-BGLU.molファイルをCONFLEX Interfaceを用いて開きます。

Interface beta-Glucose

Calculationメニューから「CONFLEX」を選択し、開いた計算設定ダイアログのDetail Settingsをクリックします。

Basic Settings

その後、詳細設定ダイアログのEdit & Submitをクリックします。計算設定のキーワードが記述されたダイアログが表示されます。

Edit and Submit Init

下記のようにキーワードを追加してSubmitをクリックしてください。計算が始まります。

Edit and Submit modified

[コマンドラインから実行する場合]

計算設定は、clus-BGLU.iniファイルにすでに記述されています。

clus-BGLU.iniファイル

MMFF94S  CONFLEX NOSEARCH
CLUSTER
CCLUS_DISTANCE=TORSION
CCLUS_LIMIT=10.0
CCLUS_NREF=6
CCLUS_IREF=(1,2)
CCLUS_IREF=(2,10)
CCLUS_IREF=(10,11)
CCLUS_IREF=(11,3)
CCLUS_IREF=(3,4)
CCLUS_IREF=(4,1)

clus-BGLU.molとclus-BGLU.ini、clus-BGLU.fxfの三つのファイルを一つのフォルダに格納し、下記コマンドを実行してください。計算が始まります。

C:\CONFLEX\bin\flex9a_win_x64.exe   -par   C:\CONFLEX\par   clus-BGLUenter

上記は、Windowsの場合です。他のOSにおける実行コマンドについては、本書の「実行方法」を参照してください。

計算結果

クラスタリングの結果、環の配座の違いにより7つのグループに分類されました。

==============================================================================
# RESULT -     1  IN CID NUMBER
# MIN=     1, MAX=   122, AVERAGE=   31.00, DISPERSION=  2499.816
==============================================================================
DISTANCE THRESHOLD=   10.00
NCLUSTERS=     7
SIZE=   122
          22           3           1          28          21           4
          12          13           2          59          14         127
          40          35          64         131          20          68
          57          33          74          58          82          88
         135          75          54         106          56          34
          92           5          55          65          97         139
          67         144          90         102         116         133
          39         101          72         132         111          83
          79          94         134         161          45          46
         103          86         151         100         167          80
         118         108         121         145          73         155
         149         173         126          95         140          49
         113          87          66          51         107          62
          98          52         125          61         142         124
         156         141         112         168          53         123
          89         117         166         122         160          60
         105         154          93         148         170          78
         150         115          96         176         153         171
         157         143         165         162         169         164
         175         158         163         177         172         182
         178         180
SIZE=    33
          76          31          29          99         137         104
         119         109          26         114          17         188
           9          23          38         192           6          77
         146          37          91         110         210          48
          44         174          43          15          69          42
         181         203          47
SIZE=    31
          50          16          30         130         138          85
          71          84         147         159         129          41
         152         136         179         120          36         186
          70          25         128         195          81         185
         184         201          63         191           8         194
         193
SIZE=     4
          32          24          10           7
SIZE=    26
         205         214         190         197         208         207
         218         189         202         212         187         198
         183         199         216         211         209         220
         217         204         215         196         213         206
         200         219
SIZE=     3
          27          19          11
SIZE=     1
          18

==============================================================================

各グループの最安定構造を示します。

beta-Glucose cluster