CONFLEX DOCKは、基質となるタンパク質に対して、指定したペプチド鎖がどこに配位し複合体を形成するかを予測するドッキングシミュレーションプログラムです。
予測する際には、タンパク質のアミノ酸残基を代表点(Cα原子)で粗視化し、ドロネー分割により四面体を構築します。そして、タンパク質表面に設定した探索点にペプチドの残基を置き、四体粗視化ポテンシャルを元にスコアを評価します。

【文献引用】

CONFLEX DOCKで得られた計算結果を論文等に掲載する場合は、以下の文献を引用してください。
T. Yamamoto, Y. Ikabata, H. Goto,
“Reconstruction of Four-Body Statistical Pseudopotential for Protein-Peptide Docking”,
J. Comput. Chem., Jpn.-Int. Ed., 2024, 10, 2023-0039.

CONFLEX DOCKは、4体統計的粗視化ポテンシャルに基づき、タンパク質ーペプチドドッキングを行うプログラムです。

4体統計的粗視化ポテンシャルの概要

タンパク質のアミノ酸残基の代表点で粗視化したモデルを用いて、native formとnon-native formの安定性が比較されました。
その際、代表点のDelaunay分割による四面体表現からポテンシャルスコアを計算しています。
Krishnamoorthy, B.; Tropsha, A. Bioinformatics, 19, 1540–1548 (2003).

この4体統計的粗視化が、タンパク質ーペプチドドッキングに応用されました。
T. Aita, K. Nishigaki, Y. Husimi, Comput. Bio. Chem. 34, 53–62 (2010).

この4体粗視化ポテンシャルに基づき、タンパク質-ペプチドドッキングプログラムの開発を行いました。
T. Yamamoto, Y. Ikabata, H. Goto,
“Reconstruction of Four-Body Statistical Pseudopotential for Protein-Peptide Docking”,
J. Comput. Chem., Jpn.-Int. Ed., 2024, 10, 2023-0039.

四つのアミノ酸残基の組み合わせ

ポテンシャルスコアを計算するにはアミノ酸残基の四つ組からなる四面体を考えます。
四面体は、以下の5つのクラスのどれかに属します:

Tetra
クラス α 説明
{1,1,1,1} 0 一次配列中の4つの残基がすべて非連続
{2,1,1} 1 1組の連続する残基を持ち,他の2つの残基は他の残基に対して非連続
{2,2} 2 2組の連続する残基を持ち,各残基は他の組と非連続
{3,1} 3 3つの連続した残基があり,残り1残基は他の残基と非連続
{4} 4 4つの残基が,タンパク質の一次配列で連続

ポテンシャルスコア

ポテンシャルスコアは、以下の計算式で求めます。

Q ijkl α = log [ f ijkl α P ijkl α ]

ここで f ijkl α は、実際の出現頻度で P ijkl α は、出現頻度の期待値です。

出現頻度fは,タンパク質をDelaunary分割して多数の四面体を作成し、それらを数え上げて計算します。
その際、四面体への分割は空間上に存在する点群を最小角が最大,最大包含球が最小となるように行います。

期待値Pは以下の式で計算します。

P ijkl α = 4! ν η t ν ! a i a j a k a l P α

ここで、各変数は以下のとおりです。

a i , a j , a k , a l データセットにおける、i, j, k, lの出現頻度
P α 四面体のクラスがαとなる確率
η 四面体を構成するアミノ酸残基の種類の数
tν 四面体における種類νの残基数

CONFLEX DOCKを用いたドッキングシミュレーションは、以下の手順で行われます。

  1. タンパク質の表面に探索点を設置
  2. ペプチドの位置(結合ポーズ)を探索
  3. ポテンシャルスコア,予測精度指標(RMSD, GTGD)に基づく、結果のソート
  4. 結合ポーズのクラスタリング

探索点の配置 - Defpol法

タンパク質を覆うように探索点を球状に配置し,タンパク質重心に向かうように表面まで移動させる方法です。
Pomelli, C. S.; Tomasi, J. J. Comput. Chem., 1988, 15, 1758–1776.

Searchpoint Sphere

探索アルゴリズム

ドッキングの探索は、以下のような流れで行います:

  1. ペプチドのアミノ酸残基を探索点に置き,ペプチドのアミノ酸残基1つとタンパク質のアミノ酸残基3つで四面体を作り,スコアを評価
  2. 次のアミノ酸残基を別の探索点に置き,スコアを評価
  3. 決められた基準で探索点を選択
  4. 上記の評価と探索を繰り返す

この手続きを木構造として捉えます。その中で、スコアの高い探索点からN個のノードを選択し、次の探索を行うというエリート戦略をとっています。
図は、このNが2の場合を示しています。

Tree

予測精度の評価方法

RMSD:Root Mean Square Deviation

アミノ酸残基ごとに位置を比較する計算方法です。

RMSD = 1 N i=1 N | ri - riexp | 2

ここで各変数は、以下のとおりです。

N ペプチドのアミノ酸残基数
ri i番目のアミノ酸残基点の座標
riexp 実験構造におけるi番目のアミノ酸残基点の座標
RMSD

GTGD:Geometric center To Geometric center Distance

幾何中心の一致度を表す指標です。

GTGD = | 1 N i=1 N ri - 1 N i=1 N riexp |

ここで各変数は、以下のとおりです。

N ペプチドのアミノ酸残基数
ri i番目のアミノ酸残基点の座標
riexp 実験構造におけるi番目のアミノ酸残基点の座標
GTGD