表紙(FrontPage) | 編集(管理者用) | 差分 | 新規作成 | 一覧 | RSS | 検索 | 更新履歴

Molecular_dockingについて -

目次

重要な役割を果たすタンパク質を同定して、それに高い親和性で結合する低分子の候補を Molecular docking 計算によって見いだすことが可能になっている。

Dynamic control of plant water use using designed ABA receptor agonists   Aditya S. など   Science 25 Oct 2019: Vol. 366, Issue 6464, eaaw8848   DOI: 10.1126/science.aaw8848   この論文では ABA 受容体 PYR1, PYL1, and PYL2  に結合する低分子の候補を using Glide docking protocols を用い ZINC database からスクリーニングした。選び出された分子を元に、さらに強力な分子を創製した。その分子を用い実用作物の乾燥に対する耐性を高めることに成功した。

Substrate-recognition mechanism of tomato β-galactosidase 4 using X-ray crystallography and docking simulation   Planta. 2020 Oct 3;252(4):72. doi: 10.1007/s00425-020-03481-4.   Kaori Matsuyama 1 2 , Tatsuya Kondo 3 , Kiyohiko Igarashi 1 , Tatsuji Sakamoto 3 , Megumi Ishimaru   PMID: 33011862    レセプター Chain A of WT_Gal (PDB: 6IK5) とリガンド(ガラクトビオース、galactobiose made by SWEET2 https://www.glycosciences.de/modeling/sweet2/doc/index.php)の立体構造は公開されているものを使っている。パラメーターの設定についても書いてある。 「Receptor search volume options were set on TBG4′s catalytic region (center coordinates were x = − 50.77, y = − 31.93, and z = 51.36, sizes were x = 29.38, y = 39.12, and z = 36.97).」 レセプターの基質結合部位の中心の座標と、それを取り囲む領域を指定している。 「The maximum number of binding modes was set to 10, and exhaustiveness of search was set to 8.」 これらも設定してある。

Discovery and identification of 2-methoxy-1-naphthaldehyde as a novel strigolactone-signaling inhibitor   J Pestic Sci. 2016 Aug 20;41(3):71-78.  Okishi Mashita, Hikaru Koishihara, Kosuke Fukui, Hidemitsu Nakamura, Tadao Asami   PMID: 30363101  PMCID: PMC6140645  DOI: 10.1584/jpestics.D16-028

D14 タンパク質の高次構造をデータとして virtual screening に成功している。 Chimera の機能を使って、低分子と D14 タンパク質の両方に水素原子を付加している。 立体構造はエネルギー最低になるように最適化する。Molecular Modeling Toolkit というものを使っている。 http://dirac.cnrs-orleans.fr/MMTK.html に紹介があった。問題点として、Molecular Modeling Toolkit はかなり以前に開発されたもので、Python 2.7 を使って書かれている。ソフトウェアの世界はものすごい早さで開発が進んでいて、Python2 はすでに過去のバージョンになっている。だから Molecular Modeling Toolkit を使いたいなら Python2 を使える専用の環境を用意しないといけない。そういう仕組みはあるが、ややこしくなる。Virtual screening には Ligandscout というソフトウェア((株)アフィニティサイエンス)が使われている。スクリーニングの際には、条件を複数設定してそれぞれの条件下で行っている。分子構造のライブラリーは市販のもの(ナミキ商事)を用いている。Autodock Vina も使われている。

In silico docking of Novel Phytoalkaloid Camalexin in the Management of Benomyl Induced Parkinson’s disease and its In vivo Evaluation by Zebrafish Model.   Tamilanban T, Manasa K, Chitra V.   CNS Neurol Disord Drug Targets. 2021 Sep 2.    PMID: 34477539

Flavones scaffold of Chromolaena odorata as a potential xanthine oxidase inhibitor: Induced Fit Docking and ADME studies   Bioimpacts. 2020;10(4):227-234. doi: 10.34172/bi.2020.29. Epub 2019 Nov 2.   Babatomiwa Kikiowoら   PMID: 32983938 PMCID: PMC7502905 DOI: 10.34172/bi.2020.29

Endosidin20‐1 is more potent than endosidin20 in inhibiting plant cellulose biosynthesis and molecular docking analysis of cellulose biosynthesis inhibitors on modeled cellulose synthase structure   Lei Huang, Xiaohui Li, Chunhua Zhang   Plant J. 2021 106(6): 1605-1624


Molecular docking の計算について調べてみる。

分子構造は常に揺らいでおり、docking する際に構造変化が誘起されることもある

神戸大学計算科学教育研究センターから、「計算生命科学の基礎」遠隔インタラクティブ講義が開催、公開されている。  http://www.eccse.kobe-u.ac.jp/distance_learning/life_science9/   計算生命科学の基礎9、第八回では 広川 貴次先生による「インシリコ創薬の基礎と応用」が行われた。 分子構造は常に揺らいでおり、docking する際に構造変化が誘起され活性配座に変化することもよくあるので「ひずみエネルギー」を考慮したり時間的な変化を計算することが必要であることを勉強した。ファーマコフォアの概念、分子のフィンガープリントと類似性の計算、Polar surface area の計算、薬が結合するポケットの検索  http://sts.bioe.uic.edu/castp/index.html  などの様々な計算に関して紹介されていた。

この下に書いていることはそういうことを全く考慮できていないので既に結合がよく分析されている例題を試してみることしかできないが、勉強のきっかけにはなる。

Autodock Vina on Chimera

「計算化学」というブログで、docking 計算を行うソフトウェアの一つである Autodock Vina について解説されていた。以前はそれを参考にして試してみた。 「計算化学 ドッキングシミュレーションのやり方【AutoDock vina】」https://computational-chemistry.com/top/blog/2017/04/26/autodock-vina/ これはかなり古い。

https://bioinform.jmir.org/2020/1/e14232   Molecular Docking Using Chimera and Autodock Vina Software for Nonbioinformaticians    という解説があった。こちらの方が新しく、 Chimera の機能を活用できるので優れている。

以前「計算化学」に従って試した際は Ubuntu 18.04 を入れたマシンを用意して、ソフトウェアをセットアップした。そのころの Linux の GUI のソフトウェアはメニューの文字がとても小さくなったりクリックしたときの反応が悪かったりすることもあった。現在ではたぶん改良されているだろう。 Ubuntu では、Autodock Vina vina.scripps.edu/download.html から tar.gz ファイルを入手した。展開して、/usr/local/autodock_vina/ に配置した。そこの /bin に実行ファイルがあるので、path に追加をして実行しやすくする。 MGL Tools    https://ccsb.scripps.edu/   というソフトウェアもセットアップした。これも /usr/local/mgltools/ に配置した。path も追加した。MGL Tools には、Autodock に必要な autodocktools (ADT) というソフトウェアが含まれている。 Pymol というソフトウェアは、apt でインストールできた。

その後、WINDOWS10 のマシンを用意したのでこれに UCSF Chimera, Autodock vina, MGL tools の windows 版をインストールした。

必要なファイル

https://bioinform.jmir.org/2020/1/e14232   Molecular Docking Using Chimera and Autodock Vina Software for Nonbioinformaticians    という解説では

を用意する。Chimera 自体に、データベースからこれらのファイルを Fetch 取り出す機能がある。

「計算化学」に紹介された方法では3つまたは4つのファイルが必要になる。

タンパク質の立体構造のファイルを入手する

https://iop.vast.ac.vn/theor/conferences/smp/1st/kaminuma/AutoDock/examples.html   では例題として、3PTB: Benzamidine docking to beta-Trypsin が取り上げられている。そこでタンパク質はトリプシン、低分子は benzamidine を選んでみる。

Protein data bank Japan PDBj https://pdbj.org/ でトリプシンを検索すると解説記事がある。3PTB にはカルシウム原子と benzamidine が含まれている。ドッキング計算の結果を 3PTB のような実験による正しい結果と比較することは重要だとこの分野の解説記事にはよく書かれている。

Chimera を使う PDB ファイルの入手と前処理

Chimera を使ってファイルを得て前処理を行うことができる。https://bioinform.jmir.org/2020/1/e14232 に従って行う。

File -> Fetch by ID   3PTB を指定する。Fetch するとすぐに 3D 構造が表示される。カルシウム原子、benzamidine が含まれているのが見える。適当なフォルダに Save PDB で pdb ファイルをセーブする。

chimera では Select -> Residue -> non-standard で、アミノ酸以外の部分を強調して表示できる。3PTB ではカルシウム原子と denzamidine が囲まれる。Actions -> Color とすると、囲まれた部分の色を変えられる。

Tools > Structure Editing > Dock Prep で、docking 計算の準備に必要な処理ができる。

「Select all options except “Delete non-complexed ions” and click OK」と書かれているので、そうする。最初からその設定になっている。ここでは remove solvents, adding hydrogen が行われる。

「 Add hydrogen ..」というダイアログに進むので、これもそのまま OK を押す。

電荷 charge を負荷するダイアログに進む。「Other residues」の設定は「Gasteiger」に変更する。 「Gasteiger 電荷」とは、原子の電気陰性度を基にそれぞれの原子がもつ電荷を簡易に計算する方法らしい。

次のダイアログで Net charge を計算する。カルシウム原子と benzamidine の電荷が表示されている。そのまま OK を押す。

これで前処理が終了したので 3PTB_chimera_prepared としてセーブする。mol2 でセーブするように言ってくるのでまずそうする。その後に pdb でセーブする。

https://bioinform.jmir.org/2020/1/e14232 の方法では、インヒビターをつけたままにすることで、ドッキング計算の初期値の設定をしやすくしている。設定をしてからインヒビターを取り除いている。だからこの段階ではインヒビターが付いたままの構造データになっている。


ここまでがタンパク質の立体構造のファイルに対する処理で、次にリガンド構造ファイルに対する処理を行う。 トリプシンを阻害する benzamidine をリガンドにする。

低分子リガンドの立体構造データベース Pubchemqc、Ligandbox

このことについて、中田 真秀先生が「第一原理計算による分子の物理化学データベース構築」という、とてもためになる解説を書かれている。

有名な化学データベースに PubChem がある。PubChem には極めて多種の分子のデータが収録されており、3D structure 立体構造のファイルもここから取得することができる。 これらのデータは非経験的分子軌道法という方法で計算されており、計算は高速にできるが精度はそれほどでもないと書かれている。中田先生のグループではより精度が高い計算方法を用いて立体構造を多数の分子について計算し、その結果をデータベース http://pubchemqc.riken.jp/ で公開している。

Benzamidine の計算結果も得ることができた。計算結果は有名な第一原理計算ソフトウェア GAMESS のフォーマットで提示されている。 GAMESS OUTPUT (ground) がエネルギー最低状態の計算結果で、ここから立体構造を取り出さないといけない。 ファイルは xz という形式で圧縮されている。Windows では 7-zip というソフトウェアを使うと元に戻せる。計算結果が書かれたログファイルが一つ入っている。 このログファイルは、Avogadro というソフトウェアで読み込み表示できる。

Avogadro https://avogadro.cc/  Avogadro is an advanced molecule editor and visualizer designed for cross-platform use in computational chemistry, molecular modeling, bioinformatics, materials science, and related areas.

Autodock Vina などの外部のソフトウェアで使用するためには、「名前をつけて保存」で .mol2 .pdb .xyz などの形式でセーブする。

今回は mol2 でセーブしてみた。mol2 ファイルについては、myPresto 5.0 という化学ソフトウェアパッケージに含まれる tplgeneL というソフトウェアの USER MANUAL に説明が記載されていた。上に書いた方法で得た mol2 ファイルには、各原子の電荷の値も計算され記載されていた。

https://dbarchive.biosciencedbc.jp/jp/ligandbox/desc.html   では、Ligandbox というデータベースが紹介されている。

Chimera でリガンドの準備をする

Chimera で mol2 ファイルを読み込むことができる。読み込むとすぐに立体構造が表示される。これについても、Tools -> Structure Editing -> Dock prep に進んで、タンパク質の pdb ファイルと同様に処理を進めて mol2 形式、pdb 形式でセーブする。これによってリガンドにも水素原子と電荷が付加される。電荷は Pubchemqc によって計算された値があるが上書きされる。Pubchemqc からのデータの場合はそのままでよいかもしれない。 リガンドの構造データをいくつかのデータベースから得られる場合、少しずつ立体構造や電荷が異なることがある。どの構造が受容体との結合に適しているかはわからないので、それぞれについて計算して複数の結果を得て比較してみるのがよいらしい。

準備前の mol2 ファイルと準備後の mol2 を比較してみると、水素が一つ増えていた。8 番の N に水素原子が付加されている。pubchemqc では MULLIKEN_CHARGES と書いてある部分が準備後のファイルでは AMBER ff14SB になっていた。電荷の値は少しずつ異なっていたが正負の符号は同じだった。AMBER ff14SB というのは分子動力学法で計算に使用する力場 force field の名前。原子がそれぞれ存在している空間がある。その空間の各点において、その点に位置する原子に働く力を定めることが力学計算に必要である。力を定めるために用いられる関数を力学や化学、量子化学の成果に基づいて書き下ろす。分子の場合力は原子と原子の間に働く。位置は二体間の相対的な値(距離、角度)でも表せる。力が位置だけで定まる(熱力学での状態量に相当・位置以外の見えない引数がない)なら、原子に働く力 = ポテンシャルエネルギー関数を原子の位置で微分した値になる。原子間に働く力は何種類もある。それらを全部考慮しないといけないので複数の項を関数に含める。力場にはシンプルなものから複雑なものまで何種類もあり使い分けられる。

Chimera + Autodock vina による Docking 計算

File -> open をして、タンパク質の横にリガンドが表示された状態にする。Chimera は自動的に見やすいように配置してくれる。

Select -> Residue -> Non-standard で、3PTB に含まれる benzamidine を見やすくする。

Tools > Surface or Binding Analysis > Autodock Vina と進む。

計算の中心になるグリッドの位置と大きさを決めて数値を入力する。https://bioinform.jmir.org/2020/1/e14232 では、阻害剤を含む構造データを使うことで決めやすくしている。3PTB も阻害剤が入っているので、そうする。

「Receptor search volume options」 に数値を入力することで設定ができる。緑の線でボックスが描かれるので、阻害剤が存在する部分を取り囲むように数値を変える。

最初は (0, 0, 0) (20, 20, 20) にしてみた。この値では benzamidine の位置からずれている。 (0, 15, 15) (15, 15, 15) で、benzamidine を取り囲むようにできた。

この状態を File -> save session で保存した。ここから 3PTB に含まれる benzamidine を取り除く。benzamide を Select -> Residue -> で選択して、Select -> Residue -> Actions -> Atoms and Bonds -> Delete で取り除く。

Tools > Surface or Binding Analysis > Autodock Vina で、autodock vina の実行ファイル vina.exe を登録した。Windows では locate32 というソフトウェアを入れると、ファイル名からインストールされている場所を検索できる。

レセプター #0 には前処理した 3PTB の pdb ファイル、リガンド #1 には benzamidine の pdb ファイルを指定した。

すべて設定して OK ボタンを押すと計算が始まる。

結果の処理、解釈

(続く)

Chimeraを使わない方法(特にメリットはない)

Pymol による pdb ファイルの前処理

PDBJ から 3ptb.cif.gz というファイルをダウンロードした。windows では 7-zip というソフトウェアが多種類の圧縮ファイルに対応していて使いやすい。7-zip で cif ファイルに戻した。このファイルを Pymol で「File」「open」で読み込んだ。ウインドウに立体構造が表示される。

Pymol の中段にコマンドを打つボックスがある。そこにコマンドを打って操作ができる。

remove solvent で、データに含まれている水分子が除かれる。

上のメニューから Display -> Sequence をチェック すると、アミノ酸配列が表示される。C末端の後ろに、CA, BEN と書かれている。これらは立体構造に含まれているカルシウム原子と benzamidine で、クリックするとウインドウに赤い点で表示される。

remove resn CA, remove resn BEN で、これらを取り除ける。

操作を加えた後に、「File」「export molecule」「PDB形式」で、pdb ファイルとしてセーブする。

Autodocktools (ADT) を使った前処理

「計算化学」の記事の解説に従って pdb ファイルに対する前処理を行う。

Autodocktools は、タンパク質の立体構造が記録されている pdb ファイルを読み込んで処理、フォーマット変換を行うために使用できる。

上に書いたようにセットアップして、ターミナルから > adt と打って起動する。windows では普通にスタートメニューから起動する。

Autodocktool (ADT) は上段に普通のメニューがあり、それとは別に中央に茶色の ADT メニューバーがある。この二つは区別しないといけない。

ADT で pdb ファイルを Read molecule する。これは上段のメニューの「File」を使う。メインの画面にタンパク質の立体構造が表示される。これに対して、

どう選択すればよいのか? まだ勉強が足りないのでよくわかっていない。これは行わなくてもよいらしい。

以前やってみた方法: 活性中心に近い部分を少しだけ選択してみた。Uniprot データベースには、トリプシンは 63, 107, 200 が active site 活性中心であると記載されている。これらの3個を選択した。アミノ酸のリストの右に「S L B C R MS L」と上に書かれた部分がある。S のカラムの□をクリックすると黄色になり選択できる。 茶色の ADT メニューから「Flexible_residues」->「Choose Torsions〜」を選択すると、右の画面に選択した部分だけの構造が残る。 茶色の ADT メニューから「Flexible_residues」->「Output」->「Save flexible」でファイルをセーブする。***_flex_part.pdbqt という名前にした。 茶色の ADT メニューから「Flexible_residues」->「Output」->「Save rigid」でファイルをセーブする。***_rigid_part.pdbqt という名前にした。

ここから ADT に戻る。

 setup benzamidine_pubchenqc: 
 kept charges from mol2 file 
 merged 5 non-polar hydrogens 
 found 6 aromatic carbons 
 detected 2 rotatable bonds 
 set TORSDOF to 2 

というメッセージが出た。benzamidine には 8 個の水素原子が含まれる。5 つはベンゼン環の部分に付いている。

Avogadro で PDB ファイルでセーブした場合、以下のようなメッセージが出た。

 setup benzamidine_pubchemqc: 
 added gasteiger charges 
 merged 5 non-polar hydrogens 
 found 6 aromatic carbons 
 detected 2 rotatable bonds 
 set TORSDOF to 2 

この場合「Added gasteiger charges」と出た。 「Gasteiger 電荷」とは、原子の電気陰性度を基にそれぞれの原子がもつ電荷を簡易に計算する方法らしい。

右の画面に分子が出てきて、立体的になっていることがわかる。Pubchem で benzamidine のデータを開いて 3D Conformer を見ると平面に収まっているので異なっている。

これでリガンドの立体構造ファイルができる。

Grid などを設定 (ADT)

Preserve input receptor charges?  という Dialog が出た。「No」を選択した。

だいぶ前に使ってみた Linux 版の ADT では値の設定や操作がやりにくいと思うこともあったが、無料で使えるソフトウェアなのでそれは仕方がない。Windows 版は動かしやすかった。

例: Center [x, y, z] = [2.538, 7.547, 23.768]  Number of points [x, y, z] = [40, 40, 40]  Offset = [0, 0, 0]

「File」->「Close saving current」でセーブして戻る。

input.txt ファイルを設定

 receptor = 2PTN_rigid_part.pdbqt
 flex = 2PTN_flex_part.pdbqt
 ligand = Benzamidine_pubchemqc_riken.pdbqt
 log = docking_2PTN_benzamidine.log
 center_x = 2.394
 center_y = 7.572
 center_z = 23.783
 size_x = 40
 size_y = 40
 size_z = 40
 cpu = 4
 exhaustiveness = 8
 num_modes = 100
 energy_range = 3

実行

Linux の場合   vina --config input.txt