Discovery Studio官方教程(Help-Tutorials) 使用ZDOCK进行蛋白-蛋白对接

2023-03-08 17:20:36 来源:软服之家

目的:通过此教程,了解Discovery Studio中蛋白序与蛋白质之间相互对接的操作方法及结果分析。


(资料图)

所需功能和模块:Discovery Studio Client,Dock Proteins with ZDOCK,Refinement with RDOCK。

所需数据文件:2ptn.pdb,2sta_I.pdb。

所需时间:1小时30分钟

介绍

蛋白对接技术是一种预测蛋白质相互识别以及相互作用的技术。在DS中,我们可以使用ZDOCK来实现蛋白质的对接计算。ZDOCK是一种基于快速傅里叶转化相关性技术的刚性蛋白对接算法。算法中快速傅里叶转化相关性技术被用于搜索蛋白-蛋白系统的平动和转动空间。RDOCK是一种基于CHARMm的能量优化过程,用于优化ZDOCK所寻找到的蛋白-蛋白复合物的结合构型,并使用能量打分函数给这些结合构型打分。

本教程使用ZDOCK来进行蛋白对接的实验,并分析对接的结果。从中选取的一些结合构型,利用RDOCK进行优化。本教程的蛋白对接实验中,我们选用牛β-胰岛素(PDB号:2ptn)作为受体蛋白,另外胰岛素抑制剂CMTI-I(PDB号:2sta,I链)将作为配体蛋白。该牛β-胰岛素及其抑制剂CMIT-I复合物的晶体结构是已知的(PDB号为1ppe)。

本教程涵盖如下内容:

ZDOCK运算的设定

ZDOCK结果的分析

对接构型的RDOCK优化

蛋白-蛋白结合界面氨基酸的RMSD分析

设定一次ZDOCK计算

1. 在同一个3D窗口中打开受体和配体蛋白

在文件浏览器(Files Explorer)中,展开Samples | Tutorials | Protein Modeling文件夹,双击2ptn.pdb文件。

DS将在一个新的3D窗口中打开该蛋白。

在同一文件夹中,将2sta_I.pdb拖至上述同一分子窗口(2ptn分子窗口)中。(图1)

图1 2ptn分子窗口

2. 蛋白-蛋白对接(ZDOCK)

在工具浏览器(Tools Explorer)中,展开Macromolecules | Dock and Analyze Protein Complexes,点击Dock Proteins(ZDOCK),打开Dock Proteins(ZDOCK)对话框。(图2)

设置Input Receptor Protein为2ptn:2ptn。

设置Input Ligand Protein为2ptn:2sta_I。

点击Angular Step Size右边的栅格,下拉列表中选取15。

注:ZDOCK计算过程中可以采用两种欧拉角度进行结合构型的采样:6°和15°。采样角度为6°时,预测结果更为准确,因为它的最终样本数包括54,000个结合构型。尽管采样角度为15°时的结果准确性有所下降(因为它的采样数只有3600个),但它的计算时间更短。

展开Clustering参数组。

点击RMSD Cutoff参数,将该值设置为6.0。

点击Interface Cutoff参数,将该值设置为9.0。

点击Maximum Number of Clusters参数,将该值设置为60。

本教程中使用的配体抑制剂较小,对于这样小的体系,将RMSD Cutoff设置为 6.0 Å的cluster 半径并同时将Interface Cutoff 设置为9.0 Å,cluster结果会更好。本教程中的ZDCOK运算,将不指定blocked residues也不指定filtering binding site residues。

设置ZRank为False。

ZRank选项用于根据静电势、范德华、去溶剂化效应能来对ZDOCK初始预测的pose进行重新排名。本教程中,我们没有使用该选项。

注:ZDOCK可以在采用blocking和(或)filtering选项时进行计算:

如果有数据表明某些氨基酸残基不可能出现在蛋白-蛋白的作用界面,那么在受体蛋白中选中这些残基,然后设定Receptor Blocked Residues参数为Create New Group from selection。同样的,也可以通过设置Ligand Blocked Residues参数来指定配体蛋白中不可能出现在界面上的残基。

如果有数据表明,某些氨基酸一定会出现在蛋白质-蛋白质作用界面上,那么选中它们。然后展开Filter Poses参数组,设置Receptor Binding Site Residues参数和Ligand Binding Site Residues参数为Create New Group from selection。

Filter Poses功能也可以在ZDOCK运算完后单独运行,采用Process Poses(ZDOCK)protocol即可。

图2 “Dock Proteins(ZDOCK)”参数设置

3. 运行ZDOCK并查看结果

点击Run运行作业,在对话框中观察作业运行状态。点击Background后台运行该作业。

该作业大概需要15分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。

待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm(图3)。在report文件中分析Summary部分并点击View Results以打开一个包含对接pose的新窗口。(图4)

图3 ZDOCK运算的Report文件

图4 ZDockResults窗口

分析ZDOCK结果

输入的受体蛋白和配体蛋白都显示在视图窗口当中。

如果两个蛋白分子并没有在视图窗口当中显示,则在工具栏中点击Fit To Screen按钮使两个蛋白分子居中显示。每一个聚类的中心pose都以点的形式显示在受体蛋白的周围。

1. 结合构型的聚类(Cluster)结果

在系统视图(Hierarchy View)中,展开Docked Poses和Clusters。

这将打开几组Clusters和poses。Cluster_1是最大的聚类(包含的poses最多),后续的聚类所包含的pose逐渐减少。

在系统视图(Hierarchy View)中,关闭Docked Poses和Clusters组。在表格浏览器(Data Table)中,点击Protein Pose标签。

这将显示如下关于ZDOCK运算结果的信息:

ZDock Score – 包含每个对接构型的ZDOCK分数(PSC 打分函数),Pose 1的 Zdock分数最高(最好)。

Cluster – 指明每个对接构型所属的聚类组

ClusterSize – 报告每个聚类含有的对接构型的个数。

Density – 报告聚类过程中临近的对接构象数目。

关于聚类算法的详述,可以参考Discovery Studio Help中的Clustering and analysis of docked protein poses。

2. 结合构型作图分析

以下的步骤将解释如何使用不同的方法,借助plots和Dock and Analyze Protein Complexes工具来帮助观看对接构型,并选择一部分ZDOCK的对接构型进行进一步的RDOCK优化。

在工具浏览器(Tools Explorer)中,展开Macromolecule | Dock and Analyze Protein Complexes,在Browse Poses一栏下设置Browse为Top Poses in Largest Clusters。

这将显示10个最大的聚类中100个打分最好的pose。

点击First显示第一个pose的配体分子。

这将在分子窗口的视图窗口中产生一个名为Pose1_Cluster2_2sta_I的配体分子。

点击Lock Visibility保留配体分子的该pose并一直处于可见状态。

点击Next观察配体分子的下一个pose,是cluster2中的pose3。

观察到该pose同第一个pose很相似。

点击Next两次显示Pose7_Cluster5_2sta_I。

观察到该pose对接至受体的位置很相似,但是配体的对接界面却有较大的差距。

继续点击Next观察其他pose,如果想要保留某一个pose则点击Lock Visibility。

在Data Table中,点击ProteinPose,使之处于激活状态。

单击鼠标右键,选取List Only Visible Objects。

点击ZDockResult点状图标签,拖拽该窗口,以使能够同时看到ZDockReults窗口。

在View工具栏中,点击Select工具,选中ZDockResults窗口中一些ZDock打分高于12.0的点。

该操作共选取了11个pose,5个pose属于cluster2,4个pose属于cluster1,cluster3和5各包含一个pose。

利用RDOCK优化对接构型

1. RDOCK优化

点击ZDockResults分子窗口,以使该窗口处于激活状态。

在工具浏览器(Tools Explorer)中,展开Macromolecules | Dock and Analyze Protein Complexes,在Refine Poses一栏下,点击Refine Docked Proteins(RDOCK),打开Refine Docked Proteins(RDOCK)对话框。(图7)

点击Input Receptor Protein右边的栅格,下拉列表中选择ZDockResults:2ptn。

点击Input Ligand Protein右边的栅格,下拉列表中选择ZDockResults:2sta_I。

点击Input Poses右边的栅格,下拉列表中选择Create New Group From Selection。

默认的会将该新产生的组命名为Group,共包含之前选取的11个pose。

注:Dielectric Constant参数仍保留设置为4.0。该值即运算RDOCK中计算CHARMm能量时所用的介电常数。

点击Run运行作业,在对话框中观察作业运行状态。

点击Background后台运行该作业。

该作业大概需要5分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。作业结束时会出现一个提醒任务结束的对话框。

图7 RDOCK参数设置

2. 结果分析

待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm。

在report文件中点击View Results打开一个新的分子窗口。(图8)

经RDOCK优化的对接构型均出现在该窗口中,其中top refined pose在视图窗口中显示。

图8 RDOCK分子窗口

每一个优化好的pose其RDOCK所计算的各能量值都列在表格浏览器(Data Table View)中。

E_elec1 and E_elec2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的静电势能

E_vdw1 and E_vdw 2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的范德华非键作用能

E_sol – 经ACE方法计算得到的蛋白质复合物的去溶剂化能

E_RDock – RDOCK分数的定义为:E_elec2 + beta×E_sol

表格中同样还包含了运算ZDOCK之后得到的各pose的性质,例如ZDock Score和聚类信息等。这些信息有利于结果的解释。

RDock打分最好的pose属于cluster2。这也证实了cluster2所包含的pose是对接最好的结果,有可能同真实的对接构象比较接近。

在Table中,点击

可以看到第一个pose的3D构象。分别点击

可以查看上一个和下一个pose的结构。

使用RMSD分析结合界面的氨基酸

本小节将把对接的构型同蛋白质复合物PDB 1ppe的晶体结构进行比较。

1 打开PDB 1ppe

点击Poses分子窗口的标签,使该窗口处于激活状态。

从主菜单栏中,选取File | Insert From | URL,打开Insert From URL对话框。

在ID文本框中输入1ppe。确保地址栏设置为Default PDB Structures。

点击Open。

这将在Poses分子窗口的视图窗口中插入1ppe蛋白复合物结构。

在分子窗口中,单击鼠标右键,选取Show All显示所有pose。

在系统视图(Hierarchy View)中,展开Cell,然后展开1PPE。

选中Water,Delete。

这将删除1ppe中的水分子。

2. 将对接构型与1ppe叠合

在进行RMSD计算之前,首先应该将对接的poses和1ppe进行基于受体蛋白的叠合。

在视图窗口(Graphic View)中,单击鼠标右键,选取Show Sequence。

这将打开一个Sequence窗口。(图9)

图9 序列窗口

点击Poses分子窗口标签,激活该窗口。

在系统视图(Hierarchy)中,点击选中1ppe的E链。

在工具浏览器(Tools Explorer)中,展开Macromolecules | Superimpose Proteins,在Reference Protein一栏下,选取1PPE中选中的链作为叠合时的参考分子。

在Sequence Alignment一栏中,设置Sequence Alignment为Poses,并将弹出的窗口关闭。

在分子窗口中,确保1ppe的E链仍被选中。

在Superimpose Proteins一栏中点击Superimpose。

该步将对接poses的受体对接至1ppe的E链。

3. 计算结合界面氨基酸的RMSD值

在系统视图(Hierarchy)中,点击选中1ppe的I链。

在Dock and Analyze Protein Complexes工具面板下,点击Define Ligand。

点击Select Binding Interface。

选中处于蛋白-蛋白分子界面的氨基酸残基。

从菜单栏中,选择Structure | RMSD | By Sequence Alignment….

这将打开RMSD by Sequence Alignment的对话框。

在该对话框中,点击Reference molecule右边的栅格,下拉列表中选择1ppe。点击Selected residues左边的圆形按钮,关闭Report at residue level选项。点击OK。(图10)

图10 “RMSD by Sequence Alignment”参数设置

DS将在一个新的Html窗口中打开一个基于选中氨基酸的RMSD报告。(图11)

比较对接poses的E_RDock打分和RMSD值,发现RMSD值最低的poses其E_RDock打分也最低,都属于cluster2类别。

图11 RMSD报告

End

标签:

上一篇:
下一篇: