WATVina支持输入包含多个配体的单一pdbqt文件
PDBQT,刚想提笔说是历史遗留,想找点资料,却又想说是历史的遗憾。
PDBQT在PDB的基础上多了Q和T,Q是partial charge的通用符号,T是atom type的代表。除此以外对于小分子,在PDB的基础上还扩展了分子树的定义,于是出现了ROOT和BRANCH的定义。在这个格式之前,还能找到PDBQ和PDBQS,前者未曾出现原子类型,后者则添加了溶剂化相关的参数。相比较千变万化的小分子结构,蛋白质结构及原子类型相对固定,但无论如何,将小分子做成PDBQT格式,是缺失了众多信息的,如键和键级,于是疲于格式的转换,从sdf到pdbqt再回到sdf等,这种复杂的转换,一直持续了30多年,而且这种工作未曾减轻,而一直存在。
Autodock和Autodock Vina太流行了。
以至于我们搜索分子对接教程,从2010年之前盛行Autodock,到今天盛行Autodock Vina,pdbqt未曾消失,也未曾进步。我们今天想面对的是含有多分子或者多构象的同一个pdbqt文件。
格式如下:
MODEL 1
第一个分子/构象的pdbqt内容
ENDMDL
MODEL 2
第二个分子/构象的pdbqt内容
ENDMDL
...
MODEL N
第N个分子/构象的pdbqt内容
ENDMDL
如果想抽取其中的第n个构象的坐标,可以定义一个 pdbqtn
的命令函数,如果觉得能增效,就写到~/.bashrc中常用吧。
#usage: pdbqtn 3 input.pdbqt >input_3.pdbqt
function pdbqtn {
sed -n "/MODEL ${1}\>/,/ENDMDL/p" ${2} |egrep -v "MODEL|ENDMDL"
}
当然也可以用Autodock Vina
随身携带的命令vina_split
进行拆解
vina_split --input input.pdbqt
vina_split
命令的结果,或者说成果是丰富的,因为生成了更多的文件。我们都不知道是不是该赞美:你好聪明哦。
WATVina既然是Vina的衍生,天生支持pdbqt,如果有一天WATVina不支持pdbqt了,它的名字也会演化,变成watdock或者wdock或者wd... ...
断舍离的生活,从精简文件的数量开始,既然可以用MODEL/ENDMDL来区分分子或者构象,WATVina自然也就得去支持它,可以用于对多个分子/构象打分,对接,优化,放松一下(relax_only)。
#对接
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt
#打分
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --score_only
#优化
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --local_only
#放松一下,但平移旋转,可旋转键的旋转在此案例中没有过火(0-1之间代表搜索范围不同程度),
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --relax_only --tramplitude 0.1 --toramplitude 0.1
多个分子顺序对接,无需重新读取受体,也就无需重新计算所有的原子类型的能量格点,节约了计算时间,哪怕每次节约1-3秒,也是一去不复返的时间和成本。
输出文件名为“运算序号_输入文件名称”,且打分直接打印到屏幕。
在这片漆黑的屏幕下,是第五生产元素数据:
LIGAND: [1](第一个分子的打分)
Using random seed: -1129898720
Num of confs to search: 2652672
+-----------+-------------+------------------------------------------------+--------+
| summary | RMSD_TO | Score contribution | E_GRID |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
|No.| score | best | init | VDW | HBond | Elect | Desol | Intra | Torsion| TMPH4 |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
! 1 -4.55 0.00 1.94 -24.55 -1.20 -1.59 0.00 0.92 0.09 0.00
! 2 -4.44 1.54 1.34 -27.23 -1.28 -0.35 0.00 1.72 0.01 0.00
! 3 -4.28 2.83 2.38 -29.22 -0.03 -1.46 0.00 0.83 0.08 0.00
! 4 -4.03 2.24 2.22 -26.54 -0.30 -1.45 0.00 0.80 0.08 0.00
! 5 -3.91 3.62 2.83 -24.81 -0.47 -1.64 0.00 1.34 0.09 0.00
! 6 -3.73 2.47 3.47 -26.56 -1.39 -0.98 0.00 2.19 0.08 0.00
! 7 -3.62 2.13 2.75 -26.56 -0.05 -1.62 0.00 1.04 0.02 0.00
! 8 -3.29 1.76 1.75 -22.65 -0.94 -0.95 0.00 1.58 0.08 0.00
! 9 -3.27 1.76 1.71 -22.90 -0.59 -1.70 0.00 1.26 0.03 0.00
! 10 -3.27 2.55 3.37 -21.45 -0.50 -1.40 0.00 1.64 0.01 0.00
LIGAND: [2](第二个分子的打分)
Using random seed: -1127312280
Num of confs to search: 2652672
+-----------+-------------+------------------------------------------------+--------+
| summary | RMSD_TO | Score contribution | E_GRID |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
|No.| score | best | init | VDW | HBond | Elect | Desol | Intra | Torsion| TMPH4 |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
! 1 -4.49 0.00 2.51 -24.59 -1.20 -1.49 0.00 0.84 0.15 0.00
! 2 -4.33 1.39 2.92 -26.96 -1.33 -0.42 0.00 1.75 0.08 0.00
! 3 -4.18 2.50 3.75 -28.90 -0.07 -1.37 0.00 0.75 0.15 0.00
! 4 -3.90 3.48 5.20 -25.43 -0.41 -1.66 0.00 1.33 0.09 0.00
! 5 -3.41 2.20 1.65 -26.23 -0.40 -2.14 0.00 2.01 0.00 0.00
! 6 -3.28 2.64 4.26 -23.48 -0.23 -1.57 0.00 1.12 0.02 0.00
! 7 -3.28 2.01 2.73 -24.97 -0.12 -2.03 0.00 1.27 0.08 0.00
! 8 -3.25 1.93 2.96 -24.53 -0.54 -1.57 0.00 1.27 0.09 0.00
! 9 -3.08 2.52 3.14 -21.97 -0.49 0.07 0.00 0.76 0.15 0.00
! 10 -2.76 5.11 5.92 -25.67 -0.00 -0.44 0.00 1.54 0.01 0.00
当然WATVina也支持从文件夹中获取分子:
watvina -c vina.config -r pro.pdbqt --ligands_dir ligs
如果不想看到密密麻麻的文件,就不用关注ligs文件夹里到底具体是啥了。