2023年12月

PDBQT,刚想提笔说是历史遗留,想找点资料,却又想说是历史的遗憾。

PDBQT在PDB的基础上多了Q和T,Q是partial charge的通用符号,T是atom type的代表。除此以外对于小分子,在PDB的基础上还扩展了分子树的定义,于是出现了ROOT和BRANCH的定义。在这个格式之前,还能找到PDBQ和PDBQS,前者未曾出现原子类型,后者则添加了溶剂化相关的参数。相比较千变万化的小分子结构,蛋白质结构及原子类型相对固定,但无论如何,将小分子做成PDBQT格式,是缺失了众多信息的,如键和键级,于是疲于格式的转换,从sdf到pdbqt再回到sdf等,这种复杂的转换,一直持续了30多年,而且这种工作未曾减轻,而一直存在。

Autodock和Autodock Vina太流行了。

以至于我们搜索分子对接教程,从2010年之前盛行Autodock,到今天盛行Autodock Vina,pdbqt未曾消失,也未曾进步。我们今天想面对的是含有多分子或者多构象的同一个pdbqt文件。
格式如下:

MODEL 1
第一个分子/构象的pdbqt内容
ENDMDL
MODEL 2
第二个分子/构象的pdbqt内容
ENDMDL
...
MODEL N
第N个分子/构象的pdbqt内容
ENDMDL

如果想抽取其中的第n个构象的坐标,可以定义一个 pdbqtn的命令函数,如果觉得能增效,就写到~/.bashrc中常用吧。

#usage: pdbqtn 3 input.pdbqt >input_3.pdbqt
function pdbqtn {
 sed -n "/MODEL ${1}\>/,/ENDMDL/p" ${2} |egrep -v "MODEL|ENDMDL"
}

当然也可以用Autodock Vina随身携带的命令vina_split进行拆解

vina_split --input input.pdbqt

vina_split命令的结果,或者说成果是丰富的,因为生成了更多的文件。我们都不知道是不是该赞美:你好聪明哦。

WATVina既然是Vina的衍生,天生支持pdbqt,如果有一天WATVina不支持pdbqt了,它的名字也会演化,变成watdock或者wdock或者wd... ...
断舍离的生活,从精简文件的数量开始,既然可以用MODEL/ENDMDL来区分分子或者构象,WATVina自然也就得去支持它,可以用于对多个分子/构象打分,对接,优化,放松一下(relax_only)。

#对接
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt 
#打分
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --score_only
#优化
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --local_only
#放松一下,但平移旋转,可旋转键的旋转在此案例中没有过火(0-1之间代表搜索范围不同程度),
watvina -c vina.config -r pro.pdbqt --multiligs_pdbqt input.pdbqt --relax_only --tramplitude 0.1 --toramplitude 0.1 

多个分子顺序对接,无需重新读取受体,也就无需重新计算所有的原子类型的能量格点,节约了计算时间,哪怕每次节约1-3秒,也是一去不复返的时间和成本。

输出文件名为“运算序号_输入文件名称”,且打分直接打印到屏幕。
在这片漆黑的屏幕下,是第五生产元素数据:

LIGAND: [1](第一个分子的打分)
Using random seed: -1129898720
Num of confs to search: 2652672
+-----------+-------------+------------------------------------------------+--------+
| summary   |   RMSD_TO   |               Score contribution               | E_GRID |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
|No.| score | best | init |  VDW  | HBond | Elect | Desol | Intra | Torsion|  TMPH4 |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
!  1  -4.55   0.00   1.94  -24.55   -1.20   -1.59    0.00    0.92    0.09    0.00
!  2  -4.44   1.54   1.34  -27.23   -1.28   -0.35    0.00    1.72    0.01    0.00
!  3  -4.28   2.83   2.38  -29.22   -0.03   -1.46    0.00    0.83    0.08    0.00
!  4  -4.03   2.24   2.22  -26.54   -0.30   -1.45    0.00    0.80    0.08    0.00
!  5  -3.91   3.62   2.83  -24.81   -0.47   -1.64    0.00    1.34    0.09    0.00
!  6  -3.73   2.47   3.47  -26.56   -1.39   -0.98    0.00    2.19    0.08    0.00
!  7  -3.62   2.13   2.75  -26.56   -0.05   -1.62    0.00    1.04    0.02    0.00
!  8  -3.29   1.76   1.75  -22.65   -0.94   -0.95    0.00    1.58    0.08    0.00
!  9  -3.27   1.76   1.71  -22.90   -0.59   -1.70    0.00    1.26    0.03    0.00
! 10  -3.27   2.55   3.37  -21.45   -0.50   -1.40    0.00    1.64    0.01    0.00
LIGAND: [2](第二个分子的打分)
Using random seed: -1127312280
Num of confs to search: 2652672
+-----------+-------------+------------------------------------------------+--------+
| summary   |   RMSD_TO   |               Score contribution               | E_GRID |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
|No.| score | best | init |  VDW  | HBond | Elect | Desol | Intra | Torsion|  TMPH4 |
+---+-------+------+------+-------+-------+-------+-------+-------+--------+--------+
!  1  -4.49   0.00   2.51  -24.59   -1.20   -1.49    0.00    0.84    0.15    0.00
!  2  -4.33   1.39   2.92  -26.96   -1.33   -0.42    0.00    1.75    0.08    0.00
!  3  -4.18   2.50   3.75  -28.90   -0.07   -1.37    0.00    0.75    0.15    0.00
!  4  -3.90   3.48   5.20  -25.43   -0.41   -1.66    0.00    1.33    0.09    0.00
!  5  -3.41   2.20   1.65  -26.23   -0.40   -2.14    0.00    2.01    0.00    0.00
!  6  -3.28   2.64   4.26  -23.48   -0.23   -1.57    0.00    1.12    0.02    0.00
!  7  -3.28   2.01   2.73  -24.97   -0.12   -2.03    0.00    1.27    0.08    0.00
!  8  -3.25   1.93   2.96  -24.53   -0.54   -1.57    0.00    1.27    0.09    0.00
!  9  -3.08   2.52   3.14  -21.97   -0.49    0.07    0.00    0.76    0.15    0.00
! 10  -2.76   5.11   5.92  -25.67   -0.00   -0.44    0.00    1.54    0.01    0.00

当然WATVina也支持从文件夹中获取分子:

watvina -c vina.config -r pro.pdbqt --ligands_dir ligs

如果不想看到密密麻麻的文件,就不用关注ligs文件夹里到底具体是啥了。