请选择 进入手机版 | 继续访问电脑版

分子模拟论坛 Molecular Simulation Forums

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 1561|回复: 4

虚拟筛选(分子对接)的假阳性与假阴性、原因及其分析

[复制链接]

13

主题

79

帖子

179

积分

注册会员

Rank: 2

积分
179
发表于 2012-7-16 09:49:00 | 显示全部楼层 |阅读模式
本帖最后由 sln 于 2012-7-18 20:28 编辑
虚拟筛选假阳性、假阴性产生的原因  虚拟筛选(VirtualScreening,VS)与高通量筛选(Highthroughput screen,HTS)都可以对几百万化合物进行快速的评估以发现潜在的先导化合物。所不同的是,THS需要对全部的化合物进行测试,而虚拟筛选仅需对少量优选的化合物进行生物学测试。分子对接(docking)是最为大众所熟知的一种虚拟筛选方法。众所周知,对接计算会因为构象采集不充分、打分函数的近似处理而出现化合物漏选,这时假阴性出现;没有活性的化合物得分很靠前,这时假阳性出现。
现在问题出来了,虚拟筛选的假阳性、假阴性到底有多大?为什么会出现?如何识别?为了回答这个问题,需要针对同一个靶点、同一个数据库综合地比较分子对接与HTS、系统地分析全部活性化合物的作用机制才能回答这些问题。
来自UCSF的Brian K. Shoichet等(Ferreira, R. S., A. Simeonov, et al.,2010)人设计了实验来回答上面的问题:针对同一个巯基蛋白酶Cruzain以及同一个数据库MLSMR library(包含197861化合物),分别用qHTS与分子对接方法进行筛选,比较两者结果,回答了下面几个问题:
1、HTS与分子对接都有什么样的假阳性分子?产生假阳性的原因是什么?
要回答这个问题,需要对基于结构的虚拟筛选与HTS进行一个有意义的比较。
2、分子对接的假阴性分子是什么样子?为什么这些分子会被漏选?
将有活性的化合物与Cruzain培养复合物晶体,就可以在原子水平解答这个问题。
3、到目前为止,Cruzain已知的抑制剂大部分都是不可逆、共价结合的化合物。有可能发现结构新颖、可逆的Cruzain抑制剂吗?
4、是否可以可靠地将真正的抑制剂富集在得分排名非常靠前的化合物中?
根据Ferreira,R. S., A. Simeonov等人(2010)的研究成果,将虚拟筛选中的上述问题整理如下:
靶点:Cruzain,一种巯基蛋白酶
数据库:MLSMR数据库,含197861化合物
虚拟筛选方法:Cruzain的晶体结构(PDB code :1AIM)去水、去配体,加标准H原子。MLSMR数据库用ZINC数据库准备流程准备。虚拟筛选用DOCK3.5.54进行对接计算。Cruzain结构保持刚性,对接时考虑小分子的柔性,以预计算构象库的方式处理。每个分子计算时评估了大约600个构象、平均18735的取向(orientation,平均每个分子的configuration不止1000万),用van der Walls与静电互补性进行打分。该打分分别分用AMBER与DelPhi的势函数完成,并计算配体的去溶剂化效应加以纠正。得分最佳的pose用于数据库排序的标准。
结果
1、关于虚拟筛选的假阳性
表1,虚拟筛选的活性化合物
如表1所示,分子对接的假阳性率为97.5%。为了进一步理解假阳性,肉眼观察了198个得分最高化合物的假阳性化合物,发现假阳性化合物有两个主要特征:分子含有多个极性基团,但是这些极性基团在活性位点里并不与Cruzain发生相互作用(大约占34%);分子的内能很高(大约占53.5%)。
实际上述观察反应了分子对接,在这里是DOCK3.5.54,的共性问题。有34%的假阳性化合物为分子量大、极性基团多的化合物,这些极性基团并没有参与到与Cruzain的相互作用,这可能是因为静电相互作用获得的正面效应与配体去溶剂化效应的损耗难以平衡造成。更为普遍的是,得分最高的化合物里有53.5%的假阳性,这些假阳性是由于pose采取了高能构象带来的。也就是DOCK3.5.54可能会选中一个高能构象但是相互作用能打分很好的化合物。这反映了对接程序的打分函数没有考虑分子内能这一问题。构建对接用数据库时仅包含了一个能量最低的构象,包含了最低能构象特定能量窗之内的全部分子,这些构象之间的内能差异没有在打分函数的最后一步加以考虑。还有大约2.5%的假阳性具有高度柔性的取代基,这意味着打分函数对结合时熵的损失没有采取惩罚所致。
2、关于虚拟筛选的假阴性
化合物27为活性化合物,但是对接的虚拟筛选却将其漏选:在197861化合物里排名180479,对接计算没能将这个化合物打分排名靠前。化合物27是个很好的分析假阴性对象。将化合物27与Cruzain培养复合物单晶,通过对接预测的结合模式与晶体解释的结合模式比较,可以了解产生这个假阴性的原因。
图1,比较化合物27对接计算的pose与共晶实验解释的结果。(a)是化合物27的立体视图,其分辨率为1.28埃。(b)化合物27与Cruzain关键的相互作用,红色小球是水分子,虚线为氢键(橘红色)或偶极-偶极相互作用(绿色)。(c)对接结果与共晶实验结果叠合图。蓝色为共晶实验结果,绿色为对接计算结果。
如图1所示,化合物对接预测的pose与实验测得的相比,其苯并咪唑环没有在结合位点里,对接计算实际是失败的。
一般情况下,分子对接计算失败的可能原因是为采样不充分或打分函数性能差。采样不足可能两个原因:构象数据库里没有合理的构象或者orientation采样不充分。
将化合物27用OpenEye的OMEGA生成其600个构象,用DOCK3.5.54进行刚性对接,发现打分好的pose其与晶体结构的RMSD可以低至1.4埃。这说明对接的采样本身没有问题。
接下来考虑一下打分函数的因素。DOCK3.5.54的打分函数包含三个成份:范德华相互作用,静电相互作用,配体的去溶剂化惩罚项。
图2,虚拟筛选用的Cruzain口袋(灰色)与化合物27/Cruzain复合物口袋(绿色)比较。除了CYS25与GLN159有点小差别之外,其余的地方基本一样。
如图2所示,比较对接用的Cruzain结合口袋与化合物27/Cruzain复合物口袋,它们之间差异很小,除了CYS25与GLN159有点小差别之外,其余的地方基本一样。将化合物27/Cruzain复合物单晶解释的构象用于打分,对接打分会发现,前后打分发生很大的变化,如表2所示。
表2,对接用Cruzain结合口袋与化合物27/Cruzain复合物结合口袋对接结果及其排名比较。
这表明,即使Cruzain活性位点里只有很小的构象变化,也会给对化合物的对接打分与排名产生非常大的影响。
3、关于虚拟筛选能否找到新颖、可逆、竞争性抑制剂
到目前为止,Cruzain已知的抑制剂大部分都是不可逆、共价结合的化合物。用128个已知的活性化合物为模板,以ECFP4与Daylight指纹图谱搜寻MLSMR数据库,结果ECFP4指纹图谱法命中961化合物、Daylight指纹图谱法命中154化合物。虽然这些命中的化合物中有些是不可逆并且非专一的抑制剂,但是没有一个是竞争性抑制剂。即使将相似性条件放宽也命中不了。在本研究中,对接虚拟筛选法找到了2类HTS没有识别出来的可逆竞争性抑制剂。这说明,分子对接虚拟筛选不同于二维结构相似的方法,分子对接可以找到结构新颖的,可逆的竞争性抑制剂,而ECFP4与Daylight不能找到竞争性抑制剂。
4、是否可以可靠地将真正的抑制剂富集在得分排名非常靠前的化合物中?
在本研究中,在HTS发现的非共价结合竞争性抑制剂中,其中有一半的抑制剂骨架类型富集于对接的前0.1%,虚拟筛选确实可以将真正的抑制剂富集在得分排名非常靠前的化合物中。
5、HTS与虚拟筛选是否互补
在本研究中,分子对接与HTS发现了各自结构类型新颖的竞争性抑制剂,所以互补性是显而易见的。
图3、HTS与VS各自发现结构新颖的竞争性抑制剂
参考文献
Ferreira, R. S., A. Simeonov,et al. (2010). "Complementarity between a docking and a high-throughputscreen in discovering new cruzain inhibitors." J Med Chem 53(13):4891-4905.
Virtual and high-throughput screens (HTS)should have complementary strengths and weaknesses, but studies thatprospectively and comprehensively compare them are rare. We undertook aparallel docking and HTS screen of 197861 compounds against cruzain, a thiolprotease target for Chagas disease, looking for reversible, competitiveinhibitors. On workup, 99% of the hits were eliminated as false positives,yielding 146 well-behaved, competitive ligands. These fell into fivechemotypes: two were prioritized by scoring among the top 0.1% of thedocking-ranked library, two were prioritized by behavior in the HTS and byclustering, and one chemotype was prioritized by both approaches. Determinationof an inhibitor/cruzain crystal structure and comparison of the high-scoringdocking hits to experiment illuminated the origins of docking false-negativesand false-positives. Prioritizing molecules that are both predicted by dockingand are HTS-active yields well-behaved molecules, relatively unobscured by thefalse-positives to which both techniques are individually prone.
如果你看不见图片,请访问:
http://hi.baidu.com/new/biocadd 或者 http://user.qzone.qq.com/615892712/main
mdbbs, baidu空间与QQ空间同步发表
回复

使用道具 举报

42

主题

336

帖子

720

积分

高级会员

Rank: 4

积分
720
发表于 2012-7-16 14:56:00 | 显示全部楼层
还是直接去你空间看吧
回复

使用道具 举报

13

主题

79

帖子

179

积分

注册会员

Rank: 2

积分
179
 楼主| 发表于 2012-7-16 17:42:00 | 显示全部楼层
非常抱歉,我不知道如何能将图片贴出来。
回复

使用道具 举报

2

主题

5

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2012-8-16 21:11:00 | 显示全部楼层
好棒,谢谢
回复

使用道具 举报

2

主题

5

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2013-6-19 16:39:00 | 显示全部楼层
挺实用的帖子,谢谢楼主
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|分子模拟论坛

GMT+8, 2020-8-4 07:05 , Processed in 0.068405 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表