您好,欢迎来到尔游网。
搜索
您的当前位置:首页分子路径及其在药物发现中的应用

分子路径及其在药物发现中的应用

来源:尔游网
第43卷第1期 南开大学学报(自然科学版) Acta Scientiarum Naturalium Universitatis Nankaiensis 2010年2月 VoI.43№1 Feb.2010 文章编号:0465—7942(2010)0I一0102—06 分子路径及其在药物发现中的应用 鹿 涛, 乔园园, 申泮文, 车云霞 (南开大学化学学院,天津300071) 摘要:提出了分子结构搜索的新方法即分子路径,不仅包括了配体所应该具备的原子(官能团),还包含了 所需要的支撑结构,优于已有的子结构和指纹法,能够更好地体现药效团的含义,从而大大提高筛选效率.开发 了分子路径搜索程序.以INNO一406为例进行搜索实验,显示了新方法的作用. 关键词:分子路径;结构匹配;药物发现 中图分类号:0639;R914.2;TP311 文献标识码:A 0 引 言 药物发现是从药物受体或者已知药物分子的结构信息出发,找出期望配体的关键结构特征,然后通过 结构衍生或者数据库搜索,找到满足条件的分子结构实体.衍生法是对已知结构的母体骨架或取代基进行 变换以获得新的结构,而数据库搜索主要通过子结构或者指纹匹配来进行.子结构的优点是能够体现分子 结构的局部特点,而指纹法则是把构效关系所用的结构描述参数数值当作指纹,因此体现的是分子的整体 特点.但是分子结构是“各部异性”的,因此子结构无法代表分子的多个部分,而指纹与分子结构的特征之 间也缺乏对应关系,两分子的部分指纹相近并不能说明它们在对应结构上有可比性. 为了体现分子结构特征,本文提出了一个全新概念即分子路径.子结构是以官能团为基础的“块”,而 分子路径则是从分子中的一个原子(或官能团)走向另一个原子(官能团)所经历的线路.一个分子可以有 多条路径,而每条路径由多个节点和路段组成,每个节点相当于原子,路段即化学键.容易看出,路径其实 是一种特殊形式的子结构,或者说是把多个子结构串起来.节点和路段的定义,既可以是具体的原子、化学 键类型,也可以是通配类型,如某个节点可以是C、N或()而不能是其他类型,某个路段可以是单键或双 键,但不能是三键等.因此路径与分子结构的对应性很明确,比指纹更具有代表性.路径的起点和终点,一 般是药物分子与受体相互作用的官能团,而路径中的其他节点和路段,则是对分子骨架结构的一种抽象, 对路径起点和终点的官能团起到了一种支撑作用,所以与药效团相比,分子路径更为具体,因为药效团没 有对支撑结构提供任何信息.总之,分子路径是优于药效团、子结构和指纹的一种新方法. 例如,INNO一406是一种具有Abl/Lyn双重抑制作用的酪氨酸激酶抑制剂,其结构如图1所示[1].如 果把它与受体的四个残基(MET318、THR315、GLU286和ASP381)有氢键作用的原子连起来,就可以得 到一条带有四个节点的分子路径,而路径中的各段还可以各自定义为单键或者芳环上的单键,构成四个节 点的支撑结构. 1算法与步骤 分子结构匹配其实比较的是拓扑图的节点(原子)和边(化学键)的对应关系.目前比较成熟的算法有 收稿日期:2009~06—20 作者简介:鹿涛(1982一),男,山东单县人,博士研究生 第1期 鹿 涛等:分子路径及其在药物发现中的应用 ・103・ GMA算法 、Ullmann算法嘲和VF算法 等. CF3 C N any A N A 争 ASP381 ASP381 (a) (b) 图1 INNO一406的分子结构(a)和分子路径(b) Fig.1 Molecular structure(a)of INNO一406 and one of its molecular path(b) 偏序集是从分子拓扑结构(如MOL格 表1偏序集(POS) 式L5 )生成的一种字符串,是从分子中一个原子 Table 1 PartiaI Order Sets(POS) 出发进行一次遍历的记录.为了实现分子路径 算法,首先要设计出恰当的偏序集(Partial Or— der Sets,POS),使之能体现节点与路径的特 点.为了提高效率,一般情况下都删去氢原子, 而且为降低回溯次数,往往从杂原子起步进行 遍历.如表1中的分子A,其POS最前面的7 表示有7个原子,紧接后面是7个路段的信息, 每个路段用“@”隔开.例如第一个路段(N 4 2 C 3 3 1)表示第一个原子N(编号为4,连接度 为2)和第二个原子C(编号为3,连接度为3)之 间的键型为1(单键).最后一个路段以“#”表 示结束.表1中的分子B,则有三个路段. 在偏序集的基础上,围绕着分子路径算法, 开发了一系列的功能模块,例如偏序生成 (POSGenerator)、官能团定位(FGFinder)、官 能团替换(FGReplacer)和路径匹配(PathMatcher)等,并建立了配体结构数据库(LigandStructL.b)、官能 团库(FGLib)和偏序库(POSLib),共同组成了分子路径搜索程序(Molecular Path Explorer,MPE).程序 的工作流程如图2所示. 用户提问的结构(Query Structure)和配体结构数据库里的结构,一般都是某种拓扑形式,为了进行路 径匹配,都需要经过偏序生成、官能团定位与替换等的处理步骤,各自形成偏序,然后进行根据它们的偏序 进行路径匹配. 配体结构数据库中每个分子结构的偏序集,都事先计算好,存人数据库,这样在实际运行中可供多次 使用,从而提高了匹配速度,适合大型数据库的搜索.考虑到性能和操作方便等因素,选择了嵌人式数据库 SQLite[6-7]来管理分子结构、偏序信息. 配体一般都是通过官能团与受体发生作用,而且每个配体都有若干这样的官能团.把官能团视为一个 节点,这样可以大大简化路径和子结构搜索.具体做法是,建立一个官能团库,对每个提问结构或者结构数 据库中的分子,找出其中是否包含某个官能团.通过POS记录的节点和路段信息,可以找出分子结构中的 官能团. 例如,以表1中分子B为官能团,看看它对应的是分子A的哪部分.首先从分子B的POS串第一个 路段(N 2 1 C l 3 1)开始与分子A进行比较.分子B的N(2)与分子A的N(4)元素相同,且N(2)的连接 ・104・ 南开大学学报(自然科学版) 第43卷 度(与该原子相连的其他原子数量)小于N(4)的连接度,所以两者相匹配.该路段的第二个原子C(1)与分 子A中C(3)或C(5)匹配,但C(1)的连接度大于C(5),即C(1)周围的环境比C(5)还复杂,所以不满足匹 配条件.再看C(1)与A的C(3),连接度相同,所以两者相匹配.于是分子B的第一个路段(N 2 1 C 1 3 1) 与分子A第一个路段(N 4 2 C 3 3 1)相匹配.按照此规则走下去,可以确定分子B的N(2)、C(1)、C(3)和 c(4)相当于分子A的N(4)、C(3)、C(2)和C(7),这个步骤就是官能团定位. 对于已经定位的官能团,可以用特殊的节点来代替,以便与正常原子节点相区别.如图3所示,将两个 官能团分别用R 和R。两个节点来代替.于是两个官能团之间的路径就转变为两个原子之间的路径,从而 简化匹配,这就是官能团替换模块的功能.而提问结构与数据库结构之间的匹配,与上述官能团定位的算 法是一样的,都是POS之间的比对. 官能团替换之前 R。 ”HN/R 2 1o O 官能团替换之后 图2分子路径搜索程序流程图 图3官能团替换 Fig.2 Flowchart of molecular path explorer Fig.3 Functional group replacement 2应用示例与分析 从蛋白质数据库得到的INNO一406与受体结合的晶体结构(PDB ID为2E2B)[13中,配体与受体残基 之间有4个氢键相互作用.从数据库中找出期望的结构,有多种方法.例如,可以把INNO一406与残基作用 的原子作为查询目标.当然原子所携带的配体结构信息太少,往往会得到太多的结果.因此,把原子进行适 当扩充,可以采用子结构进行查询,但由于无法体现多个相互作用点的情况,所以仍然会有很多无效的结 果.本文的分子路径算法,则是根据配体与受体相互作用情况进行设计,因此可以从数据库中找出与IN— N0—406的特点相似的分子. 第1期 鹿 涛等:分子路径及其在药物发现中的应用 ・105・ 2。l用原子搜索 表2列出了只考虑原子及其对应残基的情况下,能够从PDB数据库中找出其他配体的数量. 2.2用子结构搜索 H /N\ O//c ̄./ N根据INNO一406与残基的作用情况,可以 选取多个子结构,如图4所示.其中,标注NCO 表示该原子可以为N、C或者O原子. 3 10 与只用原子进行搜索相比,用子结构找到 的结果要相对集中,但数量还是太多(见表3). 表2原子与指定残基的氢键相互作用数量 Table 2 Count of interactions between atom and residue pairs /l 2 H N\ O l2 4 H\ O 9 CO N 3 H O 9 6 图4 INNO一406的子结构 Fig.4 Substructures from INNO一406 2.3用路径搜索 根据INN()一406分子结构及与蛋白质的氨基酸残基相互作用情况,用设计的分子路径搜索程序得到 的结果,远远少于用原子、子结构的情况,如表4所示. 另外从表5可以看出,通过分子路径能够很集中地找到与INNO一406具有相似结构特点的配体结构, 如STI(即STI一571或Gleevec)就是一种治疗慢性髓性白血病的药物.表4的数据实际上是对表5的简 化.从这些配体(如图5所示)的结构可以看出,它们都满足分子路径的条件. 表3子结构与指定残基的氢键相互作用数量 Table 3 Count of interactions between substructure and residue pairs 表4分子路径与指定残基的氢键相互作用数量 Table 4 Count of interactions between molecular path and residue pairs 表5分子路径与残基的相互作用统计 Table 5 Statistics on interactions between atoms from molecular path and residues ・1O6・ 南开大学学报(自然科学版) 第43卷 \0 WBT O PRC /0 FR8 o AQZ OH H 。 cr/ OH 、0//\丫 J oH H S 0 O O I NH2 O CA5 图5数据库中与INNO一406带有相同分子路径的结构 Fig.5 Structures from database of the same molecular path with INNO-406 第1期 鹿 涛等:分子路径及其在药物发现中的应用 3 结 论 分子路径算法能够很好地体现配体与残基作用的特点,优于子结构,是药效团思想的具体体现.该方 法与其他药物设计策略相结合,能有效地促进药物发现和分子设计研究.分子路径搜索程序与之前提出的 基于数据库的取代基选择 。 算法相配合,以统计概率的方式研究了与残基相作用的配体官能团情况,为设 定分子路径中的官能团提供了重要的参考;与开发的虚拟组合衍生程序 。。相配合,则可以把分子路径发 展为各种衍生结构,大大丰富结构数据库的化学空间和分子多样性.这些工作的集成和系列化,将有力地 促进化学信息学的发展n ],为药物发现和设计提供有力的探索工具 M . 参 考 文 献 1 Horio T,Hamasaki T,Inoue T,et a1.Structural factors contributing to the Abl/Lyn dual inhibitory activity of 3 substituted benzamide derivatives[J].Bioorg Med Chem Lett,2007,17:2 712—2 717. Xu J.GMA:A generic match algorithm for structural homomorphism,isomorphism,and maximal common sub— structure match and its applications[J].J Chem Inf Comput Sci,1996,36(1):25—34. Ullmann J R.An algorithm for subgraph isomorphism[J].Journal of the Association for Computing Machinary, 1976,23(1):31—42. 4 Cordelia L P,Foggia P,Sansone C,et a1.An improved algorithm for matching large graphs:Proc of 3rd IAPR— TC15 Workshop on Graph—Based Representation in Pattern Recognition,May 23—25,2001 EC].Italia:Ischia, 2OO1:l49—159. Symyx Solutions Inc.CTFile formats[EB/OI ].[2009—05—201.http://www.symyx.com/downl0ads/public/ct— file/ctfile.jsp. Richard D.Hipp.SQLite Professional support[EB/0L].[2009--05--20].http://www.sqlite.org/. 鹿涛,乔园园,申泮文,等.NKChemSQI ——针对MySQL的化学信息学扩展[J].计算机与应用化学,2009,26 (10):1 358一l 362. 8 乔园园,宋端磊,孙可.基于数据库信息的取代基选择EJ].计算机与应用化学,2008,25(8):1 027—1 030. 9 乔园园,林少凡.虚拟组合分子库的设计与实现EJ].计算机与应用化学,2004,21(5):721—724. 10 乔园园,张明浩,刘冲,等.虚拟组合衍生程序系统的研制[J].计算机与应用化学,2007,24(2):193—195. 11 乔园园,鹿涛,车云霞.化学信息学与生物信息学开放性比较口].化学进展,2007,19(4):624—632・ 12 乔园园,孙可,刘冲.化学信息学与药物发现研究的开放性EJ].计算机与应用化学,2006,23(12):1 283—1 286. 13 乔园园,刘建涛,刘冲.化学信息学与开源软件EJ].计算机与应用化学,2006,23(8):795 800. l4 乔园园,吴夏,杨.玲,等.化学信息学开源软件的集成与复用[J].计算机与应用化学,2007,24(1):133—136・ Molecular Path and its Application in Drug Discovery Lu Tao,Qiao Yuanyuan,Shen Panwen,Che Yunxia (College of Chemistry,Nankai University,Tia in 300071,China) Abstract:The task for drug discovery is to find out potential ligands from large scale databases effectivelv. Molecular path is a new method for structural match and is better than substructure because it contains not only atoms or functional groups but also the molecular framework,both of them are necessary for a ligand.A computer program was developed to lm— plement the idea of molecular path.INNO一406 is a tyrosine kinase inhibitor for treating chronic myelogenous leukemia and is used as an example for extracting molecular path and exploring the database for demonstration of the new algorithm. Key words:molecular path;structure match;drug discovery 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- axer.cn 版权所有 湘ICP备2023022495号-12

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务