解锁新药物发现的密码 | 基于电离常数的化学基因组分析方法
时间:2023-07-24 阅读:846
简介
为了提高药物发现过程的效率,药物化学家广泛应用化学基因组学原理来定制合成或筛选工作,从而使候选分子与其靶点相匹配。将化合物空间与靶标空间相关联已经促进了这一领域的许多研究,在目前的研究中,通过在大量的化学基因组学数据集中专门探索分子酸碱性质对生物活性的影响来扩展这些研究。此外,我们还通过研究筛选化合物(包括 "天然产品 "组)的酸碱性质来补充这些分析。
分子中存在的酸性和碱性官能团是化学基因组学中的一个重要因素,因为它们会强烈影响分子的理化性质,如亲油性和水溶性,反过来,这些因素又会影响化合物在生物系统中的行为,即受体相互作用以及吸收、分布、代谢、排泄和毒理学(ADMET)。酸/碱性质对ADMET特性影响的具体例子包括酸性化合物倾向于表现出更高的血浆蛋白结合力,从而影响分布容积,而碱性化合物则倾向于通过磷脂中毒和蛋白通道结合等机制表现出更大的毒性。
在配体的杂合性与分子量(MW)和分配系数(logP)等特性之间建立联系时。更大和更亲脂的分子有可能与不止一个靶点相互作用,电荷状态也可能对非靶点选择性起作用,因此,电离常数从根本上关系到化合物的行为方式及其整体的类药物特性。此外,酸电离常数(pKa)值和电离状态对药物制剂有重要影响,尤其是在化合物需要在溶液中给药的情况下。在影响水溶性的主要因素中,极性是一个关键参数,但它需要与适当的亲脂性相平衡,才能使分子穿过膜并与特定的大分子相互作用。受体相互作用同样需要药物官能团与大分子结合部位的官能团互补。总之,电荷状态和电离常数深深地影响药物的性质,因此需要进一步研究药物的酸/碱特性。
为了更深入地了解药物的酸碱性质,我们研究了已上市药物的pKa分布。然而,这一项工作仅探讨了当代药物,将其扩展到更广泛的化合物将是有益的。
本研究检查药物、对于药物的化学基因组和筛选出的化合物的酸碱特征,对他们进行三个层次的分析。通过化合物的统计以确定具有可电离官能团的化合物,并将这些物质分类。可电离化合物的pKa值以图表的形式显示,包括单一酸和单一碱化合物。总之,我们希望能够就筛选化合物或研究化学品是否符合药物的酸碱特性提出问题。该研究旨在提高我们对酸碱特征及其对生物活性的基本影响的认识。
实验部分
药物数据集是来自新墨西哥大学(Albuquerque, NM, USA)的内部收集。剔除了不含碳的化合物、含重金属的化合物、盐类、聚合物、混合物以及分子量(MW)大于1000Da的物质,剩下3766种化合物。这些化合物代表了欧洲、亚洲和美国已批准使用的当代临床使用的单一物质。
商用化合物数据库选自ZINC数据库,该数据库包含超过107种商用化合物的信息。ZINC数据库提供了从完整数据库中根据计算性质(如MW、logP、氢键供体/受体数量、可旋转键的数量和PSA)推导的子集。
01
对以下ZINC子集进行了检测:
02
对于每个数据集,都遵循以下程序
结果与讨论
生物活性化合物的电离状态强烈影响其在生物系统中的行为--该化合物如何与目标结合位点相互作用,或如何在水环境和脂质环境之间分离。化合物的实际电离状态取决于局部环境的pH值,虽然通常接近中性(~7.4),但pH值范围很广。例如,在肠道内,pH值从1到8不等,而在配体结合位点的微环境中,官能团的pKa可能会受到两个单位或更多单位的干扰。因此,酸性和碱性行为的意义并不是简单的电离状态研究,它还必须包括药物发现过程中遇到的一系列生物制药情况。
当代药物
选择经过批准的药物数据集来代表当代治疗分子。这个精心策划的数据集由美国、欧洲和亚洲监管机构批准的药物组成,从制药和医学的角度来看,可以被认为是具有国际意义的。
在本研究中,我们对药物数据集进行了过滤,保留了所有含碳物质,并剔除了含有重金属、盐类、混合物、聚合物以及分子量>1000的化合物。预测了每个分子的pKa值,并将化合物分为电荷状态类别:始终电离(6.3%)、中性(20.2%)、单酸(14.2%)、二酸(3.5%)、单碱(27.8%)、二碱(10.1%)、简单两元化合物(含有一种酸和一种碱的化合物;9.5%)和复杂化合物(8.4%;表1,图1 a)。图1b, c显示了药物数据集中单酸和单碱化合物的pKa分布。
左右滑动,查看更多
图1.a) 获准用于人体(药物)的小分子药物的酸/碱类别细分。酸/碱类别包括始终离子化(pKa<0的酸、pKa>12的碱和带永*久电荷的化合物)、中性化合物、单酸物质、单碱物质、含两个酸性基团的化合物、含两个碱性基团的化合物、简单的两性化合物(一个酸性基团和一个碱性基团)以及其他酸性基团和碱性基团的复杂组合。含有b)单个酸性基团和c)单个碱性基团的化合物的pKa分布。pKa值被划分为单个对数单位范围。直方图柱高表示为化合物总量的百分比。
最常见的酸性基团是羧酸、杂环氮原子、羟肟酸、酚类和磺酰胺,共占酸性基团的93.5%。出现频率较低的酸是磷酸盐、酰亚胺、硫酸盐、碳酸、四唑、氨基甲酸酯、醇、酸性酰胺、酸性苯胺、酰肼和硫醇。最常见的碱性基团是脂肪族胺、胍、脒、苯胺、碱性酰胺和杂环氮原子。
图2和图3显示了属于这些类别的药物实例。有趣的是,超过60%的药物只有一个或没有可电离的官能团。对含有一个碱性基团的化合物的pKa值分布进行回顾后发现,pKa值低于6.0的单一碱很少(图1 c)。对于单一含酸物质,pKa值在5-8范围内的酸性官能团非常少(图1b)。这与缺乏pKa值在此范围内的酸性官能团有关--两种最常见的酸性官能团的典型pKa值分别为:羧酸盐3.5-5,酚7.5-10.5。
表1.
化学基因组学和筛选化合物数据
集中化合物的电荷状态类别。
01
化学基因组学和筛选化合物数据集
02
化学基因组数据集的酸碱特性
最后,我们比较了配体门控、电压门控和其他离子通道(图7)。这些化合物主要是单碱基或二碱基,但31%的电压门控通道配体是中性的,23%的 "其他 "类化合物是单酸(主要是弱酸,如苯酚)。配体和电压门控通道中pKa值高于7.0的碱性化合物比例分别为55.3%和64.4%,而 "其它 "离子通道中仅有14.4%的单碱基在此范围内。
化学基因组学旨在增加我们对小型有机化合物如何与生物系统相互作用和扰动生物系统的了解。如果能将这些知识转化为用于筛选目的的定制化合物集,那么我们就能实现改进药物发现方法的目标。从上面的分析可以清楚地看出,每一类配体都具有不同的酸碱分布。图8显示了已知靶标家族的23个化学基因组学数据集的主成分分析(PCA)图,采用化合物类别、两性溶解物比例和pKa分布数据作为输入数据,揭示了靶标家族的聚类。PCA的载荷(附录1,Supping Information)显示,PC1与碱基pKa分布数据以及普通两性离子和齐聚两性离子的比例相关。酸性化合物位于图谱的上部区域。PC2与电荷状态类别数据以及部分酸pKa分布数据相关联,碱性化合物位于左下象限。酸或碱基团较少的化合物类别位于右下象限。
在该分析中,GPCR生物胺由于具有相似的单碱基pKa分布而靠近转运体(主要是单胺转运体配体)。配体门控离子通道和电压门控离子通道也聚集在一起。PDE和激酶配体通常模拟嘌呤,这种分组反映了这些化合物的杂环性质。GPCR前列腺素组、GPCR核苷酸组、整合素组、金属蛋白酶组和核受体组与其他组分开,反映了特定功能基团的高比例。例如,金属蛋白酶配体含有可与活性金属(如锌)结合的特定官能团(最常见的是羟肟酸)。与此类似,GPCR前列腺素配体也以羧酸为主。
More
左右滑动,查看更多
图 5. a) 蛋白酶配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布图
03
筛选化合物的酸碱性质
左右滑动,查看更多
图 6. a) 激酶配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布。
左右滑动,查看更多
图 7. a) 离子通道配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布图
该分析表明,药物和筛选数据集的酸碱构成存在很大差异。我们有理由相信,这种差异主要是由筛选化合物的合成和供应过程造成的。供应商公司受制于化合物的合成可得性和成本。因此,化合物的理化性质受到快速合成必要性的强烈影响。一项对医药化学家的研究发现,他们倾向于制备可溶于有机溶剂的中性分子,并在纯化过程中容易从有机溶剂中结晶出来。
高通量方法鼓励减少合成步骤(即避免化学反应性、可电离基团的保护和去保护)和易于纯化的化合物(例如,众所周知,在硅胶柱上难以纯化的齐聚物)。包括稳定性在内的其他因素可能会减少某些官能团的数量;例如,胺类化合物在储存过程中容易氧化。考虑到这些因素,可以理解的是,筛选化合物中(a)中性化合物较多,(b)普通两性化合物较多,(c)pKa<7的酸较少,(d)pKa>7的碱较少。一些化合物供应商最近提供的产品开始包含更多种类的药物化学家友好型物质,同时还出现了基于靶标的产品系列。
天然产物历来是药物和药物线索的重要来源,通常被认为比纯合成筛选的化合物更像药物。一组天然产物的性质与药物相似,但它们具有更多的可旋转键、立体中心和更高的分子量。尽管天然产物可能带来任何优势,但由于处理这些化合物的复杂性,制药行业已普遍减少在筛选中使用天然产物。在我们的分析中,我们发现天然产物组明显不同于其他筛选化合物,它们具有药物的某些特征。尽管ZINC天然产物集含有大量的中性化合物,但与筛选化合物相比,它还包括更高比例的复杂可电离化合物(始终电离、简单和复杂化合物)以及更多的齐聚物化合物。与筛选化合物相比,单酸和单碱的pKa分布更接近于药物。总的来说,天然产物数据集不能被认为与药物的特征非常吻合,但它确实包含了药物pKa分布的一些特征。该分析也可与Feher和Schmidt产生的数据一起使用,Feher和Schmidt研究了药物、天然产物和组合化学化合物的各种理化性质。
图 8. 化学基因组学数据集的主成分(PC)1 和 2 的得分图。主成分的载荷见 "辅助信息"。PC1 和 PC2 分别与碱和酸的 pKa 值相关。酸性基团比例较高的数据集一般位于图谱的右上方,而碱性化合物占多数的数据集则位于图谱的左下方。
左右滑动,查看更多
图 9. a) 药物、化合物供应商(Vendors-clean、供应商-清洁线索)和天然产品数据集之间电荷态类别的差异对比。b) 含有单一酸性或单一碱性官能团的化合物的 pKa 分布:药物、化合物供应商(Vendors-clean、供应商-清洁线索)和天然产物数据集。
More
功能集团
哪些官能团对药物和筛选化合物的酸碱性质负责?表5和表6显示了对药物、化学基因组和筛选数据集的分析。表5和表6显示,对于药物来说,最主要的酸性基团是羧酸(17%)、酚类(8%)、杂环(4%)和磺胺(3%),而最重要的碱是脂肪胺(29%)、杂环胺(28%)和苯胺(5%)。
化学基因组数据集揭示了酸碱特性的巨大多样性,反映了结合位点对配体酸碱特性的影响。例如,整合素和GPCR类原生质集之间具有极高比例的羧酸;GPCR核苷酸和激酶非酪氨酸集具有高比例的酸性杂环氮原子,而且引人注目的是,金属蛋白酶集一半以上含有羟肟酸(表1)。最后,核受体数据集显示酚酸的比例较高,而酚酸在很大程度上是雌激素配体。在所有这些情况中,特定官能团的高比例可以通过考虑其大分子结合位点的性质来合理解释。例如,金属蛋白酶组中羟肟酸的高比例与该基团需要与酶内的锌原子结合有关。值得注意的是,相对于药物数据集,供应商筛选集合中的羧酸和酚类都很缺乏,分别只有~3%和2%。
对碱性基团的分析也提供了配体与其结合位点之间的类似联系。整合素配体具有较高比例的碱性脒基和胍基(表6)。丝氨酸蛋白酶数据集偏爱脒基,而半胱氨酸蛋白酶数据集富含苯胺基。酪氨酸激酶配体含有大量碱性杂环氮原子。有几类配体含有较高比例的脂肪胺:GPCR胺、GPCR肽、GPCR A类其它和转运体。在后一种情况下,这些大分子的天然配体的基团与化学基因组中的脂肪胺之间存在着明显的联系。在药物组和筛选组中,含有脂肪族胺的化合物比例再次出现明显差异,分别为29%和2%。
结果与讨论
生物活性化合物的电离状态强烈影响其在生物系统中的行为--该化合物如何与目标结合位点相互作用,或如何在水环境和脂质环境之间分离。化合物的实际电离状态取决于局部环境的pH值,虽然通常接近中性(~7.4),但pH值范围很广。例如,在肠道内,pH值从1到8不等,而在配体结合位点的微环境中,官能团的pKa可能会受到两个单位或更多单位的干扰。因此,酸性和碱性行为的意义并不是简单的电离状态研究,它还必须包括药物发现过程中遇到的一系列生物制药情况。
结论
药物的酸性和碱性基团是大部分药物/受体相互作用的主要识别元素。在化学基因组类别中观察到的特定酸性和碱性官能团的聚集就证明了这一点,例如在GPCR类前列腺素配体中羧酸基团占优势。
配体与其结合位点之间的酸碱互补性在很大程度上决定了药物设计者所期望的亲和力。配体的酸碱性质也是亲脂性的基本决定因素,亲脂性对生物制药性质(ADMET)和非靶标活性都有很大影响。药物设计者还需要注意强离子化化合物可能会导致以下开发问题:吸收和分布不良、血浆蛋白结合力过高、hERG通道亲和力明显、磷脂中毒和制剂前景不佳。酸/碱特性也深深影响着制剂考虑因素和化学稳定性。因此,在药物发现领域进一步了解电荷状态和pKa值有可能提高效率。
本研究的主要重点是比较药物、化学基因组学数据集和筛选化合物的酸碱特征。具体来说,我们详细描述了电荷状态类别、单酸和单碱化合物的pKa分布、普通和齐聚物的比例,并确定了每个数据集的可电离官能团。我们发现药物和筛选化合物的特征存在差异,例如,在筛选化合物集中pKa值高于7.0的碱性化合物很少。此外,中性化合物在筛选化合物集中占主导地位,其数量是药物数据集的两倍。由于药物发现是以靶点为导向的,我们还研究了23个化学基因组学数据集,以提供这些蛋白质家族的酸碱概况。这些数据集显示了酸/碱谱的巨大多样性,反映了其结合位点的要求。这项工作是在我们以前研究药物pKa谱的基础上进行的。
鉴于酸碱性质对药物行为的深刻影响,在药物发现过程中考虑电荷状态和pKa值具有深远的意义。特别是,筛选化合物的选择非常重要,因为它们的选择会影响命中率效率和后续的优化过程。在选择化合物之前对其进行过滤的目的是避免将不适合测试或进一步化学处理的分子纳入其中。化合物筛选通常考虑化合物的理化性质、结构多样性、毒性或其他不受欢迎的官能团。尽管人们意识到要平衡酸碱的比例,但在筛选化合物时对pKa分布的考虑却较少关注。例如,阿斯利康公司用于基于片段筛选的两个文库。这两个文库被选择为包含1:1:4的阳离子/阴离子/中性比例,以中性化合物为主。在pH值为7.0的条件下,我们的药物数据集的酸性定义为pKa低于7.0,碱性定义为pKa高于7.0,结果阳离子/阴离子/中性的比例为2:1:2.5。
我们认为在筛选化合物时需要考虑pKa分布以及酸性和碱性官能团的多样性。如果不注意这一点,那么化合物将反映供应商数据库的酸碱特征,并将明显偏离药物特征,或者更重要的是,偏离特定化学基因组家族的一般需求。可以说,通过模仿已知药物和靶点的特征,发现将偏向于以前探索过的化学生物学。然而,通过在筛选方案中加入特定的酸/碱信息,而不是仅仅使用简单的性质筛选,有可能选择出成功概率更大的化合物,从而提高化学基因组初筛的成功率。
我们进行这项研究的主要目的是提供信息,扩大药物设计者考虑的理化性质的广度。我们认为这将有助于筛选出高质量的化合物,并突出酸碱性质在药物开发中的普遍影响。
而对于生物活性物质以及设计出的新药的pKa,在数据库中不能找到类似数据的情况下,需要我们对它们的pKa进行准确的测量来评估其在生物体内的ADMET。基于这个目的下,锐拓重磅打造,历时24个月研制的NCE P3 能完美解决这一问题。
物化参数分析仪
NCE P3
点击视频了解
通过对药物进行酸碱滴定,对滴定过程中溶液pH以及光谱的变化进行检测确定滴定终点,在计算机模型的辅助计算下得到样品的pKa,利用药物的酸碱性质确定pKa的大小,能保证测量结果的准确性,因为在利用计算机预测pKa时,对于新型化合物基团以及基团间的相互影响不能进行全面考虑,并且在药物给药后,体内pH值的变化会影响药物的pKa。这对药物的pKa预测带来一定误差,影响药物的后期开发。因此利用药物的酸碱滴定,以酸碱滴定结果得到真实的pKa结果,并且在滴定过程中,我们可以改变溶剂PH来模仿药物进入体内后的不同pH值的环境,这能更好反映药物的实际理化情况。为此NCE P3能预先设计不同的pH环境,更好的准确检测药物的pKa,这能很好的满足对药物pKa的检测,准确预测药物在体内的理化性质。
物化参数分析仪
NCE P3
孔小乐
锐拓仪器首席科学家
2023年7月25日
19:30-20:30
锐拓仪器首席科学家孔小乐博士将以线上直播课形式为大家带来重磅课程《pKa对药物研发的重要性》,欢迎大家扫码预约。
扫码预约直播课
让科学实验更轻松
Make Scientific Experiments Easier
锐拓
锐拓公众号
关注我们 了解更多