深圳市锐拓仪器设备有限公司

化工仪器网中级6

收藏

解锁新药物发现的密码 | 基于电离常数的化学基因组分析方法

时间:2023-07-24      阅读:846

简介

为了提高药物发现过程的效率,药物化学家广泛应用化学基因组学原理来定制合成或筛选工作,从而使候选分子与其靶点相匹配。将化合物空间与靶标空间相关联已经促进了这一领域的许多研究,在目前的研究中,通过在大量的化学基因组学数据集中专门探索分子酸碱性质对生物活性的影响来扩展这些研究。此外,我们还通过研究筛选化合物(包括 "天然产品 "组)的酸碱性质来补充这些分析。

分子中存在的酸性和碱性官能团是化学基因组学中的一个重要因素,因为它们会强烈影响分子的理化性质,如亲油性和水溶性,反过来,这些因素又会影响化合物在生物系统中的行为,即受体相互作用以及吸收、分布、代谢、排泄和毒理学(ADMET)。酸/碱性质对ADMET特性影响的具体例子包括酸性化合物倾向于表现出更高的血浆蛋白结合力,从而影响分布容积,而碱性化合物则倾向于通过磷脂中毒和蛋白通道结合等机制表现出更大的毒性。

在配体的杂合性与分子量(MW)和分配系数(logP)等特性之间建立联系时。更大和更亲脂的分子有可能与不止一个靶点相互作用,电荷状态也可能对非靶点选择性起作用,因此,电离常数从根本上关系到化合物的行为方式及其整体的类药物特性。此外,酸电离常数(pKa)值和电离状态对药物制剂有重要影响,尤其是在化合物需要在溶液中给药的情况下。在影响水溶性的主要因素中,极性是一个关键参数,但它需要与适当的亲脂性相平衡,才能使分子穿过膜并与特定的大分子相互作用。受体相互作用同样需要药物官能团与大分子结合部位的官能团互补。总之,电荷状态和电离常数深深地影响药物的性质,因此需要进一步研究药物的酸/碱特性。

为了更深入地了解药物的酸碱性质,我们研究了已上市药物的pKa分布。然而,这一项工作仅探讨了当代药物,将其扩展到更广泛的化合物将是有益的。

本研究检查药物、对于药物的化学基因组和筛选出的化合物的酸碱特征,对他们进行三个层次的分析。通过化合物的统计以确定具有可电离官能团的化合物,并将这些物质分类。可电离化合物的pKa值以图表的形式显示,包括单一酸和单一碱化合物。总之,我们希望能够就筛选化合物或研究化学品是否符合药物的酸碱特性提出问题。该研究旨在提高我们对酸碱特征及其对生物活性的基本影响的认识。

 

 

实验部分

药物数据集是来自新墨西哥大学(Albuquerque, NM, USA)的内部收集。剔除了不含碳的化合物、含重金属的化合物、盐类、聚合物、混合物以及分子量(MW)大于1000Da的物质,剩下3766种化合物。这些化合物代表了欧洲、亚洲和美国已批准使用的当代临床使用的单一物质。

商用化合物数据库选自ZINC数据库,该数据库包含超过107种商用化合物的信息。ZINC数据库提供了从完整数据库中根据计算性质(如MW、logP、氢键供体/受体数量、可旋转键的数量和PSA)推导的子集。

01

对以下ZINC子集进行了检测:

向上滑动阅览

  1. 由6676776个化合物组成的 "类药物供应商清洁 "子集。该子集由ZINC数据库通过筛选得到。这些过滤器结合了各种 "类药物 "标准,包括以下限制条件:logP≤5、MW≤500和MW>150、可旋转键<8、PSA<150和H键受体数量<10。一组条件用于从药物化学的角度排除某些不需要的官能团(如酸卤化物、磷烷、硫氰酸盐、过氧化物、醛等)

     

  2. 供应商清洁先导化合物 "子集包含1716660个化合物,可用于早期发现研究,以确定有用的先导化合物。这些化合物具有以下特征:ClogP<3.5,MW<350,可旋转键≤7,但不包括ClogP≤2.5,MW≤250,可旋转键≤5的化合物。

     

  3. "天然产品 "数据集包含来自七个供应商的89398个化合物。这些化合物由供应商指定为天然来源或天然产物的衍生物。天然产物数据集中化合物分别来自InterBioScreen(俄罗斯莫斯科)、Molecular Diversity Preservation International(MDPI;瑞士巴塞尔)、TimTec(美国德克萨斯州纽瓦克)、AmbInter(法国奥尔良)、Indofine(美国新泽西州希尔斯伯勒)、Specs & BioSpecs(荷兰代尔夫特)和AnalytiCon Discovery(德国波茨坦)。应考虑 "天然 "的定义,因为这是由供应商决定的。

     

    化学基因组学数据库WOMBAT用于生成作用于一系列大分子靶类的生物活性化合物列表。Instant JChem用于化合物搜索和文件处理。研究了以下目标类别:天冬氨酰蛋白酶、半胱氨酸蛋白酶、G蛋白偶联受体(GPCR)-生物胺、GPCR-大麻素、GPCR-类核苷酸、GPCR-肽、GPCR-类固醇、GPCR-其他(A类)、GPCR-B类、GPCR-C类、整合素、 配体门控离子通道、电压门控离子通道、离子通道-其他、金属蛋白酶、核激素受体、酪氨酸激酶、激酶(非酪氨酸)、氧化还原酶、氧合酶、磷酸二酯酶、丝氨酸蛋白酶和转运体。此外,一组未指定靶标的化合物被归入 "未知 "组。总共研究了24个化学基因组学数据集。对每个数据集都进行了过滤以减少列表的大小。去除分子量>1000的大分子化合物,对特定靶点的效力小于1 mm的化合物被剔除。

 

 

02

对于每个数据集,都遵循以下程序

向上滑动阅览

A. 确定了含有永*久电离的官能团(如季氮原子)的化合物。在本分析中,这些分子被归类为 "始终电离",因此未估算这些化合物的pKa值。


B. 使用Marvin软件预测每种化合物的pKa值,并使用pKa数据将化合物分为 "始终电离"、"可电离 "和 "中性"。我们的分类系统基于以下内容:具有pKa <0的酸性基团或pKa >12的碱性基团的化合物被添加到始终离子化物质列表中。PKa >10的酸性基团或pKa <0的碱性官能团被视为中性。pKa值在0-10之间的酸和pKa值在0-12之间的碱被归类为可电离物质。Marvin软件能够将这些pKa值估计到一个对数单位之内。用于定义酸和碱的可电离基团的pKa范围是在与经验丰富的药物化学家和药物开发人员讨论后选择的。这一决定与我们对pKa值的考虑不谋而合,即pKa值应接近人体内的pH值。此外,pKa范围还与药物制剂领域的pH值相关。

 

C. 使用内部算法结合pKa计算进行了进一步的结构搜索,以确定整个数据集中每个可电离基团的身份。

 

D. 简单两性溶解物是含有一个酸性和一个碱性官能团的化合物。通过考虑官能团的pKa值,可将这些化合物进一步划分为普通两聚物和齐聚物。如果酸性官能团的pKa值大于碱性官能团的pKa值,则被视为普通两性溶解物。同样,如果酸性基团的pKa值小于碱性基团的pKa值,则定义为齐聚物。根据每种简单两聚物的pKa值确定普通两聚物和齐聚物的比例。

 

 

结果与讨论

生物活性化合物的电离状态强烈影响其在生物系统中的行为--该化合物如何与目标结合位点相互作用,或如何在水环境和脂质环境之间分离。化合物的实际电离状态取决于局部环境的pH值,虽然通常接近中性(~7.4),但pH值范围很广。例如,在肠道内,pH值从1到8不等,而在配体结合位点的微环境中,官能团的pKa可能会受到两个单位或更多单位的干扰。因此,酸性和碱性行为的意义并不是简单的电离状态研究,它还必须包括药物发现过程中遇到的一系列生物制药情况。

 

 

当代药物

选择经过批准的药物数据集来代表当代治疗分子。这个精心策划的数据集由美国、欧洲和亚洲监管机构批准的药物组成,从制药和医学的角度来看,可以被认为是具有国际意义的。

 

在本研究中,我们对药物数据集进行了过滤,保留了所有含碳物质,并剔除了含有重金属、盐类、混合物、聚合物以及分子量>1000的化合物。预测了每个分子的pKa值,并将化合物分为电荷状态类别:始终电离(6.3%)、中性(20.2%)、单酸(14.2%)、二酸(3.5%)、单碱(27.8%)、二碱(10.1%)、简单两元化合物(含有一种酸和一种碱的化合物;9.5%)和复杂化合物(8.4%;表1,图1 a)。图1b, c显示了药物数据集中单酸和单碱化合物的pKa分布。

图片
图片
图片

左右滑动,查看更多

 

图1.a) 获准用于人体(药物)的小分子药物的酸/碱类别细分。酸/碱类别包括始终离子化(pKa<0的酸、pKa>12的碱和带永*久荷的化合物)、中性化合物、单酸物质、单碱物质、含两个酸性基团的化合物、含两个碱性基团的化合物、简单的两性化合物(一个酸性基团和一个碱性基团)以及其他酸性基团和碱性基团的复杂组合。含有b)单个酸性基团和c)单个碱性基团的化合物的pKa分布。pKa值被划分为单个对数单位范围。直方图柱高表示为化合物总量的百分比。

 

最常见的酸性基团是羧酸、杂环氮原子、羟肟酸、酚类和磺酰胺,共占酸性基团的93.5%。出现频率较低的酸是磷酸盐、酰亚胺、硫酸盐、碳酸、四唑、氨基甲酸酯、醇、酸性酰胺、酸性苯胺、酰肼和硫醇。最常见的碱性基团是脂肪族胺、胍、脒、苯胺、碱性酰胺和杂环氮原子。

图2和图3显示了属于这些类别的药物实例。有趣的是,超过60%的药物只有一个或没有可电离的官能团。对含有一个碱性基团的化合物的pKa值分布进行回顾后发现,pKa值低于6.0的单一碱很少(图1 c)。对于单一含酸物质,pKa值在5-8范围内的酸性官能团非常少(图1b)。这与缺乏pKa值在此范围内的酸性官能团有关--两种最常见的酸性官能团的典型pKa值分别为:羧酸盐3.5-5,酚7.5-10.5。

图片

表1.

 化学基因组学和筛选化合物数据

集中化合物的电荷状态类别。

 

01

化学基因组学和筛选化合物数据集

向上滑动阅览

WOMBAT数据库包含了30多万个化合物,其相关的靶标生物活性数据是从同行评议的文献中精心筛选出来的。我们对每组化合物进行了筛选,以选出在浓度为1 mm或更低时具有活性的化合物,并设定了截留分子量。在估算pKa值后,将化合物归入电荷状态类别。配体酸碱性质的化学基因组学分析以前没有进行过。

ZINC数据库是一个虚拟库,包含了100多个供应商提供的可购买的化学结构,其开发目的是为了方便对接实验。在本研究中,我们采用了ZINC数据库中的三组化合物来代表可用于生物筛选的化合物。这些数据集经过了ZINC数据的预过滤,剔除了不适合药物化学的化合物。最大的数据集来自包括主要供应商的660万个市售筛选化合物,被称为 "Vendors-clean "集。这些化合物的一个较小的子集主要根据低分子量和亲油性进行筛选,被称为 "Vendors-clean leads "集。最后,对天然产物集进行了评估,这些化合物被供应商自己归类为天然产物或天然产物的衍生物。

图片

图 2. 中性、始终电离、单一酸和二元酸类化合物示例

 

02

化学基因组数据集的酸碱特性

向上滑动阅览

表1总结了药物、化学基因组学和筛选化合物数据集的电荷状态类别。表2和表3提供了含单酸和单碱化合物这两类最大化合物pKa分布的详细信息。在我们的分析中,最小的数据集包含1000多种化合物,而大多数数据集包含2000多种物质。在本文中,我们选择了四个化学基因组家族来对比其酸碱性质的差异。这些靶标是G蛋白偶联受体(GPCRs;生物胺、核苷酸和肽受体)、三个蛋白酶家族(天冬氨酰、半胱氨酸和丝氨酸)、激酶(酪氨酸和非酪氨酸)和离子通道(配体门控、电压门控和其他种类)。

图4 a显示了三个GPCR家族的电荷状态类别。值得注意的是,这些靶标主要识别含碱化合物。GPCR生物胺数据集包含20 712种化合物,其中50%以上具有单一碱性基团,主要由脂肪族胺和碱性杂环氮原子组成。相比之下,同一数据集中只有4种化合物含有单一酸性基团。天冬氨酸残基是识别相关(神经)递质碱性氨基的关键,因此碱性基团所占比例较高。相比之下,肽和核苷酸受体确实能识别一些中性和酸性化合物。图4b显示了含单一碱基化合物的概况。值得注意的是,核苷酸GPCR配体显示出与肽和生物胺GPCR配体截然不同的特性。

图5显示了蛋白酶实例的概况,说明了各类蛋白酶之间的细微差别。有趣的是,丝氨酸蛋白酶中含有大量pKa值高于8.0的碱性基团的化合物。这些碱性基团(主要是脒基和碱性杂环氮原子)的存在与功能基团与蛋白质(如因子Xa)的S1口袋相互作用的需要相吻合。

激酶类化合物以含有一个或两个碱性基团的化合物为主(54%)。图6显示,无论是碱性基团还是酸性基团,在生理pH值下完全电离的化合物都很少(即pKa值低于6.0的酸和pKa值高于9.0的碱)。同样,pH值为7.4时带电的官能团也很少,这与结合位点的氢键要求一致。

图片

图 3. 单碱基、二碱基、简单两性化合物和复杂化合物类别中的化合物示例

 

 

 

最后,我们比较了配体门控、电压门控和其他离子通道(图7)。这些化合物主要是单碱基或二碱基,但31%的电压门控通道配体是中性的,23%的 "其他 "类化合物是单酸(主要是弱酸,如苯酚)。配体和电压门控通道中pKa值高于7.0的碱性化合物比例分别为55.3%和64.4%,而 "其它 "离子通道中仅有14.4%的单碱基在此范围内。

化学基因组学旨在增加我们对小型有机化合物如何与生物系统相互作用和扰动生物系统的了解。如果能将这些知识转化为用于筛选目的的定制化合物集,那么我们就能实现改进药物发现方法的目标。从上面的分析可以清楚地看出,每一类配体都具有不同的酸碱分布。图8显示了已知靶标家族的23个化学基因组学数据集的主成分分析(PCA)图,采用化合物类别、两性溶解物比例和pKa分布数据作为输入数据,揭示了靶标家族的聚类。PCA的载荷(附录1,Supping Information)显示,PC1与碱基pKa分布数据以及普通两性离子和齐聚两性离子的比例相关。酸性化合物位于图谱的上部区域。PC2与电荷状态类别数据以及部分酸pKa分布数据相关联,碱性化合物位于左下象限。酸或碱基团较少的化合物类别位于右下象限。

在该分析中,GPCR生物胺由于具有相似的单碱基pKa分布而靠近转运体(主要是单胺转运体配体)。配体门控离子通道和电压门控离子通道也聚集在一起。PDE和激酶配体通常模拟嘌呤,这种分组反映了这些化合物的杂环性质。GPCR前列腺素组、GPCR核苷酸组、整合素组、金属蛋白酶组和核受体组与其他组分开,反映了特定功能基团的高比例。例如,金属蛋白酶配体含有可与活性金属(如锌)结合的特定官能团(最常见的是羟肟酸)。与此类似,GPCR前列腺素配体也以羧酸为主。

 

表2. 含单一酸性官能团化合物的pKa分布表

图片

表3. 含单一碱性官能团化合物的pKa分布

图片

图 4. a)GPCR配体的化合物类型概览

图片

b)含有单一碱性官能团的化合物的pKa分布

图片

More

图片
图片

左右滑动,查看更多

 

图 5. a) 蛋白酶配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布图

 

03

筛选化合物的酸碱性质

向上滑动阅览

目前的药物发现在很大程度上依赖于筛选技术。在过去的十年中,商业供应商提供了大量的化合物,并对药物和先导化合物的理化性质进行了大量的分析,但是对筛选化合物的酸碱性质的系统分析还没有发表过。在本节中,我们分析了ZINC数据库中 "供应商-类药物"、"供应商-清洁先导化合物 "和 "天然产物 "集的酸碱性质。

与药物和化学基因组学数据集一样,我们估算了筛选化合物集(供应商-类药物、供应商-清洁先导物和天然产物)的pKa值,并将其分为电荷态类别(表1-3)。图9显示了筛选化合物集的电荷状态类别,并将其与药物数据集进行了比较。最明显的是,与药物相比,所有筛选集的中性化合物比例更高,总是电离或可电离基团的化合物更少。供应商-类药物集和供应商-清洁引线集彼此非常相似,这是可以理解的,因为供应商-清洁引线是更大的商用化合物集的一个子集。药物数据集中包含了相当一部分(6%)永久离子化的化合物,这些化合物在供应商数据中基本不存在,在天然产物数据集中仅占1.4%。完全中性化合物占所有筛选化合物的40%以上,但只占药物的20%。单酸类,特别是二酸类化合物在供应商集中的比例较低,尽管这些化合物在天然产物集中的比例相当高。与此形成鲜明对比的是,单碱基在筛选集中的比例接近药物中的比例,尽管天然产物集中的单碱基比例略低,而供应商集中的单碱基比例略高。所有筛选集中的二碱基和两聚物的数量仅为药物中的三分之二。其余类别的复杂化合物约占药物的8%,但只占天然产物的4.1%和筛选化合物的1.5%。

为了进一步突出筛选化合物和药物组之间的差异,图9b、c显示了单酸和含单碱化合物的pKa分布(表2)。图9b显示,与药物和天然产物集相比,筛选化合物供应商有更多pKa值高于6.0的酸。在这种情况下,只有41%的单酸药物pKa值高于6.0,而供应商数据集的这一比例为82%。药物和天然产物数据集中pKa值在3-5之间的单酸所占比例相当大,而这些单酸在供应商数据集中所占比例较小。图9 c显示了当代药物和筛选化合物集(表3)的单一碱基pKa分布之间的主要差异。供应商化合物集以 pKa 值低于5.0的弱碱为主,而药物集则有很大一部分pKa值在7-10之间。天然产物集介于这两个集之间。

单纯两性溶解物约占药物数据集的10%。两聚物可定义为普通两聚物(酸性官能团的pKa值高于碱性官能团)或齐聚两聚物(相反)。在普通两聚物中,化合物的中性种类在等电点占主导地位,而在齐聚物中则存在双电荷种类。表4列出了药物、化学基因组数据集和筛选化合物中普通和齐聚物的比例。在药物简单两性溶质中,齐聚物占了近一半,但在筛选化合物中发现95%以上的两性溶质为普通两性溶质(表4)。化学基因组数据集显示,存在的两性离子数量以及普通两性离子和齐聚物的比例存在很大差异。最值得注意的是,30%以上的整合素的数据集是两性溶质,而且几乎全部是齐聚物。

图片
图片
图片

左右滑动,查看更多

图 6. a) 激酶配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布。

图片
图片

左右滑动,查看更多

图 7. a) 离子通道配体的电荷状态类别概览。含有b)单个酸性官能团和c)单个碱性官能团的化合物的pKa分布图

 

该分析表明,药物和筛选数据集的酸碱构成存在很大差异。我们有理由相信,这种差异主要是由筛选化合物的合成和供应过程造成的。供应商公司受制于化合物的合成可得性和成本。因此,化合物的理化性质受到快速合成必要性的强烈影响。一项对医药化学家的研究发现,他们倾向于制备可溶于有机溶剂的中性分子,并在纯化过程中容易从有机溶剂中结晶出来。

高通量方法鼓励减少合成步骤(即避免化学反应性、可电离基团的保护和去保护)和易于纯化的化合物(例如,众所周知,在硅胶柱上难以纯化的齐聚物)。包括稳定性在内的其他因素可能会减少某些官能团的数量;例如,胺类化合物在储存过程中容易氧化。考虑到这些因素,可以理解的是,筛选化合物中(a)中性化合物较多,(b)普通两性化合物较多,(c)pKa<7的酸较少,(d)pKa>7的碱较少。一些化合物供应商最近提供的产品开始包含更多种类的药物化学家友好型物质,同时还出现了基于靶标的产品系列。

天然产物历来是药物和药物线索的重要来源,通常被认为比纯合成筛选的化合物更像药物。一组天然产物的性质与药物相似,但它们具有更多的可旋转键、立体中心和更高的分子量。尽管天然产物可能带来任何优势,但由于处理这些化合物的复杂性,制药行业已普遍减少在筛选中使用天然产物。在我们的分析中,我们发现天然产物组明显不同于其他筛选化合物,它们具有药物的某些特征。尽管ZINC天然产物集含有大量的中性化合物,但与筛选化合物相比,它还包括更高比例的复杂可电离化合物(始终电离、简单和复杂化合物)以及更多的齐聚物化合物。与筛选化合物相比,单酸和单碱的pKa分布更接近于药物。总的来说,天然产物数据集不能被认为与药物的特征非常吻合,但它确实包含了药物pKa分布的一些特征。该分析也可与Feher和Schmidt产生的数据一起使用,Feher和Schmidt研究了药物、天然产物和组合化学化合物的各种理化性质。

图片

图 8. 化学基因组学数据集的主成分(PC)1 和 2 的得分图。主成分的载荷见 "辅助信息"。PC1 和 PC2 分别与碱和酸的 pKa 值相关。酸性基团比例较高的数据集一般位于图谱的右上方,而碱性化合物占多数的数据集则位于图谱的左下方。

 

图片
图片
图片

左右滑动,查看更多

 

图 9. a) 药物、化合物供应商(Vendors-clean、供应商-清洁线索)和天然产品数据集之间电荷态类别的差异对比。b) 含有单一酸性或单一碱性官能团的化合物的 pKa 分布:药物、化合物供应商(Vendors-clean、供应商-清洁线索)和天然产物数据集。

 

表 4. 存在于药物、化学基因组和筛选数据集中的普通和齐聚物两性溶质的比例

图片

表5. 化学基因组学数据集和筛选化合物库中存在的酸性官能团

 

图片

表6. 化学基因组学数据集和筛选化合物库中存在的基本官能团

 

More

功能集团

哪些官能团对药物和筛选化合物的酸碱性质负责?表5和表6显示了对药物、化学基因组和筛选数据集的分析。表5和表6显示,对于药物来说,最主要的酸性基团是羧酸(17%)、酚类(8%)、杂环(4%)和磺胺(3%),而最重要的碱是脂肪胺(29%)、杂环胺(28%)和苯胺(5%)。

化学基因组数据集揭示了酸碱特性的巨大多样性,反映了结合位点对配体酸碱特性的影响。例如,整合素和GPCR类原生质集之间具有极高比例的羧酸;GPCR核苷酸和激酶非酪氨酸集具有高比例的酸性杂环氮原子,而且引人注目的是,金属蛋白酶集一半以上含有羟肟酸(表1)。最后,核受体数据集显示酚酸的比例较高,而酚酸在很大程度上是雌激素配体。在所有这些情况中,特定官能团的高比例可以通过考虑其大分子结合位点的性质来合理解释。例如,金属蛋白酶组中羟肟酸的高比例与该基团需要与酶内的锌原子结合有关。值得注意的是,相对于药物数据集,供应商筛选集合中的羧酸和酚类都很缺乏,分别只有~3%和2%。

对碱性基团的分析也提供了配体与其结合位点之间的类似联系。整合素配体具有较高比例的碱性脒基和胍基(表6)。丝氨酸蛋白酶数据集偏爱脒基,而半胱氨酸蛋白酶数据集富含苯胺基。酪氨酸激酶配体含有大量碱性杂环氮原子。有几类配体含有较高比例的脂肪胺:GPCR胺、GPCR肽、GPCR A类其它和转运体。在后一种情况下,这些大分子的天然配体的基团与化学基因组中的脂肪胺之间存在着明显的联系。在药物组和筛选组中,含有脂肪族胺的化合物比例再次出现明显差异,分别为29%和2%。

 

结果与讨论

生物活性化合物的电离状态强烈影响其在生物系统中的行为--该化合物如何与目标结合位点相互作用,或如何在水环境和脂质环境之间分离。化合物的实际电离状态取决于局部环境的pH值,虽然通常接近中性(~7.4),但pH值范围很广。例如,在肠道内,pH值从1到8不等,而在配体结合位点的微环境中,官能团的pKa可能会受到两个单位或更多单位的干扰。因此,酸性和碱性行为的意义并不是简单的电离状态研究,它还必须包括药物发现过程中遇到的一系列生物制药情况。

 

 

结论

药物的酸性和碱性基团是大部分药物/受体相互作用的主要识别元素。在化学基因组类别中观察到的特定酸性和碱性官能团的聚集就证明了这一点,例如在GPCR类前列腺素配体中羧酸基团占优势。

配体与其结合位点之间的酸碱互补性在很大程度上决定了药物设计者所期望的亲和力。配体的酸碱性质也是亲脂性的基本决定因素,亲脂性对生物制药性质(ADMET)和非靶标活性都有很大影响。药物设计者还需要注意强离子化化合物可能会导致以下开发问题:吸收和分布不良、血浆蛋白结合力过高、hERG通道亲和力明显、磷脂中毒和制剂前景不佳。酸/碱特性也深深影响着制剂考虑因素和化学稳定性。因此,在药物发现领域进一步了解电荷状态和pKa值有可能提高效率。

本研究的主要重点是比较药物、化学基因组学数据集和筛选化合物的酸碱特征。具体来说,我们详细描述了电荷状态类别、单酸和单碱化合物的pKa分布、普通和齐聚物的比例,并确定了每个数据集的可电离官能团。我们发现药物和筛选化合物的特征存在差异,例如,在筛选化合物集中pKa值高于7.0的碱性化合物很少。此外,中性化合物在筛选化合物集中占主导地位,其数量是药物数据集的两倍。由于药物发现是以靶点为导向的,我们还研究了23个化学基因组学数据集,以提供这些蛋白质家族的酸碱概况。这些数据集显示了酸/碱谱的巨大多样性,反映了其结合位点的要求。这项工作是在我们以前研究药物pKa谱的基础上进行的。

鉴于酸碱性质对药物行为的深刻影响,在药物发现过程中考虑电荷状态和pKa值具有深远的意义。特别是,筛选化合物的选择非常重要,因为它们的选择会影响命中率效率和后续的优化过程。在选择化合物之前对其进行过滤的目的是避免将不适合测试或进一步化学处理的分子纳入其中。化合物筛选通常考虑化合物的理化性质、结构多样性、毒性或其他不受欢迎的官能团。尽管人们意识到要平衡酸碱的比例,但在筛选化合物时对pKa分布的考虑却较少关注。例如,阿斯利康公司用于基于片段筛选的两个文库。这两个文库被选择为包含1:1:4的阳离子/阴离子/中性比例,以中性化合物为主。在pH值为7.0的条件下,我们的药物数据集的酸性定义为pKa低于7.0,碱性定义为pKa高于7.0,结果阳离子/阴离子/中性的比例为2:1:2.5。

我们认为在筛选化合物时需要考虑pKa分布以及酸性和碱性官能团的多样性。如果不注意这一点,那么化合物将反映供应商数据库的酸碱特征,并将明显偏离药物特征,或者更重要的是,偏离特定化学基因组家族的一般需求。可以说,通过模仿已知药物和靶点的特征,发现将偏向于以前探索过的化学生物学。然而,通过在筛选方案中加入特定的酸/碱信息,而不是仅仅使用简单的性质筛选,有可能选择出成功概率更大的化合物,从而提高化学基因组初筛的成功率。

我们进行这项研究的主要目的是提供信息,扩大药物设计者考虑的理化性质的广度。我们认为这将有助于筛选出高质量的化合物,并突出酸碱性质在药物开发中的普遍影响。

 

   而对于生物活性物质以及设计出的新药的pKa,在数据库中不能找到类似数据的情况下,需要我们对它们的pKa进行准确的测量来评估其在生物体内的ADMET。基于这个目的下,锐拓重磅打造,历时24个月研制的NCE P3 能完美解决这一问题。

图片

物化参数分析仪

NCE P3


 

点击视频了解

通过对药物进行酸碱滴定,对滴定过程中溶液pH以及光谱的变化进行检测确定滴定终点,在计算机模型的辅助计算下得到样品的pKa,利用药物的酸碱性质确定pKa的大小,能保证测量结果的准确性,因为在利用计算机预测pKa时,对于新型化合物基团以及基团间的相互影响不能进行全面考虑,并且在药物给药后,体内pH值的变化会影响药物的pKa。这对药物的pKa预测带来一定误差,影响药物的后期开发。因此利用药物的酸碱滴定,以酸碱滴定结果得到真实的pKa结果,并且在滴定过程中,我们可以改变溶剂PH来模仿药物进入体内后的不同pH值的环境,这能更好反映药物的实际理化情况。为此NCE P3能预先设计不同的pH环境,更好的准确检测药物的pKa,这能很好的满足对药物pKa的检测,准确预测药物在体内的理化性质。

 

 

 

图片

物化参数分析仪

NCE P3

孔小乐

锐拓仪器首席科学家

2023年7月25日

19:30-20:30

锐拓仪器首席科学家孔小乐博士将以线上直播课形式为大家带来重磅课程《pKa对药物研发的重要性》,欢迎大家扫码预约。

 

图片

 

扫码预约直播课

 

 

 

让科学实验更轻松

Make Scientific Experiments Easier

图片

        锐拓

图片

           锐拓公众号

关注我们 了解更多

 

上一篇: 除了作为餐桌上的美味佳肴,猪耳皮在药物研究中还能怎么用? 下一篇: 想研究生物相关溶出?看看美国药典如何测量生物相关溶解度吧?
提示

请选择您要拨打的电话: