技术文章

科研助攻 | “药筛+AI“:AI 算法如何加速药物发现? | MedChemExpress

MedChemExpress LLC

2024/9/20 16:39:19

Big news!Hey, buddy! 首届上海国际计算生物学创新大赛圆满结束。 是的,没错!正是当前火热的“药物筛选 + AI”的主题。 什么?不晓得?快快快!拉上你身边信息略有闭塞的小伙伴,一起来看下AI 技术为药物筛选带来了哪些新进步?




2024 年 9 月 9 日,首届上海国际计算生物学创新大赛•药物筛选 AI 算法“凌越”挑战赛正式落下帷幕。86 支来自国内外的计算生物参赛团队运用人工智能 (AI) 算法,在这场智慧与实力的比拼中各显神通。

MCE 中国作为大赛的协办方,为大赛提供包含 1800 万个化合物的数据资源以及约 1000 个实体化合物分子。

经过高通量测试,上海药物所发现 223 个分子具有活性,并经过多轮测试,最终选出 5 个具有特异性的潜力分子。伴随着“药筛+AI”的强强联手,赛事不仅展示了前沿科技的应用,也彰显了AI在药物研发过程中的巨大潜力和重要价值。



01
基于 AI 的筛选技术,有哪些优势?

传统的药物发现之旅是艰难的,大多数的药物需要 10-15 年才能进入临床,花费数百万甚至数十亿美元的成本,最终,大多数候选药物会由于安全或者疗效问题而失败。
随着 AI 时代的到来,越来越多的事实证明,AI 是药物发现过程中的强大工具,为长期存在的挑战提供了创新的解决方案。

2_HDMukKfyVJibx4kUP2vAib8hNPH7cQ.jpg

图 1. 药理活性分子从设计到知识交流和传递的开发过程[1]




  基于 AI 筛选的优势:

1. AI 算法可以筛选庞大的生物数据库,以快的速度和高精度识别潜在的药物靶点。

2. 通过分析从基因组到临床的所有数据,AI 工具可以精确定位在疾病进展中起关键作用的分子和生物途经,为研究人员提供关于潜在治疗干预措施的宝贵见解。
3. 同时基于 AI 筛选技术对大型的化合物库数据进行快速的筛选,以识别可能与靶标结合的化合物,这个过程曾经耗时且成本高昂,现在可以在短时间内完成,大大加快了药物发现的步伐。
4. 此外,AI 驱动的预测模型可以帮助研究人员更准确的评估候选药物的有效性和安全性,从而指导优先对哪些化合物进行进一步的优化和测试

02
基于 AI 的药物发现,如何应用?

AI 辅助药物研发成功案例 

AI 在药物发现中的潜力已经在很多案例中得到证明。例如,Gupta,R. 等人 2021 年报道了基于已知癌症相关化合物和相应的生物活性的大型数据集训练了 DL (深度学习) 算法,结果获得了具有癌症治疗潜力的新型化合物,证明了 AI 在发现新型候选药物的能力[2]

MEK 也是治疗癌症的潜在靶点,但是该靶点的有效抑制剂的开发一直具有挑战性,Zhu,J 等人在 2021 年报道了通过训练 ML (机器学习) 算法,识别出这种蛋白质的新型抑制剂[3]另一个例子是通过使用 ML 算法发现 β-分泌酶 (BACE1) 的新型抑制剂,BACE1 是一种参与阿尔兹海默症的蛋白[4]在疫情大流行期间,AI 的潜力显得尤为突出,AI 算法被用于分析潜在的大型化合物数据集,并确定了可能对抗该病毒的化合物[5][6][7][8][9][10]

本次 AI 大赛获得一等奖的团队为上科大的 GeminiMol 团队,构象空间是他们的一大亮点,该模型能够识别 2D 结构不相似,但 3D 构象相似的潜在活性分子,有助于发现具有新颖结构的先导化合物。该模型基于分子间构象空间相似性对比学习来进行训练,能够表征药物小分子的构象空间特征,全面反映与分子结构相关的分子属性、潜在药效性质等,进而在包括基于配体的虚拟筛选、靶标鉴定、分子属性预测等多种药物发现任务上表现出均衡的优良性能。

近日,该模型相关论文“Conformational Space Profiling Enhances Generic Molecular Representation for AI-powered Ligand-based Drug Discovery”已发布于国际期刊 Advanced Science 杂志。

4_PKsia96H1U49AQjT5JOJv3PMtq4PQw.jpg

5_brRkGeeSdaRq0iauUMMIzPAmkZLjrg.jpg

图 2. GeminiMol 模型架构图[11]



03
AI 制药,未来会怎么样?

去年,Insilico Medicine 公司基于 AI 生成的抗纤维化药物,名为 INS018_055,是进入临床II期实验的化合物。

今年 3 月,Insilico 在 Nature Biotechnology 上详细报道了从采用大型语言模型 (LLM) 生成到临床试验的整个过程。
2023 年,美国食品和药品管理局 (FDA) 发布了 AI 在药物发现中使用的相关指南,该报告强调了潜在的关键应用领域,同时也考虑到了降低风险以及对这一技术更明确的指导方针。在更清晰的指导下,研究人员能够更好的应用这项技术。
另一个确保 AI 实践的条件是建立对模型的信任,在最近的 Front Line Genomics 网络研讨会上,Richard Lewis (Novartis 计算机辅助药物设计数据科学总监) 讨论了模型构建的社会学考虑因素以及 AI 在药物发现中的地位。如果研究人员对这项技术有更好的理解和信任,那么 AI 应该能够在此过程中更有效地使用。 
尽管截止 2024 年,尚未有 AI 生成的药物获批上市,科学家仍在努力推动AI在药物发现中的应用。


04
MCE:一站式药筛平台

MCE 一站式药筛平台聚焦于药物发现早期,积极拥抱 AI 带来的巨大机遇和挑战,将越来越多的 AI 技术应用到各个业务模块。化合物库方面,除了通过 AI 算法生成 MegaUni 1,000 万虚拟类药多样库,还将 AI 算法应用到各种类型的 Mini 化合物库的构建,帮助客户更高效地获得符合自己需求的化合物库。虚拟筛选方面,将 AI 主动学习和分子对接相结合,以支持更大规模的虚拟筛选。

此外,MCE 拥有已知活性库、类药多样库、特色片段库及药物筛选、先导化合物优化技术平台为科研客户及新药研发客户提供—站式药物发现及研究服务。

6_LIicO1FL79rIEicqCO4veMJuwVcXKw.jpg

图 3. MCE一站式药筛平台简介。 

未来,平台将紧跟研发前沿,持续丰富专业资源与科研工具,提升视觉形象与用户体验,链接产业链资源,推进产业提质增效。在系统化、专业化、精益化的战略下,平台致力于打造适合科学研究领域的一站式药物发现及研究服务平台,构建开放、公益的化合物信息共享平台,为科学研究提供各种化合物与试剂,为科研工作者和学术界提供一个创新、高效、协作的平台,为新药研发提供智能化解决方案,更好推动科学发展和知识共享。


产品推荐

DNA 编码化合物库合成与筛选

DNA 编码化合物库(DNA Encoded compound Library,DEL)技术作为新颖、强大的苗头化合物发现引擎,可快速从几千万至数十亿分子中,遴选出结构新颖、具有潜在成药性的化合物,大大缩短药物研究周期,降低研发成本。在 DEL 库中,每一个分子砌块(Building Block)都由一段已知的 DNA 序列进行标记,通过 DNA 兼容反应和组合化学模式,历经数个循环即可获得上亿 DEL 分子。数十亿化合物可以混合在一管中筛选,最终通过高通量测序技术,解码 DEL 分子的专属 DNA 标签,快速获得针对靶点的苗头化合物信息。

50K Diversity Library (HY-L901)

由 50,000 种类药化合物组成。本多样性库具备新颖性、类药性,结构多样性等特点,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。

5K Scaffold Library(HY-L902)

由 5,000 种类药化合物组成,每种化合物代表一种结构骨架,保证了库的结构多样性。库中的化合物均经过 MedChem & PAINS filters 筛选,剔除了不合适的化学结构,避免“目标错误”。本库化合物数量少但结构足够多样,是药物筛选的有力工具。

3D Diverse Fragment Library (HY-L903)

由 5,196 个非平面片段分子组成 (平均 Fsp3 值为 0.58),超过 4,700 个片段至少包含一个手性中心。本库设计的关键元素是 3D 结构、多样性、生物反应性等,有效提高了片段潜在生物活性,为基于片段的药物发现提供了更高的片段命中概率。

Drug Fragment Library (HY-L904)

MCE Drug Fragment Library 由 1,000 个药物片段组成。这些药物片段来自 2,946 个 FDA 已批准的药物分子,同一药物的不同片段可以出现在其他药物中,这些片段和 PK/PD 性质存在一定的相关性,基于片段的筛选可以为后续优化结构预留出足够的化学空间,该化合物库是 FBDD(基于片段的药物设计)药物筛选的工具。 

Natural Product-like Library (HY-L905)

MCE Natural Product-like Compound Library 由 5,000 个来自类药库的类天然产物化合物组成,库中每个分子含有天然产物关键骨架(42 个)或者和天然产物的谷本相似系数大于 0.6,且Natural-likeness scoring > -2,该化合物库同时具备类药性和新颖性,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。



参考详情:
[1] Blanco-González, et al. The Role of AI in Drug Discovery: Challenges, Opportunities, and Strategies. Pharmaceuticals 2023, 16,891.

[2] Gupta, R.; et al. Artificial intelligence to deep learning: Machine intelligence approach for drug discovery. Mol. Divers. 2021, 25, 1315–1360.
[3] Zhu, J.; et al. Prediction of drug efficacy from transcriptional profiles with deep learning. Nat. Biotechnol. 2021, 39, 1444–1452.
[4] Dhamodharan, G.; et al. Machine learning models for predicting the activity of AChE and BACE1 dual inhibitors for the treatment of Alzheimer’s disease. Mol. Divers. 2022, 26, 1501–1517.
[5] Lv, H.; et al. Application of artificial intelligenceand machine learning for  drug discovery and vaccine design. Brief. Bioinform. 2021, 22, bbab320.
[6] Monteleone, S.; et al. Fighting  with Artificial Intelligence. In Methods in Molecular Biology; Humana Press Inc.: Totowa, NJ, USA, 2022; Volume 2390, pp. 103–112.
[7] Zhou, Y.; et al. Artificial intelligence in  drug repurposing. Lancet Digit. Health 2020, 2, e667–e676.
[8] Verma, N.; et al. Predicting potential SARS-CoV-2 drugs-in depth drug database screening using deep neural network framework ssnet, classical virtual screening and docking. Int. J. Mol. Sci. 2021, 22, 1392.
[9] Bung, N.; et al. De novo design of new chemical entities for SARS-CoV-2 using artificial intelligence.Future Med. Chem. 2021, 13, 575–585.
[10] Floresta, G.; et al. Artificial Intelligence Technologies for De Novo Drug Design. Int. J. Mol. Sci. 2022, 23, 3261.

[11] Wang L, et al. Conformational Space Profiling Enhances Generic Molecular Representation for AI-Powered Ligand-Based Drug Discovery. Adv Sci (Weinh). 2024 Aug 29:e2403998.



相关产品

当前客户在线交流已关闭
请电话联系他 :