利用化学计量学和 Agilent 5975对洋甘菊花及其精油和
时间:2022-04-18 阅读:470
摘要本文中,开发出了一种高精度统计学模型用于确定商品草药生产中所使用的洋甘菊的确切类型。该模型是根据 Agilent 7890 GC 和 Agilent 5975 GC/MSD 系统得到的精确 GC/MS数据而开发。样品的质量控制采用主成分分析法 (PCA),而样品类别预测模型的建立是基于偏最小二乘判别分析法 (PLS-DA)。该模型具有识别和预测准确性。此外还通过基于 PLS-DA 的模型对据称含有洋甘菊的 35 种商品和 11 种精油进行了后续的预测。
前言洋甘菊作为在世界广泛使用的药用植物之一,具有缓解睡眠障碍、痢疾、疝气、伤口疼痛、黏膜炎和湿疹的功效 [1,2]。洋甘菊的其他药物属性还包括抗过敏、抗菌、抗炎和抗痉挛等 [3]。然而,也有报道称洋甘菊会引发过敏反应,包括皮疹、咽喉肿胀、呼吸短促和过敏症。遗憾的是,目前并没有一种普遍接受的洋甘菊表征方法,因而对于含有这种性状不明确的天然产物的草药来说,确定和控制它们的质量、安全性和功效会变得相当困难。实际上,推广草药洋甘菊产品最大的障碍之一是产品掺假。本文介绍了新近发表的一篇研究 [4],该研究涉及商品中最常见的三类洋甘菊的化学组成: 德国洋甘菊 (Matricaria chamomilla L.syn: M. recutita L.); 罗马洋甘菊 (Chamaemelum nobile (L). All.syn: Anthemis nobilis L.) 和菊花 (Chrysanthemum morifoliumRamat.)。我们开发出了一种气相色谱/质谱 (GC/MS) 方法,并利用该方法将收集的洋甘菊样品(包括已验证的植物及其商品和精油)就其易挥发、非极性的化合物进行非目标分析。该方法通过 Agilent 7890 GC 和 Agilent 5975 GC/MSD 系统采集数据。通过使用自动数据处理程序和采用不同标准的数据筛选工具实现控制输入变量、校准保留时间和简缩数据。PLS-DA 法用于建立对目标样品进行分类和辨别的模型。该模型用于评估声称含有洋甘菊的商品。同时也用于鉴定与每类洋甘菊相关的主要标志化合物。
实验部分样品本文所研究的样品包括 27 种已验证的植物、35 种固体商品和11 种精油。所有样品的标本都保存于美国密西西比大学国家天然产物研究中心 (NCNPR) 的植物药材贮藏室(并具有 NCNPR 登记号)[4]。试剂和标样化学品和标样按所描述方式获得和使用 [4]。仪器本研究采用配备 Agilent 7693A 自动液体进样器的 Agilent 7890气相色谱仪,并与 Agilent 5975 GC/MSD 系统联用。表 1 中列出了仪器条件
样品前处理固体样品经研磨并混匀,以获得均匀的基质。大约 1 g 的细粉末经准确称量后,分散在 4 mL 正己烷溶液中,超声处理 1 小时。在GC/MS 分析之前采用 Millex GV (0.22 µm) 过滤器过滤上层清液。而对于精油样品,取 10 µL 样品溶于 1 mL 正己烷溶液中。然后将内标正十三烷 (n-C13H28) 加入到每个样品溶液中,最终浓度为90 µg/mL。
数据处理与统计分析采用 Agilent MSD Productivity ChemStation 软件 (E.02.02) 采集GC/MS 数据。同时使用 NIST 自动质谱解卷积和鉴定软件 (AMDIS)提取 GC/MS 数据。把具有相同洗脱曲线和相似质谱数据的离子鉴定为实体 (Entity),并以保留时间 (tR)、峰强度和 m/z 进行表征。将每个样品的 ELU 文件(由 AMDIS 创建)导入到 Mass ProfilerProfessional (MPP) 软件中,该软件包含了几种样品分类预测(SCP) 算法。丰度最小设置为 5000 响应值 (Counts),以用于选择5-90 分钟保留时间窗口内的实体做进一步分析。0.15 分钟的保留时间窗口容差范围和谱型相似性被用来在整个样品组中进行实体的匹配。考虑到每个样品间丰度的差异,使用了内标物对峰强度进行归一化处理。基于在样品中的存在性和参数值(按标志筛选)、出现频率(通过频率筛选)、不同种类中各自实体的丰度(通过样品差异筛选)和单因素方差分析 (ANOVA) 的结果,对实体进行逐级降维处理。PCA 用于样品数据的质量控制,并建立了基于 PLS-DA 的样品分类预测模型。通过使用一系列在之前模型训练中使用的 12 种已验证植物样品和不包含在模型训练中的已知标签商品进行交叉验证流程来验证此模型。
结果与讨论数据采集由于事先没有定义目标分析物的具体分组,因此采用全扫描模式进行非目标分析来获取尽可能多的信息。采用 GC/MS 分析法检测到已验证洋甘菊植物样品中的大量化合物。虽然在给定类型洋甘菊植物样品中的组分浓度稍有一些变动,但是相同种类洋甘菊拥有一致的色谱图型。不同类型的洋甘菊具有显著不同的化学组分分布(图 1)。
数据挖掘MPP 软件对 2560 种实体进行了分析,强度阈值为 5000 响应值。采用逐级筛选程序对代表不同类型洋甘菊的具特征性标志化合物进行鉴定,并在使用 PCA和 PLS DA方法前对数据作降维处理。本流程的第一步为“按标志筛选”。标志是用于标示一种样品中实体的品质,并指示每个样品中被检测的实体是“存在”或处于“临界”状态的属性。如果在所有样品中都有该实体,就无需进入分析。只有每个样品中*的实体才会被保留作进一步分析。第二步筛选中,在“通过频率筛选”的步骤中,需要实体在至少一个样品组(如所有的罗马洋甘菊样品组)中*存在,否则将会被移除。第三步为“通过样品差异筛选”,此筛选基于实体的丰度变异系数 (CV) 小于 25%。最后的筛选步骤会依据单因素方差分析计算出每个实体的 p 值,然后选择*重现性的数据。p 值截止值取 0.05 用于确保只有各个种类中的实体间差异具有 95% 的统计显著性才能认为通过。尽管在实施筛选程序之前,初始的实体数为 2560,但是经过逐级筛选后,该数量降到 50。该筛选程序确保只有*判别能力的实体才被用来建立预测模型。