基于无人机高光谱数据的冬小麦SPAD聚类回归估计
时间:2023-09-11 阅读:589
背景:
SPAD(Soil plant analysis development)即叶片绿度,反映叶片中叶绿素的相对含量。叶绿素是作物光合作用最重要的色素,其浓度变化直接影响作物的健康状况。传统叶绿素体外测量方法不适合大面积的实时监测。近年来,遥感技术已成为作物生长监测的重要工具。特别是基于无人机的低空遥感探测技术,具有操作方便、快速灵活、效率高、空间分辨率理想等优点,在精确农业中得到了广泛应用。搭载在无人机中的高光谱传感器具有较高的光谱分辨率和较强的波段连续性,可以准确获取冬小麦的光谱信息。
前人研究中,可以通过植被指数提取小麦生长信息,或者采用支持向量回归、随机森林、反向传播神经网络等方法监测农学参数。但是现有算法基于全局建模思想,无法最大限度地提高不同土壤肥力条件下小麦光谱特征差异。此外,在同一生育期,不同施肥处理下的冬小麦光谱特征也存在显著差异。因此,为了更好地探索不同土壤肥力条件下的冬小麦SPAD浓度,必须使用聚类神经网络等差异化模型或地理加权回归模型等局部模型。差异化模型的目标是根据光谱角距离(Spectral angle distance, SAD)对小麦光谱进行聚类,以区分不同肥力下的小麦光谱,然后对每个光谱聚类建立回归模型。
因此,本研究采用K-means作为聚类方法,采用两种集成学习算法作为回归方法:基于Boosting集成策略的极端梯度提升(XGBoost),以及基于Bagging集成策略的随机森林(RF)。比较了非聚类回归模型(RF、XGBoost)和聚类回归模型(cluster-RF、cluster-XGBoost)的性能,评估了土壤有机质(OM)和土壤全氮(TN)对小麦SPAD遥感估算的影响。
试验设计
安徽省农业科学院花可可副研究员团队利用搭载有GaiaSky-mini2-VN高光谱相机(江苏双利合谱公司)的DJI M600无人机平台,获取了不同施肥处理下的小麦冠层高光谱影像。高光谱传感器的波段范围为400 ~ 1000 nm,光谱分辨率为3.5 nm,包含176个波段。获取对应采样点的SPAD值以及土壤OM和TN。
研究中选择的聚类方法为K-means,回归算法为RF和XGBoost。整个算法流程分为两步,第一步:使用K-means将小麦光谱划分为不同的簇。对176个波段的光谱反射率进行综合划分,并将SAD作为算法的判别距离。簇的最大数量设置为30,最终选择的簇数为2。图1和2显示了6个案例的实验流程图,6个案例的设置如表1所示。第二步:针对小麦光谱的每个聚类,分别建立每个光谱聚类的回归模型,并基于RF和XGBoost算法估测SPAD值。因此,每个光谱聚类都有相应的回归模型。
图1 冬小麦SPAD估测流程图
图2 案例5和6的SPAD估测流程图。
表1 试验设计
结论
与RF相比,XGBoost模型在所有田块中表现出更好的估测性能(图3)。RF模型和XGBoost模型的R2值分别为0.763和0.781,XGBoost的RMSE和MAPE均低于RF模型(表2)。RMSE和MAPE评价指标表明,模型估计误差较小且不显著。
图3 非聚类RF(a)和非聚类XGBoost(b)模型的预测散点图
表2 非聚类回归模型的准确性
从图4可以看出,无人机高光谱技术可以实现田块尺度的SPA监测。XGBoost和RF估测模型的估测结果相似,SPAD空间分布基本相似。XGBoost预测的SPAD值比RF分布更广,并且XGBoost预测的SPAD平均值更接近于实测值。但两种模型确定的标准差与真实数据略有差异。因此,有必要引入局部建模,如聚类回归模型,以进一步提高估测性能。
图4 基于RF(a)和XGBoost(b)的SPAD空间分布
图5为聚类后的小麦光谱。将小麦光谱聚为两类,两类光谱存在显著差异,因此聚类结果是合理的。当波长小于732 nm时,Cluster1的平均光谱反射率低于Cluster2;当波长大于732 nm时,Cluster1的平均光谱反射率高于Cluster2。
图5 高光谱反射率光谱曲线聚类结果
图6显示了聚类回归模型预测的SPAD值与实测值之间的散点图。cluster-XGBoost模型总体上优于cluster-RF。cluster-XGBoost的R2(0.925)高于cluster-RF(0.901),RMSE(1.444)比cluster-RF(1.813)低0.369,MAPE比cluster-RF低25%。cluster-XGBoost比cluster-RF预测的SPAD范围更大,并且cluster-XGBoost具有更高的标准差。两种聚类回归模型预测SPAD的空间分布如图7所示,两者表现出相似的分布。
图6 cluster-RF(a)和cluster-XGBoost(b)模型的预测散点图
图7 基于cluster-RF(a)和cluster-XGBoost(b)的SPAD空间分布
前人研究表明,长期施肥处理后土壤养分的变化会影响小麦的生长,包括小麦叶绿素含量。如图8所示,光谱反射率与小麦SPAD高度相关,176个波段的相关系数绝对值均大于0.68,说明利用光谱信息可以建立小麦SPAD估测模型。土壤有机质和全氮与小麦SPAD呈显著正相关,相关系数分别为0.44和0.45。因此,可将土壤有机质和全氮引入小麦SPAD遥感估测。如表3所示,通过添加土壤OM和TN,RF和XGBoost模型的精度都得到了提高。对于RF,R2提高9.95%,RMSE降低4.25%,MAPE降低4.66%;对于XGBoost,R2提高14.23%,RMSE降低21.74%,MAPE降低13.43%。因此,结合土壤养分和光谱信息估测小麦SPAD比单独使用光谱信息更准确。此外,RF和XGBoost模型均能利用光谱和土壤信息准确检测SPAD,且XGBoost模型在施用有机肥的田中表现优于RF模型。
图8 光谱反射率与小麦SPAD的相关系数
表3 RF和XGBoost模型的精度(包括土壤养分)
作者信息
花可可,博士,安徽省农业科学院土壤肥料研究所副研究员。
主要研究方向:土壤有机质提升过程与调控机制、活性氮污染与阻控技术。
参考文献:
Yang, X., Yang, R., Ye, Y., Yuan, Z.R., Wang, D.Z., & Hua, K.K. (2021). Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods. International Journal of Applied Earth Observations and Geoinformation, 105, 102618.