在经济最优施氮量(EONR)下施用氮肥有可能提高氮肥效率和效益,同时减少对环境的负面影响。农场精确实验(OFPE)提供了收集大量数据来估计EONR的机会。机器学习(ML)方法,如广义加性模型(GAM)和随机森林(RF)是估计产量和EONR的有前途的方法。利用土壤、地形和遥感变量对小麦和大麦进行了20项OFPE氮试验,以实现以下目标:(1)利用OFPE量化冬季作物产量和产量对氮的响应的空间变异性;(2)评估和比较GAM和RF模型预测产量和产量对氮的响应的性能;(3)量化土壤、作物和田地特征对EONR估算的影响。机器学习技术能够模拟小麦和大麦产量,平均误差为13.7% (624 kg ha - 1)。然而,RF和GAM的产量预测精度相似,导致经济最优施氮量差异很大。各站点间,土壤速效磷和土壤有机质是影响最大的变量;然而,效应的大小和方向在不同的场之间有所不同。这表明,使用来自不同领域的数据来训练一个模型,当它应用于另一个领域时,可能会导致不可靠的特定地点EONR。在生产商过渡到数字时代时,需要对机器学习方法进行进一步评估,以确保N推荐的强大自动化。
氮素管理是谷物生产中实现产量和利润最大化的关键管理决策之一。然而,施用足够的氮以满足作物需求,同时尽量减少环境氮损失仍然是一个挑战(Rockstr?m等人,2009;Zhang等人,2015)。这一挑战仍然存在,因为经济最优氮肥率(EONR)与产量对氮响应的时空变异相关(Kahabka et al., 2004;Mamo et al., 2003;Pierce & Nowak, 1999),以及对氮率与产量关系建模的不确定性(Kyveryga et al., 2009;Scharf et al., 2005;Tremblay et al., 2012)。尽管人们对氮素建议的复杂性有了广泛的了解,但目前的氮素建议通常是真实产量响应函数的简化版本,它们不够准确,无法提供田间或子田间多年来一致可靠的氮素需求估计(Morris et al., 2018)。例如,使用产量目标作为估计EONR的代理是一种简化的方法,由于产量与EONR之间缺乏相关性而经常失败(Bachmaier & Gandorfer, 2009;Rodriguez et al., 2019;Scharf et al., 2006)。需要精确的推荐系统来优化农民的经济回报,保持或增加满足全球粮食需求所需的产量,并保持陆地和水生生态系统的长期功能。EONR的巨大差异给实现这些目标带来了巨大的挑战。
定点作物氮素管理已被认为是通过捕捉最佳氮素水平的时空变异来提高氮素利用效率(NUE)、利润和产量的有效途径(Mamo等人,2003;毛拉,2013;Trivelli et al., 2019)。不幸的是,选择特定地点的EONR很难预测(Setiyono et al., 2011;Van Es et al., 2006)。特定地点的氮素建议依赖于对田间氮素异质性产量反应的了解,以及将这种反应描述为作物管理、土壤特征和天气的功能的能力(Pringle等人,2004;Trevisan et al., 2021)。然而,关于作物产量对氮素水平响应的特定地点信息是有限的(Trevisan等人,2021),并且特定地点氮素管理的好处往往不完全清楚(Lobell, 2007;Whelan & McBratney, 2000)。因此,尽管有越来越多的特定地点技术(例如产量监测、遥感和可变速率应用),采用率仍然很低。特定地点信息的可扩展可用性对于改善氮素建议、衡量作物生产系统中精确和数字农业技术的价值以及促进采用至关重要(Morris等人,2018;Rodriguez et al., 2019)。
幸运的是,可变速率技术可以用于系统地控制高度机械化、大规模生产系统的投入水平,从而可以进行大规模的农场精确实验(OFPE) (Kyveryga等人,2009;Piepho et al., 2011)。这些实验对输入数据产生大量特定地点的产量响应,例如,可用于了解EONR的空间变化(Bullock et al., 2019)。OFPE可以结合廉价的土壤、地形和作物特征,如视电导率、有机质、海拔和植被指数(VI),这使研究人员能够更好地捕捉田间属性的空间结构及其对N的产量响应的影响(Derby et al., 2005;Kitchen et al., 2008;Tremblay et al., 2012)。因此,可以估计特定地点的产量响应模型(Morris et al., 2018;Rodriguez et al., 2019)。因此,OFPE允许通过匹配特定地点的要求来测试输入率是否可以在不同领域内进行有益的变化(Bachmaier & Gandorfer, 2009;Lark & Wheeler, 2003)。
机器学习(ML)方法,如随机森林(RF),由于其处理大型和不同类型数据以及分析线性和非线性关系的能力,在与产量建模和N状态估计相关的领域获得了普及(Chlingaryan等人,2018;Krause等人,2020;邱等人,2016)。然而,机器学习模型往往需要大量数据,结果可能难以解释(Chlingaryan等人,2018)。广义加性模型(GAM)可以在复杂的机器学习技术和简单的线性模型之间提供一个中间地带,允许对复杂过程进行可靠的预测,同时保持可解释性(Gardner等人,2021;木,2017)。来自OFPE的大量特定站点的产量响应数据为部署特定站点的ML模型提供了机会,用于产量和EONR估计。据作者所知,它们用于EONR预测的用途尚未经过测试(Liakos et al., 2018)。
本研究提出提高对作物产量对氮响应的空间变异性的认识,并利用基于ML的模型来预测产量和EONR。利用小麦和大麦的OFPE、田间特定作物和土壤特征数据以及ML方法来实现以下目标:(1)利用OFPE量化冬季作物产量和产量对氮的响应的空间变异性;(2)评估和比较GAM和RF模型预测产量和产量对氮的响应的性能;(3)量化土壤、作物和田地特征对EONR估计的影响。
2017 - 2019年,在阿根廷布宜诺斯艾利斯省西北地区(37.2017°S, 59.8411°W)的商业大田进行了13项小麦和7项大麦氮肥试验(图1A, B)。试验点土壤为沙质壤土,热型Hapludoll,对应于丘陵和最低地区之间的过渡;砂质壤土,热源性单普鲁道夫,对应于沙质丘陵和塔普托-湿性单普鲁道夫,与浅层土壤有关,在波动深度存在粘土盘层。降水量在680 ~ 1012 mm之间变化,各站点和年平均为850 mm。
图1
实验地点的位置(A, B)和数据密集型农场管理氮试验(DIFM n -试验)的一个例子(C, D)为Field_ID 1
现场试验是Bullock等人(2019)中描述的数据密集型农场管理(DIFM)项目的一部分,以N作为处理(DIFM N试验)。每个DIFM-N试验有6个目标施氮量,分别是在分蘖期撒施尿素(0、46、92、138、184和230 kg N ha - 1)或喷洒尿素硝酸铵(0、32、64、96、128和160 kg N ha - 1)。施氮量在试验单元的分配遵循完全随机因子设计,在被认为是田间土壤性质和产量空间变化最大的部分重复(图1C)。所有施氮量均在田间使用可变速率施肥器施用,施氮量数据用于进一步分析。每个具有独特N率的实验单元(“地块”)被赋予一个尺寸,以匹配可用机器的条形宽度。施氮机的设备宽度从12到35米不等,收割机的设备宽度从6到12米不等。对地块的大小进行了调整,以确保两个收割机在施氮区域内通过。因此,地块大小随年份变化,从90平方米到200平方米不等。其他耕作方法在整个田地中保持不变,由农民按照该地区的标准规程进行。
分别测定了0.30和0.90 m深度(EC30和EC90)土壤视电导率、土壤有机质(SoilOM)、P-Bray (SoilP)和pH (SoilpH),直至0.20 m深度。使用Veris模型3100 (Veris Technologies, Salina, Kansas, USA)在一系列间隔约30米的平行样条中收集土壤ECa。计算在0.30 m和0.90 m处的电导率之比(ECratio)。在前一季作物收获后的秋季,按照每公顷一个样本密度的系统网格进行土壤取样。高程数据(Elev)由实时运动学系统(RTK, Trimble 5700, USA)测量,地形参数如坡向(Asp)、曲率(Curv)、坡度(Slo)、地形位置指数(TPI)和地形湿度指数(TWI)由ArcMap 10.7栅格计算器(Environmental Systems Research Institute, Redlands, CA, USA)导出。通过Google Earth Engine平台(Gorelick et al., 2017)使用Sentinel-2计算两个VIs,即归一化差分红边指数(NDRE)和归一化差分植被指数(NDVI)。先前的研究结果表明,这些VIs是跟踪生物量、氮状态和叶面积指数等关键性状的重要指标(Foster et al., 2017;Magney et al., 2017;Samborski et al., 2015)。已发表的研究支持使用以前作物生物量的代用物,如NDVI或NDRE,来改进对最佳N速率的预测,因为它们在N循环中的作用(Archontoulis等人,2020;Puntel et al., 2019)。基于与其他协变量的相关性低、与产量的相关性高的特点,从遥感变量中选取了前茬NDRE (NDREpc)和前茬NDVI (NDVIpc)。
使用DIFM N-trial OFPE处方(图2A)从田间实验区对应的可变速率施药器中的反馈传感器中选择原始应用数据。来自涂抹器控制器的原始应用点数据根据机械的距离和宽度(原始应用多边形区域)转换为多边形。通过去除重叠的多边形区域和异常值来清理应用的原始多边形区域(图2B)。为了便于田间特征的数据聚合,在20 kg N ha?1范围内,对应于N率的连续施氮多边形(图2B)被合并为单个施氮均匀施氮区(图2C)。
图2
大约20公顷的氮素(N)试验处方图(A),从可变速率施用器的反馈传感器获得的原始N作为施用多边形(B),以及通过去除重叠多边形区域和异常值产生的施用均匀N区域(C)。
使用联合产量监测系统收集产量数据,并使用Yield Editor 2.0软件进行清理(Sudduth et al., 2012)。通过将产量数据与NDVI相关联,对产量数据进行进一步的质量控制(Trevisan et al., 2019a)。由于数据质量不高,从数据库中删除了Field_ID 12和13。这些田的产量值极低或极高,田间分布异常,产量与最大NDVI的相关性较差。清洗后的产量数据点使用产量监测器记录的宽度和行进距离(现在称为“产量收获面积”)转换为多边形,产量多边形之间的重叠允许高达5%。最终数据库包含40%的大麦和60%的小麦产量数据点。
然后将产量收获区与均匀施氮区(图2C、图S1)以及插值后的田间特征在空间上连接起来。基于点的数据层(例如,EC和网格土壤采样)使用经验贝叶斯克里格在一米平方分辨率下进行插值。土壤性质和VIs特征在产量收获区内平均。数据处理使用ArcMap 10.7(环境系统研究所,Redlands, CA, USA)和Quantum GIS (QGIS开发团队,2021)进行。
为了评估田间和田内(空间)的产量变异性,使用变异系数(CV) (Kravchenko et al., 2005)。计算了不施氮肥(yield - n0,小于26 kg N ha - 1)和施高施氮肥(yield - nh,大于161 kg N ha - 1)的亩产、年及所有立地年的CV。对N的平均产量响应计算为yield - nh与yield - n0的差异,采用t检验进行统计学差异分析,p值< 0.05时认为差异显著。
产率采用射频和GAM建模。用于拟合模型的解释变量因字段而异(参见表S1,选择表征每个字段的变量)。R中的“grf”和“mgcv”包分别用于训练GAM和RF模型(Tibshirani et al., 2022)。RF模型不需要对解释变量与因变量的关系进行定量指定。相比之下,GAM模型需要使用平滑样条灵活地指定要建模的变量,以及变量之间的相互作用以及如何相互作用。令为解释变量(变量总数),N为施氮速率。GAM的屈服模型具体如下:
(1)
在上述式中,为氮对产量影响的平滑度,为影响的平滑度,为氮速率的相互作用,捕捉了N的影响如何被其他变量改变()。对于()和(),薄板样条用于平滑(Wood, 2003)。对每个产量区进行了产量预测。
RF和GAM采用空间交叉验证进行调整。当数据集中存在空间自相关时,例如DIFM N-trials (Miller, 2004),建议使用空间交叉验证进行超参数调优,而不是常规交叉验证(Lovelace et al., 2019;Vucetic et al., 1999)。使用空间交叉验证对三个超参数和两组变量集合进行RF调优。具体而言,用于样本分裂的变量数、每片树叶的最小观测数和RF的样本分数参数进行了调整。此外,还考虑了两组变量集合。第一组包括所有的解释变量,第二组只包括彼此不高度相关的变量。对于第二组,去掉一个相关系数大于0.8的变量。对GAM和RF进行空间交叉验证,根据模型性能从两组变量集合中选择一组(表S2)。
空间交叉验证使用十倍空间聚类训练和使用“空间样本”包生成的测试数据集进行(Silge & Mahoney, 2022)。每折叠的面积从2公顷到4.5公顷不等,每折叠有200到300个观测值。图3举例说明了如何为字段1的10个折叠布局空间聚类的训练和测试数据集。通过空间交叉验证,选取各模型和各领域产量预测均方根误差(RMSE)最低的超参数和变量的最优集合(表S2)。然后,RF和GAM使用所有观察到的整个数据集及其各自选择的超参数和每个字段的一组变量进行训练。对于RF,树的数量被设置为2000以稳定预测。
图3
空间交叉验证中使用的训练和测试数据集示例(Field_ID 1)
通过求解每个产量区的利润最大化问题,得到每个地块的定点EONR。让我们表示一个领域内的一个地点。
(2)
上式中,为训练后的模型,为根据施氮率和场地特点估计的产量,为小麦和大麦的价格(设为Mg?1),为氮的价格(设为kg?1)。
为了测试RF和GAM模型在估计特定站点EONR方面的性能,将估计的EONR与“真实”EONR的局部近似值进行比较。由于没有观察到“真实”的特定位点EONR,因此验证估计的特定位点EONR的准确性是一项极其困难的任务。EONR总是由产量观测得出的。相比之下,验证模型的产量预测精度是直接的,因为实际产量是观察到的。在这里,使用相同的十倍测试数据集进行空间交叉验证,以检查模拟站点特定EONR的准确性。具体而言,对每一层进行以下步骤:(1)使用测试数据拟合二次平台模型来估计对N函数的产量响应;(2)基于前一步使用Eq.(2)得到的估计产量响应函数推导局部EONR;(3)计算所有点使用RF和GAM估计的EONR的平均值;(4)将估计的EONR与RF和GAM估计的平均EONR进行比较。在此分析中,排除了少于1000个观测值的场,以确保每个折叠至少有100个观测值。筛选后,14个油田每fold有足够的观察值来执行此分析。值得强调的是,这种EONR估计的测试并不是对射频和GAM的特定地点EONR的准确性的正式测试。RF和GAM的参考点不是真正的EONR,而是由上述局部回归得出的EONR的估计值。所提出的方法旨在对ML EONR估计的好坏进行部分了解。
分析ML模型中每个预测因子的相对重要性,以了解导致EONR空间变异性的因素。为此,对于每个站点,首先训练RF模型,使用用于估计产量的相同解释变量来估计站点特定的EONR。然后,使用“Shapley”包(Sellereite et al., 2020)对每个解释变量运行Shapley值分析(Lundberg et al., 2017)。从每个解释变量获得的Shapley值测量了它们对估计EONR的异质性(变异)贡献的程度和方向。Shapley值是被广泛接受的增强机器学习方法可解释性的措施(Redell, 2019),它们比重要性变量更合适,因为重要性变量确实给出了影响的方向。请注意,对用于预测产量(而不是EONR)的模型进行Shapley值分析只会给出导致产量变化的因素的信息,而不会给出导致EONR变化的因素。
摘要
介绍
材料与方法
结果与讨论
结论
参考文献
致谢
作者信息
道德声明
补充信息
搜索
导航
#####
本研究采用OFPE定量分析了小麦和大麦产量对氮响应的空间变异性。产量从1.32 Mg ha - 1到8.83 Mg ha - 1不等,所有地点的平均产量为4.54 Mg ha - 1,高于全国平均水平(3.2 Mg ha - 1, MAGyP, 2019)。小麦产量比大麦平均高出4.7%(分别为4.67 Mg ha - 1和4.46 Mg ha - 1)。
在大多数地点,产量与N的关系呈非线性模式(图4)。在12个地点,发现对N的显著正响应(产量- nh -产量- n0 > 0),最大值为1.5 Mg ha - 1(图4,表1,p < 0.05)。在类似气候条件下,产量对氮的响应程度与其他已发表的研究结果一致(Barbieri et al., 2008)。与N0下的产量分别为0.19 Mg ha - 1和0.33 Mg ha - 1相比,两个地点在NH下的产量有所下降(图4,表1,p < 0.05)。在布宜诺斯艾利斯省西北地区,小麦和大麦的负产量反应是罕见的。产量响应的缺乏可能部分归因于与产量监测过程有关的错误以及产量监测和应用数据的时间变化。正如其他研究所报道的那样,在相同投入率下,OFPE中产量值的离散度远高于小块研究中通常观察到的结果,并且可能与即使在整个田地中以统一的投入率施用也会观察到的产量的空间变异性有关(图4,Trevisan等人,2019a)。尽管产量响应曲线存在变异性,但仍有一部分位点(例如Field_ID 1和16)对N率表现出明显的正产量响应。点的分布也支持使用线性回归来表示产量响应的决定。
图4
小麦和大麦产量与施氮量的关系黑线通过绘制产量和氮肥率之间的二次关系来帮助观察模式
表1无肥(yield - n0)、高肥(yield - nh)产量的平均产量和变异系数(CV),以及产量- nh与产量- n0的差异(产量响应)
产量- n0的田间变异系数为5.3% ~ 28.5%,产量- nh的田间变异系数为4.7% ~ 31.7%(表1)。田内产量变异主要与田间土壤性质和景观位置的空间变异有关(Tremblay et al., 2012)。有趣的是,产量CV与N试验的大小之间存在显著的正相关(R2=0.29,数据未显示)。这表明,产量变异系数不仅取决于田间的自然变异性,还取决于试验规模和田间位置(Trevisan et al., 2019a)。较大的实验区可能表示除处理之外的其他因素(如有机质、质地)的较大场内空间变异性,也称为随机效应(Kravchenko et al., 2005)。与plot scale研究相比,OFPE的规模更大,可以更好地估计不同土壤和作物条件下的处理和随机效应,从而为ML建模目的提供有价值的数据(Rodriguez et al., 2019)。然而,需要进一步研究优化OFPE的大小,以更好地代表场地的空间变异性(Bullock et al., 2019)。
尽管与农场研究试验相关的挑战,如试验实施的精度、数据质量和处理(Bullock等人,2019;Kyveryga, 2019;Trevisan et al., 2021),结果显示了OFPE在实地一级对当前生产系统进行基准测试的价值,并有助于量化特定营养管理实践(如氮管理)的影响(Trevisan et al., 2019b)。大多数农田的平均氮肥产量和氮肥产量CV均大于10%,这表明考虑到不同地点对氮肥的特定产量响应,可变氮肥施用具有潜在的经济效益(Bullock等人,1998;Robertson et al., 2008)。对于本研究区域,可能需要一个特定地点的氮率来最大化产量和利润(图4)。
对GAM和RF模型在预测产量和产量对氮的响应方面的性能进行了评价和比较。图5给出了训练数据集产量预测的均方根误差(上图)和十倍空间交叉验证的均方根误差(下图)。RF在预测跨田产量一致性方面优于GAM(图5)。RF和GAM的训练数据集平均RMSE分别为476和772 kg ha - 1。在大多数领域,来自训练数据集的RF RMSE比GAM小10% (Field_ID 3除外)。RF和GAM之间模型性能的差异可能是由于它们处理产量、N率和协变量之间复杂相互作用的能力不同。
图5
训练数据集(上图)和空间交叉验证期间使用的测试集(SPVC,下图)产量预测的均方根误差(RMSE)
射频和GAM建议完全不同EONR估计,而他们YEONR估计相似(图6)甚至领域收益率建模精度是相同的(无花果。5和7)。共14个网站显示视觉EONR分布差异两种类型的模型(图6)。在几乎所有领域,GAM模型估计EONR平均26.7公斤N ha?1高于射频(无花果。6和7)。虽然这两个模型预测没有N利润最大化在该领域的许多地方,与RF相比,GAM的N率高于零的频率更高,且N率异质性更强(图6)。值得注意的是,RF建议在9个获得最高利润的田地(例如Field_ID 2、5、6、8、11、13、15、16和17)上几乎不施氮(< 10 kg N ha - 1)。
图6
A经济最优施氮量(EONR)和B经济最优施氮量(EONR)各田产量的频率分布
GAM和RF模型在不同地点和年份的平均EONR分别为43.6和20.4 kg N ha - 1(图7,表S4)。这两个数值均低于全国平均施肥水平,即小麦71 kg N ha - 1和大麦63 kg N ha - 1 (Bolsa de Cereales, 2020年)。GAM和RF模型的EONR分别为0 ~ 244 kg N ha - 1和0 ~ 225 kg N ha - 1(表S4)。这表明,对氮的产量响应和相关的EONR不能推广到一个地区或田地(Scharf et al., 2005),可能是因为土壤、管理和天气之间存在复杂的关系,这些关系决定了对氮的产量响应(Kyveryga et al., 2009;Morris等人,2018;Tremblay et al., 2012)。
尽管在ML模型之间进行了比较,但观察到的特定部位的EONR值是未知的(未观察到),因此不可能得出哪个模型更接近真实EONR的结论(Kakimoto et al., 2022)。在这项工作中,进行了“真实”EONR的局部近似,以测试RF和GAM估计的位点特异性EONR的准确性。测试EONR估计模型的有效性与验证产量预测模型有本质的不同。对于产量预测,直接观测到的产量值,使我们能够与地面真实数据验证模型。然而,由于EONR是从产量观测中得出的,因此无法对EONR进行相同的验证。虽然“真实”EONR的局部近似值很有吸引力,但没有统计保证,也没有同行评议文献证实这种方法确实有效。对EONR的局部估计可能容易出错。图7给出了与GAM和RF模型的平均EONR相比,所有场中单个褶皱的估计局部EONR。
图7
基于随机森林(RF)和基于广义加性模型(GAM)的经济最优氮肥率(EONR)估计与各农田和农田局部近似EONR的比较
基于RF和gam的EONR不接近局部近似的EONR(图7;表S3)。当地平均EONR为46.9±54.4 kg N ha?1。RF或GAM似乎低估了农田内的几个折叠,这表明N率低于10 kg N ha - 1,而当地EONR较高(例如,Field_ID 2和7)。与当地近似值相比,基于RF的EONR始终平均低估了29 kg N ha - 1(表S3和S4)。相比之下,GAM模型平均低估了7个农田的EONR 16 kg N ha?1,其余农田的EONR高估了21 kg N ha?1。小麦的区域平均施氮量为71 kg N ha - 1,大麦为63 kg N ha - 1 (Bolsa de Cereales, 2020),也证实了基于rf的EONR低估了EONR的猜想。
尽管有其局限性,但该分析为基于RF和gam的EONR估计的性质提供了有用的见解。与局部近似相比,RF和GAM显示的EONR不同,这一事实表明,需要进一步研究以了解这种分歧的原因。该模型预测产量的能力并不意味着它也能很好地预测EONR (Puntel et al., 2016)。虽然RF在预测产量方面一直比GAM表现更好(RF的低RMSE,图5),但其EONR预测似乎不如GAM(图7,表S3和S4)。事实上,RF一直低估了EONR(图S2,表S3)。如果情况确实如此,那么依赖RF可能会有潜在的危险,因为由于N的产量响应曲线的性质,N的施用不足比N的过量施用对盈利能力的危害要大得多(Mandrini et al., 2021)。
导致EONR异质性的因素因方法和领域而异(图8和图9)。例如,对于基于gam的14场EONR估计,土壤p是估计EONR异质性的主要因素。土壤磷的低、高值分别与EONR的低、高值相关。这表明EONR随着土壤p的增加而增加。相比之下,在field 2中,土壤p并不是基于gam的EONR的重要因素(图9)。这些发现表明,使用来自不同领域的数据来训练模型,当将其应用于另一个不同领域时,可能会导致高度不可靠的特定地点EONR。EONR和导致其变异性的因素是特定地点的(Morris等人,2018;Puntel等人,2019;Tremblay et al., 2012)。因此,需要更多的研究来生成特定地点的数据,以制定更好地考虑不同农场条件下土壤、天气和管理变化的氮管理策略(Wang et al., 2020)。
图8
随机森林估算经济最优氮肥利用率(基于rf的EONR)的前5个影响因子Shapley值(y轴)。贡献因子(y轴)从0到1归一化(色阶显示的大小)。缩写;sop:土壤磷;土壤pH:土壤pH值;Tpi:地形指数;Elevnorm:归一化高度;Ec30:土壤深度30 cm处的电导率;Ec90:土壤深度90 cm处的电导率;Soilom:土壤有机质;Tpi:地形位置指数;Twi:地形湿度指数;Ecratio: ec30除以ec90;归一化差异红边指数和归一化差异植被指数(分别为ndrepc和ndvicp)
图9
广义加性模型中前5个影响因子的Shapley值(y轴)估计了各领域经济最优氮肥率(基于gam的EONR)。贡献因子(y轴)从0到1归一化(色阶显示的大小)。缩写;sop:土壤磷;土壤pH:土壤pH值;Tpi:地形指数;Elevnorm:归一化高度;Ec30:土壤深度30 cm处的电导率;Ec90:土壤深度90 cm处的电导率;Soilom:土壤有机质;Tpi:地形位置指数;Twi:地形湿度指数;Ecratio: ec30除以ec90;归一化差异红边指数和归一化差异植被指数(分别为ndrepc和ndvicp)
RF估计的EONR的可变性主要是由五个字段(Field_ID 1、3、4、14和18,图8)的测量协变量来解释的。这是意料之中的,因为基于RF的这些字段的EONR估计值的可变性很低(图6)。相反,测量协变量对基于gom的EONR的影响在大多数字段中都很高(图9)。在GAM模型中纳入测量的解释变量比在RF模型中更有助于解释EONR的变异性。
基于gam的EONR模型Shapley分析表明,土壤p是6个地区EONR空间变异性的最大或第二大影响因子。然而,其对EONR的影响方向在各油田之间并不一致(图9;Duncan et al., 2018;Holford et al., 1992)。土壤p越高,4个字段(Field_ID 1、14、17、18)的EONR越高,但2个字段(Field_ID 4、13)的EONR越低。这并不奇怪,因为有证据表明氮和磷之间的相互作用会影响作物的根长、植物生长和氮吸收(Duncan et al., 2018)。
使用GAM模型,标准化的Elev是3、7和9场EONR异质性的关键驱动因素(图9)。与土壤p相似,其影响方向在不同场之间并不一致。虽然较高的归一化高度导致油田3和9的EONR较低,但它导致油田7的EONR较高。SoilOM在7号和14号田也可以进行类似的观察。场地特定地形属性、土壤有机质和气象条件之间的相互作用可能对土壤含水量的空间分布有独特的影响。这些相互作用影响了土壤有机库的矿化速率,进而决定了土壤矿质氮的空间变异,并最终决定了对氮的产量响应(Peralta et al., 2015;Ruffo et al., 2006;Tremblay et al., 2012)。这些结果加强了对推荐模型的需求,该模型具有针对特定环境定制的特定协变量,以优化田间氮肥管理(Cook等人,2013;Saikai et al., 2020)。
所提出的方法表明,DIFM N试验可以用来表征产量,产量对N的响应,并测试ML模型来估计EONR。本研究是首次利用OFPE和ML技术预测冬季谷类作物产量和EONR的研究。
所有试验点的产量范围为1.32 ~ 8.83 Mg ha - 1,平均为4.54 Mg ha - 1,对N的响应范围为0 ~ 1.5 Mg ha - 1,田间和田内均有差异。尽管GAM和RF模型在预测产量方面表现良好(RF和GAM的RMSE分别为476和772 kg ha - 1),但即使在产量建模精度相同的情况下,这两种方法产生的EONR值也存在很大差异。此外,与局部近似相比,ML产生了非常不同的EONR估计值。这表明需要进一步的研究来了解这种分歧的原因。
影响EONR异质性的因素因方法和领域的不同而不同。土壤p、土壤om、地形属性和EC是各样地影响最大的变量;然而,效应的大小和方向在不同的场之间有所不同。这些发现表明,使用来自不同领域的数据来训练一个模型,当它应用于另一个不同的领域时,可能会导致高度不可靠的特定地点EONR。在生产商过渡到数字时代时,需要对机器学习方法进行进一步评估,以确保N推荐的强大自动化。
以下是电子补充材料的链接。
下载原文档:https://link.springer.com/content/pdf/10.1007/s11119-023-10018-8.pdf