摘要:針對(duì)傳統(tǒng)單一作物生長(zhǎng)模型和機(jī)器學(xué)習(xí)模型在預(yù)測(cè)上的限制,將WOFOST模型與灌溉模型結(jié)合,利用集成學(xué)習(xí)算法建立多模型耦合系統(tǒng)(WOFOST耦合模型),選用美國(guó)航空航天局(NASA)1990—2020年數(shù)據(jù)進(jìn)行模擬試驗(yàn),選取2006年、2018年展示試驗(yàn)成果。結(jié)果表明,WOFOST耦合模型的小麥葉面積指數(shù)、總生物量均高于WOFOST模型,WOFOST耦合模型更貼近實(shí)際生產(chǎn)活動(dòng)。耦合算法的MAE、MSE均低于Bagging、Boosting、Stacking算法,分別為2.836、7.581,R2均高于Bagging、Boosting、Stacking算法,高達(dá)0.942。WOFOST耦合模型更全面和準(zhǔn)確地模擬作物生長(zhǎng)狀態(tài),提高產(chǎn)量預(yù)測(cè)的準(zhǔn)確性與可信度。
關(guān)鍵詞:集成學(xué)習(xí)算法;WOFOST模型;小麥生長(zhǎng);模擬;產(chǎn)量預(yù)測(cè);耦合
中圖分類號(hào):TP181" " " " "文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):0439-8114(2024)08-0085-07
DOI:10.14088/j.cnki.issn0439-8114.2024.08.015 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Simulation analysis and yield prediction of wheat growth based on ensemble learning algorithm and WOFOST model
LI Bo,ZHANG Jing-jing,LEI Jia-cheng,DU Yun
(College of Computer and Information Engineering/Engineering Research Center of Intelligent Agriculture, Ministry of Education/Xinjiang Agricultural Informatization Engineering Technology Research Center, Xinjiang Agricultural University,Urumqi" 830052,China)
Abstract: In response to the limitations of traditional single crop growth models and machine learning models in prediction, the WOFOST model was combined with irrigation models, and an ensemble learning algorithm was used to establish a multi model coupling system (WOFOST coupling model),simulated experiments were conducted using data from NASA from 1990 to 2020, and experimental results were presented in 2006 and 2018. The results showed that the leaf area index and total biomass of wheat in the WOFOST coupled model were higher than those in the WOFOST model, and the WOFOST coupled model was closer to actual production activities.The MAE and MSE of the coupled algorithm were lower than those of the Bagging, Boosting, and Stacking algorithms, with values of 2.836 and 7.581, respectively. The R2 was higher than that of the Bagging, Boosting, and Stacking algorithms, with a value as high as 0.942. The WOFOST coupled model provided a more comprehensive and accurate simulation of crop growth status, improving the accuracy and credibility of yield prediction.
Key words: ensemble learning algorithm; WOFOST model; wheat growth; simulation; yield prediction; coupling
機(jī)器學(xué)習(xí)和作物模型的發(fā)展為提升農(nóng)業(yè)預(yù)測(cè)性能帶來(lái)了新機(jī)遇[1,2]。雖然獨(dú)立的產(chǎn)量預(yù)測(cè)模型在功能上各具特色且均進(jìn)步顯著,但這些模型的集成效果在準(zhǔn)確性方面尚未得到充分評(píng)估。
作物模型主要考慮管理、作物品種和環(huán)境投入等因素,建立科學(xué)的作物生理、水文、土壤碳和氮循環(huán)方程等,主要用于預(yù)測(cè)作物產(chǎn)量、開(kāi)花時(shí)間、水分脅迫及其他方面[3,4]。作物模型變量通常來(lái)自不同環(huán)境的各種試驗(yàn)數(shù)據(jù),通過(guò)預(yù)處理和預(yù)訓(xùn)練實(shí)現(xiàn)更準(zhǔn)確的預(yù)測(cè)[5]。Dumont等[6]比較2種作物模型的季內(nèi)產(chǎn)量預(yù)測(cè)性能,一種基于隨機(jī)生成的氣候數(shù)據(jù),另一種基于平均氣候數(shù)據(jù),研究結(jié)果顯示,在10%的極端氣候條件下,2種模型的預(yù)測(cè)性能相似,其中,基于平均氣候數(shù)據(jù)的模型在運(yùn)行時(shí)間上較短。甘甜等[7]在冬小麥產(chǎn)量預(yù)測(cè)中,采用決策樹(shù)、隨機(jī)森林、支持向量機(jī)和嶺回歸結(jié)合集成算法進(jìn)行產(chǎn)量預(yù)測(cè),與傳統(tǒng)的單一機(jī)器算法相比,該方法的準(zhǔn)確性更高且更穩(wěn)定。文獻(xiàn)中還包含了其他作物模型用于預(yù)測(cè)不同種植系統(tǒng)實(shí)例的研究[8,9]。WOFOST(World food study)作物模型是用于模擬特定自然條件下" " 1年生作物生長(zhǎng)動(dòng)態(tài)的解釋性模型。WOFOST模型已經(jīng)從早期的3.1版本發(fā)展到7.1版本,經(jīng)過(guò)不斷改進(jìn)和完善,已成為較成熟的作物模型[10]。引入集成學(xué)習(xí)算法,將WOFOST模型與灌溉模型相結(jié)合,旨在通過(guò)模型耦合方法實(shí)現(xiàn)更準(zhǔn)確的小麥產(chǎn)量預(yù)測(cè)。
1 模型簡(jiǎn)介
1.1 WOFOST模型
WOFOST模型利用計(jì)算機(jī)技術(shù)與算法,模擬特定氣候、土壤、管理措施條件下1年生作物的生長(zhǎng)發(fā)育狀態(tài),探索發(fā)展中國(guó)家日益增加的糧食安全等相關(guān)的農(nóng)業(yè)生產(chǎn)潛力問(wèn)題[11]。WOFOST模型以單日為步長(zhǎng),以同化作用、呼吸作用、蒸騰作用和干物質(zhì)分配等作物生理生態(tài)過(guò)程為基礎(chǔ),模擬肥料供應(yīng)、水分限制和養(yǎng)分限制條件下作物的生長(zhǎng)[12]模型,其計(jì)算過(guò)程主要結(jié)合氣候模塊和作物模塊來(lái)模擬作物的潛在生長(zhǎng)過(guò)程,并利用土壤模塊中的水分和養(yǎng)分信息,模擬水分助迫和養(yǎng)分脅迫條件下的生長(zhǎng)過(guò)程。
1.2 灌溉模型
關(guān)注小麥生長(zhǎng)的生理生態(tài)響應(yīng),特別是在充足的水肥供應(yīng)條件下,節(jié)約用水和降低灌溉成本是智能灌溉模型研究的重點(diǎn)[13,14]。小麥產(chǎn)量預(yù)測(cè)主要基于干旱或半干旱氣候下的數(shù)據(jù),突顯了作物節(jié)水灌溉的迫切需求。本研究開(kāi)發(fā)了一種集成支持向量回歸(SVR)與K-means聚類算法的智能灌溉模型[15],該模型旨在根據(jù)土壤水分的變化實(shí)現(xiàn)精準(zhǔn)灌溉,并結(jié)合水文信息來(lái)優(yōu)化生長(zhǎng)預(yù)測(cè)模型的參數(shù)設(shè)定。
[fx=minw,b12w2+Ci=1mlεfxi-yi] (1)
式中,f(x)為模型對(duì)于輸入x的預(yù)測(cè)輸出;f(xi)為模型對(duì)于特定訓(xùn)練樣本xi的預(yù)測(cè)輸出;w、b分別為SVR模型中的權(quán)重和偏差值;m為輸入總個(gè)數(shù);C為大于0的常量;[lε]為松弛因子;[minw,b]為誤差,樣本的變量數(shù)據(jù)輸入SVR模型進(jìn)行訓(xùn)練,得到預(yù)測(cè)結(jié)果,并使預(yù)測(cè)結(jié)果不斷逼近實(shí)際結(jié)果,兩者之間的誤差逐步減小,SVR模型的輸出結(jié)果與輸入樣本數(shù)據(jù)具有線性相關(guān)性[16]。
為了進(jìn)一步提升預(yù)測(cè)準(zhǔn)確性,模型引入K-means聚類算法,對(duì)SVR模型訓(xùn)練的輸出結(jié)果進(jìn)行聚類分析,得到與輸入樣本數(shù)據(jù)相關(guān)性更高、誤差更小的輸出結(jié)果。根據(jù)歐式距離計(jì)算數(shù)據(jù)之間的相似度,計(jì)算公式如下。
[dxi,xj=i=1kxi-xj2]" " " nbsp; "(2)
式中,d(xi,xj)為數(shù)據(jù)之間的相似度;k為數(shù)據(jù)對(duì)象的數(shù)量;xi為輸入數(shù)據(jù);xj為預(yù)測(cè)數(shù)據(jù)。利用誤差平方和準(zhǔn)則函數(shù)來(lái)判斷K-means聚類算法是否終止迭代更新,計(jì)算公式如下。
[J=n=1kxi∈Ckdxi,Centerk] " " " " " "(3)
式中,J表示判斷更新截止的關(guān)系;d表示歐式距離密度函數(shù)density;C表示更新次數(shù);Centerk表示第k個(gè)簇的聚類中心。
綜上,構(gòu)建基于K-means-SVR的土壤水分差智能預(yù)測(cè)模型,提升灌溉效率及水資源的利用效率。
2 數(shù)據(jù)來(lái)源與方法
2.1 數(shù)據(jù)來(lái)源
試驗(yàn)選取的氣象數(shù)據(jù)主要來(lái)源于美國(guó)航空航天局(National aeronautics and space administration,NASA)的POWER(Prediction of worldwide energy resources)項(xiàng)目。該項(xiàng)目的主要目標(biāo)是改進(jìn)現(xiàn)有的可再生能源數(shù)據(jù)集,并通過(guò)新的衛(wèi)星系統(tǒng)創(chuàng)建新的數(shù)據(jù)集。NASA POWER項(xiàng)目包括可再生能源開(kāi)發(fā)、建筑能源效率以及農(nóng)業(yè)氣候?qū)W應(yīng)用3個(gè)研究領(lǐng)域。該數(shù)據(jù)集包含溫度、氣壓、風(fēng)、降水量和太陽(yáng)輻射等信息,通過(guò)在線請(qǐng)求可以方便快捷地獲取時(shí)間序列數(shù)據(jù)。太陽(yáng)輻射數(shù)據(jù)主要來(lái)源于衛(wèi)星觀測(cè),氣象數(shù)據(jù)的緯度和經(jīng)度分辨率分別為0.500°和0.625°。
2.2 模型設(shè)計(jì)方法
2.2.1 模型設(shè)計(jì)框架 在實(shí)際應(yīng)用中,不同地理位置可能存在不同的土壤質(zhì)地、養(yǎng)分含量和水分狀況,導(dǎo)致作物生長(zhǎng)過(guò)程中出現(xiàn)空間異質(zhì)性。氣候變化、土壤貧瘠和病蟲(chóng)害等因素可能使模型超出其有效范圍。因此,有必要深入研究小麥的生理生態(tài)機(jī)制,并進(jìn)一步完善生長(zhǎng)模型。
如圖1所示,通過(guò)將WOFOST模型與灌溉模型結(jié)合,利用集成學(xué)習(xí)算法建立多模型耦合系統(tǒng)(WOFOST耦合模型)。在該模型中,氣象數(shù)據(jù)作為耦合連接點(diǎn),通過(guò)調(diào)節(jié)結(jié)構(gòu)參數(shù)和融合權(quán)重來(lái)優(yōu)化模型。將來(lái)自美國(guó)航空航天局的氣象數(shù)據(jù)輸入WOFOST耦合模型,生成葉面積指數(shù)(LAI)、總生物量(TAGP)、土壤含水量(SM)。進(jìn)一步采用數(shù)據(jù)同化方法,將灌溉數(shù)據(jù)作為觀測(cè)數(shù)據(jù)進(jìn)行動(dòng)態(tài)調(diào)整,從而實(shí)現(xiàn)作物生長(zhǎng)模擬結(jié)果的更新與校正,最終輸出更準(zhǔn)確的葉面積指數(shù)、土壤含水量和總生物量。本研究中的多模型集成方法旨在利用各模型的優(yōu)勢(shì),彌補(bǔ)彼此之間的不足,通過(guò)估算模型之間的差異性來(lái)確定不確定性,融合多個(gè)模型的模擬結(jié)果與灌溉數(shù)據(jù),從而更全面和準(zhǔn)確地模擬作物生長(zhǎng)狀態(tài),提高小麥產(chǎn)量預(yù)測(cè)的準(zhǔn)確性與可信度。
2.2.2 集成學(xué)習(xí)算法 在將WOFOST模型與灌溉模型耦合的過(guò)程中,需要通過(guò)集成學(xué)習(xí)優(yōu)化學(xué)習(xí)器的參數(shù)和內(nèi)部連接權(quán)重。針對(duì)耦合過(guò)程中可能出現(xiàn)的數(shù)據(jù)沖突問(wèn)題,可以通過(guò)調(diào)整子學(xué)習(xí)器的結(jié)構(gòu)參數(shù)或群體學(xué)習(xí)器的融合權(quán)重來(lái)解決。
由于單一學(xué)習(xí)器的泛化能力或魯棒性較差,因此將多個(gè)學(xué)習(xí)器以一定的策略組合構(gòu)成集成模型,提高學(xué)習(xí)器解決問(wèn)題能力。集成學(xué)習(xí)能夠獲得比單一學(xué)習(xí)器更優(yōu)越的泛化性能或魯棒性,在保證集成學(xué)習(xí)系統(tǒng)性能的前提下,選擇1組最佳子學(xué)習(xí)器來(lái)提高學(xué)習(xí)系統(tǒng)的效率,并將該組學(xué)習(xí)器以特定方式集成,即可獲得最終預(yù)測(cè)結(jié)果的一個(gè)學(xué)習(xí)過(guò)程[17]。集成學(xué)習(xí)使用不同的學(xué)習(xí)器解決給定的問(wèn)題,然后結(jié)合多個(gè)學(xué)習(xí)器的結(jié)果來(lái)補(bǔ)償誤差、提高整個(gè)學(xué)習(xí)系統(tǒng)的性能。常用的集成方法有Boosting法[18]、Bagging法[19]、Dagging法[20]、隨機(jī)子空間法(Random subspace method,RSM)[21]、Stacking法[22]和基于投票的集成方法[23]等。
在模型設(shè)計(jì)試驗(yàn)中,通過(guò)集成學(xué)習(xí)將WOFOST模型與灌溉模型耦合起來(lái)。選取Bagging法和Boosting法作為一級(jí)分類器,用于優(yōu)化網(wǎng)絡(luò)參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu),選取Stacking法作為二級(jí)分類器進(jìn)行堆疊泛化,并優(yōu)化融合策略。最終,模型輸出葉面積指數(shù)、土壤含水量和總生物量。
2.2.3 分類器架構(gòu) 在集成學(xué)習(xí)方法中,Bagging法能降低測(cè)試誤差,Boosting法能調(diào)節(jié)權(quán)重來(lái)增強(qiáng)模型性能,Stacking法能融合預(yù)測(cè)結(jié)果并進(jìn)行堆疊泛化和交叉驗(yàn)證,從而提高模型的準(zhǔn)確性。集成學(xué)習(xí)分類器的架構(gòu)設(shè)計(jì)如圖2所示。
1)Bagging法。利用bootstrap法從總體數(shù)據(jù)集中進(jìn)行有放回抽樣,生成N個(gè)數(shù)據(jù)子集。對(duì)每個(gè)數(shù)據(jù)子集分別訓(xùn)練1個(gè)模型。對(duì)于分類問(wèn)題,通過(guò)對(duì)N個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行投票決定最終分類;對(duì)于回歸問(wèn)題,通過(guò)對(duì)N個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行平均來(lái)獲得最終預(yù)測(cè)值[19]。
ybag =[1K][k=1Ky]k" " " " " " " " " " (4)
式中,ybag為Bagging算法的預(yù)測(cè)結(jié)果;K為基本學(xué)習(xí)器的數(shù)量;yk是基本學(xué)習(xí)器k的預(yù)測(cè)結(jié)果。
Bagging模型的主要參數(shù)包含決策樹(shù)的數(shù)量、葉節(jié)點(diǎn)最小樣本點(diǎn),與單棵決策樹(shù)相比,Bagging的優(yōu)點(diǎn)是降低了測(cè)試誤差,將多棵決策樹(shù)的預(yù)測(cè)結(jié)果進(jìn)行平均,降低了估計(jì)量的方差。
2)提升方法(Boosting)。Boosting法是一種用于減小監(jiān)督學(xué)習(xí)中偏差的機(jī)器學(xué)習(xí)算法。它通過(guò)學(xué)習(xí)一系列弱分類器,將其組合成強(qiáng)分類器。Boosting法中具有代表性的是AdaBoost算法:初始訓(xùn)練時(shí),為每個(gè)訓(xùn)練樣本賦予相等的權(quán)重。算法在訓(xùn)練集上進(jìn)行t輪訓(xùn)練,每輪訓(xùn)練后,對(duì)分類錯(cuò)誤的樣本賦予更大的權(quán)重,使得學(xué)習(xí)算法在后續(xù)訓(xùn)練中更關(guān)注這些錯(cuò)分的樣本,從而生成多個(gè)預(yù)測(cè)函數(shù)[18]。為了減輕原始訓(xùn)練樣本的類別不平衡問(wèn)題,可以結(jié)合過(guò)采樣與欠采樣的混合重采樣技術(shù),同時(shí),利用貝葉斯優(yōu)化算法確定CatBoost模型的最優(yōu)超參[24]對(duì)原始數(shù)據(jù)集進(jìn)行訓(xùn)練,從而對(duì)最終結(jié)果產(chǎn)生積極影響。
yBoss [=kKα]k yk" " " " " " " " " " " " " "(5)
式中,yBoss是Boosting法的預(yù)測(cè)結(jié)果;K是基本學(xué)習(xí)器的數(shù)量;yk是基本學(xué)習(xí)器k的預(yù)測(cè)結(jié)果;[α]k是基本學(xué)習(xí)器k的權(quán)重。
3)Stacking法。Stacking法是一種集成學(xué)習(xí)方法,它首先訓(xùn)練多個(gè)基模型,然后將這些模型的輸出作為另一個(gè)模型的輸入來(lái)進(jìn)一步訓(xùn)練,以達(dá)到最終的預(yù)測(cè)結(jié)果。在Stacking過(guò)程中,通常使用適當(dāng)?shù)哪P徒M合策略,如采用邏輯回歸來(lái)組合不同的基模型輸出。具體操作時(shí),可以在整個(gè)數(shù)據(jù)集上通過(guò)bootstrap抽樣方法得到多個(gè)訓(xùn)練子集,用這些子集訓(xùn)練出一系列初級(jí)分類器(Tier1分類器),通常這一步會(huì)采用交叉驗(yàn)證方法以優(yōu)化學(xué)習(xí)過(guò)程。之后,將這些初級(jí)分類器的輸出作為輸入,用于訓(xùn)練更高級(jí)別的分類器(Tier2分類器),進(jìn)一步提升預(yù)測(cè)的準(zhǔn)確性。Stacking法在提高預(yù)測(cè)的平均準(zhǔn)確性及適應(yīng)數(shù)據(jù)峰谷變化方面展現(xiàn)出顯著優(yōu)勢(shì)[22]。
2.2.4 數(shù)據(jù)同化 在小麥生長(zhǎng)模型的應(yīng)用中,優(yōu)化初始條件和狀態(tài)變量可以提高模擬結(jié)果的準(zhǔn)確性。然而,在作物生長(zhǎng)過(guò)程中,作物的生理狀態(tài)和環(huán)境條件的變化可能導(dǎo)致模型參數(shù)的變動(dòng),不同階段的參數(shù)變化對(duì)模擬結(jié)果的影響程度各不相同。如果這些參數(shù)不能隨時(shí)間更新,模擬過(guò)程可能與實(shí)際的作物生長(zhǎng)情況產(chǎn)生較大偏差,進(jìn)而引入估算誤差。因此,為了全面理解模型的不確定性并提高模擬的可靠性與精確性,采用適當(dāng)?shù)臄?shù)據(jù)同化方法至關(guān)重要。
在短同化窗口期間,濾波算法在提升分析準(zhǔn)確性方面表現(xiàn)優(yōu)異。不過(guò),濾波算法的效果也受觀測(cè)數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)和觀測(cè)不確定性的共同影響。對(duì)于初步成功耦合的WOFOST耦合模型,模型參數(shù)的調(diào)整未必達(dá)到最優(yōu)耦合適配。通過(guò)數(shù)據(jù)同化技術(shù),可以調(diào)優(yōu)模型參數(shù),有效縮小觀測(cè)值與模擬值之間的差異。本研究通過(guò)同時(shí)校準(zhǔn)多個(gè)狀態(tài)變量,如葉面積指數(shù)、土壤含水量和總生物量,來(lái)提高數(shù)據(jù)同化系統(tǒng)的準(zhǔn)確性和穩(wěn)定性。
2.3 評(píng)估指標(biāo)
為了評(píng)估開(kāi)發(fā)的機(jī)器學(xué)習(xí)模型性能,本研究使用3種性能指標(biāo)。均方根誤差(MSE)是預(yù)測(cè)值與實(shí)際值的平均平方偏差的平方根;決定系數(shù)(R2)是因變量中由自變量解釋的方差比例;平均絕對(duì)誤差(MAE)是預(yù)測(cè)值和觀測(cè)值之間絕對(duì)誤差的平均值。MAE、MSE、R2是常用的評(píng)價(jià)指標(biāo)。與MSE相比,MAE的計(jì)算結(jié)果與目標(biāo)變量的量綱保持一致。MAE選擇的最優(yōu)模型對(duì)離群點(diǎn)不敏感,MSE選擇的最優(yōu)模型則是以犧牲正常點(diǎn)的擬合效果為代價(jià),對(duì)離群點(diǎn)容易產(chǎn)生過(guò)擬合。
[MSE=1ni=1n(yi-yi)2] " " " " " " " " " (6)
[MAE(yi,yi)=1ni=1nyi-yi] " "(7)
[R2=ni=1nyiyi-i=1nyii=1nyi2ni=1ny2i-i=1nyi2×ni=1ny2i-i=1nyi2] (8)
式中,n為數(shù)據(jù)集樣本量;[yi]為第i個(gè)樣本真實(shí)值,[yi]為第i個(gè)樣本預(yù)測(cè)值。
3 結(jié)果與分析
3.1 數(shù)據(jù)集
選用NASA 1990—2020年數(shù)據(jù)進(jìn)行模擬試驗(yàn),選取2006年、2018年展示試驗(yàn)成果,每年1月1日至12月31日的數(shù)據(jù)被用來(lái)模擬整個(gè)生長(zhǎng)季節(jié)的環(huán)境條件,確保預(yù)測(cè)模型能夠全面捕捉影響小麥產(chǎn)量的關(guān)鍵因素。
3.2 WOFOST模型與WOFOST耦合模型試驗(yàn)及結(jié)果
將氣象數(shù)據(jù)分別輸入WOFOST模型與WOFOST耦合模型,獲得小麥生長(zhǎng)信息(土壤含水量、葉面積指數(shù)、總生物量)的輸出。圖3為WOFOST模型小麥根區(qū)及土壤含水量的變化趨勢(shì),圖4為WOFOST耦合模型小麥根區(qū)及土壤含水量的變化趨勢(shì)。在7—8月時(shí),WOFOST耦合模型根據(jù)需要及時(shí)向作物根區(qū)補(bǔ)充水分,此時(shí)正值小麥快熟期,需水量旺盛,及時(shí)灌溉提高了根區(qū)土壤水分和土壤中的含水量,保證小麥不會(huì)因高溫和人為因素導(dǎo)致枯死減產(chǎn),并且提高了種植者的管理效率。
由圖5可知,WOFOST模型小麥葉面積指數(shù)在" 8月初趨近于零,意味著小麥葉片凋零??偵锪吭?月達(dá)到峰值,但缺水會(huì)嚴(yán)重影響小麥產(chǎn)量。不同的灌溉決策條件會(huì)影響小麥的生長(zhǎng)。WOFOST模型中輸出的葉面積指數(shù)、總生物量與實(shí)際情況有較大誤差,很難滿足生長(zhǎng)模型預(yù)測(cè)的需要。由圖6可知,WOFOST耦合模型的葉面積指數(shù)、總生物量均高于WOFOST模型,WOFOST耦合模型更貼近實(shí)際生產(chǎn)活動(dòng)。
3.3 集成學(xué)習(xí)試驗(yàn)及結(jié)果
MSE與MAE越小代表模型誤差越小,R2越接近1代表模型擬合度越好。與MSE相比,MAE的計(jì)算結(jié)果與目標(biāo)變量的量綱保持一致,但兩者又存在一些缺陷。耦合算法的MAE、MSE均低于Bagging、Boosting、Stacking算法,分別為2.836、7.581,R2均高于Bagging、Boosting、Stacking算法,高達(dá)0.942,如表1所示。
3.4 數(shù)據(jù)同化及結(jié)果
WOFOST模型預(yù)測(cè)的數(shù)據(jù)(小麥葉面積指數(shù)與土壤含水量)與采集數(shù)據(jù)交集較少,重合度低(圖7),WOFOST耦合模型預(yù)測(cè)的數(shù)據(jù)(小麥葉面積指數(shù)與土壤含水量)變化趨勢(shì)與采集數(shù)據(jù)變化趨勢(shì)基本吻合,重合度高,體現(xiàn)出耦合模型的優(yōu)勢(shì)(圖8)。WOFOST耦合模型可以利用各模型的優(yōu)勢(shì),彌補(bǔ)彼此的不足,并通過(guò)模型之間的差異性來(lái)估算不確定性。在數(shù)據(jù)同化系統(tǒng)中,通過(guò)融合多個(gè)模型的模擬結(jié)果和灌溉模型,可以得到更全面和準(zhǔn)確的預(yù)測(cè)作物生長(zhǎng)狀態(tài),提高作物產(chǎn)量預(yù)測(cè)的準(zhǔn)確性和可信度。
4 小結(jié)
本研究提出了一種小麥生長(zhǎng)預(yù)測(cè)的多模型耦合方法。通過(guò)引入灌溉模型,對(duì)WOFOST作物模型進(jìn)行優(yōu)化,產(chǎn)量預(yù)測(cè)的準(zhǔn)確性進(jìn)一步提高。在模型耦合的研究中,采用集成學(xué)習(xí)方法改進(jìn)作物模型輸出預(yù)測(cè)結(jié)果。結(jié)果表明,WOFOST耦合模型提高了小麥產(chǎn)量預(yù)測(cè)的準(zhǔn)確性。
參考文獻(xiàn):
[1] 馬戰(zhàn)林,文 楓,周穎杰,等.基于作物生長(zhǎng)模型與機(jī)器學(xué)習(xí)算法的區(qū)域冬小麥估產(chǎn)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(6):136-147.
[2] 李遠(yuǎn)斌,卜祥峰,丁云鴻,等.小麥產(chǎn)量預(yù)測(cè)模型綜述[J].智慧農(nóng)業(yè)導(dǎo)刊,2023, 3(5): 13-19.
[3] ASSENG S,ZHU Y,BASSO B,et al.Simulation modeling:Applications in cropping systems[J].Advances in agronomy,2014,99:112-134.
[4] BASSO B, LIU L. Seasonal crop yield forecast: Methods, applications, and accuracies[J]. Advances in agronomy, 2019, 154: 201-255.
[5] AHMED M, AKRAM M N, ASIM M, et al. Calibration and validation of APSIM-wheat and CERES-wheat for spring wheat under rainfed conditions: Models evaluation and application[J]. Computers and electronics in agriculture, 2016, 123: 384-401.
[6] DUMONT B, BASSO B, LEEMANS V, et al. A comparison of within-season yield prediction algorithms based on crop model behaviour analysis[J]. Agricultural and forest meteorology, 2015, 204: 10-21.
[7] 甘 甜,李 雷,李紅葉,等. 基于多源遙感數(shù)據(jù)和機(jī)器學(xué)習(xí)算法的冬小麥產(chǎn)量預(yù)測(cè)研究[J]. 麥類作物學(xué)報(bào), 2022, 42 (11): 1419-1428.
[8] 姜德陽(yáng).基于作物生長(zhǎng)模型和光能利用率模型耦合的玉米估產(chǎn)方法研究[D].長(zhǎng)春:吉林大學(xué),2023.
[9] 秦格霞. 基于作物生長(zhǎng)模型和機(jī)器學(xué)習(xí)算法的草地地上生物量和葉面積指數(shù)的反演研究[D].蘭州:甘肅農(nóng)業(yè)大學(xué),2022.
[10] 王萌萌,楊學(xué)斌,王吉順,等. WOFOST模型在德州市的適用性研究[J]. 湖北農(nóng)業(yè)科學(xué), 2022, 61(5): 160-164.
[11] 潘學(xué)標(biāo).荷蘭作物模型的發(fā)展與應(yīng)用[J].世界農(nóng)業(yè),1998(9): 17-19.
[12] 謝文霞,王光火,張奇春.WOFOST模型的發(fā)展及應(yīng)用[J]. 土壤通報(bào), 2006(1): 154-158.
[13] 楊妍辰,王建林,宋迎波. WOFOST作物模型機(jī)理及使用介紹[J].氣象科技進(jìn)展, 2013, 3(5): 29-35.
[14] 陳思寧,趙艷霞,申雙和,等.基于PyWOFOST作物模型的東北玉米估產(chǎn)及精度評(píng)估[J].中國(guó)農(nóng)業(yè)科學(xué), 2013,46 (14): 2880-2893.
[15] 許 婕. 融合SVR和K-means聚類算法的智慧農(nóng)業(yè)大棚智能灌溉研究[J].自動(dòng)化與儀器儀表, 2023(11): 108-112.
[16] 岳 攀,林威偉,吳斌平,等. 基于ACGWO-SVR的高寒地區(qū)心墻堆石壩壓實(shí)質(zhì)量評(píng)價(jià)模型[J].水利水電技術(shù)(中英文), 2021, 52 (11): 98-107.
[17] MENDES-MOREIRA J, SOARES C, JORGE A M, et al. Ensemble approaches for regression: A survey[J]. ACM computing surveys, 2012, 45(1): 1-40.
[18] 董樂(lè)紅,耿國(guó)華,高 原. Boosting算法綜述 [J]. 計(jì)算機(jī)應(yīng)用與軟件, 2006(8): 27-29.
[19] BREIMAN L. Bagging predictors[J]. Machine learning, 1996," " 24(2): 123-140.
[20] 常爽爽,趙栩鋒,劉震宇,等. 基于異構(gòu)多核的多類型DAG任務(wù)的響應(yīng)時(shí)間分析[J].計(jì)算機(jī)學(xué)報(bào), 2020, 43(6): 1052-1068.
[21] HO-KIN K. The random subspace method for constructing decision forests[J]. IEEE transactions on pattern analysis and machine intelligence, 1998, 20(8): 832-844.
[22] WOLPERT D H. Stacked generalization[J]. Neural networks, 1992, 5(2): 241-259.
[23] 王海深. 基于軟投票的半監(jiān)督聚類集成研究[D].成都:西南交通大學(xué), 2014.
[24] 劉 賀,郭 黎,李 豪,等.面實(shí)體匹配的集成學(xué)習(xí)CatBoost方法[J].地球信息科學(xué)學(xué)報(bào),2022,24 (11): 2198-2211.
基金項(xiàng)目:新疆維吾爾自治區(qū)重大科技專項(xiàng)(2022A02011-2);科技創(chuàng)新2030——“新一代人工智能”重大項(xiàng)目(2022ZD0115805)
作者簡(jiǎn)介:李 博(1998-),男,安徽宣城人,碩士,主要從事智慧農(nóng)業(yè)研究,(電話)17756444100(電子信箱)3480861364@qq.com;通信作者,
張婧婧(1981-),女,湖南寧鄉(xiāng)人,副教授,主要從事農(nóng)業(yè)信息化技術(shù)研究,(電話)18999164538(電子信箱)zjj@xjau.edu.cn。