趙丙秀,董 寧
(武漢軟件工程職業(yè)學院, 武漢 430205)
馬鈴薯是我國重要的糧食兼經(jīng)濟作物之一[1-2],也是湖北地區(qū)重要的糧食作物之一,在我國糧食安全中占據(jù)重要地位[3]。目前,我國馬鈴薯單產(chǎn)與發(fā)達國家相比還存在一定的差距,供需矛盾較為突出[4]。馬鈴薯產(chǎn)量的預(yù)測對于發(fā)展我國馬鈴薯生產(chǎn)、穩(wěn)定市場經(jīng)濟、調(diào)整農(nóng)業(yè)結(jié)構(gòu)及優(yōu)化馬鈴薯田間種植與管理措施具有重要的指導(dǎo)意義[5-6]。馬鈴薯產(chǎn)量呈現(xiàn)出強烈的空間變異性,與田間環(huán)境、大氣溫度、濕度、光照強度及降雨量等因素密切相關(guān),其產(chǎn)量的高低影響著該地區(qū)的經(jīng)濟發(fā)展[7-11]。
目前,作物產(chǎn)量預(yù)測方法主要包括遙感技術(shù)法、統(tǒng)計動力學法、氣象產(chǎn)量法、農(nóng)學作物模型預(yù)測法、數(shù)理統(tǒng)計法及深度學習法等[12-19]。BP(Back propagation)神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用場景最多、較為廣泛的人工神經(jīng)網(wǎng)絡(luò)之一,國內(nèi)學者通過相關(guān)環(huán)境參數(shù)及生物參數(shù)為輸入量,基于BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)了對小麥、馬鈴薯、西紅柿、菜花等糧食作物產(chǎn)量及其它行業(yè)輸出進行預(yù)測效果分析[20-21]。上述研究對于馬鈴薯產(chǎn)量的預(yù)測分析起到了重要的推動作用,但目前研究很少將氣象數(shù)據(jù)與農(nóng)作物田間的環(huán)境數(shù)據(jù)相結(jié)合來微觀預(yù)測某一區(qū)域的糧食產(chǎn)量,且考慮影響因素過于單一,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)存在過擬合、容易陷入局部最優(yōu)解及收斂速度慢等問題。因此,利用遺傳算法、粒子群、鯨魚算法及蟻群算法等用于優(yōu)化初始權(quán)重和閾值,更有利于提高模型學習效率并進行全局優(yōu)化,改善原有網(wǎng)絡(luò)結(jié)構(gòu)[22-23]。
本研究試驗數(shù)據(jù)采用湖北地區(qū)田間環(huán)境數(shù)據(jù)、氣象數(shù)據(jù)及馬鈴薯產(chǎn)量信息(數(shù)據(jù)來源:https://www.heywhale.com/home),數(shù)據(jù)覆蓋時間范圍為2009—2021年,基于鯨魚算法優(yōu)化建立WOA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,并分析傳統(tǒng)的BP預(yù)測模型及GA-BP預(yù)測模型訓練前后的精度及預(yù)測誤差,對湖北地區(qū)馬鈴薯生產(chǎn)具有重要的指導(dǎo)意義。
本研究選取大氣溫度、大氣濕度、降雨量、土壤含水率及土壤溫度作為影響因子,以月最高土壤溫度(X1)、月最低土壤溫度(X2)、月土壤平均溫度(X3)、月土壤平均含水率(X4)、月大氣最高溫度(X5)、月大氣最低溫度(X6)、月大氣平均溫度(X7)、月降雨量(X8)及月大氣平均濕度(X9)這9個指標作為輸入,以馬鈴薯產(chǎn)量作為輸出構(gòu)建網(wǎng)絡(luò)模型進行訓練和預(yù)測。以2009—2021年度5個試驗地點馬鈴薯產(chǎn)量為訓練樣本,以1個試驗地點2010—2021年數(shù)據(jù)作為驗證。分別采用BP模型、GA-BP模型及WOA-BP模型進行預(yù)測,并采用MatLab進行編程與模型建立。
1.2.1 BP神經(jīng)網(wǎng)絡(luò)
(1)
隱藏層神經(jīng)元和輸出層神經(jīng)元的閾值分別為θ1和θ2,則有
(2)
所以,隱藏層神經(jīng)元輸出為
(3)
輸出層神經(jīng)元的輸出為
(4)
實際輸出和預(yù)期輸出之間的誤差為
(5)
1.2.2 WOA-BP神經(jīng)網(wǎng)絡(luò)模型
鯨魚優(yōu)化算法工作流程主要分為以下3個步驟:
1)包圍捕食階段。WOA優(yōu)化算法首先將距離魚群最近的鯨魚最為局部最優(yōu)解,其余周圍的鯨魚個體會自己計算距離最優(yōu)解的距離,進而逐步向最優(yōu)解慢慢靠攏,逐漸包圍魚群,這個階段數(shù)學模型為
R=|C·X*(t)-X(t)|
(6)
X(t+1)=X*(t)-A·R
(7)
式中A、C—系數(shù)向量;
R—距離向量;
X*—局部最優(yōu)解;
X—位置向量。
A、C數(shù)學表達式為
A=2a·r-a
(8)
式中a—從2到0線性減小的向量;
r—隨機向量,r∈[0,1];
A—距離系數(shù),其變化受a影響。
2)在縮小魚群的活動范圍后,鯨魚會朝著魚群吐氣泡,形成“泡泡網(wǎng)”,將魚群包圍圈住后使其無法逃脫,進而實現(xiàn)在該區(qū)域?qū)で笞顑?yōu)解的目的。
3)根據(jù)式(8)對魚群進行收縮包圍后,當距離魚群的系數(shù)|A|<1時,鯨魚個體會朝著最優(yōu)解逐漸逼近;在|A|<1的前提下,|A|越大,鯨魚個體越能在較大的空間范圍內(nèi)游走,使鯨魚算法更具有全局尋優(yōu)的能力;|A|越小,鯨魚個體可以在較小的空間內(nèi)行走,仔細尋覓魚群,使得鯨魚算法更具有布局巡游的能力。由于采用氣流撿拾,本撿拾裝置的傷薯率遠低于機械式撿拾裝置傷薯率。
為了定量評估GA優(yōu)化的神經(jīng)網(wǎng)絡(luò)預(yù)測模型的有效性和準確性,分別考慮MSE(均方誤差)、RMSE(均方誤差根)、MAE(平均偏差)和MAPE(平均誤差),則有
(9)
(10)
(11)
(12)
通過前期試驗,采用試湊法得到本次試驗設(shè)置BP神經(jīng)網(wǎng)絡(luò)中相應(yīng)參數(shù):收斂誤差為0.000 65,學習速度為0.05,最大訓練次數(shù)為50 000。當收斂誤差滿足最初設(shè)置值時,完成訓練。
根據(jù)所測數(shù)據(jù),構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)、GA-BP神經(jīng)網(wǎng)絡(luò)、WOA-BP神經(jīng)網(wǎng)絡(luò)共3種預(yù)測模型,各模型對馬鈴薯產(chǎn)量預(yù)測結(jié)果如圖1所示。
圖1 不同神經(jīng)網(wǎng)絡(luò)模型預(yù)測的預(yù)測曲線Fig.1 Forecast curves predicted by different neural network models
由圖1(a)可以看出,BP預(yù)測模型預(yù)測誤差較大,經(jīng)過算法優(yōu)化后,GA-BP預(yù)測模型和WOA-BP模型的預(yù)測值與實測值擬合程度較高(圖1b、c),但GA-BP預(yù)測值在馬鈴薯產(chǎn)量低于2400kg/hm2的范圍內(nèi)模型預(yù)測誤差較大,且算法步驟復(fù)雜,運算繁瑣;WOA模型具有良好的收斂性、適應(yīng)性和預(yù)測精度(圖1c),實測值與預(yù)測值曲線擬合更接近,說明WOA-BP預(yù)測模型具有更好的擬合效果和泛化能力,體現(xiàn)了優(yōu)化算法的相對優(yōu)越性。
為了驗證3種模型的預(yù)測性能,采用驗證數(shù)據(jù)的實測值與預(yù)測值的相關(guān)系數(shù)曲線如圖2所示。不同網(wǎng)絡(luò)模型的擬合程度依次為WOA-BP網(wǎng)絡(luò)模型>GA-BP網(wǎng)絡(luò)模型>BP神經(jīng)網(wǎng)絡(luò)模型。WOA-BP網(wǎng)絡(luò)模型回歸擬合較好,相關(guān)系數(shù)R值增加到了0.9881,決定系數(shù)R2增加到了0.9764。
圖2 不同神經(jīng)網(wǎng)絡(luò)模型預(yù)測值與實測值間的相關(guān)性分析Fig.2 Correlation analysis between predicted values and measured values of different neural network models
對3種預(yù)測模型的預(yù)測結(jié)果進行量化,并利用模型評價指標對模型進行對比分析,結(jié)果如表1所示。與傳統(tǒng)的BP預(yù)測模型、GA-BP預(yù)測模型相比,WOA-BP模型的RMSE分別降低了46.94%、29.77%,MAPE分別降低了58.88%、34.02%,MAE分別降低了27.27%、22.83%。
表1 模型預(yù)測性能分析Table 1 Model prediction performance analysis
不同模型的預(yù)測誤差分布如圖3所示。其中,水平軸代表實測值與預(yù)測值之間的誤差值,縱軸表示訓練集的預(yù)測樣本。以分布誤差為0的分界線,向兩端擴散增大,0軸表示真實值與預(yù)測值結(jié)果一致,越接近0,代表預(yù)測值與實測值的差值越小,模型的預(yù)測精度越高。由圖3可以看出:與BP、GA-BP模型相比,WOA-BP預(yù)測模型的誤差直方圖誤差接近0的個數(shù)更多且誤差更小。其中,在組合預(yù)測模型里,本文提出的WOA-BP模型在零區(qū)間分布的數(shù)量更多,誤差更小,其他組合模型在零區(qū)間分布數(shù)量較小,誤差較大。
圖3 不同神經(jīng)網(wǎng)絡(luò)模型預(yù)測誤差分布圖Fig.3 Forecast error distribution of different neural network models
運用BP神經(jīng)網(wǎng)絡(luò)對馬鈴薯產(chǎn)量預(yù)測效果較差,模型預(yù)測不穩(wěn)定,個別預(yù)測結(jié)果誤差較大,預(yù)測值與實測值的R2僅為0.8731。通過構(gòu)建WOA優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型,得出最優(yōu)權(quán)重組合,經(jīng)過不斷迭代訓練,WOA-BP網(wǎng)絡(luò)模型的預(yù)測精度R2達到0.9764,MAPE僅為1.1068%,RMSE為28.1983。這一預(yù)測精度滿足馬鈴薯生產(chǎn)的實際需要,對于制定馬鈴薯生長期間的種植管理模式及農(nóng)藝管理措施具有指導(dǎo)意義。