馮培存,魏正英,張育斌,張 千,張 磊,賈維兵
(西安交通大學(xué) 機械制造系統(tǒng)工程國家重點實驗室,西安 710049)
參考作物蒸散量是計算作物灌水量的重要參數(shù)之一,是目前灌水量預(yù)測應(yīng)用最廣泛的一種方式,聯(lián)合國糧農(nóng)組織提出了以FAO-56 P-M模型作為計算ET0的公式發(fā),該公式以能量平衡以及水汽擴散理論為基礎(chǔ),具有較為充分的理論依據(jù)和計算精度[1]。陸林[2]利用非線性主成分分析法(NLPCA)和徑向基(RBF)神經(jīng)網(wǎng)絡(luò)組成的模型(NLPCA-RBF)對番茄蒸散量進行估算,結(jié)果表明,與傳統(tǒng)RBF網(wǎng)絡(luò)模型相比較,NLPCA-RBF網(wǎng)絡(luò)預(yù)測模型的計算結(jié)果更加準確。張育斌[3]等采用耦合模擬退火優(yōu)化最小二乘支持向量機算法,參照作物蒸散量預(yù)測模型,表明該模型對于大田的灌水量預(yù)測有較好效果。周瑞[4]等創(chuàng)建了基于粒子群算法和廣義回歸神經(jīng)網(wǎng)絡(luò)的參考作物蒸散量預(yù)測模型,該模型在缺少氣象數(shù)據(jù)參數(shù)的條件下,仍然具有較好的預(yù)測效果。達會廣[5]針對溫室甜瓜作物的耗水數(shù)據(jù),建立非線性多項式甜瓜耗水量模型和BP神經(jīng)網(wǎng)絡(luò)模型,結(jié)果表明,神經(jīng)網(wǎng)絡(luò)方法模擬和預(yù)測結(jié)果均優(yōu)于多因素非線性方法。呂天遠[6]通過分析番茄莖直徑和株高對于水肥變化的響應(yīng)規(guī)律,建立了水肥動態(tài)調(diào)整模型,并且最終建立水肥供應(yīng)決策模型。
本文提出了思維進化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的ET0計算模型,以溫室實測數(shù)據(jù)結(jié)合P-M公式作為模型數(shù)據(jù)的訓(xùn)練集和測試集,實驗結(jié)果表明優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)相比普通神經(jīng)網(wǎng)絡(luò)誤差明顯降低,此外,研究了在氣象參數(shù)缺失的條件下對預(yù)測模型精度的影響。
作物灌水量的確定對于植物的生長有著重要的意義,是灌溉決策中非常重要的一個參數(shù),一方面合理的灌水量可以滿足作物生長的日常需求,另一方面可以實現(xiàn)有限水資源條件下的較優(yōu)配置,有效減少水資源的浪費。作物需水量確定有一個關(guān)鍵的因素是參考作物蒸散量(ET0)的確定,針對不同作物的不同的生長時期,確定相應(yīng)的作物系數(shù)(Kc),將Kc與ET0相乘即得到作物需水量。目前計算參考作物蒸散量主要采用的是FAO-56 Penman-Monteith方法(PM56法),該模型的建立采用的是能量平衡和空氣動力學(xué)原理,綜合考慮了多項的氣象參數(shù),對于ET0的計算有著較好的計算精度。但P-M公式設(shè)計到的參數(shù)較多,在實際的生產(chǎn)應(yīng)用中存在著獲取完整數(shù)據(jù)難度大、數(shù)據(jù)不完整等問題??紤]到溫室環(huán)境與室外大田環(huán)境的差異,溫室內(nèi)風(fēng)速為0,應(yīng)采用P-M方程在日光溫室中的修正公式:
(1)
式中:ET0i為充分灌溉下第i天的參考蒸散量,mm/d;Δ為飽和蒸氣壓曲線斜率,kPa/℃;Rn為作物冠層凈輻射,MJ/(m2·d);G為土壤熱通量密度,MJ/(m2·d);γ為干濕表常數(shù),kPa/℃;T為地表1.5~2.5 m高度處每日平均氣溫,℃;es為地表1.5~2.5 m高度處平均飽和蒸氣壓,kPa;ea為地表1.5~2.5 m高度處平均實際蒸氣壓,kPa。
上式中參數(shù),不是氣象站直接得到,而是需要利用氣象站采集的原始數(shù)據(jù)進行計算處理,采集的信息包括日最高氣溫、日最低氣溫、日平均氣溫、日平均相對濕度、有效日照時長以及所在區(qū)域的緯度信息和海拔信息。
BP神經(jīng)網(wǎng)絡(luò)具有多層前饋神經(jīng)網(wǎng)絡(luò),信號向前傳播,誤差反向傳遞,根據(jù)預(yù)測的誤差實時調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,進而使得預(yù)測值不斷接近期望值。其訓(xùn)練過程如圖1所示,主要包括以下步驟,首先對網(wǎng)格初始化,確定計算的初始權(quán)值和閾值,將樣本數(shù)據(jù)輸入至模型后,會計算出隱層各神經(jīng)元的輸入以及輸出,接著計算輸出層神經(jīng)元的輸入與輸出,獲取計算輸出層和隱層的誤差,根據(jù)誤差值,對輸出層進行修正,并且修改隱層的權(quán)值和閾值,判斷迭代步數(shù)以及誤差值是否滿足設(shè)定值,進而決定是否終止訓(xùn)練。
圖1 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖
由以上步驟的分析,在算法中有兩個關(guān)鍵的參數(shù)是神經(jīng)網(wǎng)絡(luò)初始的權(quán)值和閾值,這兩個值可以決定算法的效率和預(yù)測精度,為了更好地確定BP神經(jīng)網(wǎng)絡(luò)中的權(quán)值和閾值,故引入思維進化算法對其展開研究。
思維進化算法的核心類似于人類思維的進化過程,是在遺傳算法基礎(chǔ)上衍生出來的新型進化算法,在保留遺傳算法的基礎(chǔ)啊上,提出新的“趨同”和“異化”兩種新的操作算子,通過趨同、異化等操作,不斷迭代使得預(yù)測值與期望值逐漸逼近。其基本流程如圖2所示,在獲取樣本數(shù)據(jù)之后,算法會產(chǎn)生初始種群、優(yōu)勝子種群以及臨時子種群,之后子種群執(zhí)行趨同操作,獲取成熟的子群體,之后進行異化操作進而獲取全局最優(yōu)的個體,將此個體作為訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,使得BP神經(jīng)網(wǎng)絡(luò)以更快的速率和精度獲取預(yù)測值。
圖2 思維進化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程圖
本文研究的數(shù)據(jù)來源于寧波農(nóng)科院溫室甜瓜作物一季之內(nèi)的室內(nèi)氣象站監(jiān)測,采集的信息包括日最高氣溫、日最低氣溫、日平均氣溫、日平均相對濕度、有效日照時長,利用以上的信息可以利用修正的P-M公式計算獲得ET0的標準值。此外,還測量了日平均土壤溫度、日平均土壤濕度、日平均CO2濃度、夜平均CO2濃度等85組數(shù)據(jù)。在算法訓(xùn)練和驗證時,選取其中70組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集用于訓(xùn)練,其余15組數(shù)據(jù)作為測試數(shù)據(jù)及用于模型的測試與驗證。
模型的評價指標主要有均方根誤差(RMSE)、平均絕對誤差(MAE)、模型有效系數(shù)(EF)以及自相關(guān)系數(shù)(R2),并將以上4個指標統(tǒng)一到整體評價指標(Global performance indicator,GPI)來評價模型的適用性,以上指標的計算公式如下:
(2)
(3)
(4)
(5)
(6)
當Ti為RMSE和MSE時αi等于-1,其他參數(shù)時為1。RMSE越小,表明模型偏差越??;MAE越小,表明模型精度越好;R2越接近1,表明模型模擬的吻合度越高;EF越接近1,表明模型質(zhì)量越好,可信度越高。GPI越高,說明模型的總體模擬效果越好。
以修正的溫室P-M公式計算的ET0值作為標準,溫室監(jiān)測到的氣象參數(shù)作為模型的輸入,分別對普通BP神經(jīng)網(wǎng)絡(luò)以及思維進化算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)進行預(yù)測分析,利用前文所述評價指標進行量化對比,得到數(shù)據(jù)如表1所示。由表1數(shù)據(jù)可以看出,經(jīng)過MEA算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的均方根誤差由0.411 1下降到了0.194 1,平均絕對誤差有0.346 0下降到了0.174 9,模型的有效系數(shù)由原來的0.753 5提升到了0.981 7,預(yù)測數(shù)據(jù)和目標值之間的相關(guān)系數(shù)有0.967 5提升到了0.981 7,以上4個因素的整體評價指標GPI由原來的0.963 9提升到了1.557 8,由此可見,在進行ET0預(yù)測時,加入思維進化算法(MEA)對于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度有著明顯的提升。
表1 BP神經(jīng)網(wǎng)絡(luò)以及MEA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
對利用以上兩種模型預(yù)測的數(shù)據(jù)開展相對誤差分析,得到相對誤差變化曲線如圖3所示。由圖3曲線可知,未優(yōu)化前BP神經(jīng)網(wǎng)絡(luò)的相對誤差在±13.1%以內(nèi),優(yōu)化后最大相對誤差在±7.2%以內(nèi),由圖3曲線可以明顯看出,優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)相對誤差值明顯減小,且變化幅度較小。經(jīng)過計算,優(yōu)化前的BP神經(jīng)網(wǎng)絡(luò)相對誤差絕對值的均值為6.8%,優(yōu)化后的相對誤差絕對值的均值為3.4%。
圖3 BP神經(jīng)網(wǎng)絡(luò)優(yōu)化前后相對誤差圖
在農(nóng)業(yè)實際的生產(chǎn)應(yīng)用實踐中,由于經(jīng)濟條件、地理因素等諸多方面的影響和限制,通常無法完整獲取準確計算ET0的多項氣象參數(shù),并且在極端天氣條件下也會造成氣象數(shù)據(jù)的異常變化或者難以實現(xiàn)監(jiān)測,在氣象數(shù)據(jù)不完整或者異常的情況下,對作物蒸散量進行準確的預(yù)測有著重大的意義。為此,開展不同氣象因子組合下,建立相應(yīng)的MEA-BP神經(jīng)網(wǎng)絡(luò)模型,分組對模型開展訓(xùn)練及驗證,分析在不完整氣象信息的情況下對MEA-BP模型預(yù)測精度的影響。在對氣象參數(shù)組合之前,首先對各氣象因素與標準ET0之間的相關(guān)性進行分析,確定各因素對標準ET0的貢獻程度的大小。Matlab中的corrcoef函數(shù)可計算多個序列的互相關(guān)和自相關(guān),并依據(jù)自相關(guān)值歸一化。序列表示為列向量,函數(shù)計算序列兩兩之間的皮爾遜互相關(guān)系數(shù)和自相關(guān)系數(shù)。利用corrcoef函數(shù)分別對日最高溫度、日最低溫度、日平均溫度、日平均空氣相對濕度以及有效光照時長這5個因素與ETO標準值開展相關(guān)性計算,相關(guān)系數(shù)及相關(guān)程度如表2所示。
表2 各變量與ET0之間相關(guān)性分析
由表2數(shù)據(jù)可以看出 ,對ET0影響最顯著的是有效光照時長,相關(guān)系數(shù)為0.894 2,相關(guān)程度為高度相關(guān)。其中日平均溫度以及日最高溫度的相關(guān)系數(shù)分別為0.721 8和0.695 1,相關(guān)程度為顯著相關(guān)。影響最小的是日最低溫度,相關(guān)系數(shù)為0.394 4,相關(guān)程度為實相關(guān)?;谝陨舷嚓P(guān)性分析,對不同的氣象因子進行組合,分組對模型進行訓(xùn)練,分析不同氣象因子組合對模型的精度的影響見表3。
表3 不同輸入?yún)?shù)下MEA-BP模型評價表
注:Tmax為日最高溫度,℃;Tmin為日最低溫度,℃;Tave為日平均溫度,℃;Have為日平均空氣相對濕度,%;n為有效光照時長,h。
由表3數(shù)據(jù)可以看出,隨著模型輸入氣象因子的減少,模型的均方根誤差以及平均絕對誤差均在逐漸增大,當輸入?yún)?shù)由5個減少至3個時,模型的均方根誤差由0.19逐漸增大至0.35,平均絕對誤差由0.17逐漸增大至0.24,可見均方根以及平均絕對誤差的值都在0.35以內(nèi),由此可知輸入?yún)?shù)減少至3個時,模型的計算精度依舊較高。輸入?yún)?shù)由5個減少至3個時,模型的有效系數(shù)由0.945逐漸減小至0.821,模型的有效性依舊可以得到保證;預(yù)測數(shù)據(jù)與標準值的相關(guān)系數(shù)有0.98逐漸減小至0.78。當輸入?yún)?shù)個數(shù)減小至2個時,均方根誤差基本處于0.5以上,平均絕對誤差在0.4以上,模型的有效系數(shù)在0.8以下,模型的整體評價指標GPI由1急速下降至負數(shù)。由以上的分析可知,當輸出參數(shù)減小至2個時,模型的整體計算精度以及適應(yīng)性較差。在輸入?yún)?shù)保證3個及以上,同時包含有顯著影響因子有效光照時長n時,該模型的整體計算精度以及整體的實用性較好。
(1)建立了基于思維進化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的參考作物蒸散量ET0預(yù)測模型,利用思維進化散發(fā)自動尋優(yōu)獲取了BP神經(jīng)網(wǎng)絡(luò)預(yù)測中的重要參數(shù)-權(quán)值和閾值,提升了模型運行的效率和精度,提升了模型的穩(wěn)定性。
(2)分析對比了BP神經(jīng)網(wǎng)絡(luò)優(yōu)化前模型的均方根誤差、平均絕對誤差、模型有效系數(shù)以及自相關(guān)系數(shù),結(jié)果表明,優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的最大相當誤差有原來的13%下降到了7.2%,平均相對誤差由原來的6.8%下降到了3.4%,模型優(yōu)化效果明顯。
(3)研究氣象數(shù)據(jù)缺失情況下模型的預(yù)測效果,當模型輸入?yún)?shù)為4個時,平均絕對誤差約為在0.2 mm(預(yù)測值約3~6 mm),模型的有效系數(shù)和相關(guān)系數(shù)基本在0.9以上;當模型輸入?yún)?shù)為3個時,平均絕對誤差約為0.25 mm,模型的有效系數(shù)和相關(guān)系數(shù)基本在0.8以上。因此,在輸入?yún)?shù)保證3個及以上,同時包含有顯著影響因子有效光照時長時,該模型的整體計算精度以及整體的實用性較好,可以為作物需水量智能決策提供參考。