朱愛華, 戴光鑫
(山東省海河淮河小清河流域水利管理服務(wù)中心,山東 濟(jì)南 250100)
通常情況下,作物類型、土壤類型與周邊環(huán)境等因素,具有顯著的不確定性,成為影響農(nóng)田分區(qū)灌溉需水量較為顯著的因素[1-3]。由此,在分析農(nóng)田分區(qū)灌溉需水量的過程中,需以環(huán)境因素為核心進(jìn)行分析。
當(dāng)前關(guān)于農(nóng)田分區(qū)灌溉需水量的研究方法主要集中于人工神經(jīng)網(wǎng)絡(luò)算法和農(nóng)業(yè)技術(shù)轉(zhuǎn)移決策支持系統(tǒng)模型兩方面。張曉斌等[4]應(yīng)用BP 神經(jīng)網(wǎng)絡(luò)計算土壤蓄水量,但BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,有較大概率陷入局部最小化問題,收斂速度無法保障。郭兵托等[5]應(yīng)用小波神經(jīng)網(wǎng)絡(luò)分析灌溉需水量,較為準(zhǔn)確地描述灌溉需水量的波動情況,但該方法實(shí)際應(yīng)用過程中,對非線性數(shù)據(jù)預(yù)測的精度較差,導(dǎo)致部分日期的分析結(jié)果存在顯著誤差。劉影等[6]利用農(nóng)業(yè)技術(shù)轉(zhuǎn)移決策支持系統(tǒng)(DSSAT)模型研究農(nóng)田灌溉需水量,但此類方法極度依賴歷史用水?dāng)?shù)據(jù),而且忽略了不同影響因素間的相關(guān)性。
針對上述問題,本研究將貝葉斯神經(jīng)網(wǎng)絡(luò)引入農(nóng)田分區(qū)灌溉需水量模擬中,研究基于貝葉斯神經(jīng)網(wǎng)絡(luò)的農(nóng)田分區(qū)灌溉需水量模擬分析方法,獲取準(zhǔn)確的農(nóng)田分區(qū)灌溉需水量模擬結(jié)果。
1.1.1 農(nóng)田分區(qū)灌溉用水樣本數(shù)據(jù)聚類分析
對農(nóng)田分區(qū)灌溉歷史用水的樣本數(shù)據(jù)進(jìn)行聚類分析,獲取若干個有所差異的相似狀態(tài)數(shù)據(jù)。
以X(t)和X(t′)表示農(nóng)田分區(qū)灌溉用水歷史樣本中隨機(jī)兩個日用水量數(shù)據(jù),兩者間的距離D(t,t′)可用式(1)表示。
若X(t)和X(t′)之間的 距 離D(t,t′)滿足 式(2)所 描述的相關(guān)性,即可確定X(t)和X(t′)為一類,也就是X(t)和X(t′)的狀態(tài)一致。
式中 δ—預(yù)先設(shè)定的農(nóng)田分區(qū)灌溉用水歷史樣本數(shù)據(jù)間的分類距離閾值
以提升農(nóng)田分區(qū)灌溉用水歷史樣本數(shù)據(jù)分類精度為目的,確定同類內(nèi)數(shù)據(jù)X0與Xi之間的關(guān)聯(lián)度ri,ri值同農(nóng)田分區(qū)灌溉用水歷史樣本數(shù)據(jù)分類精度之間呈正比例相關(guān),其關(guān)系如式(3)所示[7]。
式中d—數(shù)據(jù)總量
ξi(k)——X0與Xi在k點(diǎn)的關(guān)聯(lián)系數(shù)
1.1.2 輸入向量的確定
農(nóng)田分區(qū)灌溉需水量在一定程度上受季節(jié)、溫度和降雨量等環(huán)境因素影響。不同的季節(jié),晝夜長度與市場需求量均存在差異性,由此造成農(nóng)田分區(qū)灌溉需水量也存在一定差異性,這種差異性可將一年(12 個月)作為變化的周期性[8]。溫度的差異會導(dǎo)致農(nóng)田灌溉需水量的差異,當(dāng)環(huán)境溫度較高時,農(nóng)田土壤水分蒸發(fā)量較大,為確保土壤濕度,農(nóng)田土壤分區(qū)灌溉需水量也顯著提升,同時,日灌溉需水量的提升與溫度的變化率存在緊密相關(guān)性。通過降雨量彌補(bǔ)部分農(nóng)田分區(qū)灌溉需水量,如降雨量的大小對農(nóng)田土壤內(nèi)的含水量產(chǎn)生直接影響,在分區(qū)灌溉農(nóng)田過程中,如果降雨量較大,則灌溉的需水量較??;相反,農(nóng)田分區(qū)灌溉的需水量提升[9]。
基于以上分析,農(nóng)田分區(qū)灌溉需水量有一定概率存在以日為單位的短周期性和以季度為單位的長周期性變化;而溫度與降雨量又在一定程度上提升農(nóng)田分區(qū)灌溉需水量的隨機(jī)性[10]。結(jié)合農(nóng)田分區(qū)灌溉需水量有可能存在的變化趨勢,以指標(biāo)構(gòu)建的完整性、獨(dú)立性、合理性及可操作性為標(biāo)準(zhǔn),考慮農(nóng)田分區(qū)灌溉需水量的周期性、隨機(jī)性與趨勢性,以前一周需水量、年內(nèi)月需水量占比、日內(nèi)溫度上限值及日降雨量均值等10個指標(biāo)作為農(nóng)田分區(qū)灌溉需水量模擬的輸入。
式中Xn-k——第n-k天的需水量
Tn——第n天的溫度上限
Rn——依照天氣預(yù)報確定的第n天的降雨量估計值
Sn——第n天所在月占全年需求量的百分比
對上述10 個指標(biāo)的相關(guān)歷史數(shù)據(jù)進(jìn)行聚類,得到指標(biāo)均值,指標(biāo)均值輸入貝葉斯神經(jīng)網(wǎng)絡(luò)模型內(nèi)進(jìn)行訓(xùn)練,當(dāng)天的農(nóng)田分區(qū)灌溉需水量作為農(nóng)田分區(qū)灌溉需水量模擬的輸出,由此獲取農(nóng)田分區(qū)灌溉需水量模擬結(jié)果。
標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)模型在實(shí)際使用過程中均存在模型復(fù)雜度無法控制及數(shù)據(jù)擬合過度的問題,由此導(dǎo)致標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)在實(shí)際使用過程中的泛化能力較差[11]。針對這些問題,研究貝葉斯神經(jīng)網(wǎng)絡(luò),即利用貝葉斯推理優(yōu)化神經(jīng)網(wǎng)絡(luò)。貝葉斯神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)在整體上與深度神經(jīng)網(wǎng)絡(luò)一致,但有所差別的是,貝葉斯神經(jīng)網(wǎng)絡(luò)的隱藏層內(nèi)包含概率層,其中的權(quán)重值符合概率分布需求[12-13]。貝葉斯神經(jīng)網(wǎng)絡(luò)隱藏層結(jié)構(gòu)如圖1 所示,其中wi和bi分別表示第i個單元的權(quán)重與偏置,符合形式為p(wi|X,Y)的分布。
圖1 貝葉斯神經(jīng)網(wǎng)絡(luò)隱藏層結(jié)構(gòu)Fig. 1 Hidden layer structure of Bayesian neural network
增加概率層后,貝葉斯神經(jīng)網(wǎng)絡(luò)具有分析不確定性的能力。在確定輸入向量的條件下,可以通過概率層單元以不同的輸出可能性確定輸出。貝葉斯神經(jīng)網(wǎng)絡(luò)可以定義為一個包含多個子網(wǎng)絡(luò)的集成網(wǎng)絡(luò),其中不同子網(wǎng)絡(luò)之間存在一定的相關(guān)性,所有子網(wǎng)絡(luò)可以通過不同的訓(xùn)練過程同時優(yōu)化。在利用貝葉斯神經(jīng)網(wǎng)絡(luò)模擬農(nóng)田分區(qū)灌溉需水量時,利用若干次前向傳播過程確保模擬結(jié)果取自有所差異的子網(wǎng)絡(luò),說明貝葉斯神經(jīng)網(wǎng)絡(luò)能夠獲取較為顯著的正則化效果,可防止標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)內(nèi)有可能產(chǎn)生的擬合過度問題出現(xiàn)[14]。
貝葉斯神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程如圖2 所示,依照BP 神經(jīng)網(wǎng)絡(luò)原理與貝葉斯規(guī)則得到,貝葉斯神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程需通過3 個推理環(huán)節(jié)。
圖2 貝葉斯神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程Fig. 2 Training process of Bayesian neural network
(1)環(huán)節(jié)1。以H和X分別表示貝葉斯神經(jīng)網(wǎng)絡(luò)模型與農(nóng)田分區(qū)灌溉需水量歷史樣本數(shù)據(jù),以α和β分別表示貝葉斯神經(jīng)網(wǎng)絡(luò)超參數(shù),利用式(5)計算權(quán)值w的后驗(yàn)概率,由此獲取符合后驗(yàn)概率上限的權(quán)值wup。
(2)環(huán)節(jié)2。結(jié)合農(nóng)田分區(qū)灌溉需水量歷史樣本數(shù)據(jù)X,確定超參數(shù)的后驗(yàn)概率,更新α和β。
(3)環(huán)節(jié)3。通過對比不同模型的顯著度,確定存在最大后概率的模型,由此獲取最優(yōu)貝葉斯神經(jīng)網(wǎng)絡(luò)
基于上述推理,在設(shè)定先驗(yàn)概率與似然都滿足指數(shù)分布的條件下,獲取貝葉斯神經(jīng)網(wǎng)絡(luò)權(quán)值的后驗(yàn)分布,如式(8)所示。
為得到最優(yōu)權(quán)值wup,需獲取后延概率上限值,即總誤差的下限值M(w)。當(dāng)前主要使用的更新權(quán)值的方法包括擬牛頓法、蒙特卡羅數(shù)值積分法等[15]。
為更新超參數(shù),貝葉斯神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中需持續(xù)迭代訓(xùn)練農(nóng)田分區(qū)灌溉需水量歷史樣本數(shù)據(jù),由此優(yōu)化權(quán)值,確定最優(yōu)的貝葉斯神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練過程中,通過更新超參數(shù)降低貝葉斯神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)的復(fù)雜度,避免出現(xiàn)擬合過度的問題。
為驗(yàn)證基于貝葉斯神經(jīng)網(wǎng)絡(luò)的農(nóng)田分區(qū)灌溉需水量模擬分析在實(shí)際農(nóng)田分區(qū)灌溉需水量模擬中的應(yīng)用效果,以我國某省為試驗(yàn)對象,農(nóng)田分區(qū)以A~H 表示。收集試驗(yàn)對象內(nèi)不同區(qū)域歷史灌溉用水量數(shù)據(jù),采用本文方法模擬其農(nóng)田分區(qū)灌溉需水量。
以試驗(yàn)對象內(nèi)B 區(qū)域?yàn)槔?,將該區(qū)域2020 年7 月16—30 日內(nèi)的灌溉用水量數(shù)據(jù)輸入貝葉斯神經(jīng)網(wǎng)絡(luò)模型,驗(yàn)證數(shù)據(jù)的擬合度,所得結(jié)果如圖3 所示。同時,為進(jìn)一步驗(yàn)證數(shù)據(jù)擬合方面的性能,以文獻(xiàn)[4]中基于BP 神經(jīng)網(wǎng)絡(luò)的方法和文獻(xiàn)[6]中基于DSSAT 模型的方法為對比方法,利用兩種方法對數(shù)據(jù)進(jìn)行擬合,所得結(jié)果如圖4 所示。
圖3 基于貝葉斯神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)擬合結(jié)果Fig. 3 Data fitting results based on Bayesian neural network
圖4 對比方法數(shù)據(jù)擬合結(jié)果Fig. 4 Data fitting results of comparison methods
本文方法與兩種對比方法對于需水量的模擬結(jié)果與實(shí)際監(jiān)測結(jié)果的對比情況如表1 所示。
由圖3 和圖4 可知,本文方法與基于BP 神經(jīng)網(wǎng)絡(luò)的方法對于數(shù)據(jù)的擬合效果較好,擬合度分別達(dá)到0.996 87與0.997 43,顯著高于基于DSSAT 模型的擬合結(jié)果(0.994 79)。由此得到,基于BP 神經(jīng)網(wǎng)絡(luò)的方法數(shù)據(jù)擬合結(jié)果稍高于本文方法。由表1 可知,基于BP 神經(jīng)網(wǎng)絡(luò)的方法模擬需水量時相對誤差上限達(dá)到6.59%,相對誤差下限為0.14%,誤差波動較為顯著;本文方法模擬需水量時相對誤差上限與下限分別為1.70%與0.02%,誤差波動較為微弱;基于DSSAT 模型的方法模擬需水量時相對誤差上限與下限分別為6.73%和0.13%,誤差波動更大。由此說明與兩種對比方法相比,利用本文方法模擬需水量時具有更高的精度與穩(wěn)定性。
表1 需水量模擬結(jié)果與實(shí)際監(jiān)測結(jié)果對比Tab. 1 Comparison of water demand simulation results and actual monitoring results
采用本文方法和兩種對比方法對試驗(yàn)對象內(nèi)全部農(nóng)田分區(qū)在2020 年7 月31 日的灌溉需水量進(jìn)行模擬,對比不同方法模擬需水量時相對誤差,所得結(jié)果如圖5 所示。針對試驗(yàn)對象內(nèi)各農(nóng)田區(qū)域,本文方法模擬所得需水量的相對誤差與兩種對比方法相比均顯著降低。結(jié)合圖3、圖4 和表1 的試驗(yàn)結(jié)果能夠得到本文方法的模擬性能優(yōu)于兩種對比方法。
圖5 不同農(nóng)田區(qū)域灌溉需水量模擬對比Fig. 5 Simulation comparison of irrigation water demand in different farmland areas
以A、B、C、D 區(qū)域?yàn)槔?,對比本文方法中貝葉斯神經(jīng)網(wǎng)絡(luò)內(nèi)隱含層節(jié)點(diǎn)數(shù)量差異條件下,各區(qū)域灌溉需水量模擬的相對誤差,結(jié)果如圖6 所示。本文方法中采用貝葉斯神經(jīng)網(wǎng)絡(luò)進(jìn)行需水量模擬時,隨著隱含層節(jié)點(diǎn)數(shù)量的提升,各區(qū)域灌溉需水量模擬的相對誤差均呈現(xiàn)逐漸下降的趨勢,在隱含層節(jié)點(diǎn)數(shù)量達(dá)到7 個后,各區(qū)域需水量模擬相對誤差進(jìn)入穩(wěn)態(tài)階段,基本控制在2%以下,由此說明采用本文方法模擬灌溉需水量時貝葉斯神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)設(shè)定為7 即可獲取較好的模擬結(jié)果。
圖6 隱含層節(jié)點(diǎn)數(shù)量對于模擬結(jié)果的影響Fig. 6 Influence on simulation results of hidden layer nodes number
本文方法中數(shù)據(jù)聚類結(jié)果對于最終需水量模擬結(jié)果產(chǎn)生直接影響。以A、B、C、D 區(qū)域?yàn)槔?,對比本文方法中貝葉斯神經(jīng)網(wǎng)絡(luò)輸入的10 個指標(biāo)數(shù)據(jù)聚類所得結(jié)果中各數(shù)據(jù)間關(guān)聯(lián)度的均值,所得結(jié)果如表2 所示。采用本文方法對指標(biāo)數(shù)據(jù)進(jìn)行聚類,各區(qū)域聚類結(jié)果中數(shù)據(jù)間的關(guān)聯(lián)度均高于95%,說明采用本文方法能夠獲取較好的聚類結(jié)果,有助于提升最終的模擬精度。
表2 數(shù)據(jù)聚類結(jié)果關(guān)聯(lián)度Tab. 2 Correlation degree of data clustering results單位:%
根據(jù)農(nóng)田分區(qū)灌溉歷史用水?dāng)?shù)據(jù),采用貝葉斯神經(jīng)網(wǎng)絡(luò)模型對農(nóng)田分區(qū)灌溉需水量進(jìn)行模擬分析,通過訓(xùn)練獲取最終模擬結(jié)果。以我國某省為試驗(yàn)對象,采用本文方法,以及基于BP 神經(jīng)網(wǎng)絡(luò)的方法和基于DSSAT 模型的方法為對比方法,模擬分析農(nóng)田分區(qū)灌溉需水量。試驗(yàn)結(jié)果顯示,基于貝葉斯神經(jīng)網(wǎng)絡(luò)的方法數(shù)據(jù)聚類結(jié)果中數(shù)據(jù)間關(guān)聯(lián)度高于95%,數(shù)據(jù)擬合效果較好,模擬需水量時具有更高的精度與穩(wěn)定性。該方法的研究為農(nóng)田分區(qū)灌溉需水量模擬提供參考,推動農(nóng)田分區(qū)灌溉水資源的科學(xué)有效利用。