王 穎 苗
(山西省水利水電科學研究院,太原 030002)
蓄水坑灌法是一種有效解決山地果園灌溉水資源利用率低下問題的優(yōu)勢灌溉方法。它主要由蓄水坑、環(huán)狀溝、固壁設施構成。山地坡面水流進入蓄水坑后,沿坑壁側向進入果樹根系集中層,從而達到提高水分利用率的目的。近些年來,許多學者圍繞土壤-植物-大氣連續(xù)體(SPAC系統(tǒng)),對土壤水分分布及動態(tài)[1,2]、棵間蒸發(fā)[3]、根系吸水[4]、樹干莖流[5]、葉片蒸騰[6]開展了相關的研究工作,取得了一定的研究進展。
蒸騰作用是植株生長的重要生理過程,也是農田耗水的關鍵途徑。蒸騰速率是反映蒸騰作用強度大小的重要指標,反映了植株體調節(jié)機制的能力。王穎苗[6]、仇群伊[7]等人僅是對蓄水坑灌條件下果樹蒸騰速率(WSPIT)的日變化特征進行了定性分析,定量預測方面還有待進一步深入研究。隨著計算機技術的不斷發(fā)展,BP神經網絡等人工智能模型被相繼提出,并應用于各個領域。在植株蒸騰預測方面,現有模型主要包括經列文伯格(LM)算法[8]、遺傳(GA)算法[9]和附加動量(AM)算法[10]優(yōu)化的BP神經網絡模型。這些模型主要用于膜下滴灌、常規(guī)滴灌和地下滴灌方法,研究對象主要為茄子、西紅柿和甜瓜[8-10]。這些方法在蓄水坑灌條件下蘋果樹蒸騰速率定量預測方面未見相關報道,哪種模型更適合于蓄水坑灌法也有待進一步深入研究。因此,本文將采用LM算法、GA算法和AM算法優(yōu)化的三種BP神經網絡模型,實現蓄水坑灌蘋果樹蒸騰速率的定量預測,以期為蓄水坑灌條件下果園水分管理提供支持。
本研究于2014年在山西省農科院果樹研究所進行。地理坐標為東經112°32′,北緯37°23′。該試驗區(qū)屬于暖溫帶大陸性氣候,海拔789.1 m,平均降雨量460 mm,無霜期175 d,年平均氣溫5~10 ℃。降水年內分布不均,主要集中于6-8月。試驗區(qū)蘋果樹品種為紅富士丹霞,種植行株距為4 m×2 m。
測定項目主要包括蘋果樹蒸騰速率和氣象環(huán)境因子。其中,蒸騰速率采用LI-6400XT便攜式光合儀進行測定,每5 d測定一次,測定時間為早8∶00,每次測定時選取5片樹葉,測定值取平均。環(huán)境因子由ADCON無線自動氣象監(jiān)測站進行測定,測定指標主要包括氣溫、大氣相對濕度、光輻射強度和飽和水汽壓差。氣象站每10 min自動采集一次數據。
BP神經網絡是一種具有反向傳播學習能力的多層神經網絡。它由輸入層、中間層(隱含層)和輸出層組成,分別負責信息處理、傳遞和輸出。當一對學習樣本輸入給神經網絡時,神經元的激活值將從輸入層傳播到輸出層,輸出層節(jié)點得到輸入響應。然后,利用網絡反向傳播機制,對連接相鄰網絡層的權值進行反復修正,從而提高網絡對輸入的響應準確性。BP模型的計算公式如下所示。
隱含層節(jié)點的輸出:
yi=f(∑ωijxj-θi)
(1)
輸出層節(jié)點的輸出:
Ol=f(∑Tliyi-θl)
(2)
輸入層到隱含層的權值修正公式:
(3)
輸入層到隱含層的閾值修正公式:
(4)
隱含層到輸出層的權值修正公式:
Tli(k+1)=Tli(k)+ηδlyi
(5)
隱含層到輸出層的閾值修正公式:
θ(k+1)=θl(k)+ηδl
(6)
氣溫、大氣相對濕度、光輻射強度和飽和水汽壓差是影響葉片蒸騰速率的關鍵環(huán)境因子。當氣溫逐漸升高時,會促使葉片內外的水汽壓梯度增加,在水汽壓差作用下,蒸騰速率會進一步加強[11]。當大氣濕度增加時,空氣黏滯性較大,葉片內外蒸氣壓差減小,不利于氣孔下腔中水蒸氣的擴散,蒸騰作用會被進一步抑制[12]。光輻射是蒸騰作用的主要動力來源,當光輻射強度增加時,在葉片大氣界面的溫差作用下,氣孔開度進一步增大,從而促進光合作用進行[13]。飽和水汽壓差反映了實際空氣距離水汽飽和狀態(tài)的程度,能夠直接通過干預葉片氣孔開閉大小,來影響蒸騰作用的強烈程度[14]。因此,本文將上述4種因子作為模型的輸入項。模型的輸出項為葉片蒸騰速率。因此,模型的輸入節(jié)點數為4,輸出節(jié)點數為1。試驗中共有278組樣本數據,以7∶3比例將該樣本分為訓練集和預測集。
隱含層節(jié)點數與神經網絡精度緊密相關。當隱含層節(jié)點數過少時,模型精度會較差,但當隱含層節(jié)點數過多時,又會引起過擬合問題[15]。本文通過經驗公式法[式(7)]和試算法結合的方法來解決該問題。首先,由經驗公式[式(7)]確定最優(yōu)節(jié)點數范圍為2~13,然后在該范圍內,通過試算法進一步確定最優(yōu)節(jié)點數。經計算,當節(jié)點數為8時,模型誤差最小。因此,最優(yōu)的神經網絡拓撲結構為4-8-1。
(7)
式中:L為隱含層節(jié)點;m和s為輸入和輸出層節(jié)點;q為介于0~10之間的常數。
神經網絡的初始權值和閾值是通過離線訓練的方式獲得,但初始權重和偏差是隨機分配的,較難獲得全局最優(yōu)解,這是BP神經網絡的缺點,需要進一步改進。本文分別將遺傳算法(GA)、列文伯格算法(LM)和附加動量算法(AM)的宏觀搜索能力與神經網絡進行結合,先用優(yōu)化算法進行尋優(yōu),達到縮小搜索范圍的目的,再用神經網絡進行精確求解,從而實現優(yōu)化權值,提高模型預測能力的目標。
遺傳算法是一種基于自然界生物進化原理的自適應搜索算法。它通過模擬生物進化,對種群反復進行選擇、交叉和變異操作,通過優(yōu)勝劣汰達到優(yōu)化種群的目的,使模型的結果也不斷逼近最優(yōu)解[16]。在本文中,神經網絡的輸入層、隱含層和輸出層的節(jié)點數分別為4、8和1,則權值數為4×8+8×1=40,閾值數為8+1=9,遺傳算法中個體編碼長度為40+9=49。選擇浮點數編碼方式對權值編碼。交叉算子選擇算術交叉,變異算子選擇均勻變異[17]。將蒸騰速率實測值和預測值間的均方誤差作為個體適應度值,個體適應度值越小,該個體越優(yōu)。算法求解步驟已有相關報道[17],不再贅述。遺傳算法進化過程中設置種群規(guī)模為50,迭代次數為100,變異概率為0.001,交叉概率為0.7。對于該遺傳算法優(yōu)化的神經網絡模型(GA-BP-WSPIT),網絡層之間的傳遞函數均采用tanh函數,學習函數用trainlm,迭代次數為10 000,訓練目標誤差為0.000 1。
標準BP神經網絡模型的求解方法是基于梯度下降法,而LM算法兼?zhèn)涮荻认陆捣ê透倪M牛頓法的優(yōu)點。設神經網絡模型在第k次迭代時,權值和閾值組成的向量為xk,則第k+1次迭代時,新向量xk+1的更新可表述為式(8)[18]。由于LM 算法是高斯-牛頓法的一種改進形式,因此,式(8)中權值及閾值變化量Δx可描述為式(9)[18]。由于LM 算法應用了近似的二階導數信息,因此比梯度法收斂速度要快得多,并且算法更穩(wěn)定。在該LM算法優(yōu)化的神經網絡模型(LM-BP-WSPIT)中,所有的網絡參數設置均與GA-BP-WSPIT模型相同。
xk+1=xk+Δx
(8)
Δx=-[JT(x)J(x)+μI]-1J(x)e(x)
(9)
式中:J(x)為Jacobian 矩陣;μ(μ>0)為比例系數;I為單位矩陣。
標準BP算法在調整神經網絡權值時,并沒有考慮迭代過程中的梯度方向,可能會導致訓練過程出現振蕩趨勢,引起神經網絡陷入局部極小點和出現迭代速度慢等問題。基于AM算法的神經網絡模型(AM-BP-WSPIT)則考慮了以前時刻的貢獻,其權值迭代公式如式(10)所示[19]。
ωij(n+1)=ωij+η[(1-α)D(n)+αD(n-1)]
(10)
式中:D(n)和D(n-1)分別表示n時刻和n-1時刻的負梯度;η為學習率;α為動量因子。
模型預測性能的評價指標包括:平均相對誤差MAPE和均方根誤差RMSE,計算式分別為:
(11)
(12)
式中:WL為蒸騰速率預測值;WR為蒸騰速率實測值;N為樣本數。
本文主要通過預測值和實測值間的線性一致性和統(tǒng)計學指標(MAPE和RMSE)對模型訓練效果進行分析評價。圖1為三種神經網絡模型(GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT)的預測值和實測值間的線性關系。由圖1可知,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型預測值與實測值間所構成的線性方程的斜率分別為1.004、1.003和1.013,決定系數分別為0.998、0.991和0.982。由此可以說明,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型預測值與實測值間均具有較好的一致性,它們的一致性優(yōu)劣程度表現為:GA-BP-WSPIT模型>LM-BP-WSPIT模型>AM-BP-WSPIT模型。為了進一步分析模型的訓練效果,結合數據樣本,對MAPE和RMSE兩項統(tǒng)計學特征值進行了計算以及對樣本進行了t檢驗分析,結果如表1所示。由表1可知,GA-BP-WSPIT模型、LM-BP-WSPIT模型和AM-BP-WSPIT模型的MAPE分別為1.94%、3.90%和5.23%,RMSE分別為0.074、0.154和0.220。由此說明,三種模型的訓練效果好壞表現為:GA-BP-WSPIT模型>LM-BP-WSPIT模型>AM-BP-WSPIT模型。t檢驗結果表明,三種模型的預測值和實測值之間均無顯著的統(tǒng)計學差異。綜上表明,GA-BP-WSPIT模型、LM-BP-WSPIT模型和AM-BP-WSPIT模型的訓練結果具有較高的精度,均可用于蓄水坑灌蘋果樹蒸騰速率預測,其中GA-BP-WSPIT模型的訓練效果最優(yōu)。
圖1 訓練組實測值與預測值間的線性關系Fig.1 Linear relationship between measured values and predictive values in training group
為了進一步驗證三種模型的預測效果,首先將56組驗證集樣本帶入訓練好的模型中,得到驗證集樣本的預測值,然后對驗證集樣本實測值和預測值間的線性一致性和統(tǒng)計學誤差進行分析評價。圖2為驗證集樣本實測值與預測值間的線性關系。由圖2可知,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型預測值與實測值間所構成的線性方程的斜率分別為1.004、0.991和0.968,決定系數分別為0.997、0.993和0.981。說明GA-BP-WSPIT模型預測值與實測值間的線性一致性最好,LM-BP-WSPIT模型次之,AM-BP-WSPIT模型最差。表2為三種模型預測值和實測值間的統(tǒng)計學特征。由表2可以看出,GA-BP-WSPIT、LM-BP-WSPIT和AM-BP-WSPIT模型預測值與實測值間的MAPE分別為2.17%、3.56%和5.68%,RMSE分別為0.403、0.070和0.111。t檢驗結果表明,三種模型的預測值和實測值之間均無顯著的統(tǒng)計學差異。綜上所述,GA-BP-WSPIT模型的預測效果最好。因此,在蓄水坑灌條件下蘋果樹蒸騰速率定量預測中,建議采用GA-BP-WSPIT模型。
圖2 預測組樣本實測值與預測值間的線性關系Fig.2 Linear relationship between the measured value and the predicted value in the predicted group
模型MAPERMSEt值顯著性GA-BP-WSPIT2.17%0.4030.0960.924LM-BP-WSPIT3.56%0.0701.9290.059AM-BP-WSPIT5.68%0.1111.4810.144
本文基于遺傳算法、列文伯格算法和附加動量算法優(yōu)化的BP神經網絡,建立了以氣溫、大氣相對濕度、光輻射強度和飽和水汽壓差為輸入,蓄水坑灌蘋果樹蒸騰速率為輸出的GA-BP-WSPIT、LM-BP-WSPIT和LM-BP-WSPIT預測模型,并采用野外實測數據對模型進行了率定和驗證。三種預測模型的精度好壞表現為:GA-BP-WSPIT>LM-BP-WSPIT>LM-BP-WSPIT。GA-BP-WSPIT模型的預測誤差為2.17%,預測效果最好。在蓄水坑灌條件下蘋果樹蒸騰速率定量預測中,建議采用GA-BP-WSPIT模型。蒸騰速率影響因素較多,如何選取適當的輸入項,從而優(yōu)化神經網絡輸入層和輸出層之間的高維非線性拓撲關系,實現模型結構合理化和模擬結果高精度化,是有待進一步研究的方向。