任傳棟,王志真,馬 釗,張 敏
(山東省水利勘測(cè)設(shè)計(jì)院,濟(jì)南250013)
蒸散(Evapotranspiration,ET)由植株蒸騰與株間蒸發(fā)2部分組成,其值的準(zhǔn)確估算對(duì)灌溉需水量確定及農(nóng)田生態(tài)系統(tǒng)評(píng)價(jià)意義重大[1,2]。參考作物蒸散量(Reference crop evapotranspiration,ET0)的估算精度在一定程度上決定了ET的估算精度,它是作物系數(shù)法估算區(qū)域ET的重要參數(shù)之一[3]。FAO-56 分冊(cè)規(guī)定的Penman-Monteith(PM)模型綜合考慮了能量平衡和空氣動(dòng)力學(xué)的相關(guān)理論,是估算ET0的標(biāo)準(zhǔn)模型[4,5]。PM 模型計(jì)算時(shí)涉及到了多個(gè)氣象參數(shù),例如最高溫度、最低溫度、相對(duì)濕度、風(fēng)速等,這使得該模型的廣泛應(yīng)用性受到了一定的限制[6]。因此,研究區(qū)域ET0估算的簡(jiǎn)化模型,在保證估算精度的前提下使用較少的氣象參數(shù),這對(duì)區(qū)域灌溉決策的制定具有十分重要的意義。
為更好地估算區(qū)域ET0,研究學(xué)者采用了多種ET0簡(jiǎn)化計(jì)算的經(jīng)驗(yàn)?zāi)P?,例如溫度模型、輻射模型、質(zhì)量傳輸模型、蒸發(fā)皿模型等,在這些模型中,溫度模型、輻射模型和質(zhì)量傳輸模型的應(yīng)用較廣泛[7,8]。Almorox 等[9]研究比較了11 種溫度模型的計(jì)算精度,指出了Hargreaves(HS)模型精度最高;楊永剛等[10]在中國三大灌區(qū)比較了8 種溫度模型的精度,指出HS 模型在河套灌區(qū)的精度最高;Feng 等[11]比較了Priestley-Taylor(PT)、Makkink(MK)和Ritchie (RC)3 種輻射模型的精度,指出PT 模型在3 種輻射模型中的精度最高;吳宗俊等[12]利用差分進(jìn)化算法對(duì)MK 模型進(jìn)行了改進(jìn),并在四川盆地驗(yàn)證了該模型精度,指出改進(jìn)后的MK 模型R2可達(dá)0.87,精度優(yōu)于其余模型;褚榮浩等[13]比較了質(zhì)量傳輸模型與其余10 種模型的精度,驗(yàn)證了質(zhì)量傳輸模型的適用性。盡管經(jīng)驗(yàn)?zāi)P鸵驯憩F(xiàn)出了出色的性能,但它們的性能在不同地區(qū)之間存在很大差異[14]。
近年來,深度學(xué)習(xí)模型已在不同領(lǐng)域證明了其精度,深度學(xué)習(xí)模型應(yīng)用最廣泛的包括深度神經(jīng)網(wǎng)絡(luò)(DNN)、時(shí)間卷積神經(jīng)網(wǎng)絡(luò)(TCN)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)3 種[14]。Zhang 等[15]基于LSTM 模型預(yù)測(cè)了中國西北干旱地區(qū)河套灌區(qū)五個(gè)分區(qū)的地下水位深度動(dòng)態(tài)變化;Wang 等[16]在地下水流動(dòng)中驗(yàn)證了DNN 模型的精度;邢立文等[17]在華北地區(qū)驗(yàn)證了LSTM模型的精度。
深度學(xué)習(xí)模型已在不同領(lǐng)域取得了較高的精度,但在ET0估算中的應(yīng)用仍然較少。為證明深度學(xué)習(xí)模型在ET0估算中的適用性,本文以山東省為研究區(qū)域,選擇DNN、TCN 和LSTM 3 種深度學(xué)習(xí)模型估算區(qū)域ET0,并將計(jì)算結(jié)果與傳統(tǒng)機(jī)器學(xué)習(xí)模型和經(jīng)驗(yàn)?zāi)P瓦M(jìn)行對(duì)比,在有限氣象資料輸入的條件下,找尋最優(yōu)模型。
山東省位于我國中東部沿海地區(qū),屬暖溫帶季風(fēng)氣候區(qū),降水時(shí)空分布不均,旱澇災(zāi)害頻發(fā)對(duì)當(dāng)?shù)亟?jīng)濟(jì)造成了嚴(yán)重影響。由于區(qū)域地形變化較大,導(dǎo)致區(qū)域水循環(huán)差異明顯,因此,研究山東省的ET0最優(yōu)估算模型,對(duì)當(dāng)?shù)胤篮捣罎痴叩闹贫ň哂惺种匾囊饬x。本文選擇山東省惠民、青島、濟(jì)南等10 個(gè)站點(diǎn)1980-2018年的逐日氣象數(shù)據(jù),氣象數(shù)據(jù)來自國家氣象數(shù)據(jù)中心,質(zhì)量控制良好,主要包括日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時(shí)數(shù)(n)、相對(duì)濕度(RH)和10 m處風(fēng)速(U10),站點(diǎn)分布情況可見圖1。
1.2.1 Penman-Monteith模型
Penman-Monteith 模型(PM 模型)可作為ET0計(jì)算的標(biāo)準(zhǔn)模型[4],具體公式如下:
式中:Rn為作物表面的凈輻射,MJ/(m2·d);T為2 m 高處的日均氣溫,℃;G為土壤熱量通量密度,MJ/(m2·d);U2為2 m 高處風(fēng)速,m/s;采用FAO 推薦方法[4]由10 m 風(fēng)速換算得出;es為飽和水汽壓差,kPa;ea為實(shí)際水汽壓差,kPa;Δ為蒸汽壓曲線的斜率,kPa/℃;γ為干濕計(jì)常數(shù),kPa/℃。
1.2.2 深度學(xué)習(xí)模型
(1)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)。長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)可有效記憶數(shù)據(jù)歷史規(guī)律,避免了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)參數(shù)的隨機(jī)性。該模型由輸入閥門、遺忘閥門、更新閥門和輸出閥門4部分組成。通過閥門的開啟與關(guān)閉,判定模型計(jì)算結(jié)果能否滿足精度要求,模型具有步驟可見文獻(xiàn)[17]。
①遺忘閥門。LSTM 模型的遺忘閥門Fi基于sig 激活函數(shù),讀取舊元素的輸出值Yi-1和新元素的輸入值Xi,并基于模型權(quán)重判定是否應(yīng)該保留新元素,原理公式如下:
式中:Fi為模型遺忘閥門;W為權(quán)重;b為偏執(zhí)矢量;σ為sig激活函數(shù)。
②輸入閥門。輸入閥門Ii可判斷輸出值能否達(dá)到預(yù)期,輸入閥門不但可以決定當(dāng)前元素的輸出值Yi,同時(shí)可基于tanh激活函數(shù)創(chuàng)建新的候選變量,從中選出最優(yōu)值,原理公式如下:
式中:Ii為模型輸入閥門;tanh 為模型激活函數(shù);Ui為候選變量,其余參數(shù)含義同上。
③更新閥門。更新閥門Zi將輸入閥門與遺忘閥門相乘,來判斷當(dāng)前元素的狀態(tài)是否由Si-1更新到Si,原理公式如下:
④輸出閥門。輸出閥門Oi計(jì)算當(dāng)前元素的輸出值Yi,基于sig和tanh 2個(gè)激活函數(shù)最終確定模型輸出值,原理公式如下:
式中:Yi為模型輸出值;Oi為輸出閥門,其余參數(shù)含義同上。
(2)時(shí)間卷積神經(jīng)網(wǎng)絡(luò)。時(shí)間卷積神經(jīng)網(wǎng)絡(luò)(TCN)是Bai 等[18]在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(CNN)的基礎(chǔ)上發(fā)展起來的。與CNN 模型相比,TCN 模型具有因果卷積和擴(kuò)展卷積兩個(gè)顯著的特征,使得TCN 模型在解決序列問題上明顯優(yōu)于一些傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,在TCN 模型計(jì)算中,時(shí)間t的輸出包含了之前的信息,這意味著TCN 模型可以“記憶”更長(zhǎng)的過去信息。當(dāng)考慮隨意卷積和擴(kuò)張卷積時(shí),時(shí)間t的輸出可用下式表示,模型具體步驟可見文獻(xiàn)[18]。
式中:F(t)為時(shí)間t的輸出函數(shù);fi為濾波函數(shù);xi為輸入項(xiàng);d為修正系數(shù);K為輸入項(xiàng)的個(gè)數(shù)。
(3)深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)(DNN)是一種新型的人工神經(jīng)網(wǎng)絡(luò)模型,其權(quán)值和偏差通過BP 神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。與傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)模型相比,DNN 模型具有更多的隱藏層,使其具有強(qiáng)大的能力來處理許多行業(yè)的回歸和分類任務(wù),DNN 模型包括兩個(gè)主要過程,分別為前饋過程和誤差反向傳播過程,具體步驟可見文獻(xiàn)[6]。
1.2.3 傳統(tǒng)機(jī)器學(xué)習(xí)模型
為進(jìn)一步證明深度學(xué)習(xí)模型的精度,本文選擇了3種傳統(tǒng)機(jī)器學(xué)習(xí)模型,分別為極限學(xué)習(xí)機(jī)模型(ELM)、廣義回歸神經(jīng)網(wǎng)絡(luò)模型(GRNN)和隨機(jī)森林模型(RF),在相同氣象參數(shù)輸入的條件下,比較3 種傳統(tǒng)機(jī)器學(xué)習(xí)模型與3 種深度學(xué)習(xí)模型的精度,3種傳統(tǒng)機(jī)器學(xué)習(xí)模型步驟可見文獻(xiàn)[2]。
1.2.4 經(jīng)驗(yàn)?zāi)P?/p>
為進(jìn)一步驗(yàn)證深度學(xué)習(xí)模型在不同氣象參數(shù)輸入下的精度,本文選擇了6 種經(jīng)驗(yàn)?zāi)P瓦M(jìn)行精度對(duì)比,包括2 種溫度模型、2 種輻射模型和2 種質(zhì)量傳輸模型,具體公式和參數(shù)含義可見表1。
表1 經(jīng)驗(yàn)?zāi)P凸郊皡?shù)
采用3 種氣象參數(shù)輸入組合訓(xùn)練模型,分別對(duì)應(yīng)基于輻射、溫度的和質(zhì)量傳輸?shù)慕?jīng)驗(yàn)?zāi)P??;?980-2010年的氣象數(shù)據(jù)訓(xùn)練模型,2011-2018年的數(shù)據(jù)預(yù)測(cè)模型,不同氣象組合方式可見表2。
表2 不同模型參數(shù)組合輸入方式
選擇均方根誤差(RMSE)、決定系數(shù)(R2)、平均絕對(duì)誤差(MAE)和效率系數(shù)(Ens)組成模型精度指標(biāo)評(píng)價(jià)體系,公式如下:
式中:Xi和Yi分別為模型模擬值及實(shí)測(cè)值;-X和-Y分別為Xi和Yi的平均值。
GPI指數(shù)可整合4個(gè)指標(biāo)的綜合評(píng)價(jià)結(jié)果[24],公式如下:
式中:αj為常數(shù);MAE和RMSE取1,Ens和R2取-1;gj為不同指標(biāo)的縮放值的中位數(shù);yij為不同指標(biāo)的尺度值。
表3 反映了不同溫度模型與PM 模型計(jì)算結(jié)果擬合方程斜率對(duì)比。表4 顯示,TCN 模型擬合方程斜率最接近標(biāo)準(zhǔn)值“1”,在不同站點(diǎn)均達(dá)到了0.80 以上。3 種深度學(xué)習(xí)模型的擬合效果均優(yōu)于其余模型,擬合效果由高到低依次為TCN 模型>LSTM模型>DNN模型,3種模型擬合方程斜率均在0.749以上。相同氣象參數(shù)輸入條件下,機(jī)器學(xué)習(xí)模型精度普遍優(yōu)于經(jīng)驗(yàn)?zāi)P?,HS模型、DA模型與PM模型計(jì)算結(jié)果的擬合性較差。
表3 不同溫度模型ET0日值與PM模型標(biāo)準(zhǔn)值擬合方程斜率對(duì)比
圖2 為不同溫度模型的計(jì)算精度對(duì)比。由圖2 可以看出,不同溫度模型計(jì)算精度存在差異,其中TCN 模型在不同模型中的精度最高,其RMSE、R2、Ens、MAE的中位數(shù)分別為0.523 mm/d、0.874、0.870和0.388 mm/d。3種深度學(xué)習(xí)模型精度普遍優(yōu)于其余模型,3 種深度學(xué)習(xí)模型的RMSE、R2、Ens和MAE的中位數(shù)分別為0.523~0.674 mm/d、0.788~0.874、0.784~0.870 和0.388~0.502 mm/d。3 種傳統(tǒng)機(jī)器學(xué)習(xí)模型精度優(yōu)于2種經(jīng)驗(yàn)?zāi)P停渲蠷F 模型和ELM 模型的精度較高,GRNN 模型的精度較低。HS 模型和DA 模型的精度較低,其RMSE、R2、Ens和MAE的中位數(shù)分別為0.964 和1.117 mm/d、0.741 和0.736、0.560 和0.507、0.761 和0.897 mm/d??傮w而言,與其余模型相比,深度學(xué)習(xí)模型表現(xiàn)出更好的計(jì)算精度,其在不同站點(diǎn)的精度均較高,計(jì)算結(jié)果的隨機(jī)性較低。
圖2 不同溫度模型模擬ET0精度對(duì)比
表4 為不同輻射模型與PM 模型計(jì)算標(biāo)準(zhǔn)值擬合方程斜率對(duì)比。表4顯示,輻射模型的擬合效果明顯優(yōu)于溫度模型,同時(shí)TCN 模型效果最優(yōu),其在不同站點(diǎn)的擬合方程斜率在0.904~1.021之間。3種深度學(xué)習(xí)模型的擬合效果均優(yōu)于其余模型,擬合效果表現(xiàn)為TCN模型>LSTM模型>DNN模型,擬合方程斜率均在0.85 以上。相同氣象參數(shù)輸入條件下,機(jī)器學(xué)習(xí)模型精度普遍優(yōu)于經(jīng)驗(yàn)?zāi)P?,HS 模型、DA 模型與PM 模型計(jì)算結(jié)果的擬合性較差,擬合方程斜率距標(biāo)準(zhǔn)值“1”的偏差較大,表明經(jīng)驗(yàn)?zāi)P驮谟?jì)算ET0時(shí)具有較大的隨機(jī)性。
表4 不同輻射模型ET0日值與PM模型標(biāo)準(zhǔn)值擬合方程斜率對(duì)比
圖3 為不同輻射模型的計(jì)算精度對(duì)比。由圖3 可以看出,不同輻射模型計(jì)算精度存在差異,但精度總體優(yōu)于溫度模型,其中TCN 模型在不同模型中的精度最高,其RMSE、R2、Ens、MAE的中位數(shù)分別為0.319 mm/d、0.952、0.950和0.231 mm/d。3 種深度學(xué)習(xí)模型精度普遍優(yōu)于其余模型,RMSE、R2、Ens和MAE的中位數(shù)分別為0.319~0.409 mm/d、0.920~0.952、0.921~0.950 和0.231~0.307 mm/d,其中,TCN 模型精度最高,LSTM模型精度次之。3種傳統(tǒng)機(jī)器學(xué)習(xí)模型精度優(yōu)于2種經(jīng)驗(yàn)?zāi)P?,其中ELM 模型和RF 模型的精度較高,RMSE、R2、Ens和MAE的中位數(shù)分別為0.416 和0.444 mm/d、0.915 和0.907、0.914 和0.904、0.330 和0.328 mm/d。HS 模型和DA 模型的精度較低,其RMSE、R2、Ens和MAE的中位數(shù)分別為0.726 和0.769 mm/d、0.806和0.838、0.738和0.712、0.555和0.601 mm/d。
圖3 不同輻射模型模擬ET0精度對(duì)比
表5 為不同質(zhì)量傳輸模型與PM 模型計(jì)算標(biāo)準(zhǔn)值擬合方程斜率對(duì)比。表5顯示,質(zhì)量傳輸模型的擬合效果介于溫度模型與輻射模型之間,同樣表現(xiàn)為TCN 模型擬合精度最高,其在不同站點(diǎn)的擬合方程斜率均在0.886~0.979 之間。3 種深度學(xué)習(xí)模型的擬合效果均優(yōu)于其余模型,擬合方程斜率均在0.85以上。HS 模型、DA 模型與PM 模型計(jì)算結(jié)果的擬合性較差,擬合方程斜率與標(biāo)準(zhǔn)值“1”的偏差在0.163~0.367之間。
表5 不同質(zhì)量傳輸模型ET0日值與PM模型標(biāo)準(zhǔn)值擬合方程斜率對(duì)比
圖4 為不同質(zhì)量傳輸模型的計(jì)算精度對(duì)比。由圖4 可以看出,不同質(zhì)量傳輸模型的精度明顯優(yōu)于溫度模型,但略低于輻射模型。TCN 模型在不同模型中的精度最高,RMSE、R2、Ens、MAE的中位數(shù)分別為0.358 mm/d、0.943、0.939 和0.263 mm/d。相同輸入?yún)?shù)下的機(jī)器學(xué)習(xí)模型精度普遍優(yōu)于經(jīng)驗(yàn)?zāi)P停渲?種深度學(xué)習(xí)模型的精度較高。HS模型和DA 模型的精度較低,其RMSE、R2、Ens和MAE的中位數(shù)分別為0.851 和0.870 mm/d、0.706 和0.740、0.683 和0.685、0.731 和0.714 mm/d。
圖4 不同質(zhì)量傳輸模型模擬ET0精度對(duì)比
綜上所述,深度學(xué)習(xí)模型精度普遍優(yōu)于其余模型,其中,TCN模型在不同氣象參數(shù)輸入下均表現(xiàn)出了較高的精度。
為綜合判定不同輸入?yún)?shù)組合下不同模型的計(jì)算精度,本文綜合比較了24 種模型的GPI,結(jié)果見圖5。由圖5 可以看出,在不同模型中,輻射模型精度最高,質(zhì)量傳輸模型精度次之,溫度模型精度較低。TCN2 模型在所有模型中精度最高,GPI 中位數(shù)為1.036,LSTM2 模型精度次之,GPI 為0.975。溫度模型和質(zhì)量傳輸模型中,均表現(xiàn)為TCN 模型精度最高,GPI 分別為-0.006 和0.873。相同參數(shù)輸入下的經(jīng)驗(yàn)?zāi)P途容^低,其中HS和DA模型GPI僅為-2.365和-2.877。
圖5 不同參數(shù)輸入組合下不同模型GPI對(duì)比
已有研究表明,輸入氣象參數(shù)組合的不同對(duì)模型預(yù)測(cè)ET0的精度起著主要作用[25]。不同區(qū)域研究均表明,輻射數(shù)據(jù)是保障ET0較高估算精度的關(guān)鍵參數(shù)[26]。Feng 等[27]指出基于溫度和輻射參數(shù)作為機(jī)器學(xué)習(xí)模型的輸入組合,可保證模型較高的精度。3 種類型模型表現(xiàn)出的精度由高到低依次為輻射模型、質(zhì)量傳輸模型、溫度模型,表明輻射是影響山東省ET0變化的關(guān)鍵因素。董旭光等[28]指出近50年,日照時(shí)數(shù)和風(fēng)速是影響山東省ET0變化的主要因素,這與本文結(jié)論基本一致。當(dāng)僅有溫度數(shù)據(jù)輸入時(shí),機(jī)器學(xué)習(xí)模型精度高于經(jīng)驗(yàn)?zāi)P?,可滿足ET0估算的精度要求。需要指出的是,本文中不僅使用了氣溫?cái)?shù)據(jù)(Tmin和Tmax),而且將Ra數(shù)據(jù)作為了溫度組合重要的輸入?yún)?shù),Ra數(shù)據(jù)可從年日和緯度得到,可近似作為全球太陽輻射,引入Ra作為訓(xùn)練數(shù)據(jù)的輸入,提高了基于溫度模型的準(zhǔn)確性。在中國,溫度資料的獲取是最為方便的,因此基于溫度的機(jī)器學(xué)習(xí)模型可實(shí)現(xiàn)實(shí)時(shí)快捷預(yù)報(bào)ET0,從而改善灌溉和水資源管理[29]。對(duì)于質(zhì)量傳輸模型,與溫度模型相比,引入相對(duì)濕度和風(fēng)速等氣候數(shù)據(jù),可提高模型精度,但其精度低于輻射模型,因此,對(duì)于質(zhì)量傳輸模型的應(yīng)用性有待進(jìn)一步討論。
傳統(tǒng)機(jī)器學(xué)習(xí)模型參數(shù)確定的隨機(jī)性導(dǎo)致了模型誤差較大,影響了最終模型模擬的結(jié)果。本文比較了3種深度學(xué)習(xí)模型與其余傳統(tǒng)機(jī)器學(xué)習(xí)模型的精度,指出了3種深度學(xué)習(xí)模型的精度普遍較高,因此,深度學(xué)習(xí)模型可以有效避免參數(shù)的隨機(jī)性選取,從而產(chǎn)生隨機(jī)初始化權(quán)值和隱藏偏差,最終避免了非最優(yōu)解,提高了模型精度[30]。深度學(xué)習(xí)模型通過對(duì)模型訓(xùn)練數(shù)據(jù)的學(xué)習(xí),從而自行進(jìn)行數(shù)據(jù)特征選擇,能夠更好地揭示數(shù)據(jù)的客觀規(guī)律,提高模型精度。TCN 模型的廣泛應(yīng)用可為農(nóng)業(yè)、水利、氣象部門活動(dòng)提供數(shù)據(jù)支撐,保證國家糧食生產(chǎn)及水資源的合理利用。
本文以LSTM 模型、TCN 模型和DNN 模型3 種深度學(xué)習(xí)模型為基礎(chǔ),與ELM、GRNN、RF3 種傳統(tǒng)機(jī)器學(xué)習(xí)模型和HS、DA等6種經(jīng)驗(yàn)?zāi)P蛯?duì)比,找到山東省ET0估算的最優(yōu)模型,得出以下結(jié)論:
(1)3 種深度學(xué)習(xí)模型精度普遍優(yōu)于其余模型,TCN 模型具有最高的精度,在不同站點(diǎn)擬合方程斜率最接近標(biāo)準(zhǔn)值“1”,RMSE、R2、Ens、MAE的中位數(shù)在0.318~0.523 mm/d、0.874~0.952、0.870~0.950、0.231~0.388 mm/d,TCN 模型在所有模型中GPI數(shù)值均最高;
(2)基于輻射的模型優(yōu)于基于溫度和質(zhì)量傳輸?shù)哪P停琓CN2 模型在所有模型中精度最高,其RMSE、R2、Ens、MAE的中位數(shù)分別為0.318 mm/d、0.952、0.950、0.231 mm/d,同時(shí)GPI達(dá)到了1.036,在所有模型中排名第1位。
綜上所述,深度學(xué)習(xí)模型可作為區(qū)域ET0估算的推薦模型使用,其中以TCN模型精度最高。