邱衛(wèi)華,嚴(yán) 蓓
(江西省上饒市玉山縣水利局,江西 玉山 334700)
潛在蒸散量又稱為參考作物蒸散量(Reference crop evapotranspiration,ET0),作為估算作物實際蒸散及灌溉制度制定的重要參數(shù),其準(zhǔn)確估算方法的研究一直是國內(nèi)外研究的熱點[1~3]。ET0獲取最精確的方法為蒸滲儀實測法,但這種方法成本較高,在全國范圍內(nèi)難以實現(xiàn)[4,5]。國際糧農(nóng)組織FAO-56分冊推薦Penman-Monteith(PM)公式為計算ET0的標(biāo)準(zhǔn)方法,該方法包括了輻射項與空氣動力學(xué)項,綜合考慮了輻射、濕度、風(fēng)速、溫度等氣象因素,保證了方法的計算精度[6,7]。但該方法由于需要的因素較多,在氣象因素缺失的地區(qū)應(yīng)用受到了限制,因此對于ET0簡化計算方法的研究成為了熱點。
溫度是現(xiàn)有條件下最易獲得的氣象數(shù)據(jù)之一,同時溫度是影響ET0產(chǎn)生的主要因素之一,因此,基于溫度資料建立適用于區(qū)域的ET0精確計算模型十分重要。Almorox等[7]以全球為研究區(qū)域,基于全球4 362個氣象站點,研究比較了11種溫度資料計算ET0模型的精度,并找出了適用于不同區(qū)域的不同最優(yōu)模型;馮禹等[8]研究了溫度資料條件下廣義回歸神經(jīng)網(wǎng)絡(luò)模型和小波神經(jīng)網(wǎng)絡(luò)模型在四川盆地中的計算精度,并將計算結(jié)果與Hargreaves模型比較,指出2個模型在僅考慮溫度資料的條件下,表現(xiàn)出了較高的精度;同時隨著機(jī)器學(xué)習(xí)模型研究的不斷深入,輸入相同資料下的機(jī)器學(xué)習(xí)模型精度普遍高于傳統(tǒng)經(jīng)驗?zāi)P停跎萚9]、Abdullah等[10]均得到了類似的結(jié)論。
江西省位于我國華東地區(qū),是國內(nèi)著名的“魚米之鄉(xiāng)”和重要的水稻生產(chǎn)基地。區(qū)域?qū)賮啛釒Ъ撅L(fēng)氣候區(qū),土壤以紅壤為主,蓄水能力較差,長年的季節(jié)性干旱在一定程度上限制了當(dāng)?shù)亟?jīng)濟(jì)及農(nóng)業(yè)的發(fā)展[11]。本文以江西省為研究區(qū)域,基于極限學(xué)習(xí)機(jī)模型(ELM)、支持向量機(jī)模型(SVM)、隨機(jī)森林模型(RF)和M5樹模型(M5T),在僅用溫度資料條件下模擬當(dāng)?shù)谽T0,并將模擬結(jié)果與PM模型和Hargreaves模型(HS)計算結(jié)果比較,得出適用于江西省ET0計算的標(biāo)準(zhǔn)模型。
江西省 (N24°29′14″~30°04′41″,E113°34′36″~118°28′58″)空氣濕潤,雨量充足,多年平均降水量在1 630mm左右,溫度適中,年平均氣溫11.6~20℃,全省冬暖夏熱,無霜期長達(dá)240~307天,年日照時數(shù)1 600h左右。本文選擇江西省區(qū)域內(nèi)南昌、南城、景德鎮(zhèn)、吉安、贛州5個氣象站點1961~2017年的逐日氣象數(shù)據(jù),計算不同站點的ET0,得出最優(yōu)模型。
本文數(shù)據(jù)均來自于中國氣象網(wǎng)站,數(shù)據(jù)控制良好,氣象資料主要包括站點日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時數(shù)(n)、相對濕度(RH)和10m處風(fēng)速(U10)。
1.2.1 Penman-Monteith模型(PM)
Penman-Monteith(PM)模型為ET0計算的標(biāo)準(zhǔn)模型,其模型型式及參數(shù)意義見文獻(xiàn)[12]。
1.2.2 Hargreaves模型(HS)
Hargreaves(HS)模型僅考慮溫度,可較高精度模擬ET0,具體公式如下:
式中,Ra為大氣頂層輻射,(MJ m-2d-1);Tmax、Tmin為最高、最低溫度,(℃);C為常數(shù)。
1.2.3 極限學(xué)習(xí)機(jī)模型(ELM)
極端學(xué)習(xí)機(jī)(ELM)可以克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)緩慢收斂的缺點,并已廣泛應(yīng)用于回歸測試和模型預(yù)測領(lǐng)域[13]。ELM模型可以分為3個部分:輸入層、隱藏層和輸出層(詳見圖1)。首先,通過輸入層輸入變量,輸出層權(quán)重βjk。輸出變量矩陣由權(quán)重ωij和隱藏層計算。
圖1 ELM模型原理圖
1.2.4 支持向量機(jī)模型(SVM)
支持向量機(jī)模型(SVM)被認(rèn)為是當(dāng)前小樣本統(tǒng)計估計和預(yù)測學(xué)習(xí)的最佳理論。該模型取代了傳統(tǒng)的經(jīng)驗最小化與結(jié)構(gòu)經(jīng)驗最小化,這可以克服神經(jīng)網(wǎng)絡(luò)的許多缺點,具體模型訓(xùn)練步驟可見文獻(xiàn)[14]。
1.2.5 隨機(jī)森林模型(RF)
隨機(jī)森林模型(RF)訓(xùn)練期間引入隨機(jī)屬性選擇,基于隨機(jī)性和差異提取數(shù)據(jù),可以大大提高決策的準(zhǔn)確性,具體模型訓(xùn)練步驟見文獻(xiàn)[15]。
1.2.6 M5樹模型(M5T)
M5樹模型(M5T)可在掃描所有可能的分裂后選擇預(yù)期的標(biāo)準(zhǔn)偏差,保證模型精度。組成模型的過程分為兩部分。首先,將數(shù)據(jù)分成若干子集以創(chuàng)建決策樹。然后通過模型計算子集的預(yù)期誤差,精度計算公式如下:
式中,SD和SDR是標(biāo)準(zhǔn)偏差;Q是一組目標(biāo)樣本;Qi是Q的一個子集。
1.2.7 模型訓(xùn)練與模擬
ELM模型、SVM模型、RF模型和M5T模型4種模型主要通過輸入溫度資料來進(jìn)行模擬,分別用Tmax、Tmin和Ra以ET0為輸出參數(shù)。機(jī)器學(xué)習(xí)模型以1961~2000年的逐日數(shù)據(jù)訓(xùn)練模型,以2001~2017年的數(shù)據(jù)測試模型精度。模型計算均采用Matlab2018a進(jìn)行,模型參數(shù)取值如表1。
表1 模型參數(shù)計算表
1.2.8 模型精度指標(biāo)
均方根誤差(RMSE),確定系數(shù)(R2)和效率系數(shù)(Ens)用于評估模型,具體公式如下:
式中,Xi和 Yi分別為標(biāo)準(zhǔn)值和預(yù)測值;為 Xi的平均值。
由于評價指標(biāo)過多,無法統(tǒng)一對模型精度進(jìn)行比較,因此需引入GPI指數(shù)綜合衡量各指標(biāo)的大小,評估模型精度:
式中,αj為系數(shù),其中 RMSE 取 1,Ensand R2取-1;gj為評價指標(biāo)的中位數(shù);yij為評價指標(biāo)的縮放值。
圖2為不同模型在不同站點ET0日值與PM模型計算值的擬合結(jié)果。由圖中可以看出,不同模型擬合結(jié)果存在一定的差異。ELM模型在不同站點的擬合效果最好,擬合方程斜率分別為1.106、0.973、1.151、1.090和1.055,與標(biāo)準(zhǔn)值“1”最為接近。SVM模型的精度次之,在5個站點的擬合方程斜率分別為0.858、0.790、0.895、0.877和0.888,RF模型和 M5T模型的精度較低,而HS模型的精度最低,與PM模型計算結(jié)果的擬合方程斜率僅為 0.548、0.583、0.652、0.642 和 0.624,與標(biāo)準(zhǔn)值“1”的差距較大。
圖2 南昌站PM模型與預(yù)測模型ET0擬合結(jié)果分析
圖3為不同站點不同模型ET0月值計算結(jié)果對比。ET0月值計算結(jié)果可更好地反映ET0的年內(nèi)變化趨勢,為表征模型精度高低,常需從日值和月值2個角度進(jìn)行評估,分析數(shù)據(jù)的年際變化趨勢和年內(nèi)變化趨勢。由圖中可以看出,不同模型計算得出的ET0值在多年年內(nèi)的變化趨勢基本一致,均呈開口向下的二次拋物線型式。不同模型ET0在11月、12月、1月、2月的值普遍較低,約80%的ET0均集中在了3~10月的主要作物生長季。不同模型ET0月值計算的精度不同,其中ELM模型和SVM模型的計算結(jié)果與PM模型計算結(jié)果變化趨勢較吻合,而M5T模型和HS模型在5個站點ET0月值的精度誤差較大。
圖3 不同站點不同模型模擬ET0月值精度對比
表2其余站點ET0擬合結(jié)果對比為不同模型在不同站點的精度指標(biāo)計算結(jié)果。由表2可以看出,由RMSE、R2和Ens組成的評價指標(biāo)體系可較好地反映不同模型模擬結(jié)果的誤差與一致性。ELM模型在僅有溫度資料輸入的前提下,RMSE僅為0.331~0.457mm/d,而 R2和 Ens分別達(dá)到了 0.945~0.969和 0.944~0.969,誤差最低而一致性最高,SVM模型的計算精度次之,RMSE為0.346~0.466mm/d,而R2和Ens分別為0.941~0.969和0.939~0.966,RF模型和M5T模型的計算精度較差。機(jī)器學(xué)習(xí)模型精度均高于HS模型,根據(jù)計算得出的GPI指數(shù)可知,5種模型計算精度由高到底依次為ELM模型、SVM模型、RF模型、M5T模型、HS模型。
圖4為不同模型計算值相對誤差絕對值的空間分布圖。由圖中可以看出,不同模型在不同地區(qū)的計算精度不同。ELM模型計算精度表現(xiàn)為由北到南精度逐漸提高,ELM模型在南昌和南城站附近的計算精度最低,相對誤差分別為17.53%和17.08%,在贛州站附近的精度最高;SVM模型與ELM模型計算精度變化范圍基本一致,在南昌和南城站附近相對誤差最高,分別為18.80%和18.25%;而RF模型、M5T模型和HS模型計算精度變化趨勢與ELM模型和SVM模型不同,3種模型在南昌站和南城站的相對誤差最低,而在吉安和景德鎮(zhèn)附近的計算誤差最高,因此在應(yīng)用不同模型時,應(yīng)針對站點不同選擇合適的模型進(jìn)行應(yīng)用。
表2 其余站點ET0擬合結(jié)果對比表
表3 不同模型計算精度指標(biāo)對比表
圖4 不同模型ET0空間精度對比
通過對不同機(jī)器學(xué)習(xí)模型在僅輸入溫度資料條件下的ET0模擬精度對比,可得出適用于江西省計算的ET0標(biāo)準(zhǔn)模型。從日值、月值、評價指標(biāo)及精度空間分布4個角度出發(fā),綜合分析了5種模型的計算精度,最終指出ELM模型在日值計算時的擬合方程斜率最好,月值計算與標(biāo)準(zhǔn)值擬合效果最好,評價指標(biāo)中的RMSE最低而R2和Ens最高,表現(xiàn)出了最低的誤差和最高的一致性,綜合表明了在僅有溫度資料下,ELM模型可作為江西省ET0計算的標(biāo)準(zhǔn)模型使用。