褚江東,粟曉玲,2,郭盛明,牛紀(jì)蘋
(1. 西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,陜西 楊凌 712100;2. 西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100)
潛在蒸散發(fā)(potential evapotranspiration,ET0)是水分循環(huán)與能量平衡的重要組成部分,與降水共同決定著區(qū)域的干濕狀況,是估算生態(tài)需水和農(nóng)業(yè)灌溉用水的關(guān)鍵因子[1],因此ET0的模擬研究具有十分重要的實(shí)際意義。
石羊河流域是我國(guó)內(nèi)流河流域人口密度最大、人均GDP較高、人均水資源占有量最少的地區(qū)之一[2],模擬石羊河流域ET0對(duì)西北地區(qū)有著很好的代表性。ET0是各氣象因子的非線性復(fù)雜函數(shù)[3],利用人工智能方法來(lái)模擬非線性關(guān)系得到了廣泛的應(yīng)用[4]。Huo等[5]研究表明在干旱半干旱地區(qū)模擬ET0時(shí),人工神經(jīng)網(wǎng)絡(luò)(ANN)模型相比MLRs(多重線性回歸)、Penman方程和經(jīng)驗(yàn)方程有著更好的精度;El-Shafie等[6]建立了可預(yù)測(cè)日ET0的集成神經(jīng)網(wǎng)絡(luò)模型(ENN),據(jù)伊朗拉什特市與馬來(lái)西亞新山市的最低日氣溫和最高日氣溫資料進(jìn)行模擬預(yù)測(cè),得出ENN模型預(yù)測(cè)日ET0的精度較MLP-ANN方法更高。支持向量機(jī)(SVM)與人工神經(jīng)網(wǎng)絡(luò)均已在降雨量預(yù)報(bào)中應(yīng)用[7]。本文以石羊河流域?yàn)槔鶕?jù)氣象站的逐日氣象資料,采用Penman-Monteith公式(簡(jiǎn)稱PM公式)計(jì)算日ET0,分別建立六因子、四因子、三因子的SVM模型和ANN模型,將日ET0計(jì)算值與SVM模型、ANN模型模擬得到的日ET0模擬值進(jìn)行比較,從中選擇所需氣象因子少、精度較高且可以在該流域推廣使用的模型。本研究期望對(duì)石羊河流域合理開發(fā)利用水資源、發(fā)展節(jié)水農(nóng)業(yè)、調(diào)整種植結(jié)構(gòu)等工作提供參考。
石羊河流域位于河西走廊東部、祁連山北麓,烏鞘嶺以西,是甘肅省河西走廊三大內(nèi)陸河流域之一,地理坐標(biāo)為北緯36°29′~39°27′,東經(jīng)101°41′~104°16′,流域總面積4.16 萬(wàn)km2,占甘肅省內(nèi)陸河流域總面積的15.4%[8]。近幾十年來(lái),流域經(jīng)濟(jì)的迅速發(fā)展造成水資源利用過(guò)度,區(qū)域生態(tài)環(huán)境一度急劇惡化,出現(xiàn)嚴(yán)重的生態(tài)問(wèn)題,通過(guò)近幾年的不斷治理才有所緩解[9]。
氣象資料包括石羊河流域內(nèi)5個(gè)氣象站的逐日平均氣溫、最高氣溫、最低氣溫、平均風(fēng)速、平均相對(duì)濕度、日照時(shí)數(shù)。其中古浪站的資料來(lái)源于甘肅省氣象局,資料長(zhǎng)度為2001-2005年,其余氣象站的資料均來(lái)源于中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)(http:∥data.cma.cn/),資料長(zhǎng)度為2013-2017年。烏鞘嶺站位于石羊河上游,古浪站、武威站、永昌站位于中游,民勤站位于下游。五個(gè)氣象站基本覆蓋了整個(gè)石羊河流域,具有很好的代表性。氣象站的相關(guān)地理信息見(jiàn)表1。
表1 石羊河流域各氣象站地理信息Tab.1 Geographic information of all meteorological stations in Shiyang River Basin
聯(lián)合國(guó)糧農(nóng)組織(FAO)將ET0定義為一種假想的參考作物的冠層的蒸發(fā)蒸騰速率,假設(shè)作物高度為0.12 m、固定的葉面阻力為70 s/m 、反射率為0.23,非常類似于高度一致、生長(zhǎng)旺盛、完全覆蓋地面而不缺水的開闊綠色草地的蒸發(fā)蒸騰速率[10]。計(jì)算ET0的方法很多:Rohwer在1931年提出了基于空氣動(dòng)力學(xué)、考慮水汽壓差和風(fēng)速影響的Rohwer模型[11];Blaney和Criddle在1950年提出了基于溫度的Blaney-Criddle模型[12];Hargreaves在1975年提出了基于能量的Hargreaves模型[13],Allen在1998年提出了Penman-Monteith模型[10]。隨著遙感技術(shù)的發(fā)展,很多學(xué)者把遙感獲取的參數(shù),比如土壤熱通量、葉面積指數(shù)、凈輻射等應(yīng)用到PM公式中,實(shí)現(xiàn)PM公式在區(qū)域尺度上的運(yùn)用[14]。段浩等[15]將遙感數(shù)據(jù)與PM公式相結(jié)合來(lái)推求ET0,該模型在望都站估算蒸散發(fā)取得較好結(jié)果;崔越等[16]基于BEPS-Terrainlab模型,利用Landsat5-8遙感數(shù)據(jù)和氣象資料等數(shù)據(jù)模擬了犟河流域的日蒸散發(fā),模擬結(jié)果與MODIS蒸散發(fā)產(chǎn)品MOD16A2結(jié)果的決定系數(shù)R2=0.92,驗(yàn)證了模擬的可靠性;FAO推薦的基于氣象數(shù)據(jù)的PM公式[17],綜合考慮了溫度、濕度、氣壓、風(fēng)速及太陽(yáng)輻射等因素的影響,在國(guó)內(nèi)外得到了廣泛的應(yīng)用。秦年秀[18]、李常斌[19]等將多種計(jì)算方法進(jìn)行對(duì)比分析,認(rèn)為在氣象資料較為完整的情況下,PM公式的計(jì)算值更接近ET0的實(shí)際值。PM公式如下[17]:
(1)
式中:ET0為潛在蒸散發(fā)量,mm/d;Δ為飽和水汽壓與溫度關(guān)系曲線的斜率,kPa/℃;Rn為作物表面凈輻射量,MJ/(m2·d);G為土壤熱通量,MJ/(m2·d);γ為濕度計(jì)常數(shù),kPa/℃;T為空氣平均溫度,℃;u2為地面以上2 m高處的風(fēng)速,m/s;es為空氣飽和水汽壓,kPa;ea為空氣實(shí)際水汽壓,kPa。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種模仿人腦結(jié)構(gòu)的信息處理系統(tǒng)模型[20],具有自學(xué)習(xí)、自組織、自適應(yīng)性的特點(diǎn),是一種非線性統(tǒng)計(jì)模型[21]。ANN模型由輸入層、隱層、輸出層組成,基本組成單元是節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)只與鄰層節(jié)點(diǎn)相連。目前運(yùn)用最廣泛的ANN模型為BP神經(jīng)網(wǎng)絡(luò),該模型信號(hào)正向傳播、誤差反向傳播。各層間信號(hào)傳遞原理一致,通過(guò)調(diào)整權(quán)值來(lái)調(diào)整相應(yīng)誤差。輸入層到隱層的傳遞過(guò)程,各層間通過(guò)激勵(lì)函數(shù)進(jìn)行轉(zhuǎn)換與轉(zhuǎn)移[20]。ANN模型被廣泛運(yùn)用于蒸散發(fā)演變與模擬[21,22]、降水量預(yù)報(bào)[7]等。
本研究中,采用古浪站2001-2004年、其余4站2013-2016年的日氣象數(shù)據(jù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的參數(shù)率定,采用古浪站2005年、其余站2017年數(shù)據(jù)進(jìn)行參數(shù)驗(yàn)證。
支持向量機(jī)(SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來(lái)的學(xué)習(xí)算法[23],在解決小樣本、非線性和高維模式識(shí)別問(wèn)題中有許多特有的優(yōu)勢(shì),在很大程度上克服了“維數(shù)災(zāi)難”和“過(guò)學(xué)習(xí)”等問(wèn)題[24]。SVM與BP神經(jīng)網(wǎng)絡(luò)類似,首先通過(guò)樣本率定期訓(xùn)練模型,然后使用訓(xùn)練好的模型進(jìn)行預(yù)測(cè)[25],再以檢驗(yàn)期檢驗(yàn)?zāi)P湍M預(yù)測(cè)的精度。
假定樣本的訓(xùn)練集為{(x1,y1), (x2,y2),…, (xi,yi)},xi,yi∈R。則需要求解的線性回歸函數(shù)為[4]:
f(x)=ωψ(x)+b
(2)
可通過(guò)求解風(fēng)險(xiǎn)函數(shù)的最小值來(lái)求解:
(3)
式中:ξ,ξ*分別是考慮允許擬合誤差后加入的松弛變量的上限和下限;ε為允許誤差;c為懲罰系數(shù)。
采用拉格朗日乘子法以及核函數(shù)將問(wèn)題轉(zhuǎn)換為對(duì)偶形式進(jìn)行求解:
(5)
(6)
(7)
將式(7)得到的解代入原方程得出SVM回歸方程f(x)為:
(8)
本文選用徑向基函數(shù)作為核函數(shù)。懲罰系數(shù)c為對(duì)誤差的寬容度,值越大表明誤差越??;核函數(shù)在公式中自帶一個(gè)參數(shù)g,該參數(shù)決定了數(shù)據(jù)映射后的分布。用SVM模型模擬時(shí)需要選擇合適的c和g才能得到相對(duì)理想的模擬結(jié)果。隨機(jī)選取參數(shù)訓(xùn)練模型得到的精度不穩(wěn)定,可能出現(xiàn)收斂速度慢或者不收斂的情況,而基于K-fold Cross Validation(K-CV)參數(shù)優(yōu)化方法可以避免上述情況和過(guò)學(xué)習(xí)欠學(xué)習(xí)的發(fā)生[26]。K-CV方法的主要思想是將原始數(shù)據(jù)分為k組,每組數(shù)據(jù)分別做一次驗(yàn)證集,其余k-1組子集數(shù)據(jù)作為訓(xùn)練集,由此可以k個(gè)模型,該k個(gè)模型驗(yàn)證集的分類準(zhǔn)確率平均值為性能指標(biāo)[27]。
選取平均絕對(duì)誤差MAE、均方根誤差RMSE、皮爾遜相關(guān)系數(shù)R(簡(jiǎn)稱相關(guān)系數(shù))以及確定性系數(shù)DC等指標(biāo)作為模型模擬精度的評(píng)價(jià)標(biāo)準(zhǔn)。其中MAE與RMSE越接近0,R與DC越接近1代表精度越高。各指標(biāo)的計(jì)算公式如下:
(9)
(10)
(11)
(12)
為探索更簡(jiǎn)便的模擬方法并為石羊河流域周邊氣象要素缺失的站點(diǎn)提供參考,嘗試減少模型的輸入因子進(jìn)行模擬率定和檢驗(yàn),得出結(jié)果與未減少氣象因子前進(jìn)行模擬精度比較。
以平均風(fēng)速、最高氣溫、平均氣溫、最低氣溫、平均相對(duì)濕度、日照時(shí)數(shù)分別建立六因子SVM模型和ANN模型,以平均氣溫、最高氣溫、最低氣溫、相對(duì)濕度建立四因子SVM模型1和ANN模型1,以平均氣溫、相對(duì)濕度、日照時(shí)數(shù)、平均風(fēng)速建立四因子SVM模型2和ANN模型2,以平均風(fēng)速、平均氣溫、日照時(shí)數(shù)建立三因子SVM模型1和ANN模型1,以平均溫度、日照時(shí)數(shù)、相對(duì)濕度建立三因子SVM模型2和ANN模型2,對(duì)石羊河流域的5個(gè)氣象站分別進(jìn)行日尺度ET0的模擬。
基于SVM模型模擬日ET0的5站率定期與檢驗(yàn)期的相關(guān)指標(biāo)見(jiàn)表1,以古浪站為例,ET0模擬值與PM公式計(jì)算值的結(jié)果對(duì)比見(jiàn)圖1。
由表1可以看出,每個(gè)模型R均大于0.93,在率定期除烏鞘嶺站三因子SVM模型1DC小于0.9之外,其他模型與站點(diǎn)DC均大于0.9,但檢驗(yàn)期有部分模型站點(diǎn)精度較差,其中永昌站和烏鞘嶺站的RMSE、MAE值偏大,DC值偏?。徊皇禽斎胍蜃釉蕉嗟玫降哪M精度就越好,其中以平均氣溫、日照時(shí)數(shù)、相對(duì)濕度建立的三因子SVM模型2較四因子模型和三因子SVM模型1相比各項(xiàng)指標(biāo)精度更高。綜合表1和圖1,可知每個(gè)模型在一定的精度要求下均可進(jìn)行預(yù)測(cè)模擬,為推廣使用選擇所需參數(shù)較少且精度較高的模型,在有平均風(fēng)速、平均氣溫、日照時(shí)數(shù)資料時(shí)可以使用三因子SVM模型1模擬ET0,在有平均氣溫、日照時(shí)數(shù)、相對(duì)濕度資料時(shí)可以使用三因子SVM模型2模擬ET0。
基于ANN模擬的石羊河流域5個(gè)氣象站日ET0在率定期和驗(yàn)證期的精度指標(biāo)見(jiàn)表2,以古浪站為例,ET0模擬值與PM公式計(jì)算值結(jié)果對(duì)比如圖2所示。
由表2和圖2可以看出六因子輸入時(shí),ANN模型模擬各站在率定期和檢驗(yàn)期的相關(guān)系數(shù)R與DC非常接近1,MAE與RMSE值很小,各站ET0計(jì)算值與模擬值基本吻合,且六因子ANN模型比SVM模型模擬精度高。
2種四因子ANN模型和三因子ANN模型的模擬精度均較同因子數(shù)的SVM模型的模擬精度高,因此在缺少日照時(shí)數(shù)與平均風(fēng)速資料時(shí)推薦使用四因子ANN模型1模擬日ET0,在缺少最高氣溫和最低氣溫資料時(shí)推薦使用四因子ANN模型2模擬日ET0;在流域站點(diǎn)只有平均氣溫、平均風(fēng)速、日照時(shí)數(shù)資料時(shí)推薦使用三因子ANN模型1模擬日ET0,在只有平均氣溫、平均相對(duì)濕度、日照時(shí)數(shù)資料時(shí)可以使用三因子ANN模型2模擬日ET0。
表1 不同輸入因子的SVM模型評(píng)價(jià)相關(guān)指標(biāo)Tab.1 Evaluation-related index of SVM models in different input factors
圖1 古浪站ET0 PM計(jì)算值與SVM模擬值對(duì)比Fig.1 The comparison of ET0 between PM calculated values and SVM simulated values in Gulang station
表2 不同輸入因子的ANN模型的評(píng)價(jià)相關(guān)指標(biāo)Tab.2 Evaluation-related index of ANN models in different input factors
圖2 古浪站ET0 PM計(jì)算值與ANN模擬值對(duì)比Fig.2 The comparison of ET0 between PM calculated values and ANN simulated values in Gulang station
通過(guò)PM公式計(jì)算出石羊河流域5個(gè)氣象站的逐日ET0,建立不同輸入因子下SVM與ANN的日ET0模擬模型,結(jié)果表明兩個(gè)模型在不同輸入因子條件下模擬結(jié)果均達(dá)到了較高的精度,均可用于石羊河流域日ET0的模擬預(yù)測(cè)。在相同輸入因子條件下,ANN模型較SVM模型精度更高,且程序運(yùn)行時(shí)間更短,因此推薦在石羊河流域日ET0的模擬預(yù)測(cè)時(shí)優(yōu)先使用ANN模型。
本研究探索了減少輸入因子的SVM模型與ANN模型對(duì)日ET0的模擬,SVM模型精度較ANN模型精度不高可能是沒(méi)有優(yōu)選合適的懲罰參數(shù)c和核函數(shù)參數(shù)g,模型存在著一定的優(yōu)化空間,有待進(jìn)一步的研究。每種模型都有自身的優(yōu)缺點(diǎn),在對(duì)某個(gè)區(qū)域進(jìn)行ET0的模擬預(yù)測(cè)時(shí),應(yīng)該考慮多種因素,采用多種模型綜合比較后選擇精度較高的模型。