何南騰,鄒嘉南*,郭文弟,周笑遷,狄 迪
(1.南京信息工程大學(xué)中國(guó)氣象局氣溶膠與云降水重點(diǎn)開(kāi)放實(shí)驗(yàn)室,南京 210044;2.中國(guó)地質(zhì)調(diào)查局西安礦產(chǎn)資源調(diào)查中心,西安 710100)
蒸散發(fā)是陸面水循環(huán)中重要的水文過(guò)程之一,也是聯(lián)系植物碳交換和水分利用的關(guān)鍵生態(tài)過(guò)程[1]。作為大氣和地表之間的聯(lián)系,蒸散量作為水文參量同時(shí)出現(xiàn)在地表水量和能量平衡方程中,是陸面過(guò)程數(shù)值模擬研究中不可缺少的重要邊界條件。此外,Rosenberg 等[2]認(rèn)為70%降落到地球表面的降水是通過(guò)蒸發(fā)或蒸散作用回到大氣中的,在干旱區(qū)這個(gè)比例可達(dá)90%。因此,它對(duì)于了解作物蒸散發(fā)過(guò)程規(guī)律、水資源管理以及提高水資源利用效率以及干旱評(píng)定等[3-5]有重要意義。近年來(lái),Santos 等結(jié)合遙感技術(shù)與土壤水量平衡模型,估算了西班牙西南地區(qū)棉田2004—2005 年蒸散量的季節(jié)變化[6];Nobuhiro 等通過(guò)能量平衡波文比方法估算了常綠闊葉林蒸散發(fā)[1];Zhao 等基于多年渦度相關(guān)和小氣候梯度系統(tǒng)觀測(cè)數(shù)據(jù)庫(kù),使用了土壤水量平衡法、波文比法、Penman-Monteith(PM)等6 種方法估算并比較綠洲農(nóng)田蒸散量,發(fā)現(xiàn)Penman-Monteith(PM)結(jié)果最符合綠洲實(shí)際[7]。由于受不同地區(qū)氣象和地形、地貌時(shí)空異質(zhì)性的影響,不同參考作物蒸散量計(jì)算公式的適用性各不相同。Penman-Monteith(PM)公式作為FAO 專(zhuān)家組唯一推薦使用的參考作物蒸散量計(jì)算公式,至今多種參考作物蒸散量計(jì)算方法的適用性評(píng)價(jià)已成為當(dāng)今的熱點(diǎn)問(wèn)題。然而,參考作物蒸散量計(jì)算方法的普適性在極端干旱區(qū)卻鮮有研究。本文依據(jù)阿克蘇地區(qū)2006—2015 年日蒸散量數(shù)據(jù)與氣象資料,對(duì)Penman-Monteith(PM)公式進(jìn)行進(jìn)一步的優(yōu)化與適用性分析,以期推薦一個(gè)更加精確的參考作物蒸散量計(jì)算方法,這對(duì)于了解極端干旱區(qū)棉田等作物種植以及可持續(xù)發(fā)展有長(zhǎng)遠(yuǎn)的意義。
此外,由于氣象數(shù)據(jù)具備周期性強(qiáng)、時(shí)空性、多維多尺度、各屬性相互影響等特征,僅用傳統(tǒng)方法對(duì)氣象數(shù)據(jù)進(jìn)行分析和處理會(huì)遇到諸多困難[8]。目前,由于遙感衛(wèi)星成本低,基于遙感技術(shù)和模型估算蒸散發(fā)逐漸成為一種經(jīng)濟(jì)實(shí)用的手段[9-10]。另外,神經(jīng)網(wǎng)絡(luò)作為一種人工智能算法,有別于傳統(tǒng)方法,特別是應(yīng)用在處理非線性問(wèn)題上有著良好效果。此前,也有專(zhuān)家利用神經(jīng)網(wǎng)絡(luò)模型模擬膜下滴灌玉米逐日蒸散量[11]。本研究利用了反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,下文統(tǒng)一稱(chēng)為BP 神經(jīng)網(wǎng)絡(luò))、廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,下文統(tǒng)一稱(chēng)為GRNN 神經(jīng)網(wǎng)絡(luò))兩種神經(jīng)網(wǎng)絡(luò)對(duì)日蒸散量數(shù)據(jù)進(jìn)行擬合,希望通過(guò)此尋找出一種較為準(zhǔn)確的日蒸散量估算方法。
阿克蘇地區(qū)位于新疆中部地區(qū)、天山山脈中段南麓、塔里木盆地的北緣,78°03′~78°39′E,39°30′~42°41′N(xiāo),面積約為1325×104hm2。綜合觀測(cè)場(chǎng)位于阿克蘇站區(qū)內(nèi),地理坐標(biāo):80°45′E、40°37′N(xiāo),海拔1028m,2006 年建立,長(zhǎng)方形,大小150m×90m,可以滿(mǎn)足100a 尺度的采樣要求。
本研究使用了阿克蘇站中綜合觀測(cè)場(chǎng)農(nóng)田生態(tài)系統(tǒng)2006—2015 年有測(cè)量記錄的日蒸散量數(shù)據(jù)(100 個(gè)樣本,水量平衡法,單位mm·d-1,來(lái)自國(guó)家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺(tái)(http://www.cnern.org.cn/),在本研究中用于日蒸散量估算值的對(duì)比與驗(yàn)證。另外,使用了相匹配日期的阿克蘇站的氣象資料,包括日平均氣溫、日最高氣溫、最低氣溫、日照時(shí)數(shù)、平均相對(duì)濕度、平均水汽壓、平均風(fēng)速等氣候要素觀測(cè)數(shù)據(jù)和經(jīng)緯度、海拔高度等地理數(shù)據(jù)。由于國(guó)家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺(tái)中沒(méi)有阿克蘇站以上需求的日尺度氣象資料,所以,本研究需要的氣象資料引用了美國(guó)國(guó)家海洋和大氣管理局(NOAA)國(guó)家環(huán)境信息中心(NCEI)相應(yīng)的日尺度數(shù)據(jù)。
對(duì)于Penman-Monteith(PM)公式和GRNN 神經(jīng)網(wǎng)絡(luò)、BP 神經(jīng)網(wǎng)絡(luò),為方便對(duì)估算方法的評(píng)估,本研究采用同樣的樣本進(jìn)行對(duì)比。其中,Penman-Monteith(PM)公式包括了所有樣本的計(jì)算,GRNN 神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)驗(yàn)證集中的30 個(gè)樣本在總樣本中隨機(jī)選出。
1.3.1 Penman-Monteith(PM)公式
在蒸散量計(jì)算中,彭曼法(Penman-Monteith)基于能量平衡和水汽擴(kuò)散理論,不受作物種類(lèi)、土壤類(lèi)型和水汽條件等因素的限制,僅考慮氣候要素的影響,其計(jì)算得出的潛在蒸散量與實(shí)測(cè)值最為接近,因此被廣泛應(yīng)用到區(qū)域干濕狀況的評(píng)價(jià)研究中[12]。表達(dá)式如下:
式中,PE 為潛在蒸散量,Δ 表示空氣氣溫為T(mén)時(shí)的飽和水氣壓斜率,計(jì)算方式如(2),本次研究中T 取日平均氣溫,Tmean表示日平均溫度(℃),es表示飽和水氣壓(kPa),ea表示實(shí)際水氣壓(kPa);Rn為地表凈輻射,等于收入短波輻射Rns 和支出的凈長(zhǎng)波輻射Rnl 之差;G 為土壤熱通量,一天至十天的時(shí)間尺度,其參考草地的土壤熱容量相當(dāng)小,可以忽略不計(jì)。γ 為干濕表常數(shù),計(jì)算方式如(4),其中P 為大氣壓;u2為2m 高風(fēng)速,uz表示10m 高處風(fēng)速,z 表示高度,取10m。
1.3.2 方法校準(zhǔn)
在日蒸散量計(jì)算中,主要對(duì)地表凈輻射項(xiàng)的參數(shù)做出調(diào)整。目前對(duì)于地表凈輻射有諸多經(jīng)驗(yàn)方法已被廣泛用于估計(jì)世界各地的凈輻射,然而,這些經(jīng)驗(yàn)方法需要特定地點(diǎn)的參數(shù)校準(zhǔn)。Xiao 等[13]量化了地表反照率的時(shí)空變化以更好地估計(jì)中國(guó)地區(qū)的凈短波輻射,并基于原位觀測(cè)重新校了FAO-56 PM方法的參數(shù)以更好地估計(jì)凈長(zhǎng)波輻射。此方法也可用于彭曼法(Penman-Monteith)對(duì)日蒸散量的計(jì)算。地表凈輻射等于收入短波輻射Rns 和支出的凈長(zhǎng)波輻射Rnl 之差。對(duì)于短波輻射有:
其中,RS為太陽(yáng)輻射,對(duì)于阿克蘇地區(qū)(40°37′N(xiāo)),校準(zhǔn)后有:
其中α′隨月份變化如表1 所示
表1 阿克蘇地區(qū)地表反照率隨月份變化
此外,對(duì)于凈長(zhǎng)波輻射Rnl 有
其中,σ=4.903×10-9為斯蒂芬-玻爾茲曼常數(shù)(MK·K-4·m-2·d-1)。分別為最高和最低絕對(duì)氣溫(K=℃+273.16);ea為實(shí)際蒸汽壓;RS為太陽(yáng)輻射,RS0為晴空輻射;a、b 為經(jīng)驗(yàn)回歸系數(shù)(無(wú)量綱)。
對(duì)于阿克蘇地區(qū)a=0.50-0.002×lat=0.419,b=-0.25+0.002×lat=-0.169。所以對(duì)于修正后的地表凈輻射項(xiàng)可列為:
1.3.3 神經(jīng)網(wǎng)絡(luò)
(1)GRNN 神經(jīng)網(wǎng)絡(luò)
GRNN 具備很強(qiáng)的非線性映射能力、柔性結(jié)構(gòu)以及較好的容錯(cuò)性,適用于解決非線性問(wèn)題。GRNN在逼近能力和學(xué)習(xí)速度上也有很強(qiáng)的優(yōu)勢(shì),網(wǎng)絡(luò)最后收斂于樣本量積聚較多的優(yōu)化回歸面,另外在樣本數(shù)據(jù)較少時(shí),也有一個(gè)較好的預(yù)測(cè)效果。
GRNN 神經(jīng)網(wǎng)絡(luò)由四層構(gòu)成[14]。如圖1 所示,分別為輸入層、模式層、求和層和輸出層。假設(shè)樣本特征集為:{trx1,trx2,…,trxm},其中trxi=[x1,x2,…xn]。標(biāo)簽集為:{try1,try2,…,trym},其中tryi=[y1,y2…,yk]。
輸入測(cè)試樣本,節(jié)點(diǎn)個(gè)數(shù)等于樣本的特征維度。模式層中節(jié)點(diǎn)個(gè)數(shù)等于訓(xùn)練樣本的個(gè)數(shù),第i 個(gè)測(cè)試樣本trxi與第j 個(gè)測(cè)試樣本trxj之間的Gauss 函數(shù)取值為:
求和層節(jié)點(diǎn)個(gè)數(shù)等于輸出樣本維度加1×(k+1),求和層的輸出為兩部分,第一個(gè)節(jié)點(diǎn)輸出模式層輸出的算術(shù)和,其余k 個(gè)節(jié)點(diǎn)的輸出為模式輸出的加權(quán)和。假設(shè)對(duì)于測(cè)試樣本tex,模式層的輸出為{ɡ1,ɡ2,…ɡm(xù)}。
求和層第一個(gè)節(jié)點(diǎn)的輸出為:
其余k 個(gè)節(jié)點(diǎn)的輸出為:
其中加權(quán)系數(shù)yij為第j 個(gè)模式層節(jié)點(diǎn)對(duì)應(yīng)的訓(xùn)練樣本的標(biāo)簽的第j 個(gè)元素。
輸出層節(jié)點(diǎn)個(gè)數(shù)等于標(biāo)簽向量的維度,每個(gè)節(jié)點(diǎn)的輸出等于對(duì)應(yīng)的求和層輸出與求和層第一個(gè)節(jié)點(diǎn)輸出相除。
(2)BP 神經(jīng)網(wǎng)絡(luò)
本次研究還采用了BP 神經(jīng)網(wǎng)絡(luò)(如圖2),其含有輸入層、隱含層和輸出層三個(gè)部分。BP 神經(jīng)網(wǎng)絡(luò)使用梯度下降算法[15]。假設(shè)輸入層神經(jīng)元為P=[p1,p2,…,pi],隱含層神經(jīng)元為S=[s1,s2,…,sk],輸出層神經(jīng)元為Y=[y1,y2,…,yj]。另外,表示輸入層第i 個(gè)神經(jīng)元連接隱含層第k 個(gè)神經(jīng)元的權(quán)值,表示隱含層第k 個(gè)神經(jīng)元連接輸出層第j 個(gè)神經(jīng)元的權(quán)值。隱含層的激發(fā)函數(shù)為f1,輸出層的激發(fā)函數(shù)為f2,表示隱含層神經(jīng)元閾值,表示輸出層神經(jīng)元閾值,其中,∈(-1,1)。
輸入層各神經(jīng)元與隱含層各神經(jīng)由相應(yīng)的權(quán)值連接,隱含層的第一個(gè)神經(jīng)元x1,加權(quán)求和從輸入層每一個(gè)神經(jīng)元處得到輸出值,加上閾值,通過(guò)激發(fā)函數(shù)f1,得到該神經(jīng)元的輸出值:
然后,輸出層第一個(gè)神經(jīng)元y1 接收隱含層每一個(gè)神經(jīng)元輸出值,并加權(quán)求和得,加上閾值,通過(guò)激發(fā)函數(shù)f2,得到輸出層該神經(jīng)元的輸出值:
(3)評(píng)估方法
擬合優(yōu)度指標(biāo)通常用于評(píng)價(jià)改進(jìn)方法的性能,通常對(duì)于此類(lèi)研究采用Nash-Sutcliffe 系數(shù)(NSE)、平均偏差誤差(MBE)和均方根誤差(RMSE)。表達(dá)式如下[13]:
式中n 為觀測(cè)次數(shù);Re為估計(jì)數(shù)據(jù);R0為觀測(cè)數(shù)據(jù);Rave為觀測(cè)數(shù)據(jù)的平均值。Nash-Sutcliffe 系數(shù)取值范圍為-∞~1,其值越接近1,均方根誤差值越小,模型性能越好。平均偏差誤差為正值表示高估了結(jié)果,其為負(fù)值則表示低估了結(jié)果。
表2 為日蒸散量與日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時(shí)長(zhǎng)、降雨量等六個(gè)氣象要素相關(guān)系數(shù)的統(tǒng)計(jì)。其中,p 值表示原假設(shè)為真時(shí)得到的樣本觀察結(jié)果或者更極端結(jié)果出現(xiàn)的概率。* 表示有統(tǒng)計(jì)學(xué)差異(p<0.05),** 表示差異顯著(p<0.01),顯著性差異。它是統(tǒng)計(jì)學(xué)上對(duì)數(shù)據(jù)差異性的評(píng)價(jià)。通常情況下,實(shí)驗(yàn)結(jié)果達(dá)到0.05 水平或0.01 水平,才可以說(shuō)數(shù)據(jù)間具有差異顯著或是極顯著。
從表2 中可以看出,日蒸散量與其他六個(gè)氣象要素量均呈正相關(guān),與日最高溫度、日最低溫度和日平均露點(diǎn)溫度相關(guān)系數(shù)分別為0.3142、0.4338、0.4624,且均達(dá)到0.01 顯著性水平。神經(jīng)網(wǎng)絡(luò)對(duì)結(jié)果的預(yù)測(cè)如果是建立在具有高度相互影響的因素上,其預(yù)測(cè)模型和結(jié)果會(huì)相對(duì)可靠,綜合彭曼公式和相關(guān)系數(shù)考慮,本研究利用日最高溫度、日最低溫度、日平均露點(diǎn)溫度、風(fēng)速、日照時(shí)長(zhǎng)、緯度、海拔、日序作為自變量,日蒸散量作為因變量,建立神經(jīng)網(wǎng)絡(luò)模型。
表2 自相關(guān)性分析
如圖3 所示,修正過(guò)后彭曼公式對(duì)于日蒸散量的估算比修正前要?。∕BE 值由8.4428 減小到5.6030),且更接近于真實(shí)測(cè)量值。從擬合效果來(lái)看,Nash-Sutcliffe 系數(shù)修正前與修正后分別為0.0328與0.0132,能說(shuō)明結(jié)果接近觀測(cè)值的平均值水平,總體結(jié)果可信。同時(shí),修正前后的均方根誤差分別為11.7830 和8.7981。所以總的來(lái)說(shuō),修正后彭曼公式效果優(yōu)于修正前,對(duì)阿克蘇地區(qū)日蒸散量計(jì)算的適用性和準(zhǔn)確性相比修正前有所增加。
此次研究使用了一百個(gè)樣本,分成70 個(gè)訓(xùn)練集與30 個(gè)測(cè)試集,使用了日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時(shí)長(zhǎng)、緯度、海拔、日序等八個(gè)變量作為輸入值,日蒸散量作為輸出值。將GRNN 神經(jīng)網(wǎng)絡(luò)擬合結(jié)果與實(shí)際測(cè)量值進(jìn)行評(píng)估,其N(xiāo)ash-Sutcliffe 系數(shù)為-0.4410,均方根誤差為3.3431,說(shuō)明結(jié)果接近觀測(cè)值的平均值水平,總體結(jié)果可信。另外,測(cè)試集中仍有少部分預(yù)測(cè)值(4 個(gè))與測(cè)量值相比有較大誤差。這涉及到神經(jīng)網(wǎng)絡(luò)的泛化性問(wèn)題,此次研究的訓(xùn)練樣本數(shù)量較少,導(dǎo)致有少量較大誤差的預(yù)測(cè)值產(chǎn)生。
對(duì)于BP 神經(jīng)網(wǎng)絡(luò),為取消樣本數(shù)量對(duì)擬合效果的誤差,同樣分成70 個(gè)訓(xùn)練集與30 個(gè)測(cè)試集,使用了日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時(shí)長(zhǎng)、緯度、海拔、日序等八個(gè)變量作為輸入值,日蒸散量作為輸出值。估算結(jié)果與實(shí)際值的Nash-Sutcliffe 系數(shù)為-0.0883,均方根誤差為3.2659,總體結(jié)果可信。其中仍有少量的預(yù)測(cè)值與測(cè)量值相比有較大誤差。另外可以看出,BP 神經(jīng)網(wǎng)絡(luò)較GRNN 神經(jīng)網(wǎng)絡(luò)對(duì)日蒸散量估算有更好的效果。
經(jīng)過(guò)對(duì)比,BP 神經(jīng)網(wǎng)絡(luò)對(duì)于日蒸散量的估算效果優(yōu)于GRNN 神經(jīng)網(wǎng)絡(luò)。所以對(duì)于BP 神經(jīng)網(wǎng)絡(luò),本研究做了進(jìn)一步的評(píng)估。圖4 顯示神經(jīng)網(wǎng)絡(luò)輸出對(duì)訓(xùn)練、驗(yàn)證和測(cè)試集的目標(biāo)回歸圖。四幅圖的y=x 線表示目標(biāo)輸出,不同顏色的實(shí)線表示神經(jīng)網(wǎng)絡(luò)輸出。為了完美的配合,數(shù)據(jù)應(yīng)該沿著45 度的線下降??梢钥闯鲇?xùn)練集與驗(yàn)證集輸出值貼近目標(biāo)值,且回歸系數(shù)分別達(dá)到0.94244 和0.94606。同時(shí),測(cè)試集回歸系數(shù)為0.6113,效果不如訓(xùn)練集與驗(yàn)證集,本研究認(rèn)為是由數(shù)據(jù)量偏少造成。另外,總體的輸出值與目標(biāo)值也貼近且回歸系數(shù)達(dá)到了0.90871,證明BP 神經(jīng)網(wǎng)絡(luò)對(duì)于日蒸散量的估算問(wèn)題上,有一個(gè)很好的擬合效果。
本次研究對(duì)彭曼公式中地表凈輻射項(xiàng)做了一個(gè)修正,使其更好的服務(wù)于阿克蘇地區(qū),此外對(duì)于日蒸散量的計(jì)算方法本身,采用了GRNN 和BP 兩種機(jī)器學(xué)習(xí)方法進(jìn)行了擬合計(jì)算,發(fā)現(xiàn)BP 神經(jīng)網(wǎng)絡(luò)在解決此類(lèi)問(wèn)題上有較高的準(zhǔn)確性。這一研究對(duì)阿克蘇地區(qū)的日蒸散量估算、了解極端干旱區(qū)的棉田等作物種植有長(zhǎng)遠(yuǎn)的意義。
此外,神經(jīng)網(wǎng)絡(luò)自身擬合準(zhǔn)確性還與數(shù)據(jù)量有關(guān),阿克蘇站觀測(cè)數(shù)據(jù)量偏少是本研究一大局限性,所以后續(xù)仍需有大量的觀測(cè)數(shù)據(jù)投入到神經(jīng)網(wǎng)絡(luò)模型中。
致謝:本文數(shù)據(jù)來(lái)源于國(guó)家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺(tái)(http://www.cnern.org.cn/),感謝此網(wǎng)站提供的阿克蘇站日蒸散量觀測(cè)數(shù)據(jù)。