龍亞星 黃勤 李成偉
(1 陜西省大氣探測(cè)技術(shù)保障中心,西安 710015; 2 秦嶺和黃土高原生態(tài)環(huán)境氣象重點(diǎn)實(shí)驗(yàn)室,西安 710016; 3 陜西省氣象信息中心,西安 710015)
機(jī)器學(xué)習(xí)是人工智能研究領(lǐng)域中一個(gè)極其重要的研究方向,在當(dāng)下的大數(shù)據(jù)時(shí)代背景下,捕獲數(shù)據(jù)并從中發(fā)現(xiàn)有價(jià)值的信息或模式,成為氣象行業(yè)創(chuàng)新綜合觀測(cè)、預(yù)報(bào)預(yù)測(cè)和氣象服務(wù)方式的重要手段[1-2]?;跉庀笥^測(cè)數(shù)據(jù),機(jī)器學(xué)習(xí)技術(shù)在農(nóng)業(yè)用水調(diào)度、空氣質(zhì)量預(yù)測(cè)、天氣雷達(dá)超折射回波識(shí)別等社會(huì)生產(chǎn)生活領(lǐng)域中得到了廣泛應(yīng)用[3-5]。蒸發(fā)是水循環(huán)的重要環(huán)節(jié),是自然界物質(zhì)能量循環(huán)代謝的主要手段,通過(guò)蒸發(fā)將植物、土壤、大氣和水分緊密的聯(lián)系在一起,其在全球氣候變化研究中具有敏感的指示作用[6-10]。
有研究表明,西北干旱區(qū)蒸發(fā)潛力在1993年出現(xiàn)了一個(gè)明顯的轉(zhuǎn)折變化,由顯著下降逆轉(zhuǎn)為顯著上升的趨勢(shì),氣候變暖、蒸發(fā)水平增大對(duì)西北干旱區(qū)生態(tài)效應(yīng)的負(fù)作用已日趨凸顯[11]。于占江等[12]分析近40年京津冀蒸發(fā)皿蒸發(fā)量與影響因子的相關(guān)系數(shù)發(fā)現(xiàn),氣溫日較差、日照時(shí)數(shù)和平均風(fēng)速是影響京津冀地區(qū)蒸發(fā)皿蒸發(fā)量變化的主要因子,在平原地區(qū),平均風(fēng)速是主導(dǎo)因子;在山區(qū)和高原地區(qū),日照時(shí)數(shù)是主導(dǎo)因子。申雙和等[13]利用中國(guó)472個(gè)氣象站1957—2001年20 cm口徑蒸發(fā)皿的實(shí)測(cè)資料分析了中國(guó)小型蒸發(fā)皿蒸發(fā)量的變化趨勢(shì)及其變化原因,結(jié)果表明:盡管在這45年間中國(guó)年平均氣溫以0.2 ℃/10a的趨勢(shì)遞增,但是蒸發(fā)皿蒸發(fā)量總體上卻以-34.12 mm/10a的速度遞減;通過(guò)對(duì)彭曼公式中能量平衡項(xiàng)和空氣動(dòng)力項(xiàng)的分析表明,東部蒸發(fā)皿蒸發(fā)量的下降主要是因?yàn)楣┱舭l(fā)的能量顯著減少,而西部地區(qū)蒸發(fā)皿蒸發(fā)量的下降主要是供蒸發(fā)的動(dòng)力下降所致;對(duì)各氣象因子的趨勢(shì)分析和相關(guān)分析表明,影響蒸發(fā)量的主要因子為風(fēng)速和日照時(shí)數(shù)。陜西位于中國(guó)西北內(nèi)陸東部,以北山和秦嶺為界,從北到南為溫帶干旱性氣候、暖溫帶濕潤(rùn)性氣候和亞熱帶大陸性氣候3個(gè)氣候帶,形成陜北黃土高原、關(guān)中平原和陜南秦巴山地,地貌多樣,具有多種農(nóng)牧業(yè)生產(chǎn)方式,用水矛盾突出,生態(tài)環(huán)境問(wèn)題是該區(qū)域的重要問(wèn)題[14-16]。
全國(guó)地面氣象觀測(cè)自動(dòng)化改革后,小型蒸發(fā)皿人工觀測(cè)任務(wù)全部取消,涉及全國(guó)2 000余個(gè)國(guó)家級(jí)氣象觀測(cè)站。如何彌補(bǔ)國(guó)家基準(zhǔn)氣候站、基本氣象觀測(cè)站冬季結(jié)冰期以及(常規(guī))氣象觀測(cè)站蒸發(fā)皿蒸發(fā)量觀測(cè)資料的空缺,是一個(gè)值得研究的科學(xué)問(wèn)題。吳華斌等[17]利用地面氣象觀測(cè)資料,探討了日蒸發(fā)量與其他氣象因子的相關(guān)性,建立了基于多元線性回歸的日蒸發(fā)量估算方程,年蒸發(fā)量估算值與實(shí)測(cè)值的平均相對(duì)誤差達(dá)到17.2%,估算絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例達(dá)到83.2%。徐俊增等[18]建立了基于氣象預(yù)報(bào)的參考作物蒸發(fā)蒸騰量的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,平均相對(duì)誤差達(dá)到17.9%,相對(duì)誤差在20%范圍內(nèi)的合格率為76.0%。閔騫[19]以彭曼公式為基礎(chǔ),根據(jù)中長(zhǎng)期氣候預(yù)報(bào)中一般可給出的月、旬平均氣溫和中雨(雪)以上降水天數(shù),對(duì)彭曼公式進(jìn)行分解,通過(guò)分別建立月、旬水面輻射平衡值R、空氣干燥力Ea2個(gè)參數(shù)的預(yù)測(cè)模式,建立月、旬水面蒸發(fā)量預(yù)測(cè)模型,月、旬水面蒸發(fā)量的預(yù)測(cè)平均相對(duì)誤差分別達(dá)到11.9%、11.2%,相對(duì)誤差在20%以內(nèi)的合格率分別為70.4%、72.2%。以上建立的估算或預(yù)測(cè)模型均達(dá)到了生產(chǎn)上的一般精度要求,但部分指標(biāo)值如平均相對(duì)誤差、絕對(duì)誤差等還存在提升的空間,且彭曼公式雖然可應(yīng)用于蒸發(fā)皿蒸發(fā)量估算,但原公式中的水面輻射平衡值R和空氣干燥力Ea參數(shù)還需要根據(jù)區(qū)域氣候特征進(jìn)行本地化修正,計(jì)算過(guò)程復(fù)雜。本文旨在利用常規(guī)地面氣象觀測(cè)資料,研究基于機(jī)器學(xué)習(xí)技術(shù)的不同氣候區(qū)域、不同時(shí)間尺度的蒸發(fā)皿蒸發(fā)量估算方法,同時(shí)探索基于機(jī)器學(xué)習(xí)技術(shù)的日蒸發(fā)量數(shù)據(jù)質(zhì)量控制內(nèi)部一致性檢查方法[20]。
本文選取陜西省15個(gè)國(guó)家基準(zhǔn)(基本)氣象站2004—2015年的逐日地面氣象觀測(cè)數(shù)據(jù),數(shù)據(jù)均通過(guò)CIMISS氣象數(shù)據(jù)統(tǒng)一服務(wù)接口獲取,資料站點(diǎn)分布見(jiàn)圖1。
圖1 陜西省15個(gè)國(guó)家基準(zhǔn)(基本)氣象站分布
各氣象站蒸發(fā)皿蒸發(fā)量在結(jié)冰期由314 cm2表面積、約10 cm高的小型蒸發(fā)皿觀測(cè),其余時(shí)間由表面積3000 cm2、深度60 cm的E-601B大型蒸發(fā)皿測(cè)得。2種蒸發(fā)皿的主要性能參數(shù)見(jiàn)表1。
表1 小型蒸發(fā)皿與E-601B大型蒸發(fā)皿主要性能參數(shù)及觀測(cè)資料精度
影響蒸發(fā)的主要?dú)庀笠蜃訛閯?dòng)力因子、熱力因子和水分因子[21],因此選擇逐日平均氣壓、平均氣溫、日照時(shí)數(shù)等15個(gè)氣象要素作為影響蒸發(fā)(響應(yīng)變量)的特征變量,某一日的特征變量及響應(yīng)變量構(gòu)成1個(gè)實(shí)例。為避免資料插補(bǔ)帶來(lái)的誤差影響,對(duì)于特征變量或響應(yīng)變量存在缺測(cè)或數(shù)據(jù)錯(cuò)誤的實(shí)例,不納入數(shù)據(jù)集。同時(shí),由于區(qū)別表面有無(wú)自由水存在的狀況非常有必要,因此需要考慮水量、水的狀態(tài);且在干燥和半干燥地區(qū),有必要區(qū)別蒸發(fā)面的大小及形狀,因此將小型蒸發(fā)皿蒸發(fā)量折算為大型蒸發(fā)皿E-601B蒸發(fā)量,折算系數(shù)τ取陜西省年平均值0.62[22-25]。本文估算及檢驗(yàn)的蒸發(fā)皿蒸發(fā)量與大型蒸發(fā)皿蒸發(fā)量對(duì)應(yīng)。
分別建立陜北、關(guān)中和陜南3個(gè)區(qū)域數(shù)據(jù)集,以及分別屬于陜北、關(guān)中和陜南的榆林、涇河和漢中3個(gè)單站數(shù)據(jù)集。每1個(gè)數(shù)據(jù)集包括訓(xùn)練集、驗(yàn)證集和測(cè)試集,訓(xùn)練集用于訓(xùn)練和構(gòu)建模型,驗(yàn)證集用于參數(shù)優(yōu)化及模型的選擇,測(cè)試集用于對(duì)最終選擇的模型進(jìn)行檢驗(yàn)評(píng)估。各區(qū)域、單站2005—2014年日資料中,75%的實(shí)例被隨機(jī)地劃分為訓(xùn)練集,其余25%的實(shí)例作為驗(yàn)證集。數(shù)據(jù)集基本情況見(jiàn)表2。
表2 區(qū)域及單站數(shù)據(jù)集基本情況
利用SPSS軟件分別對(duì)各數(shù)據(jù)集2005—2014年數(shù)據(jù)進(jìn)行分析,得出年尺度下蒸發(fā)皿蒸發(fā)與各氣象要素的Pearson相關(guān)系數(shù)(表3),可以看出,同一類別的氣象要素中,平均量一般不是最大的影響因子;平均氣壓、最高氣壓和最低氣壓對(duì)陜北、關(guān)中和陜南各區(qū)域整體和區(qū)域內(nèi)代表性站點(diǎn)的影響程度存在較大差異,說(shuō)明進(jìn)行區(qū)域或單站蒸發(fā)量估算時(shí)需要考慮的主要?dú)庀笠蜃蛹捌錂?quán)重系數(shù)不同。
在機(jī)器學(xué)習(xí)中,為便于訓(xùn)練和更好地反映各特征變量與響應(yīng)變量之間的相關(guān)關(guān)系,對(duì)表3中的所有特征變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,處理方法如下:
(1)
表3 年尺度下蒸發(fā)皿蒸發(fā)與各氣象要素的Pearson相關(guān)系數(shù)
本文機(jī)器學(xué)習(xí)模型的評(píng)價(jià)指標(biāo)包括:均方誤差MSE(Mean Square Error,MSE)、總相對(duì)誤差TRE(Total Relative Error,TRE)、準(zhǔn)確率CR(Correct Rate,CR)以及決定系數(shù)R2,評(píng)價(jià)估算值偏離實(shí)際觀測(cè)值的程度和估算準(zhǔn)確率,MSE為損失度量指標(biāo)[26]。
(2)
(3)
(4)
(5)
根據(jù)日平均氣壓、平均氣溫等進(jìn)行蒸發(fā)皿蒸發(fā)量估算,屬于監(jiān)督學(xué)習(xí)中的回歸問(wèn)題,學(xué)習(xí)的目標(biāo)是選擇損失最小的模型。本文采用的回歸方法為k近鄰法(KNN)、多層感知機(jī)(MLP)。KNN回歸的主要算法如下:給定1個(gè)訓(xùn)練數(shù)據(jù)集,在訓(xùn)練數(shù)據(jù)集中找到與測(cè)試數(shù)據(jù)集中實(shí)例最鄰近的k個(gè)實(shí)例,然后將這k個(gè)鄰居的平均值作為該測(cè)試實(shí)例的估算值。本文中,KNN回歸方法優(yōu)化的參數(shù)為:k值(n_neighbors=k),由于數(shù)據(jù)集已進(jìn)行標(biāo)準(zhǔn)化,本文距離度量采用歐式距離。
MLP又稱為前饋人工神經(jīng)網(wǎng)絡(luò),是一種廣義的線性模型,除了輸入、輸出層,其中間可以有多個(gè)隱層,層與層之間為全連接,執(zhí)行多層處理后得到結(jié)論。在MLP中,多次重復(fù)計(jì)算線性回歸估算模型中加權(quán)求和的過(guò)程,并計(jì)算代表中間過(guò)程的隱單元,然后再計(jì)算這些隱單元的加權(quán)求和并得到最終結(jié)果。本文中,MLP回歸方法優(yōu)化的參數(shù)為:隱層數(shù)量(hidden_layer_sizes)、迭代次數(shù)(max_iter)。
基于陜北、關(guān)中和陜南訓(xùn)練集及驗(yàn)證集,分別利用KNN(n_neighbors=5)、MLP(hidden_layer_sizes=100,max_iter=200)2種回歸方法及其默認(rèn)參數(shù)建立區(qū)域估算模型,模型在驗(yàn)證集上的指標(biāo)值如表4所示。
從表4可以看出,除關(guān)中及陜南的TRE指標(biāo)外,MLP模型各指標(biāo)均優(yōu)于KNN模型:MSE平均約低0.1、R2約高3%、CR約高4%。KNN、MLP回歸模型的總相對(duì)誤差TRE均在2%以內(nèi),但不同氣候區(qū)域的R2指標(biāo)性能差異較明顯,均呈現(xiàn)以下特點(diǎn):陜北>關(guān)中>陜南,級(jí)差平均約為4%。
表4 KNN、MLP模型在默認(rèn)參數(shù)時(shí)的估算指標(biāo)值
為確保KNN、MLP模型具有最優(yōu)泛化性能,利用S折交叉驗(yàn)證(S-fold cross validation)、管道(Pipe)和網(wǎng)格搜索技術(shù)(GridSearch),根據(jù)各模型R2指標(biāo)性能和時(shí)間復(fù)雜性選擇最優(yōu)模型參數(shù)[26,29]?;陉儽薄㈥P(guān)中、陜南訓(xùn)練集及驗(yàn)證集的KNN模型不同k值(k∈[1,100])的R2曲線、MLP模型不同隱層數(shù)量及迭代次數(shù)的R2熱圖如圖2所示。
從圖2可以看出,各回歸方法在默認(rèn)參數(shù)條件下均未達(dá)到R2最優(yōu)估算性能,但部分達(dá)到次優(yōu)。圖2a表明,KNN模型在不同區(qū)域的最優(yōu)參數(shù)(即k值)基本接近:n_neighbors=20,默認(rèn)值n_neighbors=5與其相差較大;圖2b表明,陜北MLP模型的最優(yōu)參數(shù)為:hidden_layer_sizes=10, max_iter=1 000,其在默認(rèn)參數(shù)時(shí)的R2值較低,且可以看出,陜北MLP模型對(duì)參數(shù)較為敏感;從圖2c、d看出,關(guān)中、陜南MLP模型的最優(yōu)參數(shù)均為:hidden_layer_sizes=(5,12) ,max_iter=200,且默認(rèn)參數(shù)為其次優(yōu)參數(shù)。
2.4.1 區(qū)域蒸發(fā)量估算
基于以上構(gòu)建的區(qū)域估算模型及最優(yōu)參數(shù),利用2015年陜北、關(guān)中和陜南各區(qū)域測(cè)試集分別檢驗(yàn)區(qū)域估算模型的應(yīng)用效果,估算值與觀測(cè)值的散點(diǎn)圖及其擬合曲線以及評(píng)價(jià)指標(biāo)值、估算值絕對(duì)誤差分布等如圖3所示。
從圖3a、b、c可以看出,陜北KNN模型在測(cè)試集上具有良好的泛化性能,且各指標(biāo)均優(yōu)于MLP模型;MLP模型泛化性能較差:MSE、TRE分別達(dá)到3.16、20.4%,而R2、CR分別僅為0.459、27.8%,估算值絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例僅為55.4%。從圖3d、e、f可以看出,關(guān)中MLP模型的MSE、R2和CR指標(biāo)均略優(yōu)于KNN模型,TRE指標(biāo)相對(duì)較劣,KNN、MLP模型估算值絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例分別為86.3%、89.8%。從圖3g、h、i可知,KNN、MLP模型在陜南的估算值指標(biāo)性能基本接近,其絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例分別為92.2%、94.4%。KNN、MLP模型在關(guān)中、陜南均具有良好的泛化性能。
圖2 回歸模型不同參數(shù)在驗(yàn)證集上的R2值: (a)KNN模型R2曲線,(b)陜北MLP模型R2熱圖,(c)關(guān)中MLP模型R2熱圖,(d)陜南MLP模型R2熱圖
圖3 2015年陜北、關(guān)中、陜南蒸發(fā)量估算值與觀測(cè)值散點(diǎn),評(píng)價(jià)指標(biāo)值與估算值絕對(duì)誤差
2.4.2 單站蒸發(fā)量估算
由于KNN模型在陜北、關(guān)中和陜南蒸發(fā)量估算過(guò)程中均表現(xiàn)出良好的泛化性能,因此分別利用KNN區(qū)域估算模型及其最優(yōu)參數(shù)(n_neighbors=20),對(duì)各區(qū)域的代表性站點(diǎn)即榆林、涇河和漢中的2015年蒸發(fā)量進(jìn)行估算。同時(shí),基于榆林、涇河和漢中2005—2014年觀測(cè)數(shù)據(jù),分別建立各站點(diǎn)的KNN單站估算模型及其最優(yōu)參數(shù)(榆林:n_neighbors=15,涇河、漢中:n_neighbors=25),對(duì)各站點(diǎn)2015年蒸發(fā)量進(jìn)行估算?;趨^(qū)域估算模型、單站估算模型的單站蒸發(fā)量估算值與觀測(cè)值的散點(diǎn)圖及其擬合曲線以及評(píng)價(jià)指標(biāo)值、估算值絕對(duì)誤差分布如圖4所示。
從圖4可以看出,基于單站估算模型的單站蒸發(fā)量估算指標(biāo)性能均優(yōu)于基于區(qū)域估算模型的單站蒸發(fā)量估算指標(biāo)性能:榆林CR偏高9.9%,TRE偏低5.6%,區(qū)域估算模型的TRE值達(dá)到-7.1%,區(qū)域、單站模型估算值絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例分別為:84.7%、83.8%;涇河MSE偏低0.21,CR偏高4.3%,TRE偏低10.5%,區(qū)域估算模型的TRE值達(dá)到-12.7%,區(qū)域、單站模型估算值絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例分別為:78.4%、79.6%;漢中MSE偏低0.11,CR偏高8.2%,TRE偏低0.8%,區(qū)域、單站模型的TRE值均相對(duì)較高,分別達(dá)11.1%、10.3%,區(qū)域、單站模型估算絕對(duì)誤差在[-1.0,1.0]區(qū)間的比例分別為:88.9%、94.2%。同時(shí)可以看出,榆林、涇河單站模型估算值絕對(duì)誤差分布在0.0 mm時(shí)對(duì)應(yīng)的實(shí)例數(shù)約為200,而漢中對(duì)應(yīng)的實(shí)例數(shù)約為100,這可能與各單站模型的魯棒性以及陜北、關(guān)中和陜南各區(qū)域天氣、氣候特征有關(guān)。
圖4 2015年榆林、涇河、漢中蒸發(fā)量估算值與觀測(cè)值散點(diǎn),評(píng)價(jià)指標(biāo)值與估算值絕對(duì)誤差
本文在建立陜北、關(guān)中和陜南區(qū)域數(shù)據(jù)集以及榆林、涇河和漢中單站數(shù)據(jù)集的基礎(chǔ)上,分析了氣溫、地溫和日照等氣象要素與蒸發(fā)皿蒸發(fā)的相關(guān)性,通過(guò)優(yōu)化模型參數(shù),分別建立了蒸發(fā)量區(qū)域估算模型、單站估算模型,得出如下結(jié)論:
(1)年尺度下,影響陜北、關(guān)中和陜南各區(qū)域以及各區(qū)域代表性站點(diǎn)榆林、涇河和漢中蒸發(fā)皿蒸發(fā)量變化的主要因子存在差異,且同一類別氣象要素中,平均量一般不是最大的影響因子;平均氣壓、最高氣壓和最低氣壓對(duì)陜北、關(guān)中和陜南各區(qū)域整體影響較小,但對(duì)各單站的影響較大。
(2)KNN、MLP估算模型在默認(rèn)參數(shù)條件下均未達(dá)到最優(yōu)R2估算性能,KNN模型在不同區(qū)域的最優(yōu)k值基本接近(n_neighbors =20),但默認(rèn)值(n_neighbors =5)與其差距較大,陜北MLP模型對(duì)參數(shù)選擇較為敏感,關(guān)中、陜南MLP模型的最優(yōu)參數(shù)相同,且默認(rèn)參數(shù)為其次優(yōu)參數(shù)。
(3)進(jìn)行區(qū)域蒸發(fā)量估算時(shí),KNN模型表現(xiàn)出良好的泛化估算性能,其MSE、TRE和CR指標(biāo)值平均分別為0.42、2.1%、57.0%;陜北MLP模型的泛化性能較差,MSE、TRE和CR指標(biāo)值分別為3.16、20.4%、27.8%;關(guān)中MLP模型的MSE、CR指標(biāo)略優(yōu)于KNN模型,TRE指標(biāo)則相比較劣;陜南KNN、MLP模型指標(biāo)性能基本接近。
(4)進(jìn)行單站蒸發(fā)量估算時(shí),基于k近鄰法的KNN單站估算模型性能優(yōu)于區(qū)域估算模型,MSE、CR指標(biāo)值平均為0.48、55.0%,榆林與涇河TRE指標(biāo)絕對(duì)值平均為1.6%,漢中TRE指標(biāo)值偏高,達(dá)到10.3%。
以上研究結(jié)論及其與文獻(xiàn)[17-19]的評(píng)價(jià)指標(biāo)簡(jiǎn)單對(duì)比表明,本文建立的蒸發(fā)皿蒸發(fā)量估算模型部分評(píng)價(jià)指標(biāo)表現(xiàn)良好,可以為陜西省不同氣候區(qū)域及單站、不同時(shí)間尺度的蒸發(fā)量估算以及日蒸發(fā)量數(shù)據(jù)質(zhì)量控制提供一種基于機(jī)器學(xué)習(xí)的方法。但是本文也存在一些問(wèn)題,如未對(duì)其他估算或預(yù)測(cè)模型如彭曼公式進(jìn)行本地化參數(shù)修正、驗(yàn)證以及與本文建立的估算模型進(jìn)行基于同一數(shù)據(jù)集的檢驗(yàn)與對(duì)比分析,也未對(duì)MLP模型應(yīng)用于陜北蒸發(fā)量估算時(shí)泛化性能較差、漢中單站蒸發(fā)量估算時(shí)TRE指標(biāo)值偏高的原因進(jìn)行分析。因此,下一步將對(duì)影響蒸發(fā)皿蒸發(fā)變化的主要?dú)庀笠蜃釉诓煌瑲夂騾^(qū)域及單站、不同時(shí)間尺度上的變化特征進(jìn)行研究,并對(duì)比不同模型在同一數(shù)據(jù)集上的檢驗(yàn)效果。