王 澤
(臨汾市水文水資源勘測(cè)分局,山西 臨汾 041000)
中國(guó)國(guó)土面積963萬(wàn)km2,現(xiàn)有2 474個(gè)國(guó)家級(jí)地面站,國(guó)家級(jí)氣象站覆蓋率較低,且現(xiàn)有氣象站數(shù)據(jù)存在蒸發(fā)量缺測(cè)現(xiàn)象,正確認(rèn)識(shí)水面蒸發(fā)量與氣象因子之間的關(guān)系,建立適用于中國(guó)地區(qū)的區(qū)域性水面蒸發(fā)計(jì)算模型,對(duì)水資源利用等都具有十分重要的現(xiàn)實(shí)意義[1-3]。目前也有學(xué)者結(jié)合BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)等建立了蒸發(fā)量預(yù)測(cè)模型,但對(duì)不同氣象因子組合與蒸發(fā)量預(yù)測(cè)結(jié)果的影響極為缺乏[4-5]。
以山西省晉城市陽(yáng)城氣象站2015—2016年日氣象數(shù)據(jù)為基礎(chǔ),利用灰色關(guān)聯(lián)理論,計(jì)算各影響因子對(duì)水面蒸發(fā)量的灰色關(guān)聯(lián)度,選擇關(guān)聯(lián)度較高的影響因素進(jìn)行組合,作為模型輸入變量組,建立了不同氣象因子組合下的蒸發(fā)量的BP預(yù)測(cè)模型,并以該站2017年日氣象數(shù)據(jù)對(duì)模型模擬結(jié)果進(jìn)行驗(yàn)證,分析模型的合理性。
選擇晉城市陽(yáng)城站(站碼53 975)基礎(chǔ)氣象數(shù)據(jù),數(shù)據(jù)來(lái)源中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng),包括2016—2017年陽(yáng)城站的逐日平均氣溫(TEM)、逐日平均風(fēng)速(WIN)、逐日日照時(shí)數(shù)(SSD)、逐日平均相對(duì)濕度(RHU)、逐日20—20時(shí)累計(jì)降水量(PRE)及逐日蒸發(fā)量(EVP)數(shù)據(jù)。
灰色系統(tǒng)理論是學(xué)者鄧聚龍于1982年創(chuàng)立的預(yù)測(cè)理論,是一種解決貧信息、少數(shù)據(jù)問(wèn)題的常用方法。原理是以樣本數(shù)據(jù)為依據(jù),利用灰色關(guān)聯(lián)理論,求出灰色關(guān)聯(lián)度,以此描述因素間關(guān)系的強(qiáng)弱和次序。利用灰色關(guān)聯(lián)理論,確定各氣象因子對(duì)蒸發(fā)量作用的大小,合理確定蒸發(fā)量預(yù)測(cè)模型的輸入因子。
利用Matlab軟件設(shè)計(jì)模型的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。所選擇的訓(xùn)練函數(shù)、輸入層激活函數(shù)、隱含層激活函數(shù)與輸出層激活函數(shù)分別為trainlm函數(shù)、sigmoid函數(shù)、tansig正切函數(shù)與purelin線性函數(shù)。設(shè)定的建模參數(shù)如表1所示。
表1 模型設(shè)定的訓(xùn)練參數(shù)
計(jì)算時(shí),依據(jù)公式(1)限定的最小初始隱含層節(jié)點(diǎn)數(shù),構(gòu)建網(wǎng)絡(luò)模型。
式中:z——中間隱含層神經(jīng)元個(gè)數(shù);
f——輸入層神經(jīng)元個(gè)數(shù);
k——輸出層神經(jīng)元個(gè)數(shù);
p——介于0~10的任意常數(shù)。
蒸發(fā)量BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型拓?fù)浣Y(jié)構(gòu),如公式(2)所示:
式中:net——蒸發(fā)量BP預(yù)報(bào)模型結(jié)構(gòu);
newff——Matlab工具箱中的BP神經(jīng)網(wǎng)絡(luò)函數(shù);
minmax()——輸入變量的取值矩陣;
traininput——輸入變量;
[10,2]——10為中間隱含層個(gè)數(shù),2為輸出隱含層的個(gè)數(shù);
tansig——輸入層到隱含層的傳遞函數(shù);
purelin——隱含層到輸出層的傳遞函數(shù);
trainlm——灰色BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型的學(xué)習(xí)函數(shù)。
通過(guò)比較訓(xùn)練結(jié)果,決定系數(shù)R2對(duì)模型的預(yù)測(cè)效果,R2越大預(yù)測(cè)結(jié)果越好。評(píng)判系數(shù)見(jiàn)公式(3):
式中:N——樣本數(shù)量;
θi——實(shí)測(cè)值;
利用灰色關(guān)聯(lián)理論計(jì)算得到影響蒸發(fā)量的5個(gè)參數(shù)對(duì)蒸發(fā)量的關(guān)聯(lián)度,如表1所示。一般關(guān)聯(lián)度大于等于0.8時(shí),子序列與母序列關(guān)聯(lián)度很好[6]。本次研究選擇的參數(shù)的關(guān)聯(lián)度均在0.80以上,因此各氣象因子的選取是合理的。
表1 各氣象因子與蒸發(fā)因子關(guān)聯(lián)度
所選輸入因子,有逐日平均氣溫(TEM)、逐日平均風(fēng)速(WIN)、逐日日照時(shí)數(shù)(SSD)、逐日平均相對(duì)濕度(RHU)、逐日20—20時(shí)累計(jì)降水量(PRE)及逐日蒸發(fā)量(EVP)。預(yù)報(bào)模型精度的提高,不僅依賴于數(shù)據(jù)挖掘技術(shù)的應(yīng)用,還取決于輸入變量的選擇。為研究不同因子組合下的模型預(yù)測(cè)效果,分別構(gòu)建不同數(shù)量因子組合下的預(yù)測(cè)模型,共計(jì)26組,對(duì)模型輸出結(jié)果進(jìn)行檢驗(yàn),從而尋求最佳的模型輸入因子組合。以2015—2016年日系列氣象因子組合作為輸入變量,以2015—2016年日蒸發(fā)量作為輸出變量,構(gòu)成模型訓(xùn)練樣本,構(gòu)建BP模型。取訓(xùn)練效果最佳的BP神經(jīng)網(wǎng)絡(luò)模型,以2017年相應(yīng)的氣象因子組合,作為所建預(yù)測(cè)模型的測(cè)試樣本,得到模型的擬合結(jié)果。通過(guò)對(duì)26種因子組合樣本進(jìn)行訓(xùn)練,建立了26個(gè)蒸發(fā)量預(yù)測(cè)模型,各因子組合下的訓(xùn)練效果,如表2所示。
表2 各因子組合下的模擬效果
由表2可知,各因子組合下的模型R2介于0.570與0.929之間,訓(xùn)練差距較大,表明因子組合是影響蒸發(fā)量預(yù)測(cè)精度的關(guān)鍵因素。建立的BP蒸發(fā)量訓(xùn)練模型精度最高(R2最大取為0.929)時(shí),對(duì)應(yīng)的因子組合為T(mén)EM+WIN+SSD+RHU+PRE;其次R2為0.920時(shí),對(duì)應(yīng)的因子組合為T(mén)EM+WIN+SSD+RHU;訓(xùn)練模型精度最低(R2最小為0.570)時(shí),對(duì)應(yīng)的因子組合為RHU+PRE,最佳與最差訓(xùn)練結(jié)果對(duì)比見(jiàn)圖1。
這表明,對(duì)晉城地區(qū)的蒸發(fā)量預(yù)測(cè),取TEM+WIN+SSD+RHU+PRE組合,進(jìn)行BP模型構(gòu)建與訓(xùn)練,模型模擬結(jié)果最為可靠,更為接近實(shí)際,TEM+WIN+SSD+SSD+RHU組合次之。取RHU+PRE組合其結(jié)果較差,不能為實(shí)際提供參考。
圖1 訓(xùn)練結(jié)果對(duì)比圖
本文取TEM+WIN+SSD+RHU+PRE組合作為輸入因子訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)晉城市2017年蒸發(fā)量進(jìn)行預(yù)測(cè),結(jié)果如圖2所示。
圖2 預(yù)測(cè)實(shí)測(cè)結(jié)果對(duì)比
得到預(yù)測(cè)值與實(shí)測(cè)值的R2為0.629,顯著性P為0.000,達(dá)到了顯著相關(guān)水平,以相對(duì)誤差在20%以內(nèi)作為判定標(biāo)準(zhǔn),該預(yù)測(cè)模型對(duì)蒸發(fā)練的預(yù)測(cè)共有231d,合格率為63.11%,可見(jiàn)該模型預(yù)測(cè)結(jié)果與實(shí)際情況較為一致。
基于灰色關(guān)聯(lián)與BP神經(jīng)網(wǎng)絡(luò),建立了26組由不同因子組合的晉城地區(qū)蒸發(fā)量預(yù)測(cè)模型,對(duì)模型精度進(jìn)行對(duì)比分析后,得出氣象因子組合對(duì)模型訓(xùn)練效果具有重大影響。在晉城地區(qū)模型模擬精度最高時(shí),對(duì)應(yīng)的因子組合為T(mén)EM+WIN+SSD+RHU+PRE,此時(shí)訓(xùn)練模型R2值0.929。
本研究?jī)?nèi)容可為蒸發(fā)量預(yù)測(cè)提供新的思路:實(shí)踐中當(dāng)資料無(wú)法滿足最佳因子組合時(shí),可根據(jù)本研究所得的因子組合精度表,選取所能得到的現(xiàn)有因子資料,進(jìn)行預(yù)測(cè)精度最高的因子組合,對(duì)該地區(qū)的蒸發(fā)量進(jìn)行預(yù)測(cè)。一方面,有助于提高資料充足地區(qū)的蒸發(fā)量預(yù)測(cè)精度;另一方面,可以為資料缺乏地區(qū)的蒸發(fā)量預(yù)測(cè)提供參考。建議對(duì)不同地區(qū)的季節(jié)性蒸發(fā)量預(yù)測(cè)模型進(jìn)行研究,尋找區(qū)域性最佳預(yù)測(cè)因子組合,為蒸發(fā)量預(yù)測(cè)提供更多依據(jù)。