杜鑫鈺,陳軍鋒,薛 靜,鄭秀清,杜 琦,楊小鳳
(1.太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原030024;2.山西省水文水資源勘測(cè)局太谷均衡實(shí)驗(yàn)站,山西晉中030800)
土壤蒸發(fā)作為無(wú)效水分損耗,是農(nóng)田水分的主要消耗途徑,其變化過程直接影響干旱半干旱地區(qū)農(nóng)作物的生長(zhǎng)和土壤水資源的高效利用[1-4]。我國(guó)季節(jié)性凍土主要分布于干旱半干旱氣候區(qū)[5-7],該地區(qū)越冬期的土壤蒸發(fā)特征決定了春夏季播種前的土壤墑情,同時(shí)土壤凍結(jié)時(shí)水分相變及其與溫度的劇烈耦合作用加劇了土壤蒸發(fā)過程的復(fù)雜性[8]。因此,研究季節(jié)性凍融期土壤蒸發(fā)規(guī)律,準(zhǔn)確預(yù)估凍融期土壤蒸發(fā)量對(duì)于提高干旱半干旱氣候區(qū)的水資源利用效率具有重要意義。
目前,學(xué)者大多基于水熱耦合運(yùn)移數(shù)值模型[9,10]研究?jī)鋈谄诘耐寥勒舭l(fā)過程。Flerchinger[11]等根據(jù)SHAW 模型模擬研究了不同類型殘茬覆蓋物下的土壤蒸發(fā)及水熱運(yùn)移情況;李瑞平[12]等運(yùn)用SHAW模型探討了秋澆制度和土壤鹽漬化程度對(duì)凍融期土壤蒸發(fā)的影響;成向榮[13]等通過SHAW模型對(duì)黃土高原半干旱地區(qū)土壤蒸發(fā)進(jìn)行了預(yù)測(cè)研究;陳軍鋒[8]等基于SHAW模型研究了不同地下水位埋深和土壤質(zhì)地對(duì)凍融期土壤蒸發(fā)過程的影響。然而,這類數(shù)值模型需要大量精確地土壤和氣象資料驅(qū)動(dòng)模型,并且需要花費(fèi)大量時(shí)間對(duì)模型進(jìn)行調(diào)參[14]。為進(jìn)一步提高預(yù)測(cè)精度,簡(jiǎn)化模型所需輸入的參數(shù)和調(diào)參過程,神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等人工智能方法在農(nóng)田預(yù)測(cè)方面得到了普遍應(yīng)用。其中,BP 神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)應(yīng)用較為廣泛[15-21]。但是,BP 神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、易陷入局部極小點(diǎn)、對(duì)樣本依賴性大等問題,支持向量機(jī)算法對(duì)大規(guī)模訓(xùn)練樣本實(shí)施困難且對(duì)核參數(shù)和懲罰參數(shù)的選擇敏感[22]。
廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,GRNN)是基于非線性回歸理論的典型前饋式局部逼近神經(jīng)網(wǎng)絡(luò),具有計(jì)算速度快、全局最優(yōu)性等優(yōu)點(diǎn)[23]。此外,模型構(gòu)建過程中僅需調(diào)整光滑因子這一個(gè)參數(shù),能夠降低人為因素對(duì)模型預(yù)測(cè)性能的影響。粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種新型的全局進(jìn)化尋優(yōu)算法,通過PSO 算法對(duì)GRNN 網(wǎng)絡(luò)參數(shù)進(jìn)行尋優(yōu),不僅使GRNN 的優(yōu)勢(shì)得到保留,同時(shí)可解決GRNN 拓?fù)浣Y(jié)構(gòu)的不確定性問題,提高了模型的穩(wěn)定性和預(yù)測(cè)精度[24]。因此,本文通過主成分分析(Principal Component Analysis,PCA)對(duì)數(shù)據(jù)進(jìn)行降維處理并提取影響凍融土壤蒸發(fā)的主要因子,使其作為GRNN 網(wǎng)絡(luò)模型的輸入變量,將PSO 算法引入GRNN 模型優(yōu)化模型的光滑因子,依此建立PCA-PSO-GRNN 的凍融期土壤蒸發(fā)預(yù)報(bào)模型,并采用實(shí)測(cè)凍融土壤蒸發(fā)量驗(yàn)證模型的模擬精度和可靠性,以探索凍融期土壤蒸發(fā)預(yù)報(bào)模型的適用性。
試驗(yàn)區(qū)位于山西省晉中盆地汾河沖洪積平原區(qū),屬大陸性半干旱季風(fēng)氣候區(qū)。試驗(yàn)區(qū)多年平均氣溫9.9 ℃,年降水量約415.2 mm,年水面蒸發(fā)量1 642.4 mm(小型蒸發(fā)器:D20),多年平均相對(duì)濕度74%,歷史最大凍深92 cm(1960年)[15]。試驗(yàn)區(qū)耕層深度約20 cm,土壤類型為壤土。
凍融土壤蒸發(fā)試驗(yàn)于2017年11月至2018年3月在試驗(yàn)站進(jìn)行。土壤蒸發(fā)量監(jiān)測(cè)采用自制微型蒸發(fā)器稱重法,地表土壤含水率監(jiān)測(cè)采用烘干法,地表土壤溫度監(jiān)測(cè)采用預(yù)埋熱敏電阻法,試驗(yàn)過程中土壤蒸發(fā)量、含水率和溫度同步監(jiān)測(cè),且監(jiān)測(cè)頻率為每7 d 一次,監(jiān)測(cè)時(shí)間均為8∶00-9∶00,整個(gè)凍融期共監(jiān)測(cè)17 次[15]。由于17 組樣本數(shù)據(jù)偏少,因此采用線性內(nèi)插法生成130 組日數(shù)據(jù)以滿足建模需求并提高模型精度。試驗(yàn)期間的日氣象數(shù)據(jù)由試驗(yàn)站地面自動(dòng)氣象站監(jiān)測(cè),監(jiān)測(cè)項(xiàng)目包括氣溫、氣壓、日照時(shí)數(shù)、風(fēng)速、凍深、水面蒸發(fā)、降水和相對(duì)濕度等。
季節(jié)性凍融作用使土壤水分發(fā)生劇烈相變,水熱耦合作用強(qiáng)烈,導(dǎo)致影響凍融土壤蒸發(fā)的因素復(fù)雜多樣。通過分析,本文選取氣壓(x1)、風(fēng)速(x2)、日平均氣溫(x3)、地表土壤溫度(x4)、地表土壤含水率(x5)、相對(duì)濕度(x6)、水面蒸發(fā)量(x7)、降水量(x8)和太陽(yáng)輻射(x9)9 個(gè)影響因素,對(duì)凍融土壤蒸發(fā)進(jìn)行影響分析與建模預(yù)測(cè)分析。
1.3.1 PCA原理
主成分分析法(PCA)利用數(shù)據(jù)降維和變量篩選的思想,將具有一定相關(guān)性的多個(gè)原始相互重疊的變量通過線性組合的方式組成相互獨(dú)立的最小數(shù)據(jù)集,并從中選取少數(shù)綜合變量,即主成分以盡可能多的反映原始被評(píng)價(jià)變量的信息[25,26]。具體步驟如下。
(1)樣本數(shù)據(jù)標(biāo)準(zhǔn)化,以消除量綱影響。采用“minmax”法對(duì)上述9個(gè)因子進(jìn)行歸一化,公式為:
(2)計(jì)算相關(guān)系數(shù)矩陣,求出其非零特征根和特征向量。
(3)根據(jù)累積方差貢獻(xiàn)率選擇主成分個(gè)數(shù),并求出主成分載荷矩陣。
(4)計(jì)算主成分變量的取值。
1.3.2 PSO算法原理
PSO 算法首先初始化n 個(gè)粒子,每一個(gè)粒子都有可能成為所優(yōu)化問題的最優(yōu)解,比如本文中粒子代表GRNN 模型的一個(gè)光滑因子,隨后利用迭代循環(huán)找到問題的最優(yōu)解[27]。在迭代循環(huán)過程中,粒子首先要尋找到自身最優(yōu)解即個(gè)體極值Pbest,然后通過比較每個(gè)粒子的Pbest,尋找當(dāng)前整個(gè)種群的最優(yōu)解即群體極值Gbest,粒子通過跟蹤Pbest 和Gbest 利用下式(2)和(3)更新其速度V 和位置X(假設(shè)有n個(gè)粒子,D維空間),當(dāng)全部迭代完成時(shí),最終的Gbest 即算法的最優(yōu)解。
式中:d = 1,2,…,D;i = 1,2,…,n;k 為當(dāng)前迭代次數(shù);ω 為慣性權(quán)重;Vid為粒子的速度;Xid為粒子的位置;c1、c2為加速度因子;r1、r2為[0,1]區(qū)間的隨機(jī)數(shù);Pid、Pgd分別為第i個(gè)粒子的個(gè)體極值位置和群體極值位置。
1.3.3 GRNN理論與網(wǎng)絡(luò)結(jié)構(gòu)
GRNN 以非線性回歸分析為理論基礎(chǔ)。設(shè)隨機(jī)變量x 和y 的觀測(cè)值分別為X 和Y,其聯(lián)合概率密度函數(shù)為f (x,y),則Y 的預(yù)測(cè)輸出為:
假設(shè)f (x,y)服從正態(tài)分布,則有:
式中:Xi、Yi為x 和y 的樣本觀測(cè)值;X 為模型輸入變量;n為樣本數(shù)量;p 為隨機(jī)變量x 的維數(shù);σ 為模型的光滑因子。將f^(X,y)代替f (x,y)代入式(4)得下式:
GRNN網(wǎng)絡(luò)結(jié)構(gòu)由以下4部分組成:
(1)輸入層。該層由源節(jié)點(diǎn)組成,其神經(jīng)元個(gè)數(shù)等于輸入變量xi的維數(shù),輸入變量經(jīng)輸入層直接傳遞給模式層。本文將PCA法獲得的7個(gè)影響因子作為GRNN模型輸入變量,輸入層神經(jīng)元個(gè)數(shù)為7。
(2)模式層。該層神經(jīng)元個(gè)數(shù)對(duì)應(yīng)訓(xùn)練樣本的數(shù)量n,每一個(gè)神經(jīng)元對(duì)應(yīng)不同的樣本,傳遞函數(shù)為:
(3)求和層。該層有2種求和方式,一種是計(jì)算算數(shù)求和SD;另一種是計(jì)算加權(quán)求和SNj,傳遞函數(shù)分別為:
式中:Pi為模式層第i 個(gè)神經(jīng)元的傳遞函數(shù);yij為模式層第i個(gè)神經(jīng)元與求和層第j 個(gè)分子求和神經(jīng)元連接權(quán)值。
(4)輸出層。該層神經(jīng)元個(gè)數(shù)與輸出變量yi的維數(shù)對(duì)應(yīng),本文取為1。將求和層的2種求和相除,得輸出結(jié)果:
GRNN模型性能的優(yōu)劣取決于光滑因子這一參數(shù),因此利用PSO 算法對(duì)GRNN 模型參數(shù)進(jìn)行尋優(yōu)。基于PCA-PSOGRNN模型對(duì)凍融土壤蒸發(fā)預(yù)報(bào)的建模步驟如下:
(1)數(shù)據(jù)集分割與歸一化處理。將前述PCA 法篩選出的7個(gè)主要因子作為GRNN 模型的輸入變量(xi),則凍融土壤蒸發(fā)量為輸出變量(yi)。按比例(4∶1)將總數(shù)據(jù)集(130 組)隨機(jī)劃分為104 組訓(xùn)練樣本和26 組測(cè)試樣本,同時(shí)利用式(1)對(duì)數(shù)據(jù)進(jìn)行歸一化。
(2)種群初始化。設(shè)置PSO 算法的基本參數(shù),同時(shí)生成粒子初始速度和位置。
(3)構(gòu)建適應(yīng)度函數(shù)。以測(cè)試樣本的輸出值(預(yù)測(cè)值)和實(shí)際值的均方差為適應(yīng)度函數(shù)計(jì)算各粒子的適應(yīng)度值。
(4)尋找個(gè)體極值和群體極值。通過比較第i個(gè)粒子所經(jīng)過位置的所有適應(yīng)度值,最小適應(yīng)度值對(duì)應(yīng)的位置即個(gè)體極值Pbest,同理比較所有粒子的自身最優(yōu)位置的適應(yīng)度值,最小適應(yīng)度值對(duì)應(yīng)的位置即群體極值Gbest。
(5) 更新粒子的速度與位置。 更新公式見式(2)和(3)。
(6)迭代完成。取迭代過程中產(chǎn)生的最優(yōu)Gbest 為光滑因子來構(gòu)建GRNN模型。
(7)模型測(cè)試。利用建立的PCA-PSO-GRNN 模型對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)。
PCA-PSO-GRNN 模型流程見圖1。
為驗(yàn)證模型的預(yù)測(cè)精度,選取均方根誤差(RMSE)、決定系數(shù)(R2)、均方相對(duì)誤差(MSRE) 和平均絕對(duì)誤差(MAE)4個(gè)指標(biāo)評(píng)價(jià)模型預(yù)測(cè)效果,計(jì)算公式如下:
凍融土壤蒸發(fā)受大氣蒸發(fā)能力和土壤輸水能力的共同作用。大氣蒸發(fā)能力主要包括氣溫、太陽(yáng)輻射、降水等氣象因素,土壤輸水能力則包括土壤質(zhì)地和地表覆蓋等。其中,大氣蒸發(fā)能力影響土壤蒸發(fā)過程的能量供給,土壤輸水能力則決定土壤剖面水分向上遷移的條件[14]。
利用SPSS 25.0 對(duì)歸一化后的樣本數(shù)據(jù)進(jìn)行主成分篩選和分析,各主成分的特征根和貢獻(xiàn)率如表1 所示。由表1 可知,前3 個(gè)主成分(F1、F2、F3)特征值均大于1,且累計(jì)貢獻(xiàn)率高達(dá)83.00%,因此選取F1、F2、F3 主成分代替9 個(gè)原始變量。各影響因素與所選主成分之間的關(guān)系見主成分得分系數(shù)矩陣(見表2)。由表2 可知,F(xiàn)1 主成分中x3(0.47)、x9(0.47)、x7(0.45)、x4(0.41)和x1(-0.38)的系數(shù)相對(duì)較高;F2 主成分中x6(0.60)的系數(shù)最大;F3 主成分中x8(0.67)的系數(shù)最高。因此,根據(jù)表2 分析可以得出,影響凍融期土壤蒸發(fā)的主要因子依次為日平均氣溫(x3)、太陽(yáng)輻射(x9)、水面蒸發(fā)量(x7)、地表土壤溫度(x4)、氣壓(x1)、相對(duì)濕度(x6)和降水量(x8)。
本文以2017-2018年凍融期連續(xù)監(jiān)測(cè)的130 組凍融環(huán)境要素和大田土壤蒸發(fā)量作為整體樣本,并隨機(jī)選取104組作為訓(xùn)練樣本訓(xùn)練PCA-PSO-GRNN 模型,剩余26組作為測(cè)試樣本來驗(yàn)證模型。訓(xùn)練集與測(cè)試集的誤差分析見表3。
表1 各主成分特征值及貢獻(xiàn)率Tab.1 Eigenvalue and variance contribution rate of each principal component
表2 主成分得分系數(shù)矩陣Tab.2 The score coefficient matrix of principal component
表3 PCA-PSO-GRNN 模型預(yù)測(cè)誤差分析表Tab.3 The prediction error analysis of PCA-PSO-GRNN model
基于PCA-PSO-GRNN 模型的凍融期土壤蒸發(fā)模擬結(jié)果見圖2,可見,訓(xùn)練樣本預(yù)測(cè)值與實(shí)際值的模擬結(jié)果吻合性較好,見圖2(a)。為了檢驗(yàn)該模型的模擬精度和模型的泛化性能,利用測(cè)試樣本對(duì)該模型進(jìn)行驗(yàn)證,測(cè)試樣本的預(yù)測(cè)值和實(shí)際值基本一致,見圖2(b)。預(yù)報(bào)模型的評(píng)價(jià)指標(biāo)RMSE、R2、MSRE 和MAE 見表4,可以看出,訓(xùn)練樣本預(yù)測(cè)值和實(shí)際值的RMSE、R2、MSRE 和MAE 分別為0.013 1 mm/d、0.981 7、0.004 1和0.011 0 mm/d,說明模型訓(xùn)練精度較高。測(cè)試樣本預(yù)測(cè)值和實(shí)際值的RMSE 為0.011 4 mm/d,較訓(xùn)練樣本降低了12.98%,R2為0.992 1,較訓(xùn)練樣本有所提高。此外,測(cè)試樣本預(yù)測(cè)值和實(shí)際值的MSRE 和MAE 分別為0.002 9 和0.007 0 mm/d,均較訓(xùn)練樣本降低,說明模型模擬效果較優(yōu),精度較高。
為了進(jìn)一步驗(yàn)證PCA-PSO-GRNN 模型的泛化性能和優(yōu)越性,選取BP 神經(jīng)網(wǎng)絡(luò)、標(biāo)準(zhǔn)GRNN 網(wǎng)絡(luò)(光滑因子取為1.0)與PCA-PSO-GRNN 模型的模擬結(jié)果進(jìn)行對(duì)比。將PCA 提取的7 個(gè)主要因子作為各網(wǎng)絡(luò)的輸入變量分別建立BP 模型和標(biāo)準(zhǔn)GRNN模型,并對(duì)凍融土壤蒸發(fā)分別進(jìn)行預(yù)測(cè),模型預(yù)測(cè)結(jié)果分析見表5??梢?,PCA-PSO-GRNN 模型的模擬效果顯著優(yōu)于其他2 種模型,決定系數(shù)R2分別較BP 模型和標(biāo)準(zhǔn)GRNN 模型高6.7%和8.7%,因此,采用PCA 降維處理且利用PSO 優(yōu)化的GRNN 模型具有更好地泛化性能和判別能力,可應(yīng)用于凍融期大田土壤蒸發(fā)的預(yù)報(bào)。
表4 凍融土壤蒸發(fā)模型性能評(píng)價(jià)指標(biāo)Tab.4 Performance evaluation index of freeze-thaw soil evaporation model
表5 模型預(yù)測(cè)結(jié)果對(duì)比Tab.5 Comparison of model prediction results
(1)采用主成分分析法對(duì)影響凍融土壤蒸發(fā)的氣象因子數(shù)據(jù)進(jìn)行降維處理,選出影響土壤蒸發(fā)的7個(gè)主要因子,即日平均氣溫、太陽(yáng)輻射、水面蒸發(fā)量、地表土壤溫度、氣壓、相對(duì)濕度和降水量。利用粒子群算法對(duì)廣義回歸神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,降低參數(shù)選取的隨機(jī)性和人為因素的影響。
(2)PCA-PSO-GRNN 模型訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)值與實(shí)際值擬合效果較優(yōu),模型模擬精度較高,可用于凍融期土壤蒸發(fā)的預(yù)報(bào)。訓(xùn)練樣本的RMSE、R2、MSRE 和MAE 分別為0.013 1 mm/d、0.981 7、0.004 1 和0.011 0 mm/d,測(cè)試樣本的RMSE、R2、MSRE 和MAE 分別為0.011 4 mm/d、0.992 1、0.002 9和0.007 0 mm/d。
(3)PCA-PSO-GRNN 模型預(yù)測(cè)精度和泛化性能顯著優(yōu)于BP 模型和標(biāo)準(zhǔn)GRNN 模型,可為凍融期土壤蒸發(fā)的預(yù)報(bào)提供新的思路。