邢馨予,趙雪花
(太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原030024)
目前,國(guó)內(nèi)外學(xué)者們正致力于探索研究徑流預(yù)測(cè)的各種模型與方法,以期望可以進(jìn)一步提高徑流預(yù)測(cè)的精度。徑流序列具有非平穩(wěn)性、非線性等特征[1],而目前對(duì)徑流序列的處理基本是在假設(shè)該序列是平穩(wěn)的情況下進(jìn)行的,這會(huì)使預(yù)測(cè)精度大大降低,因此對(duì)徑流序列的平穩(wěn)化處理顯得非常重要。
小波分解法、經(jīng)驗(yàn)?zāi)B(tài)分解法(Empirical Mode Decomposi?tion,EMD)和互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解法(Complete Ensemble Empirical Mode Decomposition,CEEMD)等分解方法已被廣泛應(yīng)用于徑流數(shù)據(jù)的平穩(wěn)化處理,如席東潔運(yùn)用經(jīng)驗(yàn)?zāi)B(tài)分解法(EMD)和Elman神經(jīng)網(wǎng)絡(luò)的組合模型對(duì)汾河上游月徑流序列進(jìn)行分解預(yù)測(cè)[2],取得了較高的預(yù)測(cè)精度?;趯?duì)EMD 法的改進(jìn),Smith 提出新的分解信號(hào)方法—局部均值分解法(Local Mean Decomposition,LMD)[3]。與EMD 法相比,LMD 法很好地解決了濾波時(shí)帶較寬與選擇中心頻率較難以及模態(tài)重疊、端點(diǎn)效應(yīng)等問(wèn)題[4]。LMD 法在故障診斷預(yù)測(cè)和電力負(fù)荷預(yù)測(cè)領(lǐng)域得到了廣泛應(yīng)用,但該方法在徑流預(yù)測(cè)領(lǐng)域還未被應(yīng)用。
徑流序列經(jīng)過(guò)平穩(wěn)化處理后就可以對(duì)其進(jìn)行擬合預(yù)測(cè)。近年來(lái)隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,涌現(xiàn)出了新的預(yù)測(cè)方法—人工智能法。主要有人工神經(jīng)網(wǎng)絡(luò),灰色模型,小波分析法,深度學(xué)習(xí)等方法。其中人工神經(jīng)網(wǎng)絡(luò)在各領(lǐng)域中得到了廣泛應(yīng)用。李天成將徑向基神經(jīng)網(wǎng)絡(luò)(RBF)成功應(yīng)用到流域的月徑流預(yù)測(cè)中[5],但該神經(jīng)網(wǎng)絡(luò)適用范圍小,樣本數(shù)量增大后網(wǎng)絡(luò)結(jié)構(gòu)變復(fù)雜,會(huì)增大預(yù)測(cè)誤差。李代華構(gòu)建了基于3 種重尾分布改進(jìn)的布谷鳥搜索算法優(yōu)化的支持向量機(jī)(SVM)月徑流預(yù)測(cè)模型[6],但SVM 算法的核函數(shù)選取具有一定的主觀性,對(duì)預(yù)測(cè)精度存在一定的影響。張夢(mèng)利用粒子群算法優(yōu)化的回聲狀態(tài)網(wǎng)絡(luò)(ESN)模型成功完成對(duì)城市內(nèi)澇點(diǎn)降雨積水的預(yù)測(cè)[7],但ESN 神經(jīng)網(wǎng)絡(luò)的神經(jīng)元連接狀態(tài)是隨機(jī)的,提高了誤差風(fēng)險(xiǎn)。基于對(duì)ESN 神經(jīng)網(wǎng)絡(luò)的改進(jìn),Ali Rodan 提出了確定性循環(huán)跳躍網(wǎng)絡(luò)(Cycle Reservoir with Regular Jumps,CRJ)[8]。國(guó)內(nèi)外學(xué)者對(duì)CRJ神經(jīng)網(wǎng)絡(luò)進(jìn)行研究并獲得了滿意的結(jié)果。如Yuqin 利用CRJ 對(duì)大氣中的日臭氧濃度進(jìn)行預(yù)測(cè),證明了CRJ 神經(jīng)網(wǎng)絡(luò)具備較高的預(yù)測(cè)能力[9]。Yuenyong利用CRJ對(duì)激光器和玻璃的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),對(duì)比了不同參數(shù)對(duì)CRJ 神經(jīng)網(wǎng)絡(luò)的影響[10]。秋興國(guó)運(yùn)用確定性分層跳躍循環(huán)網(wǎng)絡(luò)(CRHJ)、CRJ神經(jīng)網(wǎng)絡(luò)以及ESN 神經(jīng)網(wǎng)絡(luò)等三種不同方法對(duì)煤礦礦井的突水水源判別做出了有效驗(yàn)證,證實(shí)3 種模型在判別中具有較高準(zhǔn)確性[11]。目前,CRJ神經(jīng)網(wǎng)絡(luò)在水文預(yù)報(bào)領(lǐng)域應(yīng)用較少,因此本文將CRJ神經(jīng)網(wǎng)絡(luò)應(yīng)用到徑流預(yù)測(cè)領(lǐng)域是一種新的嘗試。
徑流序列的非平穩(wěn)性和非線性的特性決定了用單一預(yù)測(cè)模型預(yù)測(cè)可能存在一定的局限性,無(wú)法更好地提高徑流預(yù)測(cè)精度[12]。因此,近年來(lái)越來(lái)越多的組合預(yù)測(cè)模型被普遍應(yīng)用到徑流預(yù)測(cè)領(lǐng)域。本文基于量子粒子群優(yōu)化算法(QPSO)構(gòu)建LMD-QPSO-CRJ 模型,對(duì)汾河上游的月徑流序列進(jìn)行預(yù)測(cè),并與單一QPSO-CRJ 模型以及CEEMD-QPSO-CRJ 模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,以驗(yàn)證該模型對(duì)于預(yù)測(cè)非平穩(wěn)、非線性的徑流序列的可靠性與有效性。
LMD 法可以自適應(yīng)地將信號(hào)分解成多個(gè)乘積函數(shù)(Prod?uct Function,PF)之和,包絡(luò)信號(hào)和純調(diào)頻信號(hào)相乘構(gòu)成1 個(gè)PF分量。其中包絡(luò)信號(hào)由PF 分量的瞬時(shí)幅值來(lái)表示。每一個(gè)PF分量的瞬時(shí)頻率由純調(diào)頻信號(hào)而得。LMD 法的計(jì)算步驟見(jiàn)式(1)~(7)[13]:
(1)首先確定原始信號(hào)x(t)的所有極值點(diǎn)ni(i= 1,2,3,…),計(jì)算相鄰兩個(gè)極值點(diǎn)的平均值,即:
經(jīng)處理后得到均值函數(shù)m11(t)。
(2)計(jì)算包絡(luò)估計(jì)值,即:
連接所有包絡(luò)估計(jì)值,經(jīng)處理后得到包絡(luò)估計(jì)函數(shù)a11(t)。
(3)從原始信號(hào)x(t)中剔除出均值函數(shù)m11(t),即:
(4)將h11(t)振幅解調(diào)得:
如果s11(t)的包絡(luò)估計(jì)函數(shù)滿足a12(t) = 1 的要求,則s11(t)為純調(diào)頻信號(hào)。如果不滿足要求,則被視為原始信號(hào)重新計(jì)算,直至s1n(t)為純調(diào)頻信號(hào),結(jié)束迭代。
(5)將所有包絡(luò)估計(jì)函數(shù)相乘,獲得包絡(luò)信號(hào)。
(6)將a1(t)和s1n(t)相乘,得到原始信號(hào)的第1個(gè)PF分量。
(7)從原始信號(hào)中分離出第1 個(gè)PF 分量,作為一個(gè)新信號(hào)u1(t),并對(duì)以上步驟循環(huán)k次,當(dāng)uk(t)為單調(diào)函數(shù)或常數(shù)時(shí),終止迭代。原始信號(hào)x(t)被分解為由k個(gè)PF 分量和1個(gè)殘余分量uk(t)組成的和,即:
CRJ 神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)為輸入層、輸出層和隱藏層。其輸入層和隱藏層采用確定的權(quán)值矩陣,而輸出層的權(quán)值矩陣通過(guò)訓(xùn)練學(xué)習(xí)得到。隱藏層具有儲(chǔ)藏記憶的作用,可對(duì)上一時(shí)間狀態(tài)的有效信息進(jìn)行保存[14]。與ESN 神經(jīng)網(wǎng)絡(luò)相比,兩者隱藏層的組成結(jié)構(gòu)不同。ESN 神經(jīng)網(wǎng)絡(luò)為隨機(jī)稀疏連接結(jié)構(gòu),容易使隱藏層中神經(jīng)元的連接變復(fù)雜,增大模型訓(xùn)練的難度[15]。而CRJ 神經(jīng)網(wǎng)絡(luò)由權(quán)重固定的單向循環(huán)結(jié)構(gòu)和雙向連接結(jié)構(gòu)組成,提高了模型的性能,避免隱藏層中隨機(jī)生成的權(quán)值矩陣對(duì)神經(jīng)網(wǎng)絡(luò)造成的不確定性影響[16]。CRJ 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見(jiàn)圖1所示。
圖1 CRJ神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 CRJ neural network structure
量子粒子群優(yōu)化算法(QPSO)是將量子進(jìn)化算法與粒子群優(yōu)化算法(PSO)相結(jié)合的一種新型算法。該算法具有可控參數(shù)少,操作簡(jiǎn)單,全局搜索能力強(qiáng)的優(yōu)點(diǎn),被廣泛運(yùn)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)[17]。QPSO的粒子進(jìn)化方程見(jiàn)式(8)~(10):
最優(yōu)位置處粒子群的數(shù)量大?。?/p>
粒子位置的更新公式:
式中:M為粒子群的數(shù)量大??;pbest_i為當(dāng)前迭代中的第i個(gè)pbest;Pi為第i個(gè)粒子位置的更新;gbest為當(dāng)前全局最優(yōu)粒子;xi為第i個(gè)粒子的位置;α為創(chuàng)新參數(shù);Φ 和u為(0,1)上均勻分布的數(shù)值,取正和取負(fù)的概率均為0.5。
為對(duì)比LMD 分解方法與CEEMD 分解方法的優(yōu)劣,通過(guò)與尋優(yōu)算法QPSO 和機(jī)器學(xué)習(xí)CRJ 神經(jīng)網(wǎng)絡(luò)相結(jié)合,選出最優(yōu)的月徑流預(yù)測(cè)模型。本文選取3 種模型分別進(jìn)行預(yù)測(cè),包括單一QPSO-CRJ 模型,組合預(yù)測(cè)LMD-QPSO-CRJ 模型,組合預(yù)測(cè)CEEMD-QPSO-CRJ模型。
LMD-QPSO-CRJ 模型的基本構(gòu)建原理為:①選用LMD 法將原始序列分解,提取出月徑流序列中具有一定物理意義的信號(hào),得到不同頻率的子序列即PF分量和趨勢(shì)項(xiàng);②利用VMD法對(duì)分解后的高頻分量PF1 進(jìn)行二次分解;③借助QPSO 算法對(duì)CRJ 神經(jīng)網(wǎng)絡(luò)的4 個(gè)參數(shù):隱藏層更新系數(shù)a、輸入權(quán)值ri、循環(huán)權(quán)重rc、跳躍權(quán)重rj進(jìn)行優(yōu)化,通過(guò)不斷地迭代找到最優(yōu)參數(shù);④對(duì)二次分解后的分量和其余分量分別進(jìn)行預(yù)測(cè)并重構(gòu)各分量的預(yù)測(cè)值,得到組合預(yù)測(cè)模型月徑流序列的預(yù)測(cè)結(jié)果。模型預(yù)測(cè)過(guò)程見(jiàn)圖2所示。
圖2 LMD-QPSO-CRJ模型流程圖Fig.2 LMD-QPSO-CRJ model flow chart
CEEMD-QPSO-CRJ 模型的基本構(gòu)建原理為:①采用CEEMD 法對(duì)原始序列進(jìn)行分解,得到一系列IMF 分量;②對(duì)高頻分量IMF1 進(jìn)行VMD 二次分解;③利用QPSO 算法對(duì)CRJ 神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)尋優(yōu);④對(duì)各子序列進(jìn)行預(yù)測(cè)并重構(gòu),得到月徑流預(yù)測(cè)值。
單一QPSO-CRJ模型的基本構(gòu)建原理與其他兩種組合預(yù)測(cè)模型類似。不同的是單一QPSO-CRJ 模型不進(jìn)行分解降噪處理,直接將原始徑流數(shù)據(jù)輸入到CRJ 神經(jīng)網(wǎng)絡(luò)中,利用QPSO 算法進(jìn)行參數(shù)尋優(yōu),預(yù)測(cè)重構(gòu)后得到徑流預(yù)測(cè)值。
為了能夠清楚地反映模型的預(yù)測(cè)結(jié)果的誤差以及預(yù)測(cè)精度,本文采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)及納什效率系數(shù)(NSE)以上3個(gè)指標(biāo)進(jìn)行分析,MAE和RMSE值越接近于0,表明模型擬合精度越高,NSE值越接近于1,表示模型擬合精度越高。3個(gè)指標(biāo)的計(jì)算公式分別為:
式中:Xio為實(shí)測(cè)值;Xie為預(yù)測(cè)值為實(shí)測(cè)值平均值;n為觀測(cè)次數(shù)。
汾河流域位于山西省的中部和西南部,流經(jīng)6 個(gè)市的29 個(gè)縣區(qū),全長(zhǎng)716 km,流域總面積為39 721 km2,占山西省國(guó)土總面積的1/4。流經(jīng)太原市南北領(lǐng)域的汾河全長(zhǎng)約100 km,占整條汾河的1/7。從寧武縣的雷鳴寺到太原市蘭村為汾河上游。汾河上游建有兩個(gè)水文站:上靜游站和汾河水庫(kù)站。上靜游站建于嵐河之上,該站所控制的流域面積為1 140 km2;汾河水庫(kù)站建于嵐河與汾河干流的交匯處,該站所控制的流域面積為5 268 km2。本文將對(duì)這2個(gè)水文站的月徑流進(jìn)行預(yù)測(cè)研究。水文站點(diǎn)1958-2016年共708 個(gè)月徑流數(shù)據(jù)包含足夠的豐、平、枯水年,徑流資料精度高,因此確保了該資料具有代表性。
將上靜游站和汾河水庫(kù)站的月徑流序列進(jìn)行LMD分解,由分解結(jié)果可知2個(gè)水文站每個(gè)站點(diǎn)的時(shí)間序列分解出5個(gè)PF分量和1 個(gè)趨勢(shì)項(xiàng)。圖3(a)和3(b)為將汾河水庫(kù)站和上靜游站1958-2016年月徑流數(shù)據(jù)進(jìn)行LMD 分解后,得到的各個(gè)站點(diǎn)PF分量和趨勢(shì)項(xiàng)的變化圖。從圖3(a)和圖3(b)中可以看出,這兩個(gè)站點(diǎn)各分量的波動(dòng)變化情況基本類似。其中,PF1 分量相比于其余分量,頻率最大,振幅最大,波長(zhǎng)最短,波動(dòng)情況最為劇烈,且與原始序列的波形最為相似;PF2~PF4 頻率逐漸減小,波長(zhǎng)也隨之變長(zhǎng),振幅逐漸縮小,且均表現(xiàn)出一定的周期性,波形的規(guī)律性逐漸減弱;PF5 分量中頻率降到最低,波動(dòng)程度最小,振幅也降到了最低;Res 趨勢(shì)項(xiàng)通常能夠表現(xiàn)出徑流時(shí)間序列的變化趨勢(shì)情況,即1958-2016年,汾河上游的月徑流序列整體上呈現(xiàn)出增大后逐漸下降的變化趨勢(shì)。
圖3 各站點(diǎn)月徑流序列LMD分解圖Fig.3 LMD decomposition diagram of monthly runoff sequence of each station
本文運(yùn)用汾河上游的汾河水庫(kù)站和上靜游站2 個(gè)站點(diǎn)的1958-2016年月徑流資料進(jìn)行徑流模擬。根據(jù)以往研究者們得到的較成功的徑流預(yù)測(cè)效果,將前564 個(gè)月徑流數(shù)據(jù)即1958年1月至2004年12月設(shè)為訓(xùn)練期。將后144 個(gè)月徑流數(shù)據(jù)即2005年1月至2016年12月設(shè)為驗(yàn)證期。LMD-QPSO-CRJ 組合預(yù)測(cè)模型、CEEMD-QPSO-CRJ 組合預(yù)測(cè)模型以及單一QPSOCRJ模型的月徑流序列驗(yàn)證期的預(yù)測(cè)結(jié)果,見(jiàn)圖4所示。
圖4 各模型預(yù)測(cè)結(jié)果對(duì)比Fig.4 Comparison of prediction results of various models
由圖4(a)和4(b)可知:①在單一QPSO-CRJ 模型下,上靜游站和汾河水庫(kù)站的月徑流預(yù)測(cè)效果不是很理想,僅大體展現(xiàn)出徑流的變化趨勢(shì)。與其他兩種組合預(yù)測(cè)模型相比,上靜游站的單一QPSO-CRJ 模型在2010年12月-2016年12月預(yù)測(cè)值與實(shí)測(cè)值偏差最大。單一QPSO-CRJ模型在對(duì)月徑流量峰值的預(yù)測(cè)效果較差,預(yù)測(cè)值與實(shí)測(cè)值相差約44%。②在組合預(yù)測(cè)CEEMD-QPSO-CRJ 模型下,預(yù)測(cè)效果比單一預(yù)測(cè)模型要好,兩個(gè)站點(diǎn)的2005年1月-2010年12月的預(yù)測(cè)效果與2011年1月-2016年12月相比,擬合效果更好,但仍存在約53%的預(yù)測(cè)數(shù)據(jù)和實(shí)測(cè)值相差20%~30%,且整體上預(yù)測(cè)值偏小。對(duì)月徑流量峰值的預(yù)測(cè)效果較好,預(yù)測(cè)值與實(shí)測(cè)值相差約35%。③在組合預(yù)測(cè)LMD-QPSO-CRJ 模型下,預(yù)測(cè)效果整體上比其他兩種模型要好。從2005年1月-2016年12月預(yù)測(cè)結(jié)果的變化趨勢(shì)來(lái)看,與實(shí)測(cè)值的相似度最高。與其他兩種模型相比,峰值的預(yù)測(cè)值增大,其誤差降低了約29%。④汾河水庫(kù)站的單一QPSO-CRJ模型預(yù)測(cè)效果整體上要優(yōu)于上靜游站。兩種組合預(yù)測(cè)模型2011年1月-2016年12月汾河水庫(kù)站的擬合效果比上靜游站同時(shí)段的擬合效果高約30%~39%。由此可以判斷出,LMD 法比CEEMD法更能有效地處理原始徑流序列,且與CRJ神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)效果更好。
表1為汾河上游上靜游站和汾河水庫(kù)站訓(xùn)練期和驗(yàn)證期的預(yù)測(cè)精度結(jié)果,從表1可以分析得到:①各模型在訓(xùn)練期和驗(yàn)證期的NSE指標(biāo)均達(dá)到0.7 以上,已達(dá)到水文預(yù)報(bào)要求。②隨著模型的不斷優(yōu)化,在訓(xùn)練期和驗(yàn)證期下均呈現(xiàn)出從單一QPSOCRJ 模型到組合預(yù)測(cè)CEEMD-QPSO-CRJ 模型再到組合預(yù)測(cè)LMD-QPSO-CRJ 模型,MAE和RMSE的值逐漸減小,NSE值逐漸增大并靠近1 的變化情況。③訓(xùn)練期,汾河水庫(kù)站的LMDQPSO-CRJ 模型MAE和RMSE值與單一QPSO-CRJ 模型相比,分別減少約40.4%和31.3%;與CEEMD-QPSO-CRJ 模型相比,分別減少約22.4%和21.4%。上靜游站的LMD-QPSO-CRJ 模型MAE和RMSE值與單一QPSO-CRJ 模型相比,分別減少了約34.7%和32.9%;與CEEMD-QPSO-CRJ 模型相比,分別減少了約22.8%和15.3%。④驗(yàn)證期,汾河水庫(kù)站的LMD-QPSO-CRJ模型MAE和RMSE值與單一QPSO-CRJ 模型相比,分別減少約32.5%和23.7%;與CEEMD-QPSO-CRJ 模型相比,分別減少約26.0%和17.4%。上靜游站的LMD-QPSO-CRJ 模型MAE和RMSE值與單一QPSO-CRJ 模型相比,分別減少約40.0%和30.7%;與CEEMD-QPSO-CRJ 模型相比,分別減少約17.4%和11.4%。⑤汾河水庫(kù)站與上靜游站各模型對(duì)比,汾河水庫(kù)站MAE值約為上靜游站的6.5~9倍;RMSE值約為上靜游站的5.6~9.3 倍。這可能是由汾河水庫(kù)站逐月徑流量比上靜游站大,且汾河水庫(kù)的豐水期與枯水期徑流量相差大而造成的。⑥總體而言,LMD-QPSO-CRJ 模型與其他模型相比,該模型的MAE值和RMSE值最小,NSE值最接近于1。因此,LMD-QPSO-CRJ 模型在汾河水庫(kù)站和上靜游站的預(yù)測(cè)效果最為理想。
表1 2個(gè)水文站各模型預(yù)測(cè)誤差對(duì)比Tab.1 Comparison of prediction errors of each model of two hydrologic stations
綜上所述,汾河上游的月徑流序列各模型的預(yù)測(cè)效果優(yōu)劣排序如下:LMD-QPSO-CRJ>CEEMD-QPSO-CRJ>QPSO-CRJ,組合模型與單一QPSO-CRJ 模型相比有一定優(yōu)勢(shì)。LMD-QP?SO-CRJ 模型比CEEMD-QPSO-CRJ 模型對(duì)驗(yàn)證期月徑流序列的預(yù)測(cè)精度高。因此,LMD-QPSO-CRJ模型對(duì)復(fù)雜頻率下的徑流序列的處理和預(yù)測(cè)是可行的。
(1)運(yùn)用LMD法和CEEMD法將原始月徑流序列分解,通過(guò)CRJ 神經(jīng)網(wǎng)絡(luò)對(duì)分量進(jìn)行預(yù)測(cè),重構(gòu)各分量預(yù)測(cè)值后,與單一QPSO-CRJ模型相比大大提高了預(yù)測(cè)精度。
(2)LMD 法可依據(jù)序列本身的特征自適應(yīng)地分解序列,能夠清晰準(zhǔn)確地反映出徑流序列在空間各尺度上分布規(guī)律的時(shí)頻分布,有利于更加細(xì)致地對(duì)徑流序列特征進(jìn)行分析以及預(yù)測(cè)模型的建立。
(3)LMD-QPSO-CRJ 模型首先將708 個(gè)月徑流序列分解成一系列分量,再通過(guò)VMD 法對(duì)第一個(gè)高頻分量PF1進(jìn)行二次分解,并利用QPSO 算法對(duì)CRJ 神經(jīng)網(wǎng)絡(luò)的各項(xiàng)參數(shù)進(jìn)行尋優(yōu),將各分量分別輸入到CRJ 神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),重構(gòu)后得到最終預(yù)測(cè)結(jié)果。該模型的預(yù)測(cè)結(jié)果與CEEMD-QPSO-CRJ 模型相比誤差最小。因此,LMD-QPSO-CRJ模型對(duì)于復(fù)雜的徑流序列預(yù)測(cè)是可行的,可以被參考應(yīng)用到其他與汾河上游水文地質(zhì)環(huán)境相似的流域中。 □