魏 鵬
(雅礱江流域水電開發(fā)有限公司,四川成都610051)
基于小波消噪技術(shù)的投影尋蹤自回歸預(yù)報(bào)模型
魏 鵬
(雅礱江流域水電開發(fā)有限公司,四川成都610051)
針對徑流序列呈現(xiàn)出的隨機(jī)性和非線性等,基于耦合小波分析理論的降噪功能以及投影尋蹤自回歸模型的非線性逼近功能,建立一種組合預(yù)報(bào)模型,即PPAR-WDT。模型運(yùn)用Mallat算法將徑流序列進(jìn)行分解;然后利用閾值消噪技術(shù)對含有噪聲的高頻信號序列進(jìn)行降噪處理,最后重構(gòu)新序列;運(yùn)用投影尋蹤自回歸模型進(jìn)行預(yù)報(bào)。將新組合模型應(yīng)用于某水文站中長期徑流預(yù)報(bào)的結(jié)果表明,相比于單一投影尋蹤自回歸等3種模型,PPAR-WDT模型具有更高的預(yù)報(bào)精度和更好的穩(wěn)定性。
徑流預(yù)報(bào);小波消噪技術(shù);Mallat算法;投影尋蹤自回歸;組合模型
徑流預(yù)報(bào)對防洪減災(zāi)以及水能資源的高效利用有著重要作用。受氣候環(huán)境和人類活動(dòng)等多種因素影響,徑流序列表現(xiàn)出強(qiáng)烈的模糊性、隨機(jī)性、非線性等特點(diǎn)[1];因此,徑流預(yù)報(bào)模型一直是水文水資源領(lǐng)域中的熱點(diǎn)及難點(diǎn)問題之一。目前,較常用的預(yù)報(bào)模型有多元回歸模型[2]、神經(jīng)網(wǎng)絡(luò)模型[3]、支持向量機(jī)[4]等;但在實(shí)際運(yùn)用中仍受到不同程度的限制。如:多元回歸模型的求解函數(shù)比較復(fù)雜,在預(yù)報(bào)非線性序列時(shí)精度難以得到保證;BP模型存在收斂速度較慢、訓(xùn)練時(shí)間較長等不足;支持向量機(jī)中參數(shù)優(yōu)化比較復(fù)雜;等等。因此,研究新模型以提高徑流預(yù)報(bào)精度仍然具有極為重要的現(xiàn)實(shí)意義[5- 6]。
小波分析理論(Wavelet Analysis Theory)作為一門數(shù)學(xué)分支學(xué)科,近些年在各領(lǐng)域已有較為出色的表現(xiàn)[7-10]。其框架下的小波消噪技術(shù)(Wavelet De-noising Technology,WDT)能對含噪聲的信號序列進(jìn)行降噪處理。利用這一技術(shù)對徑流序列進(jìn)行消噪處理,可在一定程度上減少水文序列中的干擾成分,進(jìn)一步把握其內(nèi)在變化規(guī)律?;谕队皩ほ欁曰貧w技術(shù)(Projection Pursuit Auto Regression,PPAR)具有較強(qiáng)的處理高維數(shù)據(jù)的能力,可解決非正態(tài)、非線性的問題的優(yōu)點(diǎn)[11]。鑒于目前尚無文獻(xiàn)涉及二者的結(jié)合,本文將WDT和PPAR進(jìn)行耦合,建立基于小波消噪技術(shù)的投影尋蹤自回歸模型(Projection Pursuit Auto Regression Model based on Wavelet De-noising Technology, PPAR-WDT),探求進(jìn)一步提高徑流預(yù)報(bào)精度的改進(jìn)方法。
1.1 小波變換
小波消噪技術(shù)源自小波分析理論,其重要基礎(chǔ)是小波變換。設(shè)時(shí)間序列為s(t),則其變換形式為
(1)
式中,Ws(a,b)為變換系數(shù);a為頻域因子;b為時(shí)域因子;Ψ(t)為母小波函數(shù);*表示復(fù)共軛;t為時(shí)間。
然而在實(shí)際運(yùn)用中,s(t)常是離散狀態(tài)。因此,對式(1)作離散形式的轉(zhuǎn)變。即
(2)
式中,N為離散總數(shù);Δt為時(shí)間間隔。
從式(1)、式(2)可看出,Ws(a,b)耦合了時(shí)間序列s(t)和母小波函數(shù)Ψ(t)的信息,可反映序列頻域和時(shí)域的性質(zhì)。亦即,如果頻域因子a較小,則頻域的分辨率較低,對時(shí)域的分辨率較高;反之,如果頻域因子a較大,則對頻域的分辨率較高,對時(shí)域的分辨率較低。因此,可利用小波變換對時(shí)間序列進(jìn)行多尺度分頻分析。
1.2 Mallat算法
Mallat算法是實(shí)現(xiàn)小波變換的一種經(jīng)典算法,也稱為快速小波算法(Fast Wavelet Algorithm,FWA)。其包括分解和重構(gòu)兩部分,以此對s(t)進(jìn)行分解與重構(gòu),實(shí)現(xiàn)上述小波變換功能。
分解
(3)
重構(gòu)
(4)
可以看出,濾波器是Mallat算法的核心技術(shù),不同的母小波函數(shù)Ψ(t)擁有不同的低通濾波器和高通濾波器。對于不規(guī)則信號而言,Daubechies小波系列(dbN)能較為敏感地反應(yīng)其特征,而相比于該系列其他小波,db4小波的時(shí)窗更短,分辨率更高[12]。鑒于徑流預(yù)報(bào)的非線性等特征,本文的母小波函數(shù)Ψ(t)選用db4小波
1.3 小波消噪
在上述算法基礎(chǔ)上,對s(t)進(jìn)行噪聲消除的處理。設(shè)
s(t)=f(t)+e(t)
(5)
式中,f(t)為有用信號;e(t)為白噪聲信號。
利用式(3)對s(t)作小波分解,e(t)主要表現(xiàn)在各分辨尺度對應(yīng)的高頻成分中;此時(shí)運(yùn)用閾值法[13]對高頻成分進(jìn)行處理,方可實(shí)現(xiàn)信噪分離。
2.1 基本原理
建立多種方法交叉組合的預(yù)報(bào)模型時(shí),方法間的結(jié)合方式成為研究關(guān)鍵,也直接影響著預(yù)報(bào)結(jié)果的精度。本文將WDT融入PPAR模型中,建立PPAR-WDT模型(見圖1),基本原理為:利用Mallat算法中的分解公式對原始序列進(jìn)行分解,得到高頻成分和低頻成分,對含噪的高頻部分進(jìn)行消噪處理,再加以重構(gòu),使消噪后的數(shù)據(jù)更能反映徑流序列的本質(zhì)及變化規(guī)律。在此基礎(chǔ)上,利用PPAR模型進(jìn)行預(yù)報(bào)。
圖1 PPAR-WDT模型結(jié)構(gòu)示意
2.2 模型構(gòu)建
在上述基本原理框架下,構(gòu)建PPAR-WDT模型,具體步驟如下:
Step1。選擇db4小波為母小波函數(shù),采用Mallat分解算法對時(shí)間序列s(t)進(jìn)行J層分解,得到分解序列{cJ(t),dJ(t),dJ-1(t),…,d1(t)}。
Step2。對1~J層的每一層高頻序列dj,選擇一個(gè)閾值Fσ進(jìn)行閾值量化處理,得到消噪后的高頻成分dj′。本文利用Stein無偏風(fēng)險(xiǎn)法[14]進(jìn)行閾值估算,并采用軟閾值方式進(jìn)行閾值量化處理
(6)
Step3。由第J層的低頻序列cj和消噪后的1~J層的高頻序列dj′,利用Mallat重構(gòu)算法進(jìn)行重構(gòu),得到消噪序列s′(t)。
Step4。運(yùn)用自相關(guān)技術(shù),選取各分解序列的預(yù)報(bào)因子。為簡潔闡述過程,令序列統(tǒng)一為xi(i=1,2,…,n),并設(shè)Rk(k=1,2,…,m)為xi延遲k步的自相關(guān)系數(shù),則
(7)
式中,n為序列容量,m (8) 那么,xi-k的自相關(guān)性顯著,此時(shí)可其選為預(yù)報(bào)因子。 Step5。確定投影值 (9) 式中,uk為投影方向;p為預(yù)報(bào)因子數(shù)目。 Step6。建立預(yù)報(bào)模型 (10) 式中,x′為預(yù)報(bào)值;h為Hermite多項(xiàng)式;v為h的系數(shù);M為嶺函數(shù)的個(gè)數(shù);r為h的階數(shù)。 Step7。建立投影指標(biāo)函數(shù),并采用基于實(shí)數(shù)編碼的加速遺傳算法進(jìn)行優(yōu)化,確定參數(shù)u、v: (11) Step8。令擬合殘差r=xi-xi′,若滿足精度要求,則可確定模型參數(shù),輸出預(yù)報(bào)結(jié)果;否則,用r替換x,返回Step4進(jìn)行循環(huán)計(jì)算,直到滿足條件為止。 基于MATLAB編程語言,利用某水文站1956年~2005年(共計(jì)50 a)實(shí)測年徑流數(shù)據(jù)資料進(jìn)行實(shí)例計(jì)算,以驗(yàn)證新模型的合理性。令徑流序列為{Q(t)|t=1,2,…,50},模型參數(shù)設(shè)置如下:分解尺度J=3,置信水平取70%,延遲步數(shù)m=11,嶺函數(shù)個(gè)數(shù)M=1,多項(xiàng)式的階數(shù)r=8。首先,運(yùn)用db4正交小波,采用式(3)對Q(t)進(jìn)行分解,得到對應(yīng)的小波分解序列{c3(t),d3(t),d2(t),d1(t)}(見圖2)。 圖2 宜昌站年徑流序列(1956年~2005年)小波分解 由圖2可以看出,低頻序列c3(t)包含了原始序列的趨勢成分;高頻序列dj(t)(j=1,2,3)為包含了其隨機(jī)成分,且擾動(dòng)程度隨分解尺度的增加而降低。 在此基礎(chǔ)上,依據(jù)式(6)對包含噪聲的d1(t)、d2(t)、d3(t)序列進(jìn)行消噪處理,得到d1′(t)、d2′(t)、d3′(t),并利用式(4)對消噪后的新序列{c3(t),d3′(t),d2′(t),d1′(t)}進(jìn)行重構(gòu),得到Q*,結(jié)果如圖3所示。 圖3 徑流序列消噪前后對比 從圖3可以看出,消噪序列Q*保持了原始序列Q的主要趨勢信息;同時(shí),在一定程度上受到隨機(jī)成分(噪聲)擾動(dòng)的影響較小。 進(jìn)一步將Q*作為輸入項(xiàng),依據(jù)式(7)進(jìn)行計(jì)算,選取預(yù)報(bào)因子。計(jì)算結(jié)果如表1所示。 表1 Q*自相關(guān)系數(shù)及其上、下限值 圖4 不同模型預(yù)報(bào)結(jié)果 由表1可以看出,當(dāng)k取4和5時(shí),滿足式(8)所給條件;則Q*的預(yù)報(bào)因子為x(Q*)i-4、x(Q*)i-5。 依次遵循Step5~Step6進(jìn)行計(jì)算,確定模型關(guān)鍵參數(shù)u、v,并輸出預(yù)報(bào)結(jié)果(表2、表3、圖4)。同時(shí),選取PPAR模型、BP模型以及自回歸滑動(dòng)模型(ARMA)對同一徑流序列進(jìn)行預(yù)報(bào)。此處采用擬合樣本標(biāo)準(zhǔn)均方誤差(IP1)、檢驗(yàn)樣本相對誤差平均值(IP2)以及波動(dòng)性(IP3)三項(xiàng)指標(biāo),分別從模型預(yù)報(bào)精度和預(yù)報(bào)結(jié)果穩(wěn)定性兩方面對各模型性能進(jìn)行評價(jià)。即 (12) (13) (14) 式中,X為擬合樣本的總數(shù);Y為檢驗(yàn)樣本的總數(shù);s2為檢驗(yàn)樣本方差;xsi、xyi分別為擬合樣本中第i個(gè)序號的實(shí)測值和預(yù)報(bào)值;xsj、xyj分別為檢驗(yàn)樣本中第j個(gè)序號的實(shí)測值和預(yù)報(bào)值;σt、σp分別為第t、p個(gè)序號的相對誤差。各模型的性能評價(jià)指標(biāo)和預(yù)報(bào)結(jié)果如表3、圖4所示。 表2 參數(shù)u、v 表3 不同模型性能評價(jià)指標(biāo) % 由表3可以看出,在預(yù)報(bào)精度方面,對于擬合樣本,除ARMA模型的IP1值較大外,其他3種模型的擬合效果均較好;對于檢驗(yàn)樣本,PPAR-WDT模型預(yù)報(bào)效果最佳,IP2值為4.23%,小于其他3種模型。在預(yù)報(bào)結(jié)果穩(wěn)定性方面,PPAR-WDT模型的IP3值最小,其穩(wěn)定性最好。綜上所述,由于PPAR-WDT模型利用小波消噪技術(shù)進(jìn)行了數(shù)據(jù)預(yù)處理,較大程度地降低了隨機(jī)成分的干擾,較好地提取了序列中有用信息,同時(shí)結(jié)合了PPAR模型很好的非線性逼近功能。因此,與其他3種模型相比,本模型PPAR-WDT預(yù)報(bào)效果最佳,可服務(wù)于水庫調(diào)度等作業(yè)。 本文有機(jī)地將小波消噪技術(shù)與投影尋蹤自回歸模型相結(jié)合,構(gòu)建了一種新的組合預(yù)報(bào)模型。相比于其他單一或者組合模型,其顯著優(yōu)勢在于對序列進(jìn)行了降噪處理,宏觀上凈化了序列,極大程度地排除了噪聲信號對客觀趨勢判斷的干擾,更能揭示序列變化水平。在某水文站實(shí)測年徑流預(yù)報(bào)應(yīng)用中驗(yàn)證了新模型可較充分地挖掘徑流序列的有效信息,在預(yù)報(bào)精度和穩(wěn)定性方面都有明顯提高,可作為徑流預(yù)報(bào)的一種有效途徑。 [1]劉蕊鑫, 紀(jì)昌明, 馬源. 基于互信息的改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型及其應(yīng)用[J]. 中國農(nóng)村水利水電, 2016(10): 100- 103, 115. [2]王秀杰, 練繼建, 費(fèi)守明, 等. 基于小波消噪的混沌多元回歸日徑流預(yù)測模型[J]. 系統(tǒng)仿真學(xué)報(bào), 2007, 19(15): 3605- 3608. [3]莫崇勛, 王大洋, 鐘歡歡, 等. 人工神經(jīng)網(wǎng)絡(luò)在澄碧河年徑流預(yù)測中的應(yīng)用研究[J]. 水力發(fā)電, 2016, 42(9): 25- 28. [4]朱雙, 周建中, 丁小玲, 等. 基于GM-SVR耦合的月徑流預(yù)測模型研究與應(yīng)用[J]. 水力發(fā)電, 2015, 41(12): 17- 20. [5]KALTEH A M. Monthly river flow forecasting using artificial neural network and support vector regression models coupled with wavelet transform[J]. Computers & Geosciences, 2013, 54: 1- 8. [6]ADAMOWSKI J, SUN K. Development of a coupled wavelet transform and neural network method for flow forecasting of non-perennial rivers in semi-arid watersheds[J]. Journal of Hydrology, 2010, 390(1- 2): 85- 91. [7]趙鯤鵬, 趙二峰, 王瑩, 等. 提升小波多尺度分解法與RBF神經(jīng)網(wǎng)絡(luò)在混凝土重力壩應(yīng)力監(jiān)測中的應(yīng)用[J]. 水力發(fā)電, 2015, 41(2): 81- 85. [8]童超, 刁鳴, 楊承志. 獨(dú)立分量分析聯(lián)合小波變換的多分量信號調(diào)制識別研究[J]. 科學(xué)技術(shù)與工程, 2016(30): 258- 263. [9]鄭健, 謝先武, 劉勝. 利用小波分析的高鐵沉降變形預(yù)測[J]. 測繪科學(xué), 2016(4): 1- 6. [10]孫永輝, 范磊, 衛(wèi)志農(nóng), 等. 基于小波分析和集成學(xué)習(xí)的光伏輸出功率短期預(yù)測[J]. 電力系統(tǒng)及其自動(dòng)化學(xué)報(bào), 2016(4): 6- 11, 30. [11]紀(jì)昌明, 李榮波, 張驗(yàn)科, 等. 基于小波分解的投影尋蹤自回歸組合模型及其在年徑流預(yù)測中的應(yīng)用[J]. 水力發(fā)電學(xué)報(bào), 2015, 34(7): 27- 35. [12]劉力, 周建中, 李英海, 等. 基于小波消噪的混沌徑流預(yù)測模型[J]. 華中科技大學(xué)學(xué)報(bào): 自然科學(xué)版, 2009(7): 86- 89. [13]劉國華, 錢鏡林, 王建江. 小波軟閾值技術(shù)和人工神經(jīng)網(wǎng)絡(luò)在洪水預(yù)報(bào)中的研究[J]. 水力發(fā)電學(xué)報(bào), 2004(4): 5- 10. [14]郭金吉. Fuzzy度量空間映射對的幾個(gè)不動(dòng)點(diǎn)定理[J]. 南京工業(yè)大學(xué)學(xué)報(bào): 自然科學(xué)版, 1993(1): 69- 73. (責(zé)任編輯 陳 萍) Projection Pursuit Auto Regression Forecasting Model Based on Wavelet De-noising Technology WEI Peng Considering the randomness and nonlinearity of runoff series, the Projection Pursuit Auto Regression model based on Wavelet De-noising Technology (PPAR-WDT) is proposed which combines the de-noising function of wavelet analysis theory with the nonlinear approximation function of the Projection Pursuit Auto Regression (PPAR). In this model, the runoff is firstly decomposed into several high-frequency signals and a low-frequency signal by Mallat algorithm, and then, each high-frequency signal is processed and reordered by wavelet de-noising technology to eliminate noise effects, which enables the processed signals to be reconstructed in a new runoff series. The application of this new combined model in the runoff forecast of a hydrologic station shows that PPAR-WDT model has higher forecasting accuracy and better stability comparing with other three different kinds of forecasting models. runoff forecast; wavelet de-noising technology; Mallat algorithm; projection pursuit auto regression; combined model 2016- 12- 23 魏鵬(1981—),男,四川簡陽人,高級工程師,博士,研究方向?yàn)橄到y(tǒng)工程、水能資源開發(fā)與利用. P338.2 A 0559- 9342(2017)08- 0034- 053 實(shí)例應(yīng)用
4 結(jié) 論
(Yalong River Hydropower Development Company Ltd., Chengdu 610051, Sichuan, China)