張承全
(河南省水利第一工程局,河南 鄭州 450000)
基于EMD分解的徑流量預測模型
張承全
(河南省水利第一工程局,河南 鄭州 450000)
徑流量是一個非線性、不穩(wěn)定的時間序列數據。分析了經驗模態(tài)分解和Hilbert-Huang轉換的計算方法,構建了多尺度的預測模型,并以黃河高村站547個月的徑流量數據為資料,探討了應用該模型進行徑流量預測的方法。
徑流量;EMD;Hilbert;預測模型
徑流量是一個非線性的、不穩(wěn)定的時間序列數據。在分析徑流量數據時,若采用僅考慮時域的分析方法,往往不能反映瞬時情況。而在一些必要假設的基礎上,對觀測資料進行處理分析,是體現數據直觀價值的重要途徑。
數據的分析方法有很多,如小波分析法是一種非線性的處理方法,能夠在時域和頻域內同時得到較高的分辨率,但會造成許多虛假的諧波,故具有一定的局限性[1]。傅里葉分析法是一種純時頻的數據處理方法,能夠在頻域內得到非常高的分辨率。但是,它在時域內卻失去了分辨能力,對非線性、非穩(wěn)態(tài)數據的處理存在一些不足[2]。1998年,美國國家宇航局的Norden E.Huang首次提出先對一組時間序列數據做經驗模態(tài)分解 (Empirical Mode Decomposition,簡稱EMD),再對各個分量進行希爾伯特變換的處理方法,被稱為希爾伯特黃變換 (Hilbert-Huang-Transformation,HHT)[3]。EMD能把復雜數據分解成一系列的本征模態(tài)函數 (Imtrinsic Mode Function,簡稱IMF),再對每個IMF進行希爾伯特變換,將得到的頻率、振幅、相位進行整合[4~10]。HHT數學模型是利用數據自身的調節(jié)機制反映出系統(tǒng)多尺度特性[11~13]。筆者通過對黃河高村站547個月徑流量進行EMD分解,構建了多尺度的預測模型,并用該模型進行徑流量預測。
1.1 經驗模態(tài)分解(EMD)
經驗模態(tài)分解過程是一個篩選過程,它對非線性序列進行平穩(wěn)化處理,提取出不同尺度下的波動和趨勢因子,進而篩選出其中的本征模態(tài)函數IMF。本征模態(tài)函數必須滿足以下2個條件:(1)該列數據極值點和過零點數目基本相等。(2)在任意時刻,由局部極大點構成的包絡線和由局部極小點構成的包絡線的平均值為零。
EMD的計算步驟為:(1)尋找數據序列S(t)的所有極大值和極小值,并將其用三次樣條函數分別擬合成原數據序列的上、下包絡線。(2)對上、下包絡線求局部的均值。(3)用原數據序列S(t)減去局部均值m(t),即可得到第一個本征模態(tài)函數h1(t)。(4)判斷h1(t)是否滿足IMF的2個條件,若不滿足,就將它看作新的時間序列,重復以上步驟,直到滿足IMF條件時,即可得到第一個IMF函數C1(t)。(5)將r1(t)=S(t)-h1(t)看作新的S(t),重復以上步驟,即可依次得到IMF2、IMF3……直到剩余部分R(t)滿足給定的終止條件時,篩選結束。此時,原始序列可表示為式(1)。這樣,數據序列就由一系列的本征模態(tài)函數和一個殘值數列組成。
標準差SD的計算式如式(2)所示。一般情況下,前后兩個數據的標準差越小,所得的本征模態(tài)函數的穩(wěn)定性就越好,能夠分解出的IMF的個數就越多。實踐表明,當SD∈(0.2,0.3)時,每個IMF分量都反映了信號在不同時間尺度內的模態(tài)特征,并具有較好的穩(wěn)定性。
1.2 Hilbert變換
原數據序列經過EMD分解后,再按照式(3)對其每一個IMF分量進行Hilbert變換。
式中:P表示柯西主值。
由于C(t)和Y(t)為共軛復數對,于是可以得到一個解析信號Z(t),如式(6)所示。
式中:a(t)是瞬時振幅函數;θ(t)是相位函數,θ(t)=arctan。
由此可知,經Hilbert變換得到的瞬時振幅和瞬時頻率都是隨時間變化的函數,所得的瞬時頻率能夠揭示數據的真實物理意義。
2.1 技術路線
模型操作的具體流程如圖1所示。
2.2 模型建立
根據EMD和HHT變換理論,結合數據特征,構建預測模型,如式(5)所示。
式中:S(t)為月均徑流量,億/m3;t為時間,年;a是各IMF分量的平均振幅;T是各IMF的平均周期;R(t)是殘值項;n是變換后分量的個數;b是各函數的初相位。
對式(5)求解可得式(6)。
高村水文站是黃河流入山東的重要控制站,測驗河段位于黃河下游游蕩河段的末端,斷面距河口579.1 km,集水面積為734 146 km2。本文選取黃河高村水文站547個月的徑流量數據進行分析,數據來源于《中國河流泥沙公報》和《黃河水資源公報》。
3.1 多尺度分析
將山東高村水文站547個月的月均徑流量進行EMD分解,結果如圖2所示。由圖2可以看出,山東高村水文站547個月的月均徑流量經EMD分解,成為5個本征函數IMF分量和1個殘余函數。IMF1振蕩頻率最高,從IMF1到IMF5的頻率逐漸變低,振幅逐漸減小。但是,在IMF4和IMF5中,振幅出現了異常。這種情況時常會出現在低頻部分,但不會影響整體的變化趨勢。最后一項是殘差相,它單調地體現序列的趨勢,即徑流量有減弱的趨勢。
圖1 技術路線圖Fig.1 Technical circuit
對各個IMF分量進行HHT變換,可得到IMF分量平均幅度和平均頻率,如表1所示。
由表1可知,IMF1是從時間序列中分解出的振幅最大、頻率最高、波長最短的波動,其平均周期在4.78個月左右波動,平均振幅為511.82億m3/月;IMF2平均周期在13.84個月左右波動,平均振幅為381.67億m3/月;IMF3平均周期在29.15個月左右波動,平均振幅為338.99億m3/月;IMF4平均周期在86.8個月左右波動,平均振幅為408.32億m3/月;IMF5平均周期在313.86個月左右波動,平均振幅為385.41億m3/月。IMF1~IMF5各本征模態(tài)函數的振幅逐漸變小、頻率逐漸變低,波長越來越長。這種變化趨勢一直持續(xù)到頻率已經很低的IMF4。IMF5的波動振幅比IMF4的波動振幅大。這是EMD中經常會出現的異常情況,但它只可能出現在頻率較低的部分,不會影響整體的變化趨勢??梢?,高村站547個月月均徑流量主要以4.78和13.84為主進行波動。
圖2 高村站547個月月均徑流量分解的IMF分量及趨勢項Fig.2 IMF component and trend of Gao village station average runoff decomposition for 547 months
表1 IMF分量平均幅度和平均頻率Tab.1 Average amplitude and average frequency of IMF component
3.2 預報模型
根據EMD分解和HHT變換后得到黃河高村站徑流量的周期、振幅和初相位,建立2種不同的非線性水文模型。
模型一為未考慮初相位的模型,表達式如式(7)所示。模型二為考慮初相位的模型,表達式如式(8)所示。
3.3 模型的預測
采用模型對黃河高村站第548~552月徑流量進行預測檢驗,結果如表2所示。由表2可知,預測結果與實測值接近,誤差在-4%~10%之間。
表2 第548~552月預測結果和相對誤差Tab.2 Prediction results and relative error from 548-552 month
(1)EMD分解法是對非線性序列進行平穩(wěn)化的過程,提取數據的客觀規(guī)律。HHT變換是一種在時域和頻域中應用較好的處理方法。將他們結合起來,用于徑流量的預測,可為防洪工作提供依據。
(2)用該模型預測黃河高村水文站徑流量,結果為:高村水文站月平均徑流量的波動準周期為4.78月、13.84月、29.15月、86.8月、313.86月。其中,以4.78月和13.84月為主要震蕩周期。預測誤差在-4%~10%之間,預測精度較高,滿足相關要求。
(3)模型在進行趨勢項數據處理時,做了簡化處理,HHT缺乏完善的數學理論支持。對于這些不足之處,還需要進一步研究。
[1] Long S R,Lai R J,Huang N E,et al.Blocking and trapping of waves in an inhornogeneous flow[J].Dyu Atmos Oceans,1993,20:79-106.
[2] Farge M.Wavelet transforms and their applications to turbulence[J].Ann Rev Fluid Mech,1992,24:395-457.
[3] Huang N E,Zheng S,Steven R,et al.The empirical mode decomposition and the Hilbertspectrum for nonlinear non-stationary time Series Analysis[A].Proc R Soc Lond A,1998:454;903-995.
[4] 李新杰,胡鐵松,郭旭寧,等.不同時間尺度的徑流時間序列混沌特性分析[J].水利學報,2013,44(5):516-520.
[5] 李艷玲,張云鵬,張國瑋,等.非線性多尺度模型及其應用[J].數學的實踐與認識,2015,45(1):203-208.
[6] Falconer I,Gottwald G A,Melbourne I,et al.Application of the 0-1 Test for chaos to experimental data[J].SI?AM Journal on Applied Dynamical Systems,2007,6(2):395-402.
[7] 鄧擁軍,王偉,錢成春,等.EMD方法及Hilbert變換中邊界問題的處理[J].科學通報,2001,46(3):257-263.
[8] 周念成,王予疆,陳剛,等.低頻振蕩模式辨識中信號非線性去除的平滑先驗方法[J].電力系統(tǒng)保護與控制,2012,40 (11):1-5.
[9] 戴吾蛟,丁曉利,朱建軍,等.基于經驗模式分解的濾波去噪法及其在GPS多路徑效應中的應用[J].測繪學報,2006,35(4):321-327.
[10]孫嫻,林振山.HHT新技術及其對ENSO的診斷[J].氣象,2006,32(9):17-22.
[11]Norden E Huang,Zheng Shen,Steven R Long,et al.Theempiricalmodedecomposition andtheHilbert spectrum for nonlinear and nonstationary time series analysis[J].The royal Society,1998,454:903-995.
[12]Bogdan M,Maarten D V,Ivan G,et al.Source separation from single-channel recordings by combining empirical-mode decomposition and independent component analysis[J].IEEE Trans on Bio-Medical Engineering,2010,57(9):2188-96.
[13]P Flandrin,G.Rilling,P Goncalves.Empirical modedecomposition as a filter bank[J].IEEE Signal Processing Letters,2004,2:112-114.
[責任編輯 楊明慶]
Runoff Prediction Model Based on EMD
Zhang Chengquan
(First Water Conservancy Engineering Bureau of Henan Province,Zhengzhou 45000,Henan,China)
Runoff is the nonlinear and unstable time series data.It analyzes the Empirical Mode Decomposition (EMD)and Hilbert-Huang transformation calculation method,establishes multiscale prediction model.Based on runoff data of the Yellow River Gao village hydrologic station for 547 months,it also discusses the method of using this model to predict the runoff.
Runoff;EMD;Hilbert;prediction model
TV121
A
10.13681/j.cnki.cn41-1282/tv.2017.02.003
2016-12-28
張承全(1984-),男,河南新鄉(xiāng)人,工程師,主要從事水文及水資源、水利施工方面的工作。