李愛云,趙雪花
(太原理工大學(xué)水利科學(xué)與工程學(xué)院,山西太原030024)
基于集對分析的馬爾可夫鏈入庫流量分布特征動態(tài)分析
李愛云,趙雪花
(太原理工大學(xué)水利科學(xué)與工程學(xué)院,山西太原030024)
不確定性問題具有隨時間動態(tài)變化,且具有多樣性、變異性和復(fù)雜性及不精確性。其中許多不確定性問題呈現(xiàn)某種趨勢的非平穩(wěn)隨機過程,即具有將來與過去無關(guān)的特性,而對這類問題的預(yù)測研究采用基于集對分析的馬爾可夫鏈的動態(tài)預(yù)測模型。根據(jù)小浪底水庫1919年~1974年的入庫流量資料,應(yīng)用有序樣品聚類原理將入庫流量分成枯水、偏枯、中水、偏豐、豐水5種等級區(qū)間;以各滯時步長馬爾可夫鏈的集對權(quán)重,預(yù)測 1973年~ 1974年的入庫流量,將其所在狀態(tài)區(qū)間與實測值進行對比。結(jié)果表明,基于集對分析的馬爾可夫鏈模型對小浪底水庫入庫流量預(yù)測精度較高。
集對分析;馬爾可夫鏈;入庫流量;馬氏性檢驗
受到眾多因素的影響,年徑流預(yù)測具有很大的不確定性,且年徑流的預(yù)測因子的結(jié)構(gòu)是動態(tài)復(fù)雜的,其具有多樣性、變異性及不精確性。長期以來,水文預(yù)測工作者依據(jù)大量的實測水文資料,努力嘗試尋求水文資料的各種關(guān)系。包括:在時間演變過程中前后關(guān)系;與主要影響因素的關(guān)系;空間分布上各種要素的關(guān)系。通過這些關(guān)系以達到對水文資料的分析計算、預(yù)測、評價及決策[1-3]。馬爾可夫于1907年提出的馬爾可夫鏈預(yù)測方法,根據(jù)狀態(tài)之間的轉(zhuǎn)移概率來推算系統(tǒng)未來的發(fā)展趨勢。Zekai Sen應(yīng)用馬爾可夫鏈對洪水來水情況進行預(yù)測[4-5],預(yù)測結(jié)果合理可靠。本文應(yīng)用集對分析原理分析原序列和各滯時后的序列之間的確定性和不確定性,提高馬爾可夫鏈權(quán)重的確定,探討集對分析與馬爾可夫鏈的耦合動態(tài)預(yù)測模型。
1.1 步驟1——劃分狀態(tài)空間
先把樣本序列從小到大進行排序,再根據(jù)有序樣品聚類法的方法來劃分入庫流量變化區(qū)間,這樣可以充分地考慮徑流序列的數(shù)據(jù)結(jié)構(gòu)。即確定了馬爾可夫鏈的狀態(tài)空間。其基本原理為:如果用數(shù)據(jù)x1,x2,…,xn表示N個有序的樣品,則每一類一定是這樣的形式:{xn,xn+1,…,xn+k}。其中,1≤n≤N,k≥0且n+k≤N。也就是同類樣品一定是相互近鄰的。有序聚類的Fisher的算法如下:把序列x1,x2,…,xn按某一歸類{xn,…,xm},m≥n。定義均值向量
(1)
式中,m(也稱狀態(tài))為序列x的個數(shù),m也稱之為狀態(tài);n與n+k是屬于N個有序樣品的個數(shù),但均小于N;k是滯時。
各變量間的差異性用以下面模型來衡量。即
(2)
式中,D(n,m)是分類的直徑,其值的大小與段內(nèi)變量之間的差異有關(guān),其值越小表示段內(nèi)變量的差異越??;反之,則表示差異越大。xt表示在t時刻的序列值。
1.2 步驟2——確定各滯時步長的集對權(quán)重
將n個有序變量分為f類,其分法為P(n,f):{m1,m1+1,…,m2-1}; {m2,m2+1,…,m3-1};…,{mK,mK+1,…,mn}。其分類誤差為
(3)
L[P(n,f)]最小時就是最優(yōu)分割法。f一般可以根據(jù)L[P(n,f)]和f的關(guān)系曲線圖確定,曲線拐點處的f值即為最優(yōu)分類數(shù)。
如原樣本序列狀態(tài)空間A=[x1,x2,…,xN],則原樣本序列滯時k指延遲的時間,亦即滯時步狀態(tài)空間為Bk=[xk+1,xk+2,…,xN](k=1,2,…,K)。將集合A分別與集合Bk構(gòu)成集對H(A,Bk)進行同異反分析,得出相應(yīng)的聯(lián)系度表達式。這里把研究對象分成5類,把元素處于同一等級的定義為相同,其個數(shù)是S;相差一級的(如Ⅰ與Ⅱ,Ⅱ與Ⅲ)定義為差異一,其個數(shù)是F1;相差兩個等級(如Ⅰ與Ⅲ,Ⅱ與Ⅳ)的定義為差異二,其個數(shù)是F2;相差三個等級及其以上(如Ⅰ與Ⅳ,Ⅱ與Ⅴ)定義為相反,其個數(shù)是P,相應(yīng)的聯(lián)系數(shù)
(4)
式中,μk∈[-1,1]。為了求得指標(biāo)權(quán)重,需要對聯(lián)系數(shù)進行轉(zhuǎn)換。即
Uk=0.5×μk+0.5
(5)
式中,Uk是相對聯(lián)系數(shù)值,其取值范圍為[0,1]。滯時k步的馬爾可夫鏈的權(quán)重
(6)
式中,K為最大滯時階數(shù)。
1.3 步驟3——馬氏性檢驗
設(shè)為1步狀態(tài)轉(zhuǎn)移頻率矩陣,于是
(7)
當(dāng)N較大時,統(tǒng)計量
(8)
1.4 步驟4——預(yù)測概率
(9)
根據(jù)max{Pm|m=1,2,…,M}所對應(yīng)的狀態(tài),作為該時段入庫流量的預(yù)測狀態(tài)。待該時段之后,將其帶入到原來的序列之中,再重復(fù)以上步驟即可預(yù)測下時段指標(biāo)值狀態(tài)。
現(xiàn)以1919年~1972年的資料預(yù)測1973年的入庫流量,其步驟如下。
2.1 確定馬爾可夫鏈的狀態(tài)空間
把1919年1972年的入庫流量(見表1)按從小到大的順序排列,按最優(yōu)分割法求出誤差函數(shù)L[P(n,e]與分類數(shù)e關(guān)系(見圖1)。根據(jù)圖1,把入庫流量分為5個等級區(qū)間比較合理(見表2)。
2.2 計算馬爾可夫鏈的權(quán)重
按1.2確定各滯時步長的馬爾可夫鏈的集對權(quán)重。由表2可得,原入庫流量的狀態(tài)序列A=[x1,x2,…,xN]分別與原入庫流量k步滯時的狀態(tài)序列Bk=[xk+1,xk+2,…,xN](k=1,2,…,K)構(gòu)成集對
表1 1919年~1972年入庫流量序列及狀態(tài) m3/s
圖1 誤差函數(shù)L[P(n,e)]與分類數(shù)e關(guān)系
表2 入庫流量等級區(qū)間劃分 m3/s
H(A,Bk)(k=1~5)進行同異反分析,得出相應(yīng)的聯(lián)系度表達式
μ1=0.3208+0.4151i1+0.1509i2+0.1132j
μ2=0.3269+0.3846i1+0.1731i2+0.1154j
μ3=0.3725+0.3333i1+0.1961i2+0.0981j
μ4=0.26+0.34i1+0.26i2+0.14j
依據(jù)經(jīng)驗,取i1=0.5,i2=-0.5,j=-1得出聯(lián)系數(shù)Uk=(0.3397,0.3172,0.343,0.16,0.2245),由式(5)得到相對聯(lián)系度數(shù)值Uk=(0.6698,0.6586,0.6715,0.58,0.6122),再根據(jù)式(6)得到各滯時步長的馬爾可夫鏈的權(quán)重ωk=(0.2098,0.2063,0.2104,0.1817,0.1918)。
2.3 馬氏性檢驗
通過統(tǒng)計得出各種步長的狀態(tài)轉(zhuǎn)移概率矩陣為
2.4 入庫流量預(yù)測
根據(jù)1968年~1972年的入庫流量及對應(yīng)的狀態(tài)轉(zhuǎn)移矩陣對1973年的入庫流量進行預(yù)測(見表3)。
將max{Pm}=0.343,這時m=2,也就是1973年的入庫流量預(yù)測狀態(tài)為Ⅱ為偏枯年(152≤X<226 m3/s),與1973年的入庫流量197 m3/s相吻合。
同理,以1969年~1973年的入庫流量資料,按照上面的步驟預(yù)測1974年的年徑流狀態(tài)(見表4)。
將max{Pm}=0.313,這時m=2,也就是1974年的入庫流量預(yù)測狀態(tài)為Ⅱ為偏枯年(152≤X<226 m3/s),與1974年的入庫流量224 m3/s相吻合。
表3 1973年入庫流量預(yù)測
表4 1974年入庫流量預(yù)測
2.5 各步長馬爾可夫鏈的特性分析[7-8]
由于入庫流量的馬爾可夫鏈狀態(tài)是相通的,即m?n(m,n∈E,m≠n),并且是非周期的,其全部狀態(tài)構(gòu)成一個閉集C,即為該鏈的狀態(tài)空間E。通過分析該鏈?zhǔn)潜闅v的(非周期、不可約、正常返)。根據(jù)遍歷原理,此鏈存在唯一的極限分布。即
(10)
利用小浪底水庫1919年~1972年的資料,以相對聯(lián)系度最大的步長為2的馬爾可夫鏈的特性分析,應(yīng)用公式(10)求出極限分布,并根據(jù)極限分布可以求出各狀態(tài)的重現(xiàn)期,即Tm=1/πm,結(jié)果見表5。
表5 馬爾可夫鏈的極限分布與各狀態(tài)的重現(xiàn)期
由表5可見,各狀態(tài)的重現(xiàn)期為T1=9.74,T2=4.33,T3=3.81,T4=4.75,T5=5.17。根據(jù)現(xiàn)有的實測資料,由本文有序樣品聚類確定的分類標(biāo)準(zhǔn)及表5中的概率值分析,出現(xiàn)偏枯、中水和偏豐年的概率最大,總概率為0.704。
應(yīng)用實例結(jié)果表明,基于集對馬爾可夫鏈對入庫流量分布特征進行動態(tài)分析可有效分析徑流序列的內(nèi)在規(guī)律,使劃分的年徑流區(qū)間更合理;由于集對權(quán)重的馬爾可夫鏈預(yù)測模型能充分考慮到原序列狀態(tài)和滯時k步后序列狀態(tài)之間的確定及不確定關(guān)系,有利于提高預(yù)測精度。
[1]王文圣, 李躍清, 金菊良, 等. 水文水資源集對分析[M]. 北京: 科學(xué)出版社, 2010.
[2]覃光華, 宋克超, 周澤江, 等. 基于 WA-GRNN 模型的年徑流預(yù)測[J]. 四川大學(xué)學(xué)報: 工程科學(xué)版, 2013.
[3]趙永龍, 丁晶. 相空間小波網(wǎng)絡(luò)模型及其在水文中長期預(yù)測中的應(yīng)用[J]. 水科學(xué)進展, 1998, 9(3): 252-257.
[4]SEN Z. Critical Drought Analysis by Second Order Markov Chain[J]. Journal of Hydrology, 1990, 120(1-4): 183-202.
[5]夏樂天, 馬爾可夫鏈預(yù)測方法及其在水文序列中的應(yīng)用[D]. 南京: 河海大學(xué), 2005.
[6]汪明武, 金菊良, 周玉良. 集對分析耦合方法與應(yīng)用[M]. 北京: 科學(xué)出版社, 2014.
[7]夏樂天, 梅雨強度的指數(shù)權(quán)馬爾可夫鏈預(yù)測[J]. 水利學(xué)報, 2005, 36(8): 988-993.
[8]潘剛, 蘆冰, 鄒兵, 等. 馬爾可夫鏈在水庫主汛期降雨狀態(tài)預(yù)測中的應(yīng)用[J]. 水利科技與經(jīng)濟, 2011, 17(6): 33-36.
(責(zé)任編輯 陳 萍)
Dynamic Analysis of Inflow Distribution by Using Markov Chain Based on Set Pair Analysis
LI Aiyun, ZHAO Xuehua
(College of Water Conservancy, Taiyuan University of Technology, Taiyuan 030024, Shanxi, China)
The uncertainty has a dynamic process over time and it also has diversity, variability, complexity and imprecision. Many uncertainties present a trend of non-stationary random process, which has a feature of no relationship between future and past. For forecasting this type of uncertainty problem, the dynamic analysis model based on Markov Chain of Set Pair Analysis is used in here. According to the actual inflow data of Xiaolangdi Reservoir from 1919 to 1974, the principle of sequence sample cluster is used to divide the inflow sequence into five conditions, including drought, lean drought, normal, lean wet and wet, and then the inflow of Xiaolangdi Reservoir in 1973-1974 is forecasted by the set pair weights of Markov Chain with different lag time steps. The forecasting results are compared with actual measured data. The comparison shows that the Markov Chain model based on Set Pair Analysis can predict the inflow of Xiaolangdi Reservoir with higher precision.
Set Pair Analysis; Markov Chain; reservoir inflow; Markov property testing
2015-12-21
山西省科技攻關(guān)基金資助項目(20140313023-4)
李愛云(1977—),女,山西陽泉人,講師,碩士,主要從事水文預(yù)報研究與教學(xué)工作.
TV122.5
A
0559-9342(2016)11-0016-04