吳新新
(新疆塔里木河流域希尼爾水庫管理局, 新疆 庫爾勒 841000)
?
基于改進(jìn)集對分析的新疆黃水溝年徑流預(yù)測
吳新新
(新疆塔里木河流域希尼爾水庫管理局, 新疆 庫爾勒841000)
【摘要】本文提出了以幾何形式表示集對的G-SPA模型,該模型以向量之間的夾角、相關(guān)系數(shù)、歐式距離以及向量的模為指標(biāo)對徑流集合建立對應(yīng)的指標(biāo)集合,將指標(biāo)集合的相似度作為判斷徑流集合相似度的依據(jù),其優(yōu)點是不僅考慮了徑流大小的相似性,而且考慮了徑流變化趨勢的相似性。將G-SPA預(yù)測模型應(yīng)用于新疆黃水溝年徑流量預(yù)測中,并分別與GRNN神經(jīng)網(wǎng)絡(luò)模型以及AR(2)模型的預(yù)測結(jié)果進(jìn)行了對比。結(jié)果表明:G-SPA模型預(yù)測的平均相對誤差為7.42%,預(yù)測結(jié)果優(yōu)于GRNN模型和AR(2)模型。
【關(guān)鍵詞】G-SPA模型; 預(yù)測; 年徑流; 黃水溝
集對分析(Set Pair Analysis,SPA)是我國學(xué)者趙克勤于1989年提出的一種利用聯(lián)系數(shù)處理不確定性的系統(tǒng)理論和方法[1]。目前,集對分析在水文水資源領(lǐng)域已經(jīng)有較多應(yīng)用,如:王紅芳等[2]將集對分析應(yīng)用于長江寸灘站年徑流的定量預(yù)測,并與模糊優(yōu)選預(yù)測結(jié)果進(jìn)行了對比,表明集對分析法具有計算簡單、關(guān)系結(jié)構(gòu)清晰、預(yù)測精度較高的特點;歐源等[3]提出了秩次集對分析預(yù)測模型,避免了量化標(biāo)準(zhǔn)的選取問題;王延亭等[4]提出了加權(quán)秩次集對分析模型,在計算聯(lián)系度與預(yù)測值時賦予了權(quán)重,使預(yù)測結(jié)果更合理有效。文獻(xiàn)[2- 4]共有的一個不足就是評價集合相似性時僅籠統(tǒng)地依靠徑流大小,并不能很好地體現(xiàn)徑流變化趨勢的相似性。為了既考慮徑流大小的相似,又考慮徑流變化趨勢的相似,更全面地利用徑流信息[5- 6],筆者將集對以幾何形式表示,將集對看作向量,提出了以幾何形式表示集對的集對分析(Geometric Set Pair Analysis,G-SPA)年徑流預(yù)測模型,并應(yīng)用于新疆黃水溝年徑流的預(yù)測中。
1年徑流預(yù)測的G-SPA模型
1.1模型原理
集對分析(SPA)是一種新的不確定性分析途徑[7],其基礎(chǔ)是集對。集對由存在一定聯(lián)系的一對集合構(gòu)成,其中一個集合用A表示,另一個集合用B表示,則集對可表示為H(A,B)。集對也可以用幾何形式表示[8]:一個向量表示集合A,另一個向量表示集合B,則下圖(以二維向量為例)表示一個集對H,這樣就可以從向量角度來研究集合之間的相似性,以幾何形式表示集對的集對分析就是G-SPA模型。用G-SPA模型進(jìn)行徑流預(yù)測時,首先需要確定A與B之間的相似性指標(biāo),然后用這些指標(biāo)構(gòu)成對應(yīng)集合的指標(biāo)集合A′、B′,即把集合A′、B′作為一個集對進(jìn)行處理,用聯(lián)系度表達(dá)式來描述:
(1)
式中,N為指標(biāo)集合的元素總數(shù);S為指標(biāo)集合中處于同一狀態(tài)的元素個數(shù);P為指標(biāo)集合中處于對立狀態(tài)的元素個數(shù);F為指標(biāo)集合中處于差異狀態(tài)的元素個數(shù);i為差異性系數(shù),在(-1,1)區(qū)間取值,或者作為差異性標(biāo)志符號;j為對立性系數(shù),在計算中j=-1,或者作為對立性標(biāo)志符號。
集對的幾何表示示意圖
令a=S/N,b=F/N,c=P/N,則式(1)可簡化為
(2)
式中,a表示兩指標(biāo)集合的同一性程度,稱為同一度;b表示兩指標(biāo)集合的差異性程度,稱為差異度;c表示兩指標(biāo)集合的對立性,稱為對立度;a+b+c=1。可以通過聯(lián)系度的大小來確定指標(biāo)集合的相似性,進(jìn)而確定對應(yīng)徑流集合的相似性,之后根據(jù)相似性對年徑流進(jìn)行預(yù)測。
1.2模型集合構(gòu)造
1.3模型關(guān)鍵技術(shù)
G-SPA模型的核心是如何在歷史集合中確定B的相似集合。相似性選擇有兩個關(guān)鍵:一是相似性指標(biāo)的選取,二是如何將這些指標(biāo)進(jìn)行量化。對于相似性指標(biāo)的選擇,筆者從年徑流變化特性考慮兩個集合的相似性,從而確定以下相似性指標(biāo):?向量之間的夾角;?向量之間的相關(guān)系數(shù);?向量之間的歐氏距離;?向量的模。前兩個指標(biāo)的物理意義是徑流變化的趨勢是否相似,后兩個指標(biāo)的物理意義是徑流大小是否相似。由于指標(biāo)的量化并沒有相應(yīng)的標(biāo)準(zhǔn),因此對量化標(biāo)準(zhǔn)系數(shù)進(jìn)行率定后再使用。
1.4模型計算步驟
a.已知年徑流序列(x1,x2,…,xm),構(gòu)造歷史集合、指標(biāo)集合、當(dāng)前集合及其對應(yīng)的后續(xù)值??紤]到年徑流序列的弱相依性,m值一般選4~6。
b.將指標(biāo)集合按均值離差法劃分為三級,對于落入一、二、三級標(biāo)準(zhǔn)區(qū)間的元素,分別記為“Ⅰ”“Ⅱ”“Ⅲ”。
c.對量化后的當(dāng)前指標(biāo)集合與歷史指標(biāo)集合進(jìn)行同一性、差異性、對立性分析,確定其聯(lián)系數(shù),按聯(lián)系數(shù)最大原則確定最相似集合,將其后續(xù)值或后續(xù)值的加權(quán)值作為預(yù)測值。
d.不斷調(diào)整各集合量化標(biāo)準(zhǔn)系數(shù),重復(fù)步驟b、c,求出不同標(biāo)準(zhǔn)下的平均相對誤差,將平均相對誤差最小時對應(yīng)的量化標(biāo)準(zhǔn)系數(shù)作為率定后的量化標(biāo)準(zhǔn)系數(shù)。
e.用上述率定后的量化標(biāo)準(zhǔn)系數(shù),按步驟a~c應(yīng)用于檢驗階段的徑流預(yù)測,得到預(yù)測值。
2模型應(yīng)用
黃水溝位于新疆和靜縣境內(nèi),為雨雪混合型河流。河流出山口(黃水溝水文站)以上流域面積4311km2,多年平均徑流量2.87億m3(1956—2013年系列)。黃水溝是和靜縣經(jīng)濟(jì)社會發(fā)展的主要水源,也是下游博斯騰湖重要補給源,對區(qū)域經(jīng)濟(jì)社會發(fā)展和生態(tài)環(huán)境起著不可忽視的作用。本文取弱相依性系數(shù)m為5,以1956—2005年的徑流量資料率定量化標(biāo)準(zhǔn)系數(shù),以2006—2013年為徑流預(yù)測檢驗階段。為了更全面地利用資料信息,量化標(biāo)準(zhǔn)系數(shù)的率定階段和檢驗階段均采用實時校正的方式進(jìn)行計算。
指標(biāo)集合的4個指標(biāo)分別為:?向量之間的夾角,指各歷史集合向量A與當(dāng)前集合向量B之間的夾角;?向量之間的相關(guān)系數(shù),指各歷史集合向量A與當(dāng)前集合向量B之間的相關(guān)系數(shù);?向量之間的歐氏距離,指各歷史集合向量A與當(dāng)前集合向量B之間的歐氏距離;?向量的模,指各歷史集合向量A的模和當(dāng)前集合向量B的模。對指標(biāo)集合進(jìn)行符號量化處理。計算指標(biāo)集合第j0個指標(biāo)的平均值、平均絕對離差dj0,對徑流指標(biāo)集合進(jìn)行量化(本文取a∈[0.1,1]、步長為0.01進(jìn)行循環(huán)試算),將集合的元素分為Ⅰ、Ⅱ、Ⅲ三類。平均值及平均絕對離差dj0的計算公式分別為
(3)
(4)
式中,i0——歷史集合與當(dāng)前集合的集合數(shù)之和。
得出率定后的量化標(biāo)準(zhǔn)系數(shù)a′為0.488,以a′=0.488為量化標(biāo)準(zhǔn)系數(shù)對2006—2013年的年均流量進(jìn)行預(yù)測,預(yù)測值與實測值的對比見表1,其平均相對誤差為7.42%,e(e為各年份年徑流預(yù)測相對誤差的絕對值)<10%的合格率為75%,e<20%的合格率為100%。從表1和表2可以看出,誤差較大的年份為2011年、2013年,原因是這兩年的徑流量較小,處于歷史序列的低值邊緣;G-SPA模型的預(yù)測結(jié)果優(yōu)于GRNN神經(jīng)網(wǎng)絡(luò)模型和AR(2)模型的計算結(jié)果。
表1 年均流量預(yù)測值與實測值對比
表2 不同模型預(yù)測結(jié)果對比
3結(jié)語
本文提出了以幾何形式表示集對的G-SPA年徑流預(yù)測模型,從徑流大小和變化趨勢兩方面考慮,建立了向量之間的夾角、向量之間的相關(guān)系數(shù)、向量之間的歐氏距離、向量的模4個評價徑流集合相似性的指標(biāo)。實例分析結(jié)果表明G-SPA模型有較好
的預(yù)測精度、實用性及合理性。今后可進(jìn)一步研究各指標(biāo)對相似性影響的權(quán)重問題,以提高預(yù)測精度。需要指出的是,該模型沒有考慮影響徑流的外在因素,難以預(yù)測未來出現(xiàn)的超出歷史徑流資料范圍的徑流。
參考文獻(xiàn)
[1]趙克勤.集對分析及其初步應(yīng)用[M].杭州:浙江科技出版社,2000.
[2]王紅芳,黃偉軍,王文圣.集對分析法在長江寸灘站年徑流預(yù)測中的應(yīng)用[J].黑龍江水專學(xué)報,2006,33(4):3-5.
[3]歐源,張瓊,王文圣.基于秩次集對分析的年徑流預(yù)測模型[J].人民長江,2009,40(3):63- 65.
[4]王延亭,王建群,張玉杰,等.基于加權(quán)秩次集對分析法的年徑流預(yù)報模型[J].水電能源科學(xué),2012,30(3):17-19.
[5]王強,趙軍.近50年氣候變化對托什干河徑流產(chǎn)生的影響[J].水利建設(shè)與管理,2007(4):73-75,72.
[6]努爾買買提·居買.和田河源流地表徑流特征分析[J].水資源開發(fā)與管理,2015(3):29-33,25.
[7]盧敏,張展羽,石月珍.集對分析法在水安全評價中的應(yīng)用研究[J].河海大學(xué)學(xué)報(自然科學(xué)版),2006,34(5):505-508.
[8]王紅芳,丁晶,王文圣.集對分析在頻率曲線擬合度定量評價中的應(yīng)用[J].水利水電技術(shù),2007,38(4):1-3.
[9]覃光華,宋克超,周澤江.基于WA-GRNN模型的年徑流預(yù)測[J].四川大學(xué)學(xué)報(工程科學(xué)版),2013,45(6):39- 46.
[10]王文圣,向紅蓮,丁晶.最近鄰抽樣回歸模型在水文水資源預(yù)報中的應(yīng)用[J].水電能源科學(xué),2001,19(2):9-14.
Forecast of annual runoff in Xinjiang Huangshuigou River based on improved Set Pair Analysis
WU Xinxin
(XinjiangTarimRiverBasinXinierReservoirAdministration,Korla841000,China)
Abstract:In the paper, G-SPA model representing set with geometry form is proposed. Corresponding index set is established for runoff collection by the model with angle between vectors, correlation coefficient, Euclidean distance and vector model as indexes. Index set similarity is regarded as basis for judging runoff set similarity. It has advantage that rainfall size similarity is considered on one hand, rainfall change trend similarity is considered on the other. G-SPA model forecast is applied in Xinjiang Huangshuigou River annual runoff forecast. They are respectively compared with GRNN neural network model and AR(2) model. The results show that average relative error of G-SPA model forecast is 7.42%. The forecast result is better than that of the GRNN model and AR(2) model.
Key words:G-SPA model; forecast; annual runoff; Huangshuigou River
中圖分類號:TV121
文獻(xiàn)標(biāo)志碼:A
文章編號:1005- 4774(2016)01-0065-03
DOI:10.16616/j.cnki.10-1326/TV.2016.01.018