朱 聰,王文圣,程開宇,楊 娟
(1.中國水電顧問集團華東勘測設計研究院,浙江 杭州 310014;2.四川大學水利水電學院,四川 成都 610065)
月徑流的變化常常受多種因素的影響,這些因素與月徑流之間存在著復雜的非線性關系。在月徑流展望預測 (即根據歷史月徑流資料,同時預測下一年各月的月平均徑流量)中,常用的統(tǒng)計方法很難描述多因子間的復雜關系。常規(guī)統(tǒng)計預測方法的一個共同特點是:先對數據的分布特征作某種假定,再按照一定準則尋找最優(yōu)模擬,最后對建立的模型進行證實。由于過于形式化、數學化,受束縛大,該類方法對月徑流這類高維非線性、非正態(tài)系統(tǒng)的適應能力不強。
針對上述問題,近20年來,國際統(tǒng)計界提出了“直接從審視數據出發(fā)—通過計算機分析模擬數據—設計軟件程序檢驗”這樣一條探索性數據分析方法,投影尋蹤 (Projection pursuit,PP)方法就是這類方法的突出代表。投影尋蹤技術[1-2]是一種處理多因素復雜問題的統(tǒng)計方法,其基本思路是:把高維數據通過某種組合投影到低維子空間上,對于投影的構形,采用投影指標函數來衡量投影顯現某種結構的可能性大小,尋找出使投影指標函數達到最優(yōu)(能反映高維數據結構或特征)的投影值,然后根據該投影值分析高維數據的結構特征,或根據該投影值與研究系統(tǒng)輸出值之間的散點圖,構造適當的數學模型,來預測系統(tǒng)的輸出。
本文基于投影尋蹤分析與隨機分析提出了一種新的耦合預測模型:運用投影尋蹤技術將年內12個月徑流由遺傳算法優(yōu)化得投影值,獲取投影值與年徑流的相關關系;建立年徑流預測模型,由預測的年徑流推算對應的投影值;尋找與最近鄰的h個模式,由最近鄰回歸進行年內月徑流展望預測。將耦合模型應用于寶珠寺水電站和三峽水電站入庫月徑流展望預測,研究結果表明該耦合模型可行且預測效果較好。
設 Q0i,j(i=1,2,…,n;j=1,2,…,12),為i年j月徑流量;n為年數;y0i為i年徑流量。建立耦合模型的步驟如下。
(1)數據歸一化
式中,Q0j,max為j月徑流最大值;ymax為年徑流最大值;Qi,j、yi分別為歸一化月、年徑流。
(2)線性投影。將12維月徑流量投影到一維線性空間,得到投影指標值
式中,zi為 i年投影特征值;=(a1,a2,…,a12)T為投影方向。
其相關關系可視具體情況而定。
(4)對年徑流建立預測模型,并預測來年年徑流量y^。本文采用最近鄰抽樣回歸模型[4]進行預測,最近鄰抽樣回歸模型思路:構造特征矢量Dt=(yt-1,yt-2, …, yt-p), 相應后續(xù)值 yt(t=p+1, p+2, …,n);在Dt中,尋找k個與當前特征矢量Di最近鄰(根據 Dt和Di間的歐式距離來判斷)的特征矢量D1(i),D2(i),…,Dk(i);用下式計算 Di的后續(xù)值
式中,Wj(i)為抽樣權重。
式中,Q0l,j為抽取的第 l年各月徑流分配模式;Wl(j)為第j個月、第l個分配模式對應的抽樣權重,算法如式(7)。
以寶珠寺水電站的入庫代表站三磊壩站38年(1964年~2001年)的年、月徑流資料為例。用其前34年(1964年~1997年)的月徑流資料建立模型,計算得到最優(yōu)投影方向=(0.065 2,0.128 9,0.161 0,0.208 2,0.213 6,0.198 0,0.207 9,0.440 9,0.484 9,0.248 0,0.426 9, 0.329 5), 并計算其投影指標值{zi}34, 建立zi與歸一化年徑流量 yi的關系:zi=2.441yi+0.126。其相關關系非常密切,見圖1。
圖1 投影指標值與歸一化年徑流量的關系
本例中,年徑流預測最近鄰數k=4,月徑流展望預測最近鄰數h=4。取后4年(1998年~2001年)作為檢驗年,預測結果見表1及圖2。
表1 寶珠寺水電站1998年~2001年徑流預測結果
圖2 1998年~2001年月平均流量展望預測過程
類似地,用宜昌站前46年(1950年~1995年)月徑流資料建模,計算得最優(yōu)投影方向?a=(0.331 8,0.210 9, 0.455 4, 0.569 2, 0.435 0, 0.141 0,0.178 4, 0.072 8, 0.012 0, 0.204 9, 0.122 7,0.103 2),得到各年投影指標值 {zi}46。建立zi與歸一化年徑流量yi的關系:zi=1.246yi+0.973。
本例中,年徑流預測的最近鄰數k=4,月徑流展望預測的最近鄰數h=2。展望預測后5年(1996年~2000年)月徑流量,結果見表2和圖3。
表2 三峽水電站1996年~2000年年徑流預測結果
圖3 1996年~2000年月平均流量展望預測過程
模型計算結果分析如表3。耦合模型在寶珠寺水電站應用中,雖然投影值與年徑流關系密切,但由于采用的月徑流資料是一個小水文站前的資料,年際變化較大,使得預測效果一般;而在三峽水電站應用中,采用的月徑流資料年際變化與小站的資料相比,比較穩(wěn)定,模型預測效果較好。其次,從圖3可以看出,預測過程會與其他模型類似,非汛期預測效果較好,汛期的預測效果較差,尤其在第一個例子中,某些年份還在汛期出現雙峰,年際變化復雜,使預測精度下降,但年內月徑流展望預測本身具有一定的難度,原因在于月徑流分配形式取決于未來一年各月各日的降水量。而兩個例子都顯示,遇見期為1年時,該模型能較好地擬合出月徑流變化趨勢,展望預測效果較好。
表3 耦合模型月平均流量展望預測階段誤差
將投影尋蹤回歸分析與隨機分析相結合建立了一種新型耦合模型,該模型計算步驟簡潔合理,具有較強的理論性和較高的穩(wěn)健性。將耦合模型應用于月徑流展望預測實例研究,結果表明是可行的。
[1]金菊良,魏一鳴,丁晶.投影尋蹤門限回歸模型在年徑流預測中的應用[J].地理科學,2002,22(2):171-175.
[2]王順久,張欣莉,丁晶,等.投影尋蹤聚類模型及應用[J].長江科學院院報,2002,19(6):53-55.
[3]金菊良,丁晶.水資源系統(tǒng)工程[M].四川科學技術出版社,2002:65-67,162-163.
[4]王文圣,向紅蓮,丁晶.最近鄰抽樣回歸模型在水文水資源預報中的應用[J].水電能源科學,2001,19(2):8-10,14.