王 超,楊紹瓊,楊發(fā)瑞,周東俊,趙江艷,謝 平
(1.云南省水文水資源局,昆明 650106;2. 昆明市水文水資源局,昆明 650103;3.昆明市松華壩水庫(kù)管理處,昆明 650201;4.武漢大學(xué) 水資源與水電工程科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,武漢 430072.)
瀾滄江是我國(guó)西南的國(guó)際河流之一,發(fā)源于青藏高原之唐古拉山北麓,國(guó)境內(nèi)先后流經(jīng)青、藏、滇三省。瀾滄江天然落差1 768 m,水能資源極為豐富,中下游具有一定的通航能力,云南境內(nèi)建有思茅港和景洪港兩個(gè)港口。瀾滄江素有“黃金水道”之美譽(yù),中、老、緬、泰、柬、越等六國(guó)為之相連,全長(zhǎng)4 900 km。由于其特殊的、重要的地理位置,發(fā)展其國(guó)際航運(yùn)有利于加強(qiáng)我國(guó)和東盟國(guó)家的經(jīng)濟(jì)合作等外交關(guān)系[1],有助于帶動(dòng)云南省的經(jīng)濟(jì)發(fā)展。
瀾滄江流域主要為西南季風(fēng)控制,徑流主要來(lái)源于上游的冰雪融水和季風(fēng)給中下游帶來(lái)的降水,大氣環(huán)流是影響徑流變化的主要因素。瀾滄江干濕季分明,5-10月為雨季,集中了77%以上的徑流量。在全球增暖的大背景下,瀾滄江年降水量、濕潤(rùn)指數(shù)均呈現(xiàn)震蕩中下降的趨勢(shì),1951-2008年瀾滄江年降水量下降46.4mm,氣溫約按0.15℃/10a的速度小幅上升,二者的變化對(duì)徑流影響也較為明顯[2,3],也是2009-2013年瀾滄江流域干旱的原因之一。近年來(lái)瀾滄江上的梯級(jí)水電站逐步建成,人類活動(dòng)影響顯著,由于梯級(jí)電站的調(diào)豐補(bǔ)枯,徑流的年內(nèi)變化幅度有所減小,對(duì)航運(yùn)水量、補(bǔ)償河道生態(tài)水量都有一定的調(diào)節(jié)和補(bǔ)充作用。
對(duì)于天然河道來(lái)講,水深是能否通航的重要條件之一,在其他條件不變的一般情況下,河道水深與流量成正比,因此,流量是影響河道通航的重要因素之一。由于受大環(huán)流的影響對(duì)于天然河道流量一般呈現(xiàn)季節(jié)性變化,年內(nèi)變化較大,最枯月平均流量通常只有年平均流量的幾分之一甚至更少,因此,開展河道的最枯月流量預(yù)測(cè)研究,對(duì)航運(yùn)保障具有重要的參考作用。
年最枯月流量,影響因子多,具有一定的周期性和較強(qiáng)的隨機(jī)性,準(zhǔn)確預(yù)測(cè)具有一定難度,李英晶[4-7]等學(xué)者運(yùn)用多元回歸、自回歸模型、前后期徑流相關(guān)法等對(duì)伊春河流域、密云水庫(kù)等枯水季來(lái)水量預(yù)報(bào)進(jìn)行了相關(guān)嘗試和研究,精度基本能滿足相關(guān)規(guī)范要求。年最枯月流量的預(yù)測(cè)影響因子較多,為解決個(gè)別預(yù)報(bào)因子噪聲影響較大的問題,本文利用奇異譜分析技術(shù)對(duì)隨機(jī)性較強(qiáng)的預(yù)報(bào)因子進(jìn)行主周期成分重構(gòu),與其他原始因子混合后,與PPR結(jié)合形成SSA-PPR模型,對(duì)云南省瀾滄江某站最枯月徑流進(jìn)行預(yù)測(cè),以分析其通航保障能力。
奇異譜分析,簡(jiǎn)稱SSA,是對(duì)具有非線性特征的時(shí)間序列進(jìn)行研究的一種行之有效的方法,它的思想是先重構(gòu)時(shí)間序列的成份,然后關(guān)聯(lián)經(jīng)驗(yàn)正交函數(shù),利用實(shí)測(cè)的時(shí)間序列,歸一化后構(gòu)造出軌跡矩陣,之后分解、重構(gòu)軌跡矩陣,最后提取得到不同的成分和信號(hào),并進(jìn)一步識(shí)別出長(zhǎng)期趨勢(shì)、強(qiáng)周期和白噪聲等成分,最后可對(duì)原始序列結(jié)構(gòu)進(jìn)行重構(gòu),目前,在各種時(shí)間序列的分析中也得到了大量應(yīng)用。奇異譜分析和重構(gòu)主成分,可以有效地去除時(shí)間序列中的噪聲,重生序列能夠較好地反映原始序列的特征[7,8]。其原理如下:
首先將所實(shí)際生產(chǎn)中實(shí)際觀測(cè)得到的時(shí)間序列數(shù)據(jù):x(t),t=1,2,…,n,選擇適當(dāng)?shù)拇翱陂L(zhǎng)度:m(2≤m≤n/2),轉(zhuǎn)化為二維時(shí)滯矩陣(或軌跡矩陣):
(1)
設(shè)其滯后協(xié)方差矩陣為S,它的特征值可表示為λ1≥λ2≥…≥λm≥0,即為{xi}的奇異譜,展開如下:
(2)
式中,i=1,2,…,N-M+1;j=1,2,…,M;Gkj為時(shí)間經(jīng)驗(yàn)正交函數(shù),akj為時(shí)間主分量。通過Gkj和akj進(jìn)一步計(jì)算xi重建成分xkj,公式如下:
(3)
逐一對(duì)各重建分量進(jìn)行分析,可識(shí)別各分量的振蕩周期,并根據(jù)貢獻(xiàn)的重要程度選擇前(從大到小排)y個(gè)奇異值,使他們的貢獻(xiàn)率之和大于一定閾值 (例如80%),再對(duì)原序列重構(gòu),以濾除原始序列的噪聲并顯示原始序列的主要變化特征。
投影尋蹤回歸法(Projection Pursuit Regression,PPR),是以直觀的低維空間投影來(lái)表現(xiàn)復(fù)雜的高維數(shù)據(jù),這種方法較好地解決了維數(shù)禍根和解決超高維等問題,效果較為明顯。PPR應(yīng)用領(lǐng)域日趨益廣泛,特別是在水文資源、水環(huán)境等各個(gè)方面均有嘗試,在洪水預(yù)報(bào)、徑流預(yù)報(bào)、降水預(yù)報(bào)、水資源評(píng)估、聚類分析、水質(zhì)評(píng)價(jià)等細(xì)分領(lǐng)域的應(yīng)用均得到深入開展[9-11]。PPR建模的原理主要如下[14]:
年最枯月流量f(x),非線性特征顯著,x為預(yù)測(cè)因子,a為投影向量,二者維數(shù)均w。首先要計(jì)算得到嶺函數(shù)族g(atx)。預(yù)測(cè)對(duì)象可用下式推求:
(4)
式中:g為嶺函數(shù);N為嶺函數(shù)的個(gè)數(shù)。N=1、g=1時(shí),式(4)就變?yōu)槠胀ǘ嘣貧w函數(shù)。嶺函數(shù)采用Hermite多項(xiàng)式進(jìn)行擬合,其投影回歸關(guān)系式為:
(5)
式中:m表示輸入樣本的個(gè)數(shù);j為多項(xiàng)式的階數(shù);c為多項(xiàng)式的系數(shù);yi為在方向a上的投影;h為正交多項(xiàng)式(Hermite),它們的分別表達(dá)為:
(6)
(7)
式中:φ(y)為標(biāo)準(zhǔn)高斯方程;j!代表多項(xiàng)式階數(shù)j的階乘;回歸預(yù)測(cè)建模最終轉(zhuǎn)化為求下式的最小化問題。
(8)
(9)
(i=1,2, …,m)
因此,投影尋蹤回歸預(yù)測(cè)的求解過程就轉(zhuǎn)化為優(yōu)選參數(shù)a、c和N。
目前,遺傳算法應(yīng)用最為廣泛,另外,螢火蟲法、差分法、粒子群法和仿生群智能算法(如蜘蛛群、蛾群、雞群等優(yōu)化算法[12,13])等也有很多探索研究,并取得了較好的效果,本文采用蜘蛛群算法確定最佳投影參數(shù),具體步驟可參考文獻(xiàn)[14]。
根據(jù)前述奇異譜分析和投影尋蹤回歸建模的原理,年最枯月流量預(yù)測(cè)建模的具體步驟如下。
(1)確定預(yù)測(cè)因子。利用相關(guān)分析方法確定最枯月徑流的預(yù)測(cè)因子。根據(jù)所能獲得的預(yù)報(bào)因子,計(jì)算最枯月徑流與各種因子不同延遲時(shí)段的相關(guān)系數(shù),選取相關(guān)系數(shù)最大且符合置信水平要求的延遲時(shí)段因子作為預(yù)報(bào)因子。
(2)對(duì)周期性較強(qiáng)且由于受人類活動(dòng)等噪聲影響較大的因子進(jìn)行奇異譜分析和重構(gòu)序列。其他影響因子采用原始觀測(cè)因子作為預(yù)報(bào)因子。
(3)按照文獻(xiàn)[14]用群居蜘蛛算法確定最佳投影參數(shù),得到最終投影尋蹤回歸模型及模擬和預(yù)測(cè)結(jié)果。
(4)根據(jù)水文情報(bào)預(yù)報(bào)規(guī)范(GB/T 22482-2008)對(duì)最枯月徑流預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
本文選取瀾滄江某站受人類活動(dòng)影響較小的1957-1999年共43年資料進(jìn)行驗(yàn)證,其中,1957-1994年共38年為訓(xùn)練期,后面5年為檢驗(yàn)期。瀾滄江某站最枯月徑流多出現(xiàn)在每年2月,故以2月平均流量作為預(yù)報(bào)對(duì)象。當(dāng)預(yù)測(cè)的2月平均流量低于瀾滄江通航最小流量時(shí),將無(wú)法正常通航,需通過一定的調(diào)度進(jìn)行保障。
由于在該流域及其附近缺少全面的氣象資料,所以大氣環(huán)流方面的資料僅能從相近地區(qū)收集而得,23個(gè)氣象因子名稱見表1。
根據(jù)瀾滄江流域2月份天氣系統(tǒng)物理方面的成因,分析各因子的位置及影響范圍,結(jié)合本流域與各因子的物理關(guān)系選取相應(yīng)的預(yù)報(bào)因子,首先從物理成因方面對(duì)各個(gè)影響因子進(jìn)行考察,通過考察后,為了使各預(yù)報(bào)因子與預(yù)報(bào)對(duì)象相關(guān)性更好,采用相關(guān)系數(shù)法逐一對(duì)因子進(jìn)行篩選。采用計(jì)算機(jī)智能挑選的方法確定各預(yù)報(bào)因子的提前期。置信度a取0.05,閥值Ra=0.31,相關(guān)系數(shù)小于0.31的因子予以舍棄。
為提高回歸分析的預(yù)測(cè)效果,在綜合平衡的前提下,將獨(dú)立性較差(相關(guān)性較好的一對(duì)因子其中之一)的因子去掉。最終選定的影響因子為因子2、因子4、因子9、因子19、因子20和因子23,同時(shí),由于汛期5-10月份徑流對(duì)后期最枯月徑流影響較大,與預(yù)報(bào)對(duì)象2月份平均流量相關(guān)性較好,故將其納入作為影響因子。由于汛期5-10月份徑流受水利工程開發(fā)、調(diào)度等人類活動(dòng)影響較大,數(shù)據(jù)白噪聲也較大,因此采用SSA方法對(duì)其進(jìn)行主成分重構(gòu),選取累積貢獻(xiàn)率達(dá)85%的前10項(xiàng)對(duì)其重構(gòu),以消除其白噪聲的影響,原始序列與重構(gòu)序列對(duì)比見圖1。
表1 預(yù)報(bào)因子序號(hào)、名稱對(duì)照表Tab.1 Forecast factor's number, name comparison table
圖1 影響因子(汛期徑流量)原始序列與重構(gòu)序列對(duì)比圖Fig.1 Influence factor (Runoff of flood season) comparison between original sequence and reconstructed sequence
通過對(duì)比可以看出,SSA重構(gòu)前后汛期徑流量趨勢(shì)一致性較好,由于去除了白噪聲等隨機(jī)性的影響,重構(gòu)之后的序列變化更加平穩(wěn),變幅略有變小。
為驗(yàn)證奇異譜分析前后對(duì)預(yù)測(cè)結(jié)果的影響,分別將因子2、因子4、因子9、因子19、因子20、因子23、汛期5-10月份平均流量原始序列,因子2、因子4、因子9、因子19、因子20、因子23、奇異譜分析重構(gòu)的汛期5-10月份徑流序列兩組因子分別用模型進(jìn)行模擬和預(yù)測(cè),詳見表2。
表2 PPR模型和SSA-PPR模型預(yù)測(cè)結(jié)果對(duì)比Tab.2 Comparison of Predicted Results
結(jié)果表明:瀾滄江訓(xùn)練期和檢驗(yàn)期SSA-PPR模型的平均絕對(duì)相對(duì)誤差、最大絕對(duì)相對(duì)誤差、最小絕對(duì)相對(duì)誤差三者均較PPR模型小,說(shuō)明SSA-PPR模型模擬和預(yù)報(bào)精度均較PPR模型高。SSA-PPR模型訓(xùn)練期平均絕對(duì)相對(duì)誤差、最大絕對(duì)相對(duì)誤差、最小絕對(duì)相對(duì)誤差分別為2.5%、7.4%和0.02%,檢驗(yàn)期分別為6.2%、17.5%和0.6%,檢驗(yàn)期預(yù)測(cè)精度低于訓(xùn)練期模擬精度。
根據(jù)PPR模型和SSA-PPR模型模擬和預(yù)測(cè)過程對(duì)比可以看出,SSA-PPR模型模擬和預(yù)測(cè)過程與實(shí)測(cè)序列過程更為吻合,起伏過程一致性更好,同時(shí)預(yù)測(cè)結(jié)果與實(shí)測(cè)過程均顯示總體呈現(xiàn)一個(gè)緩慢下降的趨勢(shì),與有關(guān)學(xué)者研究結(jié)論基本一致[19,20],詳見圖2。
圖2 PPR模型和SSA-PPR模型預(yù)測(cè)過程對(duì)比圖Fig.2 Comparison of Prediction Process between PPR Model and SSA-PPR Model
按水文情報(bào)預(yù)報(bào)規(guī)范(GB/T 22482-2008)評(píng)定標(biāo)準(zhǔn)[15],SSA-PPR模型預(yù)報(bào)總體合格率為88.7%,綜合精度評(píng)價(jià)為甲等??傮w上看SSA-PPR模型所預(yù)測(cè)的瀾滄江某站年最枯月流量精度滿足要求,效果較好。
上述成果經(jīng)過訓(xùn)練期與檢驗(yàn)期檢驗(yàn)分析有一定精度,但也主要基于不同要素的時(shí)間序列分析而得,因子之間物理聯(lián)系不明確,其成果存在一定不確定性。目前,瀾滄江流域由于受多級(jí)水電站影響,且各級(jí)電站水位、出入庫(kù)流量等監(jiān)測(cè)信息還未統(tǒng)一報(bào)送,因此還暫時(shí)不具備構(gòu)建流域水文模型的條件。在條件成熟時(shí)應(yīng)構(gòu)建水文模型,在多種方法相結(jié)合的基礎(chǔ)上綜合分析,進(jìn)一步提高預(yù)測(cè)成果可靠性。
為解決瀾滄江枯季通航能力預(yù)測(cè)實(shí)際問題,從影響枯水徑流的因子及枯水徑流序列出發(fā),提出了將影響因子與經(jīng)過奇異譜重構(gòu)的徑流周期因子相混合,并利用投影尋蹤回歸對(duì)瀾滄江枯水徑流進(jìn)行預(yù)測(cè);根據(jù)云南省某站(1957-1999年)的年最枯月流量資料預(yù)測(cè),結(jié)果表明:
(1)天然河道徑流量是影響瀾滄江通航的重要因素之一,由于受大環(huán)流的影響季節(jié)性強(qiáng),年內(nèi)變化較大,開展瀾滄江的最枯月徑流量進(jìn)行預(yù)測(cè)研究,對(duì)航運(yùn)保障具有重要的參考作用。
(2)訓(xùn)練期和檢驗(yàn)期SSA-PPR模型的平均絕對(duì)相對(duì)誤差、最大絕對(duì)相對(duì)誤差、最小絕對(duì)相對(duì)誤差三者均較PPR模型小;SSA-PPR模型模擬和預(yù)測(cè)過程與實(shí)測(cè)序列過程吻合更好,SSA-PPR模型預(yù)測(cè)效果總體更優(yōu)。
(3)SSA-PPR模型訓(xùn)練期平均相對(duì)誤差絕對(duì)值為2.5%,預(yù)測(cè)期平均相對(duì)誤差絕對(duì)值為6.2%;預(yù)報(bào)合格率較高,為88.7%,按預(yù)報(bào)標(biāo)準(zhǔn)評(píng)價(jià)其精度為甲等。SSA-PPR模型所預(yù)測(cè)的瀾滄江最枯月流量精度達(dá)到要求,可供瀾滄江枯季通航流量預(yù)測(cè)和調(diào)度使用。
(4)筆者提出SSA-PPR模型,在傳統(tǒng)的多元回歸基礎(chǔ)上為枯季通航流量預(yù)測(cè)增加了一種方法,但由于受水利工程調(diào)度的影響,實(shí)際工作中還要結(jié)合短期的預(yù)報(bào)對(duì)成果實(shí)時(shí)進(jìn)行修正,各部門應(yīng)加強(qiáng)瀾滄江流域梯級(jí)電站水文信息共享建設(shè),為構(gòu)建物理意義明確的流域水文模型創(chuàng)造條件,對(duì)預(yù)報(bào)的實(shí)際效果不斷驗(yàn)證并對(duì)方案逐步完善,提高預(yù)報(bào)成果的確定性,以滿足實(shí)際工作的需要。