白 鵬,龍秋波
(1.中國科學院地理科學與資源研究所陸地水循環(huán)及地表過程重點實驗室,北京 100101;2.湖南省水利水電勘測設計研究總院,湖南 長沙 410007)
用水量預測是水資源規(guī)劃及管理的重要基礎和依據(jù),也是保證供水系統(tǒng)安全運行和科學管理的有效手段[1-3]。用水量預測的方法有很多,根據(jù)對數(shù)據(jù)處理方式的差異,用水量預測通??煞譃闀r間序列法、結構分析法和系統(tǒng)分析法3類[4-6]。時間序列法主要是根據(jù)用水量周期性或規(guī)律性的變化特征進行統(tǒng)計分析,進而構建預測模型[7-9];結構分析法是通過分析城市用水量與各種相關因素(如人口、產(chǎn)值、糧食產(chǎn)量和氣候等)之間的聯(lián)系,構建用水量和關聯(lián)因素之間的統(tǒng)計模型,進行用水量預測[10];系統(tǒng)分析法不追究個別因素的作用效果,削弱隨機因素的影響,力求體現(xiàn)各因素對用水量規(guī)律的綜合作用[11-12]。上述3種方法各有優(yōu)勢和不足,目前還無法建立一個確定性模型對區(qū)域用水系統(tǒng)的復雜性進行描述。相比于其他兩種方法,時間序列法對用水系統(tǒng)外部復雜的影響因素進行簡化,不需要對影響用水量的因素進行預測,只考慮歷史用水量數(shù)據(jù)隨時間內(nèi)在變化規(guī)律,進而對整個系統(tǒng)的未來狀態(tài)做出預測[7-9]。該類方法比較符合用水量序列的特點,因而在用水量預測工作中應用較為廣泛。常見的時間序列預測法包括年增長率法、移動平均法、人工神經(jīng)網(wǎng)絡法和自回歸模型法等[13-14]。多種用水量預測方法的比較研究有助于識別最優(yōu)的方法,減少預測結果的不確定性。本文擬選擇京津冀地區(qū)為對象,對3種常用的年用水量時間序列預測方法進行比較,分析3種方法在京津冀地區(qū)年用水量預測中的適用性,為促進京津冀地區(qū)水資源的高效管理和規(guī)劃提供科學支持。
年增長率法是通過分析歷史的城市年用水量增長情況,計算出區(qū)域年用水增長率,從而根據(jù)現(xiàn)狀水平年的用水量預測出規(guī)劃年的用水量。該方法計算簡單,但需要收集長系列的歷史用水量數(shù)據(jù),在一些地區(qū)可能存在數(shù)據(jù)缺失、資料不全等問題[6]。年增長率法假定歷史年用水量數(shù)據(jù)序列符合特定的函數(shù)分布(如冪函數(shù)),常用的計算公式為
Wt+1=W0(1+R)n
(1)
式中:Wt+1為第t+1年的用水量;W0為現(xiàn)狀基準年用水量;R為城市用水量年平均增長率,本文中R的取值通過歷史用水量數(shù)據(jù)進行參數(shù)擬合求得;n為間隔年數(shù)。
當一個變量按時間順序排列的值之間具有依賴關系或自相關性時,就可以建立該變量的自回歸模型,并由此對其發(fā)展變化趨勢進行預測[15]。需要指出的是自相關性是建立自回歸模型的基礎,只有具有顯著自相關性的時間序列才可以建立自回歸模型。城市年用水量變化一般都比較緩慢,輕易不會發(fā)生突變,符合自回歸模型的構建基礎,該方法的優(yōu)點是所需資料少,可用自身變數(shù)數(shù)列進行預測。自回歸模型的方法有很多,本文選取門限自回歸模型進行研究。該模型能有效描述復雜的非線性動態(tài)系統(tǒng),由于門限的控制作用,該模型具有很強的穩(wěn)健性和適用性,常常被應用于在經(jīng)濟、環(huán)境、海洋、氣象等領域[16]。門限自回歸模型的基本思路是在觀測時間序列{Xt}的取值范圍內(nèi)引入n個門限值Tj(j=1,2,…,n),根據(jù)延遲步長d將{Xt}按{Xt-d}值的大小分配到不同的門限區(qū)域內(nèi),再用自回歸模型對不同區(qū)間內(nèi)的{Xt}序列進行擬合,從而對時間序列進行非線性動態(tài)描述,模型的一般形式[17-18]為
(2)
式中:Tj為門限值;Ztj為第j個相互獨立的正態(tài)白噪聲序列;a0j為第j個門限自回歸區(qū)間的自回歸系數(shù);mj為第j個門限區(qū)間自回歸模型的階數(shù)。
區(qū)域年用水量變化影響因素眾多,系統(tǒng)內(nèi)部的變化機理復雜且各類影響因素之間相互作用。人工神經(jīng)網(wǎng)絡方法具有自適應性、容錯性以及強大的映射能力,能夠大規(guī)模處理高度非線性復雜問題,能夠從大量的歷史數(shù)據(jù)中進行訓練,進而找出時間序列內(nèi)在的變化規(guī)律,因此被廣泛應用于區(qū)域的年用水量預測[19-20]。但是,人工神經(jīng)網(wǎng)絡方法內(nèi)部參數(shù)較多,易陷入局部最優(yōu)解,灰色預測方法可以很好地解決這些問題?;疑碚撌且环N研究既包含已知信息又包含未知信息的系統(tǒng)理論與方法,該理論以“小樣本”、“離散”、“無規(guī)律”的數(shù)據(jù)為主要研究對象,將雜亂無章的原始數(shù)據(jù)序列通過一定的處理方法,使之變?yōu)楸容^有規(guī)律的時間序列[21-22],能夠較好地弱化數(shù)據(jù)序列的波動性并處理隨機擾動因素。但是,灰色預測方法缺乏自學習和自組織能力,尤其是在對復雜的非線性系統(tǒng)進行預測時,因非線性系統(tǒng)的數(shù)據(jù)隨機性變化顯著,會產(chǎn)生很大的誤差?;疑斯ど窠?jīng)網(wǎng)絡充分利用了二者之間的差異性和互補性,充分發(fā)揮各自的優(yōu)勢[23]。二者結合的方式是利用神經(jīng)網(wǎng)絡對灰色模型GM(1,1)預測結果進行誤差修正,從而構建神經(jīng)網(wǎng)絡模型和灰色模型GM(1,1)的串聯(lián)式組合模型。本研究用到的神經(jīng)網(wǎng)絡模型為BP模型,隱含層個數(shù)為10。具體的計算步驟如下:①對時間序列進行歸一化處理,建立GM(1,1)模型;②基于GM(1,1)模型進行時間序列的預測;③計算觀測數(shù)據(jù)和預測數(shù)據(jù)的誤差;④將模型預測誤差序列作為神經(jīng)網(wǎng)絡模型的輸入項,對網(wǎng)絡進行訓練,確定網(wǎng)絡的權重和閾值,得到能夠反映預測值和誤差關系的網(wǎng)絡結構;⑤分別基于GM(1,1) 模型和神經(jīng)網(wǎng)絡模型預測下一時刻(t+1)的預測值及其偏差,二者之和即為t+1時刻的預測值;⑥重復步驟④,得到t+2,t+3,…,t+m時刻的預測值(m是預測年數(shù))。
京津冀一體化是黨中央、國務院做出的一項重大國家戰(zhàn)略部署,是實現(xiàn)京津冀三地優(yōu)勢互補、促進環(huán)渤海經(jīng)濟圈發(fā)展、帶動北方腹地發(fā)展的需要。京津冀地區(qū)可持續(xù)發(fā)展面臨的重大問題之一是經(jīng)濟社會發(fā)展水平和水資源量不匹配[24]。該地區(qū)是中國北方經(jīng)濟規(guī)模最大、最具活力的地區(qū),同時,也是我國缺水最嚴重的地區(qū)之一,人均水資源占有量約為全國平均值的1/9[25]。因此,京津冀地區(qū)的協(xié)調(diào)發(fā)展需要打破行政區(qū)域限制,以京津冀地區(qū)為統(tǒng)一體整體進行水資源規(guī)劃和管理,甄別適用于該地區(qū)的年用水量預測方法顯得尤為必要。本文的年用水量數(shù)據(jù)來源于京津冀三地的水資源公報,時間跨度均為1997—2018年(圖1)。由圖1可知,京津冀三地1997—2018年的用水量變化呈現(xiàn)出明顯不同的趨勢。北京市和天津市年用水量呈現(xiàn)先減少,而后緩慢增加的趨勢,而河北省年用水量呈波動下降趨勢。本文設置了不同的模型訓練期T(表1),如模型訓練年數(shù)為10,表示前10年數(shù)據(jù)用于模型訓練,其余年份的數(shù)據(jù)用于模型的驗證。預測結果評估指標為相對偏差,其正值表示模型高估年用水量,負值表示低估年用水量。不同訓練期的條件下基于最小二乘法擬合的京津冀年用水量年平均增長率見表1。
圖1 京津冀地區(qū)1997—2018年用水量變化
表1 不同訓練期下京津冀年用水量平均增長率
表2 不同訓練期下各模型年用水量模擬的相對誤差
表3 不同訓練期條件下各模型驗證期年用水量模擬的相對誤差
模型訓練期和驗證期,京津冀三地年用水量模擬的相對誤差見表2、表3。由表2可知,模型的誤差隨訓練期的增加而減少。以北京市為例,訓練期由10 a增加到18 a時,年增長率法的相對誤差由 -1.2%變?yōu)?.6%,自回歸模型法的相對誤差由3.4%減少到0.9%,灰色神經(jīng)網(wǎng)絡法的相對誤差變化最大,由-6.4%變?yōu)?.7%。在模型訓練期,年增長率方法在北京市明顯優(yōu)于其他兩種方法,但在模型驗證期,年增長率方法表現(xiàn)最差,可見訓練期的模型模擬結果并不能反映模型真實的預測能力。因此,本文基于驗證期的結果來評判3種模型的年用水量預測能力。由表3可見,3種模型的預測能力表現(xiàn)出明顯的區(qū)域分異性。在北京市和天津市,灰色神經(jīng)網(wǎng)絡法表現(xiàn)最好,自回歸模型法次之,而年增長率法表現(xiàn)最差。以18 a訓練期模型的預測結果為例,北京市3種模型(灰色神經(jīng)網(wǎng)絡法、自回歸模型法、年增長率法)預測結果的相對誤差分別為 -2.2%、-4.7%和-14.9%;在天津市,3種模型預測結果的相對誤差分別是-3.1%,-11.6%和-20.4%;在河北省,3種方法的預測誤差要明顯小于北京市和天津市。比較而言,灰色神經(jīng)網(wǎng)絡法略優(yōu)于年增長率法,二者均優(yōu)于自回歸模型法。
圖2為訓練期為18 a(1997—2014年)條件下,京津冀三地年用水量驗證結果。由圖2可見,年增長率法模擬和預測的年用水量近乎一條直線,這與真實的年用水量數(shù)據(jù)變化不一致,實際的年用水量序列通常呈明顯的年際波動。究其原因,可能是因為年增長率法采用單一的函數(shù)分布,很難有效地模擬年用水量的波動變化。自回歸模型法的預測誤差較大,而且與實際年用水量的變化趨勢不一致?;疑窠?jīng)網(wǎng)絡法不僅預測誤差較小且能夠很好模擬年用水量的年際波動,在年用水量呈非線性變化的地區(qū)優(yōu)勢明顯?;疑窠?jīng)網(wǎng)絡方法優(yōu)于其他兩種方法的原因可能在于其強大的非線性映射能力,使模型能夠快速捕獲時間序列中隱藏的趨勢信息,并建立穩(wěn)健的模型結構來進行趨勢的預測。因此,灰色神經(jīng)網(wǎng)絡法在京津冀三地年用水量預測中表現(xiàn)最好,建議將其作為該地區(qū)年用水量預測的優(yōu)選方法。
(a) 北京市
利用灰色神經(jīng)網(wǎng)絡法,對京津冀三地2019—2025年用水量進行預測。模型訓練數(shù)據(jù)均為1997—2018年的實際年用水量數(shù)據(jù)。模型預測結果見圖3,可見2019年后北京市年用水量總量趨于平穩(wěn),將維持2018年的用水規(guī)模,年際波動很小,平均變化速率為0.06億m3/a,2025年的用水量預測值為39.7億m3。天津市的用水量仍維持增加趨勢,但增速明顯放緩,平均速率為0.17億m3/a,2025年的用水量預測值為29.6億m3。河北省的用水量則仍維持下降態(tài)勢,平均的下降速率為-0.80億m3/a,2025年的用水量預測值為176.8億m3。
圖3 京津冀2019—2025年年用水量預測結果
時間序列預測模型的預測結果往往具有一定的不確定性,這是由時間序列預測模型的計算原理決定的。時間序列預測法的基本原理是承認事物發(fā)展的延續(xù)性,通過對過去的時間序列進行統(tǒng)計分析,推求出事物發(fā)展的趨勢,并采用數(shù)學方法消除時間序列中的隨機干擾,從而進行預測。基于時間序列的預測模型依賴于事件發(fā)生的先后順序,同樣大小的值改變順序后輸入模型產(chǎn)生的結果是不同的。如果未來有不可預測的突發(fā)事件(如大尺度、持續(xù)性的干旱),預測結果也會出現(xiàn)很大誤差,即如果各地實施有別于以往的產(chǎn)業(yè)結構調(diào)整、農(nóng)業(yè)和生活節(jié)水措施,年用水量預測的結果可能有較大誤差。即便如此,它仍然是一種簡便且有效的年用水量預測方法。
a. 京津冀三地1997—2018年的年用水量呈現(xiàn)出不同的變化趨勢,北京和天津地區(qū)的年用水量呈先減后增的非線性變化,而河北省年用水量呈波動遞減的趨勢。
b. 年增長率法、自回歸模型法和灰色神經(jīng)網(wǎng)絡法3種年用水量預測模型的比較結果表明,灰色神經(jīng)網(wǎng)絡方法在京津冀三地表現(xiàn)性最好,可推薦為該地區(qū)年用水量預測的首選方法。
c. 基于灰色神經(jīng)網(wǎng)絡方法的京津冀三地年用水量預測結果表明:2019—2025年,北京市年用水量將保持平穩(wěn),年際變化不大;天津市的年用水量將緩慢增長;河北省的年用水量將繼續(xù)下降。