張志博
(廣西大學土木建筑工程學院,廣西 南寧 530004)
水資源是國家穩(wěn)定、社會發(fā)展、人民幸福的重要基礎(chǔ)。隨著中國深化改革的推進,國民經(jīng)濟總產(chǎn)值得到進一步的提高,水資源的供需矛盾日益顯著,水資源合理配置顯得尤為重要[1]。在水資源配置的研究中,區(qū)域需水量預測是重要的前提,所以合理有效的需水量預測是區(qū)域水資源規(guī)劃的首要任務(wù)。目前國內(nèi)外采用的需水量預測方法比較多[2],主要包括單一方法和組合方法,單一方法分為傳統(tǒng)的預測方法和新型預測方法。傳統(tǒng)的預測方法有定額法[3]、線性回歸、多元回歸[4]、趨勢預測法[5]等,新型預測方法有神經(jīng)網(wǎng)絡(luò)法[6]、灰色預測法[7]等。單一預測方法和組合預測方法得出的需水量預測結(jié)果都是確定性,不能準確預測未來時段用水量的波動性,在實際供用水過程中會出現(xiàn)很多影響預測結(jié)果的不確定性因素,而區(qū)間預測能夠很好地反映需水量預測結(jié)果的不確定性[8]。本文在BP預測模型的基礎(chǔ)上,引入正態(tài)分布區(qū)間估計方法,以期更加準確的描述未來柳州市不同時段需水量的不確定性。
柳州市位于廣西中部偏東北,全市包括五區(qū)五縣,即城中區(qū)、魚峰區(qū)、柳南區(qū)、柳北區(qū)、柳江區(qū)五區(qū),柳城、三江、融安、融水、鹿寨五縣,國土面積18 592 km2。年平均降雨量在1 500~1 600 mm,全年降雨時空分布不均,在5—8月份降雨較多,地表水是其主要的供水水源。根據(jù)柳州市統(tǒng)計局統(tǒng)計,柳州市供水量基本維持在23億m3,供水量年際有一定的變化,主要是受降雨量、供水工程調(diào)蓄能力影響。供水結(jié)構(gòu)變化不大,以地表水供水為主。
BP神經(jīng)網(wǎng)絡(luò)[9]是一種應(yīng)用領(lǐng)域廣泛的預測模型,它通過模擬訓練得到輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的關(guān)系,再通過輸入新的數(shù)據(jù)得出模擬預測結(jié)果,是一種新型智能預測方法。它的學習過程主要包括以下4個部分,輸入模式順傳播、輸出誤差逆?zhèn)鞑ァ⒀h(huán)記憶訓練、學習結(jié)果判別[10]。一般情況下,需水預測應(yīng)用最多的三層BP神經(jīng)網(wǎng)絡(luò),它包括輸入層、隱含層和輸出層3部分[11]。在MATLAB運行環(huán)境下,三層BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建步驟如下。
a)數(shù)據(jù)的預處理。如果BP神經(jīng)網(wǎng)絡(luò)輸入、輸出數(shù)據(jù)范圍特別大,會導致神經(jīng)網(wǎng)絡(luò)收斂速度慢、訓練時間長。因此,在訓練神經(jīng)網(wǎng)絡(luò)前需要對原始數(shù)據(jù)進行歸一化處理,使得數(shù)據(jù)映射到[0,1]或[-1,1]或更小的范圍。本文選用premnmx函數(shù)對原始數(shù)據(jù)進行歸一化處理,使得歸一化后的數(shù)據(jù)映射到[-1,1]。
b)隱含層結(jié)點數(shù)的確定。隱含層結(jié)點數(shù)對BP神經(jīng)網(wǎng)絡(luò)訓練效果有很大的影響,如果隱含層結(jié)點數(shù)過多,會導致網(wǎng)絡(luò)訓練過慢且易陷入局部最優(yōu)。若隱含層結(jié)點數(shù)過少,則會導致網(wǎng)絡(luò)學習能力不足、無法實現(xiàn)輸入和輸出變量的映射關(guān)系[12]。隱含層結(jié)點數(shù)通常按式(1)確定:
(1)
式中n——輸入層節(jié)點數(shù);h——隱含層節(jié)點數(shù);m——輸出層節(jié)點數(shù);a——0~10的常數(shù)。
本文的輸入層結(jié)點數(shù)為5,輸出層結(jié)點數(shù)為1,取a=9,則代入式(1)得隱含層結(jié)點數(shù)h=11。
c)創(chuàng)建新的前向神經(jīng)網(wǎng)絡(luò)。本文選擇輸入層激活函數(shù)為“tansig”、輸出層激活函數(shù)為“purelin”,構(gòu)造了一個3層BP神經(jīng)網(wǎng)絡(luò)對需水量進行預測。采用梯度自動下降動量和自適應(yīng)lr算法“traingdx”訓練BP網(wǎng)絡(luò),目標誤差goal=10-3,學習率lr=0.035,最大迭代次數(shù)epochs=2000。函數(shù)構(gòu)造語句如下:
net=newff(minmax(P),[11,1],{‘tansig’,‘purelin’},‘traingdx’);
net.trainParam.show=50;
net.trainParam.lr=0.035;
net.trainParam.epochs=2000;
net.trainParam.goal=1e-3;
d)BP網(wǎng)絡(luò)訓練及仿真。調(diào)用TRAINGDM算法訓練BP神經(jīng)網(wǎng)絡(luò),并對BP網(wǎng)絡(luò)進行仿真,其算法語句如下:
[net,tr]=train(net,P,T);
A=sim(net,P);
a=postmnmx(A,mint,maxt);
(2)
(3)
(4)
可得μ的置信度為1-α的置信區(qū)間[14]為:
(5)
根據(jù)《柳州市水資源公報》和《柳州市統(tǒng)計年鑒》統(tǒng)計,柳州市的用水量主要集中在農(nóng)業(yè)、居民生活、工業(yè)等,本文初步選取7個因子作為柳州市需水量的影響因子,分別是柳州市常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資、有效灌溉面積、播種面積(表1)。通過SPSS軟件相關(guān)性分析得出這7個影響因子對用水量指標都有一定的影響(表2)。通過表3成分貢獻率可以發(fā)現(xiàn),前5個因子累計貢獻率達到99.924%。一般情況下,因子累計貢獻率達90%就很好的代表相關(guān)因子的影響。由表4的因子荷載矩陣可以看出常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資對第一主成分的相關(guān)系數(shù)都達到了0.95以上,所以選擇這5個影響因子作為主成分,并以此構(gòu)造BP模型的輸入樣本。
表1 柳州市統(tǒng)計數(shù)據(jù)
表2 各影響因子的相關(guān)系數(shù)矩陣
表3 主成分特征值和貢獻率
表4 主要因子的荷載矩陣
運用SPSS軟件對常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資與年份進行相關(guān)性分析,結(jié)果見表5??梢园l(fā)現(xiàn),常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資均與年份的相關(guān)系數(shù)分別為0.999、0.997、0.978、0.985、0.991,都接近于1,顯著性P值都小于0.01,表明此5個因子均與年份之間存在顯著線性關(guān)系。于是,繪制5個因子與年份的散點圖,見圖1—5。
表5 主成分因子與年份的相關(guān)性分析結(jié)果
圖1 常住人口與年份散點擬合
圖2 國內(nèi)生產(chǎn)總值與年份散點擬合
圖3 工業(yè)生產(chǎn)總值與年份散點擬合
圖4 農(nóng)業(yè)生產(chǎn)總值與年份散點擬合
圖5 固定資產(chǎn)投資與年份散點擬合
由散點圖可以看出,各影響指標和年份之間有良好的線性擬合關(guān)系。擬合優(yōu)度是回歸分析的決定參數(shù),可以表明自變量與因變量形成的散點與回歸曲線的接近程度[15]。通過SPSS回歸分析:常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資在回歸模型中的擬合優(yōu)化度分別為R2=0.998、0.993、0.957、0.969、0.981,調(diào)整后擬合優(yōu)化度R2=0.997、0.993、0.953、0.966、0.979,得出回歸直線對實際值擬合效果較好。另外,由輸出變異系數(shù)表(ANOVA)可知各模型統(tǒng)計量F值分別為4 004.230、1 464.204、222.460、315.332、523.761,顯著性P值均小于0.01,表明顯著性效果很好,模型具有統(tǒng)計學意義。于是對2020、2025年數(shù)值進行回歸預測分析,結(jié)果見表6。
表6 2020、2025年輸入層各指標預測值
為了盡量減少樣本量少而引起的系統(tǒng)過擬合等隨機因素導致的誤差對預測結(jié)果的影響[15],將柳州市2007—2016年統(tǒng)計數(shù)據(jù)作為訓練數(shù)據(jù),2017、2018年統(tǒng)計數(shù)據(jù)作為檢驗數(shù)據(jù),檢驗BP神經(jīng)網(wǎng)絡(luò)預測的相對誤差,并挑選相對誤差小于2%的100個BP神經(jīng)網(wǎng)絡(luò)預測模型,對2020、2025年柳州市需水量進行預測。
由表7和圖6、7可以發(fā)現(xiàn),通過BP模型得出的預測結(jié)果滿足正態(tài)性。由于2020年預測結(jié)果的偏度為-0.069、偏度標準差為0.241,偏度值約等于0。2025年的預測結(jié)果的偏度為0.609,偏度標準差為0.241,偏度值大于0、偏度的絕對值約為其標準差2.53倍。通過查閱相關(guān)資料,偏度大于0為正偏態(tài),偏度小于0為負偏態(tài),偏度約等于0為正態(tài)。偏度的絕對值為其標準值的2~3倍,偏度大于0,則此為輕度正偏態(tài)分布,反之,偏度值小于0,為輕度負偏態(tài)分布。偏態(tài)的絕對值為其標差的3倍以上,偏度值大于0,為中度正偏態(tài)分布,偏度值小于0,為中度負偏態(tài)分布。因此,2020年的預測結(jié)果服從正態(tài)分布,2025年的預測結(jié)果服從輕度正偏態(tài)分布。
表7 預測結(jié)果統(tǒng)計值
圖6 2020年預測結(jié)果頻率分布
圖7 2025年預測結(jié)果頻率分布
當數(shù)據(jù)的分布服從輕度正偏態(tài)分布時,可以考慮用自然數(shù)對數(shù)(ln)或以10為底的對數(shù)(lg)對其數(shù)據(jù)進行轉(zhuǎn)化,使其數(shù)據(jù)服從正態(tài)分布,便于對數(shù)據(jù)進行分析。但是,以10為底的對數(shù)(lg)的糾正力度較強,2025年預測數(shù)據(jù)的偏度絕對值為其標準值的2.53倍,所以采用自然對數(shù)(ln)對其進行轉(zhuǎn)換。轉(zhuǎn)換的SPSS語句為new_X=LN(Z),轉(zhuǎn)化后的統(tǒng)計結(jié)果為偏度為0.536,偏度的標準誤差為0.241,峰度為0.235,峰度的標準誤差為0.478。偏度的值小于1,并且轉(zhuǎn)換后的偏度值小于轉(zhuǎn)換前,在一定程度上改善偏態(tài)分布,可近似認為轉(zhuǎn)換后2025年預測數(shù)據(jù)服從正態(tài)分布。頻率分布見圖8。
圖8 正態(tài)變換后2025年預測結(jié)果頻率分布
通過SPSS軟件對數(shù)據(jù)進行分析,得出表8預測結(jié)果描述統(tǒng)計值。因為抽取的100組2020、2025年預測結(jié)果服從正態(tài)分布,根據(jù)統(tǒng)計學以樣本估計總體知識可知,2020、2025年BP模型預測結(jié)果服從正態(tài)分布。根據(jù)正態(tài)分布總體均值區(qū)間估計方法可得:在置信度95%的情況下,柳州市2020、2025年需水量預測結(jié)果分別為21.478億~21.622億m3、21.813億~22.023億m3。
表8 預測結(jié)果描述統(tǒng)計
與傳統(tǒng)的預測模型相比,本文將確定性方法與不確定性方法相結(jié)合,在滿足預測方法相對誤差小于2%的前提下,提取100個抽樣預測結(jié)果,通過SPSS頻率分布描述統(tǒng)計,發(fā)現(xiàn)預測結(jié)果服從一定的正態(tài)分布。結(jié)合正態(tài)分布的區(qū)間估計,得出在置信水平95%的情況下2020、2025年柳州市需水量預測結(jié)果分別為21.478億~21.622億m3、21.813億~22.023億m3。