劉文++高立慧
摘要:對城市的用水量進(jìn)行準(zhǔn)確的預(yù)測,能夠合理規(guī)劃城市給排水系統(tǒng)。選取用水人口、居民可支配收入、生活水價(jià)三種因素作為影響因子,基于MATLAB構(gòu)建了一種支持向量回歸機(jī)(Support Vector Regression, SVR)的城市年用水量預(yù)測模型。MATLAB仿真結(jié)果表明,基于SVR的城市年用水量預(yù)測模型訓(xùn)練集的決定系數(shù)為0.990、均方誤差為0.0043;測試集決定系數(shù)為0.978、均方誤差為0.0043。該模型能夠有效的對城市的年用水量進(jìn)行預(yù)測,對降低供水電耗具有實(shí)際參考價(jià)值。
Abstract: The urban water consumption is accurately predicted and the urban water supply and drainage system can be planned reasonably. Based on MATLAB, this paper constructs a city annual water consumption forecasting model based on Support Vector Regression (SVR), which uses three factors including water supply population, residents disposable income and living water price as influencing factors. The results of MATLAB simulation show that the decision coefficient of the training set of urban water consumption forecasting model is 0.990, the mean square error is 0.0043, the test set is 0.978 and the mean square error is 0.0043. The model can effectively predict the annual water consumption of the city, which has practical reference value for reducing the power consumption of water supply.
關(guān)鍵詞:用水量;支持向量回歸機(jī);預(yù)測模型;MATLAB;性能評價(jià)
Key words: water consumption;support vector machine for regression;forecasting model;MATLAB;performance evaluation
中圖分類號:TU991.31 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2017)22-0059-03
0 引言
隨著我國城市化進(jìn)程的進(jìn)一步加快、城市范圍的擴(kuò)大、城市人口的增加以及人民生活水平的不斷改善,對水資源需求量的增長幅度也越來越大[1-3]。用水量是城市供水管網(wǎng)系統(tǒng)中的一個(gè)關(guān)鍵問題,城市中的供水不足或供水水壓過大是由對需水量的估計(jì)不準(zhǔn)造成的[4-6]。因此,對城市用水量進(jìn)行預(yù)測研究具有相當(dāng)重要的意義。20世紀(jì)90年代,May等人將水價(jià)、人口、居民人均收入等作為影響因子,建立的中長期用水量與影響因子間的回歸模型用于美國Texas州的用水量預(yù)測中,取得了很好的效果[7];2002年,Brekke,Levi等人用逐步回歸法進(jìn)行用水量預(yù)測,其優(yōu)點(diǎn)在于模型建立時(shí)間短,效率高[8];2001年,哈爾濱工業(yè)大學(xué)的蘭洪娟、袁一星運(yùn)用人工神經(jīng)網(wǎng)絡(luò)建立預(yù)測模型,并將模型應(yīng)用于天津的月用水量預(yù)測中[9];2009年,安徽理工大學(xué)的何忠華等人建立了城市需水量的改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,給出了模型的求解算法,并對規(guī)劃年作出預(yù)測[10]。
本文以華北某市作為研究對象,采用支持向量回歸機(jī)建立城市用水量預(yù)測模型,選取用水人口、居民可支配收入、生活水價(jià)的數(shù)據(jù)作為樣本數(shù)據(jù),利用支持向量回歸機(jī)對城市年用水量進(jìn)行建模分析,并評價(jià)預(yù)測模型的性能。仿真結(jié)果表明,模型能夠有效地對該城市年水量進(jìn)行預(yù)測。
1 基于SVR的城市年用水量預(yù)測模型
支持向量回歸機(jī)是用于解決回歸問題的支持向量機(jī)。支持向量機(jī)應(yīng)用于回歸擬合分析時(shí),其基本思想不再是尋找一個(gè)最優(yōu)分類使得兩類樣本分開,而是尋找一個(gè)最優(yōu)分類面使得所有訓(xùn)練樣本離該最優(yōu)分類面的誤差最小,SVR基本思想示意圖參見圖1。
SVR是建立在支持向量機(jī)的原理上的,廣泛用于預(yù)測、異常檢測等領(lǐng)域,與其他模型算法相比,優(yōu)點(diǎn)是不會(huì)受到樣本的影響而陷入局部最優(yōu)解[11]。在樣本量比較少的情況下也能獲得較好的效果,因此本文選擇了支持向量回歸機(jī),SVR的結(jié)構(gòu)參見圖2。
由圖2可知,輸出是中間節(jié)點(diǎn)的線性組合,每個(gè)中間節(jié)點(diǎn)對應(yīng)一個(gè)支持向量。SVR預(yù)測模型采用決定系數(shù)R2和均方誤差E作為評價(jià)SVR預(yù)測模型性能的參數(shù),其決定系數(shù)函數(shù)如式(1)所示:
(1)
式(1)中, R2為決定系數(shù);N為測試集樣本個(gè)數(shù);yi(i=1,2,3,…,N)為第i個(gè)樣本的真實(shí)值;■i(i=1,2,3,…,N)為第i個(gè)樣本的估計(jì)值。
其誤差函數(shù)如式(2)所示:
■(2)
式(2)中,E為均方誤差;yi(i=1,2,3,…,N)為第i個(gè)樣本的真實(shí)值;■i(i=1,2,3,…,N)為第i個(gè)樣本的估計(jì)值。
在式(2)中,將每個(gè)樣本中輸出變量y的數(shù)值大小考慮進(jìn)去,在城市年用水量預(yù)測過程中,實(shí)際用水量范圍非常大,運(yùn)用公式(2)的誤差函數(shù),能夠避免擬合結(jié)果的不均勻,即避免了被測量變量較大的樣本擬合程度非常好,但是被測量變量較小的樣本擬合的程度卻非常差的情況。在訓(xùn)練結(jié)束后,每個(gè)樣本的擬合誤差都相對較小,因此能夠使每個(gè)樣本都能得到較好的擬合?;赟VR城市年用水量預(yù)測模型基本思想是以用水人口、居民可支配收入、生活水價(jià)的數(shù)據(jù)作為輸入樣本訓(xùn)練集的數(shù)據(jù),通過訓(xùn)練數(shù)據(jù)選擇合適的SVR模型參數(shù),構(gòu)建預(yù)測模型,輸入測試數(shù)據(jù)對模型進(jìn)行性能評價(jià),選取最佳預(yù)測模型。城市年用水量預(yù)測模型算法流程參見圖3。
2 實(shí)驗(yàn)研究
為了對所提城市年用水量預(yù)測模型的有效性進(jìn)行驗(yàn)證,本文以具體數(shù)據(jù),進(jìn)行實(shí)驗(yàn)研究。本文選取華北某市作為研究試點(diǎn),選取2000年到2014年的15組樣本數(shù)據(jù)以及對應(yīng)的年用水量,其樣本變化曲線如圖4所示。
選擇前12個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,用于模型訓(xùn)練及參數(shù)選擇,剩余的4個(gè)樣本數(shù)據(jù)作為測試集,用于預(yù)測結(jié)果的對比分析?;赟VR的城市年用水量預(yù)測模型訓(xùn)練完成后,訓(xùn)練集仿真結(jié)果參見圖5。
運(yùn)用式(1)中給出的相關(guān)系數(shù)和式(2)中給出的誤差系數(shù)的計(jì)算方法,得到預(yù)測模型的訓(xùn)練集測試的相關(guān)系數(shù)為0.990,均方誤差為0.0043,放電量與用水人口、居民可支配收入以及生活水價(jià)具有很強(qiáng)的相關(guān)性。樣本訓(xùn)練值與真實(shí)值之間的對比參見表1。
由表1可知,所選擇的12組樣本值的預(yù)測模型的訓(xùn)練誤差最大為0.093,精度在3%以內(nèi),因此該預(yù)測模型的建立是比較成功的。
為了對該模型進(jìn)行性能評價(jià),對測試集的4個(gè)樣本數(shù)據(jù)進(jìn)行測試,測試集仿真結(jié)果參見圖6。
運(yùn)用式(1)中給出的相關(guān)系數(shù)和式(2)中給出的誤差系數(shù)的計(jì)算方法,得出:基于SVR的城市年用水量測試集相關(guān)系數(shù)為0.978,誤差系數(shù)為0.0043?;赟VR的城市年用水量預(yù)測值與實(shí)際值的曲線趨勢基本一致。五組樣本測試值與真實(shí)值之間的對比參見表2。
由表2可知,所選擇的4組樣本值的預(yù)測模型的測試誤差最大為0.073,精度在3%以內(nèi),因此,使用該方法預(yù)測城市年用水量是可行的。
3 結(jié)論
城市年用水量預(yù)測對城市供水管網(wǎng)系統(tǒng)管理具有重要的意義,本文基于SVR構(gòu)建了城市年用水量預(yù)測模型,仿真結(jié)果表明,基于SVR的城市年用水量預(yù)測模型訓(xùn)練集和測試集的決定系數(shù)分別為0.990和0.978,均方誤差分別是0.0043和0.0043,此模型的年用水量預(yù)測值與實(shí)際值的曲線趨勢基本一致,能夠有效地對城市年用水量進(jìn)行預(yù)測,也提供了一種有效的城市年用水量預(yù)測研究方法。
參考文獻(xiàn):
[1]傅金祥,馬興冠.水資源需求預(yù)測及存在的主要問題探討[J].中國給水排水,2002,18(10):27-29.
[2]馮琨,張永麗,戴沂伽.基于因子分析的BP神經(jīng)網(wǎng)絡(luò)對成都市需水量的預(yù)測[J].四川環(huán)境,2011,30(2):125-130.
[3]Liu Q, Zhao Z, Li Y X, et al. A Novel Method of Feature Selection based on SVM[J]. Journal of Computers, 2013, 8(8).
[4]張雅君,劉全勝.需水量預(yù)測方法的評析與擇優(yōu)[J].中國給水排水,2001,17(7):27-29.
[5]Wang H Y, Fang M A, Yang K, et al. A study of information renewal GM (1,1) model for predicting urban medium and long-term water demand[J]. Journal of Wuhan University of Hydraulic & Electric Engineering, 2004, 37(6):32-35.
[6]聶相田.水資源可持續(xù)利用管理不確定性分析方法及應(yīng)用[M].黃河水利出版社,1999.
[7]L W Mays et al. Water Demand Forecasting. Hydro system Engineering and Management. 1992:24-32.
[8]Brekke, Levi,Larsen, Milton D, Ausburn, Mary, Takaichi, Lynn. Suburban Water Demand Modeling Using Step wise Regression. AWWA. 2002:1994(10):108-112.
[9]蘭宏娟.城市用水量預(yù)測模式及其應(yīng)用的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2001:10-48.
[10]何忠華.城市需水量的預(yù)測研究[D].安徽理工大學(xué),2009.
[11]曾虎,李川,李英娜,等.聯(lián)合高頻脈沖與超聲波信號的局放估計(jì)[J].傳感器與微系統(tǒng),2016,35(8):37-39.