孫麗芹,常安定,位龍虎,魏偉平
(1.長安大學理學院,西安710064;2.西安建筑科技大學土木工程學院,西安710055)
基于GM(1,1)一逐步回歸模型的用水量預測
孫麗芹1,常安定1,位龍虎2,魏偉平1
(1.長安大學理學院,西安710064;2.西安建筑科技大學土木工程學院,西安710055)
為了對城市的用水量有個更精確的預測,文章將逐步回歸模型與灰色預測模型相結(jié)合,提出了一種基于灰色預測——逐步回歸的總用水量預測模型。該模型以逐步回歸方法為基礎,利用灰色相關(guān)性分析方法對觀測數(shù)據(jù)進行處理,進而對預測模型的因變量進行篩選,并將灰色理論引入到回歸模型分析中,對預測模型進行改進。通過實例分析可知:所提出的耦合模型與單一預測模型相比,在一定程度上改善了預測效果,達到了簡化模型、提高擬合精度和增強模型預測能力的目的。
年用水量;逐步回歸分析;灰色預測;灰色關(guān)聯(lián)度
近年來,我國特別是北方地區(qū)的水資源短缺問題日趨嚴重,水資源成為焦點話題。以世界上水資源嚴重短缺的大都市之一——北京為例,其人均水資源占有量不足300m3,為全國人均的世界人均的北京屬于嚴重缺水的城市。北京市水資源短缺已經(jīng)開始影響和制約北京社會和經(jīng)濟發(fā)展。為此,政府采取了一系列措施,例如:建設南水北調(diào)工程,建立污水處理廠,調(diào)整產(chǎn)業(yè)結(jié)構(gòu)等。但是,隨著氣候變化及社會經(jīng)濟的發(fā)展,水資源短缺始終存在。那么對城市總用水量進行預測估計,并以此為依據(jù)針對不同風險因子采取相應的有效措施來避免水資源短缺的風險或減少其造成的危害,這對社會經(jīng)濟的穩(wěn)定、可持續(xù)發(fā)展具有很大的意義。
本文提出了一種基于灰色系統(tǒng)的多元逐步回歸預測模型[1]來對城市的年總用水量進行預測,并以北京市為例,建立北京市總用水量的預測模型,對北京市的總用水量的變化趨勢進行了預測,并通過與其他模型結(jié)果進行比較,驗證了此模型在預測分析方面具有較好的性能。
1.1 逐步回歸原理
在實際運用回歸分析時,對效應集起作用的變化集因素很多,這樣會引起變量之間的相關(guān)性以及多重共線性等問題。而逐步回歸(stepwise Regression,SR)[2]的基本思想是:從其中任意一個預報因素開始,依據(jù)其對因變量作用的顯著程度,從大到小的依次引入回歸方程,對已經(jīng)選入的變量因素要進行一個個的檢查,每一步都要做一次統(tǒng)計檢驗,這樣以保證引入新的顯著因子之前,回歸方程只包含顯著因子,即留下影響顯著的因子,除去其他的因子。如此反復,經(jīng)過若干步之后得到一個“最優(yōu)”的變量子集,它包含了所有的顯著因子。
1.2 多元線性回歸分析[3]
多元線性回歸的基本原理就是設預測對象y與多個影響因素變量xi() i=1,2,…,p;p>1之間存在線性關(guān)系,設其數(shù)學模型為:yi=a0+a1x1+a2x2+…+apxp,利用j組已有的觀測值在根據(jù)最小二乘法原理求出模型中的待定系數(shù)
灰色預測是以灰色模型為基礎的,在諸多的灰色模型中,以灰色系統(tǒng)中單序列一階線性微分方程模型GM(1,1)模型最為常用。簡單介紹GM(1,1)模型[4]:
(1)原始數(shù)據(jù)累加以便弱化隨機序列的波動性和隨機性,得到新的數(shù)據(jù)序列:
其中,α、μ為待定系數(shù),分別稱為發(fā)展系數(shù)和灰色作用量,并記α、μ構(gòu)成的向量為只要求出參數(shù)α、μ,就能求出x(1)(t),進而求出的未來預測值。
利用模型進行預測:
步驟1:根據(jù)灰色系統(tǒng)關(guān)聯(lián)系數(shù)[5]選擇出對預測對象有顯著影響的回歸因子。
步驟2:再運用matlab,利用逐步回歸法對這些回歸因子進行篩選,選擇出對預測對象有主要影響的回歸因子。
步驟3:根據(jù)步驟2所得到的主要影響因子與預測對象的數(shù)據(jù),運用matlab建立多元線性回歸模型。
步驟4:對這些有主要影響的回歸因子,按照GM(1,1)模型的要求,分別建立相應的微分方程,并求出各自的發(fā)展系數(shù)α和灰色作用量μ。
步驟5:由步驟4求出的微分方程分別預測出各個主要影響因子的預測值。
步驟6:由步驟5所計算出的預測值代入步驟3所得的多元線性回歸模型中進而求得預測對象的預測值。
根據(jù)北京市1991—2008年統(tǒng)計年鑒資料數(shù)據(jù),從中選取7個影響總用水量的因子:農(nóng)業(yè)用水(億m3)、工業(yè)用水(億m3)、第三產(chǎn)業(yè)及其他用水(億m3)、降雨量(mm)、城市綠化率(%)、污水處理率(%)以及北京地區(qū)的常住人口(萬人)作為研究對象。
4.1 灰色系統(tǒng)關(guān)聯(lián)度的求解
對于灰色系統(tǒng)關(guān)聯(lián)度[6]的分析,首先要確定參考序列,即作為比較的母序列,同時以幾個因素作為比較序列。此時選定北京市總用水量作為參考序列,而影響總用水量的7個因子作為比較序列。(數(shù)據(jù)見表1)
表1 1991一2008年北京市水資源相關(guān)數(shù)據(jù)
為了避免由于量剛的不同而對關(guān)聯(lián)度引起的影響,需對表1中的數(shù)據(jù)作初值變化,變換過后再進行關(guān)聯(lián)度的分析。
關(guān)聯(lián)分析[7]是系統(tǒng)分析技術(shù)的一種,它是對系統(tǒng)中各因素的關(guān)聯(lián)程度進行分析并對系統(tǒng)動態(tài)過程發(fā)展態(tài)勢的量化作比較分析的一種方法。其本質(zhì)是對各列數(shù)據(jù)進行幾何關(guān)系的比較,找出比較序列的發(fā)展趨勢與參考序列發(fā)展趨勢的吻合情況,并以此判斷比較各影響因子與母序列的關(guān)聯(lián)程度,從而選擇出影響母序列的顯著因子。利用變換過后的數(shù)值進行關(guān)聯(lián)度分析,得到北京市總用水量與各個影響因子之間的關(guān)聯(lián)系數(shù),進而得到總用水量與各個影響因子之間的關(guān)聯(lián)度(見表2)。
表2 總用水量與各個影響因子的關(guān)聯(lián)度
從表2中可以看出北京市總用水量與農(nóng)業(yè)用水、工業(yè)用水、降雨量、城市綠化率以及常住人口的關(guān)聯(lián)度比較大,而與第三產(chǎn)業(yè)及其他用水、污水處理率的關(guān)聯(lián)度較小,故選取農(nóng)業(yè)用水、工業(yè)用水、降雨量、城市綠化率以及常住人口5個因子作為自變量,總用水量作為因變量來建立逐步多元線性回歸模型。
4.2 多元逐步回歸與灰色系統(tǒng)耦合模型的建立與預測
通過以上的灰色系統(tǒng)關(guān)聯(lián)度分析得知,所研究的影響因子中對北京市總用水量變化的相關(guān)性最為緊密的是農(nóng)業(yè)用水(x1)、工業(yè)用水(x2)、降雨量(x3)、城市綠化率(x4)以及常住人口(x5)5個因子。為了模型的簡化,故采用逐步回歸的辦法,選擇出主要的影響因子為農(nóng)業(yè)用水、工業(yè)用水與城市綠化率,并使其進入多元回歸模型進而得到北京市總用水量與主要影響因子之間的多元線性回歸模型為:
分別對這些主要的影響因子農(nóng)業(yè)用水、工業(yè)用水以及城市綠化率分別建立GM(1,1)模型,求出相應的微分方程以及各自的發(fā)展系數(shù)[8]α和灰色作用量[8]μ(見表3)。
表3 發(fā)展系數(shù)α和灰色作用量μ
將表3中農(nóng)業(yè)用水、工業(yè)用水以及城市綠化率的發(fā)展系數(shù)α和灰色作用量μ代入各自的微分方程,計算出3個主要影響因素的預測值,再代入逐步回歸方程(1)中,就可以得到北京市總用水量的預測值(見表4)。
表4 2007年、2008年北京市總用水量的預測值與實際值的比較
4.3 MSR—GM(1,1)耦合模型的評價
MSR—GM(1,1)耦合模型充分的利用已知數(shù)據(jù)的信息,使得預測結(jié)果變得更精確(見表5)。
表5 2007年、2008年北京市總用水量的MSR一GM(1,1)預測值與灰色預測值的對比
由表5中的各自相對誤差可以看出MSR—GM(1,1)耦合模型的預測值具有較高的預測精度,其預測結(jié)果能夠較好的反映北京市總用水量的變化趨勢,同時也說明了在進行總用水量預測時MSR—GM(1,1)耦合模型是一種有效、適用的方法。
運用改進的MSR—GM(1,1)耦合模型對北京市未來5年的總用水量進行預測(見表6),這樣政府可以根據(jù)這些總用水量預測值來對北京市的儲水蓄水的量進行調(diào)整,并以此制定出相應的防旱減災措施。
表6 北京市2015一2020年總用水量的預測值
(1)灰色預測是一種處理小樣本預測問題的有效工具,將其引入總用水量預測的建模中,同時也改進了多元逐步線性回歸模型的精確度。將多元逐步線性回歸模型與灰色預測模型相結(jié)合,建立了MSR—GM(1,1)預測模型,模擬并預測了北京市總用水量,與其他預測方法相比,其具有較好的預測精度。
(2)充分的利用所提供數(shù)據(jù)的信息,根據(jù)實際的問題建立了MSR—GM(1,1)預測模型,其在影響因子的選擇上盡可能做到“最優(yōu)”,這樣不僅能夠使預測結(jié)構(gòu)更精確,而且能夠減少運算量,極大的提高了結(jié)果的信任度和運算效率。
[1]潘敏,范慶來.灰色模型在城市用水量預測中的應用[J].浙江水利科技,2004,(1).
[2]燕列雅.GM(1,1)模型應用[J].系統(tǒng)工程理論與實踐,1998(,10).
[3]徐洪福.灰色預測模型在年用水量預測中的應用[J].哈爾濱建筑工業(yè)大學學報,2011,34(4).
[4]張青.基于神經(jīng)網(wǎng)絡最優(yōu)組合預測方法的應用研究[J].系統(tǒng)工程理論與實踐,2001,(9).
[5]王凌.智能優(yōu)化算法及其應用[M],北京:清華大學出版社,2000.
[6]李云貴,李清富,趙國藩.灰色GM(1,1)預測模型的改進[J].系統(tǒng)工程,1992,10(6).
[7]程毛林.灰色模型預測精度改進方法新探[J].統(tǒng)計與決策,2004, (2).
[8]楊華龍,劉金霞,鄭斌.灰色預測GM(1,1)模型的改進及應用[J].數(shù)學的實踐與認識,2011,41(23).
(責任編輯/易永生)
TV213.4
A
1002-6487(2016)20-0095-03
中央高校基本科研業(yè)務費專項資金資助項目(310829130225)
孫麗芹(1987—),女,河南鄭州人,碩士研究生,研究方向:最優(yōu)化理論與算法。常安定(1964—),男,陜西大荔人,教授,研究方向:水文地質(zhì)的數(shù)學方法。