劉呈玲,方紅遠
(揚州大學(xué),江蘇 揚州 225009)
隨著人口增長、社會經(jīng)濟發(fā)展,水資源短缺問題愈發(fā)嚴重,科學(xué)管理、合理分配才能實現(xiàn)可持續(xù)發(fā)展。2013年1月,國務(wù)院辦公廳發(fā)布出臺了《實行最嚴格水資源管理制度考核辦法》,各地區(qū)廣泛開展水資源承載負荷評估工作。太湖流域作為我國經(jīng)濟、文化、科技最為發(fā)達的地區(qū)之一,嚴格落實最嚴格水資源管理制度,配套開展流域水資源承載能力評價研究等項目,將用水總量、地下水開采量作為評價流域水資源承載負荷能力的指標。其中,用水總量為最嚴格水資源開發(fā)利用控制紅線,對其進行預(yù)測與分析對太湖流域水資源承載能力評估具有一定的現(xiàn)實意義,并能為各地開展水資源研究與評估工作提供參考依據(jù)。
本文根據(jù)太湖流域水資源狀況,借鑒水資源預(yù)警的思想,利用時差相關(guān)分析法篩選預(yù)警指標,作為太湖流域用水總量的主要預(yù)測因子,并以此構(gòu)建多元線性回歸模型,預(yù)測太湖流域未來用水總量,為太湖流域水資源承載能力核算與評估提供一定的技術(shù)方法和決策依據(jù)。
相關(guān)分析是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。時差相關(guān)分析法,則是通過對時間關(guān)系的量化,利用相關(guān)系數(shù)表征各指標序列在某段時間內(nèi)的先行、同步或滯后的關(guān)系的方法[1]。相關(guān)系數(shù)有正有負,分別代表正負相關(guān),取值范圍為-1到1。
時差相關(guān)系數(shù)可按以下原理進行計算[2]:
假設(shè)時差相關(guān)系數(shù)R,基準指標Y={Y1,Y2,Y3, …,Yn},被選指標X={X1,X2,X3, …,Xn},則:
(1)
式中:l為超前或滯后期,被稱為時差或延遲數(shù)(l=0時表示不移動,表示同步;若表示超前,則對應(yīng)的l﹤0;若表示滯后,則對應(yīng)的l﹥0);n為所取數(shù)據(jù)的個數(shù);MB表示最大延遲數(shù)。
取不同的l值,分別代表不同的時差,并計算時差相關(guān)系數(shù)Rl,取絕對值最大的R′l作為時差相關(guān)系數(shù)。時差相關(guān)系數(shù)對應(yīng)的時差數(shù)l的正負,可判斷被選指標與基準指標先行、同步或滯后的關(guān)系。它反映了被選擇指標與基準指標的波動最接近,即為時差相關(guān)系數(shù)。只有超前相關(guān)性較強的指標才能被選為預(yù)測性指標。
多元線性回歸模型是研究一個因變量和多個自變量間的線性關(guān)系方法[3],設(shè)有n組觀測數(shù)據(jù)(x1,x2,…,xpi,yi)(i=1,2,…,n),其中x為自變量,y為因變量。假設(shè)其滿足以下關(guān)系式:
yi=β0+β1xi1+β2xi2+…+βpxip+εi
(2)
i=1,2,3,…,n
式中:β0,β1,…,βp為待定參數(shù);εi為隨機誤差,其均值為0,方差為σ2。
(3)
多元線性回歸模型的統(tǒng)計檢驗是指運用數(shù)理統(tǒng)計的方法,檢驗?zāi)P头匠?、參?shù)估計值的擬合優(yōu)度、顯著性等。擬合優(yōu)度檢驗,即R2檢驗,是檢驗所有解釋變量與被解釋變量之間的相關(guān)程度。方程顯著性檢驗就是檢驗?zāi)P偷慕忉屪兞颗c被解釋變量之間的總體線性關(guān)系是否顯著[4]。
隨著流域水資源用水量的日益增加,對流域用水總量進行科學(xué)分析和預(yù)測是滿足流域發(fā)展需求、保證水資源可持續(xù)利用的前提。通常所采用的區(qū)域用水量預(yù)測方法有用水定額法、回歸分析法、神經(jīng)網(wǎng)絡(luò)法、灰色模型預(yù)測法等,多元線性回歸模型具有方法簡單,模型簡潔,便于開發(fā)及預(yù)測費用較低等優(yōu)點[5],因此本文運用多元線性回歸模型對太湖流域未來用水總量進行預(yù)測,并進行模型的數(shù)理統(tǒng)計檢驗,為確定模型是否適用于指標估計值,將所建回歸模型用于樣本外某一時段的實際預(yù)測,并將預(yù)測值與實際觀測值進行比較,分析兩者差距的顯著性。
太湖流域位于我國沿海中部,長江三角洲南部,是我國第三大淡水湖。太湖流域整體略呈三角形,北依長江,東臨東海,南瀕錢塘江,西以天目山、界嶺、茅山山脈等山丘為界,流域面積為36 896 km2,水面面積為5 551 km2,行政區(qū)劃分屬江蘇、浙江、上海和安徽三省一市。太湖流域地處中緯度地區(qū),屬于典型的亞熱帶季風(fēng)氣候,四季分明。流域多年平均氣溫15~17 ℃,年平均日照時間1 800~2 240 h,多年平均降雨量為1 177.3 mm,多年平均年水面蒸發(fā)量為822 mm,多年平均年徑流量為161.5 億m3,受大氣環(huán)流影響,流域內(nèi)的降水量年際變化較大,年內(nèi)分配不均[6]。太湖流域多年平均水資源總量為177.4 億m3,人均水資源占有量為398 m3,耕地水資源占有量為48.47 m3/hm2,長江多年平均過境水量為9 334 億m3。
太湖流域是我國社會經(jīng)濟最發(fā)達的地區(qū)之一,其自然條件優(yōu)越,人口稠密,據(jù)統(tǒng)計資料顯示,至2012年末,太湖流域人口達到20萬人,約占全國總?cè)丝跀?shù)的4.4%;太湖流域社會經(jīng)濟發(fā)展迅速,2012年太湖流域國內(nèi)生產(chǎn)總值達54 188 億元,人均GDP達9 153元,是全國人均GDP的2.4倍。但流域經(jīng)濟社會的高速發(fā)展,人口的不斷增加,用水總量、污染排放量也迅速增大,水質(zhì)、水量、水生態(tài)等水資源問題逐漸制約著太湖流域的經(jīng)濟社會可持續(xù)發(fā)展[7],為切實做好最嚴格水資源管理工作,對太湖流域未來用水總量進行預(yù)測具有較高的實用價值。
區(qū)域用水總量受多種因素影響,本文主要以全面性、代表性、可量化為原則,根據(jù)太湖流域水資源狀況及利用情況,在參考《太湖流域及東南諸河水資源公報》等相關(guān)資料的基礎(chǔ)上,選取13個核心指標,對太湖流域2003-2014年的用水總量進行分析,統(tǒng)計的指標數(shù)據(jù)如表1所示。
本文采用SPSS19.0軟件對上述統(tǒng)計指標進行時差相關(guān)分析,其中用水總量指標為基準指標,其余13個指標為被選指標,計算被選指標相對于基準指標超前或滯后若干期(3年以上)的相關(guān)系數(shù),取相關(guān)系數(shù)絕對值最大值作為被選指標的最大相關(guān)系數(shù),一般要求大于0.5,其對應(yīng)超前或滯后的移動年數(shù)即為時差數(shù),以此為依據(jù)劃分先行、滯后或同步指標[8]。若指標的最大時差相關(guān)系數(shù)在超前期得出,則該指標為先行指標;若指標的最大時差相關(guān)系數(shù)在延遲期得出,則該指標為滯后指標。依據(jù)上述方法及統(tǒng)計指標,移動年數(shù)擬定為5年,計算太湖流域各被選指標值與用水總量指標時差相關(guān)系數(shù),確定每個指標的性質(zhì)類別,計算結(jié)果見表2。
表1 太湖流域社會經(jīng)濟發(fā)展和水資源狀況指標Tab.1 Indexes of social and economic development and water resources in Taihu Basin
注:X1為用水總量,億m3;X2為人口,萬人;X3為生產(chǎn)總值,億元;X4為二、三產(chǎn)業(yè)結(jié)構(gòu)比;X5為農(nóng)田面積,萬hm2;X6為生態(tài)環(huán)境用水,億m3;X7為降雨量,mm;X8水資源總量,億m3;X9為萬元GDP用水量,億m3;X10為用水消耗總量,億m3;X11為污水排放總量,億t;X12為工業(yè)用水,億m3;X13為人均用水量,m3;X14為每公頃農(nóng)田灌溉用水量,m3。
表2 太湖流域用水總量的先行、同步及滯后指標Tab.2 Forward-looking, synchronous andlagging indexes of Taihu water consumption
根據(jù)時差相關(guān)分析計算,人口、生產(chǎn)總值、農(nóng)田面積、用水消耗量、產(chǎn)業(yè)結(jié)構(gòu)比、人均用水量、工業(yè)用水、每公頃農(nóng)田灌溉用水這8個指標相關(guān)關(guān)系絕對值的最大值出現(xiàn)在先行年份,對用水總量具有預(yù)警作用,其先導(dǎo)強度與先行長度如表2中所示。因此,13個水資源承載力指標中共有8個先行指標,剩余5個為滯后指標。其中8個先行指標可作為預(yù)測性指標,對太湖流域用水總量進行預(yù)測。
3.3.1 模型的建立
依據(jù)時差相關(guān)分析法篩選出的預(yù)警指標,設(shè)因變量y為用水總量(億m3),利用SPSS19.0軟件進行線性回歸計算,得出多元線性回歸預(yù)測模型:
Y=-120.807+0.031x1+0x2-51.092x3+0.648x4-
0.288x5+0.595x6+0.215x7+0.009x8
其中生產(chǎn)總值x2的回歸系數(shù)為0,將其從自變量指標中去除,試算可知模型更加合理。因此最終計算分析得到的多元線性回歸預(yù)測模型為:
Y=-105.639+ 0.017x1-30.207x2+0.904x3-
0.290x4+0.820x5+0.112x6+0.012x7
式中:自變量x1為人口數(shù),萬人;x2為二、三產(chǎn)業(yè)結(jié)構(gòu)比;x3為農(nóng)田面積,萬hm2;x4為用水消耗總量,億m3;x5為工業(yè)用水,億m3;x6為人均用水量,m3;x7為每公頃農(nóng)田灌溉用水,m3。
3.3.2 模型的有效性檢驗
運用SPSS19.0軟件對該多元線性回歸模型進行擬合優(yōu)度檢驗、方程總體線性的顯著性檢驗(F檢驗)可得[9]:
(1)擬合優(yōu)度檢驗。模型自變量與因變量之間相關(guān)關(guān)系,即R值為0.998,R方值為0.997,調(diào)整R方值為0.991,接近于1,說明此模型方程的擬合度較高。
(2)顯著性檢驗。根據(jù)Anova表,模型回歸平方和為2 905.152,回歸自由度為7,殘差平方和為9.978,殘差自由度為4,總計平方和為2 915.129,總計自由度為11,模型的F統(tǒng)計量的值為166.382,其概率值為0,通常在顯著性水平為0.05的情形下,可以認為自變量與因變量之間有線性關(guān)系,此模型F統(tǒng)計量的概率值0﹤0.05,故判定該回歸方程有效。
(3)合理性檢驗。將太湖流域2003-2014年各年度數(shù)據(jù)代入模型進行用水總量的預(yù)測,將預(yù)測的用水總量與各年度實際用水總量進行比較,分析其相對誤差,結(jié)果如表3所示。表中最小相對誤差為0.58%,最大相對誤差為1.25%,預(yù)測等級為“好”,可以認為此用水總量預(yù)測模型是合理的。
表3 太湖流域2003-2014年用水量預(yù)測值與用水量實際值相對誤差Tab.3 The relative error between annual predicted value ofwater consumption and actual value of waterconsumption in Taihu Basin
預(yù)測的精度等級按照以下劃分:相對誤差<3.5%為好;3.5% ≤相對誤差<5.0%為合格;5.0%≤相對誤差<10.0%為勉強;相對誤差≥10.0%為不合格。
為檢驗研究方法以及模型在估計值情況下預(yù)測的合理性,運用多元回歸模型,利用太湖流域2003-2008年數(shù)據(jù)預(yù)測2009-2014年數(shù)據(jù)。由于各預(yù)警指標與用水總量指標具有較強的相關(guān)性,對各預(yù)警指標進行趨勢分析,可以預(yù)測出未來一段時間太湖流域的用水總量,具體如下:
結(jié)合太湖流域?qū)嶋H情況,2003-2008年流域總?cè)丝谥鹉赀f增,平均增加率為4.0%,故以此估算2009-2014年人口數(shù)據(jù);二、三產(chǎn)業(yè)結(jié)構(gòu)比在2003-2008年逐年遞減,平均減少率為-4.5%,故后5年數(shù)據(jù)以此估算;流域農(nóng)田面積在前6年有增有減,但總體趨勢為減少,結(jié)合流域?qū)嶋H情況,取最小值116.16萬hm2作為2009-2014年農(nóng)田面積數(shù)據(jù);2003-2008年的用水消耗總量數(shù)據(jù)處于上下波動的狀態(tài),有增有減,綜合實際情況,取6年平均值111.6 億m3,作為后六年流域用水消耗總量數(shù)據(jù);流域人均用水量除2003-2004年為遞增,2004-2008年逐年遞減,因此取2004-2008年平均減少率-4.2%,估算2009-2014年人均用水量數(shù)據(jù);對流域2003-2008年工業(yè)用水進行分析,可以發(fā)現(xiàn)其數(shù)據(jù)先增后減,根據(jù)流域經(jīng)濟社會發(fā)展,取6年平均值201.4億m3,作為2009-2014年流域工業(yè)用水量;每公頃農(nóng)田灌溉用水量2003-2008年有減有增,結(jié)合流域農(nóng)業(yè)發(fā)展水平,取6年平均值7 050 m3,作為2009-2014年流域每公頃農(nóng)田灌溉用水量。根據(jù)以上預(yù)測方法,對太湖流域2009-2014年用水總量數(shù)據(jù)進行預(yù)測,從而檢驗此模型以估計值預(yù)測用水總量的合理性,結(jié)果如表4所示。從表中可以看出,最大相對誤差出現(xiàn)在2014年,為5.30%,其他年份預(yù)測精度均為“好”。預(yù)測值與實際值相差不大,故按照以上方法估計各指標值可行,此多元回歸模型在預(yù)測值情況下仍保持合理有效。
表4 太湖流域2009-2014年用水總量預(yù)測Tab.4 Water consumption forecast in Taihu Basin from 2009 to 2014
按照以上各指標值的估算方法,結(jié)合實際情況,2015-2020年流域總?cè)丝谝?011-2014年平均增長率1.1%測算;二、三產(chǎn)業(yè)結(jié)構(gòu)比以2009-2014年平均減少率-2.6%估算;農(nóng)田面積取2009-2014年最小值86.26 萬hm2;流域用水消耗總量取2009-2014年平均值100.6 億m3;人均用水量按照2009-2014年平均變化率-3.6%計算;工業(yè)用水量、每公頃農(nóng)田灌溉用水量取2009-2014年平均值211.8 億m3、6 990 m3。將估測值代入回歸模型中,得到太湖流域2015年用水總量預(yù)測值為339.6 億m3,2020年用水總量預(yù)測值為338.3 億m3。
根據(jù)預(yù)測數(shù)據(jù),2015年太湖流域用水總量較2014年減少1.14%,2020年較2015年用水總量減少0.37%??梢钥闯?,雖然流域人口、產(chǎn)業(yè)結(jié)構(gòu)等不斷地變化,但隨著水資源利用率的提高以及節(jié)水措施的進一步落實,太湖流域用水總量基本保持穩(wěn)定[10]。
本文運用時差相關(guān)分析法篩選出太湖流域用水總量的預(yù)警指標,借鑒線性回歸理論,運用SPSS19.0軟件建立多元線性回歸模型,并進行統(tǒng)計檢驗及模型有效性分析。預(yù)測結(jié)果表明太湖流域用水總量逐步趨于穩(wěn)定,但水資源與經(jīng)濟社會發(fā)展之間的矛盾仍存在,如何通過用水量對流域水資源承載能力進行核算、評估與預(yù)警值得進一步探索與討論。
[1] 紀良綱, 王慧娟. 商品流通規(guī)模監(jiān)測預(yù)警指標的篩選----基于時差相關(guān)分析法的視角[J]. 經(jīng)濟與管理, 2008,22(2): 5-7.
[2] 陳 旭. 基于時差分析法的旅游經(jīng)濟運行預(yù)警指標篩選[J]. 生態(tài)經(jīng)濟, 2013,(11): 87-89,105.
[3] 陳 威. 基于多元線性回歸模型的武漢市水資源承載力研究[J]. 河南理工大學(xué)學(xué)報(自然科學(xué)版), 2017,36(1):75-79.
[4] 劉京娟. 多元線性回歸模型檢驗方法[J]. 湖南稅務(wù)高等??茖W(xué)校學(xué)報, 2005,18(5):48-49,59.
[5] 張 雄, 黨志良, 張賢洪, 等. 城市用水量預(yù)測模型綜合研究[J]. 水資源與水工程學(xué)報, 2005,16(4):24-28.
[6] 李魏武, 陶 濤, 鄒 鷹. 太湖流域水資源可持續(xù)利用評價研究[J]. 環(huán)境科學(xué)與管理, 2012,(1):85-89.
[7] 孫遠斌, 高 怡, 石亞東, 等. 太湖流域水資源承載能力模糊綜合評價[J]. 水資源保護, 2011,27(1):20-23,33.
[8] 任永泰, 李 麗. 哈爾濱市水資源預(yù)警模型研究(Ⅰ)----基于時差相關(guān)分析法的區(qū)域水資源預(yù)警指標體系構(gòu)建[J]. 東北農(nóng)業(yè)大學(xué)學(xué)報, 2011,42(8):136-141.
[9] 周 晨, 馮宇東, 肖匡心, 等. 基于多元線性回歸模型的東北地區(qū)需水量分析[J]. 數(shù)學(xué)的實踐與認識, 2014,(1):118-123.
[10] 沙之杰, 周金峰. 多元線性回歸模型預(yù)測天津市用水量[J]. 西昌學(xué)院學(xué)報(自然科學(xué)版), 2008,(2):32-35.