屈國棟,樓章華,王 磊
(1.浙江大學(xué)水文與水資源工程研究所,浙江杭州 310058;2.浙江大學(xué)電氣工程學(xué)院,浙江杭州 310027)
水資源優(yōu)化配置是指在流域或特定區(qū)域內(nèi),通過工程或非工程措施對有限的水資源進行空間、時間上的調(diào)配,盡量滿足各區(qū)域的用水需求,促進流域及區(qū)域經(jīng)濟的持續(xù)、穩(wěn)定發(fā)展和生態(tài)環(huán)境的健康、穩(wěn)定[1]。水資源可持續(xù)利用的基本手段之一就是水資源優(yōu)化配置[2],水資源優(yōu)化配置是解決區(qū)域水資源短缺,提高用水經(jīng)濟和社會效益的重要和有效途徑之一,而各用水戶用水經(jīng)濟效益系數(shù)的確定則是優(yōu)化配置的關(guān)鍵。當(dāng)前,確定經(jīng)濟效益系數(shù)的方法主要有兩種:直接確定法和層次分析法。直接確定法是通過分析經(jīng)濟效益系數(shù)的物理意義,利用現(xiàn)有的一些實際數(shù)據(jù)直接確定。例如:工業(yè)用水經(jīng)濟效益系數(shù)可取用水定額 (工業(yè)萬元產(chǎn)值取水量)的倒數(shù);農(nóng)業(yè)灌溉用水經(jīng)濟效益系數(shù)按灌溉后的農(nóng)業(yè)增產(chǎn)效益乘以水利分攤系數(shù)確定[3]。趙得軍等[4]在水資源配置模型中,把不同形式水源的用水效益系數(shù)看作是時間的函數(shù),利用遺傳算法優(yōu)化效益系數(shù)。沈軍等[5]將水資源優(yōu)化配置問題模擬為生物進化問題,通過遺傳算法來求解經(jīng)濟效益系數(shù)?,F(xiàn)有的方法都存在一些問題,如直接確定法雖然可以在一定程度上反映實際情況,但是由于需要確定的影響參數(shù)較多,量化比較困難,很難運用到模型求解中[6]。
本文在前人研究的基礎(chǔ)上,首先運用灰色關(guān)聯(lián)分析法的優(yōu)勢,初步確定影響經(jīng)濟效益系數(shù)的主要影響因子,然后根據(jù)歷史用水?dāng)?shù)據(jù),引入LASSO套索回歸,作為量化的統(tǒng)計方法,對用水經(jīng)濟效益系數(shù)進行量化。
本文選用灰色關(guān)聯(lián)分析方法,辨識影響因子,該方法是在灰色系統(tǒng)理論基礎(chǔ)上的一種方法,可以分析系統(tǒng)中各個因素的關(guān)聯(lián)程度。通過各因子的關(guān)聯(lián)度比較,可以確定出主次因素,得出影響某變量的主要因子。
灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線幾何形狀的相似程度來判斷其聯(lián)系是否緊密,曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度就越大,反之就越小[7]。
各影響因子與需水量的關(guān)聯(lián)系數(shù)與關(guān)聯(lián)度計算公式如下[8]。
關(guān)聯(lián)系數(shù)£:
其中:XO(k)和Xi(k),k=1,2,… ,n,i=1,2,…,m,分別為各個用水部門的用水量時間序列和相應(yīng)的影響因子時間序列。ρ為分辨系數(shù),值處于0~1之間,通常取0.5。
LASSO套索估計方法用于逼近線形模型,LASSO最小化受約束的殘留平方和誤差,由于這一約束的本質(zhì)特性,LASSO可以使得一些系數(shù)嚴(yán)格為零,從而能夠給出可解釋的模型[9]。Volker[10]提出了一個稱為廣義LASSO的稀疏核回歸模型,它是LASSO方法的非線性形式。由于解的極度稀疏性,廣義LASSO的性能優(yōu)于支持向量機。
其中,yi是歸一化的目標(biāo)函數(shù)真實值,β0是線性分類函數(shù)的截距。L1套索罰的約束使得解在yi上為非線性,并使用二次規(guī)劃來計算它們[11]。由于該約束的特征,使得t充分小將導(dǎo)致某些系數(shù)恰好為0。這樣,套索做了某種連續(xù)的子集選擇。通過自適應(yīng)的選擇t,極小化期望預(yù)測誤差估計,得到βj的估計。
周口市位于河南省東南部,面積1.19萬km2,耕地82.6萬hm2,人口1090萬人。轄八縣一市一區(qū)和一個省級經(jīng)濟開發(fā)區(qū)。周口地勢平坦,土地肥沃,是國家重要的糧、棉、油、肉、蛋、奶生產(chǎn)基地,有“中原糧倉”之稱;2010年糧食產(chǎn)量達72.35億kg,居河南省第一位。周口市多年平均水資源總量為26.10億m3。全市人均水資源量244 m3,為河南省人均水資源量500 m3的48.8%;畝均水資源量204 m3,為全省畝均水資源量395 m3的51.6%。周口市屬于水資源嚴(yán)重缺乏地區(qū)。
近年來,由于加快中原經(jīng)濟區(qū)建設(shè),城市化進程不斷推進,周口市水資源短缺問題日益顯現(xiàn),加之水污染和水環(huán)境問題的加劇,尤其是水質(zhì)性缺水問題引人注目。由水資源而引發(fā)的各種問題,對經(jīng)濟發(fā)展的約束已經(jīng)凸顯,水資源的數(shù)量和質(zhì)量已經(jīng)難以承載當(dāng)?shù)亟?jīng)濟社會的可持續(xù)發(fā)展。因此,準(zhǔn)確的量化用水經(jīng)濟效益系數(shù),實現(xiàn)合理的配置有限的水資源,勢在必行。
本文根據(jù)行政區(qū)域,將周口市十個縣市分為十個子區(qū),根據(jù)《周口市水資源公報》、《周口市統(tǒng)計年鑒》等資料得到相關(guān)數(shù)據(jù),運用各子區(qū)2010年的實際用水情況等數(shù)據(jù),對所建模型進行擬合,確定出周口市各子區(qū)工業(yè)、農(nóng)業(yè)用水的經(jīng)濟效益系數(shù)。
3.2.1 經(jīng)濟效益系數(shù)影響因子灰色關(guān)聯(lián)分析法辨識 分析研究區(qū)域?qū)嶋H用水狀況,首先定性確定經(jīng)濟效益系數(shù)影響因子,依據(jù)實際數(shù)據(jù),按照前文所述灰色關(guān)聯(lián)分析方法,分別求出各用水部門的實際用水經(jīng)濟效益與各影響因子的關(guān)聯(lián)系數(shù),進一步計算出關(guān)聯(lián)度。通過關(guān)聯(lián)度的排序可初步確定主要影響因子。得出周口市各用水部門實際用水經(jīng)濟效益主要影響因子如表1所示??沙醪酱_定與經(jīng)濟效益系數(shù)關(guān)聯(lián)性較高的因子。
表1 周口市各用水部門經(jīng)濟效益系數(shù)影響因子灰色關(guān)聯(lián)分析法計算結(jié)果Table 1 Results of effecting factors identified by gray relational analysis method foreconomic efficiency coefficient of Zhoukou
3.2.2 基于lasso的經(jīng)濟效益系數(shù)求解 在運用灰色關(guān)聯(lián)分析法初步確定各子區(qū)各部門用水經(jīng)濟效益系數(shù)的主要影響因子后,分析周口市工業(yè)、農(nóng)業(yè)兩個用水部門的數(shù)據(jù),引入LASSO套索估計,分別量化每個部門中的各子項的效益系數(shù)。以每個行業(yè)中總體經(jīng)濟指標(biāo)為標(biāo)準(zhǔn),計算出各個影響因素的效益系數(shù)。
其中,Y為總體經(jīng)濟指標(biāo),Ej是影響因素,ki是效益系數(shù),L0為截距。使用Matlab(The MathWorks,Inc.R2009b),利用開源軟件包 glmnet package,實現(xiàn)了凸優(yōu)化方法自適應(yīng)估計Ki,具體算法參見Koh K 等的文獻[12]。
根據(jù)《周口市統(tǒng)計年鑒》、《周口市水資源公報》等資料,進行數(shù)據(jù)的初步統(tǒng)計分析,得到2010年周口市各行政分區(qū)工業(yè)、農(nóng)業(yè)經(jīng)濟效益系數(shù)主要影響因子的值如表2、3所示。
運用前述理論,對表2、3中的數(shù)據(jù),以工業(yè)總產(chǎn)值和農(nóng)業(yè)總產(chǎn)值為總體經(jīng)濟指標(biāo),用lasso回歸分析,得到線性回歸函數(shù):
表2 2010年周口市各行政分區(qū)工業(yè)經(jīng)濟效益系數(shù)主要影響因子值Table 2 The effecting factors value of industrial economic efficiency coefficient of Zhoukou in the year 2010
表3 2010年周口市各行政分區(qū)農(nóng)業(yè)經(jīng)濟效益系數(shù)主要影響因子值Table 3 The effecting factors value of agricultural economic efficiency coefficient of Zhoukou in the year 2010
由式 (6)、(7)可知,在以工業(yè)、農(nóng)業(yè)總產(chǎn)值最大為目標(biāo)的情況下,影響總產(chǎn)值最大的影響因子及其值如表4所示。
表4 2010年周口市工業(yè)、農(nóng)業(yè)用水經(jīng)濟效益影響因子及其系數(shù)值Table 4 The effecting factors of industrial and agricultural water use economic efficiency coefficient and the coefficient of Zhoukou in the year 2010
由表4可知,工業(yè)用水方面,對工業(yè)總產(chǎn)值影響較大的有火電用水量和地下水用水量,因此,為了提高工業(yè)用水經(jīng)濟效益,可以通過提高火電用水量,增加工業(yè)用水中地下水的比例,以此提高工業(yè)用水經(jīng)濟效益。農(nóng)業(yè)用水方面,對農(nóng)業(yè)總產(chǎn)值影響較大的是菜田用水量和農(nóng)田灌溉用水量,可以通過適當(dāng)增加菜田種植面積,以及在可能的情況下,通過提高農(nóng)田灌溉用水量來增加農(nóng)業(yè)用水經(jīng)濟效益。根據(jù)表4中的影響因子及其系數(shù)值,可對區(qū)域合理的利用水資源提供參考,為水資源的合理配置提供對策和建議。
本文運用灰色相關(guān)分析方法,初步分析區(qū)域用水經(jīng)濟效益系數(shù)的主要影響因子,然后運用lasso方法求解,以區(qū)域總產(chǎn)值最大作為目標(biāo),綜合考慮各個縣市的用水收益情況,得出各影響因素的效益系數(shù),這些效益系數(shù)可以作為當(dāng)年和時間較臨近的年份的參考依據(jù)。其他年份的數(shù)據(jù)采用本文中的方法,可以得到相應(yīng)的效益系數(shù)集合。因為每年的效益系數(shù)是動態(tài)變化的,所以采用本文中的方法能夠動態(tài)地計算每年的效益系數(shù),再據(jù)此做進一步的優(yōu)化。本文為水資源優(yōu)化配置模型中經(jīng)濟效益系數(shù)的確定提供了一種更加精確和量化的方法。為區(qū)域水資源管理和水資源的合理配置提供了依據(jù)。
[1]孫志林,夏珊珊,許丹,等.區(qū)域水資源的優(yōu)化配置模型[J].浙江大學(xué)學(xué)報:工學(xué)版,2009,43(2):344-348.
[2]王海政,仝允恒.可持續(xù)發(fā)展視角下的區(qū)域水資源優(yōu)化配置模型[J].清華大學(xué)學(xué)報:自然科學(xué)版,2007,47(9):1531-1536
[3]馮耀龍,韓文秀,王宏江,等.面向可持續(xù)發(fā)展的區(qū)域水資源優(yōu)化配置研究[J].系統(tǒng)工程理論與實踐,2003(2):133-138.
[4]趙得軍,洪 林,李遠華,等.效益系數(shù)年際動態(tài)變化的水資源合理配置[J].中國農(nóng)村水利水電,2004,22(9):34-36.
[5]沈軍,劉勇鍵.水資源優(yōu)化配置模型參數(shù)識別的遺傳算法[J].武漢大學(xué)學(xué)報:工學(xué)版,2002,35(3):13 -16.
[6]陳奪峰,黃歲樑.改進遺傳算法確定水資源優(yōu)化配置模型經(jīng)濟效益系數(shù)[J].水資源保護,2008,24(2):6 -9.
[7]劉思峰,黨耀國,方志耕等.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2005.
[8]王艷菊,王玨,吳澤寧.基于灰色關(guān)聯(lián)分析的支持向量機需水預(yù)測研究[J].節(jié)水灌溉,2010,10(4):49 -52.
[9]TIBSHIRANI,R.Regression shrinkage and selection via the lasso[J].Jounal of the Royal Statistical Society.1996,58(1):267 -288.
[10]VOLKER R.The generalized LASSO[J].IEEE Transactions on Neural Networks,2004,15(1):16 -28.
[11]李霞,劉超.基于收縮機制的若干回歸模型比較研究[J].統(tǒng)計與決策,2008,5:30-32.
[12]KOH K,KIM S J,BOYD S.An interior-point method for large-scale L1-regularized logistic regression[J].Journal of Machine Learning,2007(8):1519-1555.