李 寧, 蘆 紅
(1. 清華大學(xué) 建筑設(shè)計(jì)研究院, 北京 100084; 2. 國際數(shù)據(jù)公司 最終用戶研究與統(tǒng)計(jì)部, 北京 100036)
水資源既是重要的基礎(chǔ)性自然資源和戰(zhàn)略性經(jīng)濟(jì)資源,也是生態(tài)環(huán)境發(fā)展的支撐性要素,具有不可替代性[1-2].隨著社會(huì)發(fā)展和科技的進(jìn)步,水資源的污染和缺失問題日益嚴(yán)重,由此增加了各國對水資源的保護(hù)壓力[3-4].為了促進(jìn)水資源的保護(hù)工作,加強(qiáng)對水資源利用區(qū)域的管理,我國相繼出臺(tái)了《全國重要江河湖泊水功能區(qū)劃》(2011~2030)、《水功能區(qū)監(jiān)督管理辦法》等政策,為全國水資源利用區(qū)劃和保護(hù)提供了支撐[5-6].
但目前的區(qū)劃方法著重于定性分析,具有較強(qiáng)的主觀性及隨意性.隨著產(chǎn)業(yè)結(jié)構(gòu)不斷調(diào)整,城市布局發(fā)生了顯著變化,導(dǎo)致區(qū)劃覆蓋面積不全面、功能定位不準(zhǔn)確等問題.因此,本文通過分析我國水資源量、功能區(qū)劃選取原則、區(qū)劃體系及結(jié)果,總結(jié)了我國在水資源區(qū)劃管理中遇到的問題與不足,并提出其水資源優(yōu)化布局方案.基于優(yōu)化布局的要求及規(guī)范,挖掘影響水資源系統(tǒng)特征搭建指標(biāo)體系,降維后進(jìn)行K-means聚類分析.采用Python工具建立聚類模型,通過大渡河流域的水資源功能區(qū)劃結(jié)果來驗(yàn)證所提方法的可行性與科學(xué)性.
根據(jù)2019年中國水資源公報(bào),全國水資源總量為29 041億m2,比近年來的平均值增長了4.8%.但人均水資源總量遠(yuǎn)低于全世界人均總量,全國接近70%的省市存在缺水問題,總?cè)笨诹恳堰_(dá)到60億m2.水資源功能區(qū)劃[7-9]目的是為水資源的開發(fā)利用和保護(hù)管理提供科學(xué)依據(jù),以實(shí)現(xiàn)水資源的可持續(xù)發(fā)展及利用.全國水資源功能區(qū)劃為兩級,如圖1所示.一級水資源功能區(qū)包括:保護(hù)區(qū)、保留區(qū)、開發(fā)利用區(qū)、緩沖區(qū);二級水資源功能區(qū)在開發(fā)利用區(qū)上進(jìn)一步劃分為:工業(yè)用水區(qū)、漁業(yè)用水區(qū)、農(nóng)業(yè)用水區(qū)、飲用水源區(qū)、過渡區(qū)、景觀娛樂用水區(qū)、排污控制區(qū).
圖1 水資源功能區(qū)劃體系Fig.1 Functional regionalization system of water resources
全國重要江河湖泊一級水資源功能區(qū)劃結(jié)果(2011~2030年)共有2 888個(gè),區(qū)劃河長177 977 km,區(qū)劃湖庫面積43 333 km2.實(shí)際區(qū)劃過程中,主要采用定性判斷法,根據(jù)技術(shù)人員的經(jīng)驗(yàn)和主觀判斷分析能力來劃分水功能區(qū).同一水域由不同技術(shù)人員劃分所得到的結(jié)果可能不同,因此具有較強(qiáng)的不確定性和隨意性.隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,部分水功能區(qū)劃已不能滿足當(dāng)前區(qū)域水資源開發(fā)利用形式,例如,部分農(nóng)業(yè)用水區(qū)隨著城市化發(fā)展正逐漸演變?yōu)楣I(yè)用水區(qū).因此,水資源系統(tǒng)具有非平衡性、多變性、自組織性、自相似性、隨機(jī)性等特性,是極其復(fù)雜的非線性系統(tǒng),需要通過定量的分析方式建立具有科學(xué)性、及時(shí)性、合理性、規(guī)范性的聚類模型進(jìn)行水功能區(qū)劃.
指標(biāo)體系構(gòu)建[10-11]是聚類分析過程中的基礎(chǔ)環(huán)節(jié),有助于對非線性復(fù)雜系統(tǒng)特征進(jìn)行分析,且關(guān)系到水資源功能區(qū)劃結(jié)果的科學(xué)性與規(guī)范性.影響水資源系統(tǒng)的因子較多,區(qū)劃考慮的因子越多,區(qū)劃則越復(fù)雜;區(qū)域內(nèi)的差異越大,區(qū)劃也越困難.合理的指標(biāo)體系有利于設(shè)計(jì)和重構(gòu)復(fù)雜的系統(tǒng),使區(qū)域特征能夠客觀、規(guī)范、合理地進(jìn)行描述和展示.
指標(biāo)體系的核心在于以研究目的為基本前提進(jìn)行構(gòu)建.水資源功能區(qū)劃以實(shí)現(xiàn)水資源的可持續(xù)開發(fā)利用為目的,建設(shè)指標(biāo)體系應(yīng)充分考慮自然環(huán)境與人類活動(dòng)的供需平衡關(guān)系.社會(huì)經(jīng)濟(jì)現(xiàn)狀和用水需求規(guī)劃影響水資源的利用狀態(tài),反映了區(qū)域水資源的需求水平.因此,水域基本屬性、區(qū)域自然情況、社會(huì)經(jīng)濟(jì)現(xiàn)狀、用水需求規(guī)劃四個(gè)層面的指標(biāo)考慮了水資源供、用、耗、需的循環(huán)過程,涵蓋了自然生態(tài)、社會(huì)經(jīng)濟(jì)和人類活動(dòng)的矛盾關(guān)系.
在具體的指標(biāo)篩選中,根據(jù)層面指標(biāo)結(jié)構(gòu),統(tǒng)計(jì)出現(xiàn)頻率較高的指標(biāo)作為參考指標(biāo),結(jié)合專家咨詢和理論分析以及考慮數(shù)據(jù)的可收集性,建立了水資源功能區(qū)劃指標(biāo)體系,如圖2所示.
圖2 水資源功能區(qū)劃指標(biāo)體系Fig.2 Index system of functional regionalization of water resources
在水資源功能區(qū)劃的研究及應(yīng)用中,本文收集了大量的數(shù)據(jù)進(jìn)行分析,多維度、多特征的大樣本雖然為水資源區(qū)劃提供了豐富的信息,但一定程度上也增加了系統(tǒng)復(fù)雜度,且眾多特征之間存在相關(guān)性,即信息上的重疊.主成分分析[12-14]是將各特征之間相互關(guān)聯(lián)的復(fù)雜關(guān)系進(jìn)行簡化處理的方法.在信息數(shù)據(jù)損失最少的原則下,將多個(gè)特征轉(zhuǎn)化為少數(shù)幾個(gè)能夠反映原先特征信息的綜合指標(biāo),且各個(gè)指標(biāo)保持相互獨(dú)立,減少信息的重疊,即對高維空間進(jìn)行降維處理.
1) 標(biāo)準(zhǔn)化處理.為了消除數(shù)據(jù)量級與量綱的影響,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.假設(shè)原始數(shù)據(jù)Y有n個(gè)樣本,m個(gè)特征,即
其中,yij為第i個(gè)樣本的第j個(gè)特征值,將各特征值yij進(jìn)行標(biāo)準(zhǔn)化處理,即
(1)
(2)
(3)
2) 計(jì)算相關(guān)系數(shù)矩陣R.計(jì)算標(biāo)準(zhǔn)化后數(shù)據(jù)矩陣各特征之間的相關(guān)系數(shù)矩陣,即
R=(rpq)m×m=
(4)
3) 計(jì)算特征值和特征向量.求解|λI-R|=0,其中I為單位矩陣,計(jì)算相關(guān)系數(shù)矩陣R的特征值λj(j=1,2,…,m),并按從大到小的順序進(jìn)行排序.計(jì)算對應(yīng)的特征向量μ1,μ2,…,μm,其中μj=(μ1j,μ2j,…,μnj)T,由特征向量組成m個(gè)新的指標(biāo),即
(5)
4) 計(jì)算特征值貢獻(xiàn)率.選擇一個(gè)主成分計(jì)算特征值的信息貢獻(xiàn)率bj和累計(jì)貢獻(xiàn)率al,其表達(dá)式分別為
(6)
(7)
當(dāng)al接近于1(一般al≥0.85)時(shí),選擇前1個(gè)指標(biāo)S1,S2,…,Sl作為一個(gè)主成分,取代原先的m個(gè)特征.
K-means是一種典型的無監(jiān)督聚類算法,主要用于將相似的樣本自動(dòng)歸為一類,適用于水資源區(qū)劃場景[15-16].其中心思想是首先確定常數(shù)K,K表示最終的聚類類別數(shù);然后隨機(jī)選定K個(gè)樣本點(diǎn)為質(zhì)心,并計(jì)算每一個(gè)樣本與K個(gè)質(zhì)心之間的相似度,將樣本歸到最相似質(zhì)心所屬的類中.相似度采用歐式距離進(jìn)行計(jì)算,其表達(dá)式為
(8)
式中,dist(x,c)為樣本x到質(zhì)心c的歐式距離;xt與ct分別為樣本x和質(zhì)心c的第t個(gè)主成分.所有樣本歸類后重新計(jì)算每個(gè)類的均值作為新的質(zhì)心,重復(fù)以上過程直到滿足收斂要求,即質(zhì)心不再改變或已達(dá)到規(guī)定的收斂次數(shù),最終確定出每個(gè)樣本所屬的類別及每個(gè)類的質(zhì)心.K-means算法流程圖如圖3所示.
圖3 K-means聚類算法流程圖Fig.3 Flow chart of K-means clustering algorithm
以大渡河流域?yàn)槔M(jìn)行一級水資源功能區(qū)劃.大渡河全長1 062 km,流域面積7.77萬km2,共有47個(gè)單元河段.按照水資源功能區(qū)劃體系收集水域基本屬性、區(qū)域自然情況、社會(huì)經(jīng)濟(jì)現(xiàn)狀、用水需求規(guī)劃四個(gè)層面共13個(gè)指標(biāo)數(shù)據(jù).通過Python 3.8實(shí)現(xiàn)對各指標(biāo)的主成分分析及K-means聚類分析.
為了消除數(shù)據(jù)量級與量綱的影響,按照式(1)對指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,處理后的數(shù)據(jù)如表1所示.
表1 大渡河流域指標(biāo)數(shù)據(jù)Tab.1 Index data of Dadu River Basin
通過式(2)~(7)計(jì)算得到主成分分析結(jié)果,如表2所示.根據(jù)各指標(biāo)的特征值和累計(jì)方差貢獻(xiàn)率,前6個(gè)主成分的方差累計(jì)貢獻(xiàn)率已達(dá)到85.604 4%,且從第7個(gè)主成分開始特征值合計(jì)小于1,因此,選擇提取前6個(gè)主成分作為聚類的特征值.
表2 主成分分析結(jié)果Tab.2 Results of principal component analysis
各指標(biāo)在6個(gè)主成分中的相關(guān)系數(shù)如表3所示.相關(guān)系數(shù)取值范圍為[-1,1],大于0表示正相關(guān),小于0表示負(fù)相關(guān),相關(guān)系數(shù)絕對值越接近1表示指標(biāo)在主成分中影響度越大.因此,主成分1反映了水域基本屬性,受河流長度、流域面積、年徑流深等指標(biāo)的影響;主成分2主要包括河口流量、年降水量、取用水量等指標(biāo);主成分3受人口密度、地形、需求用水量等指標(biāo)的影響較大;主成分4反映社會(huì)經(jīng)濟(jì)現(xiàn)狀,主要包括萬元GDP用水量、GDP增長率指標(biāo);主成分5反映用水需求關(guān)系,主要包括取用水量、需求用水量指標(biāo);主成分6反映區(qū)域自然情況,主要受地形、年降水量、年氣溫、蒸散量指標(biāo)的影響.
一級水功能區(qū)劃包括:保護(hù)區(qū)、保留區(qū)、開發(fā)利用區(qū)、緩沖區(qū)4個(gè)類別,因此K=4.隨機(jī)選取4個(gè)單元河段樣本s1(0.512,-0.701,-0.452,-0.784,-0.873,-0.86),s2(0.592,-0.833,-0.461,0.910,0.360,-0.501),s3(0.321,-0.105,0.637,-0.092,0.598,-0.764),s4(0.839,-0.156,0.576,0.712,0.722,0.526)作為初始質(zhì)心進(jìn)行K-means聚類,聚類結(jié)果為:保護(hù)區(qū){4,7,9,11,15,17,19,23,25,27,29,31,33,35,37,39,41,43,45};保留區(qū){2,5,8,10,12,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,47};開發(fā)利用區(qū){3,14,21,46};緩沖區(qū){1,6,13}.與政府部門的區(qū)劃類型結(jié)果《水功能區(qū)劃分標(biāo)準(zhǔn)》(GB/T50594-2010)進(jìn)行對比,結(jié)果如表4所示.47個(gè)河段單元有4個(gè)不同類別,分析原因是由于政府部門區(qū)劃時(shí)間為2010年,距離現(xiàn)在周期較長,河段單元的屬性和特征發(fā)生了變化.
表3 指標(biāo)的主成分相關(guān)系數(shù)Tab.3 Principal component correlation coefficients of indexes
表4 大渡河流域區(qū)劃結(jié)果Tab.4 Regionalization results of Dadu River Basin
表4(續(xù))Tab.4 (Continued)
水資源功能區(qū)的合理區(qū)劃是對水資源保護(hù)的有效支撐.本文通過對水資源功能區(qū)劃現(xiàn)狀進(jìn)行研究,分析了目前功能區(qū)劃方法的不足,從而提出了優(yōu)化布局方案.建立指標(biāo)體系對水資源系統(tǒng)的特征進(jìn)行描述,采用主成分分析方法在數(shù)據(jù)信息損失最小的情況下,將多指標(biāo)高空間進(jìn)行降維處理,提升系統(tǒng)的魯棒性.基于歐氏距離的K-means聚類算法實(shí)現(xiàn)水資源功能區(qū)劃,以大渡河流域?yàn)槔M(jìn)行實(shí)驗(yàn),以此驗(yàn)證所提方法的可行性.后續(xù)將進(jìn)行人工現(xiàn)場復(fù)核,對所提方法進(jìn)行優(yōu)化,從而進(jìn)一步提升其科學(xué)性.
沈陽工業(yè)大學(xué)學(xué)報(bào)2021年4期