閆 寶 偉,江 慧 寧,霍 磊,楊 文 發(fā),張 俊
(1.華中科技大學 土木與水利工程學院,湖北 武漢 430074; 2.長江水利委員會 水文局,湖北 武漢 430010)
水資源安全關(guān)乎人類生存,關(guān)系到生態(tài)安全、糧食安全和能源安全,是影響經(jīng)濟與社會可持續(xù)發(fā)展的關(guān)鍵因素[1]。目前,我國的水資源安全面臨諸多潛在威脅,洪旱災(zāi)害頻繁發(fā)生,水資源供需矛盾日益突出,水生態(tài)環(huán)境趨于惡化,總體形勢不容樂觀。從水量的角度來講,水資源安全是指水資源能夠滿足國民經(jīng)濟和社會可持續(xù)發(fā)展所需要的數(shù)量,且沒有出現(xiàn)因水多、水少而致災(zāi)的狀態(tài)。在我國現(xiàn)階段水情下,加強水文水資源的監(jiān)測、提高水資源安全的預(yù)警能力以及盡量降低因水資源不足或過多而造成的社會經(jīng)濟損失,是新形勢下實現(xiàn)水資源高效有序管理的一個有效途徑。
大致可以將水資源安全預(yù)警的方法分為以下兩類。
(1) 通過構(gòu)建水資源安全系統(tǒng)的指標體系,采用層次分析法[2]、模糊評價法[3]、主成分分析法[4]、集對分析法[5]和投影尋蹤評價法[6]等,對指標體系進行降維或分析權(quán)重,并構(gòu)建綜合指標對系統(tǒng)所處狀態(tài)進行綜合評價,稱之為指標型。
(2) 運用系統(tǒng)動力學方法[7-8],通過物質(zhì)、信息的輸入輸出,使水資源各個子系統(tǒng)之間相互聯(lián)系,形成多重反饋結(jié)構(gòu),并通過情景仿真,分析系統(tǒng)狀態(tài)變量的變化趨勢;或采用人工神經(jīng)網(wǎng)絡(luò)[9-10]、遺傳算法[11-12]等智能算法來模擬系統(tǒng)狀態(tài)的演化趨勢,稱之為模擬型。
上述兩類方法中,指標型方法相對而言簡單靈活、計算量較小,但存在指標體系難統(tǒng)一、指標間的相關(guān)性難消除等問題;模擬型方法可以采用非線性方程來模擬變量間復(fù)雜的相依關(guān)系,但對基礎(chǔ)數(shù)據(jù)的數(shù)量和質(zhì)量要求較高,對部分參數(shù)的敏感性較強,可能會導致不合理的模擬結(jié)果。
水資源安全預(yù)警的關(guān)鍵是水資源系統(tǒng)臨界狀態(tài)的確定。本文在預(yù)警指標體系的基礎(chǔ)上,提出了一種基于主成分分析和支持向量機的臨界狀態(tài)解析方法,運用其中的主成分分析可以消除指標間的相關(guān)性,而采用支持向量機則可以進行水資源系統(tǒng)臨界面的劃分,進而可以根據(jù)臨界狀態(tài)的發(fā)展趨勢實現(xiàn)水資源的預(yù)警。
水資源系統(tǒng)的臨界狀態(tài)是指水資源系統(tǒng)相變時的狀態(tài),即水資源由安全發(fā)展到不安全乃至致災(zāi)時的過渡狀態(tài)。單從水資源量的角度來分析,隨著水資源量的變化,水資源系統(tǒng)將經(jīng)歷以下幾個狀態(tài)。
(1) 當水資源的經(jīng)濟社會需求和生態(tài)環(huán)境需求都能得到充分滿足時,水資源系統(tǒng)將處于供需安全狀態(tài),是水資源管理的理想狀態(tài);在該階段,生態(tài)環(huán)境、社會環(huán)境和經(jīng)濟環(huán)境三者可以協(xié)同高效發(fā)展,整個社會將以穩(wěn)定的速度逐步前進。
(2) 當水資源量不能同時滿足經(jīng)濟社會和生態(tài)環(huán)境需求時,兩者間會出現(xiàn)競爭性用水,勢必有一方的用水量得不到滿足,經(jīng)濟社會和生態(tài)環(huán)境的協(xié)調(diào)發(fā)展因此會遭到破壞,此時的水資源系統(tǒng)將處于缺水狀態(tài)。
(3) 介于供需安全和缺水狀態(tài)之間,水資源量雖能滿足經(jīng)濟社會和生態(tài)環(huán)境的用水需求,但并不富裕,兩者對水資源量的敏感程度非常高,水資源的脆弱性非常強,一旦出現(xiàn)動蕩,水資源系統(tǒng)就將轉(zhuǎn)化為缺水狀態(tài),此時的水資源系統(tǒng)將處于臨界安全狀態(tài)。
(4) 當水資源量較少,處于缺水狀態(tài)時,經(jīng)濟社會的發(fā)展受到限制,生態(tài)環(huán)境質(zhì)量降低,但尚不致災(zāi);隨著水資源量的減少,缺水程度進一步加重,農(nóng)作物減產(chǎn)甚或絕產(chǎn),部分地區(qū)的居民飲水困難,生態(tài)環(huán)境惡化,旱災(zāi)形成,此時的水資源系統(tǒng)將處于災(zāi)變狀態(tài)。
(5) 介于旱災(zāi)和缺水狀態(tài)之間,隨著水資源量的減少,經(jīng)濟社會和生態(tài)環(huán)境缺水量逐漸增加,旱象初顯,農(nóng)作物和生態(tài)環(huán)境缺水將達到極限,若不采取措施,農(nóng)作物和生物群落將會枯死且不可逆轉(zhuǎn);若能及時采取措施,適當補水,損失將大大減少,此時,水資源系統(tǒng)將處于臨界旱災(zāi)狀態(tài)。
(6) 當水資源量過多時,會遠遠超過江河湖庫的蓄滯能力,洪水泛濫,農(nóng)作物被淹導致減產(chǎn)或絕產(chǎn),甚至造成了人員傷亡,嚴重破壞社會秩序和經(jīng)濟穩(wěn)定甚或危及到國家安全,此時的水資源系統(tǒng)也將處于災(zāi)變狀態(tài)。
(7) 介于供需安全與洪災(zāi)狀態(tài)之間的為臨界洪災(zāi)狀態(tài),此時,江河湖庫的水位達到保證水位,蓄滯能力接近飽和。在這種情況下,應(yīng)及時采取措施,提高洪水防御能力或分調(diào)洪水減輕流域壓力,避免對生命財產(chǎn)造成不可挽回的損失。
由此,隨著水資源量由少到多,水資源系統(tǒng)共經(jīng)歷了旱災(zāi)、臨界旱災(zāi)、缺水、臨界安全、供需安全、臨界洪災(zāi)和洪災(zāi)7種狀態(tài),其主要特征如表1所列。在這7種狀態(tài)中,共包括了臨界旱災(zāi)、臨界安全和臨界洪災(zāi)3種臨界狀態(tài),若能準確辨識出水資源系統(tǒng)所處的這3種臨界狀態(tài),將為水資源的安全預(yù)警提供重要依據(jù)。當水資源系統(tǒng)趨近于臨界狀態(tài)時,系統(tǒng)會呈現(xiàn)出臨界慢化現(xiàn)象,即系統(tǒng)的擾動恢復(fù)速率變慢、自相關(guān)系數(shù)增加、方差增加,這也是任何一個臨界狀態(tài)都具有的典型特征[13]。例如,對于臨界旱災(zāi),由于長期缺水,農(nóng)作物和生態(tài)系統(tǒng)瀕臨崩潰,即便有少許降水,也很難使系統(tǒng)迅速恢復(fù)到正常狀態(tài);當?shù)氐乃Y源量呈現(xiàn)出減少的趨勢,且越來越依賴于上一時刻的值,距離正常態(tài)也越來越遠,導致自相關(guān)性增強,方差增加。
同樣,對于臨界洪災(zāi),由于前期水資源量已經(jīng)非常豐富,江河湖庫甚至整個流域都接近蓄滿狀態(tài),稍有擾動,便有可能出現(xiàn)漫堤、潰堤等險情發(fā)生;由于當前水資源量已接近極限值,下一時刻的水資源量在很大程度上取決于當前時刻的水資源量,致使狀態(tài)變量的自相關(guān)性和方差增加。而對于臨界安全,水資源量剛剛能滿足經(jīng)濟社會和生態(tài)環(huán)境用水,水資源系統(tǒng)恰能處于供需平衡狀態(tài),缺水量為零,稍有擾動,系統(tǒng)便可能會出現(xiàn)失衡,經(jīng)濟社會或生態(tài)環(huán)境的正常用水遭到破壞,使其恢復(fù)速率變慢;當前缺水量會受到前期缺水量的影響,導致其自相關(guān)系數(shù)和方差增加。
上述3種臨界狀態(tài)雖是根據(jù)水資源量的多寡進行判斷的,但同時還與持續(xù)時間有關(guān),例如,旱災(zāi)是較長時間的缺水累積而形成的,時間尺度一般為旬、月或年;而洪災(zāi)則是短時間的洪水暴發(fā)引起的,時間尺度一般為小時或日;水資源短缺一般是指某一特定時段內(nèi)水資源供給量不能滿足需求量,時間尺度多為月、年或多年。因此,描述這3種臨界狀態(tài)的指標也不盡相同,詳情如表1所列。
表1 水資源安全狀態(tài)及指標體系Tab.1 Water resources security state and index system
對于水資源系統(tǒng)的臨界狀態(tài),可以采用單一指標法進行判別,比如,臨界旱災(zāi)狀態(tài)的干旱指數(shù)SPI、PDSI等,臨界安全的人均水資源量、水資源開發(fā)利用率等,以及臨界洪災(zāi)狀態(tài)的警戒水位、臨界雨量指標等。水資源系統(tǒng)是一個多維動態(tài)的復(fù)雜系統(tǒng),單一指標法或有一定物理含義,或有一定的統(tǒng)計意義,但一個指標僅能反映水資源系統(tǒng)某一方面的特征,過于片面。指標過多,則又可能因選取的指標具有相關(guān)性而過多地強調(diào)了水資源系統(tǒng)某一方面的特征,從而忽略了其他重要特征。為此,需去除因指標相關(guān)而產(chǎn)生的冗余信息,避免因選取的指標過多包含了某一方面的信息而賦予該特征過高的權(quán)重,從而導致部分信息失真而不能真實地表征水資源系統(tǒng)的特征屬性。
主成分分析可以在力求數(shù)據(jù)信息丟失最少的原則下,通過對高維的變量進行空間降維,將多個實測變量轉(zhuǎn)換為少數(shù)幾個不相關(guān)的綜合變量,即主成分,從而去除信息冗余和噪聲。為此,可以采用主成分分析方法對特征指標集合進行降維處理,確定水資源系統(tǒng)特征的主成分。主成分分析方法的基本思想是通過研究變量相關(guān)系數(shù)矩陣的內(nèi)部結(jié)構(gòu),找到幾個可以代表原始影響因素的主成分,以達到從指標體系中提取最重要指標的目的;通過計算數(shù)據(jù)矩陣的協(xié)方差矩陣,得到協(xié)方差矩陣的特征值和特征向量,選擇特征值最大(即方差最大)的k個特征所對應(yīng)的特征向量組成的矩陣,這樣就可以將數(shù)據(jù)矩陣轉(zhuǎn)換到新的空間當中,以實現(xiàn)數(shù)據(jù)特征的降維。
與傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)不同,支持向量機具有堅實的理論基礎(chǔ)和清晰、明確的幾何表達,在處理分類問題、判別分析等模式識別問題時具有獨特的優(yōu)勢。支持向量機的機理是尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能使超平面兩側(cè)的空白區(qū)域達到最大化[14]。以下為2個指標時支持向量機辨識臨界狀態(tài)的例子:每個點的位置均由所選取的2個指標唯一確定,支持向量機的分類原則是試圖找到一條直線來分割這些數(shù)據(jù)點,并使這些點與平面間的距離盡可能大。如果這些點是線性可分的,那么超平面可以描述為
WTXi-b=0
(1)
式中:W為超平面的法向量,b為位移項。樣本點與超平面的間隔為(2/‖W‖),盡可能使其最大。由此,最優(yōu)超平面應(yīng)當滿足:
(2)
式中:C>0為懲罰參數(shù),C的引入可以使誤分類點的個數(shù)盡可能少;ξi≥0為松弛變量,ξi的引入可以降低離群點對分類模型的影響。
為了解決這個約束最優(yōu)化的問題,引入拉格朗日乘子法,將該優(yōu)化問題轉(zhuǎn)換為與之對應(yīng)的對偶問題,并采用序列最小優(yōu)化算法進行求解,即可得到上述最優(yōu)超平面方程[15]。在線性可分的情況下,將訓練數(shù)據(jù)集中與分割超平面距離最近的樣本點稱為支持向量,即圖1中虛線上的點,將支持向量所在的超平面稱為間隔邊界。對于水資源安全系統(tǒng)而言,間隔邊界以外的點要么處于供需安全狀態(tài),要么處于缺水狀態(tài);或者是要么處于未致災(zāi)狀態(tài),要么處于致災(zāi)狀態(tài)。因此,從統(tǒng)計意義上來講,該超平面方程即為臨界安全或臨界致災(zāi)的臨界面,也就是說,該臨界面上的點處于臨界安全或臨界致災(zāi)狀態(tài)。
圖1 支持向量機的分類原理Fig.1 Classification principle of support vector machines
應(yīng)用支持向量機進行模式分類時,首先應(yīng)根據(jù)預(yù)警對象,遵循科學性、全面性和實用性等原則,建立相應(yīng)的指標體系,比如洪水預(yù)警指標體系、干旱預(yù)警指標體系、水資源供需安全指標體系等。這些指標間存在著一定的相關(guān)性,會導致支持向量機在模型訓練時出現(xiàn)多元變量共線性的問題,并將使得某個指標的權(quán)重遠遠高于其他指標,其噪音的影響也會相應(yīng)增加,從而降低模型的分類精度。為此,本文采用主成分分析方法,對上述指標體系進行降維、去噪,并提取包含樣本數(shù)據(jù)信息的主成分,再以降維后的主成分作為相應(yīng)預(yù)警系統(tǒng)的特征指標,進一步采用支持向量機進行是否安全或致災(zāi)的二元分類,從而得出相應(yīng)的臨界超平面和預(yù)警指標的臨界閾值組合,具體的技術(shù)路線如圖2所示。
圖2 技術(shù)路線Fig.2 Technical route
降維后的主成分物理含義不夠明確,無法直接獲取。為此,實時預(yù)警時,可以先將實測指標換算成主成分,再根據(jù)主成分組成的樣本點到臨界超平面的距離來判斷是否預(yù)警。
采用該方法解析水資源安全系統(tǒng)的臨界狀態(tài),需要事先知道觀測樣本的狀態(tài);對于干旱和洪水是否致災(zāi),可以根據(jù)當?shù)啬觇b是否有洪旱災(zāi)害的記錄來確定,對于水資源是否安全,則可以根據(jù)水資源安全的評價方法來確定樣本是否處于安全狀態(tài)。
以漢江月河流域為例,采用上述方法推求其洪水預(yù)警的臨界雨量。降雨量和土壤含水量是影響洪水的2個最主要因素,因此,選取這2個指標作為洪水預(yù)警指標體系。根據(jù)該流域1980~1990年的雨洪摘錄資料,共選出了87場洪水,在每場洪峰前24 h的降雨量中選取了最大6 h降雨量作為降雨量指標,并將這個最大6 h降雨量發(fā)生時刻的前5 d的累積降雨量作為該場洪水的前期雨量,前期雨量在一定程度上反映了土壤含水量的大小,因此將其作為土壤含水量的表征指標。根據(jù)實測洪水流量資料,以1 000 m3/s作為預(yù)警流量,將實測洪水樣本分為超警和未超警2類。由于指標較少,而且兩者的相關(guān)性不大,因此可以直接采用支持向量機進行洪水樣本的分類。
以87場洪水所對應(yīng)的最大6 h降雨量和前期雨量作為訓練數(shù)據(jù)集,建立線性核函數(shù)的二分類支持向量機模型,根據(jù)實測樣本的屬性進行分類訓練。結(jié)果表明,分類正確率達到了93.7%,如圖3所示,并可進一步確定出分類直線的方程為
圖3 實測洪水樣本分類結(jié)果Fig.3 Classification of measured flood samples
2.190 6x+0.599 2y-76.554 3=0
(3)
式中:x,y分別代表前期雨量和6 h的臨界雨量。
這種分類直線即為統(tǒng)計意義上的臨界方程,由此確定的雨量即為臨界雨量??梢钥闯觯S著前期雨量的升高,土壤含水量逐漸增加,所需的最大6 h成災(zāi)雨量逐步減小。根據(jù)臨界方程,可以求出不同前期雨量時所對應(yīng)的最大6 h降雨量,即為山洪預(yù)警所對應(yīng)的6 h臨界雨量,從而可以根據(jù)前期雨量以及降雨實時資料來判斷洪水是否超警,實現(xiàn)基于臨界雨量的山洪預(yù)警。
以漢江上游石泉斷面以上區(qū)域為例,采用上述方法進行干旱預(yù)警的應(yīng)用研究。文獻[15]根據(jù)研究區(qū)域1987~2015年的實測資料,選取干旱歷時、降水距平百分率、徑流距平百分率、日平均蒸發(fā)量和最小枯水流量這5個指標建立干旱指標體系,按照一定的選取原則,共選取了107個潛在干旱樣本,采用主成分分析對原特征指標進行降維,前3個主成分的方差累計貢獻率達到了89%,因此,選取這前3個主成分作為綜合指標以替代原指標體系。根據(jù)各地年鑒旱災(zāi)記錄情況,將上述107個樣本的致災(zāi)情況進行標注,采用支持向量機分類模型,將含有這3個綜合指標的107個樣本中的前79個樣本用于模型訓練。結(jié)果表明,分類正確率達到了88.6%,如圖4所示,得到的最優(yōu)分割平面方程如下[15]:
圖4 干旱樣本分類結(jié)果Fig.4 Classification of drought samples
0.664 4x+2.307 7y+0.514 9z-0.002 3=0
(4)
式中:x為第一主成分,y為第二主成分,z代表第三主成分。3個主成分皆可由指標實測數(shù)據(jù)換算而成。
利用這種臨界平面方程可以進一步確定各個干旱特征指標的閾值組合,理論上,該閾值組合不唯一。由于水資源的狀態(tài)演化是一個連續(xù)的、動態(tài)的過程,因此在實際應(yīng)用中,可以根據(jù)樣本點到臨界平面方程的距離來判斷致災(zāi)程度,以此實現(xiàn)干旱的實時預(yù)警。
以漢江上游的十堰市為例,基于上述方法進行水資源安全預(yù)警的應(yīng)用研究。文獻[16]根據(jù)2002~2017年水資源公報和社會經(jīng)濟年鑒數(shù)據(jù),分別從水資源狀況、供水設(shè)施狀況、利用效率、利用能力和生態(tài)環(huán)境5個方面共選取了23個指標,構(gòu)建了十堰市水資源安全評價指標體系。其中:
(1) 表征水資源狀況的指標有地表水資源量、地下水資源量、人均水資源量、畝均水資源量以及大中型水庫需水總量;
(2) 表征供水設(shè)施狀況的指標有年供水量、農(nóng)業(yè)用水量以及城市用水普及率;
(3) 表征利用效率的指標有萬元GDP用水量、萬元工業(yè)增加值用水量、農(nóng)田畝均灌溉用水量、城鎮(zhèn)人均生活用水量、農(nóng)村人均生活用水量、城區(qū)供水管網(wǎng)漏失率以及工業(yè)用水重復(fù)利用率;
(4) 表征利用能力的指標有人均GDP居民消費水平、第一產(chǎn)業(yè)比重和第三產(chǎn)業(yè)比重;
(5) 表征生態(tài)環(huán)境的指標有廢污水達標排放率、河流水質(zhì)良好程度、廢水排放量以及城市污水處理率。
由于選取的水資源安全指標較多,不同的指標之間存在一定的相關(guān)性,在該研究成果的基礎(chǔ)上,運用主成分分析法去除因子間的冗余信息,得出前4個主成分的累積貢獻率達到了85.1%,因此,取前4個主成分作為新的綜合指標。結(jié)合十堰市2002~2017年水資源安全評價結(jié)果[16],建立了支持向量機模型,將16 a的數(shù)據(jù)全部作為模型的訓練集,用來訓練模型參數(shù),對其進行分類,結(jié)果表明,分類準確率達到了100%,并得到了四維的臨界超平面,如圖5所示。圖5中的“*”表示水資源不安全,該臨界超平面即為水資源安全預(yù)警的臨界方程:
圖5 水資源安全狀態(tài)分類結(jié)果Fig.5 Classification results of water resources security state
-1.341 1x-0.810 4y+1.183 9z+0.300 5w+1.221 6=0
(5)
式中:x為第一主成分,y為第二主成分,z為第三主成分,w為第四主成分。
同樣地,可以根據(jù)樣本點到臨界超平面的距離來判斷水資源系統(tǒng)是否安全,以達到水資源安全預(yù)警的目的,可為相關(guān)部門提供決策依據(jù)。
水資源安全預(yù)警的關(guān)鍵是水資源安全臨界狀態(tài)的確定,隨著水資源量由少到多,水資源系統(tǒng)共經(jīng)歷了旱災(zāi)、臨界旱災(zāi)、缺水、臨界安全、供需安全、臨界洪災(zāi)和洪災(zāi)7種狀態(tài),其中,臨界旱災(zāi)、臨界安全和臨界洪災(zāi)這3種臨界狀態(tài)的準確辨識,對于水資源安全預(yù)警而言有著重要的意義。
基于主成分分析和支持向量機原理,提出了一種水資源安全臨界狀態(tài)的解析方法。研究表明:
(1) 采用主成分分析對反映水資源系統(tǒng)特征屬性的多重指標進行降維處理,去除因指標相關(guān)性而產(chǎn)生的冗余信息;降維后,新生成的綜合指標可以綜合反映水資源系統(tǒng)的多屬性特征,從而可以提高臨界狀態(tài)的識別精度。
(2) 借用支持向量機最優(yōu)分割超平面的概念,提出了水資源系統(tǒng)的臨界面。該臨界面具有明顯的統(tǒng)計意義和幾何含義,位于該臨界面上的樣本點即處于臨界安全或臨界致災(zāi)狀態(tài),進一步可以根據(jù)樣本點到該臨界面的距離來判斷系統(tǒng)是否處于安全或致災(zāi)狀態(tài),最終實現(xiàn)水資源安全或致災(zāi)的預(yù)警。
(3) 將本文提出的方法分別應(yīng)用于洪水預(yù)警、干旱預(yù)警和水資源安全預(yù)警實踐,預(yù)警準確率分別達到了93.7%、88.6%和100%,精度較高,從而可以實現(xiàn)水資源安全或致災(zāi)臨界狀態(tài)的辨識和預(yù)警。