秦 成
(中國煤炭科工集團(tuán)重慶研究院,重慶 400039)
水資源危機(jī)是指水資源系統(tǒng)不能保證生態(tài)、經(jīng)濟(jì)和社會(huì)可持續(xù)利用及其發(fā)展,并且供求矛盾異常尖銳時(shí)的狀態(tài)[1]。水資源危機(jī)涉及的誘因較多,存在明顯不確定性,但爆發(fā)前的水資源系統(tǒng)狀態(tài)的變化卻是一個(gè)按客觀規(guī)律演變的連續(xù)變化過程,水危機(jī)的發(fā)生只是該系統(tǒng)連續(xù)變化過程中符合客觀科學(xué)規(guī)律的一個(gè)突變[2]。
從水資源危機(jī)發(fā)生前各種危機(jī)前兆的出現(xiàn),到問題積聚到某一程度引發(fā)水資源危機(jī)這一過程存在一定的時(shí)間間隔,因此可以在這個(gè)時(shí)間段內(nèi)通過預(yù)警來提前預(yù)報(bào)危機(jī)并采取相應(yīng)措施控制或減緩危機(jī)的產(chǎn)生。所以預(yù)警的研究對(duì)解決水資源危機(jī)問題有著至關(guān)重要的作用,并成為當(dāng)前研究的熱點(diǎn)。陳紹金[3]建立了基于系統(tǒng)動(dòng)力學(xué)的湘江流域水安全系統(tǒng)預(yù)警模型;文俊等[4]提出了基于熵組合權(quán)重的區(qū)域水資源可持續(xù)利用預(yù)警新模型;李仰斌等[5]進(jìn)行了山西省水資源安全評(píng)價(jià)與預(yù)警研究。但是,當(dāng)前的研究還存在3個(gè)關(guān)鍵問題:①目前常用的預(yù)警方法將會(huì)面對(duì)預(yù)警警界即閾值難確定的問題,很多文獻(xiàn)是根據(jù)實(shí)際經(jīng)驗(yàn)確定閾值,缺乏理論依據(jù);②面對(duì)預(yù)警指標(biāo)眾多、指標(biāo)間非線性關(guān)系復(fù)雜的難題,如何篩選合適的預(yù)警指標(biāo)以及如何預(yù)測(cè)指標(biāo)在未來時(shí)段的量值;③傳統(tǒng)的預(yù)警方法需要建立精準(zhǔn)的數(shù)學(xué)模型方可實(shí)現(xiàn)對(duì)未來狀態(tài)的預(yù)測(cè),然而面對(duì)像水資源系統(tǒng)這樣不確定或非線性時(shí),此類方法就難以實(shí)現(xiàn)。為此,筆者將粗糙集(rough set)理論引入到水資源危機(jī)預(yù)警研究中,利用決策表的屬性約簡(jiǎn)來篩選預(yù)警指標(biāo)并獲得預(yù)警判別規(guī)則,在此基礎(chǔ)之上通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)預(yù)警指標(biāo)未來的值,然后帶入預(yù)警判別規(guī)則即可快速而簡(jiǎn)便地完成水資源危機(jī)預(yù)警。
劉梅[2]和申海亮[6]分別驗(yàn)證了水資源系統(tǒng)具有突跳性、多徑性、發(fā)散性和可恢復(fù)性,符合突變理論的基本應(yīng)用條件,因此可以把尖點(diǎn)突變(cusp catastrophe)模型應(yīng)用到水資源系統(tǒng)危機(jī)識(shí)別中[2,6]。
尖點(diǎn)突變模型勢(shì)函數(shù)是
式中:x為狀態(tài)變量,a和b為控制變量,故相空間是三維的。
勢(shì)函數(shù)的所有臨界點(diǎn)集合成突變流形M,其表達(dá)式為V'(x)=4x3+2ax+b,通過聯(lián)立V'=0和V″=0可得到反映狀態(tài)變量與各控制變量間關(guān)系的分歧集Δ,Δ是突變流形M在控制空間a~b平面上的投影:
在平衡曲面M中發(fā)生質(zhì)變有2種基本形式:①漸變。當(dāng)a>0時(shí),b的變化只引起狀態(tài)變量x的光滑變化,x連續(xù)的從上葉量變過渡到下葉或由下葉量變過渡到上葉,b稱為正則因子;②突變。當(dāng)a<0時(shí),M上出現(xiàn)褶皺,x的變化不再連續(xù),a、b達(dá)到分歧集方程關(guān)系時(shí),x從上葉突跳到下葉或由下葉突跳到上葉,a稱為剖分因子。在尖點(diǎn)突變中,a是決定突變的力量,b是某種質(zhì)態(tài)的保守力量[7]。
因此,在應(yīng)用突變模型前首先要確定控制變量。一般來說,水資源危機(jī)識(shí)別因子錯(cuò)綜復(fù)雜又相互關(guān)聯(lián),如果分析每個(gè)因子,不僅增加工作量,而且分析是孤立的,如果盲目減少因子又會(huì)損失很多信息。所以尋求一個(gè)合理的方法成為解決問題的關(guān)鍵。筆者采用主成分分析法,在保證數(shù)據(jù)信息丟失最少的前提下,把反映人類活動(dòng)對(duì)水資源系統(tǒng)不利影響的識(shí)別因子 I1,I2,…,In-k進(jìn)行主成分提取,得到少數(shù)幾個(gè)主成分,對(duì)這幾個(gè)主成分加權(quán)求和得到綜合主成分,將其作為尖點(diǎn)突變模型的剖分因子a。同樣把反映水資源系統(tǒng)自身狀態(tài)的識(shí)別因子In-k+1,…,In進(jìn)行主成分分析,求得綜合主成分將其作為尖點(diǎn)突變模型的正則因子b。狀態(tài)變量x是指水資源系統(tǒng)的狀態(tài)。將各年a、b的值帶入式(2),若Δ<0,說明水資源系統(tǒng)將會(huì)發(fā)生突變。分歧集值Δ與控制變量a和b直接相關(guān),而a和b又是從整個(gè)水資源系統(tǒng)出發(fā)通過主成分分析得到的,因此分歧集值Δ代表著水資源系統(tǒng)內(nèi)部各個(gè)子系統(tǒng)綜合作用的結(jié)果。這就是說,水資源系統(tǒng)中某個(gè)或某幾個(gè)子系統(tǒng)出現(xiàn)了問題,可能并不會(huì)影響整個(gè)系統(tǒng)正常運(yùn)行,當(dāng)各子系統(tǒng)之間相互碰撞,不利因素突顯出來,便會(huì)導(dǎo)致系統(tǒng)狀態(tài)發(fā)生突跳,即爆發(fā)水資源危機(jī)[2]。
設(shè)S={U,A,V,f}為一知識(shí)表達(dá)系統(tǒng),U為對(duì)象的非空有限集合,稱為論域;A=C∪D是屬性集合,子集C和子集D分別稱為條件屬性和決策屬性;V是對(duì)象屬性的值域;f是信息函數(shù),指定每個(gè)對(duì)象屬性的屬性值。具有條件屬性和決策屬性的知識(shí)表達(dá)系統(tǒng)稱為決策表。本次研究中將水資源危機(jī)識(shí)別的結(jié)果作為決策屬性,識(shí)別因子作為條件屬性。決策表以1個(gè)二維表格的形式表示。表中的每1列描述了1個(gè)屬性(識(shí)別因子),每1行描述了所研究論域中的1個(gè)樣本。
粗糙集理論易于處理離散數(shù)據(jù),然而在實(shí)際的水資源系統(tǒng)中大多數(shù)指標(biāo)數(shù)據(jù)都是連續(xù)的。因此要實(shí)現(xiàn)連續(xù)數(shù)據(jù)的粗糙集約簡(jiǎn)處理,得到水資源危機(jī)識(shí)別規(guī)則知識(shí),其前提就是要將連續(xù)數(shù)據(jù)進(jìn)行離散化。目前對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化的方法有多種:等距離劃分、等頻率劃等,但是使用這些方法需用戶對(duì)數(shù)據(jù)特征有較清楚的認(rèn)識(shí)[8],所以本文采用具有動(dòng)態(tài)聚類特性和一定的自適應(yīng)性的K-均值聚類算法對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化。
在選取的各種水資源危機(jī)識(shí)別因子中,并非所有的因子都很重要,其中某些屬性是冗余的。屬性約簡(jiǎn)就是在保持屬性分類能力不變的條件下,刪除其中不相關(guān)或不重要的屬性。對(duì)?a∈C,若posC(D)=pos(C-{a})(D)(posC(D)稱為 D 的 C正域)則認(rèn)為a是冗余的,稱C'=C-{a}為C的一個(gè)約簡(jiǎn)。通過屬性約簡(jiǎn)后保留的指標(biāo)即為預(yù)警指標(biāo)。
令Xi和Yj分別代表U/C與U/D中的各個(gè)等價(jià)類,des(Xi)表示對(duì)等價(jià)類Xi的描述,即等價(jià)類Xi對(duì)于各條件屬性值的特定取值;des(Yj)表示對(duì)等價(jià)類Yj的描述,即等價(jià)類Yj對(duì)于各決策屬性值的特定取值。決策規(guī)則定義如下:
根據(jù)約簡(jiǎn)后的決策信息系統(tǒng),可以得到具有一定決策概率的不精確決策規(guī)則。其中大量的決策規(guī)則是冗余的,這就需要衡量這些規(guī)則的價(jià)值。從系統(tǒng)客觀層面評(píng)價(jià)一條規(guī)則,主要依據(jù)可信度、覆蓋率和支持?jǐn)?shù)來衡量,在數(shù)據(jù)挖掘時(shí),一般希望得到可信度和覆蓋率都高的有效規(guī)則,但實(shí)際上這兩個(gè)指標(biāo)是成負(fù)關(guān)系的。所以需要權(quán)衡一規(guī)則的可信度和覆蓋率來評(píng)價(jià)其價(jià)值。雖然運(yùn)用數(shù)學(xué)方法可以對(duì)一規(guī)則進(jìn)行評(píng)價(jià),但還應(yīng)結(jié)合水資源科學(xué)的相關(guān)知識(shí)、考慮水資源危機(jī)自身的特點(diǎn)。
由于預(yù)警指標(biāo)歷史樣本數(shù)目N往往較小,故一般只能對(duì)各指標(biāo)進(jìn)行短中期預(yù)測(cè)。在確定BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)時(shí),網(wǎng)絡(luò)輸入層和輸出層的神經(jīng)元節(jié)點(diǎn)數(shù)均取預(yù)警指標(biāo)數(shù)目,隱層的神經(jīng)元節(jié)點(diǎn)數(shù)往往需要根據(jù)設(shè)計(jì)者的經(jīng)驗(yàn)和多次試驗(yàn)來確定。用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行滾動(dòng)預(yù)測(cè)的基本思想就是[9]:設(shè)xi為一系統(tǒng)因子數(shù)據(jù)系列,i=1,2,…,N,在進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí)用 xi-n,xi-n+1,…,xi-1的信息數(shù)據(jù)來預(yù)測(cè) i時(shí)刻的值,即將 xi-n,xi-n+1,…,xi-1作為數(shù)據(jù)信息輸入,而xi的值作為預(yù)測(cè)的期望值,以此構(gòu)造如下學(xué)習(xí)樣本:輸入(x1,x2,…,xn)輸出 xn+1;輸入(x2,x3,…,xn+1)輸出 xn+2…;輸入(xN-n,xN-n+1,…,xN-1)輸出xN。通過對(duì)學(xué)習(xí)樣本的訓(xùn)練,直到誤差達(dá)到允許的范圍,就可以用它滾動(dòng)預(yù)測(cè)預(yù)警指標(biāo)值。
將預(yù)測(cè)得到的預(yù)警指標(biāo)數(shù)據(jù)樣本根據(jù)決策規(guī)則對(duì)水資源危機(jī)狀況進(jìn)行判別,可能出現(xiàn)以下某種情況:①一個(gè)數(shù)據(jù)樣本與一個(gè)規(guī)則相匹配;②一個(gè)數(shù)據(jù)樣本與一個(gè)以上規(guī)則相匹配,結(jié)果一致;③一個(gè)數(shù)據(jù)樣本與一個(gè)以上規(guī)則相匹配,但結(jié)果不一致;④一個(gè)數(shù)據(jù)樣本不與任何一個(gè)規(guī)則相匹配。對(duì)于情況①和②,規(guī)則的判定結(jié)果是一致的;對(duì)于情況③和④可采用少數(shù)推理方法[10]來消除不一致沖突問題。應(yīng)用這種推理方法,對(duì)于任意待識(shí)樣本都可以根據(jù)從決策表中所得到的規(guī)則進(jìn)行判別,得到合適的結(jié)論。
本文以A市為例,在文獻(xiàn)[11]的基礎(chǔ)上,針對(duì)水資源危機(jī)的特點(diǎn)篩選如下識(shí)別因子:I1為GDP年增長率,%;I2為人口自然增長率,%;I3為萬元GDP產(chǎn)值耗水量,m3/萬元;I4為萬元產(chǎn)值工業(yè)耗水量,m3/萬元;I5為農(nóng)田灌溉用水定額,m3/hm2;I6為水資源開發(fā)利用程度,%;I7為地表水綜合污染指數(shù);I8為地下水位下降速率,m/a;I9為人均占有水資源量,m3/人;I10為地表水資源模數(shù),萬m3/(km2·a);I11為地下水可開采資源模數(shù),萬m3/(km2·a)。為了進(jìn)行系列年水資源危機(jī)識(shí)別,所有的識(shí)別因子都包含了1998—2007年10 a的數(shù)據(jù),如表1所示。
采用 spss17 統(tǒng)計(jì)分析軟件分別對(duì) I1、I2、I3、I4、I5、I6、I7、I8和 I9、I10、I1111 個(gè)評(píng)價(jià)因子進(jìn)行主成分抽取,先將指標(biāo)在方向統(tǒng)一為越大越好的值,再將各個(gè)指標(biāo)值進(jìn)行標(biāo)準(zhǔn)化處理,取得標(biāo)準(zhǔn)化值Z。對(duì)Z1,Z2,Z3,Z4,Z5,Z6,Z7,Z88 個(gè)表現(xiàn)人類活動(dòng)對(duì)水資源系統(tǒng)影響的標(biāo)準(zhǔn)化變量進(jìn)行分析,得到3個(gè)主成分F1、F2、F3,方差計(jì)算表明,累計(jì)方差貢獻(xiàn)率達(dá)到93.1%,認(rèn)為能夠很好地代表原始數(shù)據(jù),由F1、F2、F3加權(quán)求和得綜合主成分a(其代表人類活動(dòng)對(duì)水資源系統(tǒng)影響,是決定突變的力量),將它作為尖點(diǎn)突變模型的剖分因子。對(duì)Z9、Z10、Z113個(gè)表現(xiàn)自然水資源狀態(tài)的標(biāo)準(zhǔn)化變量進(jìn)行分析,抽取累計(jì)方差貢獻(xiàn)率達(dá)93.7%的兩個(gè)主成分 W1、W2,由 W1、W2計(jì)算綜合主成分b(其代表水資源自然狀態(tài),是保守力量),將它作為尖點(diǎn)突變模型的正則因子。各年的剖分因子、正則因子計(jì)算結(jié)果如表2所示。
表2 系列年a、b值
將a、b值帶入式(2)進(jìn)行計(jì)算,可知Δ<0的是1998年和1999年,水資源系統(tǒng)處于不穩(wěn)定狀態(tài),將會(huì)發(fā)生突跳,即水資源系統(tǒng)處于危機(jī)狀態(tài)。其他年份Δ>0,水資源系統(tǒng)處于穩(wěn)定狀態(tài),發(fā)生漸變。在決策表中決策屬性取值按Δ<0取0,Δ>0取1。決策屬性取值按Δ<0取0,Δ>0取1,即,0代表危機(jī)狀態(tài),1代表非危機(jī)狀態(tài),見表3所示。
表1 水資源危機(jī)識(shí)別因子原始數(shù)據(jù)
表3 各指標(biāo)離散后數(shù)據(jù)類別及決策屬性
采用K-均值聚類的方法將表1中的樣本數(shù)據(jù)離散化,將各屬性下的列數(shù)據(jù)離散為兩類數(shù)據(jù),分別用數(shù)字“1”和“2”來表示所分的類別。離散后的數(shù)據(jù)如表3所示,對(duì)應(yīng)各個(gè)聚類中心I1(9.06,14.08),I2(0.75,0.54),I3(614,372),I4(145.5,82.25),I5(3438.75,2692.50),I6(89.92,171.19),I7(0.86,0.75),I8(0.23,0.28),I9(300.93,177.19),I10(7.33,18.58),I11(33.06,24.46)。
得到表3的離散數(shù)據(jù)后,對(duì)上述11個(gè)水資源危機(jī)識(shí)別因子進(jìn)行屬性約簡(jiǎn),最終得到只含有3個(gè)識(shí)別因子的15條約簡(jiǎn),在此約簡(jiǎn)基礎(chǔ)之上產(chǎn)生了83條相應(yīng)的決策規(guī)則,通過從用戶主觀和系統(tǒng)客觀兩層面來衡量這些規(guī)則的價(jià)值,篩選出其中的約簡(jiǎn)(萬元產(chǎn)值工業(yè)耗水量I4、農(nóng)田灌溉用水定額I5、人均占有水資源量I9)作為水資源危機(jī)的預(yù)警指標(biāo),并通過對(duì)應(yīng)的決策規(guī)則(表4)來進(jìn)行預(yù)警。即通過{I4,I5,I9}這3個(gè)因子對(duì)應(yīng)的數(shù)據(jù)就可以判斷水資源系統(tǒng)是否處于危機(jī)狀態(tài),通過計(jì)算實(shí)際數(shù)據(jù)與聚類中心的距離,判斷樣本數(shù)據(jù)所屬類別后就可以按表4的規(guī)則知識(shí)來對(duì)水資源系統(tǒng)危機(jī)進(jìn)行識(shí)別,快速而方便。
用BP神經(jīng)網(wǎng)絡(luò)模型滾動(dòng)預(yù)測(cè)預(yù)警指標(biāo)2008—2012年的值,BP神經(jīng)網(wǎng)絡(luò)的輸入層、隱層、和輸出層的神經(jīng)元節(jié)點(diǎn)數(shù)分別為3、8、3,訓(xùn)練網(wǎng)絡(luò)達(dá)到收斂后進(jìn)行滾動(dòng)預(yù)測(cè),結(jié)果如表5所示。計(jì)算各預(yù)測(cè)值與 I4,I5,I9聚類中心的距離可知,2008—2012年滿足規(guī)則3:
因此未來幾年內(nèi)水資源系統(tǒng)不會(huì)發(fā)生突變,即不會(huì)產(chǎn)生危機(jī)。
表4 水資源危機(jī)預(yù)警規(guī)則
針對(duì)水資源系統(tǒng)具有突跳性、多徑性、發(fā)散性和可恢復(fù)性的特點(diǎn),用尖點(diǎn)突變模型進(jìn)行水資源危機(jī)識(shí)別,其中尖點(diǎn)突變模型中的正則因子和剖分因子分別通過對(duì)相應(yīng)水資源危機(jī)識(shí)別因子進(jìn)行主成分分析得到,將識(shí)別因子和識(shí)別結(jié)果分別作為決策表的條件屬性和決策屬性;針對(duì)粗糙集易于處理離散數(shù)據(jù)的特點(diǎn),采用具有動(dòng)態(tài)聚類特性和一定的自適應(yīng)性的K-均值聚類算法對(duì)連續(xù)的識(shí)別因子數(shù)據(jù)進(jìn)行離散化,對(duì)離散化的決策表進(jìn)行屬性約簡(jiǎn)確定出水資源危機(jī)預(yù)警指標(biāo)和決策規(guī)則;針對(duì)預(yù)警指標(biāo)間非線性關(guān)系復(fù)雜的特點(diǎn),用BP神經(jīng)網(wǎng)絡(luò)模型滾動(dòng)預(yù)測(cè)預(yù)警指標(biāo),按照決策規(guī)則就可進(jìn)行水資源危機(jī)預(yù)警判別。通過上述方法的耦合,建立了水資源危機(jī)預(yù)警的CC-RS-BP模型。
表5 用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)各預(yù)警指標(biāo)值
CC-RS-BP模型對(duì)A市進(jìn)行水資源危機(jī)預(yù)警結(jié)果表明:分歧集Δ<0的是1998和1999年,水資源系統(tǒng)處于不穩(wěn)定狀態(tài),將會(huì)發(fā)生突跳,即水資源系統(tǒng)處于危機(jī)狀態(tài),其他年份Δ>0,水資源系統(tǒng)處于穩(wěn)定狀態(tài),發(fā)生漸變;I4、I5、I9可以作為該地區(qū)的水資源危機(jī)預(yù)警指標(biāo),從系統(tǒng)客觀和用戶主觀兩層面在產(chǎn)生的83條規(guī)則知識(shí)中篩選出5條規(guī)則作為水資源危機(jī)預(yù)警的判別規(guī)則;BP神經(jīng)網(wǎng)絡(luò)滾動(dòng)預(yù)測(cè)2008—2012年的指標(biāo)滿足其中規(guī)則3:
即未來幾年內(nèi)水資源系統(tǒng)不會(huì)發(fā)生突變,這與A市2008—2010年的實(shí)際情況相吻合。
CC-RS-BP模型將尖點(diǎn)突變模型應(yīng)用于內(nèi)部作用尚未知的水資源系統(tǒng),充分發(fā)揮了尖點(diǎn)突變理論直接處理不連續(xù)性而不聯(lián)系任何特殊的內(nèi)在機(jī)制的優(yōu)點(diǎn),該模型的預(yù)警是以規(guī)則的形式來判斷的有別于傳統(tǒng)的預(yù)警方法,易被人理解和利用,模型采用BP神經(jīng)網(wǎng)絡(luò)滾動(dòng)預(yù)測(cè)預(yù)警指標(biāo)值可以充分利用相鄰時(shí)期各指標(biāo)的變化趨勢(shì)信息,為非線性、自學(xué)習(xí)、自適應(yīng)、大規(guī)模并行分布多指標(biāo)預(yù)測(cè)問題提供新途徑。
[1]周玉璽,馬傳棟.制度、技術(shù)、政策與水資源危機(jī)[J].中國生態(tài)農(nóng)業(yè)學(xué)報(bào),2006,14(2):1-4.
[2]劉梅.區(qū)域水資源危機(jī)的識(shí)別與對(duì)策研究[D].保定:河北農(nóng)業(yè)大學(xué),2009.
[3]陳紹金.水安全系統(tǒng)評(píng)價(jià)、預(yù)警與調(diào)控研究[M].北京:中國水利水電出版社,2006.
[4]文俊,李靖,金菊良.基于熵組合權(quán)重的區(qū)域水資源可持續(xù)利用預(yù)警模型[J].水電能源科學(xué),2006,24(3):6-10.
[5]李仰斌,暢明琦.水資源安全評(píng)價(jià)與預(yù)警研究[J].中國農(nóng)村水利水電,2009(1):1-4.
[6]申海亮.天津市水資源安全預(yù)警系統(tǒng)研究[D].天津:天津大學(xué),2007.
[7]艾德春.我國煤炭供需平衡的預(yù)測(cè)預(yù)警研究[D].徐州:中國礦業(yè)大學(xué),2008.
[8]徐襲,祝力,范學(xué)鑫.基于粗糙集與K-均值聚類的故障知識(shí)挖掘[J].微計(jì)算機(jī)信息,2007(15):141-142.
[9]呂光輝.中國西部干旱區(qū)生態(tài)安全評(píng)價(jià)、預(yù)警與調(diào)控研究:以新疆地區(qū)為例[D].烏魯木齊:新疆大學(xué),2005.
[10]劉菁菁,田銀華.基于主成分-粗糙集理論的企業(yè)信貸風(fēng)險(xiǎn)預(yù)警研究[J].哈爾濱商業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2009(2):57-61.
[11]李升.地下水環(huán)境健康預(yù)警研究:以黃河下游懸河段(河南)為例[D].長春:吉林大學(xué),2008.