王騰 熊仲華 杜慶治 邵玉斌
摘要 基于馬爾可夫鏈的河流水質(zhì)污染預(yù)測模型,采用河流水質(zhì)污染的指標(biāo)數(shù)據(jù),得到水質(zhì)污染的時間序列值;劃分水質(zhì)污染趨勢的狀態(tài)空間;建立狀態(tài)轉(zhuǎn)移矩陣,從而預(yù)測水質(zhì)污染趨勢變化區(qū)間。結(jié)果表明,該模型能夠有效地預(yù)測河流水質(zhì)污染的走勢,進而能夠為相關(guān)的環(huán)保部門提供治理河流的有效依據(jù),從而達到保護農(nóng)業(yè)灌溉用水的目的。
關(guān)鍵詞 河流;污染度;水質(zhì);馬爾可夫鏈
中圖分類號 S181.3;TP391 文獻標(biāo)識碼 A 文章編號 0517-6611(2015)27-209-03
Study on Prediction Model of River Water Quality Contamination Based on Markov Chain
WANG Teng1, XIONG Zhong-hua2, DU Qing-zhi1* et al
(1. College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650500; 2. Erhai Lake Basin Protection Agency of Dali, Dali, Yunnan 671000)
Abstract This paper proposes a predictive model for river pollution using Markov chain, in which we use the relative data of environmental pollution to get the time sequential-value. The interval of the variation tendency of water pollution can be predicted with the state spaces and the state transition matrix. According to the experimental results, it is proved that this model can effectively predict the trend of river pollution, so as to provide the effective basis for the management of water environment and achieve the purpose of protecting agricultural irrigation water.
Key words Rivers; Contamination; Water quality; Markov chain
環(huán)境保護歷來是人們關(guān)心的問題,隨著各地區(qū)經(jīng)濟的快速發(fā)展和人口的不斷增加,使得大量的工業(yè)生產(chǎn)污水以及生活污水排入河流中,不但影響了水環(huán)境的質(zhì)量,導(dǎo)致河流中的生物無法生存,也使得我國農(nóng)業(yè)灌溉用水銳減,水污染日益嚴(yán)重。以往的水質(zhì)污染預(yù)測模型,大部分是根據(jù)BP神經(jīng)網(wǎng)絡(luò)[1-3]、灰色模型理論[4],并結(jié)合化學(xué)、物理、生物等因素對污染物的輸出以及擴散,來對水質(zhì)污染程度進行預(yù)測[5-10]。雖然這些方法對于水質(zhì)污染有一定的預(yù)測效果,但它僅僅針對一些特定環(huán)境下的水質(zhì)預(yù)測,實現(xiàn)預(yù)測比較復(fù)雜,誤差也相對較大,故不能準(zhǔn)確地預(yù)測水質(zhì)污染情況。
筆者提出了一種基于馬爾可夫鏈的河流水質(zhì)污染預(yù)測模型,首先分析河流中水的5種化學(xué)成分,依次為需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP,通過使用加權(quán)求和的方法計算水質(zhì)污染程度值,進一步得到水質(zhì)污染程度變化值,然后基于劃分狀態(tài)區(qū)間的污染趨勢,用馬爾可夫鏈來構(gòu)建狀態(tài)轉(zhuǎn)移矩陣,得到最終的預(yù)測結(jié)果。
1 基于馬爾可夫鏈的水質(zhì)污染度剖析
1.1 水質(zhì)污染程度描述
河流水質(zhì)污染程度越來越引起人們的關(guān)注,這不僅關(guān)系到人們的生活環(huán)境,也影響了動植物的生存,尤其是農(nóng)作物的灌溉用水問題。因此,使用化學(xué)需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷為評價指標(biāo),通過加權(quán)求和計算水質(zhì)污染度,來評價河流水質(zhì)的污染程度。
所用數(shù)據(jù)主要來源于洱源縣環(huán)保局永安江在線自動監(jiān)測系統(tǒng),數(shù)據(jù)的抓取時間是2014年6月29日。抓取指標(biāo)主要包括化學(xué)需氧量COD、氨氮濃度、固體懸浮物濃度SS、pH和總磷。數(shù)據(jù)總樣本數(shù)為301條,去掉無效或錯誤數(shù)據(jù)11條,得到有效記錄290條。這290條水質(zhì)數(shù)據(jù)的獲取時間區(qū)間為2014年5月10日~6月11日。
使用B、C、D、E、F分別表示河流中5種水成分的總量,在不同時間(T)內(nèi)5種水成分含量分別用Bi、Ci、Di、Ei、Fi來表示,這里i=1,2,…,n。由于在同一時刻河流不同位置的監(jiān)測數(shù)據(jù)有差異,故需要對所測河流的化學(xué)需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP進行細化統(tǒng)計(表1)。
式中,wi(i=1,2,3,4,5)分別是河流中化學(xué)需氧量、氨氮量、固體懸浮物濃度、pH和總磷的權(quán)重。采用主觀賦權(quán)算法來確定這5種水成分的權(quán)重值,通過多名專家對多條河流歷史數(shù)據(jù)權(quán)值的詳細分析,得到每一位專家給出的權(quán)重值,然后將得到的權(quán)重值利用方根法進行演算,得到權(quán)重值分別為w1=0.276 2,w2=0.182 7,w3=0.202 1,w4=0.112 8,w5=0.226 2。
1.2 馬爾可夫模型分析
根據(jù)河流水質(zhì)的當(dāng)前狀態(tài),利用馬爾可夫模型來預(yù)測將來各個時刻水質(zhì)發(fā)生變化的概率。水質(zhì)污染程度是隨時間變化的,故可以看成是時間序列的向量,用H=[H1,H2…Hn]表示,其中n代表水質(zhì)污染度的時間段。
1.2.1
狀態(tài)空間的劃分。水質(zhì)污染的變化是一個非平穩(wěn)的隨機過程,它的時間和狀態(tài)的劃分可用離散的過程來表示。首先根據(jù)水質(zhì)污染程度H=[H1,H2,…,Hn],計算每一個水質(zhì)污染度的趨勢變化:ΔHi=Hi+1-Hi,
進而可以得到水質(zhì)污染趨勢值ΔH=[ΔH1,ΔH2,…,ΔHn-1]。根據(jù)河流水質(zhì)污染的歷史數(shù)據(jù),得到水質(zhì)污染趨勢的n個狀態(tài)S=(S1,S2,…,Sn)。通過閾值法來設(shè)置得到水污染狀態(tài)的趨勢,并依據(jù)已知數(shù)據(jù)的研究確定水質(zhì)污染程度趨勢值分布在4個狀態(tài)區(qū)間內(nèi)。當(dāng)水質(zhì)污染趨勢值ΔH>0,設(shè)置為S1(污染度急劇升高)、S2(污染度快速下降)兩個區(qū)間;水質(zhì)污染趨勢值ΔH<0時,設(shè)置為S3(污染度急劇升高)、S4(污染度快速下降)兩個區(qū)間。其中,S1=(ΔHmax/2,ΔHmax);S2=(0,ΔHmax/2);S3=(ΔHmin/2,0);S4=(ΔHmin,ΔHmin/2),其中ΔHmin=min[ΔH1,ΔH2,…ΔHn-1],
ΔHmax=max[ΔH1,ΔH2,…ΔHn-1]
。
1.2.2 建立狀態(tài)改變矩陣。將水污染程度從現(xiàn)在所處于的狀態(tài)變化到下一個階段所處狀態(tài)的數(shù)量統(tǒng)計出來。由表2可知,目前的水質(zhì)污染程度趨勢呈現(xiàn)為S1狀態(tài),下一階段仍呈現(xiàn)出S1狀態(tài)的統(tǒng)計值為n11,呈現(xiàn)出S2狀態(tài)的統(tǒng)計值n12,呈現(xiàn)出S3狀態(tài)的統(tǒng)計值n13,呈現(xiàn)出S4狀態(tài)的統(tǒng)計值n14。對于現(xiàn)在水質(zhì)污染趨勢值所呈現(xiàn)出的狀態(tài)S2、S3、S4,都使用上面的方法進行統(tǒng)計。
根據(jù)水質(zhì)污染變化呈現(xiàn)出的狀態(tài)區(qū)間,分析獲得馬爾可夫狀態(tài)轉(zhuǎn)移的概率矩陣,當(dāng)前狀態(tài)趨勢值為ΔHi,所屬狀態(tài)為Si,經(jīng)一步轉(zhuǎn)移得到下一狀態(tài)污染程度為ΔHi+1,所屬的狀態(tài)為Sj(其中Si,Sj∈S)的轉(zhuǎn)移概率是Pij,然后經(jīng)過一步轉(zhuǎn)移的概率矩陣為P=[Pij]。
令Pij=nij/nj=1nij,且nj=1Pij=1(i=1,2,…,n),則狀態(tài)轉(zhuǎn)移矩陣為:
P=[pij]=
p11p12…p1(n-1)p1n
p21p22…p2(n-1)p2n
p(n-1)1p(n-1)2…p(n-1)(n-1)p(n-1)n
pn1pn2…pn(n-1)pnn
因此,經(jīng)過x步轉(zhuǎn)移概率矩陣為Px=Px,并且呈現(xiàn)出不同污染狀態(tài)所在行的趨勢值對應(yīng)相應(yīng)的狀態(tài)向量。其中,Q=[q1,q2,…,qn]表示初始概率分布,qi表示初始狀態(tài)Si的概率,且niqi=1。
1.3 水質(zhì)污染度趨勢預(yù)測
在水質(zhì)污染的預(yù)測中,不同時間段的狀態(tài)概率可以用狀態(tài)向量π(i)來表示,即π(i)=π(i-1)P,i=1,2,…,n。設(shè)定水質(zhì)污染程度初始化狀態(tài)為Si,則初始化向量為π0=(1,0,0,…,0),然后利用初始化的向量以及狀態(tài)轉(zhuǎn)移矩陣來預(yù)測未來水質(zhì)污染程度的狀態(tài)概率。設(shè)穩(wěn)定后的水質(zhì)狀態(tài)向量為π,則
π(1)=π0P=(1,0,0,…,0)P,
π(2)=π(1)P=π0P2,…,π(n)=π(n-1)P=π0Pn。
然后,根據(jù)馬爾可夫鏈的穩(wěn)定條件滿足以下關(guān)系:π(i)P=π,
其中穩(wěn)定的狀態(tài)向量π=[π(1),π(2),…,π(n)],且ni=1π(i)=1。
2 結(jié)果與分析
2.1 水質(zhì)污染度計算
鑒于水質(zhì)污染程度的計算表達式較為復(fù)雜多變,因此對其進行標(biāo)準(zhǔn)化,公式[11]為:
yi=xi-min(xi)max(xi)-min(xi)×100
式中,max(xi)表示污染程度的最大值;min(xi)表示最小值。水質(zhì)總體污染程度變化范圍為[0,100]。
通過加權(quán)求和的方法,計算出2014年5月10日~6月11日洱源縣環(huán)保局永安江的水質(zhì)污染程度(表3)。
2.2 水質(zhì)污染度趨勢值和狀態(tài)區(qū)間劃分
2014年5月10日~6月5日永安江水質(zhì)污染度趨勢值見表4。
通過訓(xùn)練表4中2014年5月10日~6月5日獲取的水質(zhì)污染度趨勢值數(shù)據(jù),計算出水質(zhì)污染變化趨勢值的狀態(tài)轉(zhuǎn)移矩陣為:
將剛開始的水質(zhì)污染趨勢值對應(yīng)的向量設(shè)置為P0=(1,0,0,0)。以剛開始設(shè)定的向量以及狀態(tài)轉(zhuǎn)移矩陣作為基礎(chǔ),從而預(yù)測2014年6月7~11日水質(zhì)污染趨勢值所處狀態(tài)的概率,得到以下方程組:
π(1)=38π(1)+314π(2)+13π(3)+12π(3)
π(2)=58π(1)+12π(2)+13π(3)+12π(4)
π(3)=314π(2)
π(4)=114π(2)+13π(3)
依據(jù)馬爾可夫鏈的穩(wěn)定條件求解此方程組,得到水質(zhì)污染度發(fā)展趨勢穩(wěn)定后各狀態(tài)的向量,即
π=[π(1),π(2),π(3),π(4)]=(8/27,14/27,1/9,2/27)。
由表5可知,基于馬爾可夫鏈的洱源縣永安江水質(zhì)污染度的預(yù)測趨勢區(qū)間前4個與實際情況相符,基本符合河流水質(zhì)污染程度趨勢的變化。說明該模型能有效合理地判別水質(zhì)污染度的發(fā)展趨勢。
2.3 馬爾可夫鏈與BP神經(jīng)網(wǎng)絡(luò)的對比
在實際中,BP神經(jīng)網(wǎng)絡(luò)模型也可以用來預(yù)測水質(zhì)污染程度。依據(jù)BP神經(jīng)網(wǎng)絡(luò)模型的原理,該模型只能進行一步預(yù)測,即通過當(dāng)前狀態(tài)m以及以前狀態(tài)的預(yù)測值來預(yù)測下一狀態(tài)m+1。隨后將m+1狀態(tài)的預(yù)測值默認(rèn)為初始值來預(yù)測m+2狀態(tài)時的值,以此類推,來預(yù)測以后的水質(zhì)污染度的變化趨勢。以洱源縣環(huán)保局永安江水質(zhì)監(jiān)測為例,將馬爾可夫鏈的水質(zhì)污染程度預(yù)測模型與BP神經(jīng)網(wǎng)絡(luò)模型進行了對比。由表6可知,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測準(zhǔn)確率不及馬爾科夫鏈模型。
3 結(jié)論
針對現(xiàn)實中河流水質(zhì)污染嚴(yán)重影響到農(nóng)業(yè)灌溉的問題,首先提出了水質(zhì)污染度的預(yù)測方法,然后建立基于馬爾可夫鏈的水質(zhì)污染趨勢預(yù)測模型。最后,通過選取洱源縣環(huán)保局永安江水成分的監(jiān)測數(shù)據(jù)進行實證分析,構(gòu)建狀態(tài)空間,得到未來一段時間水質(zhì)污染度發(fā)展趨勢的預(yù)測區(qū)間,并將趨勢預(yù)測值與實測值進行對比。結(jié)果表明,該模型可以預(yù)測未來一段時間內(nèi)河流水質(zhì)污染程度的發(fā)展趨勢,從而為水污染治理和農(nóng)業(yè)灌溉用水保護提供依據(jù)。
參考文獻
[1] 陳繼光,祝令德.基于神經(jīng)網(wǎng)絡(luò)的馬爾可夫預(yù)測模型[J].計算機工程與應(yīng)用,2006(6):225-227.
[2] 李向兵.基于BP神經(jīng)網(wǎng)絡(luò)與加權(quán)模糊的馬爾可夫的糧食預(yù)測模型[J].甘肅聯(lián)合大學(xué)學(xué)報(自然科學(xué)版),2013(2):8-13.
[3]劉倪,葉金印.基于RBF神經(jīng)網(wǎng)絡(luò)馬爾可夫模型的淮河流域汛期暴雨量預(yù)測[J].浙江農(nóng)業(yè)科學(xué),2014(8):1256-1259.
[4] 韓曉光,李博宇,管智贇.基于灰色關(guān)聯(lián)分析指標(biāo)篩選的RBF神經(jīng)網(wǎng)絡(luò)-馬爾可夫鏈的空質(zhì)量氣預(yù)測模型[J].南開大學(xué)學(xué)報(自然科學(xué)版),2013(2):22-27.
[5] 閆欣榮,史忠科.渭河寶雞段的水環(huán)境容量與水質(zhì)分析[J].陜西師范大學(xué)學(xué)報(自然科學(xué)版),2004,32(6):29-32.
[6] 康繼田.長江水質(zhì)評價及預(yù)測的Markov 鏈模型[J].湖北工業(yè)大學(xué)學(xué)報,2006,21(6):101-104.
[7] 王丙參,何萬生,夏鴻鳴.基于馬爾可夫鏈的渭河天水段水質(zhì)預(yù)測模型[J].高師理科學(xué)刊,2012(3):4-7.
[8] THOMAS B,SOLEIMANI-MOHSENI M.Artificial neural network models for indoor temperature prediction:Investigations in two buildings [J].Neural computing & ppplications,2007,16(1):81-89.
[9] 陳振偉,王茜,黃繼紅.一種新的水質(zhì)預(yù)測模型的仿真實現(xiàn)[J].電腦知識與技術(shù),2010(36):10366-10368.
[10] 陳友超.小湖(庫)水質(zhì)預(yù)測模式的應(yīng)用研究[J].海峽科學(xué),2011(6):80-81.
[11] 葉宗欲.關(guān)于指標(biāo)綜合評價中指標(biāo)正向化和無量綱化方法的選擇[J].浙江統(tǒng)計,2003(4):24-25.