基于馬爾可夫鏈的河流水質(zhì)污染預(yù)測(cè)模型研究
王 騰1,熊仲華2,杜慶治1*,邵玉斌1
(1.昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院,云南昆明 650500;2.大理州洱海流域保護(hù)局,云南大理 671000)
摘要基于馬爾可夫鏈的河流水質(zhì)污染預(yù)測(cè)模型,采用河流水質(zhì)污染的指標(biāo)數(shù)據(jù),得到水質(zhì)污染的時(shí)間序列值;劃分水質(zhì)污染趨勢(shì)的狀態(tài)空間;建立狀態(tài)轉(zhuǎn)移矩陣,從而預(yù)測(cè)水質(zhì)污染趨勢(shì)變化區(qū)間。結(jié)果表明,該模型能夠有效地預(yù)測(cè)河流水質(zhì)污染的走勢(shì),進(jìn)而能夠?yàn)橄嚓P(guān)的環(huán)保部門(mén)提供治理河流的有效依據(jù),從而達(dá)到保護(hù)農(nóng)業(yè)灌溉用水的目的。
關(guān)鍵詞河流;污染度;水質(zhì);馬爾可夫鏈
中圖分類(lèi)號(hào)S181.3;TP391
基金項(xiàng)目云南省科技廳重點(diǎn)項(xiàng)目(2014RA051)。
作者簡(jiǎn)介王騰(1988- ),男,云南石屏人,碩士研究生,研究方向:移動(dòng)通信和水質(zhì)預(yù)測(cè)。*
收稿日期2015-07-30
Study on Prediction Model of River Water Quality Contamination Based on Markov Chain
WANG Teng1, XIONG Zhong-hua2, DU Qing-zhi1*et al(1. College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650500; 2. Erhai Lake Basin Protection Agency of Dali, Dali, Yunnan 671000)
AbstractThis paper proposes a predictive model for river pollution using Markov chain, in which we use the relative data of environmental pollution to get the time sequential-value. The interval of the variation tendency of water pollution can be predicted with the state spaces and the state transition matrix. According to the experimental results, it is proved that this model can effectively predict the trend of river pollution, so as to provide the effective basis for the management of water environment and achieve the purpose of protecting agricultural irrigation water.
Key wordsRivers; Contamination; Water quality; Markov chain
環(huán)境保護(hù)歷來(lái)是人們關(guān)心的問(wèn)題,隨著各地區(qū)經(jīng)濟(jì)的快速發(fā)展和人口的不斷增加,使得大量的工業(yè)生產(chǎn)污水以及生活污水排入河流中,不但影響了水環(huán)境的質(zhì)量,導(dǎo)致河流中的生物無(wú)法生存,也使得我國(guó)農(nóng)業(yè)灌溉用水銳減,水污染日益嚴(yán)重。以往的水質(zhì)污染預(yù)測(cè)模型,大部分是根據(jù)BP神經(jīng)網(wǎng)絡(luò)[1-3]、灰色模型理論[4],并結(jié)合化學(xué)、物理、生物等因素對(duì)污染物的輸出以及擴(kuò)散,來(lái)對(duì)水質(zhì)污染程度進(jìn)行預(yù)測(cè)[5-10]。雖然這些方法對(duì)于水質(zhì)污染有一定的預(yù)測(cè)效果,但它僅僅針對(duì)一些特定環(huán)境下的水質(zhì)預(yù)測(cè),實(shí)現(xiàn)預(yù)測(cè)比較復(fù)雜,誤差也相對(duì)較大,故不能準(zhǔn)確地預(yù)測(cè)水質(zhì)污染情況。筆者提出了一種基于馬爾可夫鏈的河流水質(zhì)污染預(yù)測(cè)模型,首先分析河流中水的5種化學(xué)成分,依次為需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP,通過(guò)使用加權(quán)求和的方法計(jì)算水質(zhì)污染程度值,進(jìn)一步得到水質(zhì)污染程度變化值,然后基于劃分狀態(tài)區(qū)間的污染趨勢(shì),用馬爾可夫鏈來(lái)構(gòu)建狀態(tài)轉(zhuǎn)移矩陣,得到最終的預(yù)測(cè)結(jié)果。
1基于馬爾可夫鏈的水質(zhì)污染度剖析
1.1水質(zhì)污染程度描述河流水質(zhì)污染程度越來(lái)越引起人們的關(guān)注,這不僅關(guān)系到人們的生活環(huán)境,也影響了動(dòng)植物的生存,尤其是農(nóng)作物的灌溉用水問(wèn)題。因此,使用化學(xué)需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷為評(píng)價(jià)指標(biāo),通過(guò)加權(quán)求和計(jì)算水質(zhì)污染度,來(lái)評(píng)價(jià)河流水質(zhì)的污染程度。所用數(shù)據(jù)主要來(lái)源于洱源縣環(huán)保局永安江在線自動(dòng)監(jiān)測(cè)系統(tǒng),數(shù)據(jù)的抓取時(shí)間是2014年6月29日。抓取指標(biāo)主要包括化學(xué)需氧量COD、氨氮濃度、固體懸浮物濃度SS、pH和總磷。數(shù)據(jù)總樣本數(shù)為301條,去掉無(wú)效或錯(cuò)誤數(shù)據(jù)11條,得到有效記錄290條。這290條水質(zhì)數(shù)據(jù)的獲取時(shí)間區(qū)間為2014年5月10日~6月11日。使用B、C、D、E、F分別表示河流中5種水成分的總量,在不同時(shí)間(T)內(nèi)5種水成分含量分別用Bi、Ci、Di、Ei、Fi來(lái)表示,這里i=1,2,…,n。由于在同一時(shí)刻河流不同位置的監(jiān)測(cè)數(shù)據(jù)有差異,故需要對(duì)所測(cè)河流的化學(xué)需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP進(jìn)行細(xì)化統(tǒng)計(jì)(表1)。
表1 河流水質(zhì)數(shù)據(jù)統(tǒng)計(jì)表
河流在不同時(shí)間同一位置的化學(xué)需氧量、氨氮量、固體懸浮物濃度、pH和總磷可以表示為:
式中,Y∈(B,C,D,E,F(xiàn));x,g=1,2,…,n;X∈(b,c,d,e,f)。河流中的化學(xué)需氧量、氨氮量、懸浮物濃度、pH和總磷5種水成分的總量分別表示為:
然后,通過(guò)加權(quán)求和的方法,可得到水質(zhì)污染度指標(biāo)H的表達(dá)式:
H=w1B+w2C+w3D+w4E+w5F
式中,wi(i=1,2,3,4,5)分別是河流中化學(xué)需氧量、氨氮量、固體懸浮物濃度、pH和總磷的權(quán)重。采用主觀賦權(quán)算法來(lái)確定這5種水成分的權(quán)重值,通過(guò)多名專(zhuān)家對(duì)多條河流歷史數(shù)據(jù)權(quán)值的詳細(xì)分析,得到每一位專(zhuān)家給出的權(quán)重值,然后將得到的權(quán)重值利用方根法進(jìn)行演算,得到權(quán)重值分別為w1=0.276 2,w2=0.182 7,w3=0.202 1,w4=0.112 8,w5=0.226 2。
1.2馬爾可夫模型分析根據(jù)河流水質(zhì)的當(dāng)前狀態(tài),利用馬爾可夫模型來(lái)預(yù)測(cè)將來(lái)各個(gè)時(shí)刻水質(zhì)發(fā)生變化的概率。水質(zhì)污染程度是隨時(shí)間變化的,故可以看成是時(shí)間序列的向量,用H=[H1,H2…Hn]表示,其中n代表水質(zhì)污染度的時(shí)間段。
1.2.1狀態(tài)空間的劃分。水質(zhì)污染的變化是一個(gè)非平穩(wěn)的隨機(jī)過(guò)程,它的時(shí)間和狀態(tài)的劃分可用離散的過(guò)程來(lái)表示。首先根據(jù)水質(zhì)污染程度H=[H1,H2,…,Hn],計(jì)算每一個(gè)水質(zhì)污染度的趨勢(shì)變化:ΔHi=Hi+1-Hi,進(jìn)而可以得到水質(zhì)污染趨勢(shì)值ΔH=[ΔH1,ΔH2,…,ΔHn-1]。根據(jù)河流水質(zhì)污染的歷史數(shù)據(jù),得到水質(zhì)污染趨勢(shì)的n個(gè)狀態(tài)S=(S1,S2,…,Sn)。通過(guò)閾值法來(lái)設(shè)置得到水污染狀態(tài)的趨勢(shì),并依據(jù)已知數(shù)據(jù)的研究確定水質(zhì)污染程度趨勢(shì)值分布在4個(gè)狀態(tài)區(qū)間內(nèi)。當(dāng)水質(zhì)污染趨勢(shì)值ΔH>0,設(shè)置為S1(污染度急劇升高)、S2(污染度快速下降)兩個(gè)區(qū)間;水質(zhì)污染趨勢(shì)值ΔH<0時(shí),設(shè)置為S3(污染度急劇升高)、S4(污染度快速下降)兩個(gè)區(qū)間。其中,S1=(ΔHmax/2,ΔHmax);S2=(0,ΔHmax/2);S3=(ΔHmin/2,0);S4=(ΔHmin,ΔHmin/2),其中ΔHmin=min[ΔH1,ΔH2,…ΔHn-1],ΔHmax=max[ΔH1,ΔH2,…ΔHn-1]。
1.2.2建立狀態(tài)改變矩陣。將水污染程度從現(xiàn)在所處于的狀態(tài)變化到下一個(gè)階段所處狀態(tài)的數(shù)量統(tǒng)計(jì)出來(lái)。由表2可知,目前的水質(zhì)污染程度趨勢(shì)呈現(xiàn)為S1狀態(tài),下一階段仍呈現(xiàn)出S1狀態(tài)的統(tǒng)計(jì)值為n11,呈現(xiàn)出S2狀態(tài)的統(tǒng)計(jì)值n12,呈現(xiàn)出S3狀態(tài)的統(tǒng)計(jì)值n13,呈現(xiàn)出S4狀態(tài)的統(tǒng)計(jì)值n14。對(duì)于現(xiàn)在水質(zhì)污染趨勢(shì)值所呈現(xiàn)出的狀態(tài)S2、S3、S4,都使用上面的方法進(jìn)行統(tǒng)計(jì)。
表2 水污染程度狀態(tài)改變表
2結(jié)果與分析
2.1水質(zhì)污染度計(jì)算鑒于水質(zhì)污染程度的計(jì)算表達(dá)式較為復(fù)雜多變,因此對(duì)其進(jìn)行標(biāo)準(zhǔn)化,公式[11]為:
式中,max(xi)表示污染程度的最大值;min(xi)表示最小值。水質(zhì)總體污染程度變化范圍為[0,100]。通過(guò)加權(quán)求和的方法,計(jì)算出2014年5月10日~6月11日洱源縣環(huán)保局永安江的水質(zhì)污染程度(表3)。
表3 2014年5月10日~6月11日永安江水質(zhì)污染度
2.2水質(zhì)污染度趨勢(shì)值和狀態(tài)區(qū)間劃分2014年5月10日~6月5日永安江水質(zhì)污染度趨勢(shì)值見(jiàn)表4。通過(guò)訓(xùn)練表4中2014年5月10日~6月5日獲取的水質(zhì)污染度趨勢(shì)值數(shù)據(jù),計(jì)算出水質(zhì)污染變化趨勢(shì)值的狀態(tài)轉(zhuǎn)移矩陣為:
表4 2014年5月10日~6月5日永安江水質(zhì)污染度趨勢(shì)值
日期水質(zhì)污染度趨勢(shì)值日期水質(zhì)污染度趨勢(shì)值5月10日0.2355月24日-0.1445月11日0.0535月25日0.0565月12日0.0715月26日0.3395月13日0.1095月27日-0.1695月14日0.1525月28日0.0415月15日0.1145月29日0.1015月16日0.5615月30日0.1525月17日0.2615月31日-0.5815月18日0.1036月1日0.1485月19日-0.3976月2日0.1515月20日-0.2046月3日-0.5965月21日0.5846月4日0.4845月22日-0.2876月5日0.0445月23日-0.160
將剛開(kāi)始的水質(zhì)污染趨勢(shì)值對(duì)應(yīng)的向量設(shè)置為P0=(1,0,0,0)。以剛開(kāi)始設(shè)定的向量以及狀態(tài)轉(zhuǎn)移矩陣作為基礎(chǔ),從而預(yù)測(cè)2014年6月7~11日水質(zhì)污染趨勢(shì)值所處狀態(tài)的概率,得到以下方程組:
依據(jù)馬爾可夫鏈的穩(wěn)定條件求解此方程組,得到水質(zhì)污染度發(fā)展趨勢(shì)穩(wěn)定后各狀態(tài)的向量,即π=[π(1),π(2),π(3),π(4)]=(8/27,14/27,1/9,2/27)。由表5可知,基于馬爾可夫鏈的洱源縣永安江水質(zhì)污染度的預(yù)測(cè)趨勢(shì)區(qū)間前4個(gè)與實(shí)際情況相符,基本符合河流水質(zhì)污染程度趨勢(shì)的變化。說(shuō)明該模型能有效合理地判別水質(zhì)污染度的發(fā)展趨勢(shì)。
表5 2014年6月7~11日永安江水質(zhì)污染度趨勢(shì)值的預(yù)測(cè)結(jié)果
2.3馬爾可夫鏈與BP神經(jīng)網(wǎng)絡(luò)的對(duì)比在實(shí)際中,BP神經(jīng)網(wǎng)絡(luò)模型也可以用來(lái)預(yù)測(cè)水質(zhì)污染程度。依據(jù)BP神經(jīng)網(wǎng)絡(luò)模型的原理,該模型只能進(jìn)行一步預(yù)測(cè),即通過(guò)當(dāng)前狀態(tài)m以及以前狀態(tài)的預(yù)測(cè)值來(lái)預(yù)測(cè)下一狀態(tài)m+1。隨后將m+1狀態(tài)的預(yù)測(cè)值默認(rèn)為初始值來(lái)預(yù)測(cè)m+2狀態(tài)時(shí)的值,以此類(lèi)推,來(lái)預(yù)測(cè)以后的水質(zhì)污染度的變化趨勢(shì)。以洱源縣環(huán)保局永安江水質(zhì)監(jiān)測(cè)為例,將馬爾可夫鏈的水質(zhì)污染程度預(yù)測(cè)模型與BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了對(duì)比。由表6可知,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確率不及馬爾科夫鏈模型。
表6 馬爾可夫鏈模型與BP神經(jīng)網(wǎng)絡(luò)模型的誤差分析
3結(jié)論
針對(duì)現(xiàn)實(shí)中河流水質(zhì)污染嚴(yán)重影響到農(nóng)業(yè)灌溉的問(wèn)題,首先提出了水質(zhì)污染度的預(yù)測(cè)方法,然后建立基于馬爾可夫鏈的水質(zhì)污染趨勢(shì)預(yù)測(cè)模型。最后,通過(guò)選取洱源縣環(huán)保局永安江水成分的監(jiān)測(cè)數(shù)據(jù)進(jìn)行實(shí)證分析,構(gòu)建狀態(tài)空間,得到未來(lái)一段時(shí)間水質(zhì)污染度發(fā)展趨勢(shì)的預(yù)測(cè)區(qū)間,并將趨勢(shì)預(yù)測(cè)值與實(shí)測(cè)值進(jìn)行對(duì)比。結(jié)果表明,該模型可以預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)河流水質(zhì)污染程度的發(fā)展趨勢(shì),從而為水污染治理和農(nóng)業(yè)灌溉用水保護(hù)提供依據(jù)。
參考文獻(xiàn)
[1] 陳繼光,祝令德.基于神經(jīng)網(wǎng)絡(luò)的馬爾可夫預(yù)測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2006(6):225-227.
[2] 李向兵.基于BP神經(jīng)網(wǎng)絡(luò)與加權(quán)模糊的馬爾可夫的糧食預(yù)測(cè)模型[J].甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2):8-13.
[3]劉倪,葉金印.基于RBF神經(jīng)網(wǎng)絡(luò)馬爾可夫模型的淮河流域汛期暴雨量預(yù)測(cè)[J].浙江農(nóng)業(yè)科學(xué),2014(8):1256-1259.
[4] 韓曉光,李博宇,管智贇.基于灰色關(guān)聯(lián)分析指標(biāo)篩選的RBF神經(jīng)網(wǎng)絡(luò)-馬爾可夫鏈的空質(zhì)量氣預(yù)測(cè)模型[J].南開(kāi)大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2):22-27.
[5] 閆欣榮,史忠科.渭河寶雞段的水環(huán)境容量與水質(zhì)分析[J].陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,32(6):29-32.
[6] 康繼田.長(zhǎng)江水質(zhì)評(píng)價(jià)及預(yù)測(cè)的Markov 鏈模型[J].湖北工業(yè)大學(xué)學(xué)報(bào),2006,21(6):101-104.
[7] 王丙參,何萬(wàn)生,夏鴻鳴.基于馬爾可夫鏈的渭河天水段水質(zhì)預(yù)測(cè)模型[J].高師理科學(xué)刊,2012(3):4-7.
[8] THOMAS B,SOLEIMANI-MOHSENI M.Artificial neural network models for indoor temperature prediction:Investigations in two buildings [J].Neural computing & ppplications,2007,16(1):81-89.
[9] 陳振偉,王茜,黃繼紅.一種新的水質(zhì)預(yù)測(cè)模型的仿真實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2010(36):10366-10368.
[10] 陳友超.小湖(庫(kù))水質(zhì)預(yù)測(cè)模式的應(yīng)用研究[J].海峽科學(xué),2011(6):80-81.
[11] 葉宗欲.關(guān)于指標(biāo)綜合評(píng)價(jià)中指標(biāo)正向化和無(wú)量綱化方法的選擇[J].浙江統(tǒng)計(jì),2003(4):24-25.