張彥
(保定水文水資源勘測局,河北保定 071003)
基于BP神經(jīng)網(wǎng)絡(luò)在白洋淀水質(zhì)綜合評價中的應(yīng)用
張彥
(保定水文水資源勘測局,河北保定 071003)
選用2012年為現(xiàn)狀年,應(yīng)用BP神經(jīng)網(wǎng)絡(luò)建立白洋淀水質(zhì)綜合評價模型,用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型對白洋淀各監(jiān)測斷面的水質(zhì)現(xiàn)狀進行類別評價。結(jié)果顯示,與單因素評價法相比,BP神經(jīng)網(wǎng)絡(luò)法是一種更加客觀、有效和實用的環(huán)境質(zhì)量評價方法。
BP神經(jīng)網(wǎng)絡(luò);水質(zhì)綜合評價;白洋淀
白洋淀位于河北省中部、保定市以東的安新縣附近,地處北京、天津和石家莊3市的三角形中心位置[1],是在太行山前的永定河和滹沱河沖積扇交匯處的扇緣洼地上匯水形成,匯集了唐河、府河、潴龍河等9條徑流[1],是華北地區(qū)最大的淡水濕地,也是我國東部地區(qū)典型的淺水型湖泊,總面積366km2,由143個淀泊、3700多條溝壑組成,水域面積約占50%,被譽為“華北之腎”。同時,白洋淀對緩滯洪水、蓄水灌溉、調(diào)節(jié)氣候、補充地下水、維持生物多樣性和生態(tài)平衡等起到了極其重要的作用。
目前,由于白洋淀上游及周邊工礦企業(yè)的增加,保定市城市污水的匯入,淀區(qū)內(nèi)網(wǎng)箱養(yǎng)魚規(guī)模的增加,以及受天然入淀水量的限制,白洋淀水質(zhì)逐年惡化,已成為影響淀區(qū)周邊地區(qū)人民生活以及經(jīng)濟持續(xù)發(fā)展的重大隱患。
河湖水質(zhì)受外界影響因素眾多,各影響因子之間關(guān)系又比較復(fù)雜并且呈現(xiàn)非線性,因此至今尚無統(tǒng)一的水質(zhì)綜合評價模型。近10年來,人工神經(jīng)網(wǎng)絡(luò)得到迅速發(fā)展[2-3],其應(yīng)用己經(jīng)深入到各個領(lǐng)域。而其中的BP神經(jīng)網(wǎng)絡(luò)具有建立任意輸入與輸出的非線性映射功能以及能模仿人腦進行自識別、自組織、實時學(xué)習(xí)等特點,已經(jīng)在湖庫的水質(zhì)綜合評價和預(yù)測中得到廣泛應(yīng)用?;谀壳吧袩o針對保定市白洋淀水質(zhì)的BP神經(jīng)網(wǎng)絡(luò)綜合評價模型,筆者采用Matlab人工神經(jīng)網(wǎng)絡(luò)工具箱,建立一個能對湖泊水質(zhì)作出正確評價的BP神經(jīng)網(wǎng)絡(luò)模型,并對白洋淀水質(zhì)現(xiàn)狀作出客觀的評價,以期為有效保護和治理白洋淀污染提供決策依據(jù)。
人工神經(jīng)網(wǎng)絡(luò),是對生物或自然的神經(jīng)網(wǎng)絡(luò)的抽象和模擬,是一種非線性動力學(xué)系統(tǒng)[4]。人工神經(jīng)網(wǎng)絡(luò)模型具有非線性、非局限性、非常定性、非凸性等四大基本特征,可以對信息進行分布存儲及并行處理,具有自組織、自適應(yīng)、實時學(xué)習(xí)的能力。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)得到廣泛應(yīng)用,在機器人控制、模式識別、圖像處理、自動控制、優(yōu)化組合、生物醫(yī)學(xué)工程等許多領(lǐng)域取得了令人鼓舞的進展,并已日趨成熟,具有極重要的理論和應(yīng)用價值[5]。
BP神經(jīng)網(wǎng)絡(luò)是以D.E.Rumelhart和J.L.McCelland為首的科學(xué)家小組在1986年提出的,按照誤差逆向傳播算法訓(xùn)練的一種多層前饋型網(wǎng)絡(luò),是目前在人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。由于BP網(wǎng)絡(luò)的神經(jīng)元通常采用sigmoid型可微函數(shù)作為傳遞函數(shù),因此就能實現(xiàn)輸入層和輸出層之間的任意非線性映射,這使其在非線性預(yù)測、模式識別、特征提取等許多領(lǐng)域有著更為廣泛的應(yīng)用[6]。
BP網(wǎng)絡(luò)模型結(jié)構(gòu)比較簡單,一般分為3層,第1層為輸入層、中間層為1個或多個隱含層,第3層為輸出層。神經(jīng)網(wǎng)絡(luò)的每層都包含若干個神經(jīng)元,前、后層之間各神經(jīng)元完全連接,而每層的各個神經(jīng)元之間沒有連接。3層前向網(wǎng)絡(luò),即隱層只有1個的BP神經(jīng)網(wǎng)絡(luò),被認為是對模擬輸入、輸出的相似關(guān)系最為適用,是在人工神經(jīng)網(wǎng)絡(luò)中算法最為成熟,應(yīng)用最為廣泛的一種[7]。圖1是常見的3層BP網(wǎng)絡(luò)的結(jié)構(gòu)。
圖1 BP神經(jīng)網(wǎng)
BP網(wǎng)絡(luò)算法的自學(xué)習(xí)過程是由信息正向傳播和誤差反向傳播兩部分組成。首先網(wǎng)絡(luò)通過正向傳播,將樣本數(shù)據(jù)由輸入層經(jīng)各隱含層神經(jīng)元逐層處理,傳到輸出層,如果實際輸出誤差達不到期望誤差,網(wǎng)絡(luò)就將輸出誤差反向傳播,網(wǎng)絡(luò)就是這樣通過不斷將訓(xùn)練輸出與實際輸出相對比,按照誤差梯度下降的方式對各層神經(jīng)元的權(quán)值或域值進行調(diào)整,從而使訓(xùn)練輸出與實際值之間的誤差不斷減小,直至到達所需誤差。
2.1.1 網(wǎng)絡(luò)層數(shù)的確定
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一般由輸入層、隱含層和輸出層3個部分組成。BP網(wǎng)絡(luò)被證明具有很強的映射功能,BP定理[8]在理論上證明了:任一連續(xù)函數(shù)或映射均可用BP三層網(wǎng)絡(luò)加以實現(xiàn)。Kolmogorov定理[9]及Cybenko定理[10]都證明了對于具有足夠多的隱含層神經(jīng)元數(shù)的三層前饋型網(wǎng)絡(luò)可以在任意的精度下逼近1個實數(shù)值的連續(xù)函數(shù)。因此,在考慮滿足精度要求和減少學(xué)習(xí)時間的情況下,本文的神經(jīng)網(wǎng)絡(luò)模型選擇1個隱含層的三層神經(jīng)網(wǎng)絡(luò)模型。
2.1.2 輸入層神經(jīng)元數(shù)的確定
神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元為水質(zhì)評價指標(biāo),輸入層神經(jīng)元的個數(shù)則等于所選取的評價指標(biāo)數(shù)目。本文通過白洋淀實際水質(zhì)監(jiān)測結(jié)果,最終確定了化學(xué)需氧量(COD)、五日生化需氧量(BOD5)、氨氮(NH3-N)、總磷(TP)、總氮(TN)等影響水質(zhì)分級的主要因子作為建立評價模型的主要參數(shù)指標(biāo)。
本文建立的水質(zhì)評價模型的輸入層設(shè)有5個神經(jīng)元。
2.1.3 隱含層節(jié)點數(shù)的確定
目前BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點數(shù)的選取還沒有理論上的指導(dǎo),需根據(jù)實際情況進行對比選取。常用的經(jīng)驗公式主要有以下兩種:
式中ny為隱含層節(jié)點數(shù);n為輸入層節(jié)點數(shù)。
式中ny為隱含層節(jié)點數(shù);n為輸入層節(jié)點數(shù);m為輸出層節(jié)點數(shù);常數(shù)a=1~10。
本文對隱含層節(jié)點數(shù)的選取方法是根據(jù)以上經(jīng)驗公式進行推算,考慮到由經(jīng)驗公式確定的隱含層節(jié)點數(shù)過于保守,因此,在以經(jīng)驗公式推算值作為初始值的基礎(chǔ)上,在設(shè)定的范圍內(nèi)對隱層節(jié)點數(shù)進行循環(huán)遞增運算,以模型的誤差為目標(biāo)函數(shù),經(jīng)試算,最終確定本文的網(wǎng)絡(luò)模型隱層結(jié)點數(shù)為20。
2.1.4 網(wǎng)絡(luò)輸出與輸出層神經(jīng)元數(shù)的確定
GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》[11]中規(guī)定的地表水環(huán)境質(zhì)量類別共分為5級,另外鑒于白洋淀部分水域水質(zhì)現(xiàn)狀較差,增加劣V類水質(zhì)標(biāo)準(zhǔn),所以水質(zhì)類別共分為6級,分別用0.1~0.6的間隔為0.1的6個小數(shù)代替,作為網(wǎng)絡(luò)輸出。由于每類水質(zhì)標(biāo)準(zhǔn)對應(yīng)相應(yīng)的水質(zhì)類別,所以輸出層神經(jīng)元數(shù)應(yīng)為1。
2.1.5 訓(xùn)練樣本的選擇和預(yù)處理
本研究選用2012年為現(xiàn)狀年,對白洋淀13個水質(zhì)采樣點(監(jiān)控斷面分布見圖2)水質(zhì)指標(biāo)的年平均數(shù)據(jù)進行分析。各采樣點樣品的采集和測試按照《水環(huán)境監(jiān)測規(guī)范》[12]由保定水環(huán)境監(jiān)測中心完成。數(shù)據(jù)處理軟件及其版本為Matlab R2010a。
圖2 白洋淀水質(zhì)監(jiān)測斷面分布簡圖
根據(jù)GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》中規(guī)定的分類等級,各類水質(zhì)的環(huán)境指標(biāo)濃度均有限值,只要所要評價的指標(biāo)處于各類水質(zhì)的濃度限值范圍內(nèi),該水質(zhì)就是其相應(yīng)的類別。由于用標(biāo)準(zhǔn)作為訓(xùn)練樣本數(shù)量較小,為保證本模型的正確性和可靠度,本文用unifrnd函數(shù)在水質(zhì)相應(yīng)類別限值范圍內(nèi)進行隨機插值,生成足夠多屬于各類水質(zhì)類別的訓(xùn)練樣本,然后打亂生成的數(shù)據(jù)順序再重新進行輸入,這樣數(shù)據(jù)就更加具有典型性和更優(yōu)良的泛化能力。
本文對6個水質(zhì)類別的指標(biāo)分級區(qū)間內(nèi)隨機插值生成200個樣本,共獲得1200個樣本。
為了加快網(wǎng)絡(luò)的收斂速度,根據(jù)輸入樣本的數(shù)量級范圍的差異程度,有必要對這些數(shù)據(jù)進行變換處理,用Matlab自帶的mapminmax歸一化函數(shù)對輸入樣本進行規(guī)范化處理,歸一化的范圍為[0,1]。
網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練樣本及輸出值確定后,接下來開始建立BP網(wǎng)絡(luò)。采用newff函數(shù)來生成BP網(wǎng)絡(luò),在生成網(wǎng)絡(luò)的同時,該函數(shù)自動對網(wǎng)絡(luò)各層的初始值和閥值進行了初始化。選用tansig函數(shù)建立輸入層和隱層函數(shù)間的對應(yīng)關(guān)系,選用purelin函數(shù)建立隱層和輸出層之間的對應(yīng)關(guān)系,選用trainlm函數(shù)作為訓(xùn)練函數(shù)。接著對網(wǎng)絡(luò)的訓(xùn)練參數(shù)進行設(shè)置。設(shè)定最大訓(xùn)練次數(shù)為1000次,學(xué)習(xí)速率為0.01,期望誤差為1e-5,最大失敗步數(shù)設(shè)為100。在設(shè)置完訓(xùn)練參數(shù)之后,調(diào)用train函數(shù)對BP網(wǎng)絡(luò)進行訓(xùn)練。圖3為BP神經(jīng)網(wǎng)絡(luò)模型分別在訓(xùn)練樣本、檢驗樣本和測試樣本上的均方誤差變化曲線。
圖3 BP神經(jīng)網(wǎng)絡(luò)均方誤差
從圖3中可以看出,算法經(jīng)過370步訓(xùn)練達到了期望誤差,證明了其收斂速度很迅速。另外,檢驗樣本和測試樣本兩者的均方誤差曲線的變化趨勢是一致的,說明網(wǎng)絡(luò)具有很強的泛化能力,完全可以用來作評價。
Matlab神經(jīng)網(wǎng)絡(luò)工具箱訓(xùn)練結(jié)果還給出了3組樣本的實際輸出與期望輸出線性回歸分析,結(jié)果如圖4所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)實際輸出與期望輸出的回歸分析
從圖4中可以看出,訓(xùn)練樣本和檢驗樣本的實際輸出y與期望輸出t的相關(guān)系數(shù)均達到了0.9998,而測試樣本的實際輸出y與期望輸出t的相關(guān)系數(shù)更是達到了0.9999。同樣可以表明,經(jīng)上述樣本訓(xùn)練后得到的神經(jīng)網(wǎng)絡(luò)模型對訓(xùn)練樣本、檢驗樣本和測試樣本具有很高的擬合能力,即該神經(jīng)網(wǎng)絡(luò)的泛化能力很強。至此,基于BP神經(jīng)網(wǎng)絡(luò)的白洋淀水質(zhì)綜合評價模型建立完成,可以很好地用于評價未知樣本。
將白洋淀13個監(jiān)測站點的水質(zhì)監(jiān)測數(shù)據(jù)作為系統(tǒng)輸入,由已訓(xùn)練好BP網(wǎng)絡(luò)模型對它們進行評價,按照其輸出值與期望值的接近程度,決定其歸屬哪一級,評價結(jié)果見表1。作為對比,在表1最后一列還列出了用GB3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》進行的單因素法評價。
表1 白洋淀監(jiān)測站點水質(zhì)綜合評價結(jié)果
由表1的評價結(jié)果得知,BP網(wǎng)絡(luò)評價結(jié)果為S1、S3、S4水質(zhì)最差,為劣Ⅴ類標(biāo)準(zhǔn),S2、S6、S7、S8為Ⅴ類標(biāo)準(zhǔn),其余均為Ⅳ類標(biāo)準(zhǔn);通過比較可以得出:絕大部分單因素法評價的水質(zhì)類別都比相應(yīng)的BP網(wǎng)絡(luò)評價的類別要高,這是因為單因素評價法只是根據(jù)污染程度最嚴(yán)重因子來判斷水質(zhì)類別,而BP神經(jīng)網(wǎng)絡(luò)法則是通過對所有參評因子進行學(xué)習(xí)訓(xùn)練而得出的一種綜合評價結(jié)果,顯然比單因素評價法評價的結(jié)果更為客觀。
另外,從地理位置上看,S1為保定市區(qū)排污入淀控制斷面,由于城市污水處理力度不夠,導(dǎo)致大量的污染物流入白洋淀,以致該斷面附近水體污染程度非常嚴(yán)重;S4斷面距離S1斷面最近,受S1水質(zhì)的影響,其水體污染程度也非常嚴(yán)重;S3斷面污染程度嚴(yán)重的主要原因是由該水域水產(chǎn)養(yǎng)殖所致;由整體趨勢看,白洋淀水質(zhì)污染程度自白洋淀入口向淀區(qū)方向呈現(xiàn)輻射狀減小趨勢,由此說明,白洋淀主要為點源污染,污染源為保定市城市生產(chǎn)生活的污廢水。
綜合BP網(wǎng)絡(luò)評價的結(jié)果不難看出白洋淀的水質(zhì)狀況已經(jīng)很嚴(yán)重了,亟待有關(guān)部門采取相應(yīng)的治理措施。
(1)BP神經(jīng)網(wǎng)絡(luò)具有自組織、自學(xué)習(xí)、自適應(yīng)能力,能夠?qū)W習(xí)和存儲大量的輸入和輸出模式映射關(guān)系,因而能客觀地反映系統(tǒng)內(nèi)部的本質(zhì)特征,避免了主觀隨意性。與單因素法相比,彌補了單因素法只根據(jù)污染程度最重的因子來確定水質(zhì)類別的不足,因此,用基于BP神經(jīng)網(wǎng)絡(luò)的水質(zhì)綜合評價模型對白洋淀進行水質(zhì)評價,結(jié)果更客觀、更合理。
(2)成功建立白洋淀BP神經(jīng)網(wǎng)絡(luò)水質(zhì)綜合評價模型,利用該模型對白洋淀水質(zhì)進行綜合評價,由結(jié)果可知,白洋淀淀區(qū)水質(zhì)都在Ⅳ類水及以上,入淀控制斷面及其周邊甚至達到了劣于Ⅴ類水標(biāo)準(zhǔn),再加上受自然入淀水量不足影響,白洋淀水質(zhì)的污染程度將日益加劇。因此,建議加大保定市城市污水處理和再利用程度,加大水資源利用程度,合理調(diào)度水資源,進一步改善白洋淀水生態(tài)環(huán)境。
[1]朱宣清,弓冉,穆仲義,等.白洋淀環(huán)境演變及預(yù)測[M].西安:西安地圖出版社,1994.
[2]胡守仁,余少波,戴葵.神經(jīng)網(wǎng)絡(luò)導(dǎo)論[M].長沙:國防科學(xué)技術(shù)大學(xué)出版社,1993.
[3]張立明.人工神經(jīng)網(wǎng)絡(luò)的模型及其應(yīng)用[M].上海:復(fù)旦大學(xué)出版社,1993.
[4]閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進化計算[M].北京:清華大學(xué)出版社,2005.
[5]楊建剛.人工神經(jīng)網(wǎng)絡(luò)實用教程[M].杭州:浙江大學(xué)出版社,2001.
[6]許東,吳錚.基于MATLAB 6.x的系統(tǒng)分析與設(shè)計[M].西安:西安電子科技大學(xué)出版社,2002.
[7]王旭.人工神經(jīng)元網(wǎng)絡(luò)原理與應(yīng)用[M].沈陽:東北大學(xué)出版社,2000.
[8]Hecht-Nielsen R.Theory of the Back Propagation Neural Network[J].Proc of IJCNN,1989(1):593-603.
[9]Kolmogorov A.V On the representation of continuous functions of several variables by superposition of continuous functions of one variable and addition[J].Doklady Akademii. NaukUSSR,1957(114):303-314.
[10]Cybenko G.Approximation by superposition of a sigmoidal function[J].Math control signals systems,1989(2):303-314.
[11]GB3838—2002,地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)[S].
[12]SL 219—98,水環(huán)境監(jiān)測規(guī)范[S].
Comprehensive Assessment of Water Quality Based on BP Neural Network in Baiyangdian Lake
ZHANG Yan
(The Hydrology Water Resource Surveys Bureau of Baoding,Baoding 071003,China)
Selected 2012 as the present year,the paper establishes a comprehensive assessment of water quality model in Baiyangdian lake by BP neural network,and then makes a assessment of water quality classification for each water monitoring sites of Baiyangdian lake by the trained BP neural network model.The results show that:compared with single factor evaluation,BP neural network method is an objective,effective and practical environmental quality evaluation method.
BP neural network;comprehensive assessment of water quality;Baiyang lake
X824
B
1672-9900(2014)03-0063-04
2014-01-26
張彥(1979-),男(漢族),河北遷安人,工程師,主要從事水質(zhì)化驗工作,(Tel)18932653658。