張 萌,趙志懷,司宏宇
(1.太原理工大學(xué)水利科學(xué)與工程學(xué)院,山西太原030024;2.中國冶金地質(zhì)總局第三地質(zhì)勘查院,山西太原030002)
隨著人口的增長和社會經(jīng)濟(jì)的發(fā)展,水源地的污染愈加嚴(yán)重[1]。為加強(qiáng)水源地的環(huán)境管理和污染的治理,提高居民飲用水質(zhì)量,保障公共用水安全[2-3],政府管理人員應(yīng)清楚地了解水源地現(xiàn)狀,準(zhǔn)確掌握水質(zhì)安全狀況?,F(xiàn)行的水質(zhì)評價(jià)模型有單因子評價(jià)法、模糊評價(jià)法、神經(jīng)網(wǎng)絡(luò)法等。單因子評價(jià)法[4]過分夸大了個(gè)別較差指標(biāo)對整體水域的污染,并不能真實(shí)地反映實(shí)際水質(zhì)狀況;模糊評價(jià)法[5]是通過經(jīng)驗(yàn)賦予因子權(quán)值,結(jié)果存在很大的主觀性;BP神經(jīng)網(wǎng)絡(luò)[6]通過得到的樣本特性,預(yù)測時(shí)權(quán)值不斷修正,是一種更為客觀的模型。但傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)未對水質(zhì)影響因子進(jìn)行篩選,造成預(yù)測過程沒必要擴(kuò)展。本文使用Pearson相關(guān)系數(shù)法[7]對水質(zhì)影響因子進(jìn)行初步篩選。然而,Pearson相關(guān)系數(shù)法篩選因子時(shí)只是主觀確定一個(gè)范圍,并未對篩選的因子合理性進(jìn)行評價(jià),因此利用方差來代表指標(biāo)的信息,即信息指標(biāo)評價(jià)法[8]對需要篩選的因子進(jìn)行信息持有度分析,從而得出最佳影響因子,提高了工作效率。本文將Pearson相關(guān)系數(shù)法、信息指標(biāo)評價(jià)法和BP神經(jīng)網(wǎng)絡(luò)法稱為改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)。
以陽泉市33個(gè)水源地水質(zhì)安全預(yù)測為例。采用Pearson相關(guān)系數(shù)法計(jì)算出各個(gè)模擬因子與被模擬因子的關(guān)聯(lián)度;將關(guān)聯(lián)度從大到大進(jìn)行排列,應(yīng)用信息指標(biāo)評價(jià)法對模擬因子進(jìn)行篩選確定出最優(yōu)模擬因子;確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以28個(gè)水源地的最優(yōu)模擬因子作為訓(xùn)練樣本,5個(gè)水源地的被模擬因子作為測試樣本進(jìn)行模擬預(yù)測。同時(shí),將傳統(tǒng)的以及改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的水質(zhì)狀況綜合指數(shù)[9]與實(shí)際值進(jìn)行比較,分析改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度,驗(yàn)證本文預(yù)測模型的合理性。
Pearson相關(guān)系數(shù)法用于描述2個(gè)指標(biāo)之間的相似性,通過計(jì)算各個(gè)模擬因子與被模擬因子之間的相關(guān)系數(shù),從而得出各個(gè)模擬因子與被模擬因子的相似程度。如需得模擬因子(x1,x2,…,xn)T,被模擬因子(y1,y2,…,yn)T相關(guān)性大小,為消除模擬因子量綱,首先采用下式進(jìn)行無量綱化處理
(1)
式中,xi為各個(gè)原始模擬因子;zi為標(biāo)準(zhǔn)化后模擬因子。則模擬因子與被模擬因子之間的相關(guān)系數(shù)γ(z,y)為
(2)
式中,γ(z,y)∈[-1,1],若γ(z,y)>0表示x、y是正相關(guān);若γ(z,y)<0表示x、y是負(fù)相關(guān);γ(z,y)的絕對值越接近1,表現(xiàn)出x、y相關(guān)性的越大。
變異系數(shù)法使用方差大小來代表模擬因子攜帶信息的多少,從而對模擬因子進(jìn)行賦權(quán)[10]。因此,在評價(jià)篩選的因子是否合理時(shí),也可用方差的大小來評判。具體做法如下:
將m個(gè)模擬因子與被模擬因子y的γ(z,y)求出,按照其相關(guān)系數(shù)從大到小進(jìn)行排列,從而得出下面的模擬因子與被模擬因子的集合矩陣ω
(3)
式中,zij表示第i個(gè)模擬因子的第j個(gè)樣本值;yj表示第j個(gè)樣本的被模擬因子。定義信息持有度R為前i個(gè)模擬因子含有的信息量Si占m個(gè)總模擬因子含有的信息量Sm的比例,即
(4)
式中,zi為第i個(gè)模擬因子值;zm為第m個(gè)模擬因子值;E(zi)為前n個(gè)模擬因子的算術(shù)平均值;E(zm)為m個(gè)總模擬因子的算術(shù)平均值。
對i值進(jìn)行試算。當(dāng)R>N時(shí)(N為參考值),對應(yīng)最小的i值即是最優(yōu)模擬因子個(gè)數(shù),前i個(gè)模擬因子為最優(yōu)預(yù)測因子。在主成分分析理論中,保留累計(jì)方差貢獻(xiàn)率達(dá)到80% 以上,即信息含量較大的主成分,表示全部原始指標(biāo)信息的絕大多數(shù)得到了反映[11]。借助此思想,N取80%。
BP神經(jīng)網(wǎng)絡(luò)是1個(gè)至少為3層的導(dǎo)師學(xué)習(xí)式的神經(jīng)網(wǎng)絡(luò),其訓(xùn)練是通過信號正傳播和誤差逆?zhèn)鞑ミM(jìn)行的[12]。同時(shí),能反映模擬因子和被模擬因子的非線性關(guān)系,適合用于水質(zhì)預(yù)測。BP神經(jīng)網(wǎng)絡(luò)的工作原理見圖1。
圖1 BP神經(jīng)網(wǎng)絡(luò)工作原理
輸入層:輸入層通常為模擬因子,本文中輸入層的因子個(gè)數(shù)為最優(yōu)模擬因子數(shù)。
隱含層:對隱含層的節(jié)點(diǎn)數(shù)目前沒有統(tǒng)一的確定方法,一般取為輸入層節(jié)點(diǎn)數(shù)的75%[13]。按照這個(gè)比例,選取幾個(gè)可能的節(jié)點(diǎn)數(shù)試驗(yàn),最終確定最優(yōu)隱含層的節(jié)點(diǎn)數(shù)。
表1 示例數(shù)據(jù)
輸出層:輸出層節(jié)點(diǎn)的個(gè)數(shù)和被模擬因子個(gè)數(shù)相等,本文等于1。
本文采用山西省陽泉市水務(wù)局2015年陽泉市地下水調(diào)查的33個(gè)地下水水源地水質(zhì)資料為基礎(chǔ)數(shù)據(jù),并以28個(gè)水源地的總硬度、硫酸鹽、氯化物、氨氮、錳、溶解性總固體、鎘、汞、揮發(fā)酚、氟化物等10個(gè)監(jiān)測值為模擬因子,5個(gè)水源地對應(yīng)的水質(zhì)狀況綜合指數(shù)WQI為被模擬因子。由于篇幅有限,本文只列出部分?jǐn)?shù)據(jù),示例數(shù)據(jù)見表1。
根據(jù)式(1)對監(jiān)測值進(jìn)行均值標(biāo)準(zhǔn)化,采用式(2)計(jì)算各個(gè)模擬因子的相關(guān)性,得出的結(jié)果從大到小排列,見表2。選取不同的模擬因子的個(gè)數(shù),即i值,代入式(4)進(jìn)行計(jì)算,得到不同模擬因子個(gè)數(shù)下的信息持有度R。模擬因子數(shù)i與信息持有度R關(guān)系見表3。由表3得出,當(dāng)R大于80%時(shí),模擬因子數(shù)i的最小取值為8,模擬因子確定為揮發(fā)酚、汞、錳、鎘、溶解性總固體、硫酸鹽、總硬度、氟化物。
本次建模采用的網(wǎng)絡(luò)結(jié)構(gòu)輸入層數(shù)為8,按照輸入節(jié)點(diǎn)的75%比例,選取幾個(gè)可能的節(jié)點(diǎn)試驗(yàn),確定隱含層節(jié)點(diǎn)數(shù)為6,輸出層為1。因此,改進(jìn)的BP模型的最終結(jié)構(gòu)為8- 6-1。
本文以28個(gè)水源地的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),5個(gè)水源地的數(shù)據(jù)作為測試數(shù)據(jù)。應(yīng)用改進(jìn)的以及傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測得到水質(zhì)狀況綜合指數(shù)進(jìn)而得到的水質(zhì)指數(shù),與水源地實(shí)際的水質(zhì)狀況綜合指數(shù)和水質(zhì)指數(shù)相比較。水質(zhì)狀況綜合指數(shù)、水質(zhì)指數(shù)對比結(jié)果分別見表4、5。
表2 模擬因子相關(guān)性
表3 模擬因子數(shù)i與信息持有度R關(guān)系
表4 水質(zhì)狀況綜合指數(shù)對比
表5 水質(zhì)指數(shù)對比
從表4可知,傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值與實(shí)際值的平均相對誤差為5.44%,改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型的平均相對誤差為3.80%,傳統(tǒng)模型預(yù)測精度低于改進(jìn)模型。從表5可知,傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型得出的水質(zhì)指數(shù)與實(shí)際值偏差率為40%,而改進(jìn)模型偏差率為0。這是由于傳統(tǒng)模型將一些對水質(zhì)安全影響較低的因子也加入預(yù)測,擴(kuò)展了模型結(jié)構(gòu),訓(xùn)練效率降低,容錯(cuò)性下降,而改進(jìn)模型合理地克服了這個(gè)缺點(diǎn)。因此,改進(jìn)模型進(jìn)行地下水水質(zhì)安全預(yù)測時(shí)更加符合實(shí)際。
改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型對水質(zhì)安全評價(jià)是以Ⅲ類水質(zhì)標(biāo)準(zhǔn)為評價(jià)依據(jù)。水源地水質(zhì)安全見圖2。從圖2可知,對柏井、白羊墅和龍莊水源地,傳統(tǒng)模型和本文模型都可得出正確水質(zhì)指數(shù),水質(zhì)指數(shù)點(diǎn)完全重合;對亂流和程家水源地,本文模型預(yù)測值與實(shí)際水質(zhì)完全一致,傳統(tǒng)模型預(yù)測值比實(shí)際水質(zhì)差一個(gè)級別,成為Ⅲ類水。水源地水質(zhì)全部在安全標(biāo)準(zhǔn)線之下,即陽泉市水源地水質(zhì)狀況較好,水源地為安全級別[14]。
圖2 水源地水質(zhì)安全
本文以陽泉市地下水水源地水質(zhì)為例,利用Pearson相關(guān)系數(shù)、信息指標(biāo)評價(jià)法和BP神經(jīng)網(wǎng)絡(luò)建立改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型對水質(zhì)進(jìn)行預(yù)測,得出以下結(jié)論:
(1)采用Pearson相關(guān)系數(shù)理論獲得陽泉市地下水飲用水水源地的水質(zhì)信息特征,利用信息指標(biāo)評價(jià)法可以避免人為主觀確定范圍選定最優(yōu)模擬因子的特點(diǎn)。通過Pearson相關(guān)系數(shù)和信息指標(biāo)評價(jià)法篩選指標(biāo),簡化了BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提高了預(yù)測效率。
(2)改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的水質(zhì)狀況綜合指數(shù)平均相對誤差為3.80%,水質(zhì)指數(shù)平均相對誤差為0%,精度高于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型。
(3)陽泉市水源地水質(zhì)為安全級別。改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型可以在一定精度上對地下水飲用水水源地水質(zhì)狀況進(jìn)行定量化的預(yù)測,可更加快速客觀地得出的水質(zhì)指數(shù),對含有多個(gè)評價(jià)指標(biāo)的多個(gè)地下水飲用水水源地水質(zhì)安全預(yù)測具有實(shí)用性。
[1] 酈建強(qiáng), 王建生, 顏勇. 我國水資源安全現(xiàn)狀與主要存在問題分析[J]. 中國水利, 2011(23): 42- 51.
[2] 侯俊, 王超, 蘭林, 等. 我國飲用水水源地保護(hù)法規(guī)體系現(xiàn)狀及建議[J]. 水資源保護(hù), 2009, 25(1): 79- 82, 85.
[3] 李揚(yáng). 山西省農(nóng)村飲水安全現(xiàn)狀及對策措施[J]. 山西水利, 2016, 32(8): 21- 22.
[4] 羅孝芹, 張強(qiáng), 陳麗影, 等. 基于單因子指數(shù)法的貴陽市南明河上游區(qū)綜合水質(zhì)評價(jià)[J]. 地下水, 2016, 38(1): 80- 82.
[5] 孫旺旺, 任傳勝, 朱春偉. 基于模糊RBF神經(jīng)網(wǎng)絡(luò)的地表水環(huán)境質(zhì)量評價(jià)[J]. 水力發(fā)電, 2013, 39(11): 1- 3.
[6] 穆征, 王方勇, 李靜, 等. 基于模糊綜合評價(jià)模型的河流水質(zhì)綜合評價(jià)[J]. 水力發(fā)電, 2009, 35(4): 11- 13.
[7] 葛芳君, 趙磊, 劉俊, 等. 基于Pearson相關(guān)系數(shù)的老年人社會支持與心理健康相關(guān)性研究的Meta分析[J]. 中國循證醫(yī)學(xué)雜志, 2012, 12(11): 1320- 1329.
[8] 顧在浜, 石寶峰, 遲國泰. 基于聚類-灰色關(guān)聯(lián)分析的綠色產(chǎn)業(yè)評價(jià)指標(biāo)體系構(gòu)建[J]. 資源開發(fā)與市場, 2013, 29(4): 350- 354.
[9] 水利部水利水電規(guī)劃設(shè)計(jì)總院. 全國城市飲用水水源地安全狀況評價(jià)技術(shù)細(xì)則[R]. 北京: 水利部水利水電規(guī)劃設(shè)計(jì)總院, 2005.
[10] 張小泓. 基于變異系數(shù)法的灰色關(guān)聯(lián)模型在節(jié)水灌溉工程投標(biāo)方案優(yōu)選中的應(yīng)用[J]. 節(jié)水灌溉, 2009(8): 54- 56.
[11] 趙夢杰, 蔣曉輝, 姚文藝, 等. 影響黑河正義峽斷面下泄水量的主導(dǎo)因子分析[J]. 人民黃河, 2016, 38(1): 56- 59.
[12] 郭琦, 何湘君. 基于BP神經(jīng)網(wǎng)絡(luò)的水電工程定額編制模型研究[J]. 人民長江, 2016, 47(5): 69- 72.
[13] 唐啟義, 馮明光. DPS數(shù)據(jù)處理系統(tǒng)[M]. 北京: 科學(xué)出版社, 2006.
[14] 朱黨生, 張建永, 程紅光, 等. 城市飲用水水源地安全評價(jià)(Ⅰ): 評價(jià)指標(biāo)和方法[J]. 水利學(xué)報(bào), 2010, 41(7): 778- 785.