劉 瀚,蔡旺煒,夏志昌,董 旭
(1.河海大學農(nóng)業(yè)工程學院,南京 210098;2.溫州市水利局,浙江 溫州 325000)
水源地是以維系生態(tài)平衡為基礎(chǔ)要求,同時提供動植物生長與人類生產(chǎn)生活用水的復雜系統(tǒng)。維護水源地水源健康是保證飲水安全與農(nóng)業(yè)生產(chǎn)的重要基礎(chǔ)[1-2]。2012年環(huán)保部辦公廳印發(fā)《全國集中式生活飲用水水源地水質(zhì)監(jiān)測實施方案》(環(huán)辦函[2012]1266號)提出,要全面、客觀、準確地掌握我國集中式生活飲用水水源地水質(zhì)狀況及變化趨勢,保障用水安全。因此,科學準確地判斷水源地健康風險并進行趨勢預測和分析顯得尤為重要。
近年來,相關(guān)學者在水源健康的評價方法上不斷推陳出新[3]。劉志明等基于灰色預測模型預測了區(qū)域水資源承載力[4],陳潔等基于三角模糊數(shù)對地下水源水環(huán)境健康進行了風險評價[5],衛(wèi)召基于神經(jīng)網(wǎng)絡對南水北調(diào)中線工程的水質(zhì)進行了評價和預測[6]。然而,目前國內(nèi)水源地健康風險的評價大多仍停留在水質(zhì)、水量的層面[7],預測方法也存在精度不高、過于繁雜等缺點。神經(jīng)網(wǎng)絡算法在進行水源健康評價時,往往只局限于5類水質(zhì)評價標準,收斂次數(shù)少,結(jié)果范圍廣,難以發(fā)揮其高計算速度、高計算精度的優(yōu)點。
本文擬根據(jù)珊溪(趙山渡)水庫實測資料,結(jié)合國內(nèi)外相關(guān)條例與評估經(jīng)驗,從多方面構(gòu)建水源地健康風險綜合評價指標體系?;贐P神經(jīng)網(wǎng)絡算法,結(jié)合綜合權(quán)重評價法的具體數(shù)值結(jié)果作為健康預測目標結(jié)果,建立水庫水源地健康風險預測模型,實現(xiàn)對水庫水源健康的科學評價,為庫區(qū)居民的工農(nóng)業(yè)用水安全提供保障。
2.1 研究區(qū)概況
珊溪(趙山渡)庫區(qū)位于浙江省南部,界于北緯27°36′~27°50′、東經(jīng)119°47′~120°15′,規(guī)劃區(qū)行政總面積為2 326.14km2,集水面積2 076.6 km2,主要由珊溪水庫和趙山渡引水工程兩部分組成。該庫區(qū)以城市供水和灌溉為主,兼有發(fā)電和防洪等功能,是典型的水庫型集中水源地[8-9]。近年來,其上游社會經(jīng)濟的發(fā)展帶來了諸多水污染問題,對水源健康構(gòu)成了潛在威脅。
本文按照其地理位置及行政區(qū)劃設(shè)置了12個有代表性的監(jiān)測點位,如圖1所示,并以此將庫區(qū)分為珊溪、黃坦坑、峃作口、三插溪1、洪口溪、三插溪2、莒江溪、飛云江、泗溪、桂溪、趙山渡和玉泉溪,共12片水域。
圖1 監(jiān)測點位分布圖Fig.1 Distribution of monitoring points
2.2 數(shù)據(jù)來源
本研究按照春夏秋冬不同季節(jié),分別于2017年7月、2017年10月、2018年1月、2018年4月、2018年7月、2018年10月先后對珊溪水庫全庫區(qū)開展了6次現(xiàn)場調(diào)查、監(jiān)測、取樣和資料收集。每次主要調(diào)查土壤、植被、水體環(huán)境、浮游生物等,收集水文、水質(zhì)監(jiān)測資料。
評價體系的建立主要依托于《全國重要飲用水水源地安全保障評估指標的指南(2015.4)》《浙江省水功能水環(huán)境功能區(qū)劃分方案(2005.12)》《地表水環(huán)境質(zhì)量標準(GB3838-2002)》等。
2.3 方法介紹
2.3.1 綜合權(quán)重評價法
在水源地健康評價的過程中,需要對不同的指標賦予不同的權(quán)重來反映指標的相對重要程度,以增強評價結(jié)果的準確性和可靠性。本文采取綜合權(quán)重評價法,綜合考慮主觀權(quán)重和客觀權(quán)重。主觀權(quán)重是河道管理人員根據(jù)現(xiàn)實情況,邀請熟悉情況的專家人員對各指標進行打分,根據(jù)分值計算權(quán)重??陀^權(quán)重即根據(jù)粗糙集理論[10~12]進行權(quán)重計算。
2.3.1.1 客觀權(quán)重的計算
(1)
σR(xi)=γR(D)-γR-{ri}(D)(i=1,2,…,n)
(2)
(3)
式中,γR(D)表示決策屬性集D對條件屬性集R的依賴度,γR-{ri}(D)表示決策屬性集D缺失i屬性時對條件屬性集R的依賴度,γR(D)與γR-{ri}(D)的差值σR(xi)表示第i個屬性對系統(tǒng)的重要度。crad表示集合元素個數(shù)計算函數(shù),PR(D)表示全體樣本的集合U關(guān)于條件屬性R的正域。
2.3.1.2 主觀權(quán)重的計算
(4)
式中,R(xi)表示第i個指標的專家打分總分,n表示專家人數(shù)。
2.3.1.3 綜合權(quán)重的計算
在計算粗糙集權(quán)重的同時,加入主觀賦權(quán)的方法,以取得更加合理的屬性權(quán)重。對應各指標不同屬性,加入不同的調(diào)整參數(shù)η(0≤η≤1),結(jié)合主客觀權(quán)重,求出綜合權(quán)重[13]。由此得出綜合權(quán)重(ωi)的公式為:
(5)
式中,η反映了決策過程中,決策者對每個指標的客觀權(quán)重和主觀權(quán)重的偏好程度。η越大則表明決策者對該屬性重視主觀賦權(quán);η越小則表明決策者更看中客觀求得的權(quán)重。
水源地健康狀態(tài)是一個定性指標,需要對其量化,以建立評價指標指數(shù)與和水源地風險等級之間的關(guān)系。通過綜合權(quán)重的計算及指標數(shù)值的歸一化處理,得到水源地健康風險綜合指數(shù)在0~1之間的數(shù)值結(jié)果。
2.3.2 基于Matlab的BP神經(jīng)網(wǎng)絡模型
BP神經(jīng)網(wǎng)絡(Back Propagation Neural Network)由眾多的神經(jīng)元可調(diào)連接權(quán)值連接而成,利用梯度搜索技術(shù),以使網(wǎng)絡的實際輸出值和期望輸出值的誤差均方差最小[14]。本文按照有導師學習的學習方式對訓練樣本進行信息處理,網(wǎng)絡經(jīng)過對樣本的訓練得到參數(shù)優(yōu)化后的參考模型,進而用于解決實際問題。本文設(shè)置該模型學習速率為0.05,最大訓練次數(shù)為2 000次,期望誤差為10-3,有16個輸入節(jié)點、1個輸出節(jié)點,并根據(jù)經(jīng)驗公式得到隱含層層數(shù)的取值范圍為(5,14],通過逐步驗證得到,當模型誤差最小時,隱藏層節(jié)點個數(shù)為8。
(6)
式中,m表示隱藏層節(jié)點數(shù),n表示輸入層節(jié)點數(shù),l表示輸出層節(jié)點數(shù),α為1到10間的常數(shù)。
完成設(shè)定后,模型隨機選取訓練樣本,導入各指標參數(shù)以及對應的目標健康指數(shù),通過訓練網(wǎng)絡實現(xiàn)函數(shù)值的近似。通過計算隱藏層神經(jīng)元的輸入與輸出變量,得到所有神經(jīng)元節(jié)點的加權(quán)值與偏差值,隨后調(diào)用反向傳播算法將性能調(diào)整到最佳。利用梯度下降法對權(quán)重系數(shù)ω進行更新,其公式為:
(7)
(8)
其中J(ω,b)求得的是每個經(jīng)過模型的輸入值對應的輸出值與實際對應y(標準答案)的歐式距離。整體代價函數(shù)越小則模型越接近目標輸出結(jié)果。
最后計算神經(jīng)網(wǎng)絡模型的全局誤差,得到模型誤差值,與預設(shè)值進行對比。當誤差值達到期望誤差或者訓練次數(shù)達到預設(shè)值則結(jié)束訓練。其全局誤差δ計算公式為:
(9)
式中,m表示訓練樣本數(shù); q表示目標值總數(shù);hn(k)表示第k個樣本的第n個目標值;yn(k)表示第k個樣本第n個實際輸出值。
經(jīng)過多次訓練后的神經(jīng)網(wǎng)絡模型達到預期的精度要求,即可建立起較為穩(wěn)定的各輸入指標間的關(guān)系網(wǎng)絡,實現(xiàn)對水源地風險的預測。
3.1 水源地健康風險綜合評價體系的建立
3.1.1 評價指標體系的建立
水源健康主要體現(xiàn)在水量安全、水質(zhì)安全、生物安全、管理安全以及對人體健康的風險安全。本文根據(jù)浙江省2015年建立的《重要飲用水水源地安全保障評估指標體系》,基于水量、水質(zhì)、監(jiān)控、管理四個角度對水庫水源地健康進行綜合評價,同時根據(jù)水庫水源地特有的防洪防澇特征,初步構(gòu)建了一套水源地健康評價指標體系,分為“總目標—子目標—指標”三層結(jié)構(gòu)??蓮淖匀唤Y(jié)構(gòu)、水體狀況、生物組成、功能與管理四個方面構(gòu)建,如表1所示。
其中,水體狀況和生物組成的評價指標具有普適性,自然結(jié)構(gòu)和功能與管理需要根據(jù)水源地類型的不同,進行指標相應的取舍與替換,如河流型水源地濱岸帶的土地利用類型差異、地下水型水源地的管理方式差異等。
表1 水源地健康風險綜合評價指標體系Tab.1 Comprehensive evaluation index system of drinking water source health risk
3.1.2 評價等級的構(gòu)建
病限值通常是用來表示病情嚴重程度的等級分界線,即各種狀態(tài)之間的臨界值??茖W合理的病限值對于評價與預測的準確性具有重大影響。本文依據(jù)理論研究中病限設(shè)置的具體描述以及水庫水源地的現(xiàn)狀特征值、發(fā)展規(guī)劃值、國家地區(qū)管理要求,應用模糊數(shù)學理論,將水庫水源地健康程度分為健康(1~0.65)、亞健康(0.65~0.4)、輕病(0.4~0.2)、重病(0.2~0.1)和病危(0.1~0)等5個等級,各等級對應于綠色、藍色、黃色、橙色和紅色5個風險評判等級。具體等級見表2。
表2 水源地健康等級與風險評判Tab.2 Health grade and risk assessment of drinking water sources
3.2 基于綜合權(quán)重評價法的水源地健康指數(shù)計算
本文以綜合權(quán)重評價法得出6個實測時段共72組數(shù)據(jù)的健康指數(shù)。首先通過對16個評價指標的歸一化計算得出評判指標值,隨后根據(jù)綜合權(quán)重法得到各指標權(quán)重,從而計算出庫區(qū)的健康指數(shù),得出庫區(qū)的風險狀況。以2018年10月的指標數(shù)據(jù)為例,通過計算得到各指標綜合權(quán)重系數(shù)如表3所示,通過綜合權(quán)重評價法得到各水域的健康指數(shù)如表4所示。根據(jù)綜合權(quán)重分析結(jié)果,C9(藍綠藻覆蓋率)和C11(水質(zhì)質(zhì)量指數(shù))的變化對水源地健康指數(shù)具有最為顯著的影響。
表3 綜合權(quán)重系數(shù)Tab.3 Comprehensive weight coefficient
表4 庫區(qū)健康指數(shù)Tab.4 Health index of reservoir area
續(xù)表4
水域結(jié)構(gòu)水體生物功能與管理健康指數(shù)洪口溪0.9210.9080.3340.6830.729三插溪20.9180.9090.3160.6890.726莒江溪0.9220.9150.3500.7160.742飛云江0.7130.8930.5370.7030.715泗溪0.7290.8450.4530.6270.671桂溪0.7550.8370.4680.6310.681趙山渡0.7080.9060.3180.7290.673玉泉溪0.8330.9250.5630.6820.760
3.3 基于模糊神經(jīng)網(wǎng)絡的水源地健康指數(shù)預測
將2017年7月、2017年10月、2018年1月、2018年4月和2018年7月的5次12片水域共60組調(diào)查數(shù)據(jù)作為訓練樣本,2018年10月的12組調(diào)查數(shù)據(jù)作為預測樣本;16個評價指標的數(shù)據(jù)集作為輸入數(shù)據(jù)矩陣,水源健康指數(shù)作為目標輸出矩陣,預測出12片水域2018年10月的水源健康指數(shù)預測值。通過Matlab軟件構(gòu)建神經(jīng)網(wǎng)絡模型進行訓練模擬,可以得到系統(tǒng)自動生成的12片水域訓練誤差變化曲線,以玉泉溪水域為例,如圖2所示,當目標誤差小于10-3或多次迭代趨于平穩(wěn)時,訓練結(jié)束,其余11片水域均呈現(xiàn)相似趨勢。同時獲得訓練過程中12片水域的60組預測值與計算值的對比曲線如圖3所示。通過預測值與指標計算值的回歸分析,復相關(guān)系數(shù)R保持在0.99以上,如圖4所示,模型穩(wěn)定性較好,該神經(jīng)網(wǎng)絡模型具有良好的預測精度。
圖2 誤差變化曲線Fig.2 Curve of error variation
圖3 訓練樣本中健康指數(shù)預測值與計算值的比較Fig.3 Comparison of predicted and calculated values of fitness index
圖4 預測值與計算值回歸分析Fig.4 Regression analysis of predicted and calculated values
3.4 綜合指標計算值和BP神經(jīng)網(wǎng)絡預測值的對比分析
將最終得到的預測樣本預測值與綜合指標法的計算值進行對比評價,如表5所示。對12片水域健康指數(shù)的預測值與計算值進行相關(guān)性分析,得到
R2=0.969,P<0.001,兩者存在極顯著相關(guān)關(guān)系。從評價結(jié)果上看,珊溪(趙山渡)庫區(qū)水源整體顯示為健康狀態(tài),風險評判為綠色,表明本文研究時段內(nèi),該庫區(qū)可以滿足生活供水與農(nóng)業(yè)灌溉的需求,但是泗溪、桂溪和趙山渡局部水域健康指數(shù)逼近臨界值,存在一定的安全風險。同時根據(jù)當?shù)厮牟块T的調(diào)查報告,在取樣時間段內(nèi)未發(fā)現(xiàn)重大水污染事故,因此,該飲用水源健康風險情況與模型預測相吻合,神經(jīng)網(wǎng)絡模型對飲用水源健康的預測具有較好的效果。
表5 預測樣本中健康指數(shù)預測值與計算值的比較Tab.5 Comparison of the predicted and calculated health index values in predicted sample
4.1 本文根據(jù)綜合權(quán)重評價法以及BP神經(jīng)網(wǎng)絡算法自2017年7月以來對珊溪(趙山渡)庫區(qū)進行了6次水源地健康風險評價,以一個季度為一個周期,結(jié)果均顯示該水庫水源地為健康狀態(tài)。同時,綜合權(quán)重分析結(jié)果表明,藍綠藻覆蓋率和水質(zhì)綜合質(zhì)量指數(shù)的變化會對水源健康指數(shù)產(chǎn)生顯著影響,水庫管理部門需加強對庫區(qū)周邊農(nóng)業(yè)廢料的管控,防止水體的富營養(yǎng)化。
4.2 神經(jīng)網(wǎng)絡與模糊評價相結(jié)合對飲用水源健康風險進行預測,兼具高效性與實用性,為大批量指標的綜合利用提供了新的思路。根據(jù)對珊溪(趙山渡)庫區(qū)的驗證分析,證明了神經(jīng)網(wǎng)絡模型在飲用水源健康風險預測中的可行性。在經(jīng)過更長時間、更多批次的數(shù)據(jù)學習后,模型的預測精度將得到進一步提升,為飲用水源地管理部門制定相應政策提供有價值的參考。