李 昂,水西霞,員佳慧,李 嫣
(1.華北水利水電大學(xué),河南 鄭州 450046;2.三門峽市陜州區(qū)計(jì)劃節(jié)約用水管理中心,河南 三門峽 472000;3.中建七局總承包公司河南分公司,河南 鄭州 450012)
水質(zhì)評(píng)價(jià)是解決水體污染和保護(hù)水環(huán)境的基礎(chǔ)[1],客觀有效的評(píng)價(jià)結(jié)果能為水資源利用和改善水環(huán)境等工程措施提供科學(xué)支撐,對(duì)水源地防污治理、保障飲用水源安全有重大意義[2]。支持向量機(jī)是20世紀(jì)末提出的一種分類器,屬于統(tǒng)計(jì)學(xué)的分支。隨著模式識(shí)別中最大邊距決策邊界的理論研究發(fā)展、基于松弛變量的規(guī)劃問(wèn)題求解技術(shù)和VC維的提出,支持向量機(jī)得到極大的發(fā)展,目前被廣泛地應(yīng)用在各個(gè)領(lǐng)域用來(lái)解決分類或回歸問(wèn)題。模糊綜合指數(shù)法可以用來(lái)判斷受多個(gè)模糊因素影響的事物或事件的總體性質(zhì),優(yōu)點(diǎn)在于能定量地反映系統(tǒng)綜合屬性。本文利用分類支持向量機(jī)、回歸支持向量機(jī)和模糊綜合指數(shù)法對(duì)云南省文山州13個(gè)飲用水水源地進(jìn)行水質(zhì)綜合評(píng)價(jià),并比較評(píng)價(jià)結(jié)果的合理性,為相關(guān)水利工作者在進(jìn)行水質(zhì)評(píng)價(jià)時(shí)提供更好的選擇。
文山壯族苗族自治州(如圖1所示),地處我國(guó)西南邊陲云南省的東南部,總面積約為3.2萬(wàn)km2,區(qū)內(nèi)水系交錯(cuò),地形復(fù)雜多變,多為山區(qū)、半山區(qū),平均海拔在1 000~1 800 m,州內(nèi)轄有8個(gè)縣區(qū)。該州水資源總量較為豐富,但各縣區(qū)水資源及降水時(shí)空分布差異較大。年平均降雨量為1 200 mm,降雨量總體呈北少南多的趨勢(shì)。
圖1 文山壯族苗族自治州水系示意圖
本文根據(jù)2014年文山市環(huán)保局對(duì)該州飲用水水源地的監(jiān)測(cè)數(shù)據(jù),利用以下評(píng)價(jià)模型對(duì)該州水源地進(jìn)行水質(zhì)評(píng)價(jià)。
本文用到的評(píng)價(jià)模型分別是FA-SVR(基于螢火蟲(chóng)算法[2]優(yōu)化學(xué)習(xí)參數(shù)的回歸支持向量機(jī))、FA-SVM(基于螢火蟲(chóng)算法優(yōu)化學(xué)習(xí)參數(shù)的分類支持向量機(jī))和模糊綜合指數(shù)法。各模型詳細(xì)描述如下。
由螢火蟲(chóng)算法(FA)及回歸支持向量機(jī)(SVR)模型原理可知,F(xiàn)A-SVR的原理即為使回歸支持向量機(jī)模型的誤差最小,可通過(guò)螢火蟲(chóng)算法來(lái)搜尋一組向量(C,g,ε)。其實(shí)現(xiàn)步驟為:
(1)根據(jù)模型對(duì)實(shí)測(cè)樣本數(shù)據(jù)進(jìn)行歸一化處理;
(2)初始化螢火蟲(chóng)算法相關(guān)參數(shù)(如螢火蟲(chóng)個(gè)數(shù),迭代次數(shù)、初始吸引度、步長(zhǎng)因子等),確定均方誤差MSE為目標(biāo)函數(shù),對(duì)應(yīng)螢火蟲(chóng)的亮度;
(3)模型運(yùn)算結(jié)束后,進(jìn)行反歸一化處理,最后進(jìn)行綜合水質(zhì)判斷。
由FA算法及SVM模型原理可知,F(xiàn)A-SVM的思想就是通過(guò)FA算法搜尋一組向量(C,g)使SVM模型的正確識(shí)別率最高。正確識(shí)別率依賴于對(duì)綜合水質(zhì)的先驗(yàn)判斷,應(yīng)合理地進(jìn)行先驗(yàn)判斷,提高模型可靠性。其實(shí)現(xiàn)步驟:
(1)根據(jù)模型對(duì)實(shí)測(cè)樣本數(shù)據(jù)進(jìn)行歸一化處理;
(2)初始化螢火蟲(chóng)算法相關(guān)參數(shù)(如螢火蟲(chóng)個(gè)數(shù),迭代次數(shù)、初始吸引度,步長(zhǎng)因子等),設(shè)定懲罰因子C和核函數(shù)參數(shù)g的搜尋范圍,確定正確識(shí)別率Accuracy為目標(biāo)函數(shù),對(duì)應(yīng)螢火蟲(chóng)的亮度;
(3)模型運(yùn)算結(jié)束后,能直接輸出對(duì)應(yīng)的水質(zhì)類別。
模糊綜合指數(shù)法實(shí)現(xiàn)水質(zhì)評(píng)價(jià)的主要步驟如下[4]。
(1)設(shè)水體中有m個(gè)因素可以影響水質(zhì),這些因素的有n個(gè)評(píng)價(jià)指標(biāo)(a=1,2,...,m;b=1,2,...,n),可得評(píng)價(jià)因素的特征矩陣X=(rij)n·m。綜合考慮a中因素,可建立隸屬度函數(shù)R:
(2)R的現(xiàn)實(shí)意義為每個(gè)因素對(duì)其評(píng)價(jià)指標(biāo)的隸屬程度。各水質(zhì)級(jí)別的隸屬函數(shù)由以下函數(shù)確定。
第一級(jí):
第二級(jí)至第m級(jí):
第m級(jí)水的隸屬函數(shù):
式中:Wij為第i種因素第j級(jí)的評(píng)價(jià)指標(biāo),Ei為第i種因素檢測(cè)值。
(3)設(shè)a=1,2,...,m中各因素的權(quán)重為l,L=(l1,l2,...,lm)為所有權(quán)重的集合,且,則該模型可以以式(5)表達(dá):
基于GB 3838—2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》,構(gòu)造向量PT=(1,2,3,4,5)為水質(zhì)分級(jí)標(biāo)準(zhǔn)。則模糊綜合指數(shù)(Fuzzy comprehensive index)為:
本文采用2014年云南省文山州內(nèi)8個(gè)縣區(qū)中13個(gè)飲用水水源地水質(zhì)數(shù)據(jù)[5]。模型均在Matlab 2018a環(huán)境下進(jìn)行仿真,支持向量機(jī)模型利用libsvm工具箱進(jìn)行編程;計(jì)算機(jī)配置:Intel(R)Core(TM)i7-8750H CPU@2.20 GHz;內(nèi)存8 GB。模糊綜合指數(shù)法部分代碼如圖1所示。
圖1 模糊綜合指數(shù)法部分代碼
螢火蟲(chóng)算法的初始化參數(shù)包括:螢火蟲(chóng)數(shù)量為20個(gè),迭代次數(shù)5 000次,初始光吸收指數(shù)1,吸引指數(shù)0.2,初始步長(zhǎng)系數(shù)0.2。
SVR模型學(xué)習(xí)參數(shù)懲罰因子C的搜索空間設(shè)為0.1~2 000,核函數(shù)參數(shù)g的搜索空間設(shè)為0.1~1 000,不敏感系數(shù)ε的搜索空間設(shè)為0~1;SVM模型學(xué)習(xí)參數(shù)懲罰因子C設(shè)搜索空間為0.1~2 000,核函數(shù)參數(shù)g的搜索空間為0.1~1 000。插值法隨機(jī)生成20組樣本,并內(nèi)插得到120組樣本,實(shí)測(cè)數(shù)據(jù)及對(duì)應(yīng)評(píng)價(jià)結(jié)果的后8組數(shù)據(jù)作為測(cè)試樣本。輸出評(píng)價(jià)結(jié)果見(jiàn)表1,仿真圖如圖2所示。
表1 水質(zhì)綜合評(píng)價(jià)成果表
圖2 回歸支持向量機(jī)仿真結(jié)果
由結(jié)果可以看出:評(píng)價(jià)結(jié)果主要在樣本4、樣本11和樣本12存在差異。這3個(gè)樣本各項(xiàng)因子實(shí)測(cè)值見(jiàn)表2,各項(xiàng)因子標(biāo)準(zhǔn)見(jiàn)表3。
表2 樣本4、11、12的幾種因子實(shí)測(cè)值 單位:mg/L
表3 樣本4、11、12的單因子評(píng)價(jià)結(jié)果
根據(jù)各項(xiàng)水質(zhì)評(píng)價(jià)因子標(biāo)準(zhǔn),3個(gè)樣本的單因子評(píng)價(jià)結(jié)果為:
以某類別因子數(shù)占優(yōu)為標(biāo)準(zhǔn),3個(gè)樣本的水質(zhì)綜合類別應(yīng)為1類、1類和2類,樣本水質(zhì)達(dá)標(biāo)。例如針對(duì)樣本12,兩者的結(jié)果顯示,其水質(zhì)綜合類別雖為3類,但很接近2類水的標(biāo)準(zhǔn),符合國(guó)家GB 5749—2006《生活飲用水衛(wèi)生標(biāo)準(zhǔn)》相關(guān)要求。
模型的改進(jìn)對(duì)水質(zhì)綜合評(píng)價(jià)的精度有著明顯的提高。本文利用新型元啟發(fā)式算法——螢火蟲(chóng)算法,對(duì)SVR模型和SVM模型的學(xué)習(xí)參數(shù)進(jìn)行優(yōu)化,建立模糊綜合評(píng)價(jià)模型以文山州13處水源地樣本因子進(jìn)行評(píng)價(jià),結(jié)果顯示13處水源地水質(zhì)符合國(guó)家標(biāo)準(zhǔn)。經(jīng)參數(shù)優(yōu)化的模糊綜合指數(shù)法易操作,可以作為水質(zhì)評(píng)價(jià)的輔助性參考工具。