曹 磊,戴俊杰,毛小燕*,蔣 吉,劉鋒琴
(1.寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211;2.寧波大學(xué)科學(xué)技術(shù)學(xué)院 信息工程學(xué)院,浙江 寧波 315300;3.慈溪市水利局,浙江 寧波 315399)
隨著人類社會(huì)經(jīng)濟(jì)的飛速發(fā)展,水環(huán)境污染以及水生態(tài)退化等問題日益明顯,嚴(yán)重違反了可持續(xù)發(fā)展理念,背離了習(xí)近平同志“綠水青山就是金山銀山”的重要論斷.因此加強(qiáng)水環(huán)境治理已經(jīng)成為各省政府的當(dāng)務(wù)之急,而其中對(duì)水質(zhì)的評(píng)價(jià)是所有事項(xiàng)中的重中之重,只有對(duì)水質(zhì)觀測(cè)數(shù)據(jù)進(jìn)行合理有效的評(píng)價(jià)才能引導(dǎo)制定科學(xué)有益的防治對(duì)策.從這方面來(lái)說(shuō),水質(zhì)綜合評(píng)價(jià)的合理性將直接影響管理者的決策[1-2].
目前,國(guó)內(nèi)外常見的水質(zhì)評(píng)價(jià)方法有單因子評(píng)價(jià)、神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)、模糊綜合評(píng)價(jià)等.單因子評(píng)價(jià)是指采用目標(biāo)水體中所有參與綜合評(píng)價(jià)的水質(zhì)指標(biāo),選取其中最差的水質(zhì)單項(xiàng)指標(biāo)所屬的類別作為該目標(biāo)水體的類別[3],其對(duì)水質(zhì)的要求過于保護(hù),無(wú)法客觀地反映水體的綜合狀態(tài).人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,通過調(diào)節(jié)內(nèi)部大量節(jié)點(diǎn)參數(shù)及其權(quán)重信息從而實(shí)現(xiàn)其擬合函數(shù)、處理信息等功能的算法.早在20 世紀(jì)末,就已經(jīng)有學(xué)者將模型結(jié)構(gòu)運(yùn)用到水質(zhì)評(píng)價(jià)任務(wù)中[4-5].雖然神經(jīng)網(wǎng)絡(luò)具有很好的客觀性,精度也相較于其他方法要高,但其訓(xùn)練過程需要大量帶標(biāo)簽樣本數(shù)據(jù),且特征選取會(huì)極大地影響最終模型的效果.近幾年也有學(xué)者對(duì)神經(jīng)網(wǎng)絡(luò)予以改進(jìn),用于水質(zhì)評(píng)價(jià)研究[6-7],但也不能達(dá)到令人十分滿意的效果.由于水質(zhì)評(píng)價(jià)是一個(gè)多指標(biāo)影響的復(fù)雜過程,且對(duì)污染程度的分級(jí)界限較為模糊,傳統(tǒng)方法很難刻畫這種不確定性,而模糊集理論為解決此類不確定性問題提供了新思路.模糊綜合評(píng)價(jià)[8]關(guān)鍵在于隸屬函數(shù)和指標(biāo)權(quán)重的確定,常通過構(gòu)造高斯隸屬函數(shù)[9]或梯形隸屬函數(shù)[10]來(lái)確定監(jiān)測(cè)數(shù)據(jù)與各等級(jí)間的隸屬度,有效地解決了評(píng)價(jià)標(biāo)準(zhǔn)邊界模糊問題;而權(quán)重的確立方法主要有熵權(quán)賦值法[11]、超標(biāo)倍數(shù)法[12]及層次分析法[13].在實(shí)際應(yīng)用中,決策者在確定各屬性隸屬度值時(shí),常會(huì)遇到多個(gè)數(shù)值之間難以取舍的問題.為處理這類情況,Torra 等[14-15]提出了猶豫模糊集概念,其允許選定多個(gè)數(shù)值作為隸屬度,能夠更真實(shí)地體現(xiàn)決策者猶豫不決的心理.因此本文也首次將猶豫模糊集應(yīng)用到水質(zhì)評(píng)價(jià)領(lǐng)域.
本文采用一種基于猶豫模糊集的水質(zhì)評(píng)價(jià)模型,并提出一種新的基于線性插值的悲觀補(bǔ)齊方案,根據(jù)距離測(cè)度來(lái)評(píng)價(jià)水質(zhì)等級(jí).通過浙江省部分水庫(kù)的實(shí)際算例,進(jìn)行穩(wěn)定性和有效性檢驗(yàn),以期豐富水質(zhì)評(píng)價(jià)方法,為水資源監(jiān)管提供客觀科學(xué)依據(jù).
研究數(shù)據(jù)來(lái)源于浙江省生態(tài)環(huán)境廳公布的地表水水質(zhì)自動(dòng)檢測(cè)數(shù)據(jù).根據(jù)國(guó)家《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002)規(guī)定,基本的水質(zhì)評(píng)價(jià)指標(biāo)有24 項(xiàng).但由于指標(biāo)過多且存在對(duì)評(píng)價(jià)結(jié)果參考意義較小的指標(biāo),因此需先對(duì)指標(biāo)進(jìn)行篩選和處理.
挑選慈溪市7 處水體,采集共計(jì)10 個(gè)月的監(jiān)測(cè)樣本,并收集相應(yīng)的水質(zhì)等級(jí)數(shù)據(jù).水體成分和外界環(huán)境因素(下文稱為特征)具體包含: 水溫、pH值、溶解氧、高錳酸鹽、總磷、總氮、硫化物等;對(duì)應(yīng)的水質(zhì)等級(jí)分別為1 級(jí)至6 級(jí),等級(jí)越低表示水質(zhì)越好,其中,6級(jí)表示水質(zhì)指標(biāo)嚴(yán)重超標(biāo),又稱劣V 類,即超出地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)規(guī)定的五類水質(zhì).首先初步剔除那些存在缺失值以及無(wú)任何參考價(jià)值的特征(如氣溫、水溫等),接著計(jì)算每個(gè)特征與水體等級(jí)之間的相關(guān)系數(shù).水質(zhì)特征及等級(jí)具體結(jié)果見表1.
表1 水質(zhì)特征與水質(zhì)等級(jí)的相關(guān)分析
通過相關(guān)性分析篩選出7 項(xiàng)顯著相關(guān)特征.特征與水質(zhì)等級(jí)之間存在相關(guān)性,各特征之間也同樣存在高度相關(guān)性,比如“溶解氧”與“五日生化需氧量”以及“氨氮”與“總氮”.為避免選擇的特征之間相關(guān)性過高,通過查閱相關(guān)文獻(xiàn),并結(jié)合《浙江省水資源公報(bào)》分析各水庫(kù)近年來(lái)的水質(zhì)狀況,最終選取溶解氧(DO)、高錳酸鹽指數(shù)(CODMn)、總磷(TP)和氨氮含量(NH3-N) 4 項(xiàng)監(jiān)測(cè)數(shù)據(jù)作為本文水質(zhì)評(píng)價(jià)指標(biāo),并且以《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002)作為評(píng)價(jià)依據(jù)(表2).
表2 地表水環(huán)境質(zhì)量標(biāo)準(zhǔn) mg·L–1
首先構(gòu)建水質(zhì)的猶豫模糊標(biāo)準(zhǔn)評(píng)價(jià)矩陣,在《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002)基礎(chǔ)上,采用專家打分值建立猶豫模糊矩陣,再通過猶豫模糊指數(shù)熵來(lái)計(jì)算各指標(biāo)間權(quán)重,采用升維補(bǔ)齊方式統(tǒng)一猶豫模糊數(shù)的維度,最后使用加權(quán)猶豫模糊蘭氏距離測(cè)度方法計(jì)算參評(píng)水域猶豫模糊矩陣與標(biāo)準(zhǔn)評(píng)價(jià)矩陣各等級(jí)的距離,最終根據(jù)距離最小原則劃定水質(zhì)等級(jí),從而得出水質(zhì)評(píng)價(jià)結(jié)論.
猶豫模糊集定義: 設(shè)論域X={x1,x2,…,xn},則X上的猶豫模糊集(Hesitant Fuzzy Set,HFS)定義為,其中hM(x)為猶豫模糊數(shù),是[0,1]中一些數(shù)值的集合,表示集合X中的任一元素x對(duì)集合M的隸屬度.特別地,如果各猶豫模糊數(shù)有且僅有一個(gè)隸屬度值,那么猶豫模糊集退化為普通的模糊集.
水質(zhì)評(píng)價(jià)指標(biāo)的屬性集合X={溶解氧,高錳酸鹽指數(shù),總磷,氨氮},并設(shè)置5 個(gè)不同等級(jí),即等級(jí)屬性集合為G={優(yōu),良,一般,較差,差}.邀請(qǐng)3 名水環(huán)境評(píng)價(jià)方面專家組成水質(zhì)評(píng)價(jià)小組,參照表2 規(guī)定的各水質(zhì)指標(biāo)值,對(duì)溶解氧、高錳酸鹽指數(shù)等評(píng)價(jià)指標(biāo)進(jìn)行打分,分值在0~1,且分值越高代表水質(zhì)等級(jí)越高.最后對(duì)評(píng)價(jià)小組的分值進(jìn)行合并,形成水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣.由于不同專家可能有不同的專業(yè)知識(shí)、背景和偏好,導(dǎo)致分值可能存在差異;但每位專家的意見都需被考慮,因此水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣中的每個(gè)指標(biāo)值用猶豫模糊數(shù)表示為專家打分值組成的集合(表3).
表3 水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣
在指標(biāo)權(quán)重信息未知的條件下,通常需要人為主觀給出.本文通過實(shí)際數(shù)據(jù)信息構(gòu)造猶豫模糊指數(shù)熵的方式來(lái)確定指標(biāo)權(quán)重,避免了過多人為主觀因素的影響.
定義一組猶豫模糊數(shù):
根據(jù)定義計(jì)算猶豫模糊指數(shù)熵,運(yùn)用信息熵最小化原則計(jì)算確定屬性權(quán)重:
對(duì)于任意集合X={x1,x2,…,xn}上的猶豫模糊集M和N,距離測(cè)度d(M,N)需滿足以下性質(zhì):
常用距離測(cè)度的方式有多種,如豪斯道夫距離測(cè)度、海明距離測(cè)度、蘭氏距離測(cè)度[17].本文水質(zhì)評(píng)價(jià)中,不同專家對(duì)參評(píng)水庫(kù)打分可能會(huì)出現(xiàn)一定差異性,如當(dāng)遇到評(píng)價(jià)指標(biāo)存在偏倚較大的數(shù)據(jù),就會(huì)導(dǎo)致最終的評(píng)價(jià)結(jié)果偏離真實(shí)情況.因此本文將采用蘭氏距離進(jìn)行測(cè)度分析,因其是無(wú)量綱,并且是采用比值方式來(lái)衡量數(shù)據(jù)之間的距離,減少了極端值的影響,能有效避免上述問題對(duì)評(píng)價(jià)結(jié)果的影響.
在進(jìn)行距離測(cè)度計(jì)算時(shí),常會(huì)遇到猶豫模糊評(píng)價(jià)矩陣與水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣在各指標(biāo)下隸屬度不等長(zhǎng)的情況,導(dǎo)致無(wú)法直接進(jìn)行距離度量.此時(shí)通常都會(huì)采用升維或降維的方式將猶豫模糊數(shù)長(zhǎng)度統(tǒng)一,但降維方式會(huì)丟失過多的專家打分信息,因此這里選擇采用升維補(bǔ)齊方案,將長(zhǎng)度略短的猶豫模糊數(shù)補(bǔ)齊至更長(zhǎng)的猶豫模糊數(shù).補(bǔ)齊數(shù)據(jù)的方式也有多種,如對(duì)情境樂觀的樂觀補(bǔ)齊法,可選用猶豫數(shù)中最大的隸屬度進(jìn)行補(bǔ)齊;偏向于規(guī)避風(fēng)險(xiǎn)的悲觀補(bǔ)齊法,可挑選猶豫數(shù)中最小的隸屬度進(jìn)行補(bǔ)齊[18].本文認(rèn)為雖然補(bǔ)齊方式可以很大程度上保留專家們的可靠評(píng)價(jià),但是無(wú)論是樂觀補(bǔ)齊法還是悲觀補(bǔ)齊法都未能較好地權(quán)衡所有專家之間的意見,鑒于水質(zhì)評(píng)價(jià)是一個(gè)需要嚴(yán)格把關(guān)的問題,因此悲觀傾向是能夠被采納的.
所以本文提出基于線性插值的悲觀補(bǔ)齊法,它能很好地全面考慮各個(gè)專家之間的態(tài)度.具體操作如下: 設(shè)定一組猶豫模糊數(shù)和升維大小d,其中l(wèi)xi≤d.為保證補(bǔ)齊方法偏向于悲觀,從hM(xi)中選取最小的兩個(gè)隸屬度,且,并且在兩者之間按照一維線性插值法插入共d-個(gè)隸屬度,從而達(dá)到補(bǔ)齊的效果.
在水質(zhì)評(píng)價(jià)的實(shí)際運(yùn)用中,經(jīng)常會(huì)出現(xiàn)不同參評(píng)水庫(kù)有著相同猶豫模糊數(shù)的情況.例如一個(gè)6名專家組成的評(píng)價(jià)小組對(duì)甲、乙水庫(kù)的某項(xiàng)水質(zhì)指標(biāo)等級(jí)進(jìn)行打分,假設(shè)其中專家小組對(duì)甲水庫(kù)的評(píng)分情況為4 名專家評(píng)分是0.8,另外2 名專家評(píng)分是0.6,用猶豫模糊數(shù){0.6,0.8}表示評(píng)分值;專家小組對(duì)乙水庫(kù)評(píng)分情況為3 名專家評(píng)分是0.8,另外3 名專家評(píng)分是0.6,用猶豫模糊數(shù){0.6,0.8}表示評(píng)分值.雖然甲、乙水庫(kù)的評(píng)價(jià)結(jié)果完全相同,但顯然不符合實(shí)際的評(píng)分情況.因此,需引入加權(quán)猶豫模糊數(shù)概念,對(duì)猶豫模糊數(shù)中每個(gè)隸屬度值都進(jìn)行加權(quán)處理,且權(quán)重大小能反映出每個(gè)隸屬度的重要程度.但加權(quán)的猶豫模糊數(shù)也分為專家權(quán)重已知和未知兩種情形.在專家權(quán)重已知情況下,構(gòu)造加權(quán)猶豫模糊數(shù),設(shè)專家e1,e2,…,ep對(duì)應(yīng)的權(quán) 重向 量wq=(w1,w2,…,wp)T,其 中,wk≥ 0,且
構(gòu)造加權(quán)猶豫模糊數(shù)為:
但在絕大多數(shù)情況下,專家權(quán)重是未知的,此時(shí)則令每位專家權(quán)重都相同,結(jié)合加權(quán)猶豫模糊數(shù)概念,可給出加權(quán)猶豫模糊蘭氏距離公式.
假設(shè)任意xi?X的權(quán)重為wi,其中i=1,2,…,n,并滿足wi? [0,1],,則加權(quán)猶豫模糊蘭氏距離[19]:
由此運(yùn)用加權(quán)猶豫模糊蘭氏距離測(cè)度方法計(jì)算猶豫模糊矩陣與標(biāo)準(zhǔn)評(píng)價(jià)矩陣的距離,并根據(jù)距離最小原則可以得出最終結(jié)論.
使用上述方法對(duì)浙江省部分水庫(kù)水體進(jìn)行水質(zhì)評(píng)價(jià),并對(duì)評(píng)價(jià)結(jié)果進(jìn)行有效性檢驗(yàn),最后再與其他評(píng)價(jià)方法進(jìn)行對(duì)比檢驗(yàn).
出于保護(hù)水資源的戰(zhàn)略選擇,現(xiàn)對(duì)浙江省內(nèi)5處(編號(hào)為A、B、C、D、E)水體進(jìn)行各自的水質(zhì)量評(píng)價(jià).為保證評(píng)價(jià)結(jié)果的可靠性和專業(yè)性,邀請(qǐng)8 名水環(huán)境評(píng)價(jià)方面的專家,并根據(jù)5 處水體的各自情況分別進(jìn)行打分評(píng)價(jià),整理得到各水體的猶豫模糊評(píng)價(jià)矩陣,其相關(guān)數(shù)據(jù)見表4.
表4 猶豫模糊評(píng)價(jià)矩陣
根據(jù)表4 的猶豫模糊評(píng)價(jià)矩陣,利用式(1)計(jì)算出各水體指標(biāo)的猶豫模糊指數(shù)熵.其中,以水體A 為例:
在得到水體A 在DO 指標(biāo)上的猶豫模糊指數(shù)熵后,同理可構(gòu)建出各水體相關(guān)指數(shù)的猶豫模糊指數(shù)熵矩陣,其相關(guān)數(shù)據(jù)見表5.
表5 猶豫模糊指數(shù)熵矩陣
接著可進(jìn)一步計(jì)算出每個(gè)水體在單個(gè)指標(biāo)上的平均模糊熵.再以表5 中DO 指標(biāo)為例:
其中,E1表示第1 個(gè)指標(biāo)DO 的平均指數(shù)熵.同理可得其余3 項(xiàng)指標(biāo)的平均指數(shù)熵分別為E2=0.683(CODMn),E3=0.754(TP),E4=0.534(NH3-N).
通過每個(gè)指標(biāo)模糊熵在總體上的占比,可以得到各個(gè)指標(biāo)的具體權(quán)重?cái)?shù)值.同樣,以DO 指標(biāo)為例,并依照式(2)可得:
同理可得,w2=0.24(CODMn),w3=0.19(TP),w4=0.36(NH3-N).
由于5 處水體的猶豫模糊評(píng)價(jià)矩陣與水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣在各指標(biāo)下的隸屬度不等長(zhǎng),導(dǎo)致無(wú)法直接進(jìn)行距離測(cè)度計(jì)算,因此需要分別對(duì)表3 和表4 進(jìn)行升維處理.升維后的矩陣數(shù)據(jù)分別見表6和表7.
表6 升維后的水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)矩陣
表7 升維后的猶豫模糊評(píng)價(jià)矩陣
最后根據(jù)式(3)計(jì)算各水體與各評(píng)價(jià)等級(jí)之間的距離測(cè)度,其結(jié)果見表8.由最小距離原則,本文將測(cè)度最小的等級(jí)作為該水體的等級(jí)評(píng)價(jià),最終各水體的水質(zhì)評(píng)價(jià)結(jié)果見表9.從表9 可以看出本文評(píng)價(jià)結(jié)果與官方評(píng)價(jià)結(jié)果基本一致,僅A 水體的評(píng)價(jià)等級(jí)與官方出現(xiàn)差異,但對(duì)于A 水體來(lái)說(shuō),從表8 可以看出,距離“良(II)”等級(jí)的距離為0.239 6,距離“一般(III)”等級(jí)的距離為0.223 0,兩者相差僅0.016 6,因此不論從后續(xù)改進(jìn)還是總體準(zhǔn)確性來(lái)說(shuō),本文方法都具備較好的可靠性.
表8 各水體與各評(píng)價(jià)等級(jí)之間的距離測(cè)度
表9 各水體的水質(zhì)評(píng)價(jià)結(jié)果
為驗(yàn)證本文評(píng)價(jià)方法的穩(wěn)定性,現(xiàn)將上述5 個(gè)水體另外相鄰3 d 的監(jiān)測(cè)數(shù)據(jù)和對(duì)應(yīng)的官方評(píng)價(jià)等級(jí)依次進(jìn)行上述步驟處理,最終得到本文的評(píng)價(jià)等級(jí),結(jié)果見表10.
表10 各水體連續(xù)3 d 的水質(zhì)評(píng)價(jià)結(jié)果
從表10 可以明顯看出,水體在相鄰時(shí)間點(diǎn)的水質(zhì)變化不明顯,并且本文的評(píng)價(jià)等級(jí)與官方評(píng)價(jià)等級(jí)基本一致,還能在不同時(shí)候保持兩者的高度一致性,這也同樣說(shuō)明了本文方法的穩(wěn)定性.
采用水質(zhì)評(píng)價(jià)領(lǐng)域常用的BP 神經(jīng)網(wǎng)絡(luò)和模糊綜合評(píng)價(jià)方法來(lái)驗(yàn)證本文方法的有效性,其最終對(duì)比結(jié)果見表11.
表11 不同方法水質(zhì)評(píng)價(jià)結(jié)果
根據(jù)表11 的對(duì)比結(jié)果可以看出,BP 神經(jīng)網(wǎng)絡(luò)在水質(zhì)評(píng)價(jià)中的結(jié)果與官方之間存在一定差異,并且神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量帶標(biāo)簽數(shù)據(jù),同時(shí)網(wǎng)絡(luò)輸出值也并非是離散值,而是連續(xù)值.因此如果取舍不恰當(dāng),容易造成最終結(jié)果的偏差.而模糊綜合評(píng)價(jià)則與官方評(píng)價(jià)出入較大,因其僅考慮一位專家的評(píng)價(jià),雖簡(jiǎn)單方便,但也容易導(dǎo)致大量極端值的出現(xiàn),從而導(dǎo)致結(jié)果可信度的缺失.綜上所述,本文方法還是具有一定的優(yōu)越性.
水體環(huán)境監(jiān)測(cè)是重要的民生大事,是關(guān)乎推動(dòng)建設(shè)美麗社會(huì)開展的極大事宜,科學(xué)全面的水質(zhì)量評(píng)價(jià)是其中的重要環(huán)節(jié).本文通過篩選有效的水質(zhì)評(píng)價(jià)指標(biāo),建立水體質(zhì)量評(píng)價(jià)體系,并采用線性插值的悲觀補(bǔ)齊方案和蘭氏距離測(cè)度方法,提出一種針對(duì)水體質(zhì)量評(píng)價(jià)的方法,通過自身和對(duì)比檢驗(yàn)驗(yàn)證了其穩(wěn)定性和有效性,以期為日后的水質(zhì)評(píng)價(jià)提供一定的參考.