楊旭瑩 宋金玲,2 祝美寧,2 劉風(fēng)超
(1.河北科技師范學(xué)院數(shù)學(xué)與信息科技學(xué)院,河北 秦皇島 066004;2.河北省農(nóng)業(yè)數(shù)據(jù)智能感知與應(yīng)用技術(shù)創(chuàng)新中心,河北 秦皇島 066004)
水資源是區(qū)域經(jīng)濟(jì)發(fā)展不可或缺的物質(zhì)基礎(chǔ),但是隨著全球氣候變化及人類生產(chǎn)生活的影響,水質(zhì)惡化、水資源短缺等問題日益突出。及時、準(zhǔn)確、客觀地根據(jù)水體各項指標(biāo)對水質(zhì)進(jìn)行綜合評價,對水污染控制及水資源利用都具有重要的現(xiàn)實(shí)意義。近年來,學(xué)者們使用的水質(zhì)評價方法主要包括灰色聚類法、神經(jīng)網(wǎng)絡(luò)法、層次分析法、模糊分析法和支持向量機(jī)法等。這些方法都推動了水質(zhì)綜合評價質(zhì)量的提升,但是評價結(jié)果的客觀性和準(zhǔn)確性還需要進(jìn)一步提高。因此,需要進(jìn)一步探索新的水質(zhì)綜合評價方法。
投影尋蹤(PP)方法可以將高維數(shù)據(jù)投影到低維空間,即在水資源配置和評價中,將多維水質(zhì)指標(biāo)數(shù)據(jù)投影到一維數(shù)據(jù)(水質(zhì)級別),便于相關(guān)研究人員及時、準(zhǔn)確、客觀地根據(jù)水體各項指標(biāo)對水質(zhì)進(jìn)行綜合評價。因此,筆者將該方法作為水質(zhì)綜合評價的基礎(chǔ)模型。在PP方法中,能夠反映數(shù)據(jù)特性的最佳投影方向是影響投影精度的關(guān)鍵因素,另因群居蜘蛛優(yōu)化算法(SSO)是一種新型的群體智能進(jìn)化算法,該算法相對常用的遺傳算法、混合蛙跳算法、蝙蝠算法、蟻群算法和粒子群算法等優(yōu)化算法具有更快的收斂速度和更強(qiáng)的全局搜索能力,所以筆者采用SSO算法選取PP方法的最佳投影方向。最后,筆者以福建省莆田市2018—2020年的水質(zhì)監(jiān)測數(shù)據(jù)為例,對SSO-PP水質(zhì)綜合評價模型進(jìn)行了驗(yàn)證,結(jié)果表明SSO-PP模型可以對水質(zhì)進(jìn)行綜合有效評價,該模型具有一定的可行性。
PP方法就是把高維數(shù)據(jù)投影到低維空間,通過極值化投影指標(biāo)來反映原數(shù)據(jù)特征,并在低維空間進(jìn)行數(shù)據(jù)結(jié)構(gòu)分析。用PP方法實(shí)現(xiàn)水質(zhì)綜合評價的步驟如下。
①數(shù)據(jù)預(yù)處理。設(shè)有個水質(zhì)樣本數(shù),由個水質(zhì)評價指標(biāo)構(gòu)成的水質(zhì)樣本集為{(,)|=1,2,…,;=1,2,…,},由于水質(zhì)各評價指標(biāo)的量綱不同,采用式(1)將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。數(shù)據(jù)預(yù)處理的計算公式如式(1)所示:
式(1)中:(,)為水質(zhì)數(shù)據(jù)集中第行第列數(shù)值;()和()是水質(zhì)指標(biāo)中的最大值和最小值。
③投影指標(biāo)函數(shù)尋優(yōu)。投影指標(biāo)函數(shù)值越大,說明其投影方向越能反映高維數(shù)據(jù)的某種特征,投影指標(biāo)函數(shù)值最大時就是最優(yōu)投影方向。投影值的優(yōu)劣一般用標(biāo)準(zhǔn)差S和局部密度D這兩個指標(biāo)評價,因此,將S和D結(jié)合可以構(gòu)造投影方向的優(yōu)化函數(shù)()。()的計算公式如式(3)所示:
式(3)中:S為投影值()的標(biāo)準(zhǔn)差矩陣;D為投影值()的局部密度矩陣;為D的局部半徑;(,)為樣本點(diǎn)之間的距離;()為單位布階函數(shù),當(dāng)≥0時,其值為1,<0時,則為0。
④建立水質(zhì)評價等級閾值。根據(jù)《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002)中對各水質(zhì)指標(biāo)限值的規(guī)定,參照式(1)對水質(zhì)指標(biāo)等級臨界值進(jìn)行標(biāo)準(zhǔn)化,計算得到每個等級標(biāo)準(zhǔn)投影值'()。
⑤水質(zhì)分級。同步驟4,計算樣本數(shù)據(jù)得到各斷面投影值(),根據(jù)'()對本次水質(zhì)進(jìn)行綜合評價。
SSO算法通過模擬群居蜘蛛的行為搜尋最優(yōu)解,將整個搜索空間作為蜘蛛行動的蜘蛛網(wǎng),每個蜘蛛的位置是目標(biāo)優(yōu)化函數(shù)的潛在解,質(zhì)量最大的蜘蛛個體的位置作為最優(yōu)解。個體按性別執(zhí)行不同的搜索方式,雌性會接近質(zhì)量較大的蜘蛛,而雄性向種群的中間位置聚集,且雄性將與滿足交配距離的雌性交配,再通過權(quán)重判斷新個體是否代替群體中的最差個體。個體間通過振動的強(qiáng)弱可以將不同的信息在蜘蛛網(wǎng)絡(luò)上傳遞給其他個體,振動的強(qiáng)弱由蜘蛛的質(zhì)量和個體間距離決定。SSO算法通過不斷循環(huán)搜索直到找到最優(yōu)解,SSO算法的實(shí)現(xiàn) 步驟如下。
①設(shè)所有蜘蛛的數(shù)量為,雌性蜘蛛和雄性蜘蛛的數(shù)量是和,雌蜘蛛群體為={,,…,f},雄蜘蛛群體為={,,…,m},及分別定義為式(4)、式(5):
式(4)、式(5)中:為取整函數(shù);為[0,1]中的隨機(jī)數(shù)。
②初始化蜘蛛種群,={=,=,…,s=f,f=,f=,…,s=m}。每個個體初始位置公式如式(6)所示:
③計算種群S中每只蜘蛛的權(quán)重,如式(7)所示:
式(7)中:w為蜘蛛個體的權(quán)重;(s)為用所求問題的適應(yīng)度函數(shù)求得的蜘蛛s個體的適應(yīng)度值;worst為最劣適應(yīng)度值;best為最優(yōu)的適應(yīng)度值。
式(8)中:、、是[0,1]的隨機(jī)數(shù);為迭代次數(shù);個體s質(zhì)量大于個體且兩者距離最近;s為最好的雌蜘蛛;Vbc是個體和之間通信的振動因子,Vbb是個體和之間通信的振動因子,兩種振動因子分別見式(9)、式(10):
式(9)、式(10)中:w>w;w為種群中最大的權(quán)重值;d=‖s-s‖;d=‖s-s‖。
式(11)中:雌蜘蛛s與雄蜘蛛最為相近;m為雄蜘蛛種群的中心;m為雄蜘蛛當(dāng)前位置;w為雄蜘蛛個體的質(zhì)量;w為中心位置雄蜘蛛的質(zhì)量;Vbf代表雄蜘蛛與最近雌蜘蛛之間通信的振動因子,如式(12)所示:
⑥雌雄蜘蛛進(jìn)行交配,當(dāng)一只雄蜘蛛在一個特定半徑范圍內(nèi)搜索到雌蜘蛛,就進(jìn)行交配產(chǎn)生新個體,形成新的種群T。如式(13)所示:
式(13)中:為空間維度。
據(jù)輪盤法確定概率ps,w為蜘蛛個體權(quán)重,如式(14)所示。得到的新蜘蛛與原來種群進(jìn)行對比,優(yōu)勢蜘蛛將替代原有的最差個體。
由于SSO算法是一種新的隨機(jī)全局優(yōu)化技術(shù),可以防止個體圍聚在較好群體附近,使個體進(jìn)行全局搜索,解決了易陷入局部最優(yōu)解和搜索結(jié)果不穩(wěn)定的問題,并且該方法初值和參數(shù)的選擇對結(jié)果影響較小,尋優(yōu)能力和魯棒性較強(qiáng)。因此,針對PP模型在水質(zhì)評價中的最佳投影方向難以確定的問題,筆者采用了SSO算法解決。
綜合利用PP方法和SSO算法,即可構(gòu)建出對水質(zhì)各指標(biāo)進(jìn)行綜合評價的SSO-PP模型。SSO-PP模型的具體實(shí)現(xiàn)步驟如下。
此研究以莆田市小流域水源地為研究區(qū),包括白沙橋、江口橋、蔣隔水庫、瀨溪、木蘭溪三江口、南安陂、獅亭橋、仙游石馬橋和園頭橋9個斷面,共收集了2018—2020年間9個斷面的233個水質(zhì)樣本進(jìn)行綜合評價。監(jiān)測指標(biāo)選用了溶解氧(DO)、高錳酸鹽指數(shù)(COD)、五日生化需氧量(BOD)、總磷(TP)和氨氮(NH-N),根據(jù)《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002),各水質(zhì)指標(biāo)評價等級標(biāo)準(zhǔn)見表1。將表1中各指標(biāo)評價最大值擴(kuò)大10倍,最小值縮小至原來的1/10,用于數(shù)據(jù)初始化,使SSO-PP模型準(zhǔn)確度更高。
最大迭代次數(shù)=20,種群數(shù)目=10;閾值=0.55。
利用SSO-PP模型得到最佳投影方向。DO、COD、BOD、NH-N、TP的 最 佳 投 影 方 向=(0.141 51,0.999 98,0.871 95,0.890 88,0.987 02),結(jié)合表1中各指標(biāo)的分級閾值,將其代入式(2)得到投影值'。據(jù)此得到水質(zhì)綜合評價分級標(biāo)準(zhǔn)為:Ⅰ類≤0.001 1;Ⅱ類(0.001 1,0.006 2];Ⅲ類(0.006 2,0.012 6]; Ⅳ類(0.012 6,0.018 9];Ⅴ類(0.018 9,0.025 3];劣Ⅴ類>0.025 3。
表1 5項水質(zhì)評價指標(biāo)分級標(biāo)準(zhǔn)值和極值
將監(jiān)測的水質(zhì)樣本按式(1)進(jìn)行歸一化,把最佳投影方向代入到式(2)中,可得到2018—2020年各斷面的投影值(),根據(jù)水質(zhì)分級標(biāo)準(zhǔn)即可得到各斷面的水質(zhì)等級,選取部分水質(zhì)樣本的評價結(jié)果見表2。從表2可以看出,在園頭橋、蔣隔水庫和木蘭溪三江口這些斷面上,單因子評價法得出的水質(zhì)等級比SSO-PP模型綜合評價法差,主要原因在于單因子評價法以最差一項指標(biāo)等級為標(biāo)準(zhǔn),忽略了其他指標(biāo)對水質(zhì)的綜合影響,低估了各斷面的水域功能。而SSO-PP模型是用各樣點(diǎn)投影值反映水體特征,與單因子評價法相比具有一定的優(yōu)越性。
表2 SSO-PP模型與單因子法評價結(jié)果對比
經(jīng)統(tǒng)計,在選取的233個水質(zhì)樣本中,有208個水質(zhì)樣本的評價結(jié)果與單因子評價法相同,占總比的89.27%,另有25個水質(zhì)樣本的評價結(jié)果與單因子評價法不同,占總比的10.73%。在評價結(jié)果不同的25個樣本中,SSO-PP模型優(yōu)于單因子評價法1級的個數(shù)為17個,優(yōu)于單因子評價法2級的個數(shù)為8個。相差2級是由于樣本中的DO質(zhì)量濃度處于Ⅴ類標(biāo)準(zhǔn),但高錳酸鹽指數(shù)、五日化需氧量、總磷和氨氮質(zhì)量濃度對應(yīng)的水質(zhì)達(dá)到了Ⅰ類或Ⅱ類標(biāo)準(zhǔn)。由于單因子評價法選取最差指標(biāo)所在的水質(zhì)等級作為此斷面評價結(jié)果,評價較為片面,不能客觀反映水環(huán)境的綜合情況,而SSO-PP模型綜合評價法權(quán)衡了較好的指標(biāo)。
針對水質(zhì)的綜合分級評價問題,筆者構(gòu)建了基于SSO-PP模型的水質(zhì)綜合評價方法,并以莆田市小流域2018—2020年間的水質(zhì)監(jiān)測數(shù)據(jù)進(jìn)行檢驗(yàn)。結(jié)果表明,SSO-PP水質(zhì)綜合評價模型的分級結(jié)果優(yōu)于單因子評價法,避免了用最差指標(biāo)判定水質(zhì)類別的硬性分級問題,使水質(zhì)的評價結(jié)果更為科學(xué)和合理,為水質(zhì)的分級評價提供了一種新的思路。