李偉晶
(遼寧省錦州水文局,遼寧錦州 121000)
當前我國水污染事件頻發(fā),對水質(zhì)進行(監(jiān))檢測治理已刻不容緩。在對流域內(nèi)的水質(zhì)進行評價時,通常需采用指標COD(化學需氧量)衡量水質(zhì)是否已被污染。故本文引入紫外-可見光譜法的水質(zhì)COD檢測預(yù)測模型,對遼寧省錦州市某流域水質(zhì)情況進行分析預(yù)測[1]。
通常在對水質(zhì)COD指標進行分析時有兩種方法:一種是光譜法,在對水質(zhì)COD指標進行分析時,通常選擇紫外-可見光測量水樣對光譜的吸收度,這種方法具有實時、在線的優(yōu)點;另一種是化學法,一般采用重鎘酸鉀和高錳酸鉀等強氧化性化學試劑,在強酸條件下對水樣進行氧化處理,然后再通過對實際消耗的氧化劑的量進行計算,以此判斷水質(zhì)化學需氧量,不足的是測量周期長、二次污染大,且實時性和在線性不好[1]。故本文主要選擇紫外-可見光譜法對錦州市某流域水質(zhì)COD指標進行合理預(yù)測、分析?;趯W者劉子毓、張宇等人的研究理論,該研究綜合了目前水質(zhì)分析中較為主流的主成分分析算法、極限學習機算法、粒子群優(yōu)化算法、粒子群優(yōu)化極限學習機預(yù)測模型,克服了常規(guī)水質(zhì)檢測分析與評價中,BP神經(jīng)網(wǎng)絡(luò)、T-S模糊神經(jīng)網(wǎng)絡(luò)存在的學習速度慢、計算分析結(jié)果復雜等不足。
在常規(guī)數(shù)據(jù)資料處理時,往往會出現(xiàn)諸多冗余性數(shù)據(jù),這些信息的存在會使特征信息量隱藏,不但會增加數(shù)據(jù)計算工作量,更會影響數(shù)據(jù)最終分析的準確度。對此,研究首先采用主成分分析法,有效去除高維數(shù)據(jù)中的大量冗余,通過提取特征因子和信息量,將復雜計算問題簡單化[2]。主成分分析法操作步驟如下:
1)將多個高緯樣本組成樣本矩陣,然后對該樣本矩陣相關(guān)數(shù)據(jù)指標進行標準化處理,以此獲得其特征向量。
2)結(jié)合特征向量的特征貢獻程度,確定主成分。
3)對得到的光譜數(shù)據(jù)進行降維處理且確定主成分后,即可結(jié)合主成分分析矩陣,對研究區(qū)水質(zhì)COD數(shù)據(jù)進行分析預(yù)測。
在PSO算法中,粒子表示每個優(yōu)化問題的潛在解。在基于粒子群優(yōu)化算法進行水質(zhì)分析時,首先會隨機生成一群粒子,而每個粒子都有與其相對應(yīng)的位置和初始化速度;然后,多次對粒子進行跌代即可獲得最優(yōu)解[3]。所以,可將PSO算法描述為:在一個多維目標搜索空間內(nèi),隨機存在的N個粒子共同組成的粒子群。其中,第i個粒子的速度與位置可通過以下公式計算:
式中:j=1,2,…,D;i=1,2,…,m;M——種群規(guī)模;T——當前進化代數(shù);r1,r2——分布于[0,1]間的隨機數(shù);c1,c2——加速常數(shù)。
PSO粒子群優(yōu)化算法流程見圖1。
在數(shù)據(jù)分析中,研究基于粒子群優(yōu)化算法,將極限學習機算法(ELM)的輸入閥值和輸入權(quán)值作為粒子群算法中的粒子[4]。與此同時,將實際值和預(yù)測值的均方根誤差RMSE作為適應(yīng)度函數(shù):
圖1 PSO粒子群優(yōu)化算法流程
式中:yi——水質(zhì)COD的實際值;yj——COD的預(yù)測值。
基于PSO-ELM的粒子群優(yōu)化極限學習機預(yù)測流程見圖2。
研究主要結(jié)合上述方法,采用試驗分析方案對遼寧省錦州市某河流水質(zhì)進行檢測分析,選取6組水樣樣本對其進行紫外-可見光譜法分析。采用光源和光譜儀分別為DH-2000氘鹵鎢燈光源和Maya2000紫外可見光譜儀,測量分析過程嚴格遵循我國現(xiàn)行GB11914-89《重鉻酸鹽法水質(zhì)化學需氧量的測定》技術(shù)標準實施[5]。
1)在對該研究中得到的光譜數(shù)據(jù)進行建模處理時,首先對其進行主成分算法分析,對數(shù)據(jù)進行降維,得到6組主成分分析特征量,見表1。
通過表1計算分析結(jié)果可知,6個主成分累計貢獻率達99.946%,采集的數(shù)據(jù)樣本能夠更好地傳遞原始光譜數(shù)據(jù)所表達的信息[6]。在上述數(shù)據(jù)處理基礎(chǔ)上,基于ELM極限學習機神經(jīng)網(wǎng)絡(luò)和PSO-ELM粒子群優(yōu)化極限學習機預(yù)測模型分析,最終得到6組主成分預(yù)測模型新訓練樣本矩陣,見表2。
圖2 基于PSO-ELM的粒子群優(yōu)化極限學習機預(yù)測流程圖
表1 基于主成分分析法的光譜數(shù)據(jù)特征值
表2 主成分分析矩陣表
2)選取以上6組數(shù)據(jù)樣本進行模型訓練分析,該研究PSO粒子群算法的種群規(guī)模N=6,學習因子c1=2,學習因子c2=2,數(shù)據(jù)最大跌代次數(shù)tmax=30,慣性權(quán)重w=0.6,將其輸入粒子群優(yōu)化極限學習機PSO-ELM模型中,經(jīng)過數(shù)據(jù)降維處理和數(shù)據(jù)跌代,最終得到PSO-ELM模型的預(yù)測結(jié)果擬合圖,見圖3。
圖3 基于PSO-ELM模型的預(yù)測結(jié)果擬合圖
從圖3可以看出:ELM模型的隱層閾值和輸入權(quán)值經(jīng)過PSO優(yōu)化后,模型預(yù)測擬合曲線逐漸平緩,由此表明經(jīng)過多次數(shù)據(jù)跌代處理,水質(zhì)分析結(jié)果精度大大提高[7]。如果以模型水質(zhì)分析預(yù)測運行時間來衡量,將上述3種不同方法應(yīng)用于遼寧省錦州市水質(zhì)分析評價預(yù)測中,效果存在很大差異。ELM模型、PSO-ELM模型和PCA-PSOELM水質(zhì)分析預(yù)測運行時間及誤差見表3。
表3 水質(zhì)分析預(yù)測運行時間和誤差
綜上3種水質(zhì)分析預(yù)測方法,PCA-PSOELM模型不僅運行時間較短,且分析結(jié)果誤差較小,僅為0.238 1,相對于ELM極限學習機算法和PSO-ELM模型而言,將PCA-PSO-ELM模型應(yīng)用于錦州市水質(zhì)分析預(yù)測和評價中,可顯著提升預(yù)測速率和預(yù)測精度[8]。
綜上所述,在區(qū)域水質(zhì)分析預(yù)測中,COD是一個十分重要的參數(shù)。研究針對錦州市某區(qū)域水質(zhì)情況進行紫外-可見光譜法分析預(yù)測,其中綜合了PCA主成分分析法、ELM極限學習機神經(jīng)網(wǎng)絡(luò)和PSO粒子群優(yōu)化算法、SO-ELM粒子群優(yōu)化極限學習機預(yù)測模型。研究應(yīng)用結(jié)果表明,基于紫外-可見光譜法的PCA-PSO-ELM模型應(yīng)用于錦州市水樣水質(zhì)分析中,可大大提升水質(zhì)分析預(yù)測精度和預(yù)測效率,這一方法為遼寧省錦州市水質(zhì)實時、在線檢測分析與評價提供了重要參考依據(jù)。
[1]許衛(wèi)娟.離子色譜法測定地表水中氟化物的方法探討[J].環(huán)境科學導刊,2014,33(4):86—87.
[2]王志民,于福蘭,劉志芬,崔杰石.阜新市地表水資源質(zhì)量評價[J].東北水利水電,2003(09):38—39.
[3]張久龍,季營,羅瑩瑩,等.鉬酸銨分光光度法測定水中總磷不確定度[J].硅谷,2012(21):183—184.
[4]陳妍.鉬酸銨分光光度法測定水中總磷含量的不確定度評定[J].廣東化工,2014,41(2):115—116.
[5]李學森.凌河流域水資源現(xiàn)狀及保護措施[J].水土保持應(yīng)用技術(shù),2015(03):36—37.
[6]高素麗.遼陽市水資源開發(fā)利用和管理保護對策[J].水土保持應(yīng)用技術(shù),2011(04):45—47.
[7]楊錦華.佛寺水庫水源飲水安全與水環(huán)境保護[J].水利技術(shù)監(jiān)督,2006(03):50—52.
[8]溫樹成.大伙房水庫水體富營養(yǎng)化現(xiàn)狀分析及對策研究[J].水土保持應(yīng)用技術(shù),2015(02):31—32.