孫英軍
(浙江省水文管理中心,浙江 杭州 310000)
工業(yè)廢水與生活廢水存在亂排放現(xiàn)象,使水體污染越來越嚴重,進而使水中氮、磷等物質(zhì)含量超標[1]。目前,各城市地下水達標率較低,地下水水質(zhì)嚴重污染已成為制約現(xiàn)代化與城鎮(zhèn)化建設的重要因素,且水污染破壞了生態(tài)環(huán)境,對人們生活與身體康健造成影響。地下水作為人類用水主要來源之一,對其水質(zhì)進行監(jiān)測已成為重點研究課題[2]。基于此,亟須提出可靠的地下水水質(zhì)參數(shù)監(jiān)測技術。為此,提出基于超球支持向量機的地下水水質(zhì)參數(shù)自動監(jiān)測技術。
超球支持向量機每類樣本只在訓練本類模型時用到一次,適合并行運算。基本思想是由兩分類問題擴展到多分類,對每一類樣本構造出一個最小超球。超球支持向量機模型構建步驟如下:
a.利用主成分分析方法采集地下水水質(zhì)數(shù)據(jù)。
b.建立樣本指標體系,并選定訓練集與測試集。
c.初始化種群位置與速度,計算適應度值。
d.根據(jù)粒子速度、位置及學習因子更新慣性權重。
e.如果滿足終止條件則終止,得到最優(yōu)參數(shù)C(懲罰因子)與σ(核參數(shù)),基于最優(yōu)參數(shù)對超球支持向量機進行訓練,通過超球支持向量機對水質(zhì)進行分級。
結合支持向量機回歸問題對超球進行改進,生成包括所有樣本點的最小超球:
其中
式中R——超球半徑;
ξi——松弛變量;
C——懲罰因子;
a——超球球心。
超球支持向量機算法流程如下:
a.使用初始訓練集Xa訓練SVM。
b.生成超球。
c.數(shù)據(jù)集中任意一點xi到超平面f(x)±ε的距離公式為
保存di≤p的點,得到保存點集St。
d.將增量數(shù)據(jù)Xb加入Xa中,使用SVM訓練數(shù)據(jù)集Xa。
超球向量機法使用兩個同心超球縮減訓練集,提高訓練速度。
通過對典型支持向量機進行分析可知,該模型可將低維空間內(nèi)樣本映射至高維空間實現(xiàn)相應處理,進而實現(xiàn)線性可分。高維空間特征計算過程中可能出現(xiàn)維數(shù)災難,總體計算量非常大,為此引入核函數(shù)進行解決[7-8]。目前使用范圍較廣的核函數(shù)主要包括線性核函數(shù)與徑向基核函數(shù)等。本研究選擇以下形式的核函數(shù):
式中xi和xj——第i和第j個樣本;
σ——核函數(shù)。
超球支持向量機運行過程中模型參數(shù)對分類具有較大影響,主要影響參數(shù)包含懲罰因子C與核參數(shù)σ。相關研究顯示,如果核參數(shù)非常小,模型訓練誤差非常小,即所有訓練樣本均為支持向量機,在核參數(shù)由小變大過程中,模型分類效果呈相應變化,中間將得到某個值所得分類效果最好。懲罰因子越小,模型分類復雜程度越低,經(jīng)驗風險值越大;相反模型分類復雜程度越高,經(jīng)驗風險值越小[9-10]。為此,須找出1組恰當?shù)膽土P因子與核參數(shù)使模型分類效果最優(yōu)。
采用改進粒子群法對超球支持向量機運行參數(shù)進行優(yōu)化,步驟如下:
a.初始化算法運行參數(shù),包括種群規(guī)模sizepop和加速系數(shù)c1、c2等,將算法最大迭代次數(shù)設為Tmax,任意生成一組(C,σ)作為粒子初始位置。
b.設置改進粒子群算法適應函數(shù),對粒子適應度進行計算與評估,選出最常用與典型的均方誤差MSE作為適應度函數(shù),計算公式如下:
c.基于粒子適應度值更新粒子自身與群體最優(yōu)適應度值,對粒子速度、位置和學習因子等進行動態(tài)調(diào)節(jié),獲取新粒子群,計算公式如下:
式中c1ini、c2ini——c1、c2初始值;
t、Tmax——目前迭代次數(shù)與最大迭代次數(shù);
c1fin、c2fin——c1、c2終值。
d.如果未滿足算法終止條件或達到最大迭代次數(shù),返回b將最優(yōu)參數(shù)進行輸出。
構建評價指標體系,并將該體系作為建立模型訓練樣本集合的基礎[3],可降低人為因素與監(jiān)測數(shù)據(jù)對模型運行的干擾,且體現(xiàn)評價結果客觀性,利于提高評價結果科學性?;趯嶋H監(jiān)測數(shù)據(jù)與水環(huán)境質(zhì)量相關標準(見表1),選取氨氮、總磷、總氮作為輸入?yún)?shù)。
表1 水環(huán)境質(zhì)量相關標準
由于指標項相對較多,且各指標項間存在密切聯(lián)系,對收斂效率與分類精確性產(chǎn)生影響,直接將部分監(jiān)測因子刪除易造成水質(zhì)情況難以全方位反映等問題,為此,引入主成分分析法,將高維空間數(shù)據(jù)轉(zhuǎn)化為低維空間數(shù)據(jù)進行處理,以簡化統(tǒng)計數(shù)字特征,消除重疊信息,獲取1組可反映原本輸入變量情況的新變量[4-6]。先對總體采集到的樣本進行主成分分析,具體過程如下。
假設存在n個樣本和p個指標變量,則原始數(shù)據(jù)矩陣表達式為
對矩陣進行標準化處理,將數(shù)據(jù)按照一定比例進行縮放,使其落到1個小區(qū)間內(nèi),對各指標分量進行標準化變換,變換表達式如下:
標準化后的矩陣X′可表示為
計算已知n個樣本間相關系數(shù),相關矩陣中各元素通過對應相關系數(shù)描述如下:
計算獲取相關矩陣R, 基于Ax=λx轉(zhuǎn)換成|R-λE|=0,實現(xiàn)特征方程求解,獲取m個不小于0的特征值,即λ1,λ2,…,λm,且λ1≥λ2≥,…,≥λm≥0,其中與第i個特征值相應的特征向量為ai=(ai1,…,aip)。
基于以上得到的m個特征向量對m個主成分變量進行計算,公式如下:
式中F1——第一主成分;
但是,在對外漢語教學中,有很長一段時間我們把教學重點放在語音、詞匯和語法上,缺乏對語用教學的重視。那么,現(xiàn)階段留學生的語用能力到底處于一個什么樣的水平,內(nèi)部發(fā)展是否均衡,語用能力是否隨著語言能力的提高而提高?留學生對語用能力的重要性、語用失誤的嚴重性又是如何看待的?在留學生看來,教材編寫和課堂教學,是否存在著語用教學方面的不足?
Fi——第i主成分。
利用訓練集合監(jiān)督學習構建相應超球支持向量機水質(zhì)等級評價分類器,通過測試集合獲取評價結果,如果超過標準值則發(fā)出警報。在超球支持向量機中,各樣本僅需開展1次訓練,較好地解決了傳統(tǒng)分類法多次參加訓練與測試的問題。
為驗證基于超球支持向量機的地下水水質(zhì)參數(shù)自動監(jiān)測技術可靠性,開展以下試驗。試驗平臺為matlab,以一地下水段為測試目標。監(jiān)測系統(tǒng)見圖1。
圖1 監(jiān)測系統(tǒng)
在地下水測試段分別設置3個測試點,對本文提出的監(jiān)測技術監(jiān)測準確性進行驗證。設置粒子群規(guī)模為20,加速度系數(shù)c1ini=2.5,c1fin=0.5,c2ini=0.5,最大迭代次數(shù)為50,ωmin=0.3,ωmax=0.9,懲罰因子取值區(qū)間為[0.01,100],核參數(shù)取值區(qū)間為[0,20]。
部分水質(zhì)類別判斷結果見表2、表3。
表2 觀測點1水質(zhì)類別判斷結果
表3 觀測點2水質(zhì)類別判斷結果
由表2、表3可知,基于超球支持向量機的地下水水質(zhì)參數(shù)自動監(jiān)測技術監(jiān)測得到的結果與實際結果一致,而單因子分類結果與實際結果略有出入,有出入的原因是某個因子污染相對嚴重,導致單因子評價結果較片面,僅突出某一水質(zhì)因子的影響,無法整體反映地下水水質(zhì)參數(shù)情況。本文提出的監(jiān)測技術評價相對全面,綜合考慮了多項指標,可高效彌補單因子評價存在的不足,提高地下水水質(zhì)參數(shù)自動監(jiān)測精確性。
對地下水進行水樣測試,并記錄TOC(總有機碳)與COD(化學需氧量),將記錄數(shù)據(jù)通過基于Python的數(shù)據(jù)分析軟件進行建模分析,生成以地下水COD值為x軸、以地下水TOC值為y軸的打點圖形,并運用最小二乘法對數(shù)據(jù)進行擬合,見圖2。
圖2 觀測點1 COD值與TOC值線性回歸模型
由圖2可知, 地下水COD值與TOC值存在良好的線性關系,監(jiān)測結果更靠近擬合的回歸曲線,可見地下水相關性較強。
TOC實測值與預測值跟隨性曲線見圖3,由圖3可知,兩處觀測點地下水水域TOC實測值曲線與TOC預測值曲線大致重合,可較好地實現(xiàn)不同地下水水域水質(zhì)參數(shù)監(jiān)測。
圖3 TOC實測值與預測值跟隨性曲線
基于上述研究,給出以下地下水水質(zhì)監(jiān)測建議:
a.建成前做好規(guī)劃。在監(jiān)測系統(tǒng)建設前期階段,基于各地區(qū)經(jīng)濟與供水等情況,按照先進、可靠的基本要求進行統(tǒng)一規(guī)劃,并為后期發(fā)展保留一定空間。隨著技術的不斷發(fā)展,在構建系統(tǒng)過程中預留接口,避免重復開發(fā)。
b.建設過程中強化管理。組織相關專家對相應方案進行優(yōu)化,并在開始投入建設后及時采集設備合格證書與說明書等,便于后期維護,并開展連續(xù)試運行,然后再驗收。
c.建成之后重視維護。以保障在線自動監(jiān)測性能為目的,按固定周期對各項監(jiān)測儀器進行清洗和調(diào)節(jié)。
現(xiàn)階段,水質(zhì)監(jiān)測效率低,且精確性較差,為此,提出基于超球支持向量機的地下水水質(zhì)參數(shù)自動監(jiān)測技術。以水質(zhì)監(jiān)測平臺為依托,結合主成分分析法、改進粒子群法、超球支持向量機構建地下水水質(zhì)參數(shù)級別評價模型。經(jīng)測試可知,本文所提方法具有良好的運行效果。下一步將結合外界因素進一步提升水質(zhì)監(jiān)測精確性,如利用地質(zhì)和氣象數(shù)據(jù)等實現(xiàn)水質(zhì)參數(shù)評價、監(jiān)測。