史利濤
(漯河市生態(tài)環(huán)境局臨潁分局,河南 漯河 462600)
城市居住環(huán)境中的河水是中水回用技術(shù)的主要應(yīng)用對象,通過對城市居民生活用水進行集中處理,使水質(zhì)達到一定標(biāo)準,可回用于植被灌溉、路面清掃、廁所沖洗等,實現(xiàn)綠色生態(tài)發(fā)展戰(zhàn)略下的節(jié)水要求[1]。因此劉冉等提出了一個基于輻射傳輸過程的水質(zhì)遙感模型,根據(jù)入射光在水體中的輻射傳輸,確定污染物的懸浮狀態(tài),以定量分析的方式獲取監(jiān)測水樣,為中水回用的河道水質(zhì),提供一個科學(xué)的監(jiān)測技術(shù)[2]。李韶慧等對黔中水利樞紐的一期工程的核心水源工程進行評價,區(qū)分了各評價因子對水質(zhì)貢獻的差異性,提出了基于組合賦權(quán)貝葉斯模型的水質(zhì)評價方法,對水質(zhì)進行了較為精確的評價,達到了貴州省水功能區(qū)劃的相應(yīng)要求[3]。董巍等提出了基于最小二乘支持向量機的污水處理出水水質(zhì)COD預(yù)測模型,實現(xiàn)污水處理中出水水質(zhì)COD光譜信號重構(gòu),采用最小二乘支持向量機法建立水樣吸光度和水質(zhì)COD濃度預(yù)測模型,進而實現(xiàn)了污水處理中出水水質(zhì)COD在線預(yù)測,穩(wěn)定性較強[4]。
但是以往研究方法僅僅依靠單一的分類方法確認水質(zhì)信息,訓(xùn)練與學(xué)習(xí)能力較差,直接影響模型監(jiān)測精度,因此,此次研究將數(shù)據(jù)挖掘方法與監(jiān)測模型相結(jié)合,優(yōu)化水質(zhì)變化監(jiān)測模型。數(shù)據(jù)挖掘分為6個大步驟,以更加詳細和精準的操作方式處理監(jiān)測數(shù)據(jù),為模型的監(jiān)測工作提供數(shù)據(jù)劃分原則,為今后的水質(zhì)變化監(jiān)測,提供更加科學(xué)的技術(shù)支持。
1.1 計算影響水質(zhì)變化的參考指標(biāo)
城市人居環(huán)境中,河流水質(zhì)直接影響到綠化灌溉、車輛沖洗、道路沖洗等節(jié)水方案,同時,在城市污水處理中,二氧化氯主要是針對水體消毒的消毒劑,主要應(yīng)用于飲用水、污水、食品加工車間環(huán)境、水產(chǎn)養(yǎng)殖、土壤改良等領(lǐng)域,功效是通過二氧化氯的強氧化性來殺滅水中的致病菌、病毒、芽孢、真菌、微生物等,達到凈化水質(zhì)的目的,因此在傳統(tǒng)方法的基礎(chǔ)上,本文所設(shè)計的水質(zhì)變化監(jiān)測模型選擇氯作為影響水質(zhì)變化的參考指標(biāo)。
河道水流中的試劑氯,以總余氯、化合性余氯以及游離余氯的形式存在??紤]到河道中的有機物和無機物,會對余氯造成衰減反應(yīng),利用下列公式,描述河道中余氯的衰減過程:
Cl2+M=CBPs
(1)
公式中:CBPs表示含量為s的反應(yīng)產(chǎn)物;Cl2表示河道水中的自由余氯;M表示能與自由余氯發(fā)生反應(yīng)的有機物或無機物。設(shè)置三個參數(shù)的反應(yīng)速率分別為vp、vc和vm,則通過下列方程組中的公式,描述不同物質(zhì)的反應(yīng)結(jié)果:
(2)
公式中:qp、qc以及qm分別表示CBPs、Cl2和M的實際濃度。若反應(yīng)產(chǎn)物CBPs的濃度值小于物質(zhì)M的濃度值時,將qm看做一個常數(shù),則
(3)
公式中:vs表示余氯的衰減速率。河道是土體或建筑表面組成的空間,因此水中的余氯還會與河道接觸,此時余氯與河道上的粘附物質(zhì)發(fā)生反應(yīng),消耗了余氯。因此河道接觸面的余氯反應(yīng)速率為:
(4)
公式中:v1表示水流到河道表面的傳輸系數(shù);lh表示高度為h的河道半徑;qb表示河道表面的余氯濃度。則個面具上述計算結(jié)果,得到河道表面的余氯衰減速率,計算公式為:
(5)
公式中:f2表示Sherwood系數(shù)。聯(lián)立公式(3)和公式(5),得到余氯在河流水中的衰減指標(biāo):
(6)
將上述指標(biāo)作為模型監(jiān)測水質(zhì)變化的參照變量,然后進行下一階段的優(yōu)化設(shè)計[5]。
1.2 基于數(shù)據(jù)挖掘設(shè)置模型對水質(zhì)變化的設(shè)別模式
數(shù)據(jù)挖掘方法中,聚類分析技術(shù)是一種先進的應(yīng)用技術(shù),可以根據(jù)目標(biāo)變量或?qū)傩?,計算具有距離差異的數(shù)據(jù)集合。因此利用數(shù)據(jù)挖掘技術(shù),對水質(zhì)監(jiān)測矩陣進行數(shù)據(jù)分類。層次聚類分析法預(yù)先初始化相似矩陣和距離,然后對最小集合進行更新與合并,不斷重復(fù)循環(huán)更新新的數(shù)據(jù)集合,達到設(shè)定的集合數(shù)目后結(jié)束迭代。將距離設(shè)置為d,則第a個監(jiān)測區(qū)域和第b個監(jiān)測區(qū)域之間的距離為:
(7)
公式中:uam和ubm分別表示第a個和第b個監(jiān)測區(qū)域,指標(biāo)m的實際監(jiān)測值,該值就是公式(6)的計算結(jié)果[6]。而水質(zhì)成分是水質(zhì)變量觀測結(jié)果的線性組合,因此歸一化區(qū)域內(nèi)所有水體的歷史數(shù)據(jù),得到水質(zhì)成分分析結(jié)果:
(8)
公式中:Fab表示水體成分;βae表示衰減速率指標(biāo)對于提取成分的影響程度;i、j分別表示水體主成分數(shù)目和監(jiān)測樣本數(shù)目;e表示水質(zhì)指標(biāo)的總變化次數(shù)。根據(jù)數(shù)據(jù)挖掘方法訓(xùn)練樣本數(shù)據(jù),得到實際可用的參數(shù),找出水質(zhì)數(shù)據(jù)之間的時空關(guān)聯(lián),利用模型的智能計算程序,監(jiān)測水質(zhì)變化情況,找出各時空間區(qū)域內(nèi),河道水質(zhì)指標(biāo)與其他參數(shù)之間的隱含關(guān)系,完成對某一特定區(qū)域內(nèi)水質(zhì)變化的識別[7]。監(jiān)測模型設(shè)計的核心思想是以智能推理的方式合理解釋重要的隱藏關(guān)系,并針對水質(zhì)污染物、污染源等問題提出相應(yīng)的管理措施,由此設(shè)置基于數(shù)據(jù)挖掘的水質(zhì)變化識別模式,如圖1所示,利用該模型實時監(jiān)測河流水質(zhì)變化特征。
圖1 水質(zhì)變化設(shè)別模式Fig.1 Water quality change model
將圖1所示的識別模式,與監(jiān)測模型之間建立有效連接,通過該模式控制模型的監(jiān)測行為[8]。
1.3 構(gòu)建具有時間性質(zhì)的水質(zhì)變化監(jiān)測模型
時間序列是指隨時間推移而發(fā)生變化的數(shù)據(jù),由于監(jiān)測模型與監(jiān)測時間點存在相關(guān)性,因此構(gòu)建一個具有時間性質(zhì)的水質(zhì)變化監(jiān)測模型。根據(jù)統(tǒng)計特性,將時間序列劃分為平穩(wěn)和非平穩(wěn)時間序列,當(dāng)希望監(jiān)測結(jié)果在未來保持不變時,此時需要模型具有處理平穩(wěn)性監(jiān)測數(shù)據(jù)的能力;當(dāng)一些數(shù)據(jù)發(fā)生變化時,則需要模型具備處理非平穩(wěn)性數(shù)據(jù)的能力。已知目標(biāo)的未來走勢與參考指標(biāo)相關(guān),因此根據(jù)移動平均法建立監(jiān)測模型,計算公式為:
(9)
(10)
至此,在數(shù)據(jù)挖掘方法的輔助下,實現(xiàn)對城市人居環(huán)境河流水質(zhì)變化監(jiān)測模型的構(gòu)建。
2.1 實驗準備
將河南省某城市的人居環(huán)境河流作為實驗測試對象,對該地區(qū)的河流水質(zhì)變化進行監(jiān)測。圖2為該城市中,某一村鎮(zhèn)的中水回用河道結(jié)構(gòu)圖。
圖2 中水回用河道結(jié)構(gòu)圖Fig.2 Reclained water reuse chamel structure diagram
圖2中,節(jié)點1表示村鎮(zhèn)供水源,其他節(jié)點表示村鎮(zhèn)人居環(huán)境用水節(jié)點,網(wǎng)狀結(jié)構(gòu)表示供水河道的走勢。根據(jù)文中設(shè)計模型的一般過程,結(jié)合數(shù)據(jù)挖掘和時序性質(zhì)基本特征,確定了自身輸入層、輸出層以及隱含層的神經(jīng)元個數(shù),分別為10、1和12,設(shè)置模型的學(xué)習(xí)速度為0.1,終止誤差為0.0001,最大迭代次數(shù)為10000,初始權(quán)重范圍為[-0.5,0.5],學(xué)習(xí)次數(shù)為7。根據(jù)上述參數(shù)的設(shè)置值,建立基于數(shù)據(jù)挖掘的城市人居環(huán)境河流水質(zhì)變化監(jiān)測模型,該模型在7次學(xué)習(xí)下,其損失函數(shù)的變化如圖3所示。
圖3 模型損失函數(shù)的變化趨勢Fig.3 Change trend of model loss function
根據(jù)圖3中的數(shù)據(jù)可知,監(jiān)測模型的損失函數(shù)為23.72,合計用時為3 386s。完成每一次學(xué)習(xí)任務(wù)后,根據(jù)樣本誤差剔除部分樣本,再根據(jù)剩余的樣本進行學(xué)習(xí),整個建模過程中,學(xué)習(xí)的樣本數(shù)量和被剔除的樣本數(shù)量,如表1所示。
表1 建模過程中每次學(xué)習(xí)的樣本數(shù)量Tab.1 Sample number of each learning in modeling process (個)
根據(jù)表1中的數(shù)據(jù)可知,隨著學(xué)習(xí)次數(shù)的增加,被剔除的樣本數(shù)量隨之減少。當(dāng)模型建立完畢時,共剔除了3 051個樣本,最后用于建模的樣本數(shù)為17 545。選擇水質(zhì)監(jiān)測需要的儀器設(shè)備,搭建實驗測試平臺,將文中設(shè)計的監(jiān)測模型作為實驗組,將文獻[2]方法作為對照組(和本文方法一直,均以定量分析的方式獲取監(jiān)測水樣,減少數(shù)據(jù)采樣過程中的不確定性),將兩個模型與水質(zhì)監(jiān)測系統(tǒng)之間建立連接,比較不同監(jiān)測模型對實驗地區(qū)的水質(zhì)監(jiān)測結(jié)果。
2.2 模型誤差檢驗
由于各學(xué)習(xí)樣本的河道水質(zhì),是通過樣本所在區(qū)域的中水回用資源均值柵格化得到的,并不是該測試河道的實際中水回用資源,因此不對單個學(xué)習(xí)樣本誤差進行分析,利用模型計算各個位置的河道水質(zhì),然后統(tǒng)計各個區(qū)域的水質(zhì)均值,將該值與村鎮(zhèn)報出的水質(zhì)數(shù)據(jù)進行比較。利用兩組模型監(jiān)測12個區(qū)域中,6個月內(nèi)的水質(zhì)變化情況,模型的監(jiān)測均值與公報值的絕對誤差和相對誤差,如表2所示。
表2 模型監(jiān)測均值與公報值的誤差對比Tab.2 Error comparison between the model monitoring mean value and the bulletin value
根據(jù)表2中的計算結(jié)果可知,文中模型計算下,有58.33%的絕對誤差絕對值,小于20mm;所有絕對誤差絕對值均小于30mm。而文獻[2]方法應(yīng)用下,有41.67%的絕對誤差絕對值,小于20mm;有66.67%的絕對誤差絕對值小于30mm。且文獻[2]方法的水質(zhì)監(jiān)測誤差,有4個區(qū)域的水質(zhì)監(jiān)測絕對誤差絕對值,大于40mm。且這四個區(qū)域的相對誤差也超過了25%。計算兩個模型的相對誤差絕對值均值,分別為7.13%和16.65%,文中模型的相對誤差絕對值平均結(jié)果,比文獻[2]方法低了9.52%??梢姶舜卧O(shè)計的水質(zhì)監(jiān)測模型,其監(jiān)測誤差更小,得到的水質(zhì)變化監(jiān)測結(jié)果,更加貼近河道水質(zhì)的真實值。
2.3 水質(zhì)變化監(jiān)測效果測試
已知河南省有17個地級市1個直轄市,為了方便實驗測試,將這些城市按照A1~A18的順序進行編號。已知18個城市中,有6個城市的水質(zhì)狀態(tài)經(jīng)過治理后,符合中水回用的標(biāo)準;有2個城市的水質(zhì)狀態(tài)則出現(xiàn)了中度污染現(xiàn)象;其他城市的水質(zhì)則一直符合中水回用標(biāo)準。實驗設(shè)置2個相同監(jiān)測周期,分別利用2個模型,對河南省各個城市的河流水質(zhì)變化進行監(jiān)測,周期與監(jiān)測過程一一對應(yīng),縮減實驗時間。圖4為第1個監(jiān)測周期內(nèi),兩個模型對城市人居環(huán)境河流水質(zhì)變化的監(jiān)測效果。
圖4 第1個測試周期內(nèi)模型對水質(zhì)變化的監(jiān)測效果Fig.4 Monitoring effect of the model on water quality changes in the first test period
根據(jù)已知的實驗測試條件發(fā)現(xiàn),文中設(shè)計的模型準確得到了6個城市的河流水質(zhì),不滿足中水回用標(biāo)準,同時也監(jiān)測到了2個城市的河流水質(zhì)出現(xiàn)了微弱變化。而文獻[2]方法在監(jiān)測過程中,還未發(fā)現(xiàn)明顯的污染變化。圖5是第2個監(jiān)測周期內(nèi),兩組模型得到的監(jiān)測結(jié)果。
圖5 第2個測試周期內(nèi)模型對水質(zhì)變化的監(jiān)測效果Fig.5 Monitoring effect of the model on water quality changes in the second test period
根據(jù)圖5所示的監(jiān)測結(jié)果發(fā)現(xiàn),此次設(shè)計的監(jiān)測模型,得到的城市河流水質(zhì)監(jiān)測結(jié)果,與已知的實驗測試條件完全一致。而文獻[2]方法則只發(fā)現(xiàn)了4個城市的河流水質(zhì),開始接近中水回用標(biāo)準值,且未發(fā)現(xiàn)1個城市的河流水質(zhì),朝著中度污染變化。比較兩組模型的訓(xùn)練誤差和泛化誤差,結(jié)果如表3所示。
表3 模型誤差統(tǒng)計Tab.3 Model error statistics (mm)
根據(jù)表3中的數(shù)據(jù)可知,此次設(shè)計的監(jiān)測模型,其精度更高,因此在監(jiān)測水質(zhì)變化時,融入了數(shù)據(jù)挖掘技術(shù),可以得到與實際數(shù)據(jù)一致的監(jiān)測結(jié)果。
本研究在借鑒傳統(tǒng)監(jiān)測模型的基礎(chǔ)上,針對分類方法單一,學(xué)習(xí)與訓(xùn)練能力較差的問題,結(jié)合數(shù)據(jù)挖掘算法與時間序列,建立具有時間性質(zhì)的水質(zhì)變化監(jiān)測模型,幫助模型增強對數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練能力,為城市水安全提供更完善的技術(shù)保障。
由于時間和實驗樣本的限制,僅對部分優(yōu)化內(nèi)容進行了詳細描述,缺少其他影響水質(zhì)變化因子的探討與區(qū)域內(nèi)水質(zhì)變化樣本的挖掘,因此,在以后的研究工作中,可以對其他部分進行說明,為模型的優(yōu)化和使用提供更詳細的數(shù)據(jù)。