史利濤
(漯河市生態(tài)環(huán)境局臨潁分局,河南 漯河 462600)
城市居住環(huán)境中的河水是中水回用技術(shù)的主要應(yīng)用對(duì)象,通過(guò)對(duì)城市居民生活用水進(jìn)行集中處理,使水質(zhì)達(dá)到一定標(biāo)準(zhǔn),可回用于植被灌溉、路面清掃、廁所沖洗等,實(shí)現(xiàn)綠色生態(tài)發(fā)展戰(zhàn)略下的節(jié)水要求[1]。因此劉冉等提出了一個(gè)基于輻射傳輸過(guò)程的水質(zhì)遙感模型,根據(jù)入射光在水體中的輻射傳輸,確定污染物的懸浮狀態(tài),以定量分析的方式獲取監(jiān)測(cè)水樣,為中水回用的河道水質(zhì),提供一個(gè)科學(xué)的監(jiān)測(cè)技術(shù)[2]。李韶慧等對(duì)黔中水利樞紐的一期工程的核心水源工程進(jìn)行評(píng)價(jià),區(qū)分了各評(píng)價(jià)因子對(duì)水質(zhì)貢獻(xiàn)的差異性,提出了基于組合賦權(quán)貝葉斯模型的水質(zhì)評(píng)價(jià)方法,對(duì)水質(zhì)進(jìn)行了較為精確的評(píng)價(jià),達(dá)到了貴州省水功能區(qū)劃的相應(yīng)要求[3]。董巍等提出了基于最小二乘支持向量機(jī)的污水處理出水水質(zhì)COD預(yù)測(cè)模型,實(shí)現(xiàn)污水處理中出水水質(zhì)COD光譜信號(hào)重構(gòu),采用最小二乘支持向量機(jī)法建立水樣吸光度和水質(zhì)COD濃度預(yù)測(cè)模型,進(jìn)而實(shí)現(xiàn)了污水處理中出水水質(zhì)COD在線預(yù)測(cè),穩(wěn)定性較強(qiáng)[4]。
但是以往研究方法僅僅依靠單一的分類方法確認(rèn)水質(zhì)信息,訓(xùn)練與學(xué)習(xí)能力較差,直接影響模型監(jiān)測(cè)精度,因此,此次研究將數(shù)據(jù)挖掘方法與監(jiān)測(cè)模型相結(jié)合,優(yōu)化水質(zhì)變化監(jiān)測(cè)模型。數(shù)據(jù)挖掘分為6個(gè)大步驟,以更加詳細(xì)和精準(zhǔn)的操作方式處理監(jiān)測(cè)數(shù)據(jù),為模型的監(jiān)測(cè)工作提供數(shù)據(jù)劃分原則,為今后的水質(zhì)變化監(jiān)測(cè),提供更加科學(xué)的技術(shù)支持。
1.1 計(jì)算影響水質(zhì)變化的參考指標(biāo)
城市人居環(huán)境中,河流水質(zhì)直接影響到綠化灌溉、車輛沖洗、道路沖洗等節(jié)水方案,同時(shí),在城市污水處理中,二氧化氯主要是針對(duì)水體消毒的消毒劑,主要應(yīng)用于飲用水、污水、食品加工車間環(huán)境、水產(chǎn)養(yǎng)殖、土壤改良等領(lǐng)域,功效是通過(guò)二氧化氯的強(qiáng)氧化性來(lái)殺滅水中的致病菌、病毒、芽孢、真菌、微生物等,達(dá)到凈化水質(zhì)的目的,因此在傳統(tǒng)方法的基礎(chǔ)上,本文所設(shè)計(jì)的水質(zhì)變化監(jiān)測(cè)模型選擇氯作為影響水質(zhì)變化的參考指標(biāo)。
河道水流中的試劑氯,以總余氯、化合性余氯以及游離余氯的形式存在??紤]到河道中的有機(jī)物和無(wú)機(jī)物,會(huì)對(duì)余氯造成衰減反應(yīng),利用下列公式,描述河道中余氯的衰減過(guò)程:
Cl2+M=CBPs
(1)
公式中:CBPs表示含量為s的反應(yīng)產(chǎn)物;Cl2表示河道水中的自由余氯;M表示能與自由余氯發(fā)生反應(yīng)的有機(jī)物或無(wú)機(jī)物。設(shè)置三個(gè)參數(shù)的反應(yīng)速率分別為vp、vc和vm,則通過(guò)下列方程組中的公式,描述不同物質(zhì)的反應(yīng)結(jié)果:
(2)
公式中:qp、qc以及qm分別表示CBPs、Cl2和M的實(shí)際濃度。若反應(yīng)產(chǎn)物CBPs的濃度值小于物質(zhì)M的濃度值時(shí),將qm看做一個(gè)常數(shù),則
(3)
公式中:vs表示余氯的衰減速率。河道是土體或建筑表面組成的空間,因此水中的余氯還會(huì)與河道接觸,此時(shí)余氯與河道上的粘附物質(zhì)發(fā)生反應(yīng),消耗了余氯。因此河道接觸面的余氯反應(yīng)速率為:
(4)
公式中:v1表示水流到河道表面的傳輸系數(shù);lh表示高度為h的河道半徑;qb表示河道表面的余氯濃度。則個(gè)面具上述計(jì)算結(jié)果,得到河道表面的余氯衰減速率,計(jì)算公式為:
(5)
公式中:f2表示Sherwood系數(shù)。聯(lián)立公式(3)和公式(5),得到余氯在河流水中的衰減指標(biāo):
(6)
將上述指標(biāo)作為模型監(jiān)測(cè)水質(zhì)變化的參照變量,然后進(jìn)行下一階段的優(yōu)化設(shè)計(jì)[5]。
1.2 基于數(shù)據(jù)挖掘設(shè)置模型對(duì)水質(zhì)變化的設(shè)別模式
數(shù)據(jù)挖掘方法中,聚類分析技術(shù)是一種先進(jìn)的應(yīng)用技術(shù),可以根據(jù)目標(biāo)變量或?qū)傩裕?jì)算具有距離差異的數(shù)據(jù)集合。因此利用數(shù)據(jù)挖掘技術(shù),對(duì)水質(zhì)監(jiān)測(cè)矩陣進(jìn)行數(shù)據(jù)分類。層次聚類分析法預(yù)先初始化相似矩陣和距離,然后對(duì)最小集合進(jìn)行更新與合并,不斷重復(fù)循環(huán)更新新的數(shù)據(jù)集合,達(dá)到設(shè)定的集合數(shù)目后結(jié)束迭代。將距離設(shè)置為d,則第a個(gè)監(jiān)測(cè)區(qū)域和第b個(gè)監(jiān)測(cè)區(qū)域之間的距離為:
(7)
公式中:uam和ubm分別表示第a個(gè)和第b個(gè)監(jiān)測(cè)區(qū)域,指標(biāo)m的實(shí)際監(jiān)測(cè)值,該值就是公式(6)的計(jì)算結(jié)果[6]。而水質(zhì)成分是水質(zhì)變量觀測(cè)結(jié)果的線性組合,因此歸一化區(qū)域內(nèi)所有水體的歷史數(shù)據(jù),得到水質(zhì)成分分析結(jié)果:
(8)
公式中:Fab表示水體成分;βae表示衰減速率指標(biāo)對(duì)于提取成分的影響程度;i、j分別表示水體主成分?jǐn)?shù)目和監(jiān)測(cè)樣本數(shù)目;e表示水質(zhì)指標(biāo)的總變化次數(shù)。根據(jù)數(shù)據(jù)挖掘方法訓(xùn)練樣本數(shù)據(jù),得到實(shí)際可用的參數(shù),找出水質(zhì)數(shù)據(jù)之間的時(shí)空關(guān)聯(lián),利用模型的智能計(jì)算程序,監(jiān)測(cè)水質(zhì)變化情況,找出各時(shí)空間區(qū)域內(nèi),河道水質(zhì)指標(biāo)與其他參數(shù)之間的隱含關(guān)系,完成對(duì)某一特定區(qū)域內(nèi)水質(zhì)變化的識(shí)別[7]。監(jiān)測(cè)模型設(shè)計(jì)的核心思想是以智能推理的方式合理解釋重要的隱藏關(guān)系,并針對(duì)水質(zhì)污染物、污染源等問(wèn)題提出相應(yīng)的管理措施,由此設(shè)置基于數(shù)據(jù)挖掘的水質(zhì)變化識(shí)別模式,如圖1所示,利用該模型實(shí)時(shí)監(jiān)測(cè)河流水質(zhì)變化特征。
圖1 水質(zhì)變化設(shè)別模式Fig.1 Water quality change model
將圖1所示的識(shí)別模式,與監(jiān)測(cè)模型之間建立有效連接,通過(guò)該模式控制模型的監(jiān)測(cè)行為[8]。
1.3 構(gòu)建具有時(shí)間性質(zhì)的水質(zhì)變化監(jiān)測(cè)模型
時(shí)間序列是指隨時(shí)間推移而發(fā)生變化的數(shù)據(jù),由于監(jiān)測(cè)模型與監(jiān)測(cè)時(shí)間點(diǎn)存在相關(guān)性,因此構(gòu)建一個(gè)具有時(shí)間性質(zhì)的水質(zhì)變化監(jiān)測(cè)模型。根據(jù)統(tǒng)計(jì)特性,將時(shí)間序列劃分為平穩(wěn)和非平穩(wěn)時(shí)間序列,當(dāng)希望監(jiān)測(cè)結(jié)果在未來(lái)保持不變時(shí),此時(shí)需要模型具有處理平穩(wěn)性監(jiān)測(cè)數(shù)據(jù)的能力;當(dāng)一些數(shù)據(jù)發(fā)生變化時(shí),則需要模型具備處理非平穩(wěn)性數(shù)據(jù)的能力。已知目標(biāo)的未來(lái)走勢(shì)與參考指標(biāo)相關(guān),因此根據(jù)移動(dòng)平均法建立監(jiān)測(cè)模型,計(jì)算公式為:
(9)
(10)
至此,在數(shù)據(jù)挖掘方法的輔助下,實(shí)現(xiàn)對(duì)城市人居環(huán)境河流水質(zhì)變化監(jiān)測(cè)模型的構(gòu)建。
2.1 實(shí)驗(yàn)準(zhǔn)備
將河南省某城市的人居環(huán)境河流作為實(shí)驗(yàn)測(cè)試對(duì)象,對(duì)該地區(qū)的河流水質(zhì)變化進(jìn)行監(jiān)測(cè)。圖2為該城市中,某一村鎮(zhèn)的中水回用河道結(jié)構(gòu)圖。
圖2 中水回用河道結(jié)構(gòu)圖Fig.2 Reclained water reuse chamel structure diagram
圖2中,節(jié)點(diǎn)1表示村鎮(zhèn)供水源,其他節(jié)點(diǎn)表示村鎮(zhèn)人居環(huán)境用水節(jié)點(diǎn),網(wǎng)狀結(jié)構(gòu)表示供水河道的走勢(shì)。根據(jù)文中設(shè)計(jì)模型的一般過(guò)程,結(jié)合數(shù)據(jù)挖掘和時(shí)序性質(zhì)基本特征,確定了自身輸入層、輸出層以及隱含層的神經(jīng)元個(gè)數(shù),分別為10、1和12,設(shè)置模型的學(xué)習(xí)速度為0.1,終止誤差為0.0001,最大迭代次數(shù)為10000,初始權(quán)重范圍為[-0.5,0.5],學(xué)習(xí)次數(shù)為7。根據(jù)上述參數(shù)的設(shè)置值,建立基于數(shù)據(jù)挖掘的城市人居環(huán)境河流水質(zhì)變化監(jiān)測(cè)模型,該模型在7次學(xué)習(xí)下,其損失函數(shù)的變化如圖3所示。
圖3 模型損失函數(shù)的變化趨勢(shì)Fig.3 Change trend of model loss function
根據(jù)圖3中的數(shù)據(jù)可知,監(jiān)測(cè)模型的損失函數(shù)為23.72,合計(jì)用時(shí)為3 386s。完成每一次學(xué)習(xí)任務(wù)后,根據(jù)樣本誤差剔除部分樣本,再根據(jù)剩余的樣本進(jìn)行學(xué)習(xí),整個(gè)建模過(guò)程中,學(xué)習(xí)的樣本數(shù)量和被剔除的樣本數(shù)量,如表1所示。
表1 建模過(guò)程中每次學(xué)習(xí)的樣本數(shù)量Tab.1 Sample number of each learning in modeling process (個(gè))
根據(jù)表1中的數(shù)據(jù)可知,隨著學(xué)習(xí)次數(shù)的增加,被剔除的樣本數(shù)量隨之減少。當(dāng)模型建立完畢時(shí),共剔除了3 051個(gè)樣本,最后用于建模的樣本數(shù)為17 545。選擇水質(zhì)監(jiān)測(cè)需要的儀器設(shè)備,搭建實(shí)驗(yàn)測(cè)試平臺(tái),將文中設(shè)計(jì)的監(jiān)測(cè)模型作為實(shí)驗(yàn)組,將文獻(xiàn)[2]方法作為對(duì)照組(和本文方法一直,均以定量分析的方式獲取監(jiān)測(cè)水樣,減少數(shù)據(jù)采樣過(guò)程中的不確定性),將兩個(gè)模型與水質(zhì)監(jiān)測(cè)系統(tǒng)之間建立連接,比較不同監(jiān)測(cè)模型對(duì)實(shí)驗(yàn)地區(qū)的水質(zhì)監(jiān)測(cè)結(jié)果。
2.2 模型誤差檢驗(yàn)
由于各學(xué)習(xí)樣本的河道水質(zhì),是通過(guò)樣本所在區(qū)域的中水回用資源均值柵格化得到的,并不是該測(cè)試河道的實(shí)際中水回用資源,因此不對(duì)單個(gè)學(xué)習(xí)樣本誤差進(jìn)行分析,利用模型計(jì)算各個(gè)位置的河道水質(zhì),然后統(tǒng)計(jì)各個(gè)區(qū)域的水質(zhì)均值,將該值與村鎮(zhèn)報(bào)出的水質(zhì)數(shù)據(jù)進(jìn)行比較。利用兩組模型監(jiān)測(cè)12個(gè)區(qū)域中,6個(gè)月內(nèi)的水質(zhì)變化情況,模型的監(jiān)測(cè)均值與公報(bào)值的絕對(duì)誤差和相對(duì)誤差,如表2所示。
表2 模型監(jiān)測(cè)均值與公報(bào)值的誤差對(duì)比Tab.2 Error comparison between the model monitoring mean value and the bulletin value
根據(jù)表2中的計(jì)算結(jié)果可知,文中模型計(jì)算下,有58.33%的絕對(duì)誤差絕對(duì)值,小于20mm;所有絕對(duì)誤差絕對(duì)值均小于30mm。而文獻(xiàn)[2]方法應(yīng)用下,有41.67%的絕對(duì)誤差絕對(duì)值,小于20mm;有66.67%的絕對(duì)誤差絕對(duì)值小于30mm。且文獻(xiàn)[2]方法的水質(zhì)監(jiān)測(cè)誤差,有4個(gè)區(qū)域的水質(zhì)監(jiān)測(cè)絕對(duì)誤差絕對(duì)值,大于40mm。且這四個(gè)區(qū)域的相對(duì)誤差也超過(guò)了25%。計(jì)算兩個(gè)模型的相對(duì)誤差絕對(duì)值均值,分別為7.13%和16.65%,文中模型的相對(duì)誤差絕對(duì)值平均結(jié)果,比文獻(xiàn)[2]方法低了9.52%??梢?jiàn)此次設(shè)計(jì)的水質(zhì)監(jiān)測(cè)模型,其監(jiān)測(cè)誤差更小,得到的水質(zhì)變化監(jiān)測(cè)結(jié)果,更加貼近河道水質(zhì)的真實(shí)值。
2.3 水質(zhì)變化監(jiān)測(cè)效果測(cè)試
已知河南省有17個(gè)地級(jí)市1個(gè)直轄市,為了方便實(shí)驗(yàn)測(cè)試,將這些城市按照A1~A18的順序進(jìn)行編號(hào)。已知18個(gè)城市中,有6個(gè)城市的水質(zhì)狀態(tài)經(jīng)過(guò)治理后,符合中水回用的標(biāo)準(zhǔn);有2個(gè)城市的水質(zhì)狀態(tài)則出現(xiàn)了中度污染現(xiàn)象;其他城市的水質(zhì)則一直符合中水回用標(biāo)準(zhǔn)。實(shí)驗(yàn)設(shè)置2個(gè)相同監(jiān)測(cè)周期,分別利用2個(gè)模型,對(duì)河南省各個(gè)城市的河流水質(zhì)變化進(jìn)行監(jiān)測(cè),周期與監(jiān)測(cè)過(guò)程一一對(duì)應(yīng),縮減實(shí)驗(yàn)時(shí)間。圖4為第1個(gè)監(jiān)測(cè)周期內(nèi),兩個(gè)模型對(duì)城市人居環(huán)境河流水質(zhì)變化的監(jiān)測(cè)效果。
圖4 第1個(gè)測(cè)試周期內(nèi)模型對(duì)水質(zhì)變化的監(jiān)測(cè)效果Fig.4 Monitoring effect of the model on water quality changes in the first test period
根據(jù)已知的實(shí)驗(yàn)測(cè)試條件發(fā)現(xiàn),文中設(shè)計(jì)的模型準(zhǔn)確得到了6個(gè)城市的河流水質(zhì),不滿足中水回用標(biāo)準(zhǔn),同時(shí)也監(jiān)測(cè)到了2個(gè)城市的河流水質(zhì)出現(xiàn)了微弱變化。而文獻(xiàn)[2]方法在監(jiān)測(cè)過(guò)程中,還未發(fā)現(xiàn)明顯的污染變化。圖5是第2個(gè)監(jiān)測(cè)周期內(nèi),兩組模型得到的監(jiān)測(cè)結(jié)果。
圖5 第2個(gè)測(cè)試周期內(nèi)模型對(duì)水質(zhì)變化的監(jiān)測(cè)效果Fig.5 Monitoring effect of the model on water quality changes in the second test period
根據(jù)圖5所示的監(jiān)測(cè)結(jié)果發(fā)現(xiàn),此次設(shè)計(jì)的監(jiān)測(cè)模型,得到的城市河流水質(zhì)監(jiān)測(cè)結(jié)果,與已知的實(shí)驗(yàn)測(cè)試條件完全一致。而文獻(xiàn)[2]方法則只發(fā)現(xiàn)了4個(gè)城市的河流水質(zhì),開(kāi)始接近中水回用標(biāo)準(zhǔn)值,且未發(fā)現(xiàn)1個(gè)城市的河流水質(zhì),朝著中度污染變化。比較兩組模型的訓(xùn)練誤差和泛化誤差,結(jié)果如表3所示。
表3 模型誤差統(tǒng)計(jì)Tab.3 Model error statistics (mm)
根據(jù)表3中的數(shù)據(jù)可知,此次設(shè)計(jì)的監(jiān)測(cè)模型,其精度更高,因此在監(jiān)測(cè)水質(zhì)變化時(shí),融入了數(shù)據(jù)挖掘技術(shù),可以得到與實(shí)際數(shù)據(jù)一致的監(jiān)測(cè)結(jié)果。
本研究在借鑒傳統(tǒng)監(jiān)測(cè)模型的基礎(chǔ)上,針對(duì)分類方法單一,學(xué)習(xí)與訓(xùn)練能力較差的問(wèn)題,結(jié)合數(shù)據(jù)挖掘算法與時(shí)間序列,建立具有時(shí)間性質(zhì)的水質(zhì)變化監(jiān)測(cè)模型,幫助模型增強(qiáng)對(duì)數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練能力,為城市水安全提供更完善的技術(shù)保障。
由于時(shí)間和實(shí)驗(yàn)樣本的限制,僅對(duì)部分優(yōu)化內(nèi)容進(jìn)行了詳細(xì)描述,缺少其他影響水質(zhì)變化因子的探討與區(qū)域內(nèi)水質(zhì)變化樣本的挖掘,因此,在以后的研究工作中,可以對(duì)其他部分進(jìn)行說(shuō)明,為模型的優(yōu)化和使用提供更詳細(xì)的數(shù)據(jù)。