亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型研究

        2022-06-14 14:08:36薛夢瑤馬金萍杜子龍
        湖北農(nóng)業(yè)科學 2022年10期
        關鍵詞:決策樹廢水水質(zhì)

        俞 武,薛夢瑤,何 斌,馬金萍,杜子龍

        (1.寧夏西干渠管理處,銀川 750021;2.河海大學商學院,江蘇 常州 213022;3.常州市大數(shù)據(jù)挖掘與知識管理重點實驗室,江蘇 常州 213022;4.常州蘭陵自動化設備有限公司,江蘇 常州 213002)

        隨著中國社會生產(chǎn)力、科學技術的發(fā)展以及產(chǎn)業(yè)結構向工業(yè)等領域調(diào)整,中國城鎮(zhèn)化步伐不斷加快,但一系列的環(huán)境問題也隨之而來,其中水污染問題尤其突出。針對水資源保護問題,中國采取了一系列科學的法律手段,先后出臺了多項規(guī)范和排污標準,包括《中華人民共和國水法》《中華人民共和國水污染防治法》《中華人民共和國環(huán)境保護法》等,以規(guī)范化和法制化手段合理利用水資源,不斷完善中國水資源法律制度體系。

        水污染會影響各類環(huán)境資源、破壞生態(tài)平衡,還會降低工業(yè)和農(nóng)業(yè)生產(chǎn)質(zhì)量,甚至危害人類生活和身體健康。縱觀近年來的水污染現(xiàn)象,突發(fā)水污染事件占比較大,其中絕大多數(shù)是由于企業(yè)違規(guī)排放廢水或工廠事故泄露所引起,而一些環(huán)保設備差、裝備水平低的中小型工業(yè)企業(yè)最容易出現(xiàn)事故。因此,在國務院于2015 年印發(fā)的《水污染防治行動計劃》中,第一點就強調(diào)了對工業(yè)污染的防治工作,尤其是對小型工業(yè)企業(yè)的排查,對小型企業(yè)的污水治理工作提出了更高的要求。但是污水監(jiān)測的全套設備包括其運行維護費用每年高達50 萬~60 萬元,導致很多小型企業(yè)因無法承擔該項費用而排放不達標廢水,對人類安全造成極大的威脅。因此,尋找適合中小型企業(yè)污水水質(zhì)等級監(jiān)測的方法已刻不容緩。本研究基于某市河道水質(zhì)數(shù)據(jù),分析容易監(jiān)測的水質(zhì)指標與水質(zhì)等級之間的關系,以決策樹算法構建的水質(zhì)等級監(jiān)測模型對企業(yè)污水排放進行監(jiān)控,有效替代傳統(tǒng)采購價高、運行成本高的設備,減少費用壓力,可以為企業(yè)、政府等相關部門提供方便、科學的排放廢水監(jiān)測體系,為中小型企業(yè)污水排放前的監(jiān)測提供理論參考。

        1 研究現(xiàn)狀

        1.1 水質(zhì)等級監(jiān)測研究現(xiàn)狀

        在水質(zhì)等級監(jiān)測研究中,主要以多種算法為基礎,構建水質(zhì)評價模型,并根據(jù)實踐中的突出問題加以改進。張穎等[1]以流域的三大監(jiān)測斷面點為研究對象,采用灰色模型對水質(zhì)的各個參考值進行預測,利用模糊神經(jīng)網(wǎng)絡方法構建水質(zhì)預測模型,綜合把握水質(zhì)變化,達到了預警效果。高學平等[2]關注季節(jié)變化對水質(zhì)指標權重的影響,以層次分析法創(chuàng)造性地提出時域權重矩陣,并將此與實測權重相結合,得到綜合評價權重,設計改進的模糊綜合評價法提高水質(zhì)評價的準確度。肖金球等[3]針對水質(zhì)監(jiān)測系統(tǒng)在太湖應用中存在的數(shù)據(jù)和等級評價不準確的問題,提出一種改進型GA-BP 的神經(jīng)網(wǎng)絡,基于此可以辨識復雜的水質(zhì)模型,以此消除干擾因素帶來的誤差。閆佰忠等[4]以地下水水質(zhì)評價為對象,基于安陽市8 個監(jiān)測點的數(shù)據(jù),以隨機森林設計水質(zhì)評價模型,并與神經(jīng)網(wǎng)絡模型相比較,結果顯示該方法的準確性與穩(wěn)定性更高。張瑩等[5]在大數(shù)據(jù)背景下聚焦于海洋水質(zhì)評價,以機器學習算法為基礎,以40 萬站點和13 個水質(zhì)指標信息為樣本,構建海洋多水質(zhì)指標信息的綜合評價模型。

        1.2 水污染溯源研究現(xiàn)狀

        隨著中國城鎮(zhèn)化不斷發(fā)展,水污染現(xiàn)象逐年增加,水污染溯源研究被廣大學者所重視,尤其是針對企業(yè)污水溯源的研究。Boano 等[6]針對任意分布源的水污染溯源和多個獨立點源的水污染溯源,采用地質(zhì)統(tǒng)計法對水污染事件進行回溯。Wei 等[7]利用AM 算法和正向模型的不確定性特征對水污染事件過程進行反演,針對水中污染物特征判斷整個污染過程,在反演過程中尋求最終結果。李欣欣等[8]利用改進的AFSA 算法對構建的污染物時空溯源模型和排放總量模型進行求解,確定污染物排放量、排放位置和時間3 個參數(shù),借助GIS 技術進行污染源企業(yè)排查清單的確定。王忠慧等[9]利用耦合的概率密度分析方法優(yōu)化水力學模型,并采用BAS 算法進行求解,實現(xiàn)污染物源項信息的確定,有效減少計算量并提高了精準度。孫策等[10]利用貝葉斯和蒙特卡洛相結合的方法,基于已知污染源信息,利用函數(shù)求得污染源的概率密度,將溯源問題轉(zhuǎn)化為求概率密度的抽樣問題,使結果更有效快速地接近目標。呂清等[11]以南方某市S 河的一次水質(zhì)異常事件為例,對水紋識別技術在水污染溯源中的實際應用進行驗證,根據(jù)水紋峰變化推斷入侵過程,比對水體水紋與污染源水紋,最終實現(xiàn)溯源。

        1.3 決策樹算法應用研究現(xiàn)狀

        決策樹算法以其速度快、精確度高等特點,已被學者們應用到各行各業(yè)的研究中。Chandra[12]將決策樹創(chuàng)造性應用于地質(zhì)學領域,用以確定發(fā)生滑坡的概率,選用地質(zhì)構造、坡度等9 個主要因素進行分析,生成滑坡敏感性圖,結果表明該圖可以用于中等規(guī)模和區(qū)域的規(guī)劃中。Arlita 等[13]在運輸領域,采用決策樹方法開發(fā)選擇模型,以確定最佳貨物運輸方案,為公司業(yè)務發(fā)展提供合理計劃。楊泉[14]將決策樹算法應用到漢語短語關系分類上,建立7 個分類特征,在自建庫中生成決策樹,以投票給出最終結果,并采用1 020 條數(shù)據(jù)進行測試,正確率高達94.8%。劉曉娜等[15]主要將其應用到解決橡膠林地的遙感識別,以Landsat MSS/TM/ETM 數(shù)據(jù)和MODIS-NDVI 數(shù)據(jù)為基礎,利用決策樹方法構建簡單快捷的橡膠林地分類方式,提取所需地區(qū)的橡膠林地,有助于生態(tài)保護和土地合理開發(fā)利用。程華等[16]利用C4.5 決策樹方法解決港航班延誤預測問題,構建預測模型,并以中國某大型機場數(shù)據(jù)為例,進行大量試驗驗證其正確率。王焱[17]在對國內(nèi)外行人檢測的研究現(xiàn)狀進行分析后,創(chuàng)造性地提出將梯度提升決策樹算法應用于行人檢測中,并與區(qū)域建議網(wǎng)絡相結合,設計出可以用于檢測不同尺度行人的檢測算法。

        2 數(shù)據(jù)來源與研究方法

        2.1 數(shù)據(jù)來源

        本研究水質(zhì)數(shù)據(jù)來源為某市20 條河流的監(jiān)測數(shù)據(jù),時間跨度為2018 年1 月至2020 年8 月,數(shù)據(jù)中包含了緯度、地區(qū)、水質(zhì)等級、高錳酸鹽指數(shù)、氨氮、總磷、pH、水溫、溶解氧、濁度、電導率、總氮、數(shù)據(jù)時間等屬性。對排放廢水歷史水質(zhì)數(shù)據(jù)進行分類和關聯(lián)分析,探究其中容易監(jiān)測的水質(zhì)指標與水質(zhì)等級之間的關系,經(jīng)過篩選后,選擇特征屬性以構建水質(zhì)等級分類模型。

        2.2 研究方法

        在構建水質(zhì)等級分類模型時主要采用決策樹算法對水質(zhì)進行分類。決策樹算法是為了解決ID3 算法忽略對葉子數(shù)目的研究而提出的一種改進算法,是通過一系列規(guī)則對數(shù)據(jù)進行分類的方法,其基本原理是通過歸納學習訓練集的規(guī)律生成相應的決策樹,用所生成的決策樹規(guī)律對新的數(shù)據(jù)進行分類。該算法具有速度快、準確性高、可處理連續(xù)字段和種類字段等優(yōu)點[18]。

        決策樹主要表現(xiàn)為樹形結構,包括一個根節(jié)點、若干個內(nèi)部節(jié)點和若干個葉子節(jié)點,其中每個內(nèi)部節(jié)點代表一種屬性測試,每個葉子節(jié)點代表一種決策結果。節(jié)點之間通過分支進行聯(lián)系,每個分支代表一種測試輸出。同時決策樹也代表了對象值與其屬性之間的映射關系,其中對象用節(jié)點表示,每個從根節(jié)點到葉子節(jié)點之間所有的路徑代表對象值,而每個分支則代表可能的屬性值。具體的決策樹結構如圖1 所示。

        圖1 決策樹結構

        一棵決策樹生成的過程也就是決策樹的學習過程,主要分為特征選擇,決策樹生成和決策樹剪枝3個步驟。首先進行特征選擇,從訓練數(shù)據(jù)樣本中選擇特征作為節(jié)點分叉標準,其中特征的選擇具有不同的選擇標準,評估標準不同最終的決策樹算法也不同;接著進行決策樹的生成,根據(jù)之前選擇的特征標準,對訓練數(shù)據(jù)采用從上至下的遞歸法生成子節(jié)點,直至分叉結束;最后是決策樹修剪過程,由于決策樹易因過擬合現(xiàn)象而導致分類有誤,因此在決策樹生成后要進行樹枝的修剪過程,通過減小樹的結構達到解決過擬合的問題。

        3 基于決策樹算法的水質(zhì)等級分類模型構建

        3.1 水質(zhì)等級監(jiān)測模型的屬性選擇

        決策樹中含有多個特征屬性,但只有一些特征屬性對分類起到關鍵作用,影響水質(zhì)類別的所有特征對其分類具有不同的敏感程度,特征的選擇對模型的準確度和效率具有直接影響。傳統(tǒng)的水質(zhì)等級評價會選擇pH、溶解氧、高錳酸鹽指數(shù)、氨氮等30多種評價指標作為特征屬性,但很多中小型企業(yè)由于資金原因無法購置和運行全套的水質(zhì)評價儀器,使工廠排放的廢水未經(jīng)過等級評價便排放到河道中,導致污染物超標,劣Ⅴ類水增加。因此,在對水質(zhì)等級與各因素之間的影響程度以及各種組合結果的對比后,最終選擇溫度和總磷作為最終的特征屬性。其中總磷是指水中所有形態(tài)磷的總量,是反映水體質(zhì)量和污染程度的重要指標。在水體中,磷一般以磷酸鹽和有機磷的形式存在,絕大多數(shù)來源于企業(yè)污水中磷的使用。磷是水中最主要的影響元素,是促進水中生物和微生物生長的關鍵因素,若磷過于富集,則會導致水體質(zhì)量下降。對中小型企業(yè)排放廢水中總磷的監(jiān)測和分析,可以辨別水質(zhì)的污染程度,了解水質(zhì)的富營養(yǎng)化狀況,因此總磷是水質(zhì)分析中的必測項目,是評價水質(zhì)的重要因素,選擇磷作為特征屬性具有一定的理論和實際支撐。

        測定總磷含量的國家標準是鉬酸銨分光光度法(GB 11893-89)。該方法的主要原理是,首先在保持中性的水環(huán)境下,用過硫酸鉀或者硫酸-高氯酸對水樣進行消解操作,使水樣中所有形態(tài)的磷轉(zhuǎn)化為正磷酸鹽,接著在酸性介質(zhì)中,讓消解的正硝酸鹽與鉬酸銨發(fā)生反應,從而保持在銻鹽存在的條件下將生成的磷鉬雜多酸立即用抗壞血酸還原生成藍色的絡合物,最后在700 nm 條件下進行吸光度測定。

        3.2 水質(zhì)等級監(jiān)測模型的建立

        水質(zhì)等級的分類模型是指從已知的水質(zhì)數(shù)據(jù)中利用決策樹分類算法,將水質(zhì)類別分類中的規(guī)律提取出來的過程,其中已知類別的數(shù)據(jù)稱為樣本數(shù)據(jù),可以分為訓練集和測試集兩部分。在建立水質(zhì)等級分類模型過程中,首先根據(jù)需求和數(shù)據(jù)特點選擇決策樹算法作為分類模型;接著將訓練集數(shù)據(jù)作為算法輸入值,總結歸納分類標準后輸出相應的分類模型;最后利用測試集數(shù)據(jù)驗證分類模型的準確性和有效性,使用構建的分類模型將測試數(shù)據(jù)進行分類,完成后與實際分類情況比對,統(tǒng)計最終的準確率,若準確率達到要求的標準,則認為該模型可作為水質(zhì)分類模型,否則需要重新構建,其具體的流程如圖2所示。

        圖2 分類模型構建流程

        4 面向中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型構建

        面向中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型是基于水質(zhì)等級分類模型建立的。對企業(yè)而言,定期對廢水進行取樣,測定廢水的溫度以及其中的總磷含量,將數(shù)據(jù)輸入構建的基于決策樹算法的水質(zhì)等級分類模型中,輸出相應的水質(zhì)類別,判斷是否符合排放標準,若符合記錄數(shù)據(jù)后可以要求進行排放程序,若不符合則需要進行再次處理,重復此過程直至廢水達到排放標準。而對政府相關部門而言,在進行廢水排放水質(zhì)抽查時,首先將監(jiān)測到的數(shù)據(jù)輸入基于水質(zhì)等級分類的模型中,判斷企業(yè)排放的廢水是否符合標準,是否對水體造成了污染,若初步監(jiān)測符合標準則記錄在冊,若結果不符合,水質(zhì)的類別低于Ⅲ類水質(zhì)或當?shù)貥藴?,則將樣水送至相關機構,采用專業(yè)設備進行監(jiān)測后,再次判斷是否符合標準,一旦發(fā)現(xiàn)不符合則根據(jù)相關政策對企業(yè)進行罰款、教育等。該模型有效降低了中小型企業(yè)和政府對廢水排放水質(zhì)的監(jiān)測費用,有效防止企業(yè)偷排超標廢水的行為,減少水體污染現(xiàn)象。其具體模型如圖3 所示。

        圖3 中小型企業(yè)的廢水水質(zhì)監(jiān)測模型

        在構建決策樹的過程中,需要找出最佳節(jié)點和最佳分支方法,衡量這個“最佳”的指標叫作“不純度”。通常來說,“不純度”越低,決策樹的擬合效果越好。參數(shù)Criterion 是用來決定“不純度”的計算方法。在sklearn 庫中提供了entropy(信息熵)和Gini Impurity(基尼系數(shù))2 種計算方法。使用的決策樹算法在分支方法上的核心大多是圍繞在對某個“不純度”相關指標的最優(yōu)化上?!安患兌取笔腔诠?jié)點來計算的,樹中的每個節(jié)點都會有一個“不純度”。信息熵相較于對“不純度”的處理更加敏感,當使用信息熵作為指標時,決策樹的生長會更加“精細”,對于高維數(shù)據(jù)、噪音很多的數(shù)據(jù),信息熵容易發(fā)生過擬合現(xiàn)象,而基尼系數(shù)在這種情況下的效果要優(yōu)于信息熵,本研究選擇基尼系數(shù)計算“不純度”。

        在構建模型時可以對特征標簽重要性進行可視化,結果發(fā)現(xiàn)總磷的重要性為0.960 20,水溫的重要性為0.039 78,可見總磷相較于溫度,對水質(zhì)等級的影響更大,也更直接。同時為了方便構建決策樹模型,將Ⅰ類、Ⅱ類、Ⅲ類、Ⅳ類、Ⅴ類、劣Ⅴ類6 個水質(zhì)等級分別用數(shù)字1、2、3、4、5、6 替代。最終生成決策樹的部分結構如圖4 所示。

        圖4 決策樹分類模型部分結構

        圖4中每個方格代表一個節(jié)點。在最上面的節(jié)點中,P≤0.4 代表下面分支的判斷條件,即總磷含量小于等于0.4 mg/L,左分支為True,右分支為False;gini 是“不純度”的指標,gini 值越小,分類效果越好;samples 代表當前節(jié)點對應的樣本數(shù)量,values 代表訓練集數(shù)據(jù)中不同標簽值對應的樣本數(shù)量,如values=[0,1,426,263,6 587,13 026]代表Ⅰ類、Ⅱ類、Ⅲ類、Ⅳ類、Ⅴ類、劣Ⅴ類的樣本數(shù)量分別為0、1、426、263、6 587、13 026 個;class 代表當前節(jié)點的標簽預測值,如class=6 代表當前節(jié)點的預測值為劣Ⅴ類水。

        5 應用測試與分析

        對決策樹進行評估時最常用的標準是預測正確率。訓練集共有50 206 條數(shù)據(jù),使用決策樹對水質(zhì)等級進行預測,預測正確數(shù)據(jù)為39 443 條,正確率為78.56%;模型的訓練集得分低于測試集,為72.87%。表1、表2 為模型預測情況的評價指標統(tǒng)計。

        在計算評估指標時,樣本被分為4 類,分別為TP(True positives)、FP(False positives)、FN(False negatives)、TN(True negatives)。TP 是指將正類判定為正類,F(xiàn)P 是指將負類判定為正類,F(xiàn)N 是指將正類判定為負類,TN 是指將負類判定為負類。其中精確度的計算公式為TP/(TP+FP),召回率的計算公式為TP/(TP+FN),加權調(diào)和平均值的計算公式為2TP/(2TP+FP+FN)。以Ⅲ類水為例,正類數(shù)據(jù)指Ⅲ類的數(shù)據(jù),負類數(shù)據(jù)指除Ⅲ類之外其他等級的數(shù)據(jù)。當水質(zhì)等級預測全部正確時,Ⅲ類水對應的樣本數(shù)量應為17 149 個。在實際使用決策樹模型進行預測時,預測出屬于Ⅲ類水的數(shù)據(jù)共19 458條,其中的正確判定為15 022條,則TP為15 022條,F(xiàn)P 則為4 436條,F(xiàn)N 為2 127 條,TN 為30 748 條,精確度為15 022/(15 022+4 436),即77.20%;召回率為15 022/(15 022+2 127),即87.59%;加權調(diào)和平均值2×15 022/(2×15 022+4 436+2 127),即82.07%(表1)。

        表1 各水質(zhì)等級模型預測情況統(tǒng)計

        如表2 所示,accuracy 指所有數(shù)據(jù)水質(zhì)等級預測的正確率,即50 206 條數(shù)據(jù),使用決策樹正確預測了其中的39 443 條數(shù)據(jù),accuracy 為78.56%。macro avg 是宏平均,即對每個類別的精確度、召回率和加權調(diào)和平均值求算術平均值。weighted avg 是加權平均值,它是對macro avg 的一種改進,在計算時考慮了每個類別樣本數(shù)量在總樣本中的占比,以消除樣本數(shù)量差異所帶來的影響??梢钥闯?,macro avg值和weighted avg 值存在一定差距,主要是因為實驗數(shù)據(jù)集中在III類與IV 類,在消除樣本數(shù)量差異的影響之后,精確度、召回率和加權調(diào)和平均值的加權平均值都維持在80%左右。

        表2 訓練集數(shù)據(jù)模型預測情況評估

        6 小結

        隨著中國城鎮(zhèn)化步伐不斷加快以及環(huán)境保護和水污染防治行動的不斷深入,大型企業(yè)已經(jīng)建成完善的廢水監(jiān)測和處理體系,而由于廢水監(jiān)測設備昂貴、運行成本高,是中小企業(yè)完善廢水監(jiān)測體系面臨的主要問題。因此,構建符合中小型企業(yè)的廢水排放水質(zhì)監(jiān)測模型顯得尤為重要和緊迫。針對這種現(xiàn)象,本研究采用決策樹算法,將水質(zhì)數(shù)據(jù)劃分為訓練集與測試集,通過構建水質(zhì)等級分類模型預測水質(zhì)等級,測試集驗證的水質(zhì)等級正確率為78.56%,證明了該方法的可行性,可用于對中小型企業(yè)的廢水水質(zhì)進行初步分級,減少監(jiān)測費用,同時對水質(zhì)進行監(jiān)控,以便在水質(zhì)異常時采集水樣進行深入監(jiān)測,并及時采取治理措施,形成針對中小型企業(yè)的廢水監(jiān)測體系,減少水污染現(xiàn)象。

        猜你喜歡
        決策樹廢水水質(zhì)
        水質(zhì)抽檢豈容造假
        環(huán)境(2023年5期)2023-06-30 01:20:01
        廢水中難降解有機物的高級氧化技術
        云南化工(2021年6期)2021-12-21 07:31:12
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        一月冬棚養(yǎng)蝦常見水質(zhì)渾濁,要如何解決?這9大原因及處理方法你要知曉
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        高氯廢水COD測定探究
        基于決策樹的出租車乘客出行目的識別
        絡合萃取法預處理H酸廢水
        基于肺癌CT的決策樹模型在肺癌診斷中的應用
        水質(zhì)總磷測定存在的問題初探
        河南科技(2014年23期)2014-02-27 14:19:07
        国产一级黄色片在线播放| 91精品国产91久久久无码95| 精品高清国产乱子伦| 成人性生交大片免费看l| 国产亚洲精品第一综合另类| 97精品人妻一区二区三区香蕉| 国产精品久久国产三级国电话系列| 日本久久黄色高清视频| 欧美精品无码一区二区三区 | aaa级久久久精品无码片| 91精品国产免费久久久久久青草| 日本视频一区二区这里只有精品| 久久亚洲精品中文字幕| 午夜精品久久久久久| 国产91对白在线观看| 在线观看高清视频一区二区三区| 免费国产线观看免费观看| 麻豆国产人妻欲求不满谁演的| 2021精品综合久久久久| 日韩不卡一区二区三区色图| 潮喷失禁大喷水aⅴ无码| 国产成人+亚洲欧洲+综合| 国产不卡一区二区av| 国产乱码一区二区三区精品| 疯狂撞击丝袜人妻| 国产精品青草久久久久婷婷| 伊人狼人大香线蕉手机视频| 国产成人av一区二区三区在线观看 | 国产精品v欧美精品v日韩精品| 欧美人成在线播放网站免费| 精品人妻日韩中文字幕| 热re99久久精品国99热| 先锋影音av资源我色资源| 啪啪视频免费看一区二区| 人妖av手机在线观看| 精品无码人妻一区二区三区品| 91精品国产91热久久p| 久久中文字幕一区二区| 精品无码久久久久久国产| 久久99国产亚洲高清| 日本a级片一区二区三区|