亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于監(jiān)督學(xué)習(xí)算法的污水出水化學(xué)需氧量(COD)預(yù)測

2022-07-15 21:10:29張凌超胡銘楊剛軼金李濤

科技研究·理論版 2022年4期

張凌超胡銘楊剛軼金李濤

摘要：出水化學(xué)需氧量（COD）是衡量污水處理效果的核心指標之一。本文采用線性回歸、K近鄰、決策樹、梯度提升回歸樹等監(jiān)督學(xué)習(xí)算法，構(gòu)建機器學(xué)習(xí)模型，對某市污水處理廠出水化學(xué)需氧量進行預(yù)測，誤差均值為3.14mg/L。提供了一種預(yù)測出水化學(xué)需氧量的方法，為污水處理的優(yōu)化提供了一種有效的方法。

關(guān)鍵詞：機器學(xué)習(xí);監(jiān)督學(xué)習(xí);COD預(yù)測

引言：城市的高速發(fā)展導(dǎo)致了用水量急劇增長，相應(yīng)的污水排放量不斷增加，使得污水的處理與排放顯得尤為重要。如何快速、準確的衡量污水處理效果并保證出水水質(zhì)的穩(wěn)定十分關(guān)鍵，是污水處理行業(yè)所追求的目標[1]。出水的化學(xué)需氧量（COD）是衡量污水處理效果的重要指標，通過對出水COD的預(yù)測，可以為污水處理高效穩(wěn)定的運行提供幫助。

人工智能（ArtificialIntelligence，AI）作為計算機科學(xué)行業(yè)的頂尖技術(shù)之一，從1956年達特茅斯會議上正式提出開始就一直備受各行業(yè)關(guān)注。人工智能技術(shù)隨著算法的不斷改進和算力的不斷提升，進入了飛速發(fā)展的時期，在各領(lǐng)域都有廣泛的應(yīng)用[2-3]。機器學(xué)習(xí)（MachineLearning，ML）是人工智能的核心，通過讓機器去模擬人類學(xué)習(xí)的能力，從而使機器變得更加智能。

本文基于傳統(tǒng)污水處理工藝技術(shù)及某市污水處理廠監(jiān)測公開數(shù)據(jù)，結(jié)合進水化學(xué)需氧量、PH值、氨氮、色度、懸浮物等與污水處理出水水質(zhì)密切相關(guān)的幾大因素，使用機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法：線性回歸（LinearRegression）、K近鄰（K-NearestNeighborKNN）、決策樹（DecisionTree）和梯度提升回歸樹（GradientBoostingRegressionTree），通過對進水樣本特征的建模與計算，提供了一種有效預(yù)測出水COD的方法，為污水處理工藝高效穩(wěn)定的運行提供幫助。

1出水化學(xué)需氧量預(yù)測模型的建立

1.1實驗樣本的來源

本文實驗所用樣本來自于某市生態(tài)環(huán)境局2018年至2019年間共9個月的污水處理廠監(jiān)督性檢測數(shù)據(jù)。樣本包含進水PH值、進水生化需氧量、進水化學(xué)需氧量、進水色度、進水氨氮、進水總氮、出水化學(xué)需氧量等15個特征，共計112組樣本。其中隨機選取93組樣本作為訓(xùn)練集，19組樣本作為測試集。

1.2線性回歸模型（LinearRegression）

線性回歸是一種用于回歸的線性模型，通過尋找參數(shù)w和b，使得預(yù)測值y與真實值y的均方誤差最小。線性回歸的預(yù)測公式為：

設(shè)有數(shù)據(jù)集{（x1，y1），（x2，y2）…（xn，yn）}，

預(yù)測值y=wx+b。

本次實驗將樣本中進水COD和出水COD的值作為輸入（x）和輸出（y），進行線性模型的訓(xùn)練。最終求得模型斜率（w）為-0.038，截距（b）為29.073。模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.39，9.71]，誤差均值為4.86，均方誤差為29.97。

1.3K近鄰（KNN）回歸模型

K近鄰算法通過在訓(xùn)練集中尋找與預(yù)測值距離最相近的K個數(shù)據(jù)點，根據(jù)“投票法（voting）選取距離最近的K個數(shù)據(jù)點中出現(xiàn)次數(shù)最多的標簽，作為預(yù)測值的標簽。

本次實驗的數(shù)據(jù)樣本特征均為連續(xù)值，根據(jù)K近鄰算法的特性，決定對訓(xùn)練集和測試集進行K近鄰回歸分析與建模;并使用歐氏距離（EuclideanDistance）計算測試集樣本與訓(xùn)練集樣本特征的差值。

歐氏距離計算公式如下：

設(shè)有數(shù)據(jù)點A（x1，x2…xn），數(shù)據(jù)點B（y1，y2…yn），則A、B兩點間的歐氏距離為：

此算法通過迭代的方式，為每一個測試集中的樣本采用歐氏距離計算與所有訓(xùn)練集樣本特征間的差值，從而找出K個距離該測試點最近的訓(xùn)練集樣本，則K個距離最近訓(xùn)練集樣本標簽的平均值為測試點的預(yù)測結(jié)果（出水COD）。同時，由于K近鄰算法的k值（鄰居數(shù)量）對模型的準確度影響極大，為了得到最優(yōu)解，需要對不同K值對模型精確度的影響進行分析。

經(jīng)過實驗分析，模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.52，12.26]，誤差均值為3.64，均方誤差為19.79。

1.4決策樹（DecisionTree）回歸模型

決策樹算法是一種非常常用的機器學(xué)習(xí)算法，廣泛應(yīng)用于分類和回歸任務(wù)。決策樹是一種樹形結(jié)構(gòu)，由一系列節(jié)點和分支組成。節(jié)點表示學(xué)習(xí)或決策過程中需要考慮的屬性，不同的分支則由不同的屬性構(gòu)成。利用某事例的屬性值，從決策樹的樹根節(jié)點往下搜索，直至葉子節(jié)點，便可對該事例進行學(xué)習(xí)，做出決策[4]。構(gòu)建決策樹模型的具體方法是：檢測所有的屬性，計算信息增益（InformationGain），并選擇信息增益最大的屬性作為決策樹結(jié)點，并根據(jù)該屬性的不同取值建立分支，再對各分支的子集采用遞歸的方式建立決策樹結(jié)點的分支，直到所有子結(jié)點僅包含同一類別的數(shù)據(jù)為止[5]。

信息增益（InformationGain）的計算方法：假設(shè)劃分前樣本為S，并用屬性A來劃分樣本S，則信息增益IG（S，A）等于樣本S的熵（Entropy）減去劃分完畢后子集的熵。公式如下：

經(jīng)過實驗分析，模型預(yù)測出水COD與實際出水COD的誤差范圍為[0，9]，誤差均值為3.68，均方誤差為20.84。

1.5梯度提升回歸樹（GradientBoostingDecisionTree，GBDT）

集成（ensemble）是一種通過合并多個機器學(xué)習(xí)的模型，從而構(gòu)建出一種更加強大的模型的方法。梯度提升回歸樹應(yīng)用了此集成方法，通過合并多個決策樹來構(gòu)建一個更加強大的機器學(xué)習(xí)模型。梯度提升樹模型中的主要參數(shù)是樹的數(shù)量（n_estimators）、學(xué)習(xí)率（learning_rate）和每棵樹的最大深度（max_depth）。其中決策樹的數(shù)量決定了模型的復(fù)雜程度;學(xué)習(xí)率控制每一棵樹對前面一棵樹錯誤的糾正強度;限制每棵樹的最大深度用于降低每棵樹的復(fù)雜度，使得內(nèi)存占用的更少，預(yù)測速度更快。

經(jīng)過實驗分析，對于本樣本來說，樹的數(shù)量選用默認值、學(xué)習(xí)率取0.12、樹的最大深度為2時，模型泛化能力較強，模型精確度較高。最終，模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.13，6.84]，誤差均值為3.14，均方誤差為13.41。

2模型預(yù)測結(jié)果分析

本文共建立了四個監(jiān)督學(xué)習(xí)模型對污水處理廠出水化學(xué)需氧量進行預(yù)測。四種模型的預(yù)測值和實際值對比如表1、圖1所示。表1四種監(jiān)督學(xué)習(xí)算法模型預(yù)測值與實際值的對比

各模型預(yù)測出水COD值和實際出水COD值的誤差范圍、誤差均值和均方誤差如表二所示。

對出水COD的預(yù)測誤差介于0.13～6.84ml/L之間，誤差均值為3.14ml/L，相較于線性回歸模型、K近鄰模型、決策樹模型算法，梯度提升回歸樹模型的預(yù)測結(jié)果更加顯著。

3結(jié)論

本文通過線性回歸、K近鄰、決策樹、梯度提升回歸樹等機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法，對某市污水處理廠出水化學(xué)需氧量進行預(yù)測研究。得到了一種可以快速有效預(yù)測出水化學(xué)需氧量的方法，對實際污水處理過程的優(yōu)化、調(diào)控具有一定的指導(dǎo)意義。

參考文獻

[1]陳威，陳會娟，戴凡翔，李忠.基于人工神經(jīng)網(wǎng)絡(luò)的污水處理出水水質(zhì)預(yù)測模型[J].給水排水，2020，56（S1）：990-994.

[2]任成.人工智能技術(shù)發(fā)展綜述[J].中國安防，2020（10）：81-83.

[3]郝欣愷.人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J].環(huán)渤海經(jīng)濟瞭望，2020（09）：152-153.

[4]魏茂勝.數(shù)據(jù)挖掘中的分類算法綜述[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用，2017（06）：65-66.

[5]羅可，林睦綱，郗東妹.數(shù)據(jù)挖掘中分類算法綜述[J].計算機工程，2005（01）：3-5+11.