亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于監(jiān)督學(xué)習(xí)算法的污水出水化學(xué)需氧量(COD)預(yù)測

        2022-07-15 21:10:29張凌超胡銘楊剛軼金李濤
        科技研究·理論版 2022年4期
        關(guān)鍵詞:機器學(xué)習(xí)

        張凌超 胡銘 楊剛軼 金李濤

        摘要:出水化學(xué)需氧量(COD)是衡量污水處理效果的核心指標之一。本文采用線性回歸、K近鄰、決策樹、梯度提升回歸樹等監(jiān)督學(xué)習(xí)算法,構(gòu)建機器學(xué)習(xí)模型,對某市污水處理廠出水化學(xué)需氧量進行預(yù)測,誤差均值為3.14mg/L。提供了一種預(yù)測出水化學(xué)需氧量的方法,為污水處理的優(yōu)化提供了一種有效的方法。

        關(guān)鍵詞:機器學(xué)習(xí);監(jiān)督學(xué)習(xí);COD預(yù)測

        引言:城市的高速發(fā)展導(dǎo)致了用水量急劇增長,相應(yīng)的污水排放量不斷增加,使得污水的處理與排放顯得尤為重要。如何快速、準確的衡量污水處理效果并保證出水水質(zhì)的穩(wěn)定十分關(guān)鍵,是污水處理行業(yè)所追求的目標[1]。出水的化學(xué)需氧量(COD)是衡量污水處理效果的重要指標,通過對出水COD的預(yù)測,可以為污水處理高效穩(wěn)定的運行提供幫助。

        人工智能(ArtificialIntelligence,AI)作為計算機科學(xué)行業(yè)的頂尖技術(shù)之一,從1956年達特茅斯會議上正式提出開始就一直備受各行業(yè)關(guān)注。人工智能技術(shù)隨著算法的不斷改進和算力的不斷提升,進入了飛速發(fā)展的時期,在各領(lǐng)域都有廣泛的應(yīng)用[2-3]。機器學(xué)習(xí)(MachineLearning,ML)是人工智能的核心,通過讓機器去模擬人類學(xué)習(xí)的能力,從而使機器變得更加智能。

        本文基于傳統(tǒng)污水處理工藝技術(shù)及某市污水處理廠監(jiān)測公開數(shù)據(jù),結(jié)合進水化學(xué)需氧量、PH值、氨氮、色度、懸浮物等與污水處理出水水質(zhì)密切相關(guān)的幾大因素,使用機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法:線性回歸(LinearRegression)、K近鄰(K-NearestNeighborKNN)、決策樹(DecisionTree)和梯度提升回歸樹(GradientBoostingRegressionTree),通過對進水樣本特征的建模與計算,提供了一種有效預(yù)測出水COD的方法,為污水處理工藝高效穩(wěn)定的運行提供幫助。

        1出水化學(xué)需氧量預(yù)測模型的建立

        1.1實驗樣本的來源

        本文實驗所用樣本來自于某市生態(tài)環(huán)境局2018年至2019年間共9個月的污水處理廠監(jiān)督性檢測數(shù)據(jù)。樣本包含進水PH值、進水生化需氧量、進水化學(xué)需氧量、進水色度、進水氨氮、進水總氮、出水化學(xué)需氧量等15個特征,共計112組樣本。其中隨機選取93組樣本作為訓(xùn)練集,19組樣本作為測試集。

        1.2線性回歸模型(LinearRegression)

        線性回歸是一種用于回歸的線性模型,通過尋找參數(shù)w和b,使得預(yù)測值y與真實值y的均方誤差最小。線性回歸的預(yù)測公式為:

        設(shè)有數(shù)據(jù)集{(x1,y1),(x2,y2)…(xn,yn)},

        預(yù)測值y=wx+b。

        本次實驗將樣本中進水COD和出水COD的值作為輸入(x)和輸出(y),進行線性模型的訓(xùn)練。最終求得模型斜率(w)為-0.038,截距(b)為29.073。模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.39,9.71],誤差均值為4.86,均方誤差為29.97。

        1.3K近鄰(KNN)回歸模型

        K近鄰算法通過在訓(xùn)練集中尋找與預(yù)測值距離最相近的K個數(shù)據(jù)點,根據(jù)“投票法(voting)選取距離最近的K個數(shù)據(jù)點中出現(xiàn)次數(shù)最多的標簽,作為預(yù)測值的標簽。

        本次實驗的數(shù)據(jù)樣本特征均為連續(xù)值,根據(jù)K近鄰算法的特性,決定對訓(xùn)練集和測試集進行K近鄰回歸分析與建模;并使用歐氏距離(EuclideanDistance)計算測試集樣本與訓(xùn)練集樣本特征的差值。

        歐氏距離計算公式如下:

        設(shè)有數(shù)據(jù)點A(x1,x2…xn),數(shù)據(jù)點B(y1,y2…yn),則A、B兩點間的歐氏距離為:

        此算法通過迭代的方式,為每一個測試集中的樣本采用歐氏距離計算與所有訓(xùn)練集樣本特征間的差值,從而找出K個距離該測試點最近的訓(xùn)練集樣本,則K個距離最近訓(xùn)練集樣本標簽的平均值為測試點的預(yù)測結(jié)果(出水COD)。同時,由于K近鄰算法的k值(鄰居數(shù)量)對模型的準確度影響極大,為了得到最優(yōu)解,需要對不同K值對模型精確度的影響進行分析。

        經(jīng)過實驗分析,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.52,12.26],誤差均值為3.64,均方誤差為19.79。

        1.4決策樹(DecisionTree)回歸模型

        決策樹算法是一種非常常用的機器學(xué)習(xí)算法,廣泛應(yīng)用于分類和回歸任務(wù)。決策樹是一種樹形結(jié)構(gòu),由一系列節(jié)點和分支組成。節(jié)點表示學(xué)習(xí)或決策過程中需要考慮的屬性,不同的分支則由不同的屬性構(gòu)成。利用某事例的屬性值,從決策樹的樹根節(jié)點往下搜索,直至葉子節(jié)點,便可對該事例進行學(xué)習(xí),做出決策[4]。構(gòu)建決策樹模型的具體方法是:檢測所有的屬性,計算信息增益(InformationGain),并選擇信息增益最大的屬性作為決策樹結(jié)點,并根據(jù)該屬性的不同取值建立分支,再對各分支的子集采用遞歸的方式建立決策樹結(jié)點的分支,直到所有子結(jié)點僅包含同一類別的數(shù)據(jù)為止[5]。

        信息增益(InformationGain)的計算方法:假設(shè)劃分前樣本為S,并用屬性A來劃分樣本S,則信息增益IG(S,A)等于樣本S的熵(Entropy)減去劃分完畢后子集的熵。公式如下:

        經(jīng)過實驗分析,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0,9],誤差均值為3.68,均方誤差為20.84。

        1.5梯度提升回歸樹(GradientBoostingDecisionTree,GBDT)

        集成(ensemble)是一種通過合并多個機器學(xué)習(xí)的模型,從而構(gòu)建出一種更加強大的模型的方法。梯度提升回歸樹應(yīng)用了此集成方法,通過合并多個決策樹來構(gòu)建一個更加強大的機器學(xué)習(xí)模型。梯度提升樹模型中的主要參數(shù)是樹的數(shù)量(n_estimators)、學(xué)習(xí)率(learning_rate)和每棵樹的最大深度(max_depth)。其中決策樹的數(shù)量決定了模型的復(fù)雜程度;學(xué)習(xí)率控制每一棵樹對前面一棵樹錯誤的糾正強度;限制每棵樹的最大深度用于降低每棵樹的復(fù)雜度,使得內(nèi)存占用的更少,預(yù)測速度更快。

        經(jīng)過實驗分析,對于本樣本來說,樹的數(shù)量選用默認值、學(xué)習(xí)率取0.12、樹的最大深度為2時,模型泛化能力較強,模型精確度較高。最終,模型預(yù)測出水COD與實際出水COD的誤差范圍為[0.13,6.84],誤差均值為3.14,均方誤差為13.41。

        2模型預(yù)測結(jié)果分析

        本文共建立了四個監(jiān)督學(xué)習(xí)模型對污水處理廠出水化學(xué)需氧量進行預(yù)測。四種模型的預(yù)測值和實際值對比如表1、圖1所示。表1四種監(jiān)督學(xué)習(xí)算法模型預(yù)測值與實際值的對比

        各模型預(yù)測出水COD值和實際出水COD值的誤差范圍、誤差均值和均方誤差如表二所示。

        對出水COD的預(yù)測誤差介于0.13~6.84ml/L之間,誤差均值為3.14ml/L,相較于線性回歸模型、K近鄰模型、決策樹模型算法,梯度提升回歸樹模型的預(yù)測結(jié)果更加顯著。

        3結(jié)論

        本文通過線性回歸、K近鄰、決策樹、梯度提升回歸樹等機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)算法,對某市污水處理廠出水化學(xué)需氧量進行預(yù)測研究。得到了一種可以快速有效預(yù)測出水化學(xué)需氧量的方法,對實際污水處理過程的優(yōu)化、調(diào)控具有一定的指導(dǎo)意義。

        參考文獻

        [1]陳威,陳會娟,戴凡翔,李忠.基于人工神經(jīng)網(wǎng)絡(luò)的污水處理出水水質(zhì)預(yù)測模型[J].給水排水,2020,56(S1):990-994.

        [2]任成.人工智能技術(shù)發(fā)展綜述[J].中國安防,2020(10):81-83.

        [3]郝欣愷.人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J].環(huán)渤海經(jīng)濟瞭望,2020(09):152-153.

        [4]魏茂勝.數(shù)據(jù)挖掘中的分類算法綜述[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(06):65-66.

        [5]羅可,林睦綱,郗東妹.數(shù)據(jù)挖掘中分類算法綜述[J].計算機工程,2005(01):3-5+11.

        猜你喜歡
        機器學(xué)習(xí)
        基于詞典與機器學(xué)習(xí)的中文微博情感分析
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
        活力(2016年8期)2016-11-12 17:30:08
        基于支持向量機的金融數(shù)據(jù)分析研究
        基于Spark的大數(shù)據(jù)計算模型
        基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
        基于圖的半監(jiān)督學(xué)習(xí)方法綜述
        機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        極限學(xué)習(xí)機在圖像分割中的應(yīng)用
        风韵犹存丰满熟妇大屁股啪啪| 久久久久亚洲女同一区二区| 亚洲va在线va天堂va四虎| 日本最新一区二区三区视频| 手机免费高清在线观看av| 天天做天天添av国产亚洲| 明星性猛交ⅹxxx乱大交| 99福利网| 国产精品一区二区三区黄片视频| 亚洲一区二区三区四区地址| 国产精品成人aaaaa网站 | 亚洲不卡无码高清视频| 极品少妇在线观看视频| 不卡一区二区黄色av| 久久无码av中文出轨人妻| 国产成人精品自在线无码| 日本成人在线不卡一区二区三区| 精品日韩一级免费视频| 久久国产精品久久久久久| 91呻吟丰满娇喘国产区| 国产亚洲激情av一区二区| 国产99一区二区三区四区| 亚洲国产精品日韩av不卡在线| 久久久久中文字幕无码少妇| 国产一区二区免费在线观看视频| 亚洲国产av自拍一区| 中国老妇女毛茸茸bbwbabes| 国产自产av一区二区三区性色| 国产激情小视频在线观看的 | 成人午夜特黄aaaaa片男男| 麻豆国产高清精品国在线| 91青青草在线观看视频| 极品嫩模大尺度av在线播放| 中文成人无码精品久久久不卡 | 男女啪啪视频高清视频| 性色做爰片在线观看ww| 亚洲AⅤ无码国精品中文字慕| 亚洲精品女人天堂av麻| 色偷偷色噜噜狠狠网站30根 | www久久久888| 中文字幕久久久人妻人区|