亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)方法的廢棄場地污染特征分析

        2023-08-11 13:58:10高明亮
        黑龍江科學(xué) 2023年12期
        關(guān)鍵詞:貝葉斯特征值類別

        李 翔,高明亮,陳 征

        (1.首都師范大學(xué),北京100048; 2.中國環(huán)境科學(xué)研究院,北京 100012)

        0 引言

        隨著現(xiàn)代化工業(yè)的不斷發(fā)展,人們環(huán)保意識逐漸增強(qiáng),許多涉污企業(yè)、廠區(qū)相繼關(guān)?;虬徇w[1]。然而,遺留在場地及其周圍的污染物并不會隨著企業(yè)廠區(qū)的搬遷、關(guān)停而消失,相反遺留污染物會持續(xù)對周圍的自然環(huán)境及居民造成潛在的風(fēng)險(xiǎn)[2-8],亟需對這些廢棄廠區(qū)遺留的污染物狀況開展持續(xù)調(diào)查及特征分析,為日后的治理、修復(fù)及管控提供科學(xué)依據(jù)。

        在污染特征分析研究方面,國內(nèi)外學(xué)者主要通過 GIS 技術(shù),運(yùn)用污染評價(jià)算法及可視化方法,分析污染空間分布特征。White[9]利用克里金插值方法,得到美國某區(qū)域土壤中鋅元素的空間分布格局,從而提取了Zn元素的污染分布特征。Goovaerts[10]等對瑞士某地區(qū)土壤中的銅、鉛元素進(jìn)行含量分析,利用克里金插值對污染進(jìn)行特征分析。樓春[11]等從水平方向與垂直方向?qū)δ辰够瘡S場地土壤污染特征進(jìn)行了分析研究。陳宏[12]等通過場地調(diào)查,確定了南方某場地的主要污染物,進(jìn)一步分析了污染物在土壤與地下水中的分布特征。耿治鵬[13]等用反距離權(quán)重法,分析了重金屬在研究區(qū)的分布特征,運(yùn)用莫蘭指數(shù)進(jìn)行空間關(guān)聯(lián)分析,運(yùn)用半變異函數(shù),分析重金屬污染整體的空間結(jié)構(gòu)及趨勢,以探究污染場地的重金屬污染空間特征。近年來,數(shù)學(xué)建模及機(jī)器學(xué)習(xí)技術(shù)飛速發(fā)展,將其應(yīng)用于污染場地特征分析成為新趨勢。Zeng[14]等通過三維建模與可視化精細(xì)表征高度污染工業(yè)場地的重金屬污染,利用三維模型,揭示水文地質(zhì)特征對污染遷移的影響及分布機(jī)制。Liu[15]等提出一種隨機(jī)森林與普通克里金法相結(jié)合的模型,結(jié)合地形要素、場地環(huán)境要素及遙感數(shù)據(jù)等多源環(huán)境數(shù)據(jù),預(yù)測某大型砷渣場地土壤中重砷(As)的空間分布。黃燕鵬[16]等基于SOM+K-means分析挖掘及空間插值方法,研究華東地區(qū)某鉻渣污染場地,并將研究區(qū)地下水分為4類區(qū)域,識別出每類區(qū)域需重點(diǎn)關(guān)注的污染指標(biāo)。

        在污染場地大數(shù)據(jù)監(jiān)管及數(shù)據(jù)挖掘背景下,提出利用機(jī)器學(xué)習(xí)方法,將研究區(qū)場地的多源異構(gòu)數(shù)據(jù)進(jìn)行融合,以綜合評判其污染情況,以期為污染場地管控及決策提供科學(xué)參考。

        1 材料與方法

        1.1 研究區(qū)概況

        該研究場地為我國華南某市的一個(gè)廢棄電鍍工業(yè)區(qū),該市屬亞熱帶海洋性氣候,春夏時(shí)間長,秋冬時(shí)間短,年平均氣溫22.6 ℃,年平均降水量1805.2 mm。陽光充足,雨量豐沛。該廢棄工業(yè)區(qū)地塊總面積43.614畝,由電鍍廠區(qū)(約23 072 m2)與污水處理廠(約6004 m2)組成。場地東邊與南邊毗鄰化工廠,西邊緊鄰農(nóng)田,北邊與某工業(yè)園相鄰。

        1.2 數(shù)據(jù)采集

        本研究所用到的數(shù)據(jù)包括遙感影像數(shù)據(jù)與土壤污染物采樣數(shù)據(jù),其中遙感影像數(shù)據(jù)來源于landsat 8平臺和高分-2號,具體信息見表1。

        表1 遙感圖像數(shù)據(jù)信息

        土壤污染物采樣數(shù)據(jù)來自于實(shí)地調(diào)查采樣,檢測包括銀、砷、鎘、鉻、銅、鎳、鉛、鋅、汞及六價(jià)鉻等 10 種重金屬及總氰化物、揮發(fā)性有機(jī)物(VOCs)、半揮發(fā)性有機(jī)物(SVOCs)、總石油烴(TPH)與多氯聯(lián)苯(PCB)等,其中銅、鎳、鋅三種重金屬元素超過風(fēng)險(xiǎn)篩選值。共設(shè)33個(gè)采樣點(diǎn)。

        1.3 研究方法

        按照《關(guān)閉搬遷企業(yè)地塊風(fēng)險(xiǎn)篩查與風(fēng)險(xiǎn)分級技術(shù)規(guī)定》[下文簡稱《規(guī)定》]分類分級指標(biāo),將采樣數(shù)據(jù)劃分為特征數(shù)據(jù)集,其中主要特征包括各類污染物濃度超標(biāo)倍數(shù)、地表覆蓋情況、地下防滲措施、土壤質(zhì)地、土地利用方式、平均采樣深度等。參考《規(guī)定》中的量化指標(biāo),將污染物特征數(shù)據(jù)集按污染嚴(yán)重程度分為中度關(guān)注、高度關(guān)注兩個(gè)類別。建立貝葉斯模型,評估各樣本分別屬于高度關(guān)注、中度關(guān)注的的概率。利用XGBoost算法,計(jì)算各特征的特征重要性,識別出污染嚴(yán)重程度的主要控制特征,并以此量化結(jié)果作為權(quán)重,量化各樣本的污染特征值?;贏RCGIS平臺,繪制該廠區(qū)污染分布圖,分析廠區(qū)內(nèi)部污染物分布特征,為污染場地治理、修復(fù)及管控決策提供科學(xué)參考。

        圖1 技術(shù)研究路線

        1.3.1 樸素貝葉斯模型

        樸素貝葉斯是貝葉斯分類器中的一種模型,用已知類別的數(shù)據(jù)集訓(xùn)練模型,從而實(shí)現(xiàn)對未知類別數(shù)據(jù)的類別判斷,理論基礎(chǔ)是貝葉斯決策論[17-24],核心思想是利用先驗(yàn)知識計(jì)算出樣本分別屬于每個(gè)類別的概率,以此來判定樣本所屬的類別,故需引入貝葉斯概率公式來計(jì)算樣本概率。

        貝葉斯公式一般表達(dá)為:

        (1)

        也可通俗表達(dá)為:

        (2)

        假設(shè)一組樣本需要分為兩個(gè)類別,則只需計(jì)算每條樣本分別屬于類別1與類別2的概率,見下式:

        (3)

        (4)

        在污染場地中,貝葉斯方法進(jìn)行數(shù)據(jù)融合主要思路是利用樸素貝葉斯分類器中的高斯分類器,將樣本的各個(gè)特征輸進(jìn)分類器,并輸出每條樣本對應(yīng)的類別,以達(dá)到數(shù)據(jù)統(tǒng)一化的目的。樣本特征值主要通過污染場地詳細(xì)調(diào)查的數(shù)據(jù)整理得到(如地表覆蓋情況、地下防滲措施、采樣深度、污染物濃度等),通過貝葉斯方法來進(jìn)行分類,得到樣本的所屬類別。

        1.3.2 XGBoost算法

        XGBoost算法[25-29]是一種決策樹提升算法,全稱為 eXtremeGradient Boosting。與 GBDT 算法相同,XGBoost算法由不定量的弱分類器組成,與GBDT的不同之處在于目標(biāo)函數(shù)的定義方式。XGBoost 的樹模型與目標(biāo)函數(shù)表達(dá)式類似,同樣屬于boosting算法,所以遵從前向分布加法,以第t步的模型為例,模型的第i個(gè)樣本的x的預(yù)測值為:

        (5)

        (6)

        (7)

        (8)

        根據(jù)泰勒公式,把函數(shù)f(x+Δx)在x處進(jìn)行泰勒的二階展開,得到式(9):

        (9)

        (10)

        將上述的二階展開式帶入到 XGBoost 的目標(biāo)函數(shù)中,得到目標(biāo)函數(shù)的近似值:

        (11)

        (12)

        對Ω(ft)進(jìn)行正則化,得:

        (13)

        用葉子結(jié)點(diǎn)表達(dá)目標(biāo)函數(shù):

        (14)

        記∑(i∈Ij)gi為Gj,∑(i∈Ij)hi為Hj,

        對wj求導(dǎo),得:

        (15)

        目標(biāo)函數(shù)可簡化為:

        (16)

        XGBoost算法引入正則化項(xiàng)于損失函數(shù)中,降低了模型的復(fù)雜度,減少了模型出現(xiàn)過擬合的概率,利用稀疏感知算法判斷模型的分裂方向,彌補(bǔ)了特征缺失值導(dǎo)致的誤差,通過抽樣計(jì)算,減小了計(jì)算量,避免了過擬合現(xiàn)象的出現(xiàn),具有非常高的可執(zhí)行性[30]。

        特征重要性是通過對數(shù)據(jù)集中的每個(gè)特征進(jìn)行計(jì)算并排序得到的。在XGBoost算法中選擇Gain(增益)衡量每個(gè)特征對模型性能改進(jìn)做出的貢獻(xiàn)。與其他特征相比,此度量值的較高值意味著它對生成預(yù)測更為重要。由節(jié)點(diǎn)負(fù)責(zé)加權(quán)及記錄次數(shù),將一個(gè)特征在所有提升樹中的結(jié)果進(jìn)行加權(quán)求和后然后平均,得到特征重要性的量化結(jié)果。

        (17)

        利用該算法獲取每個(gè)樣本的每個(gè)指標(biāo)造成污染嚴(yán)重程度的特征重要性,并以此作為每個(gè)指標(biāo)的權(quán)重,利用線性加權(quán)方法得到樣本的污染特征值,量化評估污染地塊的綜合污染情況。

        2 結(jié)果與討論

        2.1 影響因子指標(biāo)構(gòu)建

        以報(bào)告為數(shù)據(jù)來源,以《規(guī)定》為參考,選取地表覆蓋情況、地下防滲措施、土壤類型、采樣深度、重金屬污染物超標(biāo)倍數(shù)等影響因子,將各個(gè)影響因子進(jìn)行量化。

        量化細(xì)則如表2。

        表2 非結(jié)構(gòu)化數(shù)據(jù)量化細(xì)則

        2.2 關(guān)注度計(jì)算

        利用貝葉斯方法,輸出每個(gè)樣本分別是屬于中度關(guān)注還是高度關(guān)注的概率,以此來判斷該樣本所在區(qū)域的污染關(guān)注程度。采用貝葉斯模型處理多維、多類別數(shù)據(jù),無需將數(shù)據(jù)統(tǒng)一化,顯著提高了多源數(shù)據(jù)融合效率,避免了量綱及單位問題,更好地輔助決策。

        (18)

        (19)

        根據(jù)貝葉斯概率公式,計(jì)算每個(gè)樣本分別屬于中度關(guān)注還是高度關(guān)注的為后驗(yàn)概率,故需要計(jì)算出先驗(yàn)概率P(中度關(guān)注)、P(高度關(guān)注)。由于特征數(shù)據(jù)集中的數(shù)據(jù)已經(jīng)過量化,因此在貝葉斯模型中屬于連續(xù)型數(shù)據(jù),故采用高斯方法,求出先驗(yàn)概率概率P(特征∣中度關(guān)注)、P(特征∣高度關(guān)注)。根據(jù)公式進(jìn)行計(jì)算,得到樣本的后驗(yàn)概率,若P(中度關(guān)注∣特征)>P(高度關(guān)注∣特征),則判斷該樣本所在區(qū)域關(guān)注度為中度關(guān)注,反之亦然。

        將數(shù)據(jù)輸入值樸素貝葉斯分類器中,分類結(jié)果如表3所示。

        表3 污染關(guān)注度計(jì)算結(jié)果

        表4 特征指標(biāo)重要性量化結(jié)果

        經(jīng)過分類,場地內(nèi)部高度關(guān)注區(qū)域共有6處,分別為MC04/MC05一帶、MC09/MC11一帶、MC18/MC20。其余部分皆為中度關(guān)注區(qū)域。分析發(fā)現(xiàn),MC11、MC09點(diǎn)位于地塊南側(cè)某電鍍廠排污出口附近,土質(zhì)為砂土,地表硬化情況一般,有裂縫與破損及一定的地下防滲措施。MC04、MC05處位于原場地污水處理廠,土質(zhì)為砂土,地表硬化情況一般,有裂縫與破損及一定的地下防滲措施。

        2.3 污染特征計(jì)算

        傳統(tǒng)方法(如內(nèi)梅洛綜合指數(shù)法、污染物濃度插值法等)對地塊內(nèi)污染物進(jìn)行特征分析,僅考慮區(qū)域內(nèi)污染物含量造成的影響,難以綜合反映場地污染情況,因此通過XGBoost算法獲取每個(gè)污染特征指標(biāo)造成污染嚴(yán)重程度的特征重要性,以此作為每個(gè)指標(biāo)的權(quán)重,利用線性加權(quán)方法,得到每個(gè)采樣點(diǎn)的污染特征值,特征值越大,代表當(dāng)前區(qū)域綜合污染情況及風(fēng)險(xiǎn)越嚴(yán)重,以此量化評估污染地塊的綜合污染情況,從而實(shí)現(xiàn)估計(jì)環(huán)境信息的污染特征分析。

        2.3.1 特征指標(biāo)權(quán)重計(jì)算方法

        利用XGBoost算法,得到所有特征指標(biāo)在模型中的增益(Gain),再用每個(gè)特征的增益除以所有特征增益的總和,得到每個(gè)指標(biāo)特征的權(quán)重:

        (20)

        其中,Gaini是每個(gè)特征指標(biāo)的增益,n是特征個(gè)數(shù)。

        2.3.2 特征值計(jì)算方法

        分別將各個(gè)影響因子的權(quán)重與特征數(shù)據(jù)集中相應(yīng)的數(shù)值進(jìn)行相乘,再進(jìn)行相加,將得到的數(shù)據(jù)作為污染特征值。

        特征值計(jì)算結(jié)果如表5所示。從表中結(jié)果可知,該場地主要污染物為銅、鎳、鋅,與其主要電鍍相關(guān)業(yè)務(wù)排放特征一致。通過對比分析可知,該場地區(qū)域內(nèi)鋅元素污染最為嚴(yán)重,污染特征平均值達(dá)到12.40。其中,在MC09、MC11及MC18點(diǎn)位,鋅元素污染特征值分別達(dá)到了20.10、24.56及20.35,需要重點(diǎn)關(guān)注。

        表5 污染特征值計(jì)算結(jié)果

        2.4 污染物特征可視化及空間分析

        由圖2可以看出,鎳、鋅、銅三種元素的污染分布情況較為接近。污染嚴(yán)重區(qū)域集中在場地西北側(cè)污水處理廠附近及原電鍍廠與電染廠排污出口處,并有向四周擴(kuò)散的趨勢。MC11、MC09點(diǎn)位于某電鍍廠排污出口附近,土質(zhì)為砂土,地表硬化情況一般,有裂縫與破損及一定的地下防滲措施。MC04、MC05處位于原場地污水處理廠,土質(zhì)為砂土,地表硬化情況一般,有裂縫與破損及一定的地下防滲措施。初步判斷電鍍生產(chǎn)是導(dǎo)致銅、鎳、鋅三種污染的主要原因,且污染超標(biāo)最嚴(yán)重的污染元素是鋅。此外,前期研究發(fā)現(xiàn),污水處理環(huán)節(jié)及運(yùn)輸過程泄露也是導(dǎo)致重金屬污染的重要原因之一[13]。基于此,針對該廢棄場地的修復(fù)工作,應(yīng)主要集中在西北部污水處理廠、南部及北部的電鍍廠排污出口處,可減少修復(fù)工作成本及化學(xué)修復(fù)對環(huán)境帶來的副作用。

        圖2 鎳、鋅、銅污染特征可視化結(jié)果

        3 結(jié)論

        通過對多源數(shù)據(jù)的篩選整理,利用貝葉斯決策方法,預(yù)測污染場地內(nèi)部污染嚴(yán)重程度,其中預(yù)測結(jié)果與該污染場地實(shí)際污染分布情況相吻合。根據(jù)相關(guān)材料篩選出能夠綜合評價(jià)污染場地特征的指標(biāo),將其量化,利用XGBoost算法及線性加權(quán),獲得污染場地各部分樣本的污染特征值,其中鋅元素污染特征值整體較高,說明該場地鋅元素污染較嚴(yán)重,污染特征值可視化結(jié)果亦與實(shí)際情況相符。本研究基于貝葉斯決策與XGBoost構(gòu)建的廢棄場地污染特征分析方法,可為污染場地管控、修復(fù)工作提供技術(shù)支撐及決策參考。

        猜你喜歡
        貝葉斯特征值類別
        一類帶強(qiáng)制位勢的p-Laplace特征值問題
        單圈圖關(guān)聯(lián)矩陣的特征值
        貝葉斯公式及其應(yīng)用
        基于貝葉斯估計(jì)的軌道占用識別方法
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        一種基于貝葉斯壓縮感知的說話人識別方法
        電子器件(2015年5期)2015-12-29 08:43:15
        基于商奇異值分解的一類二次特征值反問題
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        關(guān)于兩個(gè)M-矩陣Hadamard積的特征值的新估計(jì)
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        亚洲av综合av国产av| 国产精品亚洲精品一区二区| 亚洲深深色噜噜狠狠网站| 国产精品国产三级国av在线观看| 国产成人久久综合热| 91亚洲精品久久久蜜桃| 91精品久久久老熟女91精品| 亚洲乱亚洲乱妇50p| 污污污污污污WWW网站免费| 超高清丝袜美腿视频在线| 久久精品一区二区三区蜜桃| 宅男666在线永久免费观看| 国产乱子伦精品无码码专区| 久久迷青品着产亚洲av网站| 亚洲国产中文字幕无线乱码| 久久青青草原亚洲av无码麻豆| 久久青青热| 亚洲av乱码一区二区三区观影 | 九月色婷婷免费| 91九色视频在线国产| 亚洲av无码乱码在线观看裸奔| 日韩亚洲精品中文字幕在线观看| 人妻丝袜av中文系列先锋影音 | 日本不卡一区二区三区久久精品 | 黄片视频大全在线免费播放| 97人妻精品一区二区三区| 九九在线视频| 久久精品一区二区三区夜夜| 999zyz玖玖资源站永久| 爱情岛永久地址www成人| 老熟女一区二区免费| 成人在线观看av毛片| 国产农村妇女精品一二区| 亚洲国产欧美日韩一区二区| 久久精品女人天堂av麻| 摸丰满大乳奶水www免费| 日本亚洲国产一区二区三区| 亚洲av色香蕉一区二区蜜桃| 亚洲最新国产av网站| 成人免费看www网址入口| 国产精品久久久一本精品|