亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于梯度提升決策樹算法的膨潤土膨脹力預(yù)測(cè)

        2023-11-08 04:06:06王瓊張佳南高岑蘇薇劉樟榮葉為民
        世界核地質(zhì)科學(xué) 2023年3期
        關(guān)鍵詞:蒙脫石膨潤土決策樹

        王瓊,張佳南,高岑,蘇薇,劉樟榮,葉為民

        (同濟(jì)大學(xué) 巖土及地下工程教育部重點(diǎn)實(shí)驗(yàn)室,上海 200092)

        隨著經(jīng)濟(jì)的迅速發(fā)展,能源需求快速增加,高效、清潔的核能在全球能源轉(zhuǎn)型中發(fā)揮著越來越重要的作用。然而,核能發(fā)電不可避免地會(huì)產(chǎn)生放射性強(qiáng)、毒性大、半衰期長的高放射性廢物(高放廢物)[1]。研究表明:深地質(zhì)處置是其最為可行可靠的處理方法,即把高放廢物埋在距離地表約500~1 000 m 的穩(wěn)定地質(zhì)體中,通過設(shè)置多重屏障(天然屏障、工程屏障、廢物罐)使其與人類生存環(huán)境永久隔離[2]。其中,作為工程屏障的緩沖/回填材料需具備水力學(xué)屏障、核素阻滯屏障、傳導(dǎo)和散失放射性廢物衰變熱等重要功能[3]。高壓實(shí)膨潤土,由于具有低滲透性、高膨脹性、高陽離子交換能力和較高的核素阻滯能力,目前已被選為高放廢物處置庫工程屏障的首選材料。

        實(shí)際工程中,一方面要求緩沖/回填材料的高膨脹能力使施工接縫自封閉,另一方面又要求膨脹力不高于處置庫圍巖的最小主應(yīng)力以防止對(duì)母巖的侵?jǐn)_和破壞。因此,膨潤土的膨脹性能是評(píng)價(jià)其緩沖性能的關(guān)鍵指標(biāo)之一。

        國內(nèi)、外已有眾多關(guān)于高壓實(shí)膨潤土膨脹力、膨脹變形特性及其影響因素的研究成果。膨潤土的膨脹特性依賴于蒙脫石含量和初始條件(干密度和含水量)。不同類型膨潤土因其蒙脫石含量不同而具有不同的膨脹性能,蒙脫石含量越高則膨脹力越大[4-5]。膨潤土的干密度、含水率(反映吸力)等初始條件會(huì)影響其結(jié)構(gòu),從而在影響膨潤土膨脹能力方面表現(xiàn)得尤為重要。干密度越大膨脹力越大[6-9];而初始含水量對(duì)最終膨脹力的影響不明顯[10]。此外,在緩沖材料性能改良的研究中發(fā)現(xiàn),純膨潤土中加入砂/巖屑等添加劑時(shí),混合材料的骨架成分會(huì)隨添加劑摻入率而變化,從而對(duì)膨脹力產(chǎn)生影響,表現(xiàn)為混合材料的膨脹性能會(huì)隨添加劑含量增加而減弱[11]。

        事實(shí)上,由于膨潤土在深地質(zhì)處置庫中作為工程屏障而發(fā)揮緩沖/回填作用,故除上述土體本身特性之外,處置庫所處耦合環(huán)境中各因素也顯著影響膨潤土的膨脹性能。工程屏障會(huì)直接接觸到廢物罐以傳導(dǎo)/散失高放廢物衰變熱,溫度的變化會(huì)使膨潤土中的水分遷移、脫離并影響膨潤土自身結(jié)構(gòu)[12-13],從而影響其膨脹力[14-16]。并且,膨潤土具有較大的離子交換容量,處置庫中的高壓實(shí)膨潤土砌塊長期受到含鹽地下水的化學(xué)作用,處置庫運(yùn)營過程中水泥水解造成的堿性環(huán)境也易將膨潤土中的蒙脫石溶解[17],因而環(huán)境中溶液類型及濃度也是影響其膨脹力的重要因素[18],膨潤土的膨脹力會(huì)隨溶液濃度的增加而相應(yīng)減?。?9-20]。

        綜上可知,在實(shí)際處置環(huán)境中,膨潤土膨脹性能的影響因素較多、作用機(jī)制復(fù)雜,且目前對(duì)綜合考慮多種因素影響的相關(guān)研究尚少,使得處置庫耦合環(huán)境下膨潤土膨脹性能的快速準(zhǔn)確預(yù)測(cè)成為難點(diǎn)。

        近年興起的機(jī)器學(xué)習(xí)方法是數(shù)據(jù)分析、預(yù)測(cè)的有效手段,對(duì)上述所提出的問題具有很高適用性。在地質(zhì)工程領(lǐng)域,已有許多學(xué)者運(yùn)用機(jī)器學(xué)習(xí)來研究存在較多影響因素的課題。尤其是機(jī)器學(xué)習(xí)中的梯度提升算法,在多因素影響下的分類、回歸問題方面表現(xiàn)優(yōu)異,常被用于地質(zhì)體識(shí)別[21-22]、成礦預(yù)測(cè)[23]和地質(zhì)災(zāi)害預(yù)測(cè)[24]等課題的研究,且能夠獲得較為準(zhǔn)確的預(yù)測(cè)結(jié)果,與本文的研究目標(biāo)有較強(qiáng)的契合性。

        因此,本文采用泛化能力出眾的梯度提升決策樹(GBDT)算法,通過梳理和總結(jié)國內(nèi)外相關(guān)的實(shí)驗(yàn)研究成果,以目前世界上較為典型的膨潤土為研究對(duì)象,選取干密度、含水率、添加劑類型及摻入比、溶液成分及濃度為特征參數(shù),構(gòu)建了基于GBDT 回歸算法的膨潤土膨脹力預(yù)測(cè)模型,以期為我國已經(jīng)開建的地下實(shí)驗(yàn)室現(xiàn)場(chǎng)試驗(yàn)與處置庫建設(shè)提供設(shè)計(jì)參數(shù)與理論支撐。

        1 理論分析

        1.1 膨潤土的膨脹機(jī)理

        膨潤土是以蒙脫石為主要成分的黏性土,通常含有少量伊利石、高嶺石、石英、方解石和長石等礦物。蒙脫石是黏土礦物中最具膨脹性的一類,因此膨潤土的膨脹性能與蒙脫石的特性密切相關(guān)。蒙脫石是2:1 型層狀硅酸鹽礦物,由上、下兩片硅氧四面體和中間一片鋁(鎂)氧(羥基)八面體構(gòu)成,晶體構(gòu)造如圖1 所示。

        圖1 蒙脫石晶體構(gòu)造示意圖Fig.1 Schematic diagram of the crystal structure of montmorillonite.

        膨潤土的膨脹包括兩個(gè)部分,即:晶層膨脹和雙電層膨脹。蒙脫石中的硅氧四面體和鋁氧八面體中的Si4+和Al3+常被低價(jià)陽離子置換,使晶層間產(chǎn)生多余的負(fù)電荷,因此晶層間會(huì)吸附大半徑陽離子(如K+、Na+和Ca2+等)以保持整體的電中性。這些大半徑陽離子通常以水化狀態(tài)存在,可相互交換,因此蒙脫石具有較高的離子交換容量與吸水能力,在遇水時(shí)水分子易沿硅氧四面體層進(jìn)入晶層間,使得晶層間距擴(kuò)大,宏觀上即表現(xiàn)為體積膨脹。另一方面,孔隙中的水與黏土顆粒表面接觸時(shí)會(huì)受到顆粒表面雙電層(圖2)的電場(chǎng)作用,極性水分子被吸附于土粒周圍形成一層結(jié)合水膜。當(dāng)極性水分子不斷被吸附、結(jié)合水膜逐漸增厚,黏土顆粒即被楔開,顆粒間距增大,導(dǎo)致宏觀上的體積膨脹,即雙電層膨脹。

        圖2 雙電層結(jié)構(gòu)示意圖Fig.2 Schematic diagram of double electric layer structure

        1.2 膨潤土膨脹力的主要影響因素

        膨脹力是指膨脹性土遇水而保持土體積不變所需要的壓力[5]。作為膨潤土主要礦物成分的蒙脫石晶體結(jié)構(gòu)特殊,使得膨潤土具有極其復(fù)雜的構(gòu)造層次——孔隙層次多、形狀大小各異,而膨潤土吸濕膨脹的性能很大程度上取決于它的孔隙結(jié)構(gòu),因此,影響膨潤土孔隙的因素也會(huì)相應(yīng)地影響到膨潤土的膨脹性能。

        膨潤土的自身性質(zhì)是決定其孔隙結(jié)構(gòu)的根本因素,可視為內(nèi)因,包括蒙脫石含量、干密度和含水量等初始條件、膨潤土中的添加劑類型和摻入率。并且,高壓實(shí)膨潤土砌塊是在處置庫中發(fā)揮其緩沖/回填作用,故處置庫的環(huán)境因素對(duì)其孔隙結(jié)構(gòu)造成的影響也不容忽視,視為外因,包括環(huán)境溫度、鹽/堿溶液及其濃度。

        綜上所述,內(nèi)因和外因都將通過影響膨潤土的結(jié)構(gòu)而對(duì)其膨脹力造成一定影響。

        1.3 GBDT 算法原理

        決策樹算法(Decision Tree)是機(jī)器學(xué)習(xí)中的一種典型算法,可以解決分類問題與回歸分析,是常用的數(shù)據(jù)預(yù)測(cè)模型,應(yīng)用十分廣泛。其中,決策樹是一種較弱的基學(xué)習(xí)器,其單棵樹預(yù)測(cè)的準(zhǔn)確性比傳統(tǒng)分類與回歸方法弱,但可通過集成學(xué)習(xí)的方法將基學(xué)習(xí)器組合,從而提升決策樹的預(yù)測(cè)效果。 GBDT(Gradient Boosting Decision Tree)便是一種基于集成學(xué)習(xí)(Ensemble Learning)策略的決策樹算法,它由多棵CART 回歸決策樹組成,通過將所有樹的結(jié)果相加得出最終結(jié)論。

        GBDT 提升樹采用前向分步算法,基學(xué)習(xí)器為回歸樹fm(x)。首先初始化回歸樹f0(x)=0,則第m步的模型為[25]:

        式(1)中:fm-1(x)—當(dāng)前模型;T(x;Θm)—第m輪的回歸樹;Θm—第m步的決策樹參數(shù)。

        與二分類問題提升樹和回歸問題提升樹不同,GBDT 算法中的損失函數(shù)(Loss Function)L(y,f(x)) 并無指定,可以自定義,這便使得GBDT 算法擁有更廣泛的適用性。該算法的核心目標(biāo)是所增加的每一個(gè)基學(xué)習(xí)器都應(yīng)使得總體損失越來越小,即第m步應(yīng)比第m-1 步的損失?。?/p>

        將損失函數(shù)L(y,fm(x))進(jìn)行一階泰勒展開,代入上述不等式(推導(dǎo)過程略)[25],得:

        式(4)表明:回歸樹T(x;Θm)是通過擬合rm(x,y)來訓(xùn)練樣本的。 將(xi,yi) 代入rm(x,y),即可得到rmi,進(jìn)而得到第m步的訓(xùn)練數(shù)據(jù)集Tm:

        式(5)中:n為樣本數(shù)量,對(duì)rm1,rm2,…,rmn進(jìn)行擬合,可得到第m棵回歸樹T(x;Θm),其葉子節(jié)點(diǎn)的區(qū)域?yàn)镽mj,j= 1,2,…,J。

        隨后,更新基學(xué)習(xí)器[25]:

        最終所得到的回歸樹為:

        綜上所述,GBDT 提升樹的計(jì)算步驟為:計(jì)算當(dāng)前損失函數(shù)L(y,fm( )x)的負(fù)梯度表達(dá)式rm(x,y);通過rm(x,y)構(gòu)造新的訓(xùn)練樣本Tm并對(duì)其進(jìn)行擬合;得到本步的回歸樹T(x;Θm)并更新本步的基學(xué)習(xí)器fm(x);最后通過相加的方法將基學(xué)習(xí)器組合成一個(gè)強(qiáng)學(xué)習(xí)器,即最終的梯度提升(GBDT)決策樹,進(jìn)而得到預(yù)測(cè)結(jié)果。

        2 GBDT 回歸模型構(gòu)建

        2.1 數(shù)據(jù)集建立和預(yù)處理

        本文的研究數(shù)據(jù)來源于國內(nèi)、外64 篇文獻(xiàn)中針對(duì)各類型膨潤土進(jìn)行的膨脹力實(shí)驗(yàn)研究結(jié)果。通過從文獻(xiàn)中收集膨脹力實(shí)驗(yàn)的相關(guān)結(jié)果,對(duì)其中涉及的膨脹力影響因素進(jìn)行歸納總結(jié),初步建立了包含1 875條樣本數(shù)據(jù)的數(shù)據(jù)集。

        由于回歸算法要求樣本的每一特征均有具體值,而上述1 875 條樣本中存在因文獻(xiàn)說明不清而造成特征值缺失的部分樣本,故對(duì)這些樣本進(jìn)行數(shù)據(jù)預(yù)處理,包括特征值補(bǔ)全和直接剔除。特征值補(bǔ)全方法為參考采用相似實(shí)驗(yàn)方法與材料的文獻(xiàn)中的特征值來取值補(bǔ)全。對(duì)于難以補(bǔ)全的樣本數(shù)據(jù)則直接剔除。完成數(shù)據(jù)預(yù)處理后,剩余1 063 條有效樣本數(shù)據(jù),以此作為建立機(jī)器學(xué)習(xí)模型的數(shù)據(jù)集。

        通過結(jié)合對(duì)文獻(xiàn)中實(shí)驗(yàn)現(xiàn)象的總結(jié),參考各因素對(duì)膨潤土膨脹力的影響機(jī)制以及對(duì)所制作的數(shù)據(jù)集進(jìn)行分析,本文以目前世界上較為常見的15 種膨潤土為研究對(duì)象,選取影響膨脹力的干密度、含水率、添加劑類型及摻入率、溶液成分及濃度因素為樣本特征,以膨潤土的膨脹力為樣本標(biāo)簽,進(jìn)行后續(xù)模型的構(gòu)建。

        數(shù)據(jù)集制作完畢后,對(duì)樣本數(shù)量較多的8種膨潤土(GMZ、Bamer1、Febex、Foca、Kunigel、Kyungju、MX80 和河南信陽膨潤土)制作箱線圖(圖3)進(jìn)行特征分析,能夠較直觀地得知各類膨潤土的各個(gè)特征的取值分布。此外,數(shù)據(jù)集中各土類的樣本數(shù)量也存在較大差異(圖4),因產(chǎn)自我國內(nèi)蒙古自治區(qū)興和縣的GMZ 膨潤土目前產(chǎn)量較大、用途廣泛且前人研究較為深入,故其樣本數(shù)量最多,其次有Febex、MX80,以Avonsea 為最少。

        圖3 樣本特征箱線圖Fig.3 Box plots of the sample features

        圖4 不同類型膨潤土的樣本數(shù)量Fig.4 Number of samples for different types of bentonite

        綜上,數(shù)據(jù)集中樣本特征分布的情況會(huì)對(duì)膨潤土膨脹力預(yù)測(cè)模型造成一定的統(tǒng)計(jì)學(xué)影響,有與采用控制變量方法進(jìn)行實(shí)驗(yàn)所得出的真實(shí)結(jié)果和規(guī)律存在出入的可能性,故用該數(shù)據(jù)集所搭建的模型并非意在解釋膨潤土的膨脹力機(jī)制,僅為復(fù)雜影響因素條件下的膨潤土膨脹力提供預(yù)測(cè)參考。

        2.2 模型構(gòu)建

        基于以上數(shù)據(jù)集的建立,本文以1063 條樣本數(shù)據(jù)的土性、干密度、含水率、添加劑類型及摻入率、溶液成分及濃度這8 個(gè)膨脹力的影響因素為樣本特征,以膨脹力為樣本標(biāo)簽,并將數(shù)據(jù)集中的所有樣本以3:1 的比例劃分為訓(xùn)練集和測(cè)試集,利用Python 程序語言中sklearn.ensemble 庫的GradientBoostingRegressor 類來構(gòu)建梯度提升決策樹回歸模型(以下簡(jiǎn)稱為GBDT 回歸模型)。采用通過GridSearchCV 網(wǎng)格搜索結(jié)合手動(dòng)參數(shù)調(diào)優(yōu),最終確定模型的最優(yōu)參數(shù)如表1 所示。

        表1 GBDT 回歸模型最優(yōu)參數(shù)Table 1 Optimum parameters of the GBDT regression model

        其他未設(shè)置的參數(shù)如loss、splitter、subsample、criterion 、min_samples_leaf 、max_features 、alpha和 min_weight_fraction_leaf 即取默認(rèn)值,見表2。

        表2 GBDT 回歸模型默認(rèn)參數(shù)Table 2 Default parameters of the GBDT regression model

        3 模型檢驗(yàn)與分析

        3.1 預(yù)測(cè)效果評(píng)估

        GBDT 回歸模型訓(xùn)練完成后對(duì)測(cè)試集樣本的膨脹力值進(jìn)行預(yù)測(cè),輸出訓(xùn)練集、測(cè)試集的膨脹力預(yù)測(cè)值,分別繪制真實(shí)值散點(diǎn)與預(yù)測(cè)值曲線(圖5)并分別計(jì)算R2(模型評(píng)估指標(biāo))如下:

        圖5 真實(shí)值散點(diǎn)與GBDT 回歸模型的預(yù)測(cè)值曲線Fig.5 Experiment data and the prediction curves of the GBDT regression model

        模型的R2值能夠反映回歸模型的方程對(duì)樣本標(biāo)簽(即膨脹力)的解釋能力,即模型的預(yù)測(cè)準(zhǔn)確率。R2越大,則表示模型越好。當(dāng)模型為最理想效果,即預(yù)測(cè)值與真實(shí)值毫無偏差時(shí),R2得到最大值1。

        R2的計(jì)算公式如下[26]:

        式(8)中:m—樣本數(shù)量;yi—樣本標(biāo)簽真實(shí)值;?—樣本標(biāo)簽預(yù)測(cè)值;—樣本標(biāo)簽真實(shí)值的平均值。

        GBDT 回歸模型的R2train值和R2test表明模型對(duì)訓(xùn)練集、測(cè)試集的預(yù)測(cè)準(zhǔn)確率分別為97.64%和91.69%。雖與訓(xùn)練集相比,測(cè)試集的預(yù)測(cè)準(zhǔn)確率有所下降,但仍保持在90%以上的較理想狀態(tài),說明該模型并未存在較嚴(yán)重的過擬合情況,在兼顧預(yù)測(cè)準(zhǔn)確率的同時(shí)具有良好的泛化能力。

        3.2 模型成本分析

        由于GBDT 回歸模型的學(xué)習(xí)機(jī)制是前向分步算法,即模型每一步都僅學(xué)習(xí)一個(gè)弱學(xué)習(xí)器,在多輪迭代后逐步逼近優(yōu)化目標(biāo),來實(shí)現(xiàn)梯度提升。并且,膨脹力預(yù)測(cè)問題屬于回歸問題,相比起分類問題具有較高的復(fù)雜度。因此,為了提高準(zhǔn)確性而增加預(yù)測(cè)深度,GBDT 回歸模型在訓(xùn)練過程中會(huì)產(chǎn)生成千上萬顆決策樹,對(duì)運(yùn)行模型的機(jī)器硬件條件要求較高。

        對(duì)此,本文將模型的預(yù)測(cè)效果與機(jī)器硬件條件共同納入考慮,尋找能夠兼顧上述兩者的模型最優(yōu)參數(shù),稱其為模型成本分析。

        通過GradientBoostingRegressor 類的loss_函數(shù)輸出模型的預(yù)測(cè)誤差隨所生成的弱學(xué)習(xí)器個(gè)數(shù)的變化(圖6),得知拐點(diǎn)出現(xiàn)在第500 個(gè)弱學(xué)習(xí)器生成時(shí),即模型于此時(shí)基本達(dá)到收斂。本文嘗試?yán)胣_estimators=500(即最多生成500 個(gè)弱學(xué)習(xí)器)這一參數(shù)重新進(jìn)行模型訓(xùn)練,計(jì)算的模型R2如下:

        圖6 預(yù)測(cè)誤差隨弱學(xué)習(xí)器個(gè)數(shù)的變化Fig.6 Variation trend of the prediction error with the number of n_estimators

        R2的計(jì)算結(jié)果顯示,將模型生成的最大弱學(xué)習(xí)器個(gè)數(shù)由原來的1 500 個(gè)縮減為當(dāng)前的500 個(gè),相應(yīng)的R2降低幅度非常小,僅從0.917降至0.901。雖然生成1 500 個(gè)弱學(xué)習(xí)器對(duì)機(jī)器來說并非難以企及,但在試圖提高效率和不追求極致準(zhǔn)確率的情況下,便可以采用縮減弱學(xué)習(xí)器個(gè)數(shù)的方法,找出圖像的拐點(diǎn),求得一個(gè)性價(jià)比最高的弱學(xué)習(xí)器個(gè)數(shù)值。

        同理,除了n_estimators 外,其他參數(shù)也可通過繪制圖像的方法尋找最優(yōu)值(圖7),縮減模型調(diào)參成本、減輕機(jī)器運(yùn)行內(nèi)存壓力、提高模型訓(xùn)練性價(jià)比。

        圖7 預(yù)測(cè)誤差隨其他參數(shù)的變化趨勢(shì)Fig.7 Variation trend of the prediction error with other parameters

        3.3 模型預(yù)測(cè)效果評(píng)價(jià)

        針對(duì)同樣的數(shù)據(jù)集,本文運(yùn)用Python 程序語言分別編寫了多元線性回歸模型、一般決策樹回歸模型、AdaBoost 決策樹回歸模型、隨機(jī)森林回歸模型的機(jī)器學(xué)習(xí)算法模型,對(duì)它們進(jìn)行訓(xùn)練學(xué)習(xí),得到各模所返回的膨脹力預(yù)測(cè)值、并與真實(shí)值進(jìn)行比較,計(jì)算模型R2,繪制模型的膨脹力擬合曲線圖(圖8~11),從而評(píng)價(jià)與比較各模型的膨脹力預(yù)測(cè)效果。

        圖8 多元回歸線性模型預(yù)測(cè)效果Fig.8 The prediction results of Linear Regression with Multiple Variables

        需要說明的是,本文在繪圖前先將各模型的輸出預(yù)測(cè)值分別進(jìn)行升序排序,并以此來編號(hào)樣本作為橫軸,隨后繪制預(yù)測(cè)值曲線和相應(yīng)的樣本編號(hào)下的真實(shí)值散點(diǎn),以保證曲線單調(diào)和圖像美觀,因此相同的真實(shí)值數(shù)據(jù)集在不同模型的圖像中呈現(xiàn)不同的分布情況。

        多元線性回歸模型由圖8b 可見,該模型的預(yù)測(cè)準(zhǔn)確率僅為33.7 %,說明線性回歸并不適用于膨脹力預(yù)測(cè)。

        一般決策樹回歸模型決策樹是機(jī)器學(xué)習(xí)中常用于回歸的監(jiān)督學(xué)習(xí)算法,通過生成回歸決策樹來輸出樣本預(yù)測(cè)值。由圖9b 可見,一般決策樹回歸模型的預(yù)測(cè)準(zhǔn)確率為56.1 %,對(duì)測(cè)試集的預(yù)測(cè)準(zhǔn)確率遠(yuǎn)低于訓(xùn)練集,存在過擬合現(xiàn)象,因此也不適用于膨脹力預(yù)測(cè)。

        圖9 一般決策樹回歸模型預(yù)測(cè)效果Fig.9 The prediction results of Decision Tree Regression

        AdaBoost 決策樹回歸模型Boosting 是一種集成學(xué)習(xí)技術(shù),在回歸問題中表現(xiàn)突出。本文用其代表之一的AdaBoost 回歸算法來優(yōu)化一般決策樹回歸模型,形成AdaBoost 決策樹回歸模型。由圖10a 和b 可見,該模型對(duì)訓(xùn)練集、測(cè)試集的預(yù)測(cè)準(zhǔn)確率較一般決策樹回歸模型均有所提升,但78.8 %的準(zhǔn)確率仍未達(dá)到本文預(yù)期。

        圖10 AdaBoost 決策樹回歸模型預(yù)測(cè)效果Fig.10 The prediction results of Decision Tree Regression with AdaBoost

        隨機(jī)森林回歸模型隨機(jī)森林算法是一種基于Bagging 策略的集成學(xué)習(xí)算法,廣泛運(yùn)用于分類和回歸任務(wù)中。由圖11b 可見,隨機(jī)森林回歸模型較一般決策樹回歸模型預(yù)測(cè)更為準(zhǔn)確,與AdaBoost 決策樹回歸模型預(yù)測(cè)水平相當(dāng),但仍未達(dá)到本文的預(yù)期效果。

        圖11 隨機(jī)森林回歸模型預(yù)測(cè)效果Fig.11 The prediction results of Random Forest Regression

        為了便于比較,將以上四種機(jī)器學(xué)習(xí)算模型與GBDT 回歸模型的R2值一同列于表3 中。通過對(duì)比R2值,容易看出GBDT 回歸模型的預(yù)測(cè)準(zhǔn)確性顯著大于以上四種機(jī)器學(xué)習(xí)模型,證明了其在膨脹力預(yù)測(cè)方面具有良好的優(yōu)越性與可行性,能夠在實(shí)際工程中得到很好的應(yīng)用。

        表3 不同機(jī)器學(xué)習(xí)模型的R2 值比較Table 3 Comparison of R2 between different machine learning models

        在地下實(shí)驗(yàn)室現(xiàn)場(chǎng)試驗(yàn)、高放廢物深地質(zhì)處置庫的設(shè)計(jì)與處置庫工程屏障投入實(shí)際運(yùn)營中,對(duì)膨潤土膨脹力產(chǎn)生影響的因素多而復(fù)雜,若采用傳統(tǒng)的原位試驗(yàn)與室內(nèi)試驗(yàn),會(huì)存在工作量大、效率低下等問題,因此難以逐個(gè)、逐情況地快速取得這些因素的具體數(shù)值。經(jīng)過本文的研究與分析,在評(píng)估了梯度提升決策樹回歸模型對(duì)膨潤土膨脹力預(yù)測(cè)的準(zhǔn)確率、模型成本的情況下,認(rèn)為該模型能夠兼顧預(yù)測(cè)的準(zhǔn)確性和泛用性,并且能夠快速地獲取作為工程屏障的高壓實(shí)膨潤土砌塊的膨脹力值,使高效評(píng)估工程屏障的工作性能及運(yùn)營狀態(tài)成為可能,值得在高放廢物深地質(zhì)處置的工程實(shí)踐分析中推廣和使用。

        4 結(jié) 論

        本文通過收集相關(guān)文獻(xiàn)的實(shí)驗(yàn)數(shù)據(jù)、建立了數(shù)據(jù)集、搭建了GBDT 回歸模型并進(jìn)行訓(xùn)練和測(cè)試,對(duì)世界上的典型膨潤土在多種影響因素下的膨脹力作出預(yù)測(cè),分析GBDT 模型在實(shí)際工程中運(yùn)用的可行性,并將其與四種經(jīng)典機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比分析,獲得如下主要結(jié)論。

        1)本文所搭建的GBDT 回歸模型通過訓(xùn)練和參數(shù)調(diào)優(yōu),對(duì)膨潤土膨脹力的預(yù)測(cè)準(zhǔn)確率可達(dá)91.7 %,預(yù)測(cè)效果符合本文的預(yù)期。

        2)在考慮模型成本后進(jìn)行的GBDT 回歸模型的參數(shù)優(yōu)化分析表明,合理地選擇模型參數(shù)能夠在減輕機(jī)器運(yùn)行壓力的同時(shí)保持較高準(zhǔn)確率。此外,當(dāng)環(huán)境中已知的影響因素值較少時(shí),本文所搭建的GBDT 回歸模型也能對(duì)膨潤土的膨脹力作出較為滿意的預(yù)測(cè)結(jié)果,具有很好的實(shí)用性和泛用性。

        3)與多元線性回歸、一般決策樹回歸、AdaBoost 決策樹回歸和隨機(jī)森林回歸模型這四種經(jīng)典機(jī)器學(xué)習(xí)模型相比,GBDT 回歸模型的膨潤土膨脹力預(yù)測(cè)效果更加理想,能夠很好地滿足實(shí)際引用需求。

        然而,受限于本領(lǐng)域的研究現(xiàn)狀,本文的數(shù)據(jù)來源僅為對(duì)于單一因素或兩種因素耦合影響下的膨脹力實(shí)驗(yàn)結(jié)果,未能獲取多因素共同影響下的膨脹力實(shí)驗(yàn)值。因此,本文中所有機(jī)器學(xué)習(xí)模型僅在數(shù)學(xué)、統(tǒng)計(jì)學(xué)等層面預(yù)測(cè)膨脹力,并未建立能夠反映各影響因素作用機(jī)制的物理模型,但這仍是未來值得繼續(xù)研究和討論的方向。

        猜你喜歡
        蒙脫石膨潤土決策樹
        葛根固斂湯聯(lián)合蒙脫石散治療小兒腹瀉的臨床觀察
        重金屬對(duì)膨潤土膨脹性的影響
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于決策樹的出租車乘客出行目的識(shí)別
        膨潤土防水毯在水庫防滲工程中的應(yīng)用
        草酸對(duì)蒙脫石的作用及機(jī)理研究
        碳化鎢與蒙脫石納米復(fù)合材料的制備與電催化活性
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        CTMAB-膨潤土處理含油污水的研究
        av鲁丝一区鲁丝二区鲁丝三区| 亚洲熟女国产熟女二区三区| 精品av一区二区在线| 亚洲毛片在线免费视频| 久久精品中文字幕大胸 | 久久久久久中文字幕有精品| 成人偷拍自拍在线视频| 久久久亚洲熟妇熟女av| 中文www新版资源在线 | 亚洲色四在线视频观看| 日韩av一区二区不卡在线 | 中文字字幕在线精品乱码| 麻豆久久五月国产综合| 久久熟女精品—区二区蜜臀| 国产精品一区二区日本| 欧美黑人性暴力猛交喷水黑人巨大 | 日日摸日日碰人妻无码老牲| 粗大挺进孕妇人妻在线| 天堂资源中文网| 国产熟妇高潮呻吟喷水| 最新国产女主播福利在线观看| 中文亚洲一区二区三区| √天堂资源中文www| 无码少妇一区二区三区| 精品国免费一区二区三区| 视频区一区二在线观看| 免费人成年激情视频在线观看 | 免费一区二区三区在线视频| 国产91熟女高潮一曲区| 一个人看的视频在线观看| 97精品国产手机| 人妻少妇精品无码系列| 一本久道久久丁香狠狠躁| 2019日韩中文字幕mv| 肉体裸交丰满丰满少妇在线观看| 国内精品人人妻少妇视频| 中文字幕国产精品一二三四五区| a级毛片成人网站免费看| 娇柔白嫩呻吟人妻尤物| 亚洲av午夜福利精品一区不卡| 欧美人做人爱a全程免费|