亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹(shù)集成學(xué)習(xí)的桉樹(shù)蓄積預(yù)估模型研究

        2020-03-15 01:15:44李曉偉吳保國(guó)蘇曉慧陳玉玲彭意欽于永輝范小虎
        關(guān)鍵詞:方法模型

        李曉偉, 吳保國(guó)*, 蘇曉慧, 陳玉玲, 彭意欽, 于永輝, 范小虎

        (1.北京林業(yè)大學(xué)信息學(xué)院,林業(yè)信息化研究所,北京 100083; 2.廣西壯族自治區(qū)國(guó)有高峰林場(chǎng),南寧 530000)

        林分生產(chǎn)力的準(zhǔn)確預(yù)測(cè)對(duì)森林經(jīng)營(yíng)及其方案編制意義重大,是實(shí)現(xiàn)人工林可持續(xù)經(jīng)營(yíng)的基礎(chǔ)[1]。林分蓄積是衡量小班林分生產(chǎn)力的重要指標(biāo),國(guó)內(nèi)外學(xué)者對(duì)蓄積預(yù)估模型已有大量研究,構(gòu)建林分蓄積模型的方法很多,主要為傳統(tǒng)統(tǒng)計(jì)建模方法和機(jī)器學(xué)習(xí)方法。傳統(tǒng)方法包括多元非線性回歸方程[2]、借助樹(shù)高和斷面積等中間變量的聯(lián)立方程組法[3]、混合效應(yīng)模型法[4-5]。傳統(tǒng)方法是在滿足數(shù)據(jù)獨(dú)立、正態(tài)分布和方差齊性等假設(shè)前提下進(jìn)行的,但是由于森林?jǐn)?shù)據(jù)的固有變異性,上述假設(shè)通常難以滿足[6]。此外,林分蓄積還受林分密度及經(jīng)營(yíng)水平等因素影響,林分生長(zhǎng)系統(tǒng)具有非線性、復(fù)雜性本質(zhì)特征,使得傳統(tǒng)的數(shù)學(xué)公式模型難以精準(zhǔn)表述[6]。而機(jī)器學(xué)習(xí)方法可對(duì)非線性關(guān)系進(jìn)行良好模擬,不僅在預(yù)測(cè)精度上有明顯優(yōu)勢(shì),而且應(yīng)用方便[7],因此,構(gòu)建機(jī)器學(xué)習(xí)模型進(jìn)行林分蓄積量預(yù)估的研究也越來(lái)越多。目前,機(jī)器學(xué)習(xí)方法中應(yīng)用較多的是人工神經(jīng)網(wǎng)絡(luò)[8-12]。對(duì)于非神經(jīng)網(wǎng)絡(luò)方法,林卓等[13]用支持向量機(jī)構(gòu)建福建西北地區(qū)杉木人工林蓄積模型,高若楠[14]使用小班數(shù)據(jù)采用隨機(jī)森林方法對(duì)東北天然闊葉林蓄積生長(zhǎng)量進(jìn)行預(yù)估。決策樹(shù)機(jī)器學(xué)習(xí)方法在預(yù)測(cè)方面表現(xiàn)更好的解釋性,并且通過(guò)集成學(xué)習(xí)方式進(jìn)行整合,既可以提高預(yù)測(cè)精度又可以減少產(chǎn)生過(guò)擬合的幾率,在生態(tài)研究等領(lǐng)域中應(yīng)用較多[15-16]。但以小班數(shù)據(jù)為基礎(chǔ),采用多種決策樹(shù)為基礎(chǔ)學(xué)習(xí)器的集成學(xué)習(xí)方法對(duì)考慮立地條件和密度因子的桉樹(shù)(EucalyptusrobustaSmith)人工林進(jìn)行蓄積預(yù)測(cè)的研究比較欠缺。本研究以廣西國(guó)有高峰林場(chǎng)速生桉為研究對(duì)象,構(gòu)建多種以決策樹(shù)為基礎(chǔ)結(jié)構(gòu)器的非集成、集成學(xué)習(xí)模型,結(jié)合年齡、立地條件、密度因素研究蓄積預(yù)估。為采用蓄積預(yù)估模型作為生產(chǎn)力判斷的泛化研究進(jìn)行一定探索,并結(jié)合具體研究地區(qū)為林場(chǎng)速生桉的造林決策提供支持。

        1 材料與方法

        1.1 研究區(qū)概況

        研究地點(diǎn)為廣西壯族自治區(qū)國(guó)營(yíng)高峰林場(chǎng),該林場(chǎng)為廣西最大國(guó)有林場(chǎng),位于22°49′N(xiāo)~23°15′N(xiāo),108°08′E~108°53′E,屬南亞熱帶氣候,夏長(zhǎng)冬短,光熱充足,雨量充沛,年平均氣溫在21 ℃左右,極端最高溫40 ℃,最低溫-2 ℃,積溫為7 500 ℃左右,年降雨量為1 200~1 500 mm,多集中在每年6—9月[17-18]。地貌主要由山丘和丘陵構(gòu)成。海拔為150~400 m,坡度為20~30°。土壤以赤紅壤為主,質(zhì)地為中壤土或輕粘土。森林植被主要有桉樹(shù)、馬尾松(PinusmassonianaLamb)、杉木(CunninghamialanceolataHook)等樹(shù)種,其中桉樹(shù)類(lèi)全部為速生桉樹(shù)種,主要包括尾葉桉(EucalyptusurophyllaS.T.Blake)、巨尾桉(Eucalyptusgrandis×urophylla)、尾巨桉(Eucalyptusurophylla×E.grandis)。

        1.2 研究數(shù)據(jù)

        本研究以廣西壯族自治區(qū)桉樹(shù)人工林為研究對(duì)象,選擇2008年高峰林場(chǎng)森林資源規(guī)劃設(shè)計(jì)調(diào)查(簡(jiǎn)稱(chēng)二類(lèi)調(diào)查)中優(yōu)勢(shì)樹(shù)種為桉樹(shù)的3 500個(gè)小班以及2010年廣西國(guó)家森林資源連續(xù)清查(簡(jiǎn)稱(chēng)一類(lèi)清查)的200個(gè)桉樹(shù)固定樣地兩個(gè)數(shù)據(jù)源作為研究數(shù)據(jù)。參照《森林資源規(guī)劃設(shè)計(jì)調(diào)查技術(shù)規(guī)程》[19]與《森林資源數(shù)據(jù)采集技術(shù)規(guī)范》[20]確定二類(lèi)調(diào)查、一類(lèi)清查各因子。提取小班和固定樣地?cái)?shù)據(jù)中共有的立地因子(海拔高度、坡向、坡位、坡度、枯枝落葉厚度、腐殖質(zhì)層厚度、土壤種類(lèi))和林分因子(林齡、公頃蓄積、公頃株數(shù)、平均胸徑、平均樹(shù)高)進(jìn)行整理,其中二類(lèi)調(diào)查數(shù)據(jù)用作模型訓(xùn)練與驗(yàn)證,一類(lèi)清查數(shù)據(jù)用作模型泛化測(cè)試。用于此建模數(shù)據(jù)的因子統(tǒng)計(jì)量見(jiàn)表1與表2。

        表1 建模數(shù)據(jù)林分因子統(tǒng)計(jì)

        表2 建模數(shù)據(jù)立地因子統(tǒng)計(jì)

        1.3 模型構(gòu)建

        集成學(xué)習(xí)主要分為并行與串行兩種,本文選擇決策樹(shù)集成學(xué)習(xí)構(gòu)建2種并行算法(Bagging和隨機(jī)森林)和2種串行算法(梯度提升決策樹(shù)和XGboost)來(lái)構(gòu)建桉樹(shù)小班蓄積模型。Bagging(bootstrap aggregating)算法[21]采用隨機(jī)有放回的選擇訓(xùn)練數(shù)據(jù)。隨機(jī)森林[22]在以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入了隨機(jī)屬性(如小班數(shù)據(jù)中坡度、土壤厚度等字段)選擇。相比Bagging,隨機(jī)森林在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個(gè)包含m個(gè)屬性的集合。隨機(jī)森林的基學(xué)習(xí)器,分別采用CART模型與Ctree模型。梯度提升決策樹(shù)GBDT(gradient boosting decision tree)算法[23]基于回歸樹(shù)模型,采用迭代的方法最小化損失函數(shù),進(jìn)而得到最優(yōu)解。GBDT中每一棵回歸樹(shù)結(jié)點(diǎn)劃分都是基于之前多個(gè)回歸樹(shù)的預(yù)測(cè)結(jié)果、采用梯度迭代法訓(xùn)練新弱分類(lèi)器,使得新回歸樹(shù)的預(yù)測(cè)結(jié)果與實(shí)際值之間的損失函數(shù)達(dá)到最小。回歸問(wèn)題損失函數(shù)設(shè)定為均方差函數(shù),其梯度結(jié)果與殘差公式一致?;貧w樹(shù)劃分節(jié)點(diǎn)后樣本的取值采用平均值法。XGboost[24]方法作為GBDT的改進(jìn),基于梯度提升部分目標(biāo)函數(shù)為損失函數(shù)加正則項(xiàng),損失函數(shù)為訓(xùn)練誤差,正則項(xiàng)為訓(xùn)練樹(shù)復(fù)雜度,通過(guò)正則項(xiàng)控制模型復(fù)雜程度,模型更為精準(zhǔn)。

        模型構(gòu)建分為數(shù)據(jù)清洗與預(yù)處理、特征選擇與數(shù)據(jù)集劃分和訓(xùn)練模型構(gòu)建與調(diào)優(yōu)三步,具體流程如圖1所示。采用統(tǒng)計(jì)軟件R 3.5.4調(diào)用相關(guān)包進(jìn)行模型訓(xùn)練、驗(yàn)證與結(jié)果分析。

        圖1 模型構(gòu)建流程

        Step1:數(shù)據(jù)清洗與預(yù)處理。數(shù)據(jù)預(yù)處理按順序包括干擾數(shù)據(jù)清除、定性因子量化處理與數(shù)據(jù)標(biāo)準(zhǔn)化處理。廣西壯族自治區(qū)速生桉樹(shù)的輪伐期為5~6 a,因此,首先剔除數(shù)據(jù)中樹(shù)木平均年齡大于 6 a 的數(shù)據(jù),然后將土壤種類(lèi)、坡位、坡向定性因子啞變量化[25]轉(zhuǎn)化為定量因子,最后,由于min-max標(biāo)準(zhǔn)化會(huì)受極端值影響,對(duì)數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化處理,以消除量綱帶來(lái)的影響。

        Step2:特征選擇與數(shù)據(jù)集劃分。林分生長(zhǎng)的主要影響因子包括立地質(zhì)量、林分平均年齡、林分密度,因此選擇2個(gè)林分因子(年齡和公頃株數(shù),表1)和8個(gè)立地因子(表2)作為輸入變量,公頃蓄積量為輸出變量。數(shù)據(jù)集劃分方式為70%訓(xùn)練數(shù)據(jù)集,30%測(cè)試數(shù)據(jù)集,對(duì)于驗(yàn)證數(shù)據(jù)集部分,不單獨(dú)劃分,而是統(tǒng)一采用十折交叉驗(yàn)證的方法3次重復(fù)進(jìn)行模型驗(yàn)證。

        Step3:參數(shù)單值預(yù)訓(xùn)練、參數(shù)全范圍模型訓(xùn)練與調(diào)優(yōu)。采用任一訓(xùn)練模型,初步選擇參數(shù)取值范圍中間值作為參數(shù)進(jìn)行模型預(yù)訓(xùn)練,將其結(jié)果做理論性可用性驗(yàn)證。在理論可行性驗(yàn)證成功基礎(chǔ)上進(jìn)行參數(shù)全范圍訓(xùn)練模型構(gòu)建與調(diào)優(yōu),選擇非集成與集成兩種方式共9種模型,調(diào)用caret軟件包的train函數(shù)進(jìn)行模型訓(xùn)練。模型構(gòu)建過(guò)程三個(gè)方面核心參數(shù)、參數(shù)訓(xùn)練范圍見(jiàn)表3。

        表3 模型構(gòu)建與調(diào)優(yōu)參數(shù)統(tǒng)計(jì)表

        Step4:模型泛化預(yù)估測(cè)試。選擇Step3對(duì)比結(jié)果最優(yōu)模型,以2015年廣西壯族自治區(qū)部分一類(lèi)清查桉樹(shù)數(shù)據(jù)進(jìn)行泛化測(cè)試,判斷其對(duì)廣西所有地區(qū)桉樹(shù)蓄積預(yù)估是否具有泛化性。對(duì)于訓(xùn)練好的最優(yōu)模型,首先用R語(yǔ)言封裝模型成為函數(shù),之后使利用Java語(yǔ)言構(gòu)建工程,輸入一類(lèi)清查數(shù)據(jù)文件,選擇Step2中特征選擇的10個(gè)自變量,使用Rserve模式調(diào)用并執(zhí)行模型程序包文件,計(jì)算樣地蓄積預(yù)測(cè)值[7],與觀測(cè)值進(jìn)行線性回歸分析計(jì)算R2與P值,其結(jié)果作為泛化測(cè)試結(jié)果。

        1.4 理論性可用性驗(yàn)證

        蓄積預(yù)估屬于生長(zhǎng)收獲模型,變化應(yīng)符合生物S型生長(zhǎng)曲線規(guī)律。隨機(jī)選擇一個(gè)小班,采用單變量法固定1.3 Step2中8個(gè)立地因子以及公頃株數(shù),以時(shí)間為自變量,蓄積預(yù)估量為因變量,以1.3 Step3預(yù)訓(xùn)練模型作生長(zhǎng)曲線圖,評(píng)價(jià)模型是否符合樹(shù)木生長(zhǎng)規(guī)律,進(jìn)而判斷模型的理論可用性。若理論可用性通過(guò),進(jìn)入?yún)?shù)全范圍的模型訓(xùn)練與調(diào)優(yōu)、模型評(píng)價(jià)階段。若理論可用性不通過(guò),回到數(shù)據(jù)預(yù)處理部分對(duì)針對(duì)業(yè)務(wù)問(wèn)題對(duì)數(shù)據(jù)再處理。

        1.5 模型評(píng)價(jià)

        對(duì)于數(shù)字評(píng)價(jià),交叉驗(yàn)證模型評(píng)價(jià)方法采用3個(gè)指標(biāo)進(jìn)行評(píng)價(jià)和檢驗(yàn),分別是決定系數(shù)(R2)、均方根誤差(RMSE)以及平均絕對(duì)偏差(MAE)。

        R2越接近1表示模型擬合效果越好,MAE與RMSE相對(duì)越低表示模型誤差越小。對(duì)于模型訓(xùn)練集效果,選擇R2與RMSE,對(duì)于模型測(cè)試集效果選擇RMSE與MAE。

        2 結(jié)果與分析

        2.1 理論可用性分析

        預(yù)訓(xùn)練和修正訓(xùn)練結(jié)果得到圖2所示。發(fā)現(xiàn)第5 a蓄積量相較第4 a增長(zhǎng)量較小,整體不符合S型生長(zhǎng)曲線,因此返回?cái)?shù)據(jù)預(yù)處理階段進(jìn)行數(shù)據(jù)再處理。分析原因,該地區(qū)桉樹(shù)主伐年齡為 5 a,在二類(lèi)調(diào)查時(shí)對(duì)n<年齡

        圖2 理論可用性預(yù)訓(xùn)練與修正訓(xùn)練結(jié)果

        2.2 模型結(jié)果與對(duì)比分析

        表4與表5分別顯示9個(gè)模型以最優(yōu)R2為標(biāo)準(zhǔn)的最優(yōu)參數(shù)組合以及模型在訓(xùn)練集與測(cè)試集中的相關(guān)精度指標(biāo)。

        表4 模型訓(xùn)練最優(yōu)參數(shù)組合

        由表5結(jié)果可知,相同方法、不同基學(xué)習(xí)器的模型訓(xùn)練結(jié)果不同。其中單棵樹(shù)模型Ctree基學(xué)習(xí)器相比CART基學(xué)習(xí)器在訓(xùn)練集上的R2與RMSE幾乎相同,但是在測(cè)試集上Ctree基學(xué)習(xí)器的R2與RMSE明顯降低。無(wú)論訓(xùn)練集還是測(cè)試集,并行集成學(xué)習(xí)模型R2與RMSE均明顯低于采用CART基學(xué)習(xí)器模型;而在隨機(jī)森林方法中實(shí)驗(yàn)結(jié)果出現(xiàn)反轉(zhuǎn),即CART基學(xué)習(xí)器模型各指標(biāo)在訓(xùn)練集與非測(cè)試集結(jié)果均好于Ctree基學(xué)習(xí)器模型,并且模型整體精度與誤差數(shù)字均為相對(duì)最低,模型整體效果為前六種中相對(duì)最優(yōu)。

        表5 模型訓(xùn)練與測(cè)試結(jié)果

        非集成學(xué)習(xí)與集成學(xué)習(xí)的模型評(píng)價(jià)量化指標(biāo)明顯不同,集成學(xué)習(xí)模型整體優(yōu)于非集成模型。無(wú)論訓(xùn)練集還是測(cè)試集,并行集成學(xué)習(xí)中采用相同基學(xué)習(xí)器的隨機(jī)森林模型相關(guān)指標(biāo)優(yōu)于一般并行Bagging方法。串行集成學(xué)習(xí)方法中模型評(píng)價(jià)指標(biāo)R2與RMSE最優(yōu)的依次為XGboost模型、增強(qiáng)回歸樹(shù)模型。對(duì)于串行與并行兩種集成學(xué)習(xí)方式,同時(shí)選擇CART作為基學(xué)習(xí)器,結(jié)合模型評(píng)價(jià)指標(biāo),模型訓(xùn)練集結(jié)果由好到壞依次為XGboost、隨機(jī)森林、增強(qiáng)回歸樹(shù)與Cubist,模型測(cè)試集結(jié)果由好到次依次為XGboost、隨機(jī)森林、Cubist與增強(qiáng)回歸樹(shù)。

        2.3 模型變量重要性評(píng)估與解釋

        2.3.1變量重要性評(píng)估 選擇非集成決策樹(shù)類(lèi)、并行集成類(lèi)以及串行集成類(lèi)中效果最優(yōu)的CART的單棵決策樹(shù)、隨機(jī)森林以及XGboost三種模型,計(jì)算得到各自變量相對(duì)于因變量每公頃蓄積的影響重要性。由圖3可知,對(duì)于立地、樹(shù)木以及密度三類(lèi)自變量因子,三種模型的自變量重要性排名幾乎一致,特別是前5名重要性自變量三個(gè)模型相同,說(shuō)明重要的幾個(gè)變量對(duì)于蓄積預(yù)估的影響程度不會(huì)因模型不同而改變,只是在貢獻(xiàn)度次序上有相對(duì)的改變。對(duì)于各自變量重要性排名,占比最高的為樹(shù)木因子中的年齡,其對(duì)于因變量重要性顯著高于其他因子,三種模型分別為達(dá)到86.5%、83.5%、78.0%。其次對(duì)于因變量存在影響的三個(gè)自變量在CART、隨機(jī)森林以及XGboost模型中的重要性數(shù)值排序分別為:土層厚度(3.0%)、腐殖質(zhì)層厚度(2.9%)、海拔(2.4%);土層厚度(4.5%)、密度(3.0%)、海拔(2.4%);海拔(4.9%)、土層厚度(3.8%)、密度(3.2%)。而坡向、坡位、坡度、土壤種類(lèi)等因素重要性在三個(gè)模型中占比都低于1%,影響極小。

        注:圖中編號(hào)1~10分別為海拔(m)、坡向、坡位、坡度(°)、枯枝落葉厚度(cm)、腐殖質(zhì)層厚度(cm)、土層厚度(cm)、土壤種類(lèi)、年齡(a)、密度(hm-2)。

        2.3.2模型解釋 相比于其他機(jī)器學(xué)習(xí)模型,決策樹(shù)具有一定的模型可解釋性,從而根據(jù)其樹(shù)杈分支的決策過(guò)程可以從中探究各自變量屬性在蓄積預(yù)估模型的劃分順序與劃分節(jié)點(diǎn)數(shù)字,從而對(duì)機(jī)器學(xué)習(xí)方法應(yīng)用于蓄積預(yù)估提供更好的解釋性。單棵樹(shù)模型相比集成學(xué)習(xí)方法,從實(shí)驗(yàn)工程的角度可以還原決策的屬性劃分過(guò)程,具有更好的模型解釋性。屬性劃分為五級(jí),第一、二級(jí)為年齡,第三級(jí)為土層厚度與枯枝落葉厚度,第四級(jí)為密度與海拔,層級(jí)越小劃分屬性影響越大。年齡值、土層與枯枝落葉厚度、密度與海拔值越大,蓄積越大。

        2.4 模型泛化預(yù)估

        模型調(diào)用結(jié)果如表6所示。由表6可知,桉樹(shù)在1~6 a蓄積平均值持續(xù)增長(zhǎng),且從第3 a開(kāi)始蓄積增長(zhǎng)值明顯擴(kuò)大,但是相對(duì)應(yīng)標(biāo)準(zhǔn)差也顯著地提升。殘差整體殘差分布較為均勻,不存在異方差情況(圖4)。模型經(jīng)檢驗(yàn)后調(diào)整后R2為0.785,P值為2.2e-16,符合檢驗(yàn)標(biāo)準(zhǔn)(圖5)。

        表6 蓄積預(yù)估結(jié)果

        圖4 XGboost模型在泛化測(cè)試數(shù)據(jù)集上殘差圖

        圖5 XGboost模型在泛化測(cè)試數(shù)據(jù)集上值的散點(diǎn)圖

        3 討論

        本研究選擇二類(lèi)調(diào)查數(shù)據(jù)用作模型擬合與驗(yàn)證,選擇一類(lèi)清查數(shù)據(jù)用作模型泛化。二類(lèi)調(diào)查數(shù)據(jù)特點(diǎn)是數(shù)據(jù)量大,研究范圍相對(duì)集中,可以滿足該地區(qū)決策樹(shù)集成學(xué)習(xí)等機(jī)器學(xué)習(xí)模型對(duì)于數(shù)據(jù)訓(xùn)練量的基本要求,并且較多訓(xùn)練數(shù)據(jù)量可以在一定程度上增加模型擬合精度。泛化測(cè)試即模型對(duì)于未知數(shù)據(jù)預(yù)測(cè)的相對(duì)準(zhǔn)確性,兩個(gè)核心要求體現(xiàn)在待測(cè)試的未知數(shù)據(jù)不同于訓(xùn)練數(shù)據(jù)集所屬地區(qū)以防止過(guò)擬合以及未知數(shù)據(jù)精度有一定保證從而可以反饋泛化測(cè)試結(jié)果。一類(lèi)清查數(shù)據(jù)精度相對(duì)較高、調(diào)查范圍大而分散的兩個(gè)特點(diǎn)符合模型泛化測(cè)試核心要求。

        對(duì)于模型判定數(shù)字指標(biāo),基于二調(diào)數(shù)據(jù),XGboost在森林蓄積預(yù)估問(wèn)題上有著最優(yōu)的模型效果,R2超過(guò)0.8,同比陳玉玲等[7]采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行華北落葉松蓄積預(yù)估精度有一定的提高。模型泛化應(yīng)用結(jié)果R2為0.785,P值小于0.000 1,符合檢驗(yàn),說(shuō)明該模型精度達(dá)到應(yīng)用水平。本研究以海拔、坡向、坡位、坡度以及土壤相關(guān)等立地屬性來(lái)作為立地因素,以每公頃種植株數(shù)作為密度因素。林卓等[13]、王少杰等[5]分別使用斷面積、計(jì)算密度指數(shù)作為密度因素。僅考慮變量獨(dú)立性以及與其他自變量較小的交互性,株數(shù)相對(duì)更合適。受年齡影響的林分因子是否可以作為自變量引入模型仍有待討論,李宗俊[26]認(rèn)為可以先預(yù)估林分因子再代入模型進(jìn)行二次訓(xùn)練的方法也是參考選項(xiàng)但可能面臨自變量多重共線性等問(wèn)題。

        決策樹(shù)模型相比神經(jīng)網(wǎng)絡(luò)可以避免潛在的數(shù)據(jù)的過(guò)度擬合等特點(diǎn)[7]。集成學(xué)習(xí)方法精度顯著高于非集成方法,原因在于單一的決策樹(shù)模型具有一些不足,如模型的不穩(wěn)定性(數(shù)據(jù)中微小的變動(dòng)可能會(huì)引起樹(shù)的巨大變化,從而影響解釋性)、次優(yōu)的預(yù)測(cè)能力等[27]。作為基學(xué)習(xí)器的模型,在集成學(xué)習(xí)方法上CART效果好,非集成學(xué)習(xí)上條件推斷樹(shù)更好。采用串行集成學(xué)習(xí)方法普遍好于一般并行集成學(xué)習(xí),但是若并行集成考慮到隨機(jī)性而采用隨機(jī)森林的方式則與串行集成學(xué)習(xí)差異不明顯,該結(jié)果與Fernández-Delgado等[28]關(guān)于回歸問(wèn)題采用的多種機(jī)器學(xué)習(xí)方法對(duì)比研究結(jié)果一致,原因是相比于條件推斷樹(shù)對(duì)于切分結(jié)果偏度的糾正,隨機(jī)森林在切分屬性的選擇上的隨機(jī)性改變更有效的減小了誤差,說(shuō)明基于屬性劃分的選擇對(duì)于誤差的影響效果要大于切分后切分值的偏度修改。模型參數(shù)訓(xùn)練范圍與歐強(qiáng)新[19]的研究類(lèi)似,但是最優(yōu)參數(shù)組合存在明顯不同,說(shuō)明因變量、自變量屬性的不同會(huì)影響同類(lèi)模型的訓(xùn)練情況。對(duì)于集成學(xué)習(xí),本研究探討了并行與串行兩種方式,后續(xù)可以采用混合集成方式進(jìn)一步研究。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢(qián)方法
        中文字幕人成乱码熟女| 国产精品亚洲美女av网站| 亚洲av性色精品国产| 成人自拍小视频在线看| 国产果冻豆传媒麻婆精东| 狼色精品人妻在线视频| 美女爽好多水快进来视频| 亚洲av中文字字幕乱码软件| 精品无码国产一区二区三区麻豆| 国产精品免费看久久久8| 中文字幕经典一区| 给我播放的视频在线观看| 免费久久99精品国产| 男女啪啪无遮挡免费网站| 传媒在线无码| 少妇人妻在线伊人春色| 午夜视频在线瓜伦| 亚洲欧洲∨国产一区二区三区| 丁香婷婷色| 人妻av在线一区二区三区| 国产亚洲综合一区二区三区| 国产女人精品一区二区三区| 美女扒开屁股让男人桶| 亚洲精品综合一区二区三| 99久久精品国产自在首页| 三级国产自拍在线观看| 性饥渴的农村熟妇| 久久精品国产亚洲av电影| 日韩有码中文字幕第一页| 日韩精品一区二区三区在线视频| 无码av中文一区二区三区桃花岛| 2019最新国产不卡a| 亚洲色拍拍噜噜噜最新网站| 国产精品一区二区三区四区亚洲| 一本大道无码人妻精品专区| 国产精品无需播放器| 色综合久久精品中文字幕| 亚洲一区二区日韩精品| 国产av无码国产av毛片| 在线观看免费午夜大片| 久久中国国产Av秘 入口|