亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        依據機器學習算法的杉木干形模擬1)

        2021-12-03 07:13:32梁瑞婷周來謝運鴻丁志丹孫玉軍
        東北林業(yè)大學學報 2021年10期
        關鍵詞:人工神經網絡樹干殘差

        梁瑞婷 周來 謝運鴻 丁志丹 孫玉軍

        (森林資源和環(huán)境管理國家林業(yè)和草原局重點開放性實驗室(北京林業(yè)大學),北京,100083)

        林木干形是描述樹干不同高度處的截面直徑隨樹干縱向位置的變化,是研究林木最重要的因子之一,它既與樹干的出材量有關,又影響木材的質量[1]。通過削度模型可以精確估算單株林木的樹干材積,對重建樹干輪廓、估算林分蓄積和森林碳儲量、評價森林經營水平和森林規(guī)劃設計等方面具有重要意義[2]。確定干形,解析木截段測量是最精確的方法,但需要耗費大量人力、物力,而且破壞性大,因此,一般采用削度方程。削度方程即是利用樹木胸徑、樹高、截面高等易測量的林木特征因子作為自變量預測截面直徑的回歸方程[3]。盡管過去已有多種統計學方法建立林木的削度方程,如:線性與非線性回歸[4]、分位數回歸[5-6]和混合效應模型[7]等,但這些方法在應用時對數據分布有很強的要求,需要滿足一定的統計學假設前提,如數據的獨立、正態(tài)、等方差等[8]。而林木生長是由多個因素交互作用、共同影響[9],其數據通常難以滿足這些假設條件,需要探索新的建模方法作為補充。

        機器學習是新近興起的一門涉及多領域的交叉學科,作為一種數據驅動的算法,機器學習能夠自動從數據中分析規(guī)律,并應用于新的樣本,非常適合處理復雜的非線性問題[10-11]。與傳統回歸相比,機器學習對數據分布沒有要求,能高效處理變量之間非正態(tài)、非線性和共線性關系[12]。而且機器學習可以通過一定措施改進模型,進一步提高模型精度,如增加訓練集數據、調整學習參數或改變模型結構。近年來,機器學習逐漸開始應用于林學領域的研究,如:Martins Silva J P et al.[13]利用機器學習和混合模型估算了巴西大草原上單株林木的材積和生物量,Kilham P et al.[14]利用隨機森林估測了德國西南部多種森林類型的林分蓄積,Ozcelik R et al.[15]人利用人工神經網絡和非線性回歸建立了紅松樹高曲線模型[16]。這些研究都取得了良好的結果,表明機器學習在森林生長收獲和森林資源監(jiān)測方面具有很大的應用潛力,也為研究林木干形提供了一種新思路。國外有學者展開相關研究,如Nunes et al.[16]采用隨機森林和人工神經網絡對巴西復雜雨林內多種林木的干形進行估測,發(fā)現人工神經網絡的精度高于傳統削度方程。Sanquetta et al.[17]采用K-近鄰法和人工神經網絡對巴西地區(qū)柳杉的干形進行模擬,發(fā)現最近鄰法能夠提高干形估測的精度,是一種簡單明了的估測方法。Schikowski et al.[18]應用3種機器學習算法對黑松的樹干削度和材積建立模型,表明機器學習一種估測森林參數可行的方法。迄今為止,國內應用機器學習對林木干形模擬的研究較少。

        本文以福建將樂國有林場的杉木(Cunninghamialanceolata)為研究對象,利用最近鄰算法、隨機森林和人工神經網絡3種機器學習模擬其干形,估測樹干不同高度處對應的直徑,并與傳統削度模型進行比較。通過4個模型評價指標,結合殘差圖和相對偏差圖進行排序,以得到高效、低偏的干形估計方法,為杉木干形的精確估測提供參考。

        1 研究區(qū)概況

        本研究的解析木數據來源于福建省三明市將樂縣(117°5′~117°40′E,26°26′~27°4′N)的將樂國有林場,該地區(qū)的年均氣溫20°左右,年均降水量約2 700 mm,氣候溫暖濕潤,雨熱同期,以中、低山為主,海拔多在400~800 m范圍內,土壤肥沃深厚。主要樹種有馬尾松(PinusmassonianaLamb.)、毛竹(Phyllostachysheterocycla(Carr.) Mitford cv.Pubescens)等。

        2 材料與方法

        選擇不同齡組且有充分代表性的杉木人工純林,并在林分內設置標準地(標準地面積為20 m×20 m或20 m×30 m),共29塊。根據每木檢尺的結果計算林分的平均胸徑和平均樹高,并選取生長健康的平均木,盡量使樣木均勻分布于各個徑階,共得46株杉木解析木。伐倒前測量樹高(H)和胸徑(D)。伐倒后按1 m區(qū)分段截取圓盤,不足1 m的區(qū)分段作為梢頭。同時,在樹干基部和胸徑1.3 m處也分別截取圓盤。然后測量每個圓盤東西、南北兩個方向的直徑,計算其平均值作為對應高度處的直徑。共計獲得793組數據,解析木的數據統計見表1。

        表1 杉木調查因子統計

        2.1 應用非線性回歸的杉木削度方程

        本研究從前人對杉木干形的研究成果中,選取了精度最高的削度模型[3-4],該模型由曾偉生提出,其具體表達見公式(1),方程的參數通過非線性最小二乘法確定,利用R4.00的nls()函數擬合求得。

        (1)

        式中:a1、a2、a3和a4為模型參數,D、H、di、hi分別表示胸徑、樹高、樹干直徑和樹干距離地面的高度。

        2.2 機器學習算法

        本研究采用的3種機器學習算法都是利用R4.0.0軟件,為了避免單一測試集的偶然性和隨機性,采用十折交叉驗證,即把所有數據10等分,每次用9/10的數據作為訓練樣本,剩余1/10作為驗證樣本。這樣重復10次,每次采用不同的訓練樣本和檢驗樣本,最后以10次結果的平均值為評價標準。

        randomForest包實現隨機森林算法,隨機森林算法的精度通常與“樹”的個數有關,盡管設置的樣本(樹)數量越多,結果越穩(wěn)定[19],樣本(樹)的設置需要依據具體的研究數據而定,默認的樣本量為500,一般而言,樣本(樹)在500以后誤差趨于穩(wěn)定[20-21],但是考慮本研究的數據量較少,取100≤樣本(樹)≤500以50為間隔進行參數調優(yōu),最終確定樣本(樹)為300,以往的采用隨機森林研究樹干削度也采用樣本(樹)=300,模型表現最好[17]。根據周志華建議[19],枝(mtry)設置為輸入變量數目的1/3左右,參考前人研究[22],枝(mtry)分別取1、2和3,結果表明不同的枝(mtry),模型擬合精度沒有明顯差異。

        網絡包實現人工神經網絡,在學習過程中,通常采用人工神經網絡建模時為了防止過擬合,一般都將權值衰減參數(decay參數)設為0.001,最大迭代次數(maxit)設為1 000次,如果達到目標,就會提前終止迭代[19,23],隱蔽單元個數則是(size參數)設置為15[18]。訓練過程如圖1所示,由輸入層,2個隱藏層和一個輸出層組成,上一層的輸出通過權重轉化后作為下一層的輸入,不斷迭代,通過梯度下降法尋找最小誤差平方和。輸入因子為樹高(H)、胸徑(D)和不同高度(hi),輸出因子為沿樹干不同高度處對應的直徑(di)。

        圖1 ANN模型的結構圖

        2.3 模型評價指標

        模型的評價包括擬合精度和擬合優(yōu)度兩方面,本研究采用決定系數(R2)、均方根誤差(ERMS)、平均誤差(EM)和平均絕對相對誤差(EMA)4個模型評價指標,依據十折交叉驗證,各指標的平均值來進行模型評價,具體計算公式如下:

        (2)

        (3)

        (4)

        (5)

        3 結果與分析

        為了比較3種機器學習算法和傳統削度模型對杉木干形的擬合能力,采用評分法對模型進行排名[19],指標最優(yōu)的模型得分最高,最后每個模型把所有指標的得分相加就是該模型的最終得分,結果見表2。各模型排名為人工神經網絡、最近鄰法、傳統削度模型、隨機森林,4個模型的R2在0.97~0.99,ERMS在1左右。最近鄰法與人工神經網絡的表現優(yōu)于其他模型,其R2均是0.99,其余指標也都較小。人工神經網絡模型的EM最小,但其EMA比最近鄰法的高了65.3%。最近鄰法是以K個最鄰近的目標的平均值作為參考,因此,最近鄰法生成的不是擬合曲線,而是類似實際數據分布的散亂的點云圖,所以與平均回歸相比,其誤差往往更小。

        表2 基于非線性回歸與機器學習算法的擬合結果(訓練集)

        為了檢驗各模型的泛化預測能力,利用不參與模型構建的檢驗集對模型進行獨立性檢驗(表3),模型在檢驗集上的表現略差于訓練集,各模型的R2都有減小,但減小幅度很小,這與前人的結論一致[19]。人工神經網絡模型的變化最小,說明人工神經網絡模型的泛化預測能力更好,穩(wěn)定性更強。人工神經網絡模型的R2最大,為0.98,其ERMS、EM和EMA均是各模型間最小。最近鄰法模型的EM比傳統削度模型大0.046,但其EMA與ERMS分別比傳統削度模型小了16.52%和2.53%。由于傳統削度方程是采用平滑的數學函數描述干形輪廓,而人工神經網絡與最近鄰法算法直接受數據驅動,從數據中尋找規(guī)律,能最大限度逼近復雜的函數,所以精度一般會更高。

        表3 基于非線性回歸與機器學習算法的獨立性檢驗(檢驗集)

        各模型的殘差分布情況如圖2所示,整體來看,各個模型的殘差均勻分布在y=0直線的兩側,且都沒有出現極端殘差,殘差的波動范圍正常,檢驗集的殘差與訓練集的殘差分布非常接近,說明沒有出現過擬合,這一現象在機器學習過程中很容易出現,通過合理地調參可以有效避免[17]。最近鄰法與隨機森林的殘差散點圖趨勢表現相似,當di<2 cm時,殘差大都小于0,而當di>25 cm時,殘差都大于0。說明這兩個模型對樹干基部有預測偏小的趨勢,而對樹干上部,有預測偏大的趨勢。但很明顯最近鄰法的殘差很小,精度高于隨機森林。盡管人工神經網絡模型的擬合殘差表現不是最好,但它的預測殘差表現最優(yōu),有最好的預測泛化能力,這在實際應用中非常重要。

        圖2 不同模型的殘差圖

        各模型的相對偏差分布情況如圖3所示,可以看出,無論訓練集還是檢驗集,各個模型的相對偏差分布都呈現單峰趨勢,在x=0處為峰值,說明絕大多數預測的相對偏差都為0,或是非常接近0。最近鄰法模型的峰值相差最大,相差0.15,隨機森林模型的差值為0.10,說明這兩個模型穩(wěn)定性不好,能較好地描述已知數據,但不能準確地預測未知數據。人工神經網絡模型的訓練集和檢驗集的相對偏差分布幾乎重合,其峰值相差極小,模型的擬合結果和預測結果較理想。人工神經網絡模型由于具有大量的“神經元”,通過調整權重而不斷逼近[24],采用誤差反向傳播算法訓練的,能夠對任何類型的輸入盡可能映射到輸出。研究采用提前終止,沒有出現過擬合現象。

        圖3 相對偏差的密度圖

        各模型對干形的模擬精度隨著相對高度的變化而變化(表4),在相對高度為0.1~0.6時,各模型的EMA較小。說明削度模型對樹干中部的預測精度更高,對樹干基部的和樹干上部的直徑的預測誤差較大,這與前人結論一致[18],符合林木樹干的形態(tài)特征,樹干基部與上部的削度變化較大,而樹干中部類似圓柱體,更為規(guī)律。在相對高度≤0.1時,傳統削度模型對干形的模擬精度最高,而在相對高度為0.2~1.0時,人工神經網絡模型與最近鄰法模型對干形的模擬精度較高。說明不同模型對樹干不同部位的模擬效果不同,如果多個模型互為補充,配合使用,其預測精度會更高。人工神經網絡模型對樹干絕大部分的預測精度最高,可以較精確地模擬杉木干形,但對樹干基部的預測效果略差于傳統削度模型,若采用傳統削度模型作為補充可能會進一步提高預測精度。

        表4 各模型對不同樹干部位預測的平均絕對誤差(EMA)

        4 結論與討論

        傳統回歸在處理復雜的非線性問題時,尤其當變量個數較多、變量間關系復雜時,往往出現不收斂的情況[14,25-27]。樹木干形的影響因素很多,采用傳統的模型增加自變量會使模型結構復雜,實際應用不便。機器學習是一種能夠自主發(fā)現變量間的關系、給出模型結果的算法,而且可以處理有噪聲、缺失等低質量數據。

        本研究以我國重要的用材樹種的杉木為對象,引入機器學習,分別采用最近鄰法(KNN)、隨機森林(RF)和人工神經網絡(ANN)3種算法對干形進行模擬,同時構建了傳統非線性削度方程作為比較。結果表明:人工神經網絡模型是4個模型間表現最優(yōu)的,R2最大,殘差范圍和殘差密度范圍最小,對樹干絕大部分的干形模擬都較為精確,特別是其預測泛化能力,優(yōu)于其他模型,這與Schikowski et al.的對巴西草原的黑松干形的研究結果一致[18]。人工神經網絡模型之所以表現如此出色,是因為該算法能夠自動發(fā)掘“真實數據”之間的復雜關系,考慮變量之間的相互依賴性,這對傳統非線性回歸模型來說,是不容易實現的。其次表現較好的是最近鄰法模型,最近鄰法模型的擬合能力是4個模型間最好的,但是其預測能力不如人工神經網絡,在Sanquetta et al.利用最近鄰法模型估測材積時也發(fā)現這一特點[17]。最近鄰法模型與傳統回歸模型之間的誤差非常相近,甚至在某些情況下,最近鄰法的誤差更小。最近鄰法模型能夠通過若干鄰近值進行預測[20],不需要任何回歸擬合過程,具有簡單通用和較強的可塑性等優(yōu)點。隨機森林模型能夠有效處理生態(tài)領域的分類和回歸問題,具有很好的泛化能力和統計可靠性[22]。但本研究中,隨機森林對杉木不同高度處直徑的預測不高,尤其在檢驗集內,該模型有對較小直徑的預測偏小,對較大直徑的預測偏大的趨勢。這種特殊趨勢是基于回歸樹模型特有的,在其他的研究中也有類似發(fā)現[17]。隨機森林表現不如人工神經網絡,是內在算法不同導致,隨機森林的每個節(jié)點由平均值給出,可能會低估較低值而高估較高值。

        機器學習模型和傳統削度模型都表現出良好的擬合能力,訓練集的決定系數(R2)均高于0.97,均方根誤差(ERMS)在1 cm左右波動。盡管傳統回歸能夠滿足干形預測精度,但是在模型選型和參數估計上仍是比較復雜。此外,最近鄰法模型與人工神經網絡模型在沒有引入更多變量的前提下,擬合精度與預測精度均高于傳統削度模型,比傳統回歸能更精確地預測杉木沿樹干不同高度處的直徑,最近鄰法與人工神經網絡更適合模擬杉木干形,具有更好的適用性。未來的研究可以基于機器學習算法研究其他森林參數,擴展其應用范圍,以提高森林參數的估測精度。

        猜你喜歡
        人工神經網絡樹干殘差
        基于雙向GRU與殘差擬合的車輛跟馳建模
        為什么樹干不是方的?
        軍事文摘(2021年16期)2021-11-05 08:49:16
        基于殘差學習的自適應無人機目標跟蹤算法
        利用人工神經網絡快速計算木星系磁坐標
        基于遞歸殘差網絡的圖像超分辨率重建
        自動化學報(2019年6期)2019-07-23 01:18:32
        人工神經網絡實現簡單字母的識別
        電子制作(2019年10期)2019-06-17 11:45:10
        為什么要在樹干上刷白漿
        為什么要在樹干上刷白漿
        為什么要在樹干上刷一層白漿
        平穩(wěn)自相關過程的殘差累積和控制圖
        河南科技(2015年8期)2015-03-11 16:23:52
        少妇愉情理伦片| 国产精品专区一区二区av免费看 | 免费人成在线观看播放视频| 国产大屁股喷水视频在线观看| 精品国产一区二区三区香蕉| 91呻吟丰满娇喘国产区| 极品少妇被后入内射视| 日本中文字幕婷婷在线| 国产精品乱码一区二区三区| 久久尤物AV天堂日日综合| 日本中文字幕一区二区在线观看| 国产伦一区二区三区色一情| 少妇私密会所按摩到高潮呻吟 | 亚洲Av无码专区尤物| 蜜臀av一区二区三区| 无码熟妇人妻av影音先锋| 亚洲男人第一av网站| 国产小车还是日产的好| 国内精品亚洲成av人片| 大肉大捧一进一出好爽视频| a观看v视频网站入口免费| 国产午夜视频在线观看| 亚洲国产成人精品无码区在线秒播 | 亚洲精品有码在线观看| 国产一区二区三区涩涩| 人妻夜夜爽天天爽三区丁香花| 7777奇米四色成人眼影| 国产精品无码久久久久久久久作品 | 国产欧美日韩视频一区二区三区 | 夜夜躁狠狠躁日日躁视频| 日日摸夜夜添狠狠添欧美| 淫欲一区二区中文字幕| 人成综合视频在线播放| 国精品无码一区二区三区在线| AV无码免费不卡在线观看| 中国亚洲av第一精品| 精品免费久久久久久久| 日日摸夜夜添夜夜添一区二区| 中文字幕视频一区二区| 免费乱理伦片在线观看| 国内精品久久久久久久久齐齐|