朱泊東 金京 羅洪斌 龍飛 李春干 岳彩榮
摘要: 森林高度是反映森林?jǐn)?shù)量和質(zhì)量的重要指標(biāo),是森林經(jīng)營管理的重要基礎(chǔ)數(shù)據(jù),準(zhǔn)確獲取森林高度信息一直是林業(yè)遙感研究的目標(biāo)。本研究以廣西高峰林場的105塊地面實(shí)測樣地?cái)?shù)據(jù)和機(jī)載激光雷達(dá)(Light detection and ranging, LiDAR)數(shù)據(jù)為基礎(chǔ),從點(diǎn)云數(shù)據(jù)中提取35個(gè)特征變量,分別采用支持向量機(jī)-遞歸特征消除法(SVM-RFE)、輕量級梯度提升機(jī)(LightGBM)和主成分分析(PCA)法進(jìn)行特征篩選,并結(jié)合參數(shù)模型(LR)和非參數(shù)模型(RFR、KNN)對林分平均高進(jìn)行反演。研究結(jié)果表明,不同特征選擇方法和估測模型的組合精度差異較大。其中,利用LightGBM進(jìn)行特征篩選結(jié)合KNN回歸反演效果最佳,建模的 R? 2 和 RMSE 分別為0.83和1.64 m,驗(yàn)證的 R? 2 和 RMSE 分別為0.81和1.56 m。此外,在SVM-RFE、LightGBM和PCA這3種特征篩選方法中LightGBM的效果最好,無論在RFR模型還是在KNN模型中均能得到較高的 R? 2 ,優(yōu)于SVM-RFE和PCA。
關(guān)鍵詞: 機(jī)載激光雷達(dá); 林分平均高; 特征優(yōu)選; LightGBM
中圖分類號: TP79?? 文獻(xiàn)標(biāo)識碼: A?? 文章編號: 1000-4440(2022)03-0706-08
Inversion of average forest stand height based on variable selection by airborne laser radar
ZHU Bo-dong 1 , JIN? Jing 1 , LUO Hong-bin 1 , LONG? Fei 1 , LI Chun-gan 2 , YUE Cai-rong 1
(1.College of Forestry, Southwest Forestry University, Kunming 650224, China; 2.College of Forestry, Guangxi University, Nanning 530004, China)
Abstract: Forest height is an important indicator of forest quantity and quality, and it is also an important essential parameter for forest management. Obtaining the height information of the forest accurately has always been the target of remote sensing study of the forestry. In this study, 35 characteristic variables were extracted from the point cloud data, based on the measured data from 105 sample ground plots and airborne light detection and ranging (LiDAR) data of Guangxi State-owned Gaofeng Forest Farm. Support vector machine-recursive feature elimination (SVM-RFE), light gradient boosting machine (LightGBM) and principal components analysis (PCA) were used to screen the characteristics, respectively. The average height of forest were inverted by combining parametric model (LR) and nonparametric models (RFR, KNN). The results showed that, there were large differences of accuracy between combinations of different feature selection methods and estimation models. Among them, the combination of LightGBM feature selection with KNN regression inversion showed the best effect. The ?R? 2 ?and root mean square error ( RMSE ) of modeling were 0.83 and 1.64 m, respectively, and the ?R? 2 ?and ?RMSE ?of verification were 0.81 and 1.56 m, respectively. In addition, among the three feature selection methods of SVM-RFE, LightGBM and PCA, LightGBM showed the best effect, which was high in ?R? 2 ?both in the RFR model and in the KNN model, and was better than SVM-RFE and PCA.
Key words: airborne laser radar; average forest stand height; feature selection; light gradient boosting machine (LightGBM)
林分平均高度是生態(tài)系統(tǒng)模型重要的輸入?yún)?shù)之一,是反映森林生長狀況、計(jì)算森林蓄積量和生物量的重要因子,與碳循環(huán)研究高度相關(guān) [1] 。森林樹高一直是森林調(diào)查中最難準(zhǔn)確獲取的因子之一。傳統(tǒng)森林資源調(diào)查主要是依靠人工地面調(diào)查,需要耗費(fèi)大量的人力物力財(cái)力,且部分區(qū)域地形復(fù)雜難以進(jìn)行精確的地面調(diào)查 [2-3] 。遙感技術(shù)的出現(xiàn),給森林資源調(diào)查提供了一種全新的技術(shù)手段 [4] 。而對于林分尺度和單木尺度的森林垂直結(jié)構(gòu)探測,激光雷達(dá)(Light detection and ranging, LiDAR)技術(shù)相較于其他遙感探測手段具有顯著優(yōu)勢 [5-6] 。
在用LiDAR估測林分高度的研究中,通常采用從LiDAR數(shù)據(jù)中提取的大量特征中選取部分或全部特征,并在此基礎(chǔ)上建立模型,估測林分平均高。穆喜云等 [7] 基于機(jī)載激光雷達(dá)數(shù)據(jù)與樣地?cái)?shù)據(jù),構(gòu)建不同樹種的林分平均高與郁閉度反演模型,結(jié)果表明,不同樹種模型的估測精度不同,混交林的林分平均高估測精度高于闊葉林和針葉林。彭濤等 [8] 分別設(shè)置圓形樣地和方形樣地,利用激光雷達(dá)特征變量中的高度分位數(shù)估測樟子松及落葉松的林分平均高,結(jié)果表明,利用累積高度百分位數(shù)中99%累積高度估測林分平均高時(shí)2種樣地結(jié)果均最優(yōu)。曾偉生等 [9] 研究發(fā)現(xiàn),基于機(jī)載激光雷達(dá)對林分平均高等森林參數(shù)進(jìn)行估測時(shí),非線性模型優(yōu)于線性模型。焦義濤等 [10] 基于激光點(diǎn)云數(shù)據(jù)計(jì)算植被點(diǎn)云高度閾值平均值,以此建立預(yù)測林分平均高的回歸模型,結(jié)果表明,利用點(diǎn)云高度閾值的平均值進(jìn)行林分平均高估測可靠性較高。趙勛等 [11] 利用隨機(jī)森林、支持向量機(jī)以及組合模型對林分平均高進(jìn)行估測,結(jié)果表明組合模型的泛化能力及預(yù)測精度最好。周蓉等 [12] 通過提取32個(gè)點(diǎn)云特征變量,并采用逐步回歸法和BP神經(jīng)網(wǎng)絡(luò)算法對針葉林進(jìn)行林分平均高估測,研究發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型估測精度較高,優(yōu)于逐步回歸法,其 R? 2 均在87%以上。沈劍波等 [13] 通過對比森林調(diào)查因子和不同神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法對平均樹高估測結(jié)果的影響,發(fā)現(xiàn)利用貝葉斯正則化 BP 神經(jīng)網(wǎng)絡(luò)能有效提升估測精度。Grace等 [14] 研究發(fā)現(xiàn),建模因子的增加并不意味著模型精度的提升,對建模因子進(jìn)行篩選有助于提升模型精度。曹林等 [15] 采用主成分分析法、逐步回歸法和貝葉斯模型平均法對建模因子進(jìn)行篩選,結(jié)果表明,逐步回歸法擬合模型效果最好。Paolo等 [16] 比較了不同特征篩選方法(遺傳算法特征篩選和隨機(jī)森林算法特征篩選)對森林參數(shù)估測的影響,結(jié)果表明,將遺傳算法(GAs)和赤池信息量準(zhǔn)則(AIC)組合進(jìn)行變量篩選是最有效的方法。郝紅科 [17] 從歸一化點(diǎn)云數(shù)據(jù)中提取43個(gè)點(diǎn)云變量,分別采用支持向量機(jī)回歸、快速人工神經(jīng)網(wǎng)絡(luò)以及逐步回歸建立林分平均高反演模型,研究結(jié)果表明,對建模變量進(jìn)行篩選能有效提升模型預(yù)測精度。
綜上所述,基于機(jī)載激光雷達(dá)的林分平均高反演中點(diǎn)云變量的特征篩選方法與估測模型的選擇是最終決定反演精度的2個(gè)技術(shù)環(huán)節(jié),針對不同的估測模型選擇適當(dāng)?shù)奶卣骱Y選方法有助于提高估測精度,但還需進(jìn)一步對估測模型與特征篩選方法的最優(yōu)組合進(jìn)行探討和分析。為此,本研究以廣西高峰林場為研究區(qū)域,利用支持向量機(jī)-遞歸特征消除法(SVM-RFE)、輕量級梯度提升機(jī)(LightGBM)和主成分分析(PCA)對35個(gè)點(diǎn)云特征變量進(jìn)行建模因子篩選的基礎(chǔ)上構(gòu)建基于逐步回歸、隨機(jī)森林和K近鄰法的林分平均高估測模型,對比基于不同特征篩選的模型估測結(jié)果,為提高機(jī)載激光雷達(dá)林分平均高的估測精度提供參考。
1 材料與方法
1.1 研究區(qū)概況
研究區(qū)位于廣西最大的國有林場——國營高峰林場,研究區(qū)為一個(gè)呈東北-西南走向的近矩形區(qū)域,長11.2 km,寬4.2 km,面積約為4 770 ?hm 2 ,中心地理位置為108°23′45″E,22°58′33″N [18] 。高峰林場屬于南亞熱帶季風(fēng)氣候區(qū),日照充足,雨量充沛,其地貌主要為丘陵和山地,地形起伏較大,坡度大多為20°~ 35°,最大坡度為69.7°。
研究區(qū)內(nèi)森林覆蓋率達(dá)90%以上,約95%為人工林,主要為短周期經(jīng)營的桉樹人工林和長周期經(jīng)營的杉木,主要樹種包括尾葉桉( Eucalyptus urohpylla ?S.T.Blake)、巨尾桉( Eucalyptus grandis×E. urohpylla )、杉木( Cunninghamia lanceolata ?)、馬尾松( Pinus massoniana ?Lamb.)、濕地松( Pinus elliottii ?Engelmann)、八角( Lllicium verum ?Hook. f.)等 [18] 。
1.2 地面樣地?cái)?shù)據(jù)
地面調(diào)查時(shí)間為2016年5月至12月,在研究區(qū)內(nèi)設(shè)置105個(gè)30 m× 30 m的地面實(shí)測樣地(包括51塊針葉林樣地和54塊闊葉林樣地),記錄胸徑大于5 cm的每株樹的樹種、胸徑、樹高、冠幅等。林分平均高利用斷面積加權(quán)法(公式1)進(jìn)行計(jì)算。樣地調(diào)查信息如表1所示。
H=ni=1higini=1gi (1)
式中, n 為林木株數(shù), hi? 表示第 i 株樹的樹高, gi? 表示第 i 株樹的胸高斷面積。
1.3 機(jī)載LiDAR數(shù)據(jù)
本研究以R44直升機(jī)為飛行平臺,搭載奧地利RIEGL公司生產(chǎn)的VUX1LR激光雷達(dá)系統(tǒng)獲取點(diǎn)云數(shù)據(jù),數(shù)據(jù)獲取時(shí)間為2016年9月。遙感平臺飛行高度為1 000 ?m,激光器的波長為1 550 ?nm,激光發(fā)射角為0.5 mrad,脈沖發(fā)射頻率為820 kHz,平均點(diǎn)云密度為2.9 pts/m 2? ,飛行覆蓋面積約為55 km 2 。該系統(tǒng)還搭載了3× 107像素的電荷耦合器件(CCD)相機(jī)以獲取該研究區(qū)的航空影像,影像的空間分辨率為0.2 m。
1.4 LiDAR數(shù)據(jù)預(yù)處理
對激光雷達(dá)點(diǎn)云數(shù)據(jù)進(jìn)行去噪后采用布料模擬濾波(Cloth simulation filter,CSF)法將點(diǎn)云數(shù)據(jù)分類為地面點(diǎn)和非地面點(diǎn),將地面點(diǎn)通過不規(guī)則三角網(wǎng)(Triangulated irregular network,TIN)插值生成空間分辨率為0.5 m的數(shù)字高程模型(Digital elevation models,DEM),以此生成歸一化點(diǎn)云數(shù)據(jù)。
1.5 特征變量提取
目前較多的研究者利用歸一化點(diǎn)云數(shù)據(jù)提取高度變量、密度變量和強(qiáng)度變量并將其用于森林參數(shù)估測。本研究共提取了35個(gè)特征變量,其中包括24個(gè)高度變量、10個(gè)密度變量和郁閉度,各點(diǎn)云特征變量描述如表2所示。
1.6 特征變量篩選
一個(gè)好的特征選擇技術(shù)可使機(jī)器學(xué)習(xí)集中在最重要的特征上,能有效提升運(yùn)算效率和模型精度,從而避免大量冗余特征的輸入對機(jī)器學(xué)習(xí)的性能和結(jié)果造成影響。本研究使用支持向量機(jī)-遞歸特征消除法、LightGBM算法以及主成分分析法對點(diǎn)云特征變量進(jìn)行篩選,研究不同特征篩選方法對林分平均高估測結(jié)果的影響。
1.6.1 支持向量機(jī)-遞歸特征消除法 支持向量機(jī)-遞歸特征消除法(Support vector machine-recursive feature elimination,SVM-RFE),利用SVM的最大間隔原理,先訓(xùn)練樣本再按特征貢獻(xiàn)進(jìn)行排序,每次迭代中去掉得分最低的特征,直至選出所需特征數(shù) [19] 。
1.6.2 LightGBM LightGBM(Light gradient boosting machine)是一種基于決策樹的快速、分布式、高性能的梯度下降樹(GBDT)框架,是GBDT算法的改進(jìn) [20] 。與GBDT算法相比,LightGBM算法具有訓(xùn)練效率更高、內(nèi)存占用率更低、準(zhǔn)確率更高、能夠處理大規(guī)模數(shù)據(jù)等優(yōu)點(diǎn)。
1.6.3 主成分分析法 主成分分析法(Principal component analysis,PCA)利用降維的思想通過正交變換將高維數(shù)據(jù)映射到低維空間中,在保留高維數(shù)據(jù)重要特征的同時(shí)又能去除不重要的特征或噪聲。
1.7 林分平均高估測模型的建立
1.7.1 隨機(jī)森林回歸算法 隨機(jī)森林回歸算法(Random forest regression,RFR)是由Breiman [21] 提出的,利用bootstrap方法生成 m 個(gè)訓(xùn)練集,然后對于每個(gè)訓(xùn)練集構(gòu)造一棵決策樹,并在特征中隨機(jī)抽取一部分特征作為最優(yōu)解,應(yīng)用于節(jié)點(diǎn)。選擇重要性累計(jì)貢獻(xiàn)率大于0.85的特征變量建模,并通過網(wǎng)格搜索法和十折交叉驗(yàn)證法確定決策樹的數(shù)量、最小特征數(shù)及最小葉子節(jié)點(diǎn)。
1.7.2 K近鄰回歸算法 K近鄰(K-nearest neighbor,KNN)算法常被用于大面積森林參數(shù)反演和制圖。KNN是通過測量不同樣本在特征空間中的距離來進(jìn)行分類的 [22] ?;舅悸肥牵涸谀骋粯颖镜奶卣骺臻g中如果有 K 個(gè)樣本與之相似,那么這些樣本大多數(shù)屬于同一個(gè)類別,則該樣本也屬于這個(gè)類別。本研究采用歐氏距離作為激勵(lì)度量方法。
1.7.3 線性回歸方程 通過逐步回歸法構(gòu)建線性回歸方程預(yù)測林分平均高,在回歸建模過程中,每一步引入的新變量都要進(jìn)行 F 檢驗(yàn)并達(dá)到顯著水平( P < 0.05)。
1.8 模型精度評價(jià)
采用決定系數(shù)( R 2)、均方根誤差( RMSE )和相對均方根誤差( rRMSE )作為指標(biāo)評價(jià)回歸模型的精度。 R 2、 RMSE ?和 rRMSE計(jì)算 方法分別見公式(2)、公式(3)和公式(4):
R2=1- ni=1(yi-yi ^)2ni=1(yi-yi —)2 (2)
RMSE=ni=1(yi-yi ^)2n (3)
rRMSE=RMSEyi —×100% (4)
式中, yi? 為樣地實(shí)測值; n 為樣地個(gè)數(shù); yi ^ 為預(yù)測值; yi — 為樣本平均值。
2 結(jié)果與分析
2.1 特征篩選及重要性評估
2.1.1 支持向量機(jī)-遞歸特征消除法特征篩選 利用SVM-RFE對所提取的35個(gè)特征進(jìn)行特征重要性排序,排序結(jié)果如圖1所示。在排序準(zhǔn)則中的特征得分越小,其特征的重要性也就越高。因此,本研究選取特征的重要性為1的12個(gè)變量參與建模,分別為 CC 、 D 0 、 D 3 、 D 4 、 D 5 、 D 6 、 H 30 、 H 40 、 H 50 、 H 60 、 H 95 、 H skew ,其中包括5個(gè)密度變量、6個(gè)高度變量以及郁閉度。
2.1.2 LightGBM特征篩選 基于LightGBM算法對所提取的35個(gè)特征進(jìn)行特征重要性排序,排序結(jié)果如圖2所示。在排序準(zhǔn)則中重要度越大所對應(yīng)特征的重要性也就越大,圖2中前16個(gè)特征的重要度不為0,認(rèn)為其特征重要性高于重要度為0的其他特征,同時(shí)有4個(gè)特征重要度為1的變量也認(rèn)為其特征重要性較低,故將其剔除。因此,本研究選取特征重要度大于1的12個(gè)特征變量參與建模,其中包括7個(gè)高度變量( H cv 、 H max 、 H 90 、 H iq 、 H 99 、 H kurt 、 H stdv )和5個(gè)密度變量( D 5 、 D 4 、 D 9 、 D 3 、 D 6 )。
2.1.3 主成分分析法特征篩選 PCA法依據(jù)貢獻(xiàn)率高的前幾個(gè)主成分與原始點(diǎn)云特征變量的相關(guān)關(guān)系篩選出每個(gè)主成分中相關(guān)性最高的變量參與建模,當(dāng)累計(jì)貢獻(xiàn)率大于85%時(shí)就認(rèn)為少數(shù)幾個(gè)變量就足以解釋原始數(shù)據(jù)的大部分信息。本研究結(jié)果顯示,前5個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到了89%,說明前5個(gè)主成分足以反映原始數(shù)據(jù)的大部分信息。利用主成分分析得到的各主成分與點(diǎn)云特征變量的相關(guān)關(guān)系如表3所示。
與第1主成分的相關(guān)性最高的變量為 H 30 和 H 40 ,相關(guān)系數(shù)為0.982;與第2主成分的相關(guān)性最高的是 H cv ,相關(guān)系數(shù)為0.943;與第3主成分的相關(guān)性最高的是 D 4 ,相關(guān)系數(shù)為0.687;與第4主成分的相關(guān)性最高的是 D 9 ,相關(guān)系數(shù)為0.463;與第5主成分的相關(guān)性最高的是 H min ,相關(guān)系數(shù)為0.834。故 H 40 、 H 30 、 H cv 、 D 4 、 D 9 和 H min 能夠解釋原始變量的絕大部分信息,將其作為回歸模型的自變量。
2.2 林分平均高估測模型建立及精度評價(jià)
通過構(gòu)建的RFR、KNN和LR 3種模型反演林分平均高,根據(jù)模型精度評價(jià)的指標(biāo)( R? 2 、 RMSE 和 rRMSE ),對不同特征篩選方法所構(gòu)建的RFR、KNN和LR模型進(jìn)行精度評價(jià), 并做對比分析, 其中建模精度與檢驗(yàn)精度之差能有效反映不同估測模型間的泛化能力。具體模型評價(jià)指標(biāo)對比見表4。
隨機(jī)森林算法所生成的決策樹數(shù)目為200,樹節(jié)點(diǎn)分裂最小特征數(shù)為3,最小葉節(jié)點(diǎn)為2;KNN模型以歐氏距離作為激勵(lì)度量方法,當(dāng) K 值為11時(shí),KNN模型的誤差最小;逐步回歸方程為 LorH = 3.278+ 0.676? H 90 + 8.661? D 0,式中 LorH 代表林分的胸高斷面積加權(quán)平均高。
其中基于LightGBM進(jìn)行特征篩選構(gòu)建的KNN模型比較穩(wěn)定, 精度最高, 為高峰林場林分平均高反演的最優(yōu)模型, 建模結(jié)果的 R? 2 為0.83, RMSE 為1.64 m, rRMSE 為12.04%;基于PCA進(jìn)行特征篩選構(gòu)建的KNN模型精度最低, R? 2 為0.53, RMSE 為2.40 m, rRMSE 為18.36%。在3種特征篩選方法中基于LightGBM進(jìn)行特征篩選所構(gòu)建的估測模型較為穩(wěn)健,其泛化能力最強(qiáng)。而基于SVM-RFE特征篩選所構(gòu)建的RFR和KNN模型,建模精度與驗(yàn)證精度相差很多,說明模型不夠穩(wěn)健,泛化能力差。利用PCA對建模因子進(jìn)行降維后,其精度反而低于不降維的模型精度,且模型出現(xiàn)欠擬合。
除PCA方法外,進(jìn)行特征篩選后所構(gòu)建的估測模型精度均高于全部因子參與建模的模型精度,表明通過對建模因子進(jìn)行特征篩選能有效提升模型精度和運(yùn)算效率。
2.3 林分平均高反演
利用基于LightGBM進(jìn)行特征篩選所建立的KNN模型對高峰林場林分平均高進(jìn)行反演。將反演的林分平均高分為6個(gè)等級,Ⅰ級為2.0~ 6.0 m,Ⅱ級為6.1~ 10.0 m,Ⅲ級為10.1~ 14.0 m,Ⅳ級為14.1~ 18.0 m,Ⅴ級為18.1~ 22.0 m,Ⅵ級為22.0 m以上。
高峰林場大部分區(qū)域林分平均高等級較低,林分平均高在Ⅰ、Ⅱ、Ⅲ級的相對較多,這是因?yàn)榱謭鲋饕阅静纳a(chǎn)作為經(jīng)營項(xiàng)目,林分以人工純林為主,林種結(jié)構(gòu)單一,導(dǎo)致高度等級低的林分內(nèi)部高度差異小,分布較為集中。
3 結(jié)論與討論
本研究以中國南亞熱帶季風(fēng)區(qū)域的人工林為研究對象,以機(jī)載激光雷達(dá)點(diǎn)云數(shù)據(jù)為數(shù)據(jù)源,在研究區(qū)內(nèi)選取105個(gè)典型樣地(2種森林類型)作為驗(yàn)證數(shù)據(jù),分別采用PCA、支持向量機(jī)-遞歸特征篩選和LightGBM對提取的35個(gè)點(diǎn)云特征變量進(jìn)行建模因子篩選,并結(jié)合KNN、RFR和LR對林分平均高進(jìn)行反演,結(jié)果表明,對建模因子進(jìn)行特征篩選能有效提升模型精度和計(jì)算效率,除PCA外其他2種基于特征篩選所建立的估測模型精度均高于所有特征參與建模的模型精度?;贚ightGBM進(jìn)行特征篩選所構(gòu)建的估測模型均能得到較好的估測結(jié)果,其泛化能力優(yōu)于其他特征篩選方法。其中,基于LightGBM進(jìn)行特征篩選所構(gòu)建的KNN模型建模精度和檢驗(yàn)精度均最高。
以往的研究大多是比較某一種非參數(shù)模型與參數(shù)模型(如逐步回歸)的精度差異,如曾偉生等 [9] 考慮到模型的實(shí)用性和可解釋性,采用簡單的線性與非線性模型構(gòu)建估測模型,雖然研究結(jié)果表明,基于點(diǎn)云高度變量(中位數(shù))與強(qiáng)度變量(75%分位數(shù))所構(gòu)建的二元非線性模型就能達(dá)到較為理想的估測結(jié)果,但也忽略了其他點(diǎn)云變量所包含的有用信息。此外,多數(shù)研究結(jié)果表明,非參數(shù)模型精度優(yōu)于參數(shù)模型;周蓉等 [12] 和沈劍波等 [13] 比較了不同訓(xùn)練算法對BP神經(jīng)網(wǎng)絡(luò)所建立的林分平均高估測模型精度的影響并與逐步回歸算法進(jìn)行比較,但未考慮其他特征篩選方法和估測模型的差異對精度的影響。而比較多種特征篩選方法與多種模型的組合對模型精度影響的研究還較少,此外LightGBM算法雖然在其他領(lǐng)域表現(xiàn)出較強(qiáng)的預(yù)測能力以及數(shù)據(jù)挖掘能力,但在林分平均高建模及對點(diǎn)云變量篩選方面的研究還較少,本研究使用的不同特征篩選方法和多種模型結(jié)合的方法為林分平均高建模提供了參考。
目前,機(jī)器學(xué)習(xí) [23-25] 被廣泛應(yīng)用于森林參數(shù)估測,通過對變量進(jìn)行篩選可以有效降低自變量的維度,從而提高模型精度和運(yùn)算效率。但用隨機(jī)森林法和支持向量機(jī)法等機(jī)器學(xué)習(xí)模型進(jìn)行森林參數(shù)估測時(shí)具有隨機(jī)性,此外機(jī)器學(xué)習(xí)的擬合精度取決于訓(xùn)練樣本和參數(shù)的設(shè)置,如果訓(xùn)練樣本選取不合理或者參數(shù)設(shè)置不當(dāng),將會(huì)使機(jī)器學(xué)習(xí)模型過擬合或欠擬合。在今后的研究中將考慮用諸如遺傳算法、粒子群算法等來對模型進(jìn)行優(yōu)化。對不同森林類型、不同樹種及不同郁閉度下所提取的森林參數(shù)對模型估測精度的影響機(jī)理有待進(jìn)一步研究。
參考文獻(xiàn):
[1] 董立新.林分平均高度衛(wèi)星遙感新進(jìn)展[J].遙感技術(shù)與應(yīng)用,2016,31(5):833-845.
[2] ZHAO F, GUO Q, KELLY M. Allometric equation choice impacts lidar-based forest biomass estimates: a case study from the Sierra National Forest, CA[J]. Agricultural and Forest Meteorology, 2012, 165: 64-72.
[3] 劉亞男.基于多源遙感數(shù)據(jù)的森林地上生物量及凈初級生產(chǎn)力估算研究[J].測繪學(xué)報(bào),2020,49(12):1641.
[4] GREGOIRE T G , NSSET E , MCROBERTS R E , et al. Statistical rigor in LiDAR-assisted estimation of aboveground forest biomass[J]. Remote Sensing of Environment, 2016, 173:98-108.
[5] PEDERSEN R , BOLLANDSS O M, GOBAKKEN T, et al. Deriving individual tree competition indices from airborne laser scanning[J]. Forest Ecology and Management, 2012, 280: 150-165.
[6] 劉魯霞,龐 勇.機(jī)載激光雷達(dá)和地基激光雷達(dá)林業(yè)應(yīng)用現(xiàn)狀[J].世界林業(yè)研究,2014,27(1):49-56.
[7] 穆喜云, 張秋良, 劉清旺, 等. 基于機(jī)載LiDAR數(shù)據(jù)的林分平均高及郁閉度反演[J]. 東北林業(yè)大學(xué)學(xué)報(bào), 2015, 43(9): 84-89.
[8] 彭 濤,邢艷秋,尤號田,等.LiDAR采樣形狀及采樣尺度對林分均高估測的影響[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2018,38(4):27-32.
[9] 曾偉生,孫鄉(xiāng)楠,王六如,等. 基于機(jī)載激光雷達(dá)數(shù)據(jù)估計(jì)林分蓄積量及平均高和斷面積[J].林業(yè)資源管理,2020(2):79-86.
[10] 焦義濤,邢艷秋,霍 達(dá),等. 基于機(jī)載LiDAR點(diǎn)云估測林分的平均樹高[J]. 西北林學(xué)院學(xué)報(bào), 2015, 30(3): 170-174.
[11] 趙 勛,岳彩榮,李春干,等. 基于機(jī)載 LiDAR 數(shù)據(jù)估測林分平均高[J]. 林業(yè)科學(xué)研究, 2020, 33(4): 59-66.
[12] 周 蓉,趙天忠,吳發(fā)云.依據(jù)BP神經(jīng)網(wǎng)絡(luò)的機(jī)載LiDAR數(shù)據(jù)估算林分平均高[J].東北林業(yè)大學(xué)學(xué)報(bào),2021,49(9):60-66.
[13] 沈劍波,雷相東,李玉堂,等.基于BP神經(jīng)網(wǎng)絡(luò)的長白落葉松人工林林分平均高預(yù)測[J].南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,42(2):147-154.
[14] GRACE Y,HE W Q,CARROLL R J. Feature screening with large scale and high dimensional survival data.[J]. Biometrics, 2021,77(2):1-14.
[15] 曹 林,代勁松,徐建新,等. 基于機(jī)載小光斑 LiDAR 技術(shù)的亞熱帶森林參數(shù)信息優(yōu)化提取[J]. 北京林業(yè)大學(xué)學(xué)報(bào), 2014, 36(5): 13-21.
[16] PAOLO M, VIBRANS A C, MCROBERTS R E, et al. Methods for variable selection in LiDAR-assisted forest inventories[J]. Forestry,2017, 90: 112-124.
[17] 郝紅科. 基于機(jī)載激光雷達(dá)的森林參數(shù)反演研究[D]. 楊凌:西北農(nóng)林科技大學(xué), 2019.
[18] 莫莉婕.國有林場森林資源可持續(xù)發(fā)展對策研究——以高峰林場為例[J].企業(yè)科技與發(fā)展,2021(4):222-224.
[19] GUYON I, WESTON J, BARNHILL S, et al. Gene selection for cancer classification using support vector machines[J]. Machine Learning, 2002, 46(1): 389-422.
[20] KE G L, MENG Q, FINLEY T, et al. LightGBM: a highly efficient gradient boosting decision tree[J]. Advances in Neural Information Processing Systems, 2017, 30: 3146-3154.
[21] BREIMAN L. Random forests[J].Machine Learning,2001,45 (1) :5-32.
[22] ACAR L. Some examples for the decentralized receding horizon control[C]. Tucson: IEEE, 1992: 1356-1359.
[23] 郝 玲,張 佩,史逸民,等. 基于機(jī)器學(xué)習(xí)的江蘇省冬小麥氣象產(chǎn)量客觀區(qū)劃及歉年預(yù)測[J].江蘇農(nóng)業(yè)科學(xué),2021,49(12):162-168.
[24] 白 婷,丁建麗,王敬哲. 基于機(jī)器學(xué)習(xí)算法的土壤有機(jī)質(zhì)質(zhì)量比估算[J].排灌機(jī)械工程學(xué)報(bào),2020,38(8):829-834.
[25] 趙獻(xiàn)立,王志明. 機(jī)器學(xué)習(xí)算法在農(nóng)業(yè)機(jī)器視覺系統(tǒng)中的應(yīng)用[J].江蘇農(nóng)業(yè)科學(xué),2020,48(12):226-231.
(責(zé)任編輯:陳海霞)
收稿日期:2021-10-29
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(42061072);云南省科技廳重大科技專項(xiàng)(202002AA00007-015);云南省教育廳項(xiàng)目(2018JS330)
作者簡介:朱泊東(1997-),男,云南曲靖人,碩士研究生,主要從事林業(yè)遙感研究。(E-mail)zhubodong@swfu.edu.cn
通訊作者:岳彩榮,(E-mail)cryue@163.com