亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機載LiDAR點云數(shù)據(jù)降維與分類的隨機森林方法

        2018-05-04 08:04:52高仁強徐戰(zhàn)亞
        測繪學報 2018年4期
        關鍵詞:特征選擇特征參數(shù)鄰域

        熊 艷,高仁強,徐戰(zhàn)亞

        1. 中國地質大學(武漢)信息工程學院,湖北 武漢 430074; 2. 北京大學遙感與地理信息系統(tǒng)研究所,北京 100871

        機載LiDAR技術作為一種全新的測繪技術,具有快速獲取大范圍、高密度、高精度的地面信息的優(yōu)勢,已在城市規(guī)劃、地形制圖、自然災害監(jiān)測方面得到廣泛應用[1-2]。點云分類是激光點云數(shù)據(jù)后處理的一個重要環(huán)節(jié),也是目前攝影測量與遙感領域的重要研究方向之一[3]。在實際的點云分類應用中,受點云的噪聲、離散性、密度的不均勻性以及地物形態(tài)的多樣性等因素的影響,自動化、高精度的點云分類依然面臨著巨大挑戰(zhàn)。

        目前的點云分類方法主要有以下幾種解決思路。①將LiDAR點云內(nèi)插生成高程或者強度影像,然后從圖像中提取一些基本的統(tǒng)計特征參數(shù)并采用基于像素或者對象的分類方法進行地物分類[4-7]。這種方式雖然能取得較好的效果,但是內(nèi)插會帶來計算誤差,而且將三維點云轉為二維柵格數(shù)據(jù)來處理有信息損失。②直接根據(jù)點云的三維空間信息選擇合適的空間鄰域結構,鄰域的選擇形式包括K近鄰、球體鄰域、圓柱體鄰域或立方體鄰域,然后提取反映地物類型差異的幾何特征參數(shù),并借助相關的機器學習算法進行分類[8-10]。這種方法的難點在于鄰域的確定受空間鄰域尺度的影響。對于最佳空間鄰域尺度的確定,大多學者是通過反復的嘗試或者憑借經(jīng)驗獲得,可指導性不強,也有學者嘗試采用多尺度的方式解決,但是不加篩選的添加鄰域尺度將導致特征維數(shù)的急劇增大,給數(shù)據(jù)處理帶來巨大負擔。③將點云分類轉為多次的目標探測與分離,通過設定一系列的目標識別規(guī)則逐步減少分類數(shù)量,從而實現(xiàn)點云分類[10-11]。這種方法的不足之處在于誤差存在傳遞與累積,導致分類結果具有很大的不確定性,而且過程比較繁雜,尤其是地物類型比較多的情況。④基于高度紋理的分類方法,該方法先將點云的高程信息內(nèi)插生成高度影像,然后提取高度紋理特征(如變異系數(shù)、二階矩、熵等)并應用遙感影像分類算法進行分類[10-11]。該方法要求預先設定的地物類別的高度特征存在明顯差異,而且對分類地物的先驗知識具有較高要求,單獨依靠紋理信息進行分類精度不高,需要強度以及幾何特征信息的輔助。⑤對全波形機載點云的全波形信息進行分解,然后提取波形特征參數(shù)(如回波率、后向散射系數(shù)、振幅、波寬等)以及高程特征進行分類[1,13-15]。該方法對數(shù)據(jù)源的要求較高,目前通過波形信息來量化地物的空間形態(tài)差異還存在很多難點,尤其是植被或者建筑物都具有多回波特征,波形的差異不明顯,一般需要結合其他特征參數(shù)才能取得比較好的效果[16]。

        盡管學者們提出了多種多樣的特征參數(shù)用于點云分類的研究,但是缺乏對特征參數(shù)的選擇過程。如果直接將所有的特征參數(shù)用于構建分類器,一方面樣本數(shù)據(jù)的特征維度較高導致計算開銷大、運算時間長,另一方面無關特征的加入會使得分類器精度下降,而且對不同特征作用于地物分類效果的重要性程度分析不夠,導致特征參數(shù)與目標地物之間的耦合關系缺乏深刻認識。

        本文在前人研究的基礎上,提出一種基于隨機森林的點云數(shù)據(jù)降維與分類方法。該方法不需要點云內(nèi)插,直接以點云數(shù)據(jù)為核心:首先,通過分析城區(qū)目標地物的高度特征、幾何特征、回波特征以及強度特征的差異并提取分類特征參數(shù);其次,對于其中依賴于鄰域結構的特征參數(shù),本文引入多尺度分析的概念,構建多尺度特征以克服空間鄰域尺度選擇難的問題;然后,基于隨機森林算法進行特征選擇和點云分類;最后,從特征選擇效果、分類精度以及特征變量的重要性3個方面進行模型效果評價。

        1 數(shù)據(jù)描述

        研究區(qū)域位于芬蘭中部城市Jyv?skyl?(62°14.5′N,25°44.5′E),數(shù)據(jù)來源于TerraSolid官方網(wǎng)站提供的訓練數(shù)據(jù)(http:∥www.terrasolid.com/training/training_data.php)。LiDAR數(shù)據(jù)的獲取時間為2011年,借助無人機搭載的激光掃描儀系統(tǒng)在城市上方飛行獲得,其中包含7條航帶的數(shù)據(jù),點云密度平均為17 points/m2。本文選取質量較好且覆蓋城市主要設施的點云作為試驗數(shù)據(jù),其坐標系已由WGS-84橢球投影變換至UTM坐標系,覆蓋范圍大約為2100×400 m2,包括14 784 484個激光點數(shù)據(jù)(圖1),原始點云的基本屬性包括三維坐標、激光強度、掃描角、回波總數(shù)及回波次數(shù)等信息。結合點云數(shù)據(jù)的特點以及區(qū)域內(nèi)地物類型的幾何形態(tài)差異,本文將研究區(qū)內(nèi)的地物類型分為地面、建筑物與其他3種。

        2 研究方法

        本文的試驗流程如下:首先對LiDAR點云進行去噪聲處理;然后選取訓練樣本提取多尺度特征參數(shù),構建分類特征集;再采用RFFS算法進行特征選擇,并將特征選擇得到的結果用于隨機森林模型的構建;最后應用于測試集對分類和精度進行評價。

        圖1 試驗區(qū)獲取的LiDAR點云數(shù)據(jù)Fig.1 LiDAR data obtained from the study area

        2.1 點云數(shù)據(jù)去噪

        由于激光脈沖的折射或者多路徑效應,原始點云存在許多噪聲點數(shù)據(jù),這部分噪聲信息可以通過目視加以剔除;另外點云中也存在少量的高程粗差點,通過設置合適的搜索半徑閾值R(如0.5 m),然后逐個計算當前搜索點的高程與該點所在半徑R內(nèi)的鄰域點的高程平均值的差值,并按照差值不超過3σ原則將粗差點識別出來,最后加以刪除。

        2.2 特征提取

        2.2.1 歸一化高度特征

        基于布料模擬算法[17]對去噪點云構建柵格化的DTM模型,由于試驗區(qū)域的地形存在較大的起伏,兼顧計算機的運算能力,本文設置布料模擬算法輸出的DTM柵格大小為0.8 m,迭代次數(shù)為500,布料的硬度系數(shù)為2,且進行坡度后處理。點云中的某一點到該點投影所在的DTM柵格內(nèi)的高程值之差就是該點的歸一化高度(normalized height,NH),如圖2所示。該特征在區(qū)分地面點和非地面點方面具有很好的效果,如建筑物離地面的高度通常較高且比較有規(guī)律,而其他地物的高度特征則比較復雜。

        圖2 歸一化高度示意圖Fig.2 Schematic diagram of normalized height

        2.2.2 高程統(tǒng)計特征

        該特征主要表達的是不同地物的高程屬性分布特點。假設整個三維點云構成的點集為

        c=pi|pi=xi,yi,zi,i=1,2,…,m

        當前計算點為

        p=x,y,z∈c

        則以該點為中心半徑為R的鄰域點集可表示為

        從當前點和鄰域點共同構成的點集中通過統(tǒng)計分析提取高程統(tǒng)計量,本文使用的高程統(tǒng)計量包括極差、標準差、峰度和偏度。

        (1) 高程極差Hr。高程極差的數(shù)學形式為

        (1)

        (2) 高程標準差HSTD。高程標準差的數(shù)學形式為

        (2)

        (3) 高程峰度Hskw。高程峰度的數(shù)學形式為

        (3)

        (4) 高程偏度Hkur。高程偏度的數(shù)學形式為

        (4)

        2.2.3 表面相關特征

        表面相關特征主要體現(xiàn)不同地物在平面上的起伏差異,包括平面粗糙度(N)、平面極差(Sr)、平面標準差(SSTD)、平面法向量與豎直方向的夾角(Sn)。如圖3所示,對當前點和鄰域點共同構成的點集用一個平面進行擬合,使得所有點到該平面的距離的平方和最小,計算當前點到該平面的距離即為粗糙度,所有點到該平面的距離的最大差值即為平面極差,所有點到該平面的距離的標準差為平面標準差。通常植被的粗糙度最大,地面次之,建筑物最小;另外地面和建筑物屋頂?shù)钠矫鏄藴什钶^小,而植被的平面標準差較大;建筑物屋頂?shù)姆ㄏ蛄颗c豎直方向的夾角比較小且固定,而地面點的變化較大,植被點的變化則非常大。

        圖3 表面相關特征示意圖Fig.3 Schematic diagram of surface metric feature

        2.2.4 空間分布特征

        空間分布特征主要描述當前點在鄰域點內(nèi)服從一維、二維、三維空間分布的程度。首先對當前點和鄰域點共同組成的點集的三維坐標進行主成分變換,得到對應于當前點的3個主成分系數(shù)μ1、μ2、μ3(μ1≤μ2≤μ3),進一步對這3個主成分系數(shù)進行歸一化

        (5)

        式中,λ1、λ2、λ3就對應于當前點在鄰域點集內(nèi)服從一維、二維、三維空間分布的程度。如果λ1→1,則說明當前搜索點與鄰域點在空間上呈線狀分布特征,如圖4(a)所示;如果λ1與λ2的值可比擬且λ1+λ2→1,則說明當前搜索點與鄰域點在空間上呈面狀分布特征,如圖4(b)所示;如果λ1與λ2、λ3的值均可比擬,則說明當前搜索點與鄰域點在空間上呈體狀分布特征,如圖4(c)所示。

        圖4 3種不同的空間分布特征示意圖Fig.4 Schematic diagram of three different spatial distribution feature

        2.2.5 回波特征

        LiDAR的回波信息包括兩個方面:回波次數(shù)和第幾次回波。回波次數(shù)特征有單次回波(Ns)及多次回波(Nm);第幾次回波特征有首次回波(Nf)、中間回波(Ni)及末次回波(Nl)。地面在無遮擋條件下通常只有一次反射回波,如果受樹木的遮擋作用,則由于樹木間隙的存在導致部分激光點的末次回波從地面反射回來,因此表現(xiàn)出多次回波的末次回波點一般對應地面點的特征;建筑物一般由鋼筋混凝土等堅固材料組成,激光點打在上面不容易發(fā)生穿透,因此通常只具有單次回波,但是在建筑物邊緣會發(fā)生多次反射;植被點由于間隙的存在導致激光點會發(fā)生多次反射,第1次回波出現(xiàn)在冠層表面,中間回波出現(xiàn)在樹枝以及樹葉上,而最后一次回波則一般透過間隙打在地面上(圖5)。依據(jù)這個特點,本文提取了地面點回波指數(shù)(EGI)、建筑物回波指數(shù)(EBI)、植被點回波指數(shù)(EVI)。假設當前點和鄰域點構成的點集的點數(shù)為Nall,則對應回波指數(shù)的數(shù)學形式為[18]

        (6)

        (7)

        (8)

        圖5 不同地物類型的回波反射特征Fig.5 Schematic diagram of echo reflection feature of different ground object

        2.2.6 強度特征

        由于不同的地物類型對特定的激光波長的反射、吸收能力存在差異,因此激光強度信息在地物分類中也具有廣泛應用。本文計算當前點和鄰域點共同組成的點集內(nèi)的激光強度的平均值AI作為當前點的平均強度值,并將其作為地物分類的一個特征參數(shù)。

        2.3 多尺度特征構建

        本文提取的特征參數(shù)除了歸一化高度特征不需要考慮鄰域結構外,其他均需要。而本文使用的鄰域結構是球體鄰域,因此受空間鄰域尺度的影響。在某個搜索半徑R下得到的當前點與鄰域點的關系只描述了鄰域尺度為R時的空間特征規(guī)律,通過不斷調整搜索半徑R的大小,并分別計算不同鄰域尺度下的各個特征參數(shù)值,從而得到一系列的多尺度特征參數(shù)。結合研究區(qū)域內(nèi)的地物對象大小、異質性特征、空間聚集狀況以及激光點的間距大小等因素,初步設定的空間鄰域尺度有9個,分別為0.4 m、0.5 m、0.6 m、0.7 m、0.8 m、0.9 m、1.0 m、1.2 m、1.5 m。

        2.4 隨機森林算法

        2.4.1 隨機森林算法原理

        隨機森林(random forest,RF)是一種集成學習算法,它可以用于求解多類分類問題。該算法采用Bagging抽樣技術,能有效地減少過擬合的風險,而且可以在訓練的過程中對變量的重要性進行評估,具有很好的抗噪聲、泛化能力[19],其基本組成是分類回歸樹。該算法進行分類的具體步驟為

        (1) 首先基于Bagging抽樣技術從訓練樣本中有放回的隨機抽取N個樣本數(shù)據(jù)、有放回的隨機抽取M個特征變量構建新的自助樣本集,并由此產(chǎn)生T棵分類回歸樹,而每次未被抽到的樣本則組成了T個袋外樣本(out-of-bag,OOB)。

        (2) 每棵分類回歸樹的根節(jié)點存儲對應的自助樣本數(shù)據(jù),從根節(jié)點開始按照最小不純度原則選擇某個特征變量,分裂生成子節(jié)點。本文使用的不純度指標為基尼系數(shù)G,計算方法為

        (9)

        式中,m是類別數(shù);pi是第i個類別的樣本比例。接著對該特征變量選取合適的分裂點使得分裂前后節(jié)點的基尼系數(shù)下降量達到最大。假設當前選擇的特征變量為f,分裂點為k,則該特征變量分裂前后的基尼系數(shù)下降量為

        ΔG(k)=G(p)-(1-q)G(f

        qG(f>k)

        (10)

        式中,G(fk)表示對節(jié)點p的f值大于k的樣本的基尼系數(shù)。

        (3) 每棵樹最大限度的遞歸的選擇節(jié)點和分裂節(jié)點,不做任何裁剪,直至達到最大的分解深度。試驗過程中為了加快建樹的時間并減少過擬合風險,對每個節(jié)點是否分裂添加額外的樣本數(shù)限制條件,即當某個節(jié)點的樣本數(shù)大于限制閾值nthreshold時,才可以繼續(xù)分裂。

        (4) 將生成的T棵分類回歸樹組成森林,在測試階段,每棵分類回歸樹都對測試樣例進行一次投票,最后將得票數(shù)最多的類別屬性賦給測試樣例,從而實現(xiàn)隨機森林分類。

        參考文獻[19]的研究成果并結合訓練樣本數(shù)量較大的特點,本文設置N值為樣本總數(shù)的90%,M值為特征總個數(shù)的平方根,T值為100,分裂節(jié)點的樣本數(shù)nthreshold為10。

        2.4.2 基于隨機森林的變量重要性度量

        (11)

        如果精度下降量越大,則該特征變量的重要性程度也就越高,為確保結果的穩(wěn)定性,本文計算平均精度下降量時,控制模擬次數(shù)為10次。

        2.4.3 基于隨機森林的特征選擇

        特征選擇的目的是從特征集中識別出關鍵特征,刪除無關特征或者冗余特征信息,從而達到降低特征空間的維數(shù)以提高模型的訓練速度和學習效果[21-22]?;陔S機森林的特征選擇(feature selection based on random forest,RFFS)算法,首先利用隨機森林算法的特征變量重要性度量對特征集進行排序,然后采用序列后向搜索算法迭代的從當前特征集中刪除最不重要(重要性得分最低)的特征,并依次計算每輪迭代過程中的分類準確率,最后選擇分類準確率最高的特征子集作為特征選擇結果。為了確保訓練的模型可靠且穩(wěn)定,本文采用了K折交叉驗證的訓練技巧,即每次迭代時將自助樣本集隨機劃分成K份,然后選擇其中的K-1份作為訓練數(shù)據(jù)構建隨機森林分類器,剩下的1份則作為驗證數(shù)據(jù)用于評估分類效果。在K次交叉驗證的過程中,選擇驗證數(shù)據(jù)上分類準確率最高的一次所得的變量重要性排序作為刪除特征的依據(jù),而該輪迭代的分類準確率則是K次交叉驗證的平均分類準確率[21]。由于初始的特征變量數(shù)較多,兼顧計算機的處理效率與試驗結果的可靠性,本文設置K值為5。

        2.5 優(yōu)化計算的方法

        由于機載LiDAR點云數(shù)據(jù)量一般非常大,因而確定點云中某個激光點的鄰域點過程是一個非常耗時的空間查詢過程,尤其是在多尺度幾何特征參數(shù)的計算方面。為了提高空間查詢的效率,本文采用八叉樹結構[23]進行點云數(shù)據(jù)的存儲與空間查詢優(yōu)化。八叉樹將三維空間遞歸的劃分為許多規(guī)則的體素結構,并對每個體素建立八叉樹索引,在鄰域搜索時通過定位當前點所在的體素并預估可能與當前點有交集的體素從而減少空間查詢范圍來提高查詢效率。本文為了減少隨機森林分類器的訓練或者預測時間,在訓練或分類之前先對訓練與測試樣本進行抽稀(空間均勻采樣)處理,再利用抽稀后的訓練樣本構建隨機森林模型并對抽稀后的測試樣本進行分類,對抽稀后的測試樣本分類完成后,去噪點云的類別按照空間最近鄰原則由空間距離最近的測試樣本點的類別決定,由此實現(xiàn)去噪點云的分類。將測試樣本點的類別按照空間最近鄰原則賦給去噪點云時,涉及最近鄰查詢,本文采用KD(K-dimension)樹[24-25]來提高最近鄰點的搜索效率。

        2.6 分類精度評價

        混淆矩陣是一種常用的分類精度評價方式,其每列數(shù)值代表實際類別的點云在各個類別下的數(shù)量,每行則代表了模型預測的點云在各個類別下的數(shù)量。本文也采用混淆矩陣對點云分類精度進行評定,具體的分類精度評價指標包括:總體精度(OA)以及Kappa系數(shù),對應指標的計算方法為

        (12)

        (13)

        式中,N是點云總數(shù);nii代表對角線上的總點數(shù);ni.則表示第i行的總點數(shù);n.i則代表第i列的總點數(shù)。

        3 結果與分析

        3.1 基于隨機森林的特征選擇

        圖6表達的是特征子集大小與總體分類精度指標之間的變化關系,試驗過程中設置分類回歸樹的數(shù)量T為100,每次隨機抽取90%的樣本作為自助樣本,隨機抽取的特征數(shù)M為總特征數(shù)的平方根,交叉驗證的K值為5,初始的特征集大小為127,最小的特征集大小為5。試驗表明,隨著特征子集中重要性程度較低的特征的剔除,分類器的預測能力整體上逐漸增加,這是由于去除了不相關和冗余的特征使得分類器性能得到提高的緣故。當特征子集大小達到一定數(shù)量(本例是26)時,分類器的預測能力達到最大97.0%,繼續(xù)剔除特征變量則會使得一部分關鍵特征被當作無用特征剔除使得分類器性能下降導致預測精度降低。

        圖6 特征集大小與分類精度變化關系Fig.6 The relationship between overall accuracy and feature set size

        3.2 點云分類結果

        經(jīng)過RFFS特征選擇過程得到最優(yōu)特征子集后,為了加快分類速度,對去噪點云進行抽稀處理(即空間均勻采樣,抽樣率大約為1%),再將這部分抽稀點云作為核心點數(shù)據(jù)并從中選擇訓練樣本點和測試樣本點。本文最后選取的訓練樣本點個數(shù)為54 395、測試樣本點個數(shù)為70 976?;赑ython語言對訓練樣本點構建隨機森林分類器,并基于該分類器對測試樣本進行分類。隨后,按照空間最鄰近插值原理對去噪點云進行分類,結果如圖7(a)所示。為了說明本文方法的有效性,本文對未經(jīng)過特征選擇而直接使用全部特征構建隨機森林分類器也進行試驗,除特征變量不同外其他參數(shù)設置不變,其結果如圖7(b)所示。另外本文與現(xiàn)有主流的機器學習算法之一:支持向量機(SVM)模型進行比較,試驗過程中使用統(tǒng)一的訓練樣本和測試樣本,由于線性SVM模型支持大容量樣本的模型訓練,因此本文采用線性SVM模型。模型參數(shù)是通過反復嘗試使得總體精度達到最優(yōu)來確定的,關鍵的參數(shù)包括penalty值為12,懲罰系數(shù)C=1.0,迭代次數(shù)為200,其他參數(shù)取默認值。同樣對特征選擇前、后分別進行試驗,對應的結果如圖7(c)、(d)所示??傮w上看,本文的分類方法對于地面、其他類的分類效果非常好,但是對于建筑物的分類效果較差,尤其是在坡地和建筑物邊緣地帶(如圖7(a)中的1#和2#);相對于未經(jīng)過特征選擇的分類策略而言,地面點的錯分現(xiàn)象更少,而且椒鹽現(xiàn)象更輕一些(如圖7(a)、(b)中的3#、4#和5#),而相比于SVM模型而言,這種優(yōu)勢更為明顯(如圖7(a)、(b)、(d)中的1#、6#和7#)。

        3.3 精度評價與效率對比

        為定量評價本文提出的方法的分類效果,通過交互式的方式對點云數(shù)據(jù)進行分類,并將其作為參考數(shù)據(jù)(圖8),與上述4種分類策略下的分類結果進行比較,得到的誤差統(tǒng)計結果如表1所示。由表1可見,基于隨機森林算法的分類結果特點是:經(jīng)過特征選擇后,目標類別點的漏分率均得到降低,除了建筑物點的錯分率有所輕微增加外,其他兩類的錯分率也都得到降低。另外,建筑物點的漏分率相比于其他類別要高很多,主要原因在于分類器誤把一部分建筑物點當做地面點而發(fā)生混淆。而基于SVM算法的分類結果特點是:經(jīng)過特征選擇后,地面點的錯分率和建筑物點的錯分率得到降低,但其他類點的錯分率略微增加;另外,其他類點的漏分率得到降低的同時建筑物點的漏分率卻在增加,而地面點保持不變。值得注意的是,基于SVM得到的建筑物點的漏分率和錯分率要大大高于基于隨機森林算法的結果。

        圖7 不同分類策略下的分類結果Fig.7 The classification result of different classification strategies

        圖8 參考點云分類結果Fig.8 The reference classification data

        注:RF+FS分類表示經(jīng)過特征選擇后的隨機森林算法分類;RF分類表示未經(jīng)過特征選擇直接使用隨機森林算法進行分類;SVM+FS分類表示經(jīng)過特征選擇后的SVM算法分類;SVM分類表示未經(jīng)過特征選擇直接使用SVM算法分類。

        進一步對這4種分類策略下的結果進行精度與效率評比,試驗過程使用的是輕便型筆記本電腦(型號:華碩A501;CPU:Intel Core i5-5200U,主頻2.19 GHz;內(nèi)存12 GB),結果如表2所示。從表2的結果來看,經(jīng)過特征選擇后的隨機森林算法的總體精度相比于未經(jīng)過特征選擇的分類精度提高1.4%,Kappa系數(shù)提高0.022;相比于經(jīng)過特征選擇的SVM分類方法而言總體精度提高2.1%,Kappa系數(shù)提高0.35;相比于未經(jīng)過特征選擇的SVM分類算法而言,總體精度提高2.3%,Kappa系數(shù)提高0.037。這就說明經(jīng)過特征選擇后分類精度確實能得到提升,但是提升幅度較小,并且基于集成的學習算法的學習能力比SVM更強,但是由于本文使用的最優(yōu)特征子集是通過RFFS算法得到的,該特征子集的優(yōu)勢是使得隨機森林算法的分類精度達到最大,但是該特征子集并不一定適用于SVM模型,因此運用到SVM模型后沒有明顯的精度提升。另外,從運行效率方面來看,經(jīng)過特征選擇后,不管是隨機森林算法還是SVM算法,其模型訓練時間以及模型測試時間均得到大幅度降低,能滿足某些實時性要求高的應用需要。

        表2分類精度與效率比較

        Tab.2Thecomparisonofclassificationaccuracyandefficiency

        參數(shù)RF+FS分類RF分類SVM+FS分類SVM分類OA/(%)94.392.992.292.0Kappa0.9220.9000.8870.885模型訓練時間/s10.7027.468.4552.37模型測試時間/s1.071.820.040.16

        注:RF+FS分類表示經(jīng)過特征選擇后的隨機森林算法分類;RF分類表示未經(jīng)過特征選擇直接使用隨機森林算法進行分類;SVM+FS分類表示經(jīng)過特征選擇后的SVM算法分類;SVM分類表示未經(jīng)過特征選擇直接使用SVM算法分類。

        3.4 特征重要性比較

        圖9是通過袋外樣本計算得到的特征重要性結果(各個特征的得分值經(jīng)過標準化處理,最重要的特征得分設為100)。由圖9可知,歸一化的高度NH的重要性程度最高,這是因為歸一化高度則能有效地將地面點和非地面點進行分離,并且建筑物點的歸一化高度特征相對其他類點來說更明顯。另外,回波指數(shù)在分類過程中也起到了關鍵作用,這是因為地面不存在間隙,因此單次回波(或首次回波)占據(jù)主要的比例,其比例也就最高,其次是建筑物,最低的則是植被,因為植被具有縫隙容易發(fā)生多次透射,而建筑物只在邊緣處發(fā)生透射,導致回波特征有較大差異。另外激光強度AI、法向量與豎直方向的夾角Sn以及空間分布特征λ2對點云分類也發(fā)揮了重要作用。相比較而言,高程統(tǒng)計量在本次試驗中的分類作用則不明顯,主要是復雜的地形條件下點云的高程特征差異性并未得到突顯。

        進一步考察空間鄰域尺度的利用情況,通過對各個鄰域尺度下的特征數(shù)量進行統(tǒng)計,其結果如表3所示。容易看出,隨著鄰域尺度的增大,有效得到利用的特征數(shù)量也在增加,這表明在較大的尺度下這3種地物類型的特征差異得到突出;另外,在較大的鄰域尺度下,高程統(tǒng)計量、空間分布特征和建筑物回波指數(shù)才開始出現(xiàn)作用;激光強度特征、法向量夾角和地面點回波指數(shù)則在所有的空間鄰域尺度下均發(fā)揮作用。

        表3 不同鄰域尺度下的特征數(shù)量

        4 討論與結論

        本文以機載LiDAR數(shù)據(jù)為研究對象,通過分析點云數(shù)據(jù)的特點提取了高度統(tǒng)計量、歸一化高度、表面相關特征、空間分布特征、回波特征和激光強度特征6大類特征參數(shù),并在此基礎上構建多尺度特征參數(shù),采用隨機森林分類算法進行數(shù)據(jù)降維,得到最優(yōu)特征子集后再對點云進行分類。試驗過程中得到了以下幾點結論:

        (1) 多尺度特征參數(shù)的構建不僅有效克服了鄰域結構設計時最佳空間尺度的選擇難問題,并且為點云分類增加了更多的特征參數(shù),但是并非所有多尺度特征參數(shù)都對分類變量起到重要作用,其中有許多特征參數(shù)之間存在相關性和冗余,因此在進行點云分類前需要對特征變量進行降維。這一方面可以減少模型的訓練時間,另一方面可以提高分類器的預測能力。RFFS特征選擇算法不僅能快速剔除相關和冗余特征,且該算法以分類精度最大化為目標,能有效地尋找到分類預測能力最優(yōu)的特征子集。本文基于該方法將原始特征集大小由127下降為26,不僅使得模型訓練和預測的時間大大縮短,并且使得最終的分類精度提高1.4%。

        (2) 本文的分類方法在地形條件復雜區(qū)域和地物邊緣處會產(chǎn)生較大的錯分誤差??傮w上來看,本文的分類方法對地面點和其他類點的識別能力很強,對建筑物點的識別能力稍弱。隨機森林模型建立過程中由于采用Bagging抽樣技術,使得模型對異常值和噪聲有較好的容忍度,并且不容易出現(xiàn)過擬合。與傳統(tǒng)的SVM分類算法進行比較發(fā)現(xiàn),基于隨機森林算法的分類總體精度和Kappa系數(shù)均要優(yōu)于SVM,體現(xiàn)了集成學習算法的優(yōu)勢。

        (3) 本文的特征重要性分析結果表明,歸一化高度在城市地區(qū)的點云分類中起到了核心作用,另外回波指數(shù)、激光強度、表面特征和空間分布特征對點云分類也起到了重要作用,高程統(tǒng)計量特征發(fā)揮的作用則較小。結合空間尺度的利用率來看,隨著鄰域尺度的增大,特征的利用率也在逐漸提高,并且激光強度特征和地面點回波指數(shù)在各個尺度均發(fā)揮作用。

        圖9 特征重要性得分結果Fig.9 Feature importance score results

        城市地物類型除了空間形態(tài)和回波特征等差異外,還有光譜信息、紋理信息等方面的差異,如果能將光譜特征和紋理特征引入到分類中,點云的分類精度有可能得到進一步提高,并為精細的地物類型分類提供支持。隨著無人機LiDAR技術的發(fā)展,集成光學或高光譜傳感器的無人機系統(tǒng)將逐步普及,未來將探索融合無人機影像與LiDAR的點云分類方法。

        參考文獻:

        [1] 范士俊, 張愛武, 胡少興, 等. 基于隨機森林的機載激光全波形點云數(shù)據(jù)分類方法[J]. 中國激光, 2013, 40(9): 0914001.

        FAN Shijun, ZHANG Aiwu, HU Shaoxing, et al. A Method of Classification for Airborne Full Waveform LiDAR Data Based on Random Forest[J]. Chinese Journal of Lasers, 2013, 40(9): 0914001.

        [2] YAN W Y, SHAKER A, EL-ASHMAWY N. Urban Land Cover Classification Using Airborne LiDAR Data: A Review[J]. Remote Sensing of Environment, 2015, 158(3): 295-310.

        [3] 徐宏根, 王建超, 鄭雄偉, 等. 面向對象的植被與建筑物重疊區(qū)域的點云分類方法[J]. 國土資源遙感, 2012, 24(2): 23-27.

        XU Honggen, WANG Jianchao, ZHENG Xiongwei, et al. Object-based Point Clouds Classification of the Vegetation and Building Overlapped Area[J]. Remote Sensing for Land & Resources, 2012, 24(2): 23-27.

        [4] 李峰, 崔希民, 劉小陽, 等. 機載LiDAR點云提取城市道路網(wǎng)的半自動方法[J]. 測繪科學, 2015, 40(2): 88-92.

        LI Feng, CUI Ximin, LIU Xiaoyang, et al. A Semi-automatic Algorithm of Extracting Urban Road Networks from Airborne LiDAR Point Clouds[J]. Science of Surveying and Mapping, 2015, 40(2): 88-92.

        [5] ANTONARAKIS A S, RICHARDS K S, BRASINGTON J. Object-based Land Cover Classification Using Airborne LiDAR[J]. Remote Sensing of Environment, 2008, 112(6): 2988-2998.

        [6] IM J, JENSEN J R, HODGSON M E. Object-based Land Cover Classification Using High-posting-density LiDAR Data[J]. GIScience & Remote Sensing, 2008, 45(2): 209-228.

        [7] ZHOU Weiqi. An Object-based Approach for Urban Land Cover Classification: Integrating LiDAR Height and Intensity Data[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(4): 928-931.

        [8] 郭波, 黃先鋒, 張帆, 等. 顧及空間上下文關系的JointBoost點云分類及特征降維[J]. 測繪學報, 2013, 42(5): 715-721.

        GUO Bo, HUANG Xianfeng, ZHANG Fan, et al. Points Cloud Classification Using JointBoost Combined with Contextual Information for Feature Reduction[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(5): 715-721.

        [9] 岳沖, 劉昌軍, 王曉芳. 基于多尺度維度特征和SVM的高陡邊坡點云數(shù)據(jù)分類算法研究[J]. 武漢大學學報(信息科學版), 2016, 41(7): 882-888.

        YUE Chong, LIU Changjun, WANG Xiaofang. Classification Algorithm for Laser Point Clouds of High-steep Slopes Based on Multi-scale Dimensionality Features and SVM[J]. Geomatics and Information Science of Wuhan University, 2016, 41(7): 882-888.

        [10] BRODU N, LAGUE D. 3D Terrestrial LiDAR Data Classification of Complex Natural Scenes Using a Multi-scale Dimensionality Criterion: Applications in Geomorphology[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2012, 68(1): 121-134.

        [11] ZHAO Jiaping, YOU Suya. Road Network Extraction from Airborne LiDAR Data Using Scene Context[C]∥2012 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops. Providence, RI, USA: IEEE, 2012: 9-16.

        [12] 喬紀綱, 劉小平, 張亦漢. 基于LiDAR高度紋理和神經(jīng)網(wǎng)絡的地物分類[J]. 遙感學報, 2011, 15(3): 539-553.

        QIAO Jigang, LIU Xiaoping, ZHANG Yihan. Land Cover Classification Using LiDAR Height Texture and ANNs[J]. Journal of Remote Sensing, 2011, 15(3): 539-553.

        [13] NIEMEYER J, WEGNER J D, MALLET C, et al. Conditional Random Fields for Urban Scene Classification with Full Waveform LiDAR Data[C]∥Proceedings of 2011 ISPRS Conference on Photogrammetric Image Analysis. Munich, Germany: Springer, 2011: 233-244.

        [14] AZADBAKHT M, FRASER C S, KHOSHELHAM K. Improved Urban Scene Classification Using Full-waveform LiDAR[J]. Photogrammetric Engineering & Remote Sensing, 2016, 82(12): 973-980.

        [15] CHU H J, WANG C K, KONG S J, et al. Integration of Full-waveform LiDAR and Hyperspectral Data to Enhance Tea and Areca Classification[J]. GIScience & Remote Sensing, 2016, 53(4): 542-559.

        [16] MALLET C, BRETAR F. Full-waveform Topographic LiDAR: State-of-the-art[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2009, 64(1): 1-16.

        [17] ZHANG Wuming, QI Jianbo, WAN Peng, et al. An Easy-to-Use Airborne LiDAR Data Filtering Method Based on Cloth Simulation[J]. Remote Sensing, 2016, 8(6): 501.

        [18] KIM H B, SOHN G. 3D Classification of Power-line Scene from Airborne Laser Scanning Data Using Random Forests[J]. International Archives of Photogrammetry and Remote Sensing, 2010, 38(3A): 126-132.

        [19] BREIMAN L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32.

        [20] 孫杰, 賴祖龍. 利用隨機森林的城區(qū)機載LiDAR數(shù)據(jù)特征選擇與分類[J]. 武漢大學學報(信息科學版), 2014, 39(11): 1310-1313.

        SUN Jie, LAI Zulong. Airborne LiDAR Feature Selection for Urban Classification Using Random Forests[J]. Geomatics and Information Science of Wuhan University, 2014, 39(11): 1310-1313.

        [21] 姚登舉, 楊靜, 詹曉娟. 基于隨機森林的特征選擇算法[J]. 吉林大學學報(工學版), 2014, 44(1): 137-141.

        YAO Dengju, YANG Jing, ZHAN Xiaojuan. Feature Selection Algorithm Based on Random Forest[J]. Journal of Jilin University (Engineering and Technology Edition), 2014, 44(1): 137-141.

        [22] THANGAVEL K, PETHALAKSHMI A. Dimensionality Reduction Based on Rough Set Theory: A Review[J]. Applied Soft Computing, 2009, 9(1): 1-12.

        [23] VO A V, TRUONG-HONG L, LAEFER D F, et al. Octree-based Region Growing for Point Cloud Segmentation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 104(1): 88-100.

        [24] ZHANG Kun, QIAO Shiquan, GAO Kai. A New Point Cloud Reconstruction Algorithm Based-on Geometrical Features[C]∥Proceedings of the 7th International Conference on Modelling, Identification and Control. Sousse, Tunisia: IEEE, 2015: 1-6.

        [25] BENTLEY J L. Multidimensional Binary Search Trees Used for Associative Searching[J]. Communications of the ACM, 1975, 18(9): 509-517.

        猜你喜歡
        特征選擇特征參數(shù)鄰域
        故障診斷中信號特征參數(shù)擇取方法
        基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
        稀疏圖平方圖的染色數(shù)上界
        基于鄰域競賽的多目標優(yōu)化算法
        自動化學報(2018年7期)2018-08-20 02:59:04
        基于PSO-VMD的齒輪特征參數(shù)提取方法研究
        Kmeans 應用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        關于-型鄰域空間
        聯(lián)合互信息水下目標特征選擇算法
        統(tǒng)計特征參數(shù)及多分類SVM的局部放電類型識別
        電測與儀表(2015年7期)2015-04-09 11:40:04
        基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
        男女做爰猛烈啪啪吃奶动| 91青青草手机在线视频| 在线免费看91免费版.| 国内精品久久久人妻中文字幕 | 性色av浪潮av色欲av| 欧美日韩亚洲色图| 国产精品久久夜伦鲁鲁| 黄片视频免费观看蜜桃| 无码人妻久久一区二区三区免费| 99久久久久国产| 台湾自拍偷区亚洲综合| 日韩精品专区在线观看 | 无码aⅴ在线观看| 国产精品一区二区午夜久久| 久久精品国产亚洲av麻豆床戏 | av免费在线播放观看| 亚洲av无码乱码在线观看富二代| 男女野外做爰电影免费| 亚洲熟妇av日韩熟妇av| 国产黑丝美女办公室激情啪啪 | 精品久久人妻av中文字幕| 国内揄拍国内精品少妇| 国产精品第一二三区久久蜜芽 | 老太婆性杂交视频| 日韩少妇激情一区二区| 精品三级久久久久久久| 日本一区二区三区熟女俱乐部| 亚洲熟女www一区二区三区| 无限看片在线版免费视频大全 | 精品偷拍被偷拍在线观看| 精品国产亚洲AⅤ麻豆| 日本久久精品在线播放| 日本亚洲精品一区二区三| 在线亚洲午夜理论av大片| 91青草久久久久久清纯| 日韩精品极品系列在线免费视频| 久热国产vs视频在线观看| 婷婷丁香91| 日韩产的人妻av在线网| 真实国产乱子伦精品视频| 亚洲AV日韩AV永久无码电影|