張 蕊,李廣云,李明磊,王石巖
(1.信息工程大學導航與空天目標工程學院,河南鄭州 450001;2.華北水利水電大學軟件學院,河南鄭州 450011;3.河南省基礎地理信息中心,河南鄭州 450003)
利用PCA-BP算法進行激光點云分類方法研究
張 蕊1,2,李廣云1,李明磊1,王石巖3
(1.信息工程大學導航與空天目標工程學院,河南鄭州 450001;2.華北水利水電大學軟件學院,河南鄭州 450011;3.河南省基礎地理信息中心,河南鄭州 450003)
在闡述現(xiàn)有激光點云分類技術的基礎上,為滿足高精度、高速度、高可靠性、自動化的數(shù)據(jù)處理要求,著重研究了基于主成分分析(PCA)和BP神經(jīng)網(wǎng)絡的激光點云分類方法,并通過真實激光掃描數(shù)據(jù)進行試驗,將建筑物和樹葉有效分類,達到了預期效果。
激光點云;數(shù)據(jù)處理;主成分分析(PCA);BP神經(jīng)網(wǎng)絡;點云分類
隨著三維激光掃描技術的普及和發(fā)展,空間數(shù)據(jù)的獲取從傳統(tǒng)的單點數(shù)據(jù)采集向連續(xù)的、密集型自動數(shù)據(jù)獲取技術轉(zhuǎn)變,從而大大增加了數(shù)據(jù)采集量,提高了效率,使專業(yè)技術人員突破了傳統(tǒng)的數(shù)據(jù)處理模式,改進了數(shù)據(jù)處理理論和方法;尤其對于由激光掃描獲取的海量點云數(shù)據(jù)的后期處理,迫切需要高精度、高速度、高可靠性、自動化的數(shù)據(jù)處理技術,以滿足穩(wěn)定高效的數(shù)據(jù)處理要求,這不僅是測繪領域熱衷的研究方向,同時由于圖形、圖像處理技術和大數(shù)據(jù)處理技術等滲透其中,也成為計算機領域近年來研究的熱點。
點云分類是三維激光掃描數(shù)據(jù)處理的重點和熱點問題,也是點云數(shù)據(jù)處理的一項關鍵工作。而人工神經(jīng)網(wǎng)絡具有許多優(yōu)良特性,如具有較強的容錯性,能夠識別帶有噪聲的數(shù)據(jù);具有較強的自適應學習能力;采用并行工作方式,匹配速度快等。這些特性對解決海量激光點云分類問題是非常適合的。
激光掃描點云中既含有地面點又包含地物點,若要進行地物的提取和建筑物的三維重建,需要將植被、電線桿、建筑物、道路等進行區(qū)分,得到不同類型的點云系列,即激光掃描點云數(shù)據(jù)的分類。
目前,對于激光點云分類的研究主要體現(xiàn)在道路、植被和建筑物的提取等幾個方面,大部分的研究都是針對其中一個方面進行的。如在植被提取方面,文獻[1]使用 LiDAR數(shù)據(jù)生成距離圖像,然后使用圖像處理的方法提取植被;文獻[2]采用區(qū)域增長和梯度分割的方法來提取樹木;文獻[3]通過SVM分類實現(xiàn)城區(qū)植被的識別;關于建筑物的提取,文獻[4]利用強度信息和高程進行數(shù)據(jù)分類和分割,利用多次回波進行數(shù)據(jù)分類,先將植被提取出來,為分割相互毗鄰的房屋和樹木提供了一種有效的途徑;文獻[5]采用逐級分類的策略,先將點云數(shù)據(jù)分為地面點和非地面點,對于非地面點,首先將影像與點云數(shù)據(jù)套合,將影像的光譜信息賦予點云,根據(jù)光譜信息提取出光譜特征較為明顯的植被,然后在剩余的點云中利用高程紋理提取出建筑物,最后根據(jù)回波次數(shù)提取剩余植被點云。
除了常用的激光點云分類算法,還可利用專業(yè)的激光雷達點云數(shù)據(jù)處理軟件,如TerraScan、LASEdit等。其中TerraScan軟件是國內(nèi)外處理激光掃描點云數(shù)據(jù)的主要軟件,可以完成海量點云數(shù)據(jù)的讀取、分類、處理、建模等相關工作。對于分類,可以完成對建筑物、電線、植被等點云的自動分類提取[6]。如需要專業(yè)模塊,也可以人工手動提取,但工作量巨大。
以上分類算法一般都是半自動或人工操作方式,計算量大,處理過程復雜。在研究現(xiàn)有激光點云分類技術的基礎上,本文提出先根據(jù)主成分分析(principal component analysis,PCA)得到不同地物點在三維空間的幾何特征分布,然后將其特征送入神經(jīng)網(wǎng)絡進行訓練,構建神經(jīng)網(wǎng)絡模型,最后通過該模型對激光點云進行分類。本文把其命名為PCA-BP點云分類算法。
基于PCA-BP算法的激光點云數(shù)據(jù)分類算法包括主成分分析、BP神經(jīng)網(wǎng)絡構建、BP神經(jīng)網(wǎng)絡訓練及BP神經(jīng)網(wǎng)絡分類4個步驟,其算法流程如圖1所示。
圖1 PCA-BP算法流程
1.主成分分析
主成分分析是一種數(shù)學變換的方法,又稱主分量分析或矩陣數(shù)據(jù)分析,是指當變量之間存在一定的相關關系時,將相關變量通過線性組合變換成另一組不相關的變量,這些新的變量按照方差依次遞減的順序排列。在數(shù)學變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關,稱為第二主成分,依次類推。
基于主成分分析的點云分類使用掃描點的空間分布統(tǒng)計對點云局部幾何特征進行描述。對于平面點集
激光點云幾何特征的分布通過構造協(xié)方差矩陣(公式(4))并對該矩陣進行主成分分析得到。三維點集的協(xié)方差矩陣為三階,共3個主成分,從主成分的幾何意義出發(fā),第一和第二主成分代表曲面上的主趨勢,第三主成分(最小主成分)代表了三維表面法向方向的趨勢(平面度越好的點集第三主成分越接近零),如圖2所示。
圖2 主成分對應特征向量幾何示意圖
不同地物的掃描點在三維空間中呈不同的分布形態(tài)。為了得到掃描點的統(tǒng)計描述信息,對式(4)所示的協(xié)方差矩陣進行主成分分析得到按降序排列的特征值λ1≥λ2≥λ3[8]。若被掃物體為樹葉,則三個主成分滿足 λ1≈λ2≈λ3,見表1;若被掃物為墻面,則有λ1,λ2≥λ3,見表2。
2.BP神經(jīng)網(wǎng)絡模型的率定
BP(back propagation)神經(jīng)網(wǎng)絡是一種基于誤差反向傳播算法多層前饋神經(jīng)網(wǎng)絡,其具有分層結構,信息從輸入層傳遞到隱含層,逐層向前傳遞,最后到輸出層,除輸入層之外,每一層的輸入是上一層的輸出,如果輸出層的實際輸出與期望輸出不符,則誤差反向傳播,即輸出誤差以某種形式通過隱含層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,以該誤差為依據(jù)對網(wǎng)絡權值和閾值進行調(diào)整。信號正向傳播與誤差反向傳播的各層權值調(diào)整過程,周而復始地進行,該過程就是神經(jīng)網(wǎng)絡的學習訓練過程,一直進行到網(wǎng)絡的輸出誤差減少到可接受的程度,或進行到預先設定的學習次數(shù)為止[9]。
表1 樹葉激光點云三維坐標及主成分示例
表2 面狀激光點云三維坐標及主成分示例
本文采用的BP神經(jīng)網(wǎng)絡結構如圖3所示。其中,λ1、λ2、λn是BP神經(jīng)網(wǎng)絡的輸入;Y1、Ym是 BP神經(jīng)網(wǎng)絡的預測輸出;ωij和ωjk為權值;N、M、L分別表示輸入層、隱含層和輸出層神經(jīng)元的個數(shù)。由于表示點云空間幾何特征的輸入信息為三維,待分類的點云共有2類,因此本文采用的BP神經(jīng)網(wǎng)絡結構為3-4-2,即輸入層有3個節(jié)點,隱含層有4個節(jié)點,輸出層有2個節(jié)點。
圖3 BP神經(jīng)網(wǎng)絡結構
本文試驗所用數(shù)據(jù)為自新校區(qū)幼兒園室外掃描數(shù)據(jù),包含有2 151 693個掃描點,通過地面激光掃描儀采集獲得。計算機硬件環(huán)境為 Intel Core i5 CPU 2.6 GHz,內(nèi)存為8 GB,軟件環(huán)境為Win7、Matlab7.0、VS2012和PtCloudPro。試驗步驟如下:
1)主成分分析。對式(4)所示的協(xié)方差矩陣進行主成分分析得到3個特征值λ1、λ2、λ3。
2)為訓練樣本增加類別標識。由于樹葉點和平面點3個主成分之間的關系有顯著差異,依此給兩類點云增加類別標識1和0,其中標識為1的點為平面點,標識為0的點為樹葉點。
3)建立BP神經(jīng)網(wǎng)絡模型。經(jīng)過反復試驗和驗證,最終采用newff建立一前向BP網(wǎng)絡,訓練函數(shù)為 trainlm,隱含層傳遞函數(shù)為 logsig,學習率為0.05,訓練步數(shù)為50 000,訓練目標誤差為1e-6。
4)訓練神經(jīng)網(wǎng)絡。把平面樣本和樹葉樣本進行合并,隨機選取部分數(shù)據(jù)作為訓練樣本,其余作為測試樣本,λ1、λ2、λ3作為輸入,1、0組成的矩陣作為輸出,對神經(jīng)網(wǎng)絡進行訓練,當在指定的訓練次數(shù)范圍之內(nèi)達到指定的目標,訓練成功。
5)點云分類。將待分類樣本輸入已訓練好的BP網(wǎng)絡,根據(jù)輸出的值1或0確定是平面點或樹葉點。分類效果如圖4所示,從圖4(a)和(b)可以看出,建筑物點云與樹葉點云基本分開。
圖4 分類前后效果圖
本文提出的基于PCA-BP算法的激光點云分類方法,首先根據(jù)協(xié)方差矩陣由點云三維坐標計算出3個主成分,然后依此對BP神經(jīng)網(wǎng)絡進行訓練,最后用訓練好的網(wǎng)絡對待分類點云進行分類,試驗結果表明該方法能有效地將地物點云(建筑物和樹葉)進行分類。BP神經(jīng)網(wǎng)絡具有很強的自學習能力,能夠通過大量的訓練樣本,自動對權值等系數(shù)進行調(diào)整,直到輸出誤差達到期望誤差為止。但是由于激光點云數(shù)據(jù)量大,訓練和分類大量的數(shù)據(jù)樣本需要很長的時間;另外BP神經(jīng)網(wǎng)絡受經(jīng)驗值影響較大,網(wǎng)絡層數(shù)、各層神經(jīng)元個數(shù)、傳遞函數(shù)、訓練樣本的選擇等因素都會影響模型的建立和分類的效果,且泛化能力較差,可能會造成漏分和誤分的情況。因此,如何對BP神經(jīng)網(wǎng)絡進行改進、選擇其他類型的神經(jīng)網(wǎng)絡或與傳統(tǒng)分類方法相結合等是下一步要研究的內(nèi)容。
[1] CHEN G,ZAKHOR A.2D Tree Detection in Large Urban Landscapes Using Aerial LiDAR Data[C]∥16th IEEE International Conference.[S.l.]:IEEE,2009:1693-1696.
[2] 張齊勇,岑敏儀,周國清,等.城區(qū)LiDAR點云數(shù)據(jù)的樹木提取[J].測繪學報,2009,38(4):330-335.
[3] 劉峰,龔健雅.基于3D LiDAR數(shù)據(jù)的城區(qū)植被識別研究[J].地理與地理信息科學,2009,25(6):5-8.
[4] 張小紅.機載激光掃描測高數(shù)據(jù)濾波及地物提取[D].武漢:武漢大學,2002.
[5] 龔亮.機載LiDAR點云數(shù)據(jù)分類技術研究[D].鄭州:信息工程大學,2011.
[6] 鄭斌,包亞東.車載LiDAR數(shù)據(jù)的初探[C]∥江蘇省測繪學會2011年學術年會論文集.[S.l.]:江蘇省測繪學會,2011.
[7] 王學民.應用多元分析[M].2版.上海:上海財經(jīng)大學出版社,2004:232-238.
[8] 梁玉斌.面向建筑測繪的地面激光掃描模式識別方法研究[D].武漢:武漢大學,2013.
[9] 施彥,韓力群,廉小親,等.神經(jīng)網(wǎng)絡設計方法與實例分析[M].北京:北京郵電大學出版社,2009.
[10] 龔俊,柯勝男,朱慶,等.一種八叉樹和三維R樹集成的激光點云數(shù)據(jù)管理方法[J].測繪學報,2012,41 (4):597-604.
Classification of LiDAR Point Clouds Based on PCA-BP Algorithm
ZHANG Rui,LI Guangyun,LI Minglei,WANG Shiyan
P234.5
B
0494-0911(2014)07-0023-04
2014-04-08
國家自然科學基金(41274014)
張 蕊(1980—),女,河南濮陽人,博士生,研究方向為激光點云數(shù)據(jù)處理、大數(shù)據(jù)處理。
張蕊,李廣云,李明磊,等.利用PCA-BP算法進行激光點云分類方法研究[J].測繪通報,2014(7):23-26.
10.13474/j.cnki.11-2246.2014.0217