向澤君,滕德貴,袁長征,龍川
(重慶市勘測院,重慶 401121)
建筑立面信息在建構(gòu)筑物模型重建[1]、老舊小區(qū)改造[2]等方面具有重要作用,傳統(tǒng)的立面測量方法包括全站儀法、測距儀法及攝影測量法[3]等,存在信息獲取不全、作業(yè)效率低等問題。三維激光掃描可快速獲取具有三維坐標(biāo)及顏色、強(qiáng)度、紋理等屬性的海量點(diǎn)云,極大提升了空間地理信息的獲取能力[4-5],也為建筑立面圖測繪提供了一種更新、更快的技術(shù)手段[6]。由于點(diǎn)云中包含的地物類型多樣、點(diǎn)密度分布不均且存在各種噪聲,快速準(zhǔn)確地提取建筑立面一直是點(diǎn)云數(shù)據(jù)處理的難點(diǎn)。
學(xué)者們針對點(diǎn)云分類與提取進(jìn)行了大量研究,主要算法分為模型擬合法[7-8]、屬性聚類法[9-10]、區(qū)域生長法[11-13]、機(jī)器學(xué)習(xí)算法[14-20]以及平面投影法[21-23]等。其中,模型擬合法[7-8]基于平面、球體、圓柱體等幾何體的數(shù)學(xué)模型進(jìn)行點(diǎn)云分隔,處理速度快,但只適用于規(guī)則地物的提??;屬性聚類法[9-10]利用點(diǎn)云的特征進(jìn)行聚類和分隔,其結(jié)果較穩(wěn)定,但無法區(qū)分特征相似的地物,且處理復(fù)雜場景時耗時較長;區(qū)域生長法[11-13]首先選取種子點(diǎn),然后搜索鄰域內(nèi)滿足一定相似性標(biāo)準(zhǔn)的點(diǎn)進(jìn)行聚類,通過不斷生長完成分割,算法結(jié)果依賴于種子點(diǎn)及生長準(zhǔn)則的選取,選取不當(dāng)將導(dǎo)致過生長或欠生長;面向三維點(diǎn)云的機(jī)器學(xué)習(xí)算法[14-20]框架還有待完善,且需要大量樣本數(shù)據(jù)進(jìn)行訓(xùn)練,分類結(jié)果具有一定隨機(jī)性。
點(diǎn)云平面投影方法[21-23]將三維點(diǎn)云投影到二維平面并進(jìn)行格網(wǎng)劃分得到點(diǎn)云特征圖像,然后采用圖像處理方法進(jìn)行分類,具有算法簡單、運(yùn)算速度快等優(yōu)點(diǎn),在點(diǎn)云分類方面得到了廣泛應(yīng)用。史文中等[21]基于點(diǎn)云投影密度進(jìn)行建筑物立面提取,由于分類標(biāo)準(zhǔn)單一,提取結(jié)果容易受其他地物干擾,在地形起伏較大、地物復(fù)雜多樣時效果難以保證;盧秀山等[22]通過三維和二維格網(wǎng)進(jìn)行綜合判斷,并基于RANSAC算法去噪,提高了分類精度,但算法復(fù)雜度高,運(yùn)算效率較低。邵磊等[23]提出了一種結(jié)合多種投影影像提取建筑物的方法,但該方法首先要進(jìn)行地面點(diǎn)云提取,增加了算法復(fù)雜度,且地面點(diǎn)提取精度將直接影響后續(xù)建筑物提取精度。
針對上述傳統(tǒng)格網(wǎng)算法存在的問題,引入點(diǎn)云的單點(diǎn)語義、格網(wǎng)語義和區(qū)域語義,構(gòu)建基于多層次語義特征的建筑立面點(diǎn)云提取方法,并對不同場景的點(diǎn)云數(shù)據(jù)進(jìn)行提取,驗(yàn)證算法的有效性。
建筑區(qū)地物可分為地面(含低矮植被)、建筑物、桿狀物、樹木及其他地物類型[24],通過地面三維激光掃描儀獲取的部分地物點(diǎn)云及平面投影如圖1所示,其具體特性如下:
圖1 建筑區(qū)典型地物點(diǎn)云及平面投影Fig.1 Typical surface point cloud and plane projection in the building
1)建筑物點(diǎn)云特征。建筑物外形較為規(guī)則,高度較高,點(diǎn)云集中在建筑物外立面,投影到XOY平面后呈線性連續(xù)分布,立面投影區(qū)域點(diǎn)云密度大,建筑物內(nèi)部點(diǎn)云密度小。此外,由于建筑立面一般垂直于地面,點(diǎn)云法向量垂直角集中分布在90°附近,標(biāo)準(zhǔn)差較小。
2)地面點(diǎn)云特征。地面點(diǎn)云高程值較小,投影到平面后呈面狀均勻分布,法向量垂直角分散分布,標(biāo)準(zhǔn)差較大。
3)桿狀地物點(diǎn)云特征。電桿、路燈等桿狀地物一般垂直于地面且有一定高度,投影面積小,點(diǎn)密度較大。立桿部分與附屬部件(如燈泡、攝像頭等)法向量垂直角差異較大。
4)樹木點(diǎn)云特征。樹木具有一定高度,且樹冠范圍較樹干大,單棵樹木投影后呈近似圓形分布,投影范圍內(nèi)點(diǎn)密度分布較為均勻,法向量垂直角標(biāo)準(zhǔn)差較大。
計算圖1中各點(diǎn)云的法向量,并分別選取10 000個來計算其垂直角(法向量與Z軸夾角),分布特征如圖2和表1所示:
圖2 建筑區(qū)典型地物法向量垂直角分布統(tǒng)計圖Fig.2 Normal vector vertical angle distribution of typical features in the building
表1 建筑區(qū)典型地物法向量垂直角均值及標(biāo)準(zhǔn)差統(tǒng)計表Table 1 Mean and standard deviation of normal vector vertical angle of typical features in the building area
根據(jù)各類地物的空間特征,結(jié)合建筑立面提取的需求,構(gòu)建點(diǎn)云單點(diǎn)語義、格網(wǎng)語義和區(qū)域語義3類特征。
1)單點(diǎn)語義特征。對于點(diǎn)P,將其高程值PZ作為單點(diǎn)語義特征,即
P={PZ}
(1)
基于該特征,通過設(shè)置低點(diǎn)閾值Zlow可將低于該值的非建筑點(diǎn)云剔除;若大于高點(diǎn)閾值Zhigh的點(diǎn)全部為建筑立面點(diǎn),則可將該閾值以上的點(diǎn)標(biāo)記為建筑立面點(diǎn)。
2)格網(wǎng)語義特征。將點(diǎn)云進(jìn)行平面投影并按一定尺寸劃分格網(wǎng)G,計算格網(wǎng)內(nèi)的點(diǎn)云密度GD、最高點(diǎn)與最低點(diǎn)高差GH作為單元格網(wǎng)的語義特征,即
G={GD,GH}
(2)
由于建筑物具有一定高度且在立面處的點(diǎn)云投影密度較大,可將格網(wǎng)密度或高差低于一定閾值的非建筑立面點(diǎn)云剔除。
3)區(qū)域語義特征。將滿足格網(wǎng)語義特征閾值要求的格網(wǎng)定義為興趣格網(wǎng),相互連通的興趣格網(wǎng)集合定義為一個對象區(qū)域A,對每個區(qū)域采用安德魯算法(Andrew’s Algorithm)計算凸包,統(tǒng)計凸包范圍內(nèi)格網(wǎng)總數(shù)AT以及興趣格網(wǎng)數(shù)量AC,按式(3)計算興趣格網(wǎng)比例。
(3)
建筑物對應(yīng)區(qū)域AC較大但AR較??;桿狀物及樹木對應(yīng)區(qū)域AC較小但AR較大。此外,由于建筑立面點(diǎn)云法向量垂直角標(biāo)準(zhǔn)差A(yù)N明顯小于其他地物,可作為立面點(diǎn)云提取的一個重要特征。綜上,將AC、AR以及AN作為對象區(qū)域的語義特征,即
A={AC,AR,AN}
(4)
以上定義的點(diǎn)云單點(diǎn)語義、格網(wǎng)語義及區(qū)域語義分別代表地物的單點(diǎn)特征、局部特征和整體特征,形成了點(diǎn)云多層次語義特征描述子,如表2及圖3所示。
表2 點(diǎn)云多層次語義特征Table 2 Multi-level semantic features of point cloud
圖3 點(diǎn)云多層次語義特征示意圖Fig.3 Multi-level semantic features of point
基于上述多層次語義特征描述子,提出一種建筑立面點(diǎn)云提取算法:首先通過單點(diǎn)語義特征,即點(diǎn)的高程值剔除低于建筑物的點(diǎn)云,同時提取出一定高度以上僅包含建筑物的高層建筑點(diǎn)云;然后將剩余點(diǎn)云及高層建筑點(diǎn)云投影到XOY平面并劃分格網(wǎng),根據(jù)格網(wǎng)語義特征選取興趣格網(wǎng);最后對興趣格網(wǎng)進(jìn)行連通性分析得到對象區(qū)域,并基于區(qū)域語義特征實(shí)現(xiàn)建筑立面點(diǎn)云的精確提取,具體步驟如下。
1)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理主要是通過裁剪、濾波等方式剔除點(diǎn)云中的噪點(diǎn),減少對后續(xù)數(shù)據(jù)處理的干擾;此外,按一定采樣間隔進(jìn)行重采樣,去除過密點(diǎn)云,提高運(yùn)算效率。
2)基于單點(diǎn)語義特征的初步分類。設(shè)置低點(diǎn)閾值Zlow,剔除低于該值的非建筑點(diǎn)云;設(shè)置高點(diǎn)閾值Zhigh,提取高于該值的建筑立面點(diǎn),即
(5)
閾值設(shè)置時,要確保低于Zlow無建筑立面點(diǎn),高于Zhigh只有建筑立面點(diǎn)。
3)點(diǎn)云平面投影及單元格網(wǎng)劃分。將步驟2)得到的待分類點(diǎn)以及高層建筑立面點(diǎn)投影到XOY平面,投影計算公式為
(6)
式中:X、Y、Z為點(diǎn)云原始坐標(biāo);X′、Y′、Z′為投影后坐標(biāo);h為投影面高程,一般取0。投影后即可按一定間隔d進(jìn)行格網(wǎng)劃分,設(shè)點(diǎn)云平面坐標(biāo)最大、最小值分別為Xmin、Ymin、Xmax、Ymax,則格網(wǎng)的行列數(shù)R、C分別為
(7)
設(shè)點(diǎn)i坐標(biāo)為(xi,yi,zi),則對應(yīng)格網(wǎng)行列號ri、ci為
(8)
式中:floor為小于該值的最大整數(shù),且行列號從0開始計數(shù)。
4)基于格網(wǎng)語義特征的二次分類。設(shè)格網(wǎng)I內(nèi)的點(diǎn)數(shù)為N,對應(yīng)三維點(diǎn)云坐標(biāo)為(XIi,YIi,ZIi),i=1,2,…,N,則該格網(wǎng)的點(diǎn)密度GDI、高差GHI分別為
GDI=N/d2
(9)
(10)
設(shè)置點(diǎn)密度閾值GD_th和高差閾值GH_th,并基于式(11)所示準(zhǔn)則選取建筑物立面對應(yīng)興趣格網(wǎng)。
g(GD,GH)=
(11)
點(diǎn)密度閾值GD_th根據(jù)點(diǎn)云密度與格網(wǎng)尺寸d進(jìn)行確定;高差閾值GH_th應(yīng)略小于范圍內(nèi)最矮建筑物的高度。
5)基于區(qū)域語義特征的精確分類。對興趣格網(wǎng)進(jìn)行連通性分析得到多個對象區(qū)域,設(shè)區(qū)域J包含的興趣格網(wǎng)數(shù)量為S,對應(yīng)凸包范圍內(nèi)格網(wǎng)總數(shù)為T,則該區(qū)域語義特征ACJ、ARJ分別為
ACJ=S
(12)
(13)
計算區(qū)域內(nèi)點(diǎn)云法向量及垂直角,并統(tǒng)計垂直角標(biāo)準(zhǔn)差A(yù)NJ,然后設(shè)置各特征閾值A(chǔ)C_th、AR_th及AN_th,基于式(14)所示準(zhǔn)則進(jìn)行建筑立面點(diǎn)云的精確分類。
a(AC,AR)={(AC>AC_th)∧(AR (14) 興趣格網(wǎng)數(shù)量閾值A(chǔ)C_th根據(jù)格網(wǎng)尺寸與建筑物大小進(jìn)行設(shè)置;根據(jù)測試,比例閾值A(chǔ)R_th一般設(shè)置為20%~30%,法向量垂直角標(biāo)準(zhǔn)差閾值A(chǔ)N_th一般設(shè)置為5°~10°。 最后,查詢平面投影位于建筑立面區(qū)域內(nèi)的點(diǎn)云,與步驟(2)提取的高層建筑點(diǎn)云取并集,即得到滿足多層次語義特征的建筑立面點(diǎn)云。 算法流程如圖4所示。 圖4 算法流程圖 目前,基于屬性聚類算法的點(diǎn)云分類方法在多款主流的點(diǎn)云商業(yè)處理軟件中方得到了實(shí)現(xiàn),使用較為廣泛。本文算法是對傳統(tǒng)格網(wǎng)密度算法的改進(jìn),因此,分別采用本文算法、傳統(tǒng)格網(wǎng)密度(DoPP)算法以及屬性聚類算法對不同場景的點(diǎn)云數(shù)據(jù)進(jìn)行建筑立面提取,并對提取結(jié)果進(jìn)行評價以驗(yàn)證本文算法的提取精度、效率及適用性。 實(shí)驗(yàn)數(shù)據(jù)為低層建筑區(qū)、高層建筑區(qū)以及超高層建筑區(qū)3種典型場景的實(shí)測地面三維激光點(diǎn)云,如圖5所示。 圖5 實(shí)驗(yàn)數(shù)據(jù) 3個數(shù)據(jù)集的基本特征如表3所示。 表3 點(diǎn)云數(shù)據(jù)集特征描述Table 3 Feature description of point cloud data set 首先通過人工編輯方式對3個數(shù)據(jù)集中的建筑立面進(jìn)行精細(xì)提取,并將其作為評價算法精度的標(biāo)準(zhǔn);然后分別用3種算法提取建筑立面點(diǎn)云,對提取結(jié)果的精度、適應(yīng)性及效率進(jìn)行對比分析。其中本文算法及DoPP算法采用C++語言編程實(shí)現(xiàn),屬性聚類算法采用某商業(yè)軟件點(diǎn)云分類功能模塊。 2.2.1 參數(shù)設(shè)置 針對不同數(shù)據(jù)集的實(shí)際特點(diǎn),設(shè)置了本文算法以及DoPP算法的各項(xiàng)參數(shù),為便于比較,對兩種算法設(shè)置相同的格網(wǎng)尺寸和點(diǎn)云密度參數(shù),如表4所示。 表4 算法參數(shù)表Table 4 Algorithm parameters 2.2.2 算法提取 圖6、圖7、圖8分別展示了采用人工精細(xì)分類、本文算法、DoPP算法以及屬性聚類算法對3個數(shù)據(jù)集的建筑立面提取結(jié)果。 圖6 低層建筑區(qū)提取結(jié)果Fig.6 Extraction results of low-rise building 圖7 高層建筑區(qū)提取結(jié)果Fig.7 Extraction results of high-rise building 圖8 超高層建筑區(qū)提取結(jié)果Fig.8 Extraction results of super-tall building 2.2.3 評價指標(biāo) 以人工提取結(jié)果作為真實(shí)值,分別按式(15)、(16)、(17)、(18)計算各算法提取結(jié)果的真正類率(True Positive Rate,TPR)、假正類率(False Positive Rate,F(xiàn)PR)、準(zhǔn)確率(Accuracy,Acc)和交并比(Intersection over Union,IoU)4個精度指標(biāo),同時,統(tǒng)計運(yùn)算時間來評價算法效率。 (15) (16) (17) (18) 式中:TP、FP、TN、FN的含義可用混淆矩陣表示。 表5 分類混淆矩陣Table 5 Classification confusion matrix 為評價算法效率,采用3種算法對所有數(shù)據(jù)集分別處理10次,計算平均用時,測試平臺基本參數(shù)如表6所示。 表 6測試平臺基本參數(shù)表Table 6 Basic parameter of test platform 3種分類方法的評價指標(biāo)如表7所示。 從圖6、圖7、圖8以及表7中可以看出: 表7 提取結(jié)果對比分析Table 7 Comparison and analysis of extracted results 1)提取精度方面:除了高層建筑區(qū)的TPR指標(biāo),本文算法其他各項(xiàng)指標(biāo)均為最優(yōu)。對于高層建筑區(qū),DoPP算法的TPR指標(biāo)最高,即該算法提取的真實(shí)建筑立面點(diǎn)最多,但FPR指標(biāo)同樣很高,說明結(jié)果中包含了大量錯分點(diǎn),圖7(c)也證明了這一結(jié)論。 2)場景適應(yīng)性方面:本文算法對3種不同場景的點(diǎn)云均提取出了較為完整的建筑立面,僅在點(diǎn)云過于稀疏的立面和擋墻處(圖6(b)A、B處;圖7(b)C、D處;圖8(b)E、F、G處)有部分缺失;DoPP算法在低層及高層建筑區(qū)的錯分點(diǎn)云較多(圖6(c)、圖7(c)),在超高層建筑上部立面缺失明顯(圖8(c));屬性聚類算法在高層建筑區(qū)提取效果較好,但無法剔除大面積的密集植被,且超高層建筑立面缺失嚴(yán)重(圖8(d))。 3)運(yùn)算效率方面:與DoPP算法相比,由于本文算法顧及的特征更加全面,運(yùn)算時間略有增加,但相差均小于1 s,且都在10 s以內(nèi);屬性聚類算法運(yùn)算時間較長。 綜合各項(xiàng)評價指標(biāo),本文算法在提取精度及不同場景的適應(yīng)性方面均明顯優(yōu)于DoPP算法及屬性聚類算法;在運(yùn)算效率方面與于DoPP算法相當(dāng),與屬性聚類算法相比優(yōu)勢明顯。 結(jié)合各類地物點(diǎn)云的單點(diǎn)特征、局部特征及整體特征構(gòu)建對應(yīng)的語義屬性,并提出了一種基于多層次語義特征的建筑物立面提取方法。該方法的主要貢獻(xiàn)有: 1)綜合考慮點(diǎn)云高程、平面投影點(diǎn)密度及分布特征、法向量垂直角等多層次語義特征,實(shí)現(xiàn)對建筑立面的精確描述,提高了提取結(jié)果的正確率和完整性。 2)將三維分類問題轉(zhuǎn)化到二維平面,算法效率高。 3)算法參數(shù)設(shè)置靈活,適應(yīng)性好,可滿足不同場景的提取需求。 通過不同場景點(diǎn)云的提取實(shí)驗(yàn)結(jié)果表明:該方法可快速有效的提取復(fù)雜環(huán)境中的建筑立面點(diǎn)云,與傳統(tǒng)DoPP算法及屬性聚類算法相比,提取精度及適應(yīng)性顯著提高。目前,算法參數(shù)需根據(jù)點(diǎn)云的實(shí)際情況進(jìn)行設(shè)定,下一步將研究參數(shù)的自適應(yīng)設(shè)置,提高算法的實(shí)用性,并在三維建模、智慧城市建設(shè)等領(lǐng)域推廣應(yīng)用。2 實(shí)驗(yàn)分析
2.1 實(shí)驗(yàn)數(shù)據(jù)
2.2 實(shí)驗(yàn)方法
2.3 結(jié)果分析
3 結(jié)論