亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于位置編碼和雙距離注意的點云分割方法

        2024-03-25 06:39:04溫智成馮錦梁葉森輝
        激光與紅外 2024年2期
        關(guān)鍵詞:語義特征信息

        溫智成,王 蕾,馮錦梁,葉森輝

        (東華理工大學(xué)信息工程學(xué)院,江西 南昌 330013)

        1 引 言

        隨著機器人、自動駕駛和AR/VR應(yīng)用的日益普及,對3D點云數(shù)據(jù)處理的需求正在迅速增長[1-2]。然而,由于其固有的不規(guī)則性和無序性等特點,處理此類數(shù)據(jù)具有挑戰(zhàn)性。正則化的卷積不適用于點云處理。

        為了處理三維點云數(shù)據(jù),許多研究人員探索將它轉(zhuǎn)換為其他形式的表示,并應(yīng)用卷積運算來學(xué)習(xí)特征信息。這些方法可以分為三類:基于投影的方法[3-5]、基于體素化的方法[6-7]和基于點的方法[8-21]。

        基于投影的方法。將點云投影到二維平面上,將其作為正則化圖像進行處理。Gvcnn[3]設(shè)計了一個由視圖、組和形狀組成的框架,可以更有效地聚合來自各種視圖的信息并識別3D形狀。RangeNet++[4]將點云轉(zhuǎn)換為距離圖像表示,使用2D卷積進行語義分割,并使用k近鄰算法提高分割性能。View-gcn[5]使用圖卷積網(wǎng)絡(luò)聚合多視圖特征。但是,這種方式會導(dǎo)致部分點云信息的丟失。

        基于體素的方法。將點云轉(zhuǎn)換成三維體素,隨后通過三維卷積運算學(xué)習(xí)特征信息。Voxnet[6]網(wǎng)絡(luò)使用基于體素的表示作為對象識別和其他任務(wù)的輸入。SPVConv[7]引入了一種低成本、高分辨率的基于點的分支結(jié)構(gòu),可以捕獲更細粒度的信息。然而,該類方法會造成高額的計算成本和內(nèi)存消耗。

        基于點的方法。直接在原始點云上執(zhí)行卷積操作,無需將點云轉(zhuǎn)換為中間態(tài)的表示,從而避免了上述方法的缺點。PointNet[11]和PointNet++[12]是第一批直接對點進行操作的研究工作。AGConv[15]通過將坐標與對于點的其余特征相乘,使卷積對每個局部區(qū)域的操作是各向異性的。PCT[19]采用全局自注意力機制,使各點能夠關(guān)注彼此的特征信息。

        然而,上述基于點的方法由于使用對稱聚合操作,導(dǎo)致無法獲得點云的良好局部表示,從而導(dǎo)致局部信息的嚴重丟失。

        為了應(yīng)對這些挑戰(zhàn),本文提出了DualRes-Net網(wǎng)絡(luò)。利用位置編碼模塊(Position Encoding Module,PEM)對點云的坐標特征進行編碼,從而獲得更有效的局部信息表示。采用雙距離注意池(Dual-distance Attention Pooling,DDAP)將中心點與鄰近點的差異與注意力相結(jié)合,更好地實現(xiàn)了點云內(nèi)部局部信息的自適應(yīng)聚合。然后利用去分化殘差(De-Differentiation Residual,DDRes)結(jié)構(gòu)挖掘點云的深層語義信息,利用MLP分別學(xué)習(xí)對應(yīng)點的坐標特征等特征,從而穩(wěn)定模型的訓(xùn)練。本文提出的DualRes-Net在S3DIS Area5上的分割性能優(yōu)于許多基準網(wǎng)絡(luò)。

        2 本文方法

        本文提出了一種DualRes-Net網(wǎng)絡(luò),如圖1所示(圖中Input Data為輸入點云數(shù)據(jù);Output為預(yù)測語義;DS為下采樣方法),該網(wǎng)絡(luò)主要由三個關(guān)鍵模塊組成:位置編碼模塊(PEM)、雙距離注意池(DDAP)模塊和去分化殘差(DDRes)模塊。由于本文所提方法與點云的Transformer類方法相似,所以在本節(jié)中,我們首先介紹本文所提三個模塊的具體結(jié)構(gòu),隨后將本文方法與Transformer類方法進行比較。

        圖1 DualRes-Net網(wǎng)絡(luò)架構(gòu)

        2.1 位置編碼模塊(PEM)

        點云點屬性包括坐標、顏色和其他屬性。在點云語義分割任務(wù)中,網(wǎng)絡(luò)對位置信息比其他信息更敏感。例如,在分割綠墻和草地時,坐標特征可以清楚地顯示兩者的區(qū)別。

        因此,提出PEM模塊,如圖2所示(圖中N為點數(shù),k為最近鄰搜索次數(shù),3和C分別為坐標特征通道數(shù)和對應(yīng)點其余特征通道數(shù))。該模塊明確地將編碼的坐標特征與相應(yīng)的點特征融合,使點特征知道自己在空間中的位置。這使得PEM能夠清晰地觀察到局部信息,這對于學(xué)習(xí)復(fù)雜的場景結(jié)構(gòu)非常有益。該模塊的操作步驟如下:

        圖2 位置編碼模塊(PEM)

        (1)

        (2)

        重復(fù)兩次以上的點坐標編碼和點特征融合步驟,可以得到更好的局部點云表示,從而提高網(wǎng)絡(luò)的分割性能。

        2.2 雙距離注意池模塊(DDAP)

        圖3 雙距離注意池(DDAP)

        (3)

        (4)

        為了加快網(wǎng)絡(luò)的推理速度,我們將其設(shè)為負指數(shù)函數(shù),如式:

        (5)

        因此,處理后的輸入數(shù)據(jù)如式:

        (6)

        其中,“‖”為連接符號。

        處理后的數(shù)據(jù)通過MLP和softmax層傳遞,如式:

        score=Softmax(MLP(fconcat))

        (7)

        獲取局部區(qū)域內(nèi)各點對應(yīng)的分數(shù)。

        最后將分數(shù)乘以局部區(qū)域內(nèi)對應(yīng)的點,利用對稱函數(shù)Sum對局部信息進行匯總,如式:

        (8)

        2.3 去分化殘差模塊(DDRes)

        傳統(tǒng)的殘差模塊首先使用k近鄰(KNN)算法獲得局部區(qū)域。通過連接相應(yīng)點的坐標和其他特征,數(shù)據(jù)通過MLP和最大池化層提供。輸出再經(jīng)過兩層MLP處理學(xué)習(xí)特征信息,最后加入到輸入數(shù)據(jù)中形成殘差模塊的輸出。傳統(tǒng)殘差模塊結(jié)構(gòu)如圖4(a)所示,公式如下:

        圖4 去分化殘差(DDRes)

        fmax=max(φ(inputknn))

        (9)

        fout=φ×2(fmax)+inputfeat

        (10)

        其中,inputknn表示對輸入數(shù)據(jù)進行KNN搜索得到的局部數(shù)據(jù);inputfeat表示對應(yīng)點的其余特征;fmax表示MLP和max-pooling后的數(shù)據(jù)輸出;fout表示殘差模塊的輸出。

        傳統(tǒng)的殘差模塊是將坐標特征與對應(yīng)點的剩余特征進行拼接,利用MLP學(xué)習(xí)特征信息。受CN[21]的啟發(fā),由于不同的輸入類型(坐標特征、顏色特征)具有明顯不同的分布,這可能導(dǎo)致模型訓(xùn)練不穩(wěn)定。為了解決這一問題并穩(wěn)定模型訓(xùn)練,本文提出了去分化殘差(DDRes)模塊。MLP分別應(yīng)用于坐標特征和對應(yīng)點的其余特征。使用最大池將兩個MLP的輸出結(jié)果相加以獲得局部特征,然后將其通過兩個MLP層并與輸入數(shù)據(jù)相加。DDRes模塊結(jié)構(gòu)如圖4(b)所示,公式如下:

        fmid=φ(inputx)+φ(inputfeat)

        (11)

        fmax=max(fmid)

        (12)

        綜上所述,PEM可以獲得更好的點云局部表示,提高分割性能;DDAP模塊將中心點與鄰近點的差異與注意力池相結(jié)合,自適應(yīng)聚合局部信息;DDRes模塊使用去分化結(jié)構(gòu)來穩(wěn)定模型訓(xùn)練,同時從點云中挖掘深度信息。

        2.4 Transformer類方法

        本文所提方法DualRes-Net與點云的Transformer類方法類似,下面將詳細介紹Point Transformer[20]和Fast Point Transformer[21]方法。

        Point Transformer:該網(wǎng)絡(luò)的輸入為點云數(shù)據(jù),其中每個點由3D坐標和顏色特征表示。它首先將點云映射到一個低維特征空間,并將這些特征作為Transformer的輸入。Transformer由多個編碼器層組成,每個編碼器層包含自注意力機制和前饋神經(jīng)網(wǎng)絡(luò)。自注意力機制通過計算點與其他點之間的相似度,學(xué)習(xí)點的上下文信息,以至于每個點都能夠利用周圍點的信息來更新自身的特征表示。多頭自注意力機制并行計算多個關(guān)注權(quán)重,以捕捉不同層次的特征。通過多個編碼器層的堆疊,Point Transformer能夠建模點云中點的全局和局部關(guān)系,并提取豐富的特征。

        FastPoint Transformer:該方法在Point Transformer的基礎(chǔ)上引入了稀疏技術(shù),通過對點云進行子采樣來減少計算量。它的關(guān)鍵思想是將點云劃分為一組局部鄰域,并且僅對每個局部鄰域應(yīng)用Transformer操作。這樣可以減少自注意力機制的計算復(fù)雜度,并仍然能夠捕捉到全局和局部之間的關(guān)系。

        上述方法對點云局部利用自注意力機制,并在編碼器與解碼器層添加多個自注意力機制,從而獲得豐富的特征信息。然而,與本文方法DualRes-Net相比,由于在編碼器層與解碼器層存在多層自注意力,Transformer類方法會導(dǎo)致高額計算量的問題。

        3 實 驗

        在本節(jié)中,在S3DIS數(shù)據(jù)集上進行了實驗,以評估提出的DualRes-Net網(wǎng)絡(luò)。

        3.1 數(shù)據(jù)集

        S3DIS數(shù)據(jù)集是斯坦福大學(xué)提供的一個公開可用的數(shù)據(jù)集。它由271個房間組成,完全由6個不同的大型區(qū)域的點組成,有13個語義類別(窗戶,墻壁,椅子等)。每個點包含歐幾里德坐標和顏色信息。

        3.2 實現(xiàn)細節(jié)

        S3DIS數(shù)據(jù)集分為6個不同的區(qū)域(Area1-Area6)。本文使用Area5作為測試集,其余5個區(qū)域作為訓(xùn)練集。使用平均交聯(lián)(Intersection over Union,mIoU)作為語義分割性能的度量。

        提出的DualRes-Net網(wǎng)絡(luò)是基于Pytorch框架實現(xiàn)的。實驗在一臺配備NVIDIA RTX3080 GPU的服務(wù)器上進行。訓(xùn)練時,EPOCH設(shè)置為100,BatchSize設(shè)置為4,初始學(xué)習(xí)率設(shè)置為0.01,使用AdamW優(yōu)化器,使用余弦退火函數(shù)逐漸衰減學(xué)習(xí)率。

        3.3 評估性能

        DualRes-Net網(wǎng)絡(luò)和其他方法在S3DIS Area5上的量化語義分割性能如表1所示。

        表1 S3DIS Area5的語義分割結(jié)果

        表1展示了本文提出的DualRes-Net方法在S3DIS Area5上的定量語義分割性能,mIoU為63.7 %,OA為87.5 %,mAcc為70.8 %。與經(jīng)典的語義分割方法PointWeb、RandLA-Net和GACNet相比,該方法的mIoU分別提高了3.4 %、1.3 %和0.8 %。

        為了證明我們提出的方法在語義分割方面的有效性,我們在Area5中可視化了三種不同類型的房間,如圖5所示。

        圖5 Area5的部分房間可視化結(jié)果

        3.4 消融實驗

        為了驗證DualRes-Net中三個關(guān)鍵模塊的有效性,在Area5上進行了消融實驗。

        從表2可以看出(其中“√”表示采用該方法,“×”表示沒有采用該方法),如果移除PEM、DDAP和DDRes模塊,性能會下降8.9 %。加入位置編碼模塊PEM后,分割性能提高至55.6 %,比移除所有模塊提高1.8 %,說明對點云的位置信息進行編碼可以獲得有效的局部特征表示。與不添加殘差結(jié)構(gòu)Res相比,添加殘差結(jié)構(gòu)Res的模型性能提高了3.8 %,表明殘差結(jié)構(gòu)Res可以挖掘深度點云信息。與加入殘差結(jié)構(gòu)Res相比,加入去分化殘差模塊DDRes的模型性能提高了0.8 %,說明分別對對坐標和對應(yīng)點的其余特征應(yīng)用MLP可以穩(wěn)定模型訓(xùn)練,提高分割性能。最后,與不添加雙距離注意池模塊DDAP相比,添加DDAP可以使mIoU指標提高3.5 %,表明該模塊可以有效地自適應(yīng)聚合局部信息。

        表2 在Area5上的DualRes-Net消融實驗結(jié)果

        4 總 結(jié)

        本文提出了DualRes-Net網(wǎng)絡(luò),以解決現(xiàn)有的許多點云分割方法對局部位置信息表示能力有限以及丟失重要特征信息的問題。采用位置編碼模塊(PEM)對點坐標進行編碼,采用雙距離注意池(DDAP)模塊對局部特征信息進行自適應(yīng)聚合,采用去分化殘差(DDRes)模塊挖掘深層點云特征,采用多層感知器(MLP)分別對坐標和對應(yīng)點的其余特征進行處理。實驗結(jié)果表明,該方法的分割性能為mIoU 63.7 %,優(yōu)于許多現(xiàn)有點云語義分割的網(wǎng)絡(luò)。消融實驗表明了PEM、DDAP和DDRes模塊的有效性。

        猜你喜歡
        語義特征信息
        語言與語義
        如何表達“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        “上”與“下”語義的不對稱性及其認知闡釋
        認知范疇模糊與語義模糊
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        語義分析與漢俄副名組合
        免费网站国产| 亚洲人成网站在线播放2019| 极品白嫩的小少妇| 国产在线精品一区二区三区不卡| 高清国产美女一级a毛片在线| 一区二区黄色素人黄色| 国产自拍视频免费在线| 99久久精品日本一区二区免费| 国产精品一区高清在线观看| 日本免费一区精品推荐| 青青草骚视频在线观看| 久久久av精品波多野结衣| 亚洲久无码中文字幕热| 99精品又硬又爽又粗少妇毛片| 亚洲av午夜一区二区三| 国产免费av片在线播放| 亚洲最新版无码AV| 中国av一区二区三区四区| 亚洲午夜无码毛片av久久| 日产国产精品亚洲系列| 骚片av蜜桃精品一区| 一道本加勒比在线观看| 国产又黄又硬又粗| 亚洲最大av资源站无码av网址| 欧美zozo另类人禽交| 日本不卡一区二区三区久久精品 | 一区二区视频观看在线| 精品国产女主播一区在线观看| 成人试看120秒体验区| 永久黄网站色视频免费| 亚洲av粉色一区二区三区| 亚洲一区二区三区日本久久九| 女人被狂躁到高潮视频免费网站| 国产xxxxx在线观看免费| 免费观看一区二区三区视频| 欧美精品国产综合久久| 亚洲熟妇无码av不卡在线播放| 日韩av一区在线播放| 丰满少妇按摩被扣逼高潮| 亚洲日韩中文字幕一区| 国产丝袜精品丝袜一区二区|