亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于偏移注意力機制和多特征融合的點云分類

        2024-02-15 03:04:04田晟宋霖趙凱龍
        關(guān)鍵詞:分類特征融合

        田晟 宋霖 趙凱龍

        (華南理工大學(xué) 土木與交通學(xué)院,廣東 廣州 510640)

        隨著深度學(xué)習(xí)在各領(lǐng)域的興起,對點云相關(guān)的研究也逐漸深入。由于點云可以獲取物體的三維坐標(biāo)等多種信息,且具有無序性、旋轉(zhuǎn)不變性和稀疏性的特性,在自動駕駛、機器人和測繪方面都得到了廣泛的應(yīng)用,目前對點云分類主流的研究方法主要有基于多視圖的方法、基于體素的方法、直接基于點的方法等。

        在基于多視圖的研究方法中,MVCNN[1]實現(xiàn)了不同角度投影的特征提取,相對于傳統(tǒng)的機器學(xué)習(xí)算法有一定的提升?;隗w素的方法是采取已有的方法將點云轉(zhuǎn)換為三維體積形狀,利用現(xiàn)在較為成熟的三維卷積網(wǎng)絡(luò)實現(xiàn)分類,2015 年Voxnet 網(wǎng)絡(luò)[2]的提出實現(xiàn)了體素在點云分類中的應(yīng)用。Zhang等[3]將注意力機制和基于體素的方法相結(jié)合,分類總體準(zhǔn)確率達到了94.0%。對多視圖而言,由于視點的位置和角度的變換會導(dǎo)致部分重要信息的丟失,而基于體素的方法對資源消耗比較大。

        相對于多視圖以及體素的研究方法,直接對點云數(shù)據(jù)進行特征提取不僅減少了前期人工處理工作,且不易丟失特征信息,充分利用了點云數(shù)據(jù)的優(yōu)勢,是研究人員較為熱衷的方向之一。Qi等[4]于2017 年提出PointNet,直接利用多層感知機(MLP)提取最終全局特征,又于同年提出PointNet++[5]進行最遠點采樣并分組,通過PointNet 提取點云局部特征,經(jīng)最大池化進行降采樣以減少運算量。PointCNN[6]利用多層感知機實現(xiàn)點特征變換以模仿CNN 進行特征提取。Wu 等[7]提出的PointConv 通過構(gòu)建逆密度變換實現(xiàn)卷積核的動態(tài)更新,分類總體準(zhǔn)確率達到了92.5%。陳根等[8]通過整合點與點的關(guān)系特征以及中心點的特征,分類總體準(zhǔn)確率與PointConv 相同。Xu 等[9]提出的PAConv 通過利用動態(tài)生成的分?jǐn)?shù)權(quán)重乘以初始權(quán)值以實現(xiàn)卷積核的動態(tài)更新,嵌入DGCNN 網(wǎng)絡(luò)準(zhǔn)確率較PointConv 提升1.1%。Wang 等[10]提出的DGCNN 采用圖卷積的方式,聚合中心點和鄰居節(jié)點的特征,實現(xiàn)了鄰居節(jié)點特征的聚合,分類總體準(zhǔn)確率達到了92.2%。Zhang 等[11]在DGCNN 的基礎(chǔ)上,引入殘差結(jié)構(gòu),實現(xiàn)不同層級動態(tài)圖的連接,準(zhǔn)確率較DGCNN 提高了0.7%。以上網(wǎng)絡(luò)模型都較少考慮點云多特征的融合,而全局和局部特征還可以進一步的豐富,蘭紅等[12]利用圖卷積提取節(jié)點間位置關(guān)系,利用三維方向卷積捕捉節(jié)點間方向信息,進行信息組合獲取更加豐富的局部鄰域特征。蘆新宇等[13]構(gòu)造局部-非局部交互卷積模塊,實現(xiàn)低層次的幾何信息和高層次的語義信息的融合,構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)分類總體準(zhǔn)確率達到了93.4%。戴莫凡等[14]融合了3 個尺度下的K 近鄰點云特征導(dǎo)入提出的幾何卷積神經(jīng)網(wǎng)絡(luò)模塊。杜靜等[15]同時引入殘差優(yōu)化結(jié)構(gòu)和多特征融合方法實現(xiàn)了S3DIS(Stanford Large-Scale 3D Indoor Spaces Datase)室內(nèi)和Semantic3D 室外數(shù)據(jù)集的點云語義分割。從大多數(shù)學(xué)者的網(wǎng)絡(luò)改進方式來看,直接對點云實現(xiàn)分類的網(wǎng)絡(luò)結(jié)構(gòu),大多是基于PointNet和DGCNN網(wǎng)絡(luò)進行局部改進。

        隨著Transformer[16]在自然語言處理等領(lǐng)域效果日漸顯著,不少學(xué)者利用Transformer的思想,對網(wǎng)絡(luò)模型進行改進以適應(yīng)點云的特性。Zhao等[17]設(shè)計自注意力機制層應(yīng)用于3D 點云分類。Chen 等[18]將注意力機制嵌入圖神經(jīng)網(wǎng)絡(luò)中,采用多頭注意力機制,提出點云分類網(wǎng)絡(luò)GAPNet,通過學(xué)習(xí)局部的幾何表示,得到了在中心點附近不同的注意力權(quán)重,實現(xiàn)更加有效地利用局部特征。Guo 等[19]提出的PCT網(wǎng)絡(luò)對自注意力機制所得的特征矩陣和原始矩陣作差以得到偏移注意力機制,實現(xiàn)了93.2%的總體分類準(zhǔn)確率。陳涵娟等[20]提出競爭注意力融合模塊嵌入基準(zhǔn)網(wǎng)絡(luò),實現(xiàn)多層級特征融合,并同存在噪聲的數(shù)據(jù)集測試結(jié)果進行了對比實驗,最優(yōu)總體準(zhǔn)確率達到93.2%。王利媛等[21]引入PointConv 中的點卷積算子和注意力機制模塊,在ISPRS Vaihingen三維語義標(biāo)記基準(zhǔn)數(shù)據(jù)集和GML_DataSetA室外機載點云數(shù)據(jù)集上進行分類測試實驗,驗證了方法的有效性。

        同時也有不少計算機圖形學(xué)中的幾何學(xué)的知識應(yīng)用于點云特征提取當(dāng)中,對整體或者部分區(qū)域的幾何結(jié)構(gòu)特征進行描述,如CurveNet[22]選取了點云中的曲線以突顯局部形狀,RepSurf[23]提出的Umbrella Surfaces較好表示局部幾何結(jié)構(gòu),也取得了較好的效果。由于利用幾何形狀的特征提取計算過程較為復(fù)雜,故嘗試直接利用Tansformer 的思想和多特征融合方法實現(xiàn)點云分類。

        無論是基于體素、基于多視圖還是基于點的方法,大多僅單一考慮了全局或局部特征,針對這一問題,本文將點的全局特征信息和局部信息進行融合,并利用殘差連接和偏移注意力機制,提升特征提取能力,實現(xiàn)測試集上點云對象的類別判定。

        1 網(wǎng)絡(luò)框架

        1.1 模型總體結(jié)構(gòu)

        本文受到LDGCNN[11]和PCT[19]網(wǎng)絡(luò)的啟發(fā),提出了一種基于融合注意力機制的多特征融合殘差網(wǎng)絡(luò),利用Offset-Attention 模塊[19]實現(xiàn)初始特征提取,然后實現(xiàn)點云特征和三維坐標(biāo)特征的融合,引入殘差結(jié)構(gòu)以防止淺層特征的丟失。網(wǎng)絡(luò)總體框架和框架細(xì)節(jié)如圖1和圖2所示。

        圖1 模型總體結(jié)構(gòu)Fig.1 The overall structure of the model

        圖2 網(wǎng)絡(luò)結(jié)構(gòu)細(xì)節(jié)Fig.2 Network structure details

        圖1中,模型總體采用類似ResNet的結(jié)構(gòu),以兩個基本模塊構(gòu)成一個網(wǎng)絡(luò)層級,其中第1類基本模塊會改變點云特征矩陣的通道數(shù),故采用藍色箭頭進行連接,第2類基本模塊用于提取更深層次的網(wǎng)絡(luò)特征,不改變特征矩陣通道數(shù),故采用黑色箭頭進行連接。

        多個網(wǎng)絡(luò)層級進行殘差連接以提取深層次的隱式特征,最后通過最大池化和平均池化得到全局拼接的點云特征,導(dǎo)入全連接層實現(xiàn)點云分類任務(wù),網(wǎng)絡(luò)總結(jié)構(gòu)如圖2所示。

        圖2中的虛線框(Make Layer1)詳細(xì)描述了單個網(wǎng)絡(luò)層級中基本模塊的構(gòu)成情況,虛線框Basic Block1描述了第1類基本模塊,虛線框Basic Block2描述了第2 類基本模塊,兩類基本模塊中都包括LBR(Linear,BatchNorm and ReLU layers)、OFSA(Offset-Attention)和MFA(Muti-Feature Aggregation)模塊。LBR包括卷積層、批量正則化層和Relu激活函數(shù),卷積層用于改變特征矩陣的通道數(shù),批量正則化以防止模型過擬合,加快模型訓(xùn)練速度,Relu激活函數(shù)用于增加模型的非線性擬合能力;OFSA模塊為偏移注意力機制,用于改變特征權(quán)重,介紹見1.2 節(jié);MFA 模塊指多特征融合模塊,詳見1.3 節(jié)。網(wǎng)絡(luò)訓(xùn)練過程中,首先通過LBR 改變采樣點矩陣的通道數(shù),使維度從三維坐標(biāo)特征轉(zhuǎn)換為32 維的隱式特征,同時通過將輸入點云輸入MFA模塊以得到9 維的顯式特征,對顯式特征使用LBR以和隱式特征的特征通道數(shù)一致,實現(xiàn)與隱式特征融合,并將融合得到的特征矩陣輸入多層殘差模塊進一步提取點云的特征信息。

        1.2 偏移注意力機制

        人類大腦在觀察事物時會快速定位并提取關(guān)鍵信息,以作出相應(yīng)的決策,注意力機制通過對所提取的特征信息分配不同權(quán)重以模擬人類大腦快速定位關(guān)鍵信息的能力,從而更加關(guān)注較為重要的特征區(qū)域,過濾不重要的信息點,提高網(wǎng)絡(luò)模型在數(shù)據(jù)噪聲下的預(yù)測性能,具有較高的魯棒性。

        縮放點積注意力機制(Scaled Dot-Product Attention)的原理是通過某種映射將嵌入的特征矩陣生成不同類型的Q、K、V權(quán)重系數(shù)矩陣;偏移注意力機制是通過不同的多層感知機(MLP)生成Q、K、V權(quán)重系數(shù)矩陣,權(quán)重矩陣Q和K進行矩陣相乘,并使用Softmax 函數(shù)激活相得到Attention 系數(shù)矩陣,與V特征矩陣進行哈達瑪積得到一個重構(gòu)特征,并對原始特征與重構(gòu)特征進行作差,通過LBR 得到最終Offset-Attention層的特征。其中具體的計算公式如下:

        式中,m為輸出的重構(gòu)特征矩陣,F(xiàn)in為輸入的特征矩陣,Q為用于查找的系數(shù)向量,K為其它用于接受的系數(shù)向量,V為自身的向量。

        在自然語言處理中,Transformer 網(wǎng)絡(luò)中Attention機制由于存在較好的效果而得到了廣泛的應(yīng)用,受注意力機制與傳統(tǒng)網(wǎng)絡(luò)模型進行混合的啟發(fā),本文采取偏移注意力機制,將改進的注意力機制嵌入特征聚合模塊,其中偏移注意力機制的結(jié)構(gòu)如圖3所示。

        圖3 Offset-Attention模塊Fig.3 Offset-Attention module

        圖3中,Conv1d為一維卷積,主要用于改變特征矩陣第2 個維度(Channel)的大小,b為批次數(shù),c為特征矩陣的通道數(shù),n為點的個數(shù),Softmax 為激活函數(shù)將數(shù)值向量進行歸一化為概率分布向量,用于實現(xiàn)多分類問題的輸出。

        1.3 殘差模塊

        引入殘差結(jié)構(gòu)有助于解決梯度消失和梯度爆炸的問題,在訓(xùn)練更深的網(wǎng)絡(luò)時可以有效防止網(wǎng)絡(luò)退化的問題。主干結(jié)構(gòu)上采用快捷連接,使用兩個卷積層以改變特征矩陣的通道數(shù),使用偏移注意力機制模塊(OFSA)和多特征聚合模塊(MFA)實現(xiàn)特征重構(gòu),另外,對輸入層進行恒等映射,并根據(jù)輸入和輸出特征矩陣通道數(shù)是否一致,來實現(xiàn)跳躍連接(Identity),具體結(jié)構(gòu)如圖4所示。

        圖4 殘差模塊Fig.4 Residual module

        1.4 多特征融合模塊

        多特征融合模塊如圖5所示,為虛線框所選取的MFA 部分。注意力機制每一步計算都不依賴于上一步的計算結(jié)果,可實現(xiàn)和CNN 一樣的并行處理操作,可替代CNN,能表達任何卷積濾波層[24-26]。圖5 中的上半分支,通過最遠點采樣得到1 024個采樣點P={pi|i=1,…,N}∈RN×3,將得到的采樣點作為中心點,通過Offset-Attention 注意力機制得到聚合后的中心點特征Fi,與DGCNN 網(wǎng)絡(luò)對特征矩陣中心點和鄰居點拼接不同,本文以廣播方式直接對鄰居點特征和中心點特征進行求差Fj-Fi,以獲取局部鄰域特征信息。圖5的下半分支是對采樣中心點Pi以KNN(K-Nearest Neighbor)算法找到其鄰居節(jié)點Pj∈Ni,Ni為中心點的k個近鄰點坐標(biāo)集,指中心點和鄰居節(jié)點構(gòu)成的一個集合,圖中的Pjk均指采樣點周圍的鄰居節(jié)點。對采樣得到的中心點坐標(biāo)Pi,中心點k個鄰居節(jié)點坐標(biāo)Pjk、中心點與鄰居節(jié)點的相對坐標(biāo)Pjk-Pi進行拼接,得到了通道數(shù)為9的4維特征矩陣,拼接后利用一維卷積將通道數(shù)從9映射為3,實現(xiàn)圖5的上半分支和下半分支特征的相加,減少通道堆疊,盡可能降低計算代價。

        圖5 局部特征與點特征融合模塊Fig.5 Local feature and point feature fusion module

        1.5 評價指標(biāo)

        為了確定模型最終分類的效果,采用分類總體準(zhǔn)確率和類別平均準(zhǔn)確率作為點云分類評價指標(biāo)。

        (1)分類總體準(zhǔn)確率

        式中,ηoverall為分類正確的數(shù)量與總樣本數(shù)量的比值,N為總樣本數(shù)量,T為預(yù)測的樣本中所有分類正確的點云數(shù)量。

        (2)類別平均準(zhǔn)確率

        式中,ηavg為所有類別預(yù)測準(zhǔn)確率的平均值,i為第i個類,Ti是第i個類別分類預(yù)測正確的樣本數(shù)量,Ni為第i個類別的樣本總數(shù)。

        2 實驗結(jié)果與分析

        2.1 實驗數(shù)據(jù)集

        采用ModelNet40[27]和ScanObjectNN[28]數(shù)據(jù)集用于模型評估。https://modelnet.cs.princeton.edu 和https://hkust-vgd.github.io/scanobjectnn 為數(shù)據(jù)下載鏈接。ModelNet40數(shù)據(jù)集是CAD繪制的3D模型轉(zhuǎn)換成的點云對象,共包含12 311個點云形狀個體,共40個類別,其中訓(xùn)練集為9 843個點云模型,測試集為2 468 個點云模型,每個模型都進行了1 024 個點的采樣以作為網(wǎng)絡(luò)的輸入,調(diào)用Mayavi.mlab庫,選取ModelNet40 的前9 個類別如飛機、浴缸、床、板凳、書架、水瓶、碗、汽車和椅子等點云數(shù)據(jù)進行展示,部分?jǐn)?shù)據(jù)見圖6所示。

        圖6 Modelnet40部分?jǐn)?shù)據(jù)Fig.6 Partial data from modelnet40

        ScanObjectNN是一個從存在背景和遮擋的真實世界中掃描采樣的室內(nèi)數(shù)據(jù)集,由15 個類別的2 902 個3D 對象組成。由于背景的干擾,部分點云存在缺失和變形的情況,具有較大的挑戰(zhàn)性。

        為公平地驗證模型性能,本文在ScanObjectNN的擾動(PB-T50-RS)變體數(shù)據(jù)集上進行實驗。PB(Perturbation)是指通過平移、旋轉(zhuǎn)和縮放真實邊界框等數(shù)據(jù)增強方法對數(shù)據(jù)集進行擴展,該變體數(shù)據(jù)集主要利用了T50和RS數(shù)據(jù)增強方法,T50是指從邊界框中心沿著軸將邊界框隨機移動至50%的對象大小,RS(Rotation,Scale)表示旋轉(zhuǎn)和縮放。擴充數(shù)據(jù)集共14 510 個對象,每個對象包含5 個隨機變換樣本,本文分別以1 024和2 048個采樣點作為網(wǎng)絡(luò)的輸入,同時對比了不同采樣點下的點云分類準(zhǔn)確率,以驗證網(wǎng)絡(luò)模型的性能。部分ScanObjectNN和其中的PB-T50-RS數(shù)據(jù)如圖7和圖8所示。

        圖7 ScanObjectNN部分?jǐn)?shù)據(jù)Fig.7 Partial data from ScanObjectNN

        圖8 PB-T50-RS部分?jǐn)?shù)據(jù)Fig.8 Partial data from PB-T50-RS

        2.2 實驗步驟

        2.2.1 點云數(shù)據(jù)處理

        在訓(xùn)練之前,需要對所采集的數(shù)據(jù)進行前期處理以確保模型有效運行。點云數(shù)據(jù)處理的流程是首先進行噪聲濾除、然后進行數(shù)據(jù)采樣以實現(xiàn)輸入模型的數(shù)據(jù)大小相同,最后在模型搭建過程中對數(shù)據(jù)分組形成類似卷積的操作。

        在數(shù)據(jù)預(yù)處理階段,需進行數(shù)據(jù)去噪和數(shù)據(jù)增強,對于離群噪聲點和非離群噪聲點,存在中值濾波、均值濾波和高斯濾波等處理方式,ModelNet40數(shù)據(jù)集采用CAD手工繪制的模型轉(zhuǎn)換得到,存在較少的噪聲,可直接用于模型的訓(xùn)練。ScanObjectNN數(shù)據(jù)集來自真實世界,存在較多噪聲,故采用噪聲濾除和數(shù)據(jù)增強過的(PB-T50-RS)變體數(shù)據(jù)集進行實驗。

        在模型運行之前,為使輸入網(wǎng)絡(luò)的點云數(shù)量一致,需要對點云進行采樣,主要有最遠點采樣(FPS)、隨機采樣、格點采樣和幾何采樣等采樣方式,最遠點采樣需選擇一個初始點作為參考點,在所能承受的最遠距離范圍內(nèi),選取相對參考點的最大歐式距離點用于更新采樣點集合,并將最大歐式距離點作為新的參考點以不斷迭代,直至采樣到所需的N個目標(biāo)采樣點為止。最遠點采樣方法相對于隨機采樣等其它采樣方式采樣點分布較為均勻,避免了部分區(qū)域出現(xiàn)采樣點密度過大的情況,具有較高的魯棒性。

        在網(wǎng)絡(luò)搭建過程中,進行算法設(shè)計實現(xiàn)點云查詢分組,形成類似卷積的操作。點云查詢分組的目的主要是為了實現(xiàn)局部區(qū)域點云特征的聚合,防止下采樣過程中未采樣到的點云的特征丟失,實現(xiàn)局部區(qū)域的點云特征聚合至該局部區(qū)域內(nèi)的單個中心點。另外查詢分組方式有球查詢和最近鄰(KNN)查詢等,大多是在采樣點的基礎(chǔ)上進行查詢分組,以實現(xiàn)局部區(qū)域特征的提取,其中球查詢是以采樣點作為球心,選取特定的半徑進行球形區(qū)域掃描,在球形區(qū)域內(nèi)的點即為所需分組點,而最近鄰查詢是以采樣點作為中心點,選取離中心點周圍最近的k個點作為所需分組點,相對球查詢來說所分組中的點個數(shù)更加均勻,因此本文采用最近鄰采樣并通過多層感知機計算出每個局部區(qū)域鄰居點與中心點的關(guān)系系數(shù),通過與DGCNN 中類似的方式完成鄰居點信息特征的聚合。

        2.2.2 點云特征提取

        點云的特征按照空間尺度有單點特征、局部特征和全局特征,按照物理屬性有幾何域和強度域等,部分網(wǎng)絡(luò)模型利用點云幾何特征作為一部分輸入取得了較好的效果,但提取幾何特征較為復(fù)雜,目前大多模型采用的是點云的空間尺度特征。本文采用最遠點采樣和最近鄰查詢實現(xiàn)多個分組,進而在空間特征尺度上實現(xiàn)點云不同層次特征的聚合,之后通過提出的基于偏移注意力機制和多特征融合的點云分類模型,以逼近數(shù)據(jù)特征所能決定的學(xué)習(xí)上限。

        2.3 點云分類實驗環(huán)境

        本實驗使用基于Python語言的Pytorch深度學(xué)習(xí)框架,硬件環(huán)境CPU為Intel(R)Core(TM)i5-9400F@2.90 GHz,GPU 為NVIDIA GeForce GTX 1070顯卡,具體軟件平臺配置如表1所示。

        表1 軟件平臺配置Table 1 Software platform configuration

        在實驗參數(shù)設(shè)置方面,K近鄰算法k值設(shè)置為20,采用SGDM(Stochastic Gradient Descent with Momentum)優(yōu)化器,設(shè)置動量系數(shù)緩解SGD優(yōu)化器可能的梯度下降方向不穩(wěn)定問題,動量為默認(rèn)值0.9,初始學(xué)習(xí)率(lr)設(shè)置為0.001。訓(xùn)練的Batchsize設(shè)置為32,測試的Batchsize設(shè)置為16,共迭代訓(xùn)練200次,采用BN 正則化(Batch Normalization)和RELU(Rectified Linear Unit)激活函數(shù),并在全連接層后添加Dropout層防止網(wǎng)絡(luò)模型過擬合。

        2.4 點云分類實驗結(jié)果分析

        網(wǎng)絡(luò)模型訓(xùn)練過程中,導(dǎo)入的原始點云數(shù)據(jù)通過多層感知機增加點云的通道數(shù),進一步通過OFSA 和MFA 將全局的語義特征信息、局部特征信息以及點的相關(guān)性信息融合。不斷提取特征,增加點云特征矩陣的通道數(shù),在提取的深層次點云特征矩陣上分別使用全局最大池化和全局平均池化,將所有特征點聚集為一個可用于分類的全局特征點,最終根據(jù)數(shù)據(jù)集的特性設(shè)計全連接層得到類別向量。選取類別向量中的最大值的索引作為預(yù)測類別,若訓(xùn)練ModelNet40,網(wǎng)絡(luò)最后一層共40 個神經(jīng)單元;訓(xùn)練ScanObjectNN,網(wǎng)絡(luò)最后一層共15個神經(jīng)單元。以訓(xùn)練ModelNet40數(shù)據(jù)集為例,所提出的網(wǎng)絡(luò)不同層級通道數(shù)變換見表2所示,首先輸入最初的特征和采樣點,經(jīng)過第1 個Make_layer層,輸出第1層的特征點和采樣點,用作下一層的輸入,不同層級均存在特征點和采樣點的輸入輸出,每一個Make_layer層基礎(chǔ)模塊的通道數(shù)變換如表2所示。

        表2 網(wǎng)絡(luò)的通道數(shù)變換Table 2 Channel number conversion of network

        應(yīng)用標(biāo)簽平滑計算交叉熵?fù)p失值作為三維點云分類的損失評估指標(biāo),用于模型的反向傳播過程中的權(quán)值等參數(shù)的更新。將提出的網(wǎng)絡(luò)模型在Model-Net40 數(shù)據(jù)集上與部分基于多視圖的方法、基于體素的方法和直接基于點的方法進行對比實驗,在分類總體準(zhǔn)確率(Ao)和類別平均準(zhǔn)確率(Am)上都達到較好的效果,該數(shù)據(jù)集的不同模型具體分類結(jié)果如表3所示。

        表3 不同算法在ModelNet40數(shù)據(jù)集上分類結(jié)果比較Table 3 Different algorithms are compared to classify results on the ModelNet40 dataset

        表3中的Input列是指輸入網(wǎng)絡(luò)模型的方式,輸入方式有體素、多視圖和直接基于點云3 個類別,Points指初始輸入的點的個數(shù),1k為1 024個點,可以看出,在ModelNet40數(shù)據(jù)集上,基于體素的方法相對于基于多視圖和直接基于點云的方法表現(xiàn)得較差,部分模型由于缺少局部特征信息,較DGCNN等包含局部信息的模型預(yù)測分類準(zhǔn)確率略微低一些。PCT 和DGCNN 可以較好的彌補缺少局部鄰域特征信息這一缺點,另外LDGCNN的殘差連接方式使得分類總體準(zhǔn)確率相對DGCNN 提高了0.7 個百分點,故考慮構(gòu)造一個鄰域拓?fù)浣Y(jié)構(gòu)提取局部特征,同時融合點云全局特征,最終搭建一個基于偏移注意力機制并融合圖結(jié)構(gòu)信息的殘差網(wǎng)絡(luò)模型。實驗結(jié)果表明,與其他算法相比,LPCTNet網(wǎng)絡(luò)消耗的計算資源較少,可以更好地捕獲局部信息,在ModelNet40 點云目標(biāo)分類任務(wù)中,Ao指標(biāo)較Point-Net、LDGCNN、PCT模型分別提高4.4、0.7、0.4個百分點,Am指標(biāo)較PointNet 和LDGCNN 分別提高4.7、0.4個百分點。

        圖9表示的是在ScanObjectNN 數(shù)據(jù)上的混淆矩陣,橫坐標(biāo)表示的是點云的實際類別,縱坐標(biāo)表示的是預(yù)測類別,由于在列方向上進行了歸一化處理,故單元格范圍在0~1之間,其中混淆矩陣對角線表示的是單個類別的召回率,單個類別的精確率可通過行方向計算推理而出,即可通過該類別召回率的值和該類別行方向上總和的比值計算推理。

        圖9 ScanObjectNN數(shù)據(jù)集混淆矩陣Fig.9 ScanObjectNN dataset confusion matrix

        表4為不同算法在ScanObjectNN 數(shù)據(jù)集上分類結(jié)果,在ScanObjectNN 數(shù)據(jù)集上的實驗結(jié)果表明,與其他算法相比,所提出的算法模型的分類總體準(zhǔn)確率較高,Ao指標(biāo)較PointNet++和DGCNN模型分別提高5.8、5.6 個百分點,Am指標(biāo)較PointNet++和DGCNN分別提高5.5、7.3個百分點。

        表4 不同算法在ScanObjectNN數(shù)據(jù)集上分類結(jié)果比較Table 4 Different algorithms are compared on the ScanObjectNN dataset

        2.5 消融實驗

        不同模塊的嵌入對模型的影響不同,為研究不同模塊的重要程度,在ModelNet40點云分類數(shù)據(jù)集上進行模型消融實驗,分別將多特征融合模塊,殘差連接和偏移注意力機制融入網(wǎng)絡(luò)結(jié)構(gòu)中進行實驗,另外為驗證不同模塊的性能,嘗試單獨去掉一個模塊進行消融實驗,共進行6組不同模型結(jié)構(gòu)的對比實驗,以發(fā)現(xiàn)不同模塊對網(wǎng)絡(luò)總體分類預(yù)測準(zhǔn)確率的影響程度。

        由表5可知,不使用采樣點的全局特征和局部鄰域結(jié)構(gòu)的融合模型的分類總體準(zhǔn)確率僅為89.2%;為捕捉全局的特征信息,在提取采樣層級局部區(qū)域的特征信息的同時對輸入層的點云特征實現(xiàn)特征層面上的拼接,同時和特征層級局部區(qū)域特征信息相聚合,實現(xiàn)多特征信息的融合,使得網(wǎng)絡(luò)的準(zhǔn)確率達到92.3%;進一步融入殘差結(jié)構(gòu),網(wǎng)絡(luò)模型的分類總體準(zhǔn)確率提升0.8個百分點;最后在此基礎(chǔ)上引入偏移注意力機制,分類總體準(zhǔn)確率達到93.6%。另外,從表中可知,當(dāng)去除多特征融合模塊時,分類總體準(zhǔn)確率和類別平均準(zhǔn)確率分別下降了2.0 和3.8 個百分點,相對偏移注意力機制和殘差連接而言下降的更加明顯,因此多特征融合模塊在提升精度方面的效果最為顯著,而偏移注意力機制和殘差連接對精度也有一定的提升效果。

        表5 模塊重要性分析結(jié)果Table 5 Module importance analysis results

        3 結(jié)語

        本文提出了一種基于偏移注意力機制和多特征融合的殘差點云網(wǎng)絡(luò),利用了偏移注意力機制提取點云的全局語義信息,多特征融合模塊實現(xiàn)原始層級和特征層級的全局信息和局部信息的融合,在ModelNet40和ScanObjectNN數(shù)據(jù)集上取得了較好的分類識別效果。

        本文提出的模型主要貢獻有以下幾點:①引入殘差結(jié)構(gòu)實現(xiàn)了來自不同層級所聚合的特征的有效連接,避免了梯度消失的問題。②增加了偏移注意力機制,獲取點的相關(guān)性,提取點云的隱式全局語義特征。③在提取局部特征的基礎(chǔ)上,增加點的全局信息特征,提高網(wǎng)絡(luò)模型對點云的幾何形狀感知能力。通過在不同數(shù)據(jù)集上的經(jīng)典模型對比實驗以及自身的消融實驗證明了本文所提出的模型具有較高的準(zhǔn)確率,且具備較好的魯棒性。

        目前較多的點云分類算法難以兼容準(zhǔn)確率和速度,如何進行改進以適應(yīng)不同的環(huán)境需求是未來重點考慮的研究方向之一。

        猜你喜歡
        分類特征融合
        村企黨建聯(lián)建融合共贏
        融合菜
        分類算一算
        從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
        《融合》
        如何表達“特征”
        不忠誠的四個特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        国产ww久久久久久久久久| 日韩一区二区中文字幕视频| 中文字幕乱码亚洲在线| 四虎国产精品永久在线| 欧美熟妇精品一区二区三区| 国产91在线精品福利| 亚洲av天堂在线免费观看| 日韩人妻熟女中文字幕a美景之屋| 色五月丁香五月综合五月4438| 亚洲Av午夜精品a区| 亚洲综合网中文字幕在线| 91超精品碰国产在线观看| 亚洲精品suv精品一区二区| 国产免费AV片在线看| 久久本道久久综合一人| 免费观看91色国产熟女| 无码人妻av一区二区三区蜜臀| 久久精品免费无码区| 丰满熟女人妻一区二区三区 | 日韩国产人妻一区二区三区| 99久久亚洲精品无码毛片| 免费国产一级片内射老| av在线一区二区三区不卡| 无码人妻h动漫中文字幕| 草草影院发布页| 国产福利一区二区三区在线观看 | 丰满少妇又爽又紧又丰满动态视频| 午夜被窝精品国产亚洲av香蕉 | 亚洲AV无码成人网站久久精品| 蜜臀久久久精品国产亚洲av| 成午夜福利人试看120秒| 欧美疯狂做受xxxx高潮小说| 欧美激情国产一区在线不卡| 精品人妻av一区二区三区四区 | 丁香花五月六月综合激情| 久久久无码人妻精品一区| 福利视频一二区| 尤物蜜桃视频一区二区三区| 午夜免费啪视频| 无遮挡网站| 亚洲AV无码AV色|