亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于八叉樹的卷積神經(jīng)網(wǎng)絡(luò)三維模型分割

        2020-09-29 08:08:54楊曉文韓慧妍
        關(guān)鍵詞:八叉樹樹結(jié)構(gòu)標(biāo)簽

        楊曉文,李 靜,韓 燮,韓慧妍,陶 謙

        (中北大學(xué) 大數(shù)據(jù)學(xué)院,山西 太原 030051)

        0 引 言

        由于獲取3D信息設(shè)備的不斷發(fā)展,通過建模工具所創(chuàng)建的三維模型不斷增多,對(duì)其進(jìn)行研究成為熱點(diǎn)問題。其中,三維模型的分割包括對(duì)點(diǎn)云與網(wǎng)格模型的分割,根據(jù)語(yǔ)義上的不同,把完整的三維模型分割為相鄰子部分[1]。三維模型的分割有利于進(jìn)一步理解和分析三維模型,包括變形、簡(jiǎn)化、檢索以及曲面重建等[2],同時(shí)也是古文物保護(hù)、建筑物及城市場(chǎng)景三維建模、動(dòng)植物外形建模、醫(yī)學(xué)檢測(cè)、幾何壓縮與傳輸?shù)裙ぷ鞯幕A(chǔ),在許多模型處理和視覺應(yīng)用上也越來越重要。

        1 相關(guān)研究

        卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)不斷應(yīng)用在各領(lǐng)域中,國(guó)內(nèi)外研究學(xué)者根據(jù)對(duì)三維形狀的分析,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)三維模型的分割進(jìn)行了研究,其中,主要為基于體素,流形以及多視圖3類方法。

        基于體素的方法是指以三維空間的體素作為定義域進(jìn)行3D卷積,將CNN拓展到三維空間進(jìn)行學(xué)習(xí)。Maturana等[3]將3D形狀光柵化并在密集體素上采樣距離函數(shù),在整個(gè)體素上應(yīng)用3D CNN。Wu NZ等[4]在體素上定義3D CNN以進(jìn)行形狀分析,提出了用于物體識(shí)別和形狀分析的3D ShapeNets,但是該方法只適合于低分辨率的三維模型。為了降低基于全體素方法的計(jì)算成本,Graham B[5]提出了3D稀疏CNN,對(duì)于深層CNN,該方法的計(jì)算和存儲(chǔ)成本仍然很高。這些方法計(jì)算量大,不易儲(chǔ)存,不適用于高分辨率模型。

        基于流形的方法是指對(duì)流形網(wǎng)格上定義的特征進(jìn)行CNN操作。Boscaini等[6]將3D表面參數(shù)化為2D圖像,將采樣的特征圖像饋送到CNN中以進(jìn)行形狀分析。Bronstein等[7]將CNN擴(kuò)展到由不規(guī)則三角形網(wǎng)格定義的圖形上。這些方法對(duì)于三維模型的等距變形較為穩(wěn)健,但是它們被約束為平滑的流形網(wǎng)格時(shí)難以提取局部特征,噪聲較大。

        基于多視圖的方法是指利用空間投影將三維模型轉(zhuǎn)化為多個(gè)視圖下的二維影像,并將圖像堆棧作為2D CNN的輸入。謝智歌等[8]提出了基于全卷積的多角度多層次極限學(xué)習(xí)機(jī)的三維模型分割方法,該方法通過對(duì)深度圖像的多標(biāo)簽訓(xùn)練、預(yù)測(cè)以及把標(biāo)簽回投到三維模型的三角面片上得到分割結(jié)果。Kalogerakis等[9]設(shè)計(jì)了一個(gè)投影卷積網(wǎng)絡(luò)應(yīng)用于三維形狀的分割。這些方法直接利用基于圖像的CNN進(jìn)行3D形狀分析并處理高分辨率輸入,但是不能確定視圖數(shù)量以完全覆蓋三維模型,無法避免遺失三維信息。

        本文利用八叉樹表示三維點(diǎn)云模型,將卷積計(jì)算限制在八叉樹節(jié)點(diǎn)上,使計(jì)算量只和八叉樹節(jié)點(diǎn)數(shù)目相關(guān),卷積、反卷積、池化、反池化操作由于八叉樹的數(shù)據(jù)和層次結(jié)構(gòu)在迭代過程中計(jì)算高效,減少了計(jì)算與存儲(chǔ)成本,避免了視圖選擇問題,可以處理高分辨率的點(diǎn)云輸入。實(shí)驗(yàn)及評(píng)估度量結(jié)果表明,實(shí)驗(yàn)數(shù)據(jù)集中大多數(shù)模型取得了良好的分割效果。

        2 背景知識(shí)

        2.1 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),包含卷積計(jì)算并具有深層結(jié)構(gòu),其不斷應(yīng)用在深度學(xué)習(xí)中[10]。CNN的本質(zhì)是多層感知機(jī),局部連接和權(quán)值共享的方式減少了權(quán)值的數(shù)量更易于優(yōu)化網(wǎng)絡(luò),降低模型的復(fù)雜度,減小過擬合的風(fēng)險(xiǎn)。通過構(gòu)建多層網(wǎng)絡(luò)提取數(shù)據(jù)中具有抽象語(yǔ)義信息的高層次特征,得到更好的特征魯棒性。

        CNN是基于監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)特征提取功能的核心模塊位于隱含層的卷積層和池化層,每層有多個(gè)特征圖,每個(gè)特征圖有多個(gè)神經(jīng)元,并使用大小不等的卷積濾波器提取特征。其中,卷積層為特征提取層,通過權(quán)值共享的卷積核使每一層的特征都由上一層的局部區(qū)域激勵(lì)得到,即將每個(gè)神經(jīng)元的輸入與上一層的局部感知野相連,并由激活函數(shù)形成并輸出特征映射圖[11]。池化層位于連續(xù)的卷積層中,用于壓縮數(shù)據(jù)和參數(shù)量,去除冗余信息,防止過擬合。

        2.2 八叉樹結(jié)構(gòu)

        二維圖像通常結(jié)構(gòu)化表示為二維平面上的矩陣,但是三維形狀是非結(jié)構(gòu)化的,尤其點(diǎn)云數(shù)據(jù)是不規(guī)則和無序的。因此,利用卷積神經(jīng)網(wǎng)絡(luò)處理點(diǎn)云數(shù)據(jù)時(shí),由于輸入數(shù)據(jù)的不穩(wěn)定性使得卷積操作難以直接應(yīng)用到點(diǎn)云數(shù)據(jù)上。

        利用自適應(yīng)的空間剖分來壓縮存儲(chǔ)點(diǎn)云數(shù)據(jù),八叉樹[12]是一個(gè)非常好的選擇。八叉樹是一種遞歸、軸對(duì)齊且空間分隔的數(shù)據(jù)結(jié)構(gòu),將空間分成等體積的立方體可以加速細(xì)分運(yùn)算,且單元大小的存儲(chǔ)也可以節(jié)省空間。三維空間根據(jù)是否含有三維點(diǎn)云的一部分決定是否一分為八,并在子塊里重復(fù)劃分。八叉樹結(jié)構(gòu)常用于計(jì)算機(jī)幾何進(jìn)行優(yōu)化碰撞檢測(cè)、最鄰近搜索等,且常用于三維數(shù)據(jù)的表達(dá)。

        3 基于八叉樹的卷積神經(jīng)網(wǎng)絡(luò)的三維模型分割

        本文使用八叉樹結(jié)構(gòu)化表示三維點(diǎn)云模型,在點(diǎn)云模型的邊界表面占據(jù)的稀疏八分體上執(zhí)行CNN操作對(duì)三維點(diǎn)云模型進(jìn)行分割。本文方法流程包括:①對(duì)點(diǎn)云模型進(jìn)行預(yù)處理并在此基礎(chǔ)上構(gòu)建表示點(diǎn)云的八叉樹結(jié)構(gòu),八叉樹的最深葉節(jié)點(diǎn)處存儲(chǔ)點(diǎn)云的信息,提取最大深度的葉子八分體中采樣點(diǎn)云的平均法向量與平均曲率,并將其融合作為卷積網(wǎng)絡(luò)的輸入特征,存儲(chǔ)在相對(duì)應(yīng)的葉節(jié)點(diǎn)上;②將卷積計(jì)算限制在八叉樹節(jié)點(diǎn)上,計(jì)算每個(gè)深度的相鄰水平節(jié)點(diǎn)的特征,池化合并之后,將特征下采樣到父節(jié)點(diǎn)并且被傳送到下一八叉樹深度層。級(jí)聯(lián)反卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行逐點(diǎn)預(yù)測(cè),遍歷整個(gè)神經(jīng)網(wǎng)絡(luò),不斷迭代神經(jīng)網(wǎng)絡(luò)層訓(xùn)練并測(cè)試,得出點(diǎn)云模型分割預(yù)測(cè)標(biāo)簽;③使用CRF優(yōu)化并進(jìn)行分割可視化得出三維點(diǎn)云模型分割結(jié)果。本文方法流程如圖1所示。

        圖1 本文方法流程

        3.1 數(shù)據(jù)準(zhǔn)備過程

        3.1.1 點(diǎn)云預(yù)處理

        實(shí)驗(yàn)所用原始模型是稀疏點(diǎn)云,并且點(diǎn)云模型缺失了對(duì)應(yīng)的法線信息,為此將點(diǎn)云模型與相應(yīng)的3D網(wǎng)格對(duì)齊,并將點(diǎn)投影到三角面片中,然后采用射線射擊算法在三角網(wǎng)格中確定密集點(diǎn),將密集點(diǎn)所在的三角面片的法線分配給該點(diǎn),得到預(yù)處理的點(diǎn)云模型。射線射擊算法具體來說,在將點(diǎn)云模型投影到三角面片的基礎(chǔ)上,根據(jù)點(diǎn)云中每個(gè)點(diǎn)所在的三角面片確定包含該點(diǎn)云模型的邊界立方體(該邊界立方體是根據(jù)三角面片統(tǒng)一采樣來確定的),將多個(gè)虛擬相機(jī)均勻放置在包含點(diǎn)云模型的邊界立方體的各個(gè)面中心,從每個(gè)方向均勻地對(duì)模型發(fā)射平行光線,計(jì)算光線與三角面片的交點(diǎn),如果此三角面片中包含了點(diǎn)云模型中的點(diǎn),即將該點(diǎn)的法線指向相機(jī),不相交的點(diǎn)被舍棄,得到點(diǎn)云模型的密集點(diǎn),以此預(yù)處理點(diǎn)云得到具有定向法線和密集點(diǎn)的點(diǎn)云數(shù)據(jù)。

        3.1.2 構(gòu)造八叉樹結(jié)構(gòu)

        為了構(gòu)造表示三維點(diǎn)云的八叉樹結(jié)構(gòu),首先將三維點(diǎn)云模型縮放于軸對(duì)稱的3D立方體中,然后采用廣度優(yōu)先算法,細(xì)分點(diǎn)云模型的邊界立方體,并不斷迭代,直到將深度為d處的點(diǎn)云模型邊界所占據(jù)的所有非空八分體細(xì)分到下一深度d+1處的八個(gè)子八分體,即達(dá)到指定的八叉樹深度,迭代停止。八叉樹的每一層由排序后的隨機(jī)鍵數(shù)組和標(biāo)記非空節(jié)點(diǎn)序號(hào)的標(biāo)簽數(shù)組組成[13],通過這些數(shù)組可以快速訪問節(jié)點(diǎn)鄰居。八叉樹構(gòu)造過程如圖2所示。

        圖2 八叉樹構(gòu)造過程

        其中,隨機(jī)鍵是用來表示深度為d的八分體O在3D空間中的相對(duì)位置:key(O)∶x1y1z1x2y2z2..xdydzd,xiyizi∈{0,d}。 通過隨機(jī)鍵升序排列八分體,第d深度的所有八分體中排序后的隨機(jī)鍵存儲(chǔ)在隨機(jī)鍵矢量Sd中,矢量的長(zhǎng)度是當(dāng)前深度的八分體的數(shù)量,該矢量用于構(gòu)建3D卷積中八分體的鄰域。類比四叉樹節(jié)點(diǎn)的隨機(jī)鍵與每個(gè)深度的相應(yīng)隨機(jī)鍵數(shù)組如圖3所示。

        圖3 四叉樹隨機(jī)鍵與標(biāo)簽

        描述相鄰深度的父子八分體之間的關(guān)系,通過池化操作將深度為d的八分體處計(jì)算得到的特征經(jīng)過下采樣計(jì)算后連接到深度為d+1的子八分體,并為非空八分體指定標(biāo)簽p, 并將該深度處的所有八分體的標(biāo)簽存儲(chǔ)在標(biāo)簽矢量Ld中。詳細(xì)定義請(qǐng)參見文獻(xiàn)[13]。在第d深度的一個(gè)非空節(jié)點(diǎn)處定義索引j,計(jì)算第d+1深度處其第一個(gè)子八分體的索引k=8*(Ld[j]-1), 從而可以快速找到父節(jié)點(diǎn)到其子節(jié)點(diǎn)的對(duì)應(yīng)關(guān)系。類比四叉樹每個(gè)深度的標(biāo)簽矢量如圖3所示。

        3.1.3 提取特征

        構(gòu)造點(diǎn)云的八叉樹結(jié)構(gòu)之后,提取最大深度的葉子八分體中采樣點(diǎn)云的平均法向量[14]與平均曲率,兩者相融合作為CNN的輸入特征。對(duì)于空葉子八分體,將其指定為零向量作為輸入特征;對(duì)于非空葉子八分體,對(duì)嵌入葉子八分體中的點(diǎn)云形狀表面的一組點(diǎn)進(jìn)行采樣,利用點(diǎn)云預(yù)處理過程中分配給各點(diǎn)的定向法線計(jì)算平均法向量。

        (1)

        式中:NP(i) 表示點(diǎn)pi在該葉子八分體區(qū)域,N表示該葉子八分體內(nèi)點(diǎn)的個(gè)數(shù),pj是pi在此葉子八分體內(nèi)的鄰域點(diǎn),從而得到pi的協(xié)方差如式(2)所示

        (2)

        式中:C是一個(gè)半正定矩陣,可以取3個(gè)非負(fù)特征值λi(i=0,1,2)。 當(dāng)λ0<λ1<λ2, 并定義λi的對(duì)應(yīng)正交特征向量為ni(i=0,1,2), 又由式(3)所示

        (3)

        此時(shí)T(x) 表示點(diǎn)pi的最小二乘平面,近似看作點(diǎn)pi切平面。n0表示點(diǎn)pi在局部區(qū)域內(nèi)的法矢,特征值λ表示為該曲面的變分。由Pualy等[16]定義可得該曲面變分近似于點(diǎn)pi處的曲率,如式(4)所示

        (4)

        并根據(jù)平均曲率定義求得點(diǎn)pi處平均曲率。

        特征融合[16]是指從多個(gè)相關(guān)原始特征集中獲得最具差異性的信息,能夠消除因不同特征集之間的相關(guān)性而產(chǎn)生的冗余信息。本文方法中計(jì)算出平均法向量和平均曲率之后,利用并行特征融合策略將其合并成一個(gè)比單個(gè)輸入特征更具有判別能力的特征并將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入特征。并行特征融合策略的思想是:假設(shè)α,β是同一樣本的兩組特征向量,用復(fù)向量來表示樣本的并行組合特征[16],融合公式如式(5)所示

        γ=α+iβ(i是虛數(shù))

        (5)

        最后將融合后的特征作為卷積神經(jīng)網(wǎng)絡(luò)的輸入特征并將其存儲(chǔ)到輸入特征矢量中。

        3.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        卷積神經(jīng)網(wǎng)絡(luò)對(duì)點(diǎn)云的八叉樹結(jié)構(gòu)反復(fù)應(yīng)用卷積和池化操作,本文中激活函數(shù)使用ReLU(f∶x∈R→max(0,x)), 并使用批量標(biāo)準(zhǔn)化(BN)來減少內(nèi)部協(xié)變量偏移。將“convolution+BN+ReLU+pooling”作為基本單元,當(dāng)卷積操作應(yīng)用于深度為d的八分體時(shí),由Ud表示,Ud的特征映射的通道數(shù)設(shè)置為2max(d,9-d), 卷積核大小為3*3*3。 該部分網(wǎng)絡(luò)結(jié)構(gòu)定義為CNN(d):輸入→Ud→Ud-1→…→U2。

        本文方法參考圖像語(yǔ)義分割網(wǎng)絡(luò)DeconvNet[17],在卷積網(wǎng)絡(luò)之后級(jí)聯(lián)反卷積網(wǎng)絡(luò)進(jìn)行密集逐點(diǎn)預(yù)測(cè)。卷積網(wǎng)絡(luò)被設(shè)置為CNN(d),反卷積網(wǎng)絡(luò)是CNN(d)的鏡像,其中卷積和池化運(yùn)算符由反卷積和上池化代替。將“unpooling+deconvolution+BN+ReLU”作為一個(gè)基本單位,將反卷積操作應(yīng)用于深度為d的八分體時(shí),則由DUd表示。所以整體卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)定義為: CNN(d)→DU2→DU3→…DUd。 網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

        圖4 網(wǎng)絡(luò)結(jié)構(gòu)

        3.2.1 3D卷積

        3D卷積(3D convolution)是指卷積核的維度為三維,最早提出用于行為識(shí)別等領(lǐng)域。在本文方法中,將卷積運(yùn)算應(yīng)用于某個(gè)深度處的所有八分體,需要在該八叉樹深度處連接其相鄰八分體,卷積運(yùn)算φc如式(6)所示

        (6)

        3.2.2 池 化

        池化(pooling)的目的是逐步壓縮空間大小,是對(duì)卷積層輸出的特征圖做下采樣操作。池化層在每個(gè)通道上獨(dú)立運(yùn)行,并在空間上調(diào)整其大小,去除冗余信息,最常見的形式是max-pooling和avy pooling,本文采用max-pooling操作。八叉樹結(jié)構(gòu)上應(yīng)用max-pooling可以從每8個(gè)連續(xù)存儲(chǔ)的子八分體屬性值中挑選出最大值。

        3.2.3 上池化

        上池化(unpooling)操作是匯集和執(zhí)行上采樣的逆向操作,一般指的是max-pooling的逆過程,廣泛用于CNN可視化和圖像分割。應(yīng)用max-pooling之后,每個(gè)池區(qū)域中最大值的位置記錄并存儲(chǔ)在一組變量中,這些變量將當(dāng)前特征映射放入上采樣特征映射的適當(dāng)位置。在CNN中,最大池化操作是不可逆的,可以通過使用一組轉(zhuǎn)換變量記錄每個(gè)池化區(qū)域內(nèi)最大值的位置獲得一個(gè)近似的逆操作結(jié)果。

        3.2.4 反卷積

        反卷積(deconvolution),也稱為轉(zhuǎn)置卷積和反向卷積,用來放大和加密特征圖,步長(zhǎng)為k的反卷積核可以實(shí)現(xiàn)特征圖的k倍放大效果。卷積層的反向傳播過程是反卷積層的前向傳播過程,基于先前描述的八叉樹上的卷積操作,可以相應(yīng)地實(shí)現(xiàn)反卷積操作。

        3.2.5 神經(jīng)網(wǎng)絡(luò)優(yōu)化算法

        (7)

        ωt+1=ωt+Vt+1

        (8)

        其中, ?是負(fù)梯度的學(xué)習(xí)率(base_lr),μ是上一次梯度值的權(quán)重(momentum),用來加權(quán)之前梯度對(duì)現(xiàn)在梯度下降方向的影響,這兩個(gè)參數(shù)值需要通過不斷調(diào)整得到最合適的值。

        3.2.6 損失函數(shù)

        損失函數(shù)[19]在CNN中是用來衡量預(yù)測(cè)標(biāo)簽與初始標(biāo)簽一致性的度量指標(biāo)。本文中使用SoftmaxWithLoss計(jì)算訓(xùn)練過程中的損失值,卷積過程中,SoftmaxWithLossLayer主要使用了兩個(gè)概率統(tǒng)計(jì)原理:邏輯回歸和最大似然估計(jì)。

        邏輯回歸對(duì)應(yīng)于Softmax,其將神經(jīng)網(wǎng)絡(luò)的輸出特征轉(zhuǎn)化成概率,最大似然估計(jì)用于計(jì)算損失函數(shù),其核心公式如式(9)、式(10)所示

        (9)

        (10)

        其中,yi為標(biāo)簽值,k為輸入點(diǎn)云標(biāo)簽所對(duì)應(yīng)的神經(jīng)元,m為輸出的最大值,主要考慮數(shù)值穩(wěn)定性。而反向傳播時(shí)loss計(jì)算公式如式(11)所示

        (11)

        對(duì)輸入的zk求導(dǎo)可得式(12)

        (12)

        3.3 CRF優(yōu)化

        本文使用條件隨機(jī)場(chǎng)CRF(conditional random field algorithm)[20]優(yōu)化分割結(jié)果。由于反卷積網(wǎng)絡(luò)分別對(duì)每個(gè)點(diǎn)進(jìn)行預(yù)測(cè),分割后的點(diǎn)云模型中相鄰區(qū)域之間仍然存在噪聲,因此使用CRF對(duì)結(jié)果進(jìn)行調(diào)整。

        E(x)=∑iφu(xi)+∑i

        (13)

        式中:i和j的范圍從1到N。φu(xi) 用來約束最終輸出結(jié)果,定義為φu(xi)=-log(p(xi)), 其中p(xi) 是神經(jīng)網(wǎng)絡(luò)生成標(biāo)簽的概率。φp(xi,xj) 用于合并信息以輸出精確結(jié)果,如式(14)所示

        (14)

        式中:Wθi表示具有標(biāo)準(zhǔn)差θi的高斯函數(shù),μ(xi,xj) 是標(biāo)簽函數(shù),ωi和θi是超參數(shù)。通過CRF優(yōu)化算法之后,點(diǎn)云模型的不同分割區(qū)域之間噪聲減小,邊緣更平滑。

        4 實(shí)驗(yàn)討論

        4.1 數(shù)據(jù)集與實(shí)驗(yàn)環(huán)境

        本文實(shí)驗(yàn)使用數(shù)據(jù)集ShapeNetCore的一個(gè)子集,包含16種形狀類別,大約17 000個(gè)點(diǎn)云模型,每個(gè)類別有2到6個(gè)部分,總共有50類不同區(qū)域的標(biāo)簽注釋。在實(shí)驗(yàn)中,對(duì)于每一類的點(diǎn)云模型分別以模型總數(shù)90%的數(shù)據(jù)量作訓(xùn)練數(shù)據(jù),10%的數(shù)據(jù)量作測(cè)試數(shù)據(jù)。

        實(shí)驗(yàn)環(huán)境:以Caffe為深度學(xué)習(xí)框架,支持GPU運(yùn)算;Intel(R)Core(TM)i7,CPU@2.80 GHz,NVIDIA GeForce GTX 1050 Ti 4 GB,VS2015+anaconda 3.4.2,CUDA8.0+cudnn-8.0-windows10-x64-v5.0。

        4.2 訓(xùn)練與測(cè)試

        實(shí)驗(yàn)中神經(jīng)網(wǎng)絡(luò)的參數(shù)和函數(shù)設(shè)置見表1。網(wǎng)絡(luò)模型采用SDG優(yōu)化算法,迭代學(xué)習(xí)中隨機(jī)均勻采樣訓(xùn)練數(shù)據(jù),更新模型參數(shù),逐層調(diào)節(jié)權(quán)重參數(shù),使用SoftmaxWithLoss通過大量的迭代訓(xùn)練提高網(wǎng)絡(luò)的精度,并計(jì)算迭代過程中的損失值。針對(duì)不同類別的個(gè)別參數(shù)進(jìn)行調(diào)整,其中基礎(chǔ)學(xué)習(xí)率變化范圍在0.1到0.001之間;批量大小和測(cè)試間隔隨測(cè)試集的數(shù)量大小進(jìn)行調(diào)整,調(diào)整規(guī)則為2的整數(shù)次冪;最大迭代數(shù)根據(jù)訓(xùn)練集的大小調(diào)整。

        表1 實(shí)驗(yàn)參數(shù)/函數(shù)設(shè)置

        在卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,訓(xùn)練與測(cè)試同時(shí)進(jìn)行,并將測(cè)試間隔設(shè)置為200,即每訓(xùn)練200次測(cè)試一次,同時(shí)計(jì)算各自的準(zhǔn)確率與損失值。在訓(xùn)練迭代結(jié)束后,生成caffemodel(caffemodel里不僅存儲(chǔ)了權(quán)重和偏置等信息,還存儲(chǔ)了整個(gè)訓(xùn)練網(wǎng)絡(luò)的結(jié)構(gòu)信息)。在測(cè)試階段,調(diào)用每個(gè)類別的caffemodel獲得每個(gè)最精細(xì)葉節(jié)點(diǎn)的輸出標(biāo)簽和預(yù)測(cè)概率,此時(shí)可以得到通過神經(jīng)網(wǎng)絡(luò)輸出的逐點(diǎn)的預(yù)測(cè)標(biāo)簽。

        4.3 結(jié)果與對(duì)比

        本文使用pcl工具可視化分割結(jié)果。簡(jiǎn)單來說,使用八叉樹結(jié)構(gòu)中的葉節(jié)點(diǎn)表示點(diǎn)云模型,使用神經(jīng)網(wǎng)絡(luò)得到的預(yù)測(cè)標(biāo)簽分別以不同顏色分類顯示分割結(jié)果的不同區(qū)域。經(jīng)過CRF優(yōu)化之后,本文方法得到的分割效果如圖5所示。

        圖5 本文方法應(yīng)用于ShapeNetCore子集的分割效果

        本文還分別使用PointNet[21],SpecCNN[22],O-CNN(5)[13],O-CNN(6)[13],SPGN[23]的方法進(jìn)行實(shí)驗(yàn)并且與本文方法進(jìn)行比較,如圖6所示,可以看出,O-CNN(6)方法在模型右側(cè)椅腿與椅座連接處噪聲明顯,本文方法則在分割相鄰區(qū)域處以及邊界處噪聲較小,邊緣更平滑,分割效果更好。為了更準(zhǔn)確地描述分割效果的優(yōu)劣,采用IoU(intersection over union)標(biāo)準(zhǔn)對(duì)以上不同方法和本文方法進(jìn)行度量,該標(biāo)準(zhǔn)用于測(cè)量實(shí)際標(biāo)簽值和預(yù)測(cè)標(biāo)簽值之間的相關(guān)度,相關(guān)度越高,度量值越高,分割效果越好,對(duì)比結(jié)果見表2。對(duì)比結(jié)果表明,本文方法對(duì)飛機(jī),椅子,汽車,吉他等三維點(diǎn)云模型都有較好的分割結(jié)果。

        圖6 O-CNN(6)分割結(jié)果(a)與本文結(jié)果(b)對(duì)比

        5 結(jié)束語(yǔ)

        本文針對(duì)三維點(diǎn)云數(shù)據(jù)的計(jì)算量大以及存儲(chǔ)成本高的問題,使用八叉樹數(shù)據(jù)結(jié)構(gòu)表示三維點(diǎn)云模型,同時(shí)為了避免顯式的特征提取帶來的局限性,使用兩種基礎(chǔ)特征相融合作為卷積神經(jīng)網(wǎng)絡(luò)的輸入特征,利用卷積神經(jīng)網(wǎng)絡(luò)級(jí)聯(lián)反卷積神經(jīng)網(wǎng)絡(luò)對(duì)三維點(diǎn)云模型進(jìn)行分割,實(shí)現(xiàn)了分割結(jié)果可視化,提高了實(shí)驗(yàn)數(shù)據(jù)集中大多數(shù)類別的分割準(zhǔn)確率。但是由于使用八叉樹結(jié)構(gòu)表示點(diǎn)云模型,對(duì)于部分類的分割結(jié)果的分割區(qū)域之間存在噪聲,模型邊界處鋸齒狀明顯,在分割可視化時(shí)部分模型效果欠佳。其次由于數(shù)據(jù)量不同以及在訓(xùn)練過程中存在擬合問題使各類點(diǎn)云的預(yù)測(cè)標(biāo)簽存在誤差,需要進(jìn)一步研究處理。

        表2 以IoU為評(píng)價(jià)度量的對(duì)比結(jié)果

        猜你喜歡
        八叉樹樹結(jié)構(gòu)標(biāo)簽
        三維十字鏈表八叉樹的高效檢索實(shí)現(xiàn)
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        四維余代數(shù)的分類
        標(biāo)簽化傷害了誰(shuí)
        大數(shù)據(jù)背景下基于B—樹結(jié)構(gòu)的SQL Server數(shù)據(jù)優(yōu)化策略研究
        基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
        基于μσ-DWC特征和樹結(jié)構(gòu)M-SVM的多維時(shí)間序列分類
        采用動(dòng)態(tài)樹結(jié)構(gòu)實(shí)現(xiàn)網(wǎng)絡(luò)課程內(nèi)容的動(dòng)態(tài)更新
        河南科技(2014年11期)2014-02-27 14:17:57
        散亂點(diǎn)云線性八叉樹結(jié)構(gòu)在GPU中的實(shí)現(xiàn)
        久久精品国产亚洲7777| 精品国精品自拍自在线| 日韩有码在线一区二区三区合集| 美女扒开屁股让男人桶| 亚洲av天堂在线视频| 国产又色又爽又高潮免费视频麻豆| 中年熟妇的大黑p| 人妻无码中文专区久久综合| 日韩精品一区二区三区含羞含羞草 | 国产精品久久久天天影视| 男女车车的车车网站w98免费| 无码片久久久天堂中文字幕| AV无码专区亚洲AVL在线观看| 午夜在线观看一区二区三区四区| av免费播放网站在线| 亚洲精品白浆高清久久久久久| 丰满少妇在线观看网站| 国产思思久99久精品| 国产免费人成视频在线观看 | 亚洲一区二区三区免费的视频| 日韩国产人妻一区二区三区| 中文字幕有码无码av| 免费在线观看一区二区| 国产老熟女伦老熟妇露脸| 欧美xxxx做受欧美| 天天摸日日摸狠狠添| 国产真实乱XXXⅩ视频| 日韩中文字幕乱码在线| 欧美老妇牲交videos| 亚洲av无码不卡| 精品国产一区二区三区AV小说 | 亚洲区精品久久一区二区三区女同 | 精品无码久久久久成人漫画| 中文字幕一区二区三区在线不卡 | 四季极品偷拍一区二区三区视频 | 国精品人妻无码一区二区三区性色 | 国产一级片内射在线视频| 岛国熟女精品一区二区三区| 在线综合亚洲欧洲综合网站 | 亚洲成人色黄网站久久| 99久久无码一区人妻|