亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        二維形狀特征描述及分類識別研究進(jìn)展綜述

        2021-07-28 12:36:26鄒媛媛陳泊璇
        計算機(jī)工程與應(yīng)用 2021年14期
        關(guān)鍵詞:描述符骨架輪廓

        劉 磊,鄒媛媛,陳泊璇

        1.沈陽建筑大學(xué) 機(jī)械工程學(xué)院,沈陽110168

        2.高檔石材數(shù)控加工裝備與技術(shù)國家地方聯(lián)合工程實驗室,沈陽110168

        物體的形狀特征由于其不會隨著光照、顏色和紋理等的變化而發(fā)生改變,被認(rèn)為是一個穩(wěn)定的特征,因此,形狀特征被廣泛應(yīng)用于物體識別、目標(biāo)跟蹤等領(lǐng)域。其中,魯棒的二維形狀表示可以提高形狀識別的精度和準(zhǔn)確率,因此,形狀表示在形狀識別、形狀檢索等相關(guān)應(yīng)用中起著重要作用。通常,二維形狀的表示可分為三類:基于輪廓的表示方法、基于區(qū)域的表示方法以及基于骨架的表示方法。近年來,研究學(xué)者針對二維形狀的高效表示,在傳統(tǒng)特征表示的基礎(chǔ)上,不斷提出了新的形狀特征表示方法,例如通過融合不同類別的特征來表示二維形狀,以提高形狀描述的準(zhǔn)確性。

        高性能高精度的分類識別方法也會影響二維形狀分類識別的準(zhǔn)確度。現(xiàn)有研究中常用機(jī)器學(xué)習(xí)分類器進(jìn)行二維形狀分類識別,主要有支持向量機(jī)[1](Support Vector Machine,SVM)和隨機(jī)森林[2](Random Forest,RF)等傳統(tǒng)的分類器以及集成分類器,其中,集成分類器相較于單分類器,識別性能得到了一定的提升?;跈C(jī)器學(xué)習(xí)的二維形狀識別分類過程如圖1 所示。隨著深度學(xué)習(xí)的發(fā)展,運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)[3-4](Convolutional Neural Network,CNN)進(jìn)行二維形狀分類識別也受到了研究學(xué)者的關(guān)注,成為了一個新的方向。

        圖1 基于機(jī)器學(xué)習(xí)的二維形狀識別分類流程圖

        本文首先對二維形狀特征表示和識別中的關(guān)鍵問題研究現(xiàn)狀進(jìn)行了總結(jié),接著,綜述了近年來二維形狀表示方法和識別分類方法,對各方法進(jìn)行了綜合分析,其中,形狀特征表示方法分別包括基于輪廓的、基于區(qū)域的、基于骨架的以及基于多特征融合的二維形狀特征表示方法,識別分類方法主要包括傳統(tǒng)的機(jī)器學(xué)習(xí)分類器、集成分類器、深度學(xué)習(xí)方法等,然后,匯總了二維形狀識別中常用的標(biāo)準(zhǔn)數(shù)據(jù)庫,最后,展望了二維形狀特征表示和分類識別方法的研究發(fā)展趨勢,并對本文工作做了總結(jié)。

        1 形狀特征表示方法研究進(jìn)展

        魯棒的二維形狀表示應(yīng)該對平移、旋轉(zhuǎn)、尺度變換等變化不敏感,并對邊界噪聲有一定的魯棒性。本章主要綜述近年來二維形狀特征表示方法的研究進(jìn)展。

        1.1 基于輪廓的形狀表示

        基于輪廓的二維形狀表示方法基于形狀邊界,通過提取輪廓邊界特征來表示二維形狀。根據(jù)是否將輪廓進(jìn)行分段,該方法又可分為使用總體輪廓的輪廓全局表示方法以及使用輪廓段的輪廓局部表示方法。

        輪廓全局表示方法主要有Wang 等人[5]提出的名為高度函數(shù)(Height Function,HF)的形狀描述符。首先將輪廓以固定的采樣點(diǎn)進(jìn)行表示,對于每個采樣點(diǎn),高度函數(shù)定義為其他采樣點(diǎn)到此采樣點(diǎn)切線的距離。然后通過平滑高度函數(shù)得到緊湊和魯棒的形狀描述符。Shu等人[6]提出的名為輪廓點(diǎn)分布直方圖(Contour Point Distribution Histogram,CPDH)的形狀描述符。這是一種通過極坐標(biāo)下物體輪廓點(diǎn)的分布位置來表示形狀特征的方法。CPDH是尺度不變和平移不變的,對于旋轉(zhuǎn)不變問題,需要添加額外的條件加以保證。Shi等人[7]提出的基于輪廓重構(gòu)和特征點(diǎn)弦長函數(shù)的圖像檢索算法,以輪廓為基礎(chǔ),這種方法通過分析輪廓的能量保持率并對輪廓進(jìn)行降維重構(gòu),減少了噪聲對輪廓的影響。通過篩選有效的輪廓特征點(diǎn),得到輪廓點(diǎn)和相應(yīng)特征點(diǎn)的弦長關(guān)系作為輪廓特征的表示,這種方法滿足不變性要求。

        輪廓局部表示方法主要有Laich 等人[8]提出的用有序的輪廓片段序列來表示輪廓形狀的方法,然后使用最小二乘模型,將每個片段與一個三次多項式曲線相關(guān)聯(lián),再將得到的曲線進(jìn)行歸一化,得到最終的形狀描述符,這種方法是縮放、旋轉(zhuǎn)、平移不變的。Yang 等人[9]提出的一種名為三角形質(zhì)心距離(Triangular Centroid Distances,TCDs)的形狀描述符。首先通過離散曲線演化[10](Discrete Contour Evolution,DCE)算法將輪廓分割成輪廓片段,然后計算輪廓質(zhì)心點(diǎn),輪廓片段上的兩個采樣點(diǎn)和輪廓質(zhì)心點(diǎn)形成一個三角形,計算此三角形的質(zhì)心,得到三角形質(zhì)心和輪廓質(zhì)心之間的距離,作為最終的形狀描述符。

        近年來,有研究學(xué)者基于單詞包[11-12](Bag of Words,BoW)模型,融合全局輪廓信息和局部輪廓信息,研究了一種形狀特征包[13](Bag of Shape Features,BoSF)形狀分類識別框架。該框架主要可分為以下幾個部分:第一步提取輸入形狀的輪廓,并應(yīng)用離散輪廓演化算法將輪廓分解為不同長度的輪廓段;第二步對每一個輪廓段進(jìn)行特征描述;第三步進(jìn)行形狀編碼,常用的編碼方式為局部線性約束編碼[14](Locality-constrained Linear Coding,LLC);第四步特征池化,并得到直方圖作為最終的形狀表示;第五步運(yùn)用SVM 進(jìn)行訓(xùn)練和實驗。該框架最終得到的形狀表示既包含局部信息,又包含全局信息。BoSF框架的算法流程圖如圖2所示,其中,特征池化方法可以采用空間金字塔匹配[15](Spatial Pyramid Matching,SPM),也可以采用最大池化及平均池化等。

        圖2 BoSF框架算法流程圖

        許多基于該框架提出的方法在常用的形狀分析數(shù)據(jù)庫上均取得了不錯的識別率和分類準(zhǔn)確率。Wang等人[16]提出了名為輪廓碎片包(Bag of Contour Fragments,BCF)的形狀表示。這種方法使用形狀上下文[17]描述每個輪廓片段,并使用LLC算法將其編碼成形狀代碼,最終通過SPM算法匯集形狀代碼,得到緊湊的形狀表示。Pedrosa 等人[18]提出了名為顯著點(diǎn)袋(Bag of Salience Points,BoSP)的形狀描述子,這種描述子為尋找兩組顯著點(diǎn)的對應(yīng)關(guān)系提供了快速解決方案,有助于加速形狀匹配任務(wù)。Shen等人基于該框架,在特征池化過程中采用最大池化和平均池化加權(quán),并通過學(xué)習(xí)確定權(quán)重,這種改進(jìn)提高了識別準(zhǔn)確率。Zeng 等人[19]針對二維形狀識別中的非剛性變換和局部變形問題,提出采用曲率對每個輪廓段進(jìn)行表示,得到曲率詞袋Curvature Bag of Words(CBoW)模型。實驗結(jié)果表明該算法識別率高,魯棒性好,適用于非剛性變換和局部變形的目標(biāo)形狀識別領(lǐng)域。表1對上文所提到的一些描述符做了匯總。

        表1 幾種基于輪廓的表示方法

        基于輪廓的二維形狀表示方法提取的特征包含豐富的邊界信息,其中,輪廓全局表示方法抗噪性較好,但無法捕捉局部特征,導(dǎo)致區(qū)分不同形狀的能力較差,輪廓局部表示方法能夠更好地捕捉局部形狀,但是對邊界噪聲較敏感,且不易實現(xiàn),融合局部輪廓信息和全局輪廓信息的特征能夠更準(zhǔn)確地表示形狀,識別效果更好。

        1.2 基于區(qū)域的形狀表示

        基于區(qū)域的二維形狀表示方法通過利用形狀的內(nèi)部區(qū)域來表示二維形狀,有學(xué)者選擇通過提取整個形狀區(qū)域的特征進(jìn)行表示,也有選擇對區(qū)域進(jìn)行分割,提取分割后的子區(qū)域特征進(jìn)行形狀表示。

        柯善武等人[20]提出了一種融合圖像顯著區(qū)域二維形狀特征的圖像檢索算法。這種方法很好地解決了當(dāng)目標(biāo)存在變形以及大小存在巨大差異時難以提取圖像形狀特征的問題。Wahyono 等人[21]提出了一種基于質(zhì)心的樹結(jié)構(gòu)(CENTREES)。該方法是一種典型的基于區(qū)域的形狀分類識別方法,其將形狀質(zhì)心作為根節(jié)點(diǎn),根據(jù)點(diǎn)和相對于質(zhì)心的主軸之間的角度將形狀分成幾個子區(qū)域,對每個子區(qū)域,用幾種幾何參數(shù)作為描述符。最終,所有參數(shù)的向量作為形狀描述符,該方法是平移旋轉(zhuǎn)縮放不變的。該算法的流程圖如圖3 所示。Wang等人[22]提出了一種將形狀分解與形狀分類相結(jié)合的框架,構(gòu)造一個被稱為“分解圖”的數(shù)據(jù)結(jié)構(gòu),最后通過在分解圖上搜索最優(yōu)路徑得到分解和分類的結(jié)果,實驗證明該方法有很好的分類性能。Priyanka等人[23]提出了名為三角二階形狀導(dǎo)數(shù)的形狀描述符,將幾何概念和圖像導(dǎo)數(shù)算子融合來實現(xiàn)特征描述和提取,取得了很好的檢索率。表2對上文提到的方法做了匯總。

        表2 幾種基于區(qū)域的表示方法

        圖3 基于質(zhì)心的區(qū)域形狀分解流程圖

        基于區(qū)域的二維形狀表示利用了形狀內(nèi)部信息,多數(shù)學(xué)者采用對區(qū)域進(jìn)行分割的方法,通過分割得到的子區(qū)域?qū)π螤钸M(jìn)行描述,這種方法區(qū)分不同形狀的能力更強(qiáng)。然而,區(qū)域分割方法不易實現(xiàn),且當(dāng)數(shù)據(jù)集較大且形狀種類多時,存在細(xì)節(jié)信息丟失的情況。

        1.3 基于骨架的形狀表示

        基于骨架的二維形狀表示方法通過提取形狀骨架來表示二維形狀。在提取骨架時,用到了最大內(nèi)切圓模型,最大內(nèi)切圓指的是圓心在形狀內(nèi)部且至少內(nèi)切形狀輪廓上兩個點(diǎn)的圓形。形狀骨架點(diǎn)由這些內(nèi)切圓的圓心集合而成。

        陳展展等人[24]提出了一種骨架樹匹配算法。這種算法不考慮骨架樹的拓?fù)浣Y(jié)構(gòu),只匹配骨架樹的葉子節(jié)點(diǎn),實驗證明這種方法提高了匹配精度。Bai 等人[25]提出了一種稱為路徑相似骨架圖的匹配算法。其主要思想是通過比較骨架端點(diǎn)之間的測地路徑(骨架末端節(jié)點(diǎn)之間的最短骨架路徑)來匹配骨架圖,該方法不考慮拓?fù)鋱D的結(jié)構(gòu),即使形狀存在一些變形,該方法也能得到正確的結(jié)果。Aslan等人[26]提出了一種運(yùn)用不連續(xù)骨架進(jìn)行形狀匹配的算法,這種表示沒有傳統(tǒng)連續(xù)骨架常見的不穩(wěn)定性問題,實驗結(jié)果證明該種表示方法魯棒性較好。Shen等人[27]提出了一種聚類結(jié)構(gòu),它基于一個名為公共結(jié)構(gòu)骨架圖(Common Structure Skeleton Graph,CSSG)的骨架表示,這種骨架表示表達(dá)了集群的各個骨架的節(jié)點(diǎn)之間可能存在的對應(yīng)關(guān)系,實驗結(jié)果證明該方法是有效的。Xie等人[28]提出了一種形狀匹配和建模方法,該方法基于代表性的骨架特征,在匹配過程中使用骨架分支與沿著形狀曲線的連續(xù)片段進(jìn)行自然對應(yīng),避免了不同片段之間的錯誤對應(yīng)。實驗結(jié)果顯示了其具有很好的性能。

        骨架是形狀數(shù)據(jù)的一種簡單的一維表示,不僅能表示形狀的拓?fù)湫畔⒉⑶野恍┴S富的細(xì)節(jié)信息。然而,當(dāng)形狀受到較大噪聲影響時,骨架可能會存在冗余的骨架枝,導(dǎo)致結(jié)構(gòu)混亂,影響對真實形狀的判斷。

        1.4 基于特征融合的形狀表示

        在二維形狀特征表示中,為了提高形狀描述的準(zhǔn)確性,有研究學(xué)者在傳統(tǒng)特征表示的基礎(chǔ)上,通過融合多種特征來表示二維形狀,并取得了很好的識別效果。

        盧勇強(qiáng)等人[29]采用輪廓與骨架相結(jié)合的方法來描述二維形狀特征,該方法引入生物信息序列分析方法到二維形狀分析中,提出了一種輪廓骨架協(xié)同編碼方案。實驗結(jié)果表明,與原有方法相比,該方法提高了識別效率和準(zhǔn)確性。Yang 等人[30]提出了一種用于形狀匹配和檢索的不變多尺度描述符,該方法對DCE 算法加以改進(jìn),改善了原算法的過度演化問題,并采用這種改進(jìn)之后的稱為自適應(yīng)離散輪廓演化(ADCE)的算法提取輪廓顯著特征點(diǎn),并將歸一化面積、弧長和中心距離三種描述符進(jìn)行融合,作為最終的二維形狀表示,實驗結(jié)果表明該表示方法具有較好的魯棒性。Lin等人[31]針對非線性失真導(dǎo)致形狀輪廓分類性能差的問題,提出了一種基于輪廓的多特征融合算法,實驗結(jié)果顯示該方法優(yōu)于原有的其他方法,解決了幾何變換和非線性失真導(dǎo)致的分類性能差的問題。Shen 等人[32]提出了一種稱為骨架相關(guān)形狀上下文(Skeleton-associated Shape Context,SSC)的形狀描述符,該描述符獲取與骨架信息相關(guān)的輪廓片段,在此基礎(chǔ)上,運(yùn)用BoSF 框架進(jìn)行特征提取,形成了一種對整體形狀有意義的特征向量。實驗結(jié)果表明,該方法在幾個標(biāo)準(zhǔn)形狀數(shù)據(jù)集上取得了很好的識別性能。Lin 等人[33]提出了一種運(yùn)用區(qū)域特征進(jìn)行形狀分類的方法,該方法將名為區(qū)域骨架描述符(Region Skeleton Descriptor,RSD)、區(qū)域面積描述符(Region Area Descriptor,RAD)和簡化形狀簽名(Simplified Shape Signature,SSS)三種描述符進(jìn)行融合,作為最終的形狀表示,在核極限學(xué)習(xí)機(jī)[34-35](Kernel Extreme Learning Machine,K-ELM)上進(jìn)行實驗。實驗結(jié)果表明該方法的效率和準(zhǔn)確率都很高。表3 對上文提到的特征融合方法做了簡單匯總。

        表3 幾種特征融合的表示方法

        上文提到的基于輪廓、區(qū)域、骨架以及特征融合的二維形狀表示方法各有優(yōu)缺點(diǎn),表4對其做了一個匯總。

        表4 各類表示方法對比分析

        2 形狀分類方法

        二維形狀分類識別中,通常選用機(jī)器學(xué)習(xí)分類器進(jìn)行形狀分類,在提取出形狀特征后,通過選取訓(xùn)練樣本,訓(xùn)練分類器,最終可以得到有效的模型完成形狀分類識別。本章主要討論了在二維形狀分類中常用的傳統(tǒng)機(jī)器學(xué)習(xí)分類器、集成分類器以及深度學(xué)習(xí)方法。

        2.1 傳統(tǒng)機(jī)器學(xué)習(xí)分類器

        傳統(tǒng)的分類技術(shù)又可分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩類,在二維形狀分類中,常用的分類器多為有監(jiān)督分類器,包括樸素貝葉斯分類器、隨機(jī)森林、支持向量機(jī)等等。

        樸素貝葉斯分類器是一種概率分類方法,其原理是利用貝葉斯公式,根據(jù)某種特征的先驗概率計算出它的后驗概率,選擇具有最大后驗概率的類別作為特征所屬的類別。樸素貝葉斯分類器的優(yōu)點(diǎn)在于數(shù)據(jù)集易于訓(xùn)練,并且完成計算所花費(fèi)的時間較少。

        Sun 等人[36]利用類段集對輪廓形狀進(jìn)行分類,實驗采用了貝葉斯分類器,得到了很高的分類精度。

        隨機(jī)森林(RF)是一種有監(jiān)督學(xué)習(xí)的分類器,它包含多個決策樹。決策樹是一種樹形結(jié)構(gòu),它通過將數(shù)據(jù)劃分成具有相似性的子集來完成樹的構(gòu)建,這種劃分過程會一直持續(xù)到不能繼續(xù)劃分下去為止。樹中包含兩種節(jié)點(diǎn),其中,有兩個及以上分支的節(jié)點(diǎn)稱為決策節(jié)點(diǎn),沒有分支的節(jié)點(diǎn)是葉子節(jié)點(diǎn)。隨機(jī)森林是許多決策樹的一個集成,并且輸出的類別由個別樹輸出類別的眾數(shù)決定。隨機(jī)森林的效率很高,即使是大型的數(shù)據(jù)集,依舊可以高效運(yùn)轉(zhuǎn),且在數(shù)據(jù)不一致的情況,它也能提供準(zhǔn)確性。

        Lepetit 等人[37]將隨機(jī)森林分類器用于三維物體檢測和姿態(tài)估計。Bosch等人[38]比較了隨機(jī)森林分類器與支持向量機(jī)(SVM)用于圖像分類的性能,結(jié)果表明,當(dāng)使用感興趣區(qū)域(Region Of Interest,ROI)時,隨機(jī)森林分類器較支持向量機(jī)有約5%的性能提升,且當(dāng)在分類器訓(xùn)練期間生成額外的數(shù)據(jù)時,隨機(jī)森林分類器的性能也會得到提升,文章方法的隨機(jī)森林分類器與支持向量機(jī)相比,最終得到一個約10%的性能提升。Huang等人[39]提出了一種管狀結(jié)構(gòu)分類的方法,該方法提取了三個形狀描述符:三角形面積、距離閾值以及最小慣性軸,將其組合作為最終的形狀表示,并使用隨機(jī)森林分類器進(jìn)行訓(xùn)練和實驗,取得了很好的分類結(jié)果。Keskin 等人[40]運(yùn)用隨機(jī)森林分類器進(jìn)行手勢形狀分類,同樣得到了很好的分類效果。

        支持向量機(jī)(SVM)是一種有監(jiān)督學(xué)習(xí)的分類器,是當(dāng)前最常用的分類算法。SVM的決策邊界是對學(xué)習(xí)樣本求解的最大邊距超平面。SVM的目標(biāo)是以最小的錯誤率對物體進(jìn)行分類。SVM的優(yōu)勢在于給出的結(jié)果比其他方法更準(zhǔn)確,但是它的訓(xùn)練過程需要一定的時間且需要額外內(nèi)存來存儲訓(xùn)練圖像[41]。

        文獻(xiàn)[16]使用線性支持向量機(jī)分類器進(jìn)行形狀分類,同時提出使用徑向基函數(shù)核和交集核等能夠提高性能,但較為耗時。文獻(xiàn)[13]同樣使用了線性支持向量機(jī)進(jìn)行形狀分類。文獻(xiàn)[32]使用線性支持向量機(jī)進(jìn)行形狀分類,并指出該方法使用非線性核分類器反而會導(dǎo)致性能下降。Daliri 等人[42]提出了一種形狀識別的核方法,該方法使用支持向量機(jī)進(jìn)行形狀分類,在常用的形狀分析數(shù)據(jù)集上均取得了較好的結(jié)果。

        2.2 集成分類器

        對于有監(jiān)督機(jī)器學(xué)習(xí)任務(wù),集成學(xué)習(xí)是一種有效的方法,其思路是通過多機(jī)器學(xué)習(xí)算法的集成來提升預(yù)測的結(jié)果。理論上,集成學(xué)習(xí)在訓(xùn)練集上比單一模型的擬合能力更強(qiáng),且某些集成學(xué)習(xí)方法也能更好地處理過擬合的問題。對于分類性能好的分類器,集成學(xué)習(xí)往往能夠給予更高的權(quán)重。

        常用的集成方法包括bagging[43]、boosting[44]等,除此之外,投票法、簡單加權(quán)以及隨機(jī)森林方法也常用于分類器的集成。

        采用相同的分類算法,在不同的訓(xùn)練集子集上進(jìn)行訓(xùn)練,且采樣時將樣本放回,這種方法稱為bagging,也稱為自舉匯聚法。使用該方法進(jìn)行集成得到的分類器與單一分類器相比,降低了在訓(xùn)練集上訓(xùn)練的偏差和方差。該方法流行的原因不僅在于其可以并行進(jìn)行,還因為此方法易于拓展。

        提升法是指將多個弱學(xué)習(xí)器結(jié)合成為一個強(qiáng)學(xué)習(xí)器的集成方法,代表方法包括AdaBoost 和梯度提升兩種。兩種方法類似,差別僅在于AdaBoost 方法不再是調(diào)整單個預(yù)測器的參數(shù)使得成本函數(shù)最小化,而是不斷在集成中加入預(yù)測器,使模型越來越好。該方法的缺點(diǎn)是無法并行,所以在拓展方面的表現(xiàn)不如bagging方法。

        投票法是指將多個分類器的結(jié)果進(jìn)行聚合,然后將得票最多的結(jié)果作為最終的結(jié)果的一種方法,這種大多數(shù)投票分類器也被稱為硬投票分類器,其工作原理如圖4所示。

        圖4 多數(shù)投票法集成分類器

        簡單加權(quán)是指使用不同的分類器在同一訓(xùn)練集上進(jìn)行訓(xùn)練,得到的結(jié)果通過權(quán)重進(jìn)行組合的一種集成方法。通常,組合權(quán)重α可通過學(xué)習(xí)過程獲得。加權(quán)組合得到的集成分類器性能往往高于單一的分類器。

        Mohandes 等人[45]提出了一個基于準(zhǔn)則的多分類器組合技術(shù)框架及其應(yīng)用領(lǐng)域,將分類器的組合類型大致分為四類:組合級別、閾值類型、組合的適應(yīng)性和基于集成的方法。Wang等人[46]提出了一種融合特征以及分類器的方法來進(jìn)行形狀識別,該方法通過訓(xùn)練7種不同的單分類器,并通過平均規(guī)則進(jìn)行融合得到分類結(jié)果,在標(biāo)準(zhǔn)形狀分析數(shù)據(jù)庫上顯示出很好的性能。Rida等人[47]提出的掌紋識別,Zhao 等人[48]提出的手寫字體識別,均采用了集成學(xué)習(xí)的技術(shù),顯示出分類器集成相較于單分類器,性能得到了提升。

        2.3 深度學(xué)習(xí)方法

        卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),它是多層感知器(MLP)的一個變種形式。其基本結(jié)構(gòu)由三層組成:輸入層、隱藏層、輸出層。其隱藏層又包含卷積層、池化層、全連接層等結(jié)構(gòu)。CNN 對于大數(shù)據(jù)集的處理效果很好,當(dāng)數(shù)據(jù)集樣本偏小時,性能受到很大影響。采用CNN 進(jìn)行形狀分類識別流程如圖5所示。

        圖5 卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行形狀識別分類流程圖

        Atabay 等人[49]提出了一種適用于二值圖像的CNN結(jié)構(gòu),該方法在小尺度的二值圖像上性能較高且時間復(fù)雜度較低。在另一篇文章中,Atabay 等人[50]將CNN 用于葉片圖像分類,引入指數(shù)線性單元(ELU)代替校正線性單元(ReLU)得到新的CNN 結(jié)構(gòu)。實驗結(jié)果表明在兩個葉片數(shù)據(jù)集上,新的CNN網(wǎng)絡(luò)結(jié)構(gòu)性能優(yōu)異。Tixier等人[51]利用傳統(tǒng)的2D CNN網(wǎng)絡(luò)進(jìn)行圖形分類,該方法將圖形進(jìn)行處理之后輸入進(jìn)網(wǎng)絡(luò)來進(jìn)行后續(xù)操作,該方法在時間復(fù)雜度方面優(yōu)于圖核方法,并且適用于更大圖形的更大規(guī)格的數(shù)據(jù)集。表5 對上文提到的幾種分類器做了簡單匯總。

        表5 幾種不同分類器的識別率比較

        3 二維形狀標(biāo)準(zhǔn)數(shù)據(jù)庫

        為了便于開展二維形狀分析研究,目前,研究學(xué)者建立了多個二維形狀標(biāo)準(zhǔn)數(shù)據(jù)庫,本文將常用的二維形狀標(biāo)準(zhǔn)數(shù)據(jù)庫進(jìn)行了匯總。

        MPEG-7數(shù)據(jù)庫[52]是形狀分析研究領(lǐng)域中最常用的數(shù)據(jù)庫,其包含70個類別,在每個類別中,有20個形狀,因此數(shù)據(jù)集中的形狀總數(shù)為1 400個。

        Animal數(shù)據(jù)庫[53]包含20個類別,每個類別中有100個形狀,總共由2 000 個形狀組成。由于動物是非剛性物體,該數(shù)據(jù)集中的形狀具有很高的類內(nèi)可變性,因此,這個數(shù)據(jù)庫的分類識別任務(wù)相當(dāng)具有挑戰(zhàn)性。

        Swedish leaf 數(shù)據(jù)庫[54]由15 個類別組成,每個類別有75個樣本,共有1 125個形狀。由于有較大的類內(nèi)差異,這個數(shù)據(jù)庫的識別也相當(dāng)具有挑戰(zhàn)性。

        ETH-80數(shù)據(jù)庫[55]包含八類對象。每個類別中有10個物體是從不同的視角拍攝的,每個物體有41 幅彩色圖像,如圖6所示,共有80個樣本。

        圖6 ETH-80數(shù)據(jù)庫

        Tools數(shù)據(jù)庫[56]包含8類對象,其中包括6類不同的剪刀和2 類訂書機(jī),一共40 個形狀,如圖7 所示。在每一類中,這五種形狀相互之間有較大的關(guān)節(jié)變形差異。

        圖7 工具數(shù)據(jù)庫

        針對二維形狀識別分類問題,分類識別準(zhǔn)確率[16]往往是執(zhí)行分類任務(wù)的算法的評估標(biāo)準(zhǔn)。基于機(jī)器學(xué)習(xí)的方法中,半訓(xùn)練和留一法是兩種常用的評估方案。半訓(xùn)練是指將一半樣本用于算法的訓(xùn)練,另一半樣本用于實驗測試。留一法是指將90%的樣本用于算法訓(xùn)練,剩下的10%樣本用于實驗測試。

        表6 匯總了上文提到的表示方法和識別分類方法在標(biāo)準(zhǔn)數(shù)據(jù)庫上的識別率。并將現(xiàn)有在上述五個數(shù)據(jù)庫上表現(xiàn)較突出的方法的識別率匯總在表7之中。

        表6 各方法識別率匯總

        表7 不同數(shù)據(jù)庫上表現(xiàn)較突出的方法的識別率

        4 研究發(fā)展趨勢

        隨著二維形狀特征描述及分類識別技術(shù)研究的不斷深入,學(xué)者們提出了眾多的形狀描述符以及識別分類方法。由于實際中的形狀往往存在噪聲、變形、遮擋等情況,使得這些方法的準(zhǔn)確實現(xiàn)受到挑戰(zhàn)。因此,對該領(lǐng)域的研究還有很多值得深入的地方。

        在表示方法方面,單一的人工特征描述符方法接近穩(wěn)定,基于此,新提出的特征描述符往往嘗試將傳統(tǒng)特征進(jìn)行融合,將融合后的特征作為最終的形狀描述符,以提高形狀表示的準(zhǔn)確性。在分類識別方法方面,傳統(tǒng)的動態(tài)規(guī)劃方法以及相似性度量方法存在算法復(fù)雜度高以及精確度不夠的問題,使得機(jī)器學(xué)習(xí)方法逐漸被學(xué)者們應(yīng)用到二維形狀識別分類的研究當(dāng)中。不滿足于單一分類器得到的結(jié)果,已有學(xué)者運(yùn)用集成學(xué)習(xí)方法將多種分類器進(jìn)行集成,以提高分類識別的精確度。同時,深度學(xué)習(xí)方法也在該領(lǐng)域得到了應(yīng)用,并展示出良好的性能。

        5 結(jié)束語

        本文綜述了用于二維形狀特征描述及分類識別領(lǐng)域的新的技術(shù)。主要從形狀特征提取、形狀分類識別、形狀數(shù)據(jù)庫三個方面展開討論。形狀特征提取方法主要基于輪廓、區(qū)域、骨架三種特征,特征融合方法的提出,一定程度上彌補(bǔ)了單一特征進(jìn)行形狀分類識別所表現(xiàn)出的不足。分類識別方法主要基于機(jī)器學(xué)習(xí),現(xiàn)有方法大多使用單一分類器完成分類識別任務(wù),集成學(xué)習(xí)方法也在形狀分類識別領(lǐng)域得到應(yīng)用,并取得了令人滿意的結(jié)果。文中列舉的形狀分析數(shù)據(jù)庫是進(jìn)行二維形狀分類識別實驗常用的數(shù)據(jù)庫,不同方法在不同數(shù)據(jù)集上的表現(xiàn)略有差別。

        猜你喜歡
        描述符骨架輪廓
        淺談管狀骨架噴涂方法
        基于結(jié)構(gòu)信息的異源遙感圖像局部特征描述符研究
        OPENCV輪廓識別研究與實踐
        骨架密度對炭/炭多孔骨架壓力浸滲銅的影響
        基于實時輪廓誤差估算的數(shù)控系統(tǒng)輪廓控制
        Linux單線程并發(fā)服務(wù)器探索
        利用CNN的無人機(jī)遙感影像特征描述符學(xué)習(xí)
        在線學(xué)習(xí)機(jī)制下的Snake輪廓跟蹤
        內(nèi)支撐骨架封抽技術(shù)在突出煤層瓦斯抽采中的應(yīng)用
        中國煤層氣(2014年3期)2014-08-07 03:07:45
        鐵骨架配合物凝膠的合成、表征及催化性能
        野花社区www高清视频| 亚洲va无码va在线va天堂| 成人免费a级毛片| 国产精品乱码一区二区三区| 看全色黄大色大片免费久久| 亚洲精品国产第一区二区尤物| 亚洲成a人片在线看| 性欧美老人牲交xxxxx视频| 人人爽人人爽人人爽| 欧美亚洲日韩国产区| 亚洲另在线日韩综合色| 亚洲一区二区免费日韩| 少妇人妻中文字幕在线| 在线免费观看蜜桃视频| 亚洲第一女人av| 国产七十六+老熟妇| 亚洲欧美aⅴ在线资源| 色妞色综合久久夜夜| 久草午夜视频| 国产精品国产三级国产AvkTV | 色婷婷一区二区三区久久亚洲 | 中文字幕日韩有码国产| 亚洲开心婷婷中文字幕| 内射欧美老妇wbb| 亚洲综合色自拍一区| 日韩成人精品日本亚洲| 偷柏自拍亚洲综合在线| 日本免费视频一区二区三区| 强d乱码中文字幕熟女免费| 在线播放免费人成毛片乱码| 18分钟处破好疼哭视频在线观看 | 自拍 另类 综合 欧美小说| 中文字幕五月久久婷热| 蜜桃传媒免费观看视频| 亚洲精品中文字幕一二三区| 成人亚洲精品777777| 精品日韩欧美一区二区在线播放| 99精品国产在热久久国产乱| 蜜桃视频中文字幕一区二区三区| 男女打扑克视频在线看| 午夜性刺激免费看视频|