亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的候選區(qū)域優(yōu)化算法

        2020-01-10 01:49:30王春哲安軍社姜秀杰邢笑雪
        中國(guó)光學(xué) 2019年6期
        關(guān)鍵詞:候選框數(shù)目滑動(dòng)

        王春哲,安軍社,姜秀杰,邢笑雪

        (1.中國(guó)科學(xué)院國(guó)家空間科學(xué)中心 復(fù)雜航天系統(tǒng)電子信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100190;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.長(zhǎng)春大學(xué),吉林 長(zhǎng)春 130022)

        1 引 言

        在計(jì)算機(jī)視覺(jué)中,目標(biāo)檢測(cè)在人臉識(shí)別與目標(biāo)跟蹤等方面有著廣泛的應(yīng)用[1-2]。目標(biāo)檢測(cè)是確定圖像中是否含有目標(biāo)及目標(biāo)所在圖像中的位置。在過(guò)去幾十年中,解決該問(wèn)題的主要方法是采用滑動(dòng)窗口范式,具體為:在該范式下,使用一個(gè)高效的分類(lèi)器判斷密集采樣的滑動(dòng)窗口中是否存在目標(biāo)。然而,該類(lèi)方法計(jì)算量巨大,僅在單尺度下,每張圖像就需處理104~105個(gè)滑動(dòng)窗口,而且現(xiàn)在的數(shù)據(jù)集還要求預(yù)測(cè)目標(biāo)的寬高比,極大地增加了檢測(cè)算法的復(fù)雜度。最近,學(xué)者們提出基于候選區(qū)域(Region Proposals,RP)的檢測(cè)框架,該檢測(cè)框架可有效提高目標(biāo)的檢測(cè)效率,其主要思想是在圖像上生成少量更可能包含目標(biāo)的候選區(qū)域,并對(duì)該候選區(qū)域進(jìn)行后續(xù)的識(shí)別與定位[3]。

        生成候選區(qū)域的主要準(zhǔn)則有[3]:分組提案(Grouping Proposals,GP)準(zhǔn)則及窗口評(píng)分(Window Scoring Proposals,WSP)準(zhǔn)則。GP準(zhǔn)則試圖生成可能包含目標(biāo)的分割段,并利用顏色、形狀等線索合并分割段來(lái)生成候選區(qū)域,其代表性算法是選擇性搜索算法(Selective Search,SS)[4]。WSP準(zhǔn)則是對(duì)滑動(dòng)窗口中出現(xiàn)目標(biāo)的可能性進(jìn)行評(píng)分,并根據(jù)評(píng)分高低篩選候選區(qū)域,該準(zhǔn)則主要有Object-ness[5],BING[6]以及Edge Boxes(EB)[7]。

        EB通過(guò)統(tǒng)計(jì)滑動(dòng)窗口中出現(xiàn)目標(biāo)邊緣信息的多少來(lái)生成目標(biāo)的候選區(qū)域。但由于EB方法使用傳統(tǒng)邊緣檢測(cè)算子生成邊緣特征,不能準(zhǔn)確地描述目標(biāo),因此具有一定局限性。近幾年,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)在目標(biāo)分割、識(shí)別與檢測(cè)等領(lǐng)域中表現(xiàn)出色[8-11]。由于目標(biāo)邊界通常含有較多的語(yǔ)義信息[12],使用CNN可以生成更富有語(yǔ)義信息的邊緣特征,有助于提高目標(biāo)候選區(qū)域的質(zhì)量。

        目標(biāo)顯著性是在圖像的多尺度及不同寬高比下統(tǒng)計(jì)圖像的顏色、紋理及形狀信息,從而將目標(biāo)從背景中區(qū)分出來(lái)[13-14]。目標(biāo)的空間位置信息是衡量目標(biāo)屬性的重要指標(biāo),自然圖像中,目標(biāo)多出現(xiàn)在圖像的中間或鄰近中間位置,若將目標(biāo)顯著性及位置信息引入到候選區(qū)域算法中,可有效提高目標(biāo)候選區(qū)域的召回率。

        本文從卷積邊緣特征、目標(biāo)顯著性及目標(biāo)的空間位置,3個(gè)方面來(lái)研究目標(biāo)的候選區(qū)域算法。使用深度神經(jīng)網(wǎng)絡(luò)生成更能表達(dá)目標(biāo)邊界的卷積邊緣特征,并統(tǒng)計(jì)每個(gè)滑動(dòng)窗口中含有的目標(biāo)邊緣信息量、顯著性特征及目標(biāo)的空間位置信息,篩選滑動(dòng)窗口。

        2 卷積邊緣特征與目標(biāo)顯著性

        本文所述候選區(qū)域算法主要包括:(1)邊緣信息得分;(2)目標(biāo)的顯著性得分;(3)位置信息得分;(4)篩選滑動(dòng)窗口。首先,使用RCF(Richer Convolutional Features)網(wǎng)絡(luò)生成富有語(yǔ)義信息的卷積邊緣特征圖;然后,在整張圖像上無(wú)重疊采樣若干圖像塊,并使用周邊延拓像素、顏色直方圖的卡方距離(Chi-square distance)等策略,統(tǒng)計(jì)每個(gè)滑動(dòng)窗口的平均顯著性得分;第三,為每個(gè)滑動(dòng)窗口構(gòu)建位置信息得分模型;最后,根據(jù)每個(gè)滑動(dòng)窗口的邊緣信息得分、顯著性得分及位置信息得分,篩選滑動(dòng)窗口,算法結(jié)構(gòu)如圖1所示。

        圖1 所提算法實(shí)現(xiàn)框圖 Fig.1 Block diagram of the proposed algorithm

        圖2 RCF結(jié)構(gòu) Fig.2 The structure of RCF

        2.1 卷積邊緣特征

        圖3 給定一張圖像X Fig.3 An given image X

        圖4 X的邊緣特征圖 Fig.4 Edge feature maps of X

        表1 邊緣組算法描述

        對(duì)于一個(gè)邊緣組s中的任意邊緣點(diǎn)p,其邊緣強(qiáng)度為mp、邊緣方向角為θp及邊緣點(diǎn)位置為(xp,yp),則邊緣組s的位置(xs,ys)可定義為:

        (3)

        其中,P為邊緣組s中所有邊緣點(diǎn)集合。邊緣組s的方向角θs可表示為:

        (4)

        在邊緣組集合T中任意取兩個(gè)邊緣組ti及tj,則兩邊緣組之間的相似度為:

        a(ti,tj)=|cos(θi-θij)cos(θj-θij)|γ.

        (5)

        其中,θi、θj分別為ti及tj的方向角;θij為ti及tj重心連線間的方向角;γ用于調(diào)整方向角變化對(duì)相似度的敏感性[7],根據(jù)EB算法取值策略,取γ=2。

        (6)

        (7)

        其中,mi表示第i個(gè)邊緣組強(qiáng)度;bh與bw為滑動(dòng)窗口b的高和長(zhǎng);ε為調(diào)節(jié)hb對(duì)滑動(dòng)窗口大小的敏感度[7],鑒于EB算法,本文取ε=1.5。

        2.2 顯著性得分

        在文獻(xiàn)[14]中,作者認(rèn)為目標(biāo)的顏色變化比背景的顏色變化豐富,因此作者將圖像無(wú)重疊地分成若干圖像塊,并將圖像塊的6個(gè)通道R、G、B、L、a、b作為顏色向量,使用隨機(jī)森林等訓(xùn)練策略確定滑動(dòng)窗口的顯著性得分。這種處理對(duì)算法性能有所改善,但有兩點(diǎn)不足:第一,眾所周知,語(yǔ)義信息對(duì)后續(xù)的目標(biāo)檢測(cè)很重要,但作者在文獻(xiàn)[14]中使用傳統(tǒng)的邊緣檢測(cè)算子生成邊緣特征,不能很好地描述圖像的語(yǔ)義信息,這就要求采用更復(fù)雜的分類(lèi)器對(duì)后續(xù)目標(biāo)進(jìn)行識(shí)別,從而增加了檢測(cè)階段算法的復(fù)雜度;第二,需要對(duì)若干圖像塊的顏色特征進(jìn)行單獨(dú)的預(yù)先訓(xùn)練,而訓(xùn)練后的參數(shù)可能受不同數(shù)據(jù)庫(kù)內(nèi)容的影響,從而增加了算法的運(yùn)算時(shí)間。

        針對(duì)上述兩點(diǎn)不足,本文使用目標(biāo)顏色的局部特征改進(jìn)算法。目標(biāo)顯著性指出,目標(biāo)與周?chē)尘爸g的顏色差異較大[13]。對(duì)于緊緊包含目標(biāo)的矩形框bxc,通過(guò)將矩形框bxc向周邊擴(kuò)展像素,獲得背景矩形框bxs(bxc?bxs);對(duì)于不包含目標(biāo)的矩形框bxr,按照相同策略獲取相應(yīng)的背景矩形框bxm(bxr?bxm),則顏色直方圖的卡方距離關(guān)系有:ds{bxc,bxs}>ds{bxr,bxm},如圖5所示。將矩形框bxc、bxr稱(chēng)為中心圖像塊,簡(jiǎn)記為C圖像塊;背景矩形框bxs、bxm稱(chēng)為背景圖像塊,簡(jiǎn)記為S圖像塊。

        圖5 圖像塊的卡方距離 Fig.5 The chi-square distance of image patches

        圖6 選取S圖像塊的策略 Fig.6 Selection strategy of S image patch

        在尺寸為M×N的彩色圖像X上無(wú)重疊采樣,采樣窗口為w×w,因此,共采樣Ng=(M/w)×(N/w)個(gè)彩色圖像塊。每個(gè)彩色圖像塊Xci(i=1,…,Ng)有3個(gè)通道,分別記作Xci(R)、Xci(G)、Xci(B)。

        為計(jì)算顯著性得分,需將每個(gè)圖像塊Xci按照一定的策略向四周延拓像素,形成S圖像塊,記作Xsi(i=1,…,Ng)。S圖像塊的選取策略如圖6所示。對(duì)位于X邊緣上的圖像塊Xci,僅向含有像素的方向延拓2×w個(gè)像素;對(duì)位于非邊緣上的圖像塊Xci,則向四周分別延拓2×w個(gè)像素。為衡量圖像塊Xci及Xsi間的顏色差異,分別計(jì)算Xci三通道的顏色直方圖為hr,hg,hb以及Xsi三通道的顏色直方圖為sr,sg,sb。每個(gè)通道顏色直方圖的卡方距離分別為:

        (8)

        (9)

        (10)

        其中,nbin為一常數(shù),取值為256。圖像塊Xci及Xsi的顏色直方圖的卡方距離定義為:

        (11)

        使用b中所有圖像塊的卡方距離的平均值,作為滑動(dòng)窗口b的顯著性得分:

        (12)

        2.3 位置信息得分

        為描述圖像中目標(biāo)的位置信息,圖7分別列出了PASCAL VOC 2007、VOC 2012數(shù)據(jù)集中目標(biāo)位置與目標(biāo)數(shù)目的關(guān)系。其中:橫坐標(biāo)為已標(biāo)注目標(biāo)的中心與圖像中心歸一化后的歐氏距離,縱坐標(biāo)為目標(biāo)數(shù)目??梢钥吹?,目標(biāo)主要分布在距圖像中心[0,0.5)范圍內(nèi),此區(qū)域的目標(biāo)約占70%,隨著距離的增加,目標(biāo)數(shù)逐漸減少。根據(jù)這一特性,將目標(biāo)位置信息融入到候選區(qū)域算法中。

        圖7 目標(biāo)位置與目標(biāo)數(shù)目關(guān)系。(a)VOC 2007數(shù)據(jù)集;(b)VOC 2012數(shù)據(jù)集 Fig.7 Relationship between the object′s location and object′s number. (a) VOC 2007 dataset; (b) VOC 2012 dataset

        首先對(duì)每個(gè)滑動(dòng)窗口進(jìn)行位置信息建模,計(jì)算彩色圖像X的中心位置坐標(biāo)(Xmx,Xmy):

        (13)

        對(duì)于滑動(dòng)窗口b,用四維向量(bx,by,bw,bh)表示,因此b的中心位置坐標(biāo)(bmx,bmy):

        (14)

        其中,bx,by表示滑動(dòng)窗口b左上角的位置坐標(biāo),bw及bh分別為滑動(dòng)窗口的寬和高。則滑動(dòng)窗口b的中心與彩色圖像中心的歐氏距離為:

        (15)

        由于滑動(dòng)窗口b的中心與圖像X中心距離越大,則含有目標(biāo)的概率越小。因此,本文選取一個(gè)單調(diào)遞減函數(shù)作為該距離的權(quán)重,來(lái)表達(dá)該候選區(qū)域的位置信息得分:

        L(b)=(η)dst(b,X)·dst(b,X) ,

        (16)

        其中,0<η<1,η值的大小(取0.5),表明L(b)對(duì)距離dst(b,X)的敏感程度。

        2.4 篩選候選框

        將計(jì)算的邊緣信息得分、顯著性得分及位置信息得分,分別賦予合適權(quán)重,作為滑動(dòng)窗口b的最終得分:

        (17)

        表2 精調(diào)滑動(dòng)窗口策略

        3 數(shù)據(jù)分析與性能比較

        3.1 數(shù)據(jù)庫(kù)選取及性能評(píng)價(jià)指標(biāo)

        本文選取在候選區(qū)域算法中使用較廣泛的數(shù)據(jù)集PASCAL VOC 2007進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)集有訓(xùn)練集、驗(yàn)證集及測(cè)試集,共9 963張圖像、24 640個(gè)目標(biāo)。數(shù)據(jù)集的基本情況如表3所示。

        表3 VOC 2007數(shù)據(jù)集特性

        本文采用召回率(recall)、AUC(Area Under Curve,AUC)值及達(dá)到某召回率時(shí)所需候選框數(shù)目作為評(píng)價(jià)算法性能的標(biāo)準(zhǔn),具體見(jiàn)3.4節(jié)。

        召回率是描述候選區(qū)域?yàn)檎龢颖镜母怕手笜?biāo),公式為:

        (18)

        其中,nmb(·)表示含有·的數(shù)目;tp表示正樣本,fn表示虛假負(fù)樣本。為確定候選區(qū)域是否為正樣本,需通過(guò)候選區(qū)域與標(biāo)注區(qū)域的交并比(Intersection over Union,IoU)實(shí)現(xiàn)。在給定候選區(qū)域pbx及對(duì)應(yīng)的標(biāo)注框gbx情況下,其交并比可定義為:

        (19)

        若交并比IoU(pbx,gbx)大于設(shè)置的閾值thr(通常為0.5),則候選區(qū)域pbx為正樣本。召回率越大,說(shuō)明候選區(qū)域算法越好。AUC值是衡量候選區(qū)域算法性能的重要指標(biāo),其值越大,候選區(qū)域算法性能越好。

        3.2 RCF網(wǎng)絡(luò)訓(xùn)練

        為得到更加富有語(yǔ)義信息的邊緣特征,本文選取ImageNet數(shù)據(jù)集VGG16的預(yù)先訓(xùn)練模型,并在BSD500的邊緣檢測(cè)數(shù)據(jù)集上訓(xùn)練RCF。在訓(xùn)練RCF網(wǎng)絡(luò)時(shí),選擇均值為零、標(biāo)準(zhǔn)差為0.01的高斯分布的權(quán)重值,在偏置為零時(shí)進(jìn)行參數(shù)初始化。每次選取10張圖像,并使用隨機(jī)梯度SGD算法優(yōu)化參數(shù)。參數(shù)設(shè)置為:學(xué)習(xí)率為1×10-6、動(dòng)量值為0.9、權(quán)重衰減為0.000 2,NVIDIA GeForce GTX 1080上共運(yùn)行SGD 40k次。

        3.3 參數(shù)確定

        圖8 參數(shù)α、β與召回率的關(guān)系 Fig.8 Relationship of the parameters α, β and recall

        為確定合適的窗口尺寸w,固定參數(shù)α及β的最優(yōu)值α=0.000 1和β=0.1,選取w分別為8,16,24,32,40,48,w與召回率之間的關(guān)系如圖9所示??梢?jiàn),當(dāng)窗口尺寸w=16時(shí),召回率為最大值。因此,本文最終選取的參數(shù)為α=0.000 1、β=0.1、w=16。

        圖9 參數(shù)w與召回率的關(guān)系 Fig.9 Relationship of the parameter w and recall

        3.4 數(shù)據(jù)分析與性能比較

        為驗(yàn)證本文方法的有效性,選取SS[4]、Object-ness[5]、BING[6]、CPMC[15]、EB[7,16]、Randomized Prim′s[17]、Rantalankila[18]、MCG[19]、Endres[20]、Geodesic[21]、Rigor[22-23]、Improved EdgeBoxes[14]共12種近年來(lái)主流算法,在PASCAL VOC2007測(cè)試集上進(jìn)行對(duì)比實(shí)驗(yàn)。首先固定候選框的數(shù)目,研究13種算法在不同交并比IoU下的召回率,如圖10所示(彩圖見(jiàn)期刊電子版)。

        從圖10可知,實(shí)驗(yàn)中的算法可分為兩類(lèi):一類(lèi)是定位較好的算法,此類(lèi)算法隨著IoU的升高,召回率緩慢下降,如SS和EB算法;另一類(lèi)是定位較差的算法,隨著IoU的升高,召回率急速下降,如BING,Rantalankila算法。當(dāng)候選框個(gè)數(shù)為100時(shí),Improved EdgeBoxes性能略高于所提算法,但弱于CPMC、endres等算法,這表明在候選框較少的情況下,可優(yōu)先考慮CPMC及endres算法;當(dāng)候選區(qū)域數(shù)目為1 000時(shí),MCG性能表現(xiàn)最好;當(dāng)候選區(qū)域數(shù)目大于1 000,且IoU為0.5~0.7時(shí),本文算法的召回率最高,這表明本文算法有效提高了候選區(qū)域的質(zhì)量。

        評(píng)價(jià)候選區(qū)域算法性能的另一種方法是固定交并比IoU,研究不同候選區(qū)域數(shù)目下算法的召回率。圖11(彩圖見(jiàn)期刊電子版)為指定交并比IoU,13種算法召回率隨候選區(qū)域數(shù)目的變化示意圖。從圖11可知,交并比IoU取為0.5及0.7時(shí),隨著候選框數(shù)目的增加,本文算法性能趨于最佳,有最高的召回率。圖11(c)展示了13種算法

        在不同交并比下的平均召回率。從圖11(c)可知,MCG、SS和本文算法的整體性能表現(xiàn)優(yōu)越。

        圖10 不同候選框數(shù)下召回率與交并比之間的關(guān)系 Fig.10 Relationship between recall and IoU at different number of proposals

        圖11 不同交并比的候選框數(shù)與召回率的關(guān)系 Fig.11 Recall versus number of proposals at different IoUs

        平均召回率AR表示在不同交并比IoU下召回率的平均值,定義為:

        (20)

        為全面衡量所提算法性能,表4列出了在PASCAL VOC 2007驗(yàn)證集下,當(dāng)交并比IoU=0.7時(shí),AUC值、運(yùn)算時(shí)間及召回率分別達(dá)到45%、60%、75%時(shí),所需候選框的數(shù)目。其中,除本文算法外,其他算法的結(jié)果來(lái)自參考文獻(xiàn)[7][24]。

        若在指定召回率下,所需候選框數(shù)目越少,表明該算法定位性能越好;另外,由于處理的候選框相對(duì)較少,也可為后續(xù)檢測(cè)節(jié)約時(shí)間,從而極大地提高了檢測(cè)效率。

        達(dá)到指定召回率時(shí),所需最少候選框數(shù)目的確定規(guī)則如下:

        (1)預(yù)先選取候選框的個(gè)數(shù)為cnts={1,2,5,10,100,200,500,1 000,2 000,5 000,10 000},然后計(jì)算各候選框數(shù)目下的召回率,為區(qū)分不同交并比下的召回率,此處,記作Rj(j=1,2,…11);

        (2)對(duì)給定的數(shù)據(jù)集合cnts中每個(gè)數(shù)據(jù)取對(duì)數(shù)ms=log(cnts),ms中共有11個(gè)值,每個(gè)值分別記為ms[i];

        (3)當(dāng)召回率Rj>Rs時(shí),候選區(qū)域最小數(shù)目的索引為:e=min{index{Rj>Rs}},并令f=e-1;

        (4)召回率達(dá)到Rs時(shí),所需候選框的最小數(shù)目,即為:

        (ms[e]-ms[f])+ms[f]) .

        (21)

        根據(jù)上述的召回率值Rj及ms確定AUC值,其策略如下:

        (22)

        式(22)中,ms[end]表示集合ms的最后一個(gè)值。

        表4中“--”表示無(wú)窮大。由表4知,本文算法的AUC值達(dá)到了0.47,與MCG算法性能相當(dāng);性能達(dá)到75%時(shí),僅需799個(gè)候選框,相比于MCG的1 116個(gè)、SS的1 812個(gè)候選區(qū)域,明顯降低了候選框個(gè)數(shù)。

        表4中,Rρ代表候選框數(shù)為ρ(1 000,2 000,10 000)時(shí),各算法的召回率??梢灾?,在不同候選框數(shù)目下,本文算法均有很好性能;當(dāng)候選框數(shù)為10 000時(shí),本文算法的召回率達(dá)到了90.50%,明顯高于其他算法,同時(shí)較Improved EdgeBoxes提高了1.25%。

        表4 交并比為0.7時(shí)13種算法的實(shí)驗(yàn)結(jié)果

        本文在NVIDIA GeForce GTX 1080、CPU@4.20 GHz,32G RAM下,本文算法所用時(shí)間為0.764 9 s,以犧牲微小計(jì)算資源,提高了算法的召回率。精度mAP值是選取1 000個(gè)候選框,在Fast R-CNN(model M)的測(cè)試結(jié)果。由表4可知,本文算法的精度較高。

        3.5 圖像中不同位置目標(biāo)的召回率

        為證明所提算法對(duì)出現(xiàn)在圖像中不同位置目標(biāo)的性能,本文在PASCAL VOC 2007測(cè)試集中,選取已標(biāo)注目標(biāo)的中心與圖像中心的歸一化距離分別為[0,0.5)、[0.5,0.8)及[0.8,1.0]的圖像進(jìn)行實(shí)驗(yàn)。歸一化距離越大,則目標(biāo)越靠近圖像邊緣;距離越小,目標(biāo)越靠近圖像中心。圖12(彩圖見(jiàn)期刊電子版)列出了圖像中不同區(qū)域的目標(biāo)、候選框數(shù)目取10 000時(shí),13種算法在不同交并比IoU下的召回率??梢钥闯?,所提算法在距離圖像中心為[0,0.5)及[0.5,0.8)上的目標(biāo)性能優(yōu)越,Improved EdgeBoxes與EB算法性能相當(dāng),低于所提算法的性能,在靠近邊緣的目標(biāo),所提算法的性能接近SS算法。這表明,無(wú)論是在圖像中心或圖像邊緣的目標(biāo),所提算法均有良好性能。

        為進(jìn)一步說(shuō)明所提算法對(duì)圖像邊緣目標(biāo)檢測(cè)的性能,選取測(cè)試集中與圖像中心的歸一化距離為[0.8,1.0]的圖像,在不同交并比IoU下進(jìn)行測(cè)試,其候選框數(shù)目與召回率之間的關(guān)系如圖13(彩圖見(jiàn)期刊電子版)所示。由圖13(a)、13(b)可知,所提算法僅用較少的候選框,就能達(dá)到較高的召回率;由圖13(c)可見(jiàn),隨著候選框數(shù)目的增加,所提算法的平均召回率逐漸上升,算法性能與SS相當(dāng),這說(shuō)明所提算法能夠獲取定位較好的候選框。

        圖12 13種算法不同位置目標(biāo)的召回率與交并比的關(guān)系 Fig.12 Recall vs IoU curves of objects at different locations by 13 kinds of algorithms

        圖13 不同交并比下候選框數(shù)與召回率的關(guān)系 Fig.13 Recall versus number of proposals at different IoUs

        圖14 本文算法在PASCAL VOC 2007測(cè)試集的召回率 Fig.14 Recall on the PASCAL VOC 2007 test set for proposed algorithm in this paper

        為確定每一類(lèi)目標(biāo)候選區(qū)域的召回率,本文利用PASCAL VOC 2007測(cè)試集中單目標(biāo)圖像的標(biāo)注信息,以及Hosang在文獻(xiàn)[24]中對(duì)VOC 2007各類(lèi)目標(biāo)候選框的統(tǒng)計(jì)標(biāo)注信息,計(jì)算各類(lèi)目標(biāo)的召回率。

        圖14(彩圖見(jiàn)期刊電子版)從PASCAL VOC 2007測(cè)試集選取20類(lèi)目標(biāo),本文算法在候選框數(shù)目為500時(shí)的各類(lèi)召回率??梢钥闯觯崴惴ㄔ凇癱ow”、“dog”及“sheep”目標(biāo)在各交并比IoU下均能獲得較高的召回率;但對(duì)于“bottle”及“pottedplant”目標(biāo),召回率相對(duì)較低,這是由于此類(lèi)目標(biāo)尺寸較小,含有目標(biāo)的信息不多,使得召回率下降。

        3.6 圖像窗口的寬高比對(duì)實(shí)驗(yàn)結(jié)果的影響

        本文測(cè)試了C圖像塊窗口的寬高比對(duì)實(shí)驗(yàn)結(jié)果的影響。所謂寬高比是指窗口的寬與高的比值。本文選取寬高比分別為0.5,1.2、窗口寬度分別為8,16,24共8個(gè)窗口,在測(cè)試集及驗(yàn)證集上進(jìn)行實(shí)驗(yàn),不同寬高比的召回率如圖15(彩色見(jiàn)期刊電子版)所示??芍?,寬高比對(duì)召回率的影響小,這表明本文算法對(duì)寬高比的魯棒性較好。

        圖15 不同寬高比時(shí)測(cè)試集及驗(yàn)證集上的召回率 Fig.15 The recalls at different aspect ratios of test set and validation set

        3.7 所提算法的目標(biāo)檢測(cè)結(jié)果

        圖16(彩圖見(jiàn)期刊電子版)列出了本文算法的部分目標(biāo)的檢測(cè)結(jié)果。其中,實(shí)線代表真實(shí)的標(biāo)注框;虛線為本文算法預(yù)測(cè)的候選區(qū)域??梢钥吹?,所提算法的目標(biāo)檢測(cè)性能較好,但對(duì)于尺寸相對(duì)較小的目標(biāo),出現(xiàn)了漏檢。

        圖16 所提算法對(duì)部分目標(biāo)的檢測(cè)結(jié)果 Fig.16 Object detection results of some objects detected by proposed algorithm

        為證實(shí)漏檢目標(biāo)的分布情況,圖17繪制了測(cè)試集中漏檢目標(biāo)的尺寸與漏檢目標(biāo)數(shù)目間的關(guān)系示意圖??梢?jiàn),漏檢目標(biāo)主要集中在行數(shù)為(0~50)、列數(shù)為(0~50)范圍內(nèi),這一區(qū)域內(nèi)所提算法的性能下降。

        圖17 漏檢目標(biāo)的尺寸與漏檢目標(biāo)數(shù)目間的關(guān)系 Fig.17 The relation of the size of undetected objects and the number of undetected objects

        由于小目標(biāo)分辨率低及對(duì)噪聲敏感等原因,小目標(biāo)檢測(cè)是目標(biāo)檢測(cè)領(lǐng)域的一項(xiàng)挑戰(zhàn)。針對(duì)這一問(wèn)題,現(xiàn)有方法多借用多尺度手段,使用插值算法對(duì)小目標(biāo)區(qū)域進(jìn)行插值放大后檢測(cè)。但這增加了算法的復(fù)雜度,且檢測(cè)精度受插值算法影響較大。本課題組將繼續(xù)從深度卷積神經(jīng)網(wǎng)絡(luò)方面研究小目標(biāo)的敏感特征,使得算法有更高的檢測(cè)精度。

        4 結(jié) 論

        本文從卷積邊緣特征、目標(biāo)顯著性及目標(biāo)空間位置信息三方面研究了目標(biāo)候選區(qū)域算法。從實(shí)驗(yàn)結(jié)果中得知,由于使用語(yǔ)義信息更豐富的卷積邊緣特征,提高了目標(biāo)候選區(qū)域的質(zhì)量,這說(shuō)明卷積神經(jīng)網(wǎng)絡(luò)能夠很好地描述目標(biāo)邊界;另外,將目標(biāo)顯著性的局部特征及目標(biāo)空間位置引入到候選區(qū)域中,也使得目標(biāo)候選區(qū)域的召回率有所提高,這表明目標(biāo)顯著性特征及目標(biāo)的空間位置信息有助于生成定位更準(zhǔn)確的候選區(qū)域。當(dāng)選取10 000個(gè)候選框、交并比為0.7時(shí),所提算法在PASCAL VOC 2007驗(yàn)證集上的召回率達(dá)到了90.50%,較EB和SS算法分別提高了3.31%、1.38%。本文算法的不足之處在于對(duì)小目標(biāo)的檢測(cè)效果不好。這是由于小目標(biāo)的像素較少,產(chǎn)生的邊緣信息不多,容易出現(xiàn)目標(biāo)漏檢。針對(duì)這種情況,下一步將繼續(xù)利用深度神經(jīng)網(wǎng)絡(luò)探究小目標(biāo)含有的特征,以提高候選區(qū)域算法的召回率。

        猜你喜歡
        候選框數(shù)目滑動(dòng)
        有機(jī)物“同分異構(gòu)體”數(shù)目的判斷方法
        重定位非極大值抑制算法
        面向自然場(chǎng)景文本檢測(cè)的改進(jìn)NMS算法
        基于Soft-NMS的候選框去冗余加速器設(shè)計(jì)*
        一種新型滑動(dòng)叉拉花鍵夾具
        Big Little lies: No One Is Perfect
        一種針對(duì)特定目標(biāo)的提議算法
        《哲對(duì)寧諾爾》方劑數(shù)目統(tǒng)計(jì)研究
        牧場(chǎng)里的馬
        滑動(dòng)供電系統(tǒng)在城市軌道交通中的應(yīng)用
        亚洲阿v天堂2018在线观看| 国产亚洲精品不卡在线| 国产亚洲av手机在线观看| 区一区二区三区四视频在线观看| 亚洲av无码码潮喷在线观看| 欧洲熟妇色xxxx欧美老妇多毛网站| 久久久久久久一线毛片| 无码人妻丰满熟妇区免费| 国产在线精品观看一区二区三区| 看久久久久久a级毛片| 在线播放亚洲第一字幕| 国产999视频| 精品人妻一区二区三区av| 亚洲女优中文字幕在线观看 | 久激情内射婷内射蜜桃| 亞洲綜合一區二區三區無碼| 毛片色片av色在线观看| 亚洲精品中文字幕免费专区| 国产精品成人观看视频| 国产精品丝袜在线不卡 | 毛片无码国产| 日韩区在线| 亚洲av一区二区网址| 一边摸一边做爽的视频17国产| 无码成人aaaaa毛片| 日本高清色惰www在线视频| 国产精品高湖呻呤久久av| 精品乱码一区内射人妻无码| 免费无码av片在线观看网址| 日本女优一区二区在线免费观看| 麻豆视频在线播放观看| 国产精品久久久久久久久岛| 国产免费一区二区三区最新不卡| 偷拍熟女露出喷水在线91 | 国产情侣一区二区| 国产午夜亚洲精品午夜鲁丝片| 91亚洲欧洲日产国码精品| 日本女优激情四射中文字幕| 内射爽无广熟女亚洲| 久久半精品国产99精品国产| 97人妻精品一区二区三区免费|