亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多應(yīng)用場(chǎng)景的主動(dòng)學(xué)習(xí)算法研究

        2018-11-17 02:35:16王天珩張軼
        現(xiàn)代計(jì)算機(jī) 2018年29期
        關(guān)鍵詞:類(lèi)別標(biāo)簽精度

        王天珩,張軼

        (四川大學(xué)視覺(jué)合成圖形圖像技術(shù)國(guó)家重點(diǎn)學(xué)科實(shí)驗(yàn)室,成都 610065)

        0 引言

        目標(biāo)檢測(cè)是近年來(lái)一個(gè)非常熱門(mén)的研究方向。目標(biāo)檢測(cè)的本質(zhì)可以理解為在場(chǎng)景中對(duì)一個(gè)物體進(jìn)行分類(lèi)和定位,但是該領(lǐng)域存在一個(gè)問(wèn)題:預(yù)測(cè)結(jié)果的偏置和精度飽和問(wèn)題。

        理想情況下:樣本越多,檢測(cè)精度越高。而在很多真實(shí)世界應(yīng)用場(chǎng)景下,如果選擇的樣本有偏差,可能會(huì)造成在有監(jiān)督學(xué)習(xí)方式下目標(biāo)檢測(cè)的效果下降。于是,在盡可能減少標(biāo)簽代價(jià)的情況下盡可能增加目標(biāo)檢測(cè)精度就成為了當(dāng)前研究的熱點(diǎn)。

        近些年來(lái),深度卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)領(lǐng)域發(fā)展迅速,產(chǎn)生了大量的深度網(wǎng)絡(luò),其中有Fast R-CNN、SPP等網(wǎng)絡(luò)模型,但是當(dāng)訓(xùn)練樣本的數(shù)量較少或者樣本中存在大量困難樣例的時(shí)候,檢測(cè)精度就會(huì)不可避免地下降。主動(dòng)學(xué)習(xí)[1]是一種能夠保證目標(biāo)性能不受太大影響下,同時(shí)能夠有效減少標(biāo)注樣本數(shù)量的機(jī)器學(xué)習(xí)算法。主動(dòng)學(xué)習(xí)先是訓(xùn)練少量有標(biāo)簽的樣本,然后將訓(xùn)練出的模型預(yù)測(cè)大量無(wú)標(biāo)簽樣本并且加入訓(xùn)練集中,可以看做是特殊的半監(jiān)督學(xué)習(xí)[2]。本文將主動(dòng)學(xué)習(xí)算法和深度卷積網(wǎng)絡(luò)結(jié)合在了一起。

        1 算法實(shí)現(xiàn)

        在本算法中,有標(biāo)簽樣本會(huì)被分為完備數(shù)據(jù)集和不完備數(shù)據(jù)集。一個(gè)完備的樣本是有著正確的感興趣區(qū)域(ROI)信息,例如物體的類(lèi)別、屬性、位置信息和尺寸,但是在訓(xùn)練中所用到的不完備樣本信息以上的信息則可能不完全正確。對(duì)于不完備數(shù)據(jù)的處理不同于其他完備數(shù)據(jù),因?yàn)檫@些不完備數(shù)據(jù)不但可能對(duì)于當(dāng)前的分類(lèi)模型沒(méi)有幫助,甚至可能造成目標(biāo)檢測(cè)分類(lèi)器性能下降。

        在實(shí)驗(yàn)中,采用了信息含量較高的樣本,兼顧了樣本的多樣性。目標(biāo)就是先用少量的完備有標(biāo)簽數(shù)據(jù)集訓(xùn)練出一個(gè)初始模型,然后隨著迭代逐次往其中加入不完備數(shù)據(jù)或者無(wú)標(biāo)簽樣本。由于該算法采用了主動(dòng)學(xué)習(xí)和聚類(lèi)算法[3]思想,就將這種算法命名為ACL(Active-Clustering Learning)算法。

        比起前人算法,ACL算法有如下優(yōu)勢(shì):

        (1)結(jié)合了主動(dòng)學(xué)習(xí)算法和聚類(lèi)思想,提高了篩選樣本的質(zhì)量,減少了大量的冗余樣本和標(biāo)簽代價(jià)。

        (2)減少了不平衡數(shù)據(jù)分類(lèi)中,樣本的選擇偏差問(wèn)題。

        筆者將提出的算法應(yīng)用在具有挑戰(zhàn)性的目標(biāo)檢測(cè)[4]和動(dòng)作識(shí)別數(shù)據(jù)上。實(shí)驗(yàn)證明,與前人的方法比較而言,這套方法的性?xún)r(jià)比較高。在部分類(lèi)別上,精度超越了前人最優(yōu)算法。在目標(biāo)檢測(cè)和動(dòng)作識(shí)別等多個(gè)公開(kāi)數(shù)據(jù)庫(kù)上,該算法已經(jīng)證明了其優(yōu)越性。

        圖1 算法總體流程圖

        ACL算法總體流程:

        輸入:n,v(2n>v);完備數(shù)據(jù)集Dconf和不完備數(shù)據(jù)集

        輸出:有標(biāo)注數(shù)據(jù)庫(kù)DΔ和候選數(shù)據(jù)庫(kù)Dbatch,DΔ<

        方法:

        Step 1.令Dconf為初始訓(xùn)練樣本,訓(xùn)練出一個(gè)初始化模型:M0。

        Repeat

        Step 2.從Dimp中選擇出數(shù)據(jù)Dbatch,根據(jù)公式(1)給出當(dāng)前分類(lèi)器的分類(lèi)結(jié)果Ft。

        Step 3.確定一個(gè)批次數(shù)據(jù)庫(kù)的規(guī)模:

        1.通過(guò)上下界選擇出部分不確定樣本。

        2.從不確定數(shù)據(jù)集Duncertain中的各個(gè)聚類(lèi)中一共選擇v個(gè)樣本,即Ddivers。

        3.根據(jù)當(dāng)前選擇的樣本初始化上下界。

        4.重復(fù)第3步直至DΔ的數(shù)量達(dá)到定值。

        Step 4.人工修正DΔ中沒(méi)有正確標(biāo)注的樣本。

        Step 5.重新訓(xùn)練Ft,每輪都加入DΔ中的新樣本,Dimp中的樣本在持續(xù)減少。

        訓(xùn)練直到達(dá)到收斂或者Dimp中樣本耗盡。

        2 實(shí)驗(yàn)結(jié)果

        (1)目標(biāo)檢測(cè)數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果:

        本環(huán)節(jié)的實(shí)驗(yàn)主要是為了驗(yàn)證該算法在目標(biāo)檢測(cè)公開(kāi)庫(kù)上的實(shí)驗(yàn)效果和精度。實(shí)驗(yàn)主要從檢測(cè)平均精度(mAP)和節(jié)省的樣本比例兩個(gè)維度來(lái)證明該算法的杰出性能。同時(shí)還會(huì)給出不同類(lèi)別的物體在不同算法上的精度差異。

        實(shí)驗(yàn)數(shù)據(jù)庫(kù):PASCAL VOC 2012數(shù)據(jù)集中包含了20類(lèi),訓(xùn)練集中一共包含了5717張圖片,測(cè)試用到了5823張圖片。

        為了盡量減少誤差,每個(gè)實(shí)驗(yàn)都做了五次以求中間結(jié)果。所有的實(shí)驗(yàn)都從相同的baseline目標(biāo)檢測(cè)器作為初始化模型,從無(wú)標(biāo)簽數(shù)據(jù)集中選擇出來(lái)500張圖片進(jìn)行訓(xùn)練。此后,每個(gè)主動(dòng)學(xué)習(xí)算法執(zhí)行15輪。每一輪中,算法選擇出置信度接近于0.5的200張圖片,并把這些圖片加入到已有訓(xùn)練集中,訓(xùn)練出一個(gè)新的模型,如此一直循環(huán)下去。

        本文中的實(shí)驗(yàn)對(duì)比方法分別是隨機(jī)采樣,不確定性采樣,TCAL[5]和本算法。

        圖2 不同算法在PASCAL數(shù)據(jù)庫(kù)上的檢測(cè)精度

        圖3 不同算法在PASCAL數(shù)據(jù)庫(kù)上節(jié)約的樣本比例

        在數(shù)據(jù)庫(kù)所包含的20個(gè)物體類(lèi)別中,有些樣本使用ACL算法提升明顯,有些樣本則不升反降,屬于困難樣例。

        表1 20類(lèi)物體在不同方法下的檢測(cè)精度

        表1展示的是每種方法在PASCAL VOC 2012數(shù)據(jù)集上的平均精度(有標(biāo)簽訓(xùn)練集的數(shù)量是1100)。每種方法的結(jié)果是五輪訓(xùn)練結(jié)果的平均值。每列加粗的字體是最好的結(jié)果,下標(biāo)劃?rùn)M線的是第二好的結(jié)果。精度低于被動(dòng)學(xué)習(xí)40%的樣本算作是困難樣例,已經(jīng)用星號(hào)標(biāo)了出來(lái),這類(lèi)樣本在主動(dòng)學(xué)習(xí)中提升的效果比較有限。

        圖4困難樣例TCAL算法和本算法性能差異

        圖4 顯示的是在PASCAL VOC 2012數(shù)據(jù)庫(kù)中,不同類(lèi)別樣本在TCAL和本文算法的精度差異。通過(guò)圖表可以觀察出:本算法在部分類(lèi)別上的精確度超過(guò)了state-of-the-art,在所有20個(gè)類(lèi)別上則是平均超過(guò)了大約1%??傮w上說(shuō),本算法的性能還是比較優(yōu)越的。

        本算法在9個(gè)類(lèi)別上超過(guò)了TCAL算法,具有較為優(yōu)越的性能。

        (2)動(dòng)作識(shí)別數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果:

        在本環(huán)節(jié),將方法在有挑戰(zhàn)性的動(dòng)作分類(lèi)Willow actions數(shù)據(jù)庫(kù)上進(jìn)行了實(shí)驗(yàn)。該數(shù)據(jù)庫(kù)包含了7類(lèi)人體動(dòng)作,分別是使用電腦、攝影、使用樂(lè)器、騎自行車(chē)、騎馬、跑步以及步行,數(shù)據(jù)庫(kù)比較具有挑戰(zhàn)性。數(shù)據(jù)庫(kù)中每類(lèi)中至少包括108張圖片,其中40張用于訓(xùn)練,30張用于驗(yàn)證,剩余的圖片用于測(cè)試。

        對(duì)比方法分別是隨機(jī)采樣,不確定性采樣,TCAL和本算法。

        表2 七類(lèi)動(dòng)作在不同方法下的檢測(cè)精度

        表2展示的是在這個(gè)數(shù)據(jù)庫(kù)上不同方法的效果圖。最高的檢測(cè)率已經(jīng)加粗,本文的算法是基于Faster R-CNN,將運(yùn)用主動(dòng)學(xué)習(xí)算法,結(jié)合部分?jǐn)?shù)據(jù)的Faster R-CNN算法和使用了全部數(shù)據(jù)的Faster R-CNN算法進(jìn)行對(duì)比。其中,“使用樂(lè)器”類(lèi)達(dá)到了最好的效果。而本文的算法通過(guò)多輪迭代,達(dá)到了性?xún)r(jià)比較高的結(jié)果,在“使用樂(lè)器”,“攝影”和“使用計(jì)算機(jī)”類(lèi)上達(dá)到了最好的結(jié)果。原因是這類(lèi)動(dòng)作中人和物體間的聯(lián)系較為緊密,使用全部數(shù)據(jù)可能會(huì)造成部分困難樣例,對(duì)分類(lèi)器造成干擾。同時(shí),在其他多數(shù)類(lèi)別上,本文算法都能達(dá)到不錯(cuò)的性能,雖然沒(méi)能實(shí)現(xiàn)最高檢測(cè)精度,但是能節(jié)省部分樣本,可以實(shí)現(xiàn)高性?xún)r(jià)比,即用較少的樣本達(dá)到較高的精度。

        3 結(jié)語(yǔ)

        本文中提出了一個(gè)基于聚類(lèi)思想,對(duì)樣本進(jìn)行精篩的主動(dòng)學(xué)習(xí)算法,并且在圖像分類(lèi)和目標(biāo)檢測(cè)領(lǐng)域的有挑戰(zhàn)公開(kāi)庫(kù)上證明了其有效性。

        首先,實(shí)驗(yàn)證明了使用主動(dòng)學(xué)習(xí)方法的性能表現(xiàn)接近于使用100%的有標(biāo)簽數(shù)據(jù)集。其次,實(shí)驗(yàn)證明了將聚類(lèi)思想融入到主動(dòng)學(xué)習(xí)算法以后,能夠進(jìn)一步將樣本精篩,提高選擇樣本的效率。在部分特定類(lèi)別物體上的檢測(cè)效率,超過(guò)了使用整個(gè)數(shù)據(jù)集的方法。

        猜你喜歡
        類(lèi)別標(biāo)簽精度
        無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車(chē)迷(2018年11期)2018-08-30 03:20:32
        基于DSPIC33F微處理器的采集精度的提高
        電子制作(2018年11期)2018-08-04 03:25:38
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        標(biāo)簽化傷害了誰(shuí)
        GPS/GLONASS/BDS組合PPP精度分析
        服務(wù)類(lèi)別
        基于多進(jìn)制查詢(xún)樹(shù)的多標(biāo)簽識(shí)別方法
        改進(jìn)的Goldschmidt雙精度浮點(diǎn)除法器
        論類(lèi)別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類(lèi)別全科醫(yī)師培養(yǎng)模式的探討
        在线精品亚洲一区二区动态图| 欧美手机在线视频| 国产精品99久久精品女同| 日本人妻精品有码字幕| 成人特黄a级毛片免费视频| 国产精品区一区第一页| 午夜亚洲国产精品福利| 国产在线一区二区三区四区乱码| 精品av熟女一区二区偷窥海滩| 亚洲欧美日韩国产精品专区| 日本熟妇hd8ex视频| 久久久亚洲成年中文字幕| 中文亚洲av片不卡在线观看| 久久人人爽天天玩人人妻精品| 国产目拍亚洲精品一区二区| 水蜜桃在线观看一区二区国产 | 一本久久综合亚洲鲁鲁五月天 | 国精产品一区二区三区| 亚洲大尺度动作在线观看一区| 久久精品免费视频亚洲| 欧美人与禽2o2o性论交| av无码精品一区二区三区四区| 久久久精品国产亚洲麻色欲| 日本a爱视频二区三区| 啦啦啦中文在线观看日本| 亚洲日本天堂| 免费一区二区三区av| 狂猛欧美激情性xxxx大豆行情| 伊伊人成亚洲综合人网香| 极品诱惑一区二区三区| 国产在线一区二区三区四区乱码| 东京热无码av一区二区| 宅男噜噜噜| 精品一区二区三区长筒靴| 精品亚洲国产成人av色哟哟| 极品新婚夜少妇真紧| 国产精品无码无片在线观看3D| 日本视频一区二区这里只有精品| 国产无套乱子伦精彩是白视频| 亚洲av一宅男色影视| 精品国产自拍在线视频|