劉浩++董軍宇++孫鑫++蹇木偉
[摘 要]本文適當(dāng)運(yùn)用主動學(xué)習(xí)方法,提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)反饋?zhàn)R別方法,可以從無標(biāo)記測試樣本中選擇最合適的樣本反饋訓(xùn)練深度網(wǎng)絡(luò)模型,使得識別系統(tǒng)在使用過程中逐漸提高目標(biāo)識別的準(zhǔn)確度和魯棒性。實(shí)驗(yàn)結(jié)果表明所提出的方法能夠在快速準(zhǔn)確地對目標(biāo)進(jìn)行辨別的同時(shí),逐漸提升真實(shí)場景下應(yīng)用的準(zhǔn)確度。
[關(guān)鍵詞]主動學(xué)習(xí);深度神經(jīng)網(wǎng)絡(luò);反饋;目標(biāo)識別
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2016)08-0383-01
Object Feedback Recognition System Base on Deep Learning
Hao Liu1,Junyu Dong1,Xin Sun1,Muwei Jian1
[Abstract]This paper proposed a novel deep neural network based object recognition method with a feedback process by using an appropriate active learning method. It selects better non-labeled samples to feedback and retrain the deep neural network model, which makes the accuracy and robustness of the object recognition system improved gradually during use. The experiments show that the proposed method can recognize the target object in a fast way and improve the accuracy of application in the real scene gradually.
[Key words]Active Learning; Deep Neural Network; Feedback; Object Recognition
1.介紹
目標(biāo)識別一直以來都是機(jī)器學(xué)習(xí)領(lǐng)域研究的前沿問題,近些年來,出現(xiàn)了一些優(yōu)秀的基于特征的物體識別方法,例如基于梯度信息的SIFT/SURF[1]算法等,但隨著數(shù)據(jù)集樣本的增多,逐漸達(dá)到了一定的瓶頸。近年來,基于深度學(xué)習(xí)所提取的抽象特征在物體識別中取得了非常好的表現(xiàn)。2012年Krizhevsky等人通過使用卷積神經(jīng)網(wǎng)絡(luò)取得了較高的圖像分類準(zhǔn)確率。2014年R. Girshick[2]等人所提出的Region Based CNN算法在目標(biāo)識別領(lǐng)域也取得了較好的結(jié)果。雖然這些方法取得了較好的效果,但是日常生活中的場景是多變的,因此需要所得到的模型能夠自動學(xué)習(xí)和適應(yīng)新的場景和需求,本文將基于RCNN方法提出一種帶反饋的自適應(yīng)學(xué)習(xí)目標(biāo)識別算法,它隨著反饋的增加,模型越來越完善和智能。
2.相關(guān)技術(shù)介紹
2.1 RCNN算法
Region Based CNN算法首先使用Selective search算法在圖像上產(chǎn)生約2000個(gè)候選窗口,進(jìn)行目標(biāo)檢測。然后使用CNN對每一個(gè)候選窗口提取4096維特征來表示每個(gè)Proposal,最后用SVM分類器對目標(biāo)進(jìn)行分類。
2.2 主動反饋學(xué)習(xí)
主動學(xué)習(xí)具有減少冗余和快速收斂的優(yōu)勢。通過一定的主動學(xué)習(xí)方法選擇出一個(gè)或一批最有用的樣本,并向檢查者詢問標(biāo)簽,然后利用獲得的新知識來訓(xùn)練分類器和進(jìn)行下一輪查詢。本文使用主動學(xué)習(xí)的思想對反饋?zhàn)R別過程進(jìn)行控制。
3.基于主動學(xué)習(xí)的物體反饋?zhàn)R別
目標(biāo)反饋?zhàn)R別是一個(gè)智能化的交互過程,它先使用有限訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)初始分類模型,這個(gè)模型對物體進(jìn)行識別的準(zhǔn)確率可能并不高。接下來,我們希望后續(xù)的每次識別都能夠?yàn)槟P吞峁┬畔?,模型依?jù)這些信息重新訓(xùn)練,實(shí)現(xiàn)對分類模型的修改與完善。本文基于RCNN算法,首先使用有限標(biāo)定樣本進(jìn)行訓(xùn)練,利用RCNN 生成一個(gè)初始模型。然后每次使用主動學(xué)習(xí)的方法,從未標(biāo)記樣本集中選擇出n0個(gè)最有用的、最利于完善分類模型的樣本圖像;最后利用檢查者對樣本所做的標(biāo)記,進(jìn)一步訓(xùn)練分類器,完善模型,迭代進(jìn)行,最終實(shí)現(xiàn)模型的自動更新達(dá)到最優(yōu)的識別效果。
4.實(shí)驗(yàn)
以1.1圖的Train圖像為例進(jìn)行識別,圖1.2得到識別結(jié)果為Bus,識別發(fā)生錯(cuò)誤,此時(shí)使用本文方法進(jìn)行反饋,系統(tǒng)將結(jié)果反饋給分類模型,這樣選擇出的每張圖像都會反饋一個(gè)結(jié)果來優(yōu)化模型,迭代進(jìn)行。如果如圖1.3再次對這張圖像進(jìn)行識別,得到識別結(jié)果“未檢測到Bus”,識別正確,說明反饋過程起到了應(yīng)有的作用。通過實(shí)驗(yàn)可以表明,本文提出的方法會使物體識別變得越來越智能。
5.結(jié)論
本文提出的基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)反饋?zhàn)R別方法,使用主動學(xué)習(xí)來對反饋?zhàn)R別過程進(jìn)行控制,通過對VOC2007數(shù)據(jù)集中的Train類圖像進(jìn)行識別試驗(yàn)的結(jié)果可以看到,本文提出的方法成功提升了目標(biāo)識別系統(tǒng)的準(zhǔn)確度和魯棒性,逐漸提升了在復(fù)雜多樣的真實(shí)場景下識別目標(biāo)的準(zhǔn)確度,使得系統(tǒng)越來越完善與智能,最終實(shí)現(xiàn)了非常好的目標(biāo)識別效果。
參考文獻(xiàn)
[1]Lowe, D. G., "Distinctive Image Features from Scale-Invariant Keypoints ", International Journal of Computer Vision, 60, 2, pp. 91-110, 2004.
[2]Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation,R. Girshick, J. Donahue, T. Darrell, J. Malik,IEEE CVPR (Oral), 2014.