李一男
【摘要】 ? ?為了更準(zhǔn)確的對圖像中的目標(biāo)物體進(jìn)行識別,科學(xué)家研發(fā)了目標(biāo)檢測技術(shù),其是計(jì)算機(jī)視覺的重要組成。最近幾年深度學(xué)習(xí)越來越普及,基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)具有更高的準(zhǔn)確率和檢測效率,可以應(yīng)用在很多領(lǐng)域,然而應(yīng)用過程中還存在一些影響深度學(xué)習(xí)目標(biāo)檢測的發(fā)展的問題急需解決,基于此,本文對目標(biāo)檢測概念進(jìn)行了簡單介紹,并對深度學(xué)習(xí)目標(biāo)檢測算法進(jìn)行了歸納總結(jié),對深度學(xué)習(xí)目標(biāo)檢測中存在的問題和未來發(fā)展進(jìn)行了探究,希望可以為目標(biāo)檢測實(shí)現(xiàn)更好發(fā)展提供助力。
【關(guān)鍵詞】 ? ?深度學(xué)習(xí) ? ?目標(biāo)檢測 ? ?研究
Abstract: In order to more accurately identify target objects in images, scientists have developed target detection technology, which is an important component of computer vision. In recent years, deep learning has become more and more popular. The target detection technology based on deep learning has higher accuracy and detection efficiency, and can be applied in many fields. However, there are still some problems that affect the development of deep learning target detection in the application process. Based on this, this article briefly introduces the concept of target detection, summarizes the deep learning target detection algorithm, and explores the problems and future development of deep learning target detection, hoping to achieve better target detection Good development provides assistance.
Keywords: deep learning; target detection; research
引言:
深度學(xué)習(xí)最近幾年得到了很大的發(fā)展,計(jì)算機(jī)視覺技術(shù)也得到了很大的提升,基于深度學(xué)習(xí)的目標(biāo)檢測方法在很多領(lǐng)域都實(shí)現(xiàn)了廣泛應(yīng)用。其目的就是在圖像中快速、準(zhǔn)確的找到目標(biāo)物體,并判斷出物體位置和大小,這也是計(jì)算視覺領(lǐng)域的重要內(nèi)容。
一、什么是目標(biāo)檢測
目標(biāo)檢測的最終目的就是對圖像中的目標(biāo)物體位置和大小進(jìn)行判定,但是不同物體有著不同的特征,再加上一些外界因素的影響,所以目標(biāo)檢測具有很大的難度,這也是機(jī)器視覺領(lǐng)域比較頭疼的一個問題。
我們拿到一張圖片后需要將其分為三個步驟進(jìn)行理解:
第一步:分類,用事前確定好的類別或?qū)嵗齀D對化為信息的圖像結(jié)構(gòu)進(jìn)行描述。
第二步:檢測,上一步是對整張圖片內(nèi)容的描述,這一步則需要選定一個物體目標(biāo)進(jìn)行檢測,獲取物體所處位置以及類別信息。
第三步:分割,這一步需要對語義和實(shí)例進(jìn)行分割,并得出像素屬于哪個目標(biāo)物體或哪個場景的結(jié)論。
二、基于深度學(xué)習(xí)的目標(biāo)檢測算法
深度學(xué)習(xí)目標(biāo)檢測算法大體上可以分為雙階段和單階段兩種,前者需要將整體分為兩部分,然后生成識別框分別對兩部分進(jìn)行識別,后者是將整個流程放在一起直接進(jìn)行檢測。單階段目標(biāo)檢測算法中比較具有代表性是算法主要有SSD和YOLO,下面就來具體介紹一下兩種目標(biāo)檢測算法:
2.1雙階段目標(biāo)檢測算法
該算法需要先借助SelectiveSearch選出圖像中的候選區(qū)域,之后還需要對候選區(qū)域進(jìn)行再次檢測,從而得出最后檢測結(jié)果,比較常用的算法主要有OverFeat、R-CNN、MaskR-CNN等。
2.1.1 OverFeat算法
該算法是在AlexNet算法基礎(chǔ)上進(jìn)行改進(jìn)而得到的。OverFeat算法通過和AlexNet進(jìn)行結(jié)合可以更全面的對圖像特征進(jìn)行提取,還可以對提取內(nèi)容進(jìn)行共享,該算法現(xiàn)在已經(jīng)在圖像分類中實(shí)現(xiàn)了應(yīng)用,在位置定位中的應(yīng)用也取得了不錯的成效。
和傳統(tǒng)檢測方法相比,該算法有著更高的準(zhǔn)確率,對于開發(fā)其他深度學(xué)習(xí)目標(biāo)檢測算法也具有啟迪作用,但是,該算法對于小目標(biāo)物體檢測的準(zhǔn)確性卻比較低,甚至?xí)霈F(xiàn)誤差。
2.1.2 R-CNN算法
該算法出現(xiàn)于2014年,是將AlexNet和SelectiveSearch結(jié)合后產(chǎn)生的一種比較典型的雙階段目標(biāo)檢測算法,該算法主要包括三個模塊,一、區(qū)域建議,就是從每張圖像中選出可能包含目標(biāo)物體信息的候選區(qū)域,并將這些區(qū)域放入?yún)^(qū)域候選框內(nèi);二、深度特征提取,先將候選區(qū)域縮放為統(tǒng)一大小,然后從中進(jìn)行特征提取;三、分類回歸,利用AlexNet提取候選區(qū)域特征,然后借助SVM對特征進(jìn)行分類,在利用BoundingBoxRegression對區(qū)域進(jìn)行過濾,利用非極大值抑制對區(qū)域進(jìn)行調(diào)整,最后就可以確定目標(biāo)物體的位置。該算法在和其他目標(biāo)檢測算法相比具有更好的性能,但其也存在一些缺陷。
2.2單階段目標(biāo)檢測算法
該算法依據(jù)的是回歸分析思想,所以也被稱作回歸分析目標(biāo)檢測算法。該算法之所以被稱作單階段目標(biāo)檢測算法是因?yàn)樵撍惴ú恍枰珊蜻x區(qū)域,而是直接對整個圖像進(jìn)行檢測,從而獲得目標(biāo)位置類別和位置信息,比較常用的檢測算法主要有YOLO和SSD。
2.2.1 YOLO目標(biāo)檢測算法
由于雙階段目標(biāo)檢測算法的檢測效率比較低,所以一些學(xué)者提出了單階段目標(biāo)檢測。JosephRedmon等人在2016年的時(shí)候提出了由卷積層和FC層構(gòu)成的YOLO目標(biāo)檢測算法,先要在最頂層特征圖中標(biāo)出邊界框,之后就可以對每個類別概率進(jìn)行預(yù)測,最后再激活函數(shù)就可以得到最終信息。該算法并不是針對整幅圖像進(jìn)行檢測,而是將整幅圖像分為了多個網(wǎng)格單元,對每個網(wǎng)格中心目標(biāo)進(jìn)行檢測即可,該算法不用生成候選區(qū)域,在一個卷積網(wǎng)絡(luò)中就可以完成特征提取、分類回歸等任務(wù),檢測過程得到了簡化,檢測速度也變得更快,但該算法對于小尺度目標(biāo)的檢測不夠準(zhǔn)確,如果圖像中存在重疊遮擋等現(xiàn)象就可能出現(xiàn)遺漏。
2.2.2 SSD目標(biāo)檢測算法
R-CNN在檢測準(zhǔn)確性方面具有優(yōu)勢,但是檢測速度比較差,YOLO的檢測效率比較高,對于大維度變化目標(biāo)的檢測也具有優(yōu)勢,但在小目標(biāo)檢測方面具有劣勢。對這兩種算法的優(yōu)勢進(jìn)行結(jié)合,最終產(chǎn)生了一種檢測準(zhǔn)確性和速度都比較好的目標(biāo)檢測算法——SSD。該算法主要借助骨干網(wǎng)絡(luò)對目標(biāo)物體特征進(jìn)行提取,而且增加了四個卷積層。該算法依據(jù)的是分層提取思想,也就是將網(wǎng)絡(luò)分為若干層級,然后對每個層級的圖像特征進(jìn)行提取,對特征進(jìn)行分類和邊界框回歸,這樣就可以提高檢測準(zhǔn)確度。而且該算法還應(yīng)用了目標(biāo)預(yù)測機(jī)制,可以對不同層次的目標(biāo)種類和位置信息進(jìn)行預(yù)測。目標(biāo)預(yù)測機(jī)制具有很多優(yōu)勢:第一、借助卷積層就可以推測出目標(biāo)物體信息,這樣計(jì)算量就可以變少。第二、目標(biāo)檢測突破了空間限制,這樣就可以對多個小目標(biāo)物體進(jìn)行同時(shí)檢測。
和YOLO相比,該算法的檢測效率有了進(jìn)一步提升,檢測范圍甚至可以達(dá)到R-CNN的三倍。當(dāng)然該算法也存在一些缺陷,如,不能準(zhǔn)確的對小目標(biāo)進(jìn)行分類,還可能出現(xiàn)重復(fù)檢測等。
三、深度學(xué)習(xí)目標(biāo)檢測待解決問題與未來研究方向
3.1先驗(yàn)知識缺失情況下目標(biāo)識別缺乏準(zhǔn)確性
目標(biāo)檢測需要借助計(jì)算機(jī)對目標(biāo)物體進(jìn)行準(zhǔn)確識別,對目標(biāo)信息進(jìn)行準(zhǔn)確提取,所以,先驗(yàn)知識是否完整、是否存在質(zhì)量問題能夠?qū)z測準(zhǔn)確性造成嚴(yán)重影響。針對這種情況,現(xiàn)在往往會采用人工預(yù)料標(biāo)注的方法進(jìn)行解決,但是這種方法不僅要花費(fèi)很高的人工成本,而且也不能對所有場景使用,另外,目標(biāo)處于不同環(huán)境和場景下,標(biāo)注數(shù)據(jù)也需要進(jìn)行變化,否則就會影響到檢測精確性。為此,近幾年有學(xué)者研發(fā)出了弱監(jiān)督或無監(jiān)督學(xué)習(xí)方法,為的就是對目標(biāo)識別、檢測準(zhǔn)確性進(jìn)行提高,但還需要繼續(xù)研究在先驗(yàn)知識不完整情況下進(jìn)行目標(biāo)準(zhǔn)確識別的方法。
3.2骨干網(wǎng)絡(luò)性能有待提升
骨干網(wǎng)絡(luò)性能的高低能夠?qū)δ繕?biāo)檢測算法效用造成很大的影響,所以需要對骨干網(wǎng)絡(luò)性能進(jìn)行積極提升,這和之后的目標(biāo)檢測有著密切關(guān)系。現(xiàn)在很多人選擇骨干網(wǎng)絡(luò)時(shí)都沒有目標(biāo),比較隨意,這樣就會影響到骨干網(wǎng)絡(luò)性能。要知道骨干網(wǎng)絡(luò)在不同任務(wù)中會發(fā)揮出不同的性能,所以進(jìn)行目標(biāo)檢測時(shí)需要遵守以下兩點(diǎn)原則:
第一、根據(jù)任務(wù)的不同選擇特定的骨干網(wǎng)絡(luò)。現(xiàn)在的骨干網(wǎng)絡(luò)性能雖然已經(jīng)有了很大提升,但是因?yàn)槟繕?biāo)分類和檢測過程中會出現(xiàn)偏差,所以骨干網(wǎng)絡(luò)性能也會受到影響,現(xiàn)在急需研究針對目標(biāo)檢測性能更好的骨干網(wǎng)絡(luò)。
第二、選擇處理效率比較高的骨干網(wǎng)絡(luò)?,F(xiàn)在的骨干網(wǎng)絡(luò)參數(shù)已經(jīng)能夠高達(dá)數(shù)百萬數(shù)億,這對于硬件資源而言無疑非常具有挑戰(zhàn),所以要選擇處理效率比較高的骨干網(wǎng)絡(luò),未來還需要研究處理效率更高的骨干網(wǎng)絡(luò)以便可以滿足目標(biāo)檢測需要。
3.3圖像語義信息不夠豐富
進(jìn)行目標(biāo)檢測時(shí)豐富的圖像語義信息可以有效提高檢測準(zhǔn)確性和效果。然而現(xiàn)在的難題是在網(wǎng)絡(luò)結(jié)構(gòu)圖像中如何發(fā)掘出更多的語義信息,解決這個問題的方法現(xiàn)在有兩種:
第一、通過高清表示,也就是對深度神經(jīng)網(wǎng)絡(luò)進(jìn)行深層次特征提取,這樣圖像尺寸就會變得比較小,分辨率也會有所下降,這時(shí)就可以借助沙漏型網(wǎng)絡(luò)結(jié)構(gòu)來獲取高清表示信息圖像,或是利用反卷積、分辨率并行等方法來對目標(biāo)分辨率進(jìn)行提高,這樣目標(biāo)檢測準(zhǔn)確性也能得到增強(qiáng)。
第二、通過圖像語義理解,圖像語義理解和圖像信息提取之間有著密切關(guān)系,通過圖像語義理解可以更快速、準(zhǔn)確的提取圖像信息,對于像素級對象實(shí)例分割問題的解決也能起到很大的助力,像素級對象實(shí)例分割越是精確獲得的圖像實(shí)例特征也越是準(zhǔn)確,這樣就可以更深刻的了解圖像語義。
四、結(jié)束語
綜上所述,深度學(xué)習(xí)目標(biāo)檢測可以在很多領(lǐng)域進(jìn)行應(yīng)用,如,行人檢測、車輛檢測、面部檢測、遙感圖像目標(biāo)檢測等,而且在這種領(lǐng)域的應(yīng)用都取得了不錯的成效。經(jīng)過幾年發(fā)展,深度學(xué)習(xí)目標(biāo)檢測雖然有了一定發(fā)展,但其中還存在一些難以解決的問題,對于這些問題,需要各學(xué)者繼續(xù)進(jìn)行研究,從而推動深度學(xué)習(xí)目標(biāo)檢測走向更高的層次。
參 ?考 ?文 ?獻(xiàn)
[1]員嬌嬌,胡永利,孫艷豐,尹寶才.基于深度學(xué)習(xí)的小目標(biāo)檢測方法綜述[J].北京工業(yè)大學(xué)學(xué)報(bào),2021,47(03):293-302.
[2]冉蓉,徐興華,邱少華,崔小鵬,歐陽斌.基于深度卷積神經(jīng)網(wǎng)絡(luò)的裂紋檢測方法綜述[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-16[2021-04-09]
[3]袁慧敏,張緒紅.目標(biāo)檢測算法綜述[J].科技經(jīng)濟(jì)導(dǎo)刊,2021,29(06):52-55.