亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)研究綜述及應(yīng)用

        2019-01-08 03:16:09吳燕如珠杰管美靜
        電腦知識(shí)與技術(shù) 2019年33期
        關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)視覺目標(biāo)檢測(cè)

        吳燕如 珠杰 管美靜

        摘要:隨著深度學(xué)習(xí)的快速發(fā)展,目標(biāo)檢測(cè)技術(shù)已經(jīng)越來(lái)越成熟。目前神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)已經(jīng)被廣泛應(yīng)用在行人檢測(cè)、自動(dòng)駕駛、視頻追蹤等領(lǐng)域。本文首先分析了目標(biāo)檢測(cè)技術(shù)的發(fā)展背景,介紹了神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程和目標(biāo)檢測(cè)中常用的卷積神經(jīng)網(wǎng)絡(luò)模型;其次分析了深度神經(jīng)網(wǎng)絡(luò)下的目標(biāo)檢測(cè)方法,指出現(xiàn)階段不同檢測(cè)方法存在的問(wèn)題以及今后我們需要改進(jìn)的方向;最后對(duì)深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)進(jìn)行了總結(jié)和展望。

        關(guān)鍵詞:計(jì)算機(jī)視覺;目標(biāo)檢測(cè);深度神經(jīng)網(wǎng)絡(luò)

        中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1009-3044(2019)33-0181-04

        1概述

        在研究過(guò)程中,計(jì)算機(jī)并不能像人一樣能夠直接感知到物體所屬類別以及所在位置。計(jì)算機(jī)視覺技術(shù)就是像人一樣來(lái)完成物體的及時(shí)定位,獲取位置,并進(jìn)行識(shí)別、分割的技術(shù)。在計(jì)算機(jī)視覺發(fā)展的早期,目標(biāo)檢測(cè)這一研究方向就激發(fā)了學(xué)者們濃厚的研究興趣。隨著計(jì)算機(jī)技術(shù)的發(fā)展,常見物體對(duì)象的檢測(cè),根據(jù)不同對(duì)象的特征信息,能夠?qū)崿F(xiàn)目標(biāo)的定位、識(shí)別,像人臉檢測(cè)、行為檢測(cè)等一些特定目標(biāo)對(duì)象的檢測(cè),現(xiàn)在已經(jīng)有較成熟的技術(shù)川。計(jì)算機(jī)在檢測(cè)過(guò)程中存在兩種需要解決的難題,一是多目標(biāo)對(duì)象的情形,二是前景和背景比較相似的情形,即使遇到這樣有難度的檢測(cè)對(duì)象,現(xiàn)階段也已經(jīng)有了有效的解決方法。

        目標(biāo)檢測(cè)通常是指對(duì)輸入的圖像根據(jù)其目標(biāo)對(duì)象的特征信息,首先畫出能夠把目標(biāo)對(duì)象完整圈在框內(nèi)的最小外接矩形;其次給矩形貼上類別標(biāo)簽;最后對(duì)物體的邊框進(jìn)行回歸。傳統(tǒng)的目標(biāo)檢測(cè)方法需要手動(dòng)提取檢測(cè)對(duì)象的特征,不可避免地會(huì)發(fā)生特征遺漏。此外,采用選擇性搜索生成候選區(qū)域,也增加了計(jì)算復(fù)雜度。

        當(dāng)傳統(tǒng)目標(biāo)檢測(cè)模型DPM的改進(jìn)無(wú)所適從的時(shí)候,深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法問(wèn)世,該方法在數(shù)據(jù)量比較大的時(shí)候能夠自動(dòng)提取檢測(cè)對(duì)象的高層特征Cq,實(shí)現(xiàn)了在網(wǎng)絡(luò)中快速提取特征、選擇、分類和定位的完整操作,提高了目標(biāo)檢測(cè)的效率和準(zhǔn)確率。大量數(shù)據(jù)端到端的訓(xùn)練方式,迅速在目標(biāo)檢測(cè)領(lǐng)域流傳開來(lái),傳統(tǒng)的目標(biāo)檢測(cè)也由此過(guò)渡到深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)上。

        2神經(jīng)網(wǎng)絡(luò)的發(fā)展

        2.1神經(jīng)網(wǎng)絡(luò)的發(fā)展

        神經(jīng)網(wǎng)絡(luò)是人類對(duì)神經(jīng)元的功能和網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行模擬,去完成認(rèn)知任務(wù)的一類機(jī)器學(xué)習(xí)算法。早在1943年,McCunoc等就提出了人工神經(jīng)網(wǎng)絡(luò)的概念,并闡述了它的邏輯運(yùn)算機(jī)制p)。約在1958年,Rosenblat模擬出“感知機(jī)”的神經(jīng)網(wǎng)絡(luò)模型,人工神經(jīng)網(wǎng)絡(luò)正式產(chǎn)生。1969年,《感知機(jī)》一書認(rèn)為感知機(jī)并不能解決線性不可分問(wèn)題,這種觀念讓人工神經(jīng)網(wǎng)絡(luò)的研究進(jìn)入了停滯狀態(tài)。在低潮期間仍有部分研究者堅(jiān)持著神經(jīng)網(wǎng)絡(luò)的研究,1986年,Rummelhart等人再次提出了后向傳播的學(xué)習(xí)方法16);1998年,LeCun提出Let5網(wǎng)絡(luò),實(shí)現(xiàn)了手寫數(shù)字的識(shí)別。深度神經(jīng)網(wǎng)絡(luò)的再次復(fù)興離不開這些研究成果的積淀。

        2006年,Hinton首次提出深度神經(jīng)網(wǎng)絡(luò)的概念,實(shí)驗(yàn)采用含有多個(gè)隱藏層的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,再用后向傳播算法學(xué)習(xí)網(wǎng)絡(luò)中的參數(shù)值。在這種情況下,深度神經(jīng)網(wǎng)絡(luò)的研究仍然不被大眾接受。直到在2012年的ImageNet圖像分類比賽中獲得冠軍,點(diǎn)燃了深度學(xué)習(xí)的熱潮,使得深度神經(jīng)網(wǎng)絡(luò)重新進(jìn)入復(fù)興時(shí)期。

        2.2神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型

        神經(jīng)網(wǎng)絡(luò)在圖像檢測(cè)過(guò)程中,首先輸入待檢測(cè)的數(shù)據(jù)集和檢測(cè)的結(jié)果,網(wǎng)絡(luò)在訓(xùn)練中自己學(xué)習(xí)參數(shù),然后模型可以達(dá)到能夠識(shí)別這一類圖像的目的,最后根據(jù)測(cè)試集的測(cè)試結(jié)果,對(duì)網(wǎng)絡(luò)的學(xué)習(xí)情況做出評(píng)價(jià)。在深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法中,基礎(chǔ)網(wǎng)絡(luò)采用卷積神經(jīng)網(wǎng)絡(luò)(CNN),在演化的過(guò)程中模型的網(wǎng)絡(luò)深度和結(jié)構(gòu)存在很大差異,但都屬于卷積神經(jīng)網(wǎng)絡(luò)的范疇。CNN的演化過(guò)程如圖1所示。

        1998年,Lecun提出Lenet5網(wǎng)絡(luò)。該模型作為最早的神經(jīng)網(wǎng)絡(luò)模型,但在網(wǎng)絡(luò)結(jié)構(gòu)和性能上并沒有特別的地方,直到AlexNet出現(xiàn),才真正成為深度神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)折點(diǎn)。

        2012年,Hinton等設(shè)計(jì)出AlextNet網(wǎng)絡(luò),同年在ImageNet比賽中獲得了圖像分類任務(wù)的冠軍,CNN首次實(shí)現(xiàn)Top-5誤差率降低了15.2%,標(biāo)志著深度學(xué)習(xí)的開始。該網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,從可視化角度向我們展示了網(wǎng)絡(luò)各層的具體分工和實(shí)現(xiàn)效果。利用兩塊GPU進(jìn)行訓(xùn)練,首次引入ReLU激活函數(shù),解決梯度消失問(wèn)題;然后引入最大池化,擴(kuò)大了感受野;最后是DropOut操作,有效避免了過(guò)擬合現(xiàn)象。為了探究網(wǎng)絡(luò)深度對(duì)模型精確度的影響,學(xué)者們?cè)O(shè)計(jì)出了VGGNet網(wǎng)絡(luò)。

        2014年,牛津大學(xué)計(jì)算機(jī)視覺組合和GooSe DeepMind公司研究員共同設(shè)計(jì)出了VGGNet網(wǎng)絡(luò),在了op-5上的錯(cuò)誤率僅為7.5%,在同年的ImageNet分類比賽中僅次于GoogLeNet。其主要思想是用兩個(gè)3*3卷積核代替原來(lái)5*5的卷積核,池化核的大小均為2*2,減少了參數(shù)數(shù)量。該模型增加了網(wǎng)絡(luò)深度,參數(shù)的數(shù)量并沒有增加太多,在圖像特征信息提取上取得了良好的效果。

        2014年,ChristianSzegedy提出GooLeNet網(wǎng)絡(luò),在Top-5上的錯(cuò)誤率降低到了6.67%,在同年的ImageNet比賽中獲得了分類冠軍叫。該網(wǎng)絡(luò)引入了Inception模塊,考慮了所有可能遇到的情況,網(wǎng)絡(luò)結(jié)構(gòu)趨于優(yōu)化,不需人為指導(dǎo)網(wǎng)絡(luò)訓(xùn)練過(guò)程,網(wǎng)絡(luò)自己根據(jù)學(xué)習(xí)情況設(shè)置參數(shù),不僅參數(shù)數(shù)量減少了12倍,而且大大提升了圖片分類的準(zhǔn)確率。但由于Inception模塊對(duì)超參數(shù)設(shè)置的局限性,影響了網(wǎng)絡(luò)的擴(kuò)展,因此就有了廣泛被作為基礎(chǔ)網(wǎng)絡(luò)的ResNet。

        2015年,He等提出了ResNet網(wǎng)絡(luò),在同年的ImageNet和COCO比賽中,分別獲得了圖像檢測(cè)、識(shí)別、分割領(lǐng)域的冠軍。該網(wǎng)絡(luò)的核心是跳層連接的方式,原始輸入信息直接傳到后面的層中,后面的層主要是學(xué)習(xí)上一個(gè)網(wǎng)絡(luò)的輸出殘差,降低了學(xué)習(xí)難度。該網(wǎng)絡(luò)深度增加至152層,參數(shù)沒有額外增加,不改變網(wǎng)絡(luò)訓(xùn)練復(fù)雜度,較好地解決了網(wǎng)絡(luò)深度較深的情況下準(zhǔn)確率不增加反而下降、梯度消失和爆炸的難題。

        3神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型分類

        目前,神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)已經(jīng)有多種模型,按照是否需要提取候選區(qū)域可以將模型分為兩類,一類是基于區(qū)域提名的模型,另一類是不用區(qū)域提名的模型。深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型進(jìn)化過(guò)程如圖2所示。

        3.1基于域名提名的模型

        目標(biāo)檢測(cè)中基于區(qū)域提名的模型主要有R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN,這一類模型的訓(xùn)練屬于多階段的訓(xùn)練,訓(xùn)練模型的時(shí)候首先需要找出感興趣的候選區(qū)域,常用到的方式有滑動(dòng)窗口、規(guī)則塊、選擇性搜索等,實(shí)驗(yàn)過(guò)程中要根據(jù)自己的研究對(duì)象選擇合適的方法。

        2013年,Ross B.Girshick提出R-CNN網(wǎng)絡(luò),該模型是首個(gè)用域名命名的深度神經(jīng)網(wǎng)絡(luò)檢測(cè)模型。該網(wǎng)絡(luò)在訓(xùn)練中使用標(biāo)注好的數(shù)據(jù)集進(jìn)行訓(xùn)練,大幅提升了數(shù)據(jù)集的平均精度,由于輸入圖片必須是相同尺寸,圖片需要經(jīng)過(guò)拉伸或者壓縮進(jìn)行轉(zhuǎn)換,候選區(qū)域要進(jìn)行重復(fù)的特征計(jì)算,時(shí)間消耗比較大,數(shù)據(jù)集的測(cè)試也比較緩慢。

        2015年,Hc對(duì)R-CNN做出改進(jìn)并提出了SPP-Net網(wǎng)絡(luò)。該網(wǎng)絡(luò)對(duì)輸入圖片的所有區(qū)域做共享卷積計(jì)算,提取出所有區(qū)域的特征,通過(guò)引入空間金字塔池化,實(shí)現(xiàn)不同尺寸區(qū)域的特征提取。該模型主要解決了R-CNN固定輸入尺寸的問(wèn)題,仍然是一個(gè)復(fù)雜的多階段訓(xùn)練,需要存儲(chǔ)大量圖像特征,同時(shí)網(wǎng)絡(luò)在金字塔池化層之前的所有卷積層參數(shù)不能進(jìn)行finetun-ing,并沒有實(shí)現(xiàn)誤差反向傳播。

        2015年,Ross Girshiek提出了Fast R-CNN網(wǎng)絡(luò)。該網(wǎng)絡(luò)對(duì)R-CNN進(jìn)行改進(jìn),同時(shí)也采納了SPP-Net的方法,解決了候選區(qū)域重復(fù)的特征計(jì)算問(wèn)題,實(shí)現(xiàn)了大量數(shù)據(jù)端到端單階段的訓(xùn)練,不需要離線存儲(chǔ)特征文件。Fast R-CNN是一種速度更快、性能更好的模型,但提取候選區(qū)域采用的還是傳統(tǒng)做法,限制了它的使用。同年,Hc等人提出了Faster R-CNN檢測(cè)算法,該算法實(shí)現(xiàn)用區(qū)域建議網(wǎng)絡(luò)提取候選區(qū)域,提取出的建議區(qū)域大大減少。使用RPN網(wǎng)絡(luò)提取出建議區(qū)域后,剩下的訓(xùn)練過(guò)程和Fast R-CNN一樣。Fast R-CNN在速度上有了很大提升,然而還是未能實(shí)現(xiàn)物體的實(shí)時(shí)檢測(cè)。

        Faster R-CNN網(wǎng)絡(luò)改進(jìn)之后產(chǎn)生了R-FCN,目的是解決Faster R-CNN檢測(cè)速度慢的問(wèn)題,其主要是因?yàn)楦信d趣池化層后的結(jié)構(gòu)對(duì)建議區(qū)域沒有實(shí)現(xiàn)共享叫。R-FCN在池化層前加入位置信息,較好的解決位置敏感性問(wèn)題。該網(wǎng)絡(luò)具有較深的共享卷積網(wǎng)絡(luò)層,能夠獲取到更加抽象的高層特征,其檢測(cè)速度比Faster R-CNN快2.5-20倍,但仍未能實(shí)現(xiàn)物體的實(shí)時(shí)檢測(cè)。于是,基于回歸思想的檢測(cè)方法就應(yīng)運(yùn)而生。

        3.2不基于域名提名模型

        區(qū)域卷積神經(jīng)的模型都需要生成建議區(qū)域,這會(huì)帶來(lái)重復(fù)的特征計(jì)算問(wèn)題。因此,學(xué)者們提出了不基于域名提名的目標(biāo)檢測(cè)方法,目標(biāo)檢測(cè)方法也由多階段的訓(xùn)練過(guò)渡到單階段的訓(xùn)練,訓(xùn)練過(guò)程很大限度地得到簡(jiǎn)化。目前,不基于域名提名的網(wǎng)絡(luò)模型有YOLO、SSD。

        2015年,在Faster R-CNN問(wèn)世的同時(shí),Ross Girshick等人又提出了YOLO檢測(cè)方法,是首個(gè)不需要提取候選區(qū)域的算法。該算法采用回歸的思想,每張圖像只需要看一眼就能知道有哪些物體類別以及所在的位置。該算法從整體進(jìn)行預(yù)測(cè),通過(guò)卷積神經(jīng)網(wǎng)絡(luò)能夠直接預(yù)測(cè)出boundingbox的定位置信度以及所屬類別概率。由實(shí)驗(yàn)可知,YOLO檢測(cè)過(guò)程簡(jiǎn)單,檢測(cè)速度和準(zhǔn)確度較高,但對(duì)密集小物體的檢測(cè)效果欠佳,容易發(fā)生物體定位錯(cuò)誤。

        2016年,Liu提出SSD網(wǎng)絡(luò),目前已經(jīng)成為主流的目標(biāo)檢測(cè)方法之一。該算法不但借鑒了YOLO回歸的思想用CNN提取出不同尺度的特征圖直接進(jìn)行檢測(cè)(Yolo是在全連接層之后做檢測(cè)),而且采用FasterR-CNN中的anchor機(jī)制,降低了訓(xùn)練難度。該網(wǎng)絡(luò)和FasterR-CNN有著同樣的檢測(cè)精確度,與YO-LO一樣有著較快的檢測(cè)速度,對(duì)于小物體的檢測(cè)效果相比YO-LO有所提升。深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域目標(biāo)檢測(cè)各模型性能對(duì)比如表1所示。

        上述表1展示了兩類不同的神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)方法的性能指標(biāo),從各項(xiàng)性能指標(biāo)可以看出由兩階段的訓(xùn)練到端到端的訓(xùn)練過(guò)程,訓(xùn)練的平均精度有了很大的提升,每秒處理圖像的幀數(shù)也大幅增加,訓(xùn)練速度也是愈來(lái)愈快。由實(shí)驗(yàn)可知,F(xiàn)asterR-CNN對(duì)小物體的檢測(cè)效果還是比較樂觀的,SSD網(wǎng)絡(luò)的訓(xùn)練速度最快,而YOLO則是融合了兩者的特點(diǎn),速度上要比FasterR-CNN快,對(duì)于小物體的檢測(cè)要比SSD遜色。在未來(lái)的發(fā)展中,待提出的網(wǎng)絡(luò)模型不但要能夠適應(yīng)各種尺寸的物體檢測(cè),而且要有較高的識(shí)別率和更快的檢測(cè)速度。

        4神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法存在的問(wèn)題

        目前深度神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展迅速,在圖像、語(yǔ)音、自然語(yǔ)言處理等領(lǐng)域都取得了可喜的成績(jī),這些成果離不開硬件處理單元GPU的快速改進(jìn),提升了計(jì)算機(jī)處理圖像的能力。深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)作為一項(xiàng)發(fā)展中的技術(shù),目前還存在一些急待解決的問(wèn)題。

        4.1數(shù)據(jù)集標(biāo)注的問(wèn)題

        在深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)模型中,我們需要使用標(biāo)注過(guò)的數(shù)據(jù)集進(jìn)行訓(xùn)練。在大型的視覺類比賽中常用到的公開數(shù)據(jù)集有PASCALVOC、ImageNet、MS COCO等,但對(duì)于不同模型,數(shù)據(jù)集標(biāo)注格式不同,需要我們足夠熟悉各種模型的數(shù)據(jù)集標(biāo)注格式,快速實(shí)現(xiàn)不同類型的標(biāo)注數(shù)據(jù)集之間的轉(zhuǎn)換。當(dāng)數(shù)據(jù)集大小適中的情況下,深度神經(jīng)網(wǎng)絡(luò)方法能夠?qū)颖緶?zhǔn)確定位并分類;當(dāng)數(shù)據(jù)集較大的時(shí)候,人工標(biāo)注數(shù)據(jù)的工作量也不容樂觀,增加了數(shù)據(jù)標(biāo)注成本。然而,在深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,若數(shù)據(jù)集太小則會(huì)引起數(shù)據(jù)擬合問(wèn)題,不利于模型的實(shí)現(xiàn)。因此,深度神經(jīng)網(wǎng)絡(luò)方法在小數(shù)據(jù)集上的應(yīng)用,將是一個(gè)急待解決的問(wèn)題。

        4.2硬件處理單元的改進(jìn)問(wèn)題

        在深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,不需要人工手動(dòng)提取出目標(biāo)對(duì)象的特征,網(wǎng)絡(luò)能夠自動(dòng)提取出目標(biāo)對(duì)象的特征,并對(duì)其進(jìn)行分類和定位。在數(shù)據(jù)集較大的情況下,特征提取、特征計(jì)算問(wèn)題也愈加繁雜,普通計(jì)算機(jī)的CPU處理器已經(jīng)不能滿足網(wǎng)絡(luò)訓(xùn)練需要的計(jì)算能力。由英偉達(dá)公司開發(fā)的高性能顯卡,實(shí)現(xiàn)了GPU硬件環(huán)境的搭建,在同種模型的訓(xùn)練中有效提升了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效率,顯著減少了網(wǎng)絡(luò)訓(xùn)練需要的時(shí)間。在未來(lái)的研究中,我們可能開發(fā)出更加深層次的網(wǎng)絡(luò)結(jié)構(gòu),用其訓(xùn)練大量更加復(fù)雜的目標(biāo)對(duì)象,這一訓(xùn)練的實(shí)現(xiàn)也依賴于計(jì)算機(jī)的計(jì)算能力,有效升級(jí)計(jì)算機(jī)硬件處理單元是我們需要努力改進(jìn)的地方。

        4.3目標(biāo)檢測(cè)模型的進(jìn)化問(wèn)題

        在傳統(tǒng)的目標(biāo)檢測(cè)方法中,研究者根據(jù)特定目標(biāo)對(duì)象的特征設(shè)計(jì)出特定的檢測(cè)器,比如:Harr特征、梯度方向直方圖(HOG)、支持向量機(jī)(SVM)、多尺度形變部件(DPM)等,這些檢測(cè)器都需要人為的提取出目標(biāo)對(duì)象的特征,不可避免地會(huì)發(fā)生特征遺漏,影響最終的檢測(cè)效果。自2013年問(wèn)世的深度神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)模型,能夠自動(dòng)提取出目標(biāo)對(duì)象的特征,在計(jì)算機(jī)視覺領(lǐng)域已經(jīng)得到了良好的應(yīng)用。

        目前深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法分為兩類,一類是基于域名提名的多階段訓(xùn)練模型;另一類是不基于域名提名的單階段訓(xùn)練模型?,F(xiàn)階段這兩類方法主要適用于普通物體檢測(cè),對(duì)于文本、版面等對(duì)象的檢測(cè)效果不是很理想。這主要是因?yàn)槲矬w本身具有封閉性、均勻性,文本、版面則是開放的,往往都是扁寬的形狀,文本的縱橫比也不盡相同,文字也呈現(xiàn)出水平、豎直、傾斜的方向。研究者需要根據(jù)自身實(shí)踐經(jīng)驗(yàn),調(diào)整模型的參數(shù),讓模型也能夠適應(yīng)文本等不均勻目標(biāo)對(duì)象的檢測(cè)。

        此外,現(xiàn)有的深度神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)方法對(duì)于小物體的檢測(cè)和存在遮擋的物體檢測(cè)效果還不是很理想。盡管學(xué)者們也對(duì)此類問(wèn)題提出了不同的解決方法,但還沒有足夠的理論依據(jù)去解釋這一類問(wèn)題。研究者需要加強(qiáng)自身理論的學(xué)習(xí),從理論角度深刻理解并改進(jìn)這一類問(wèn)題,關(guān)于模型的進(jìn)化也是未來(lái)需要解決的問(wèn)題。

        5總結(jié)和展望

        本文回顧了目標(biāo)檢測(cè)的發(fā)展歷程,引出了神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)。簡(jiǎn)單介紹了神經(jīng)網(wǎng)絡(luò)發(fā)展歷程、基礎(chǔ)網(wǎng)絡(luò)的演化,分析了現(xiàn)階段神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法各自的優(yōu)缺點(diǎn)以及模型所能解決的問(wèn)題。隨著計(jì)算機(jī)硬件GPU和深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù)逐漸成熟,在計(jì)算機(jī)視覺領(lǐng)域已經(jīng)有了較為成功的應(yīng)用。雖然目前已經(jīng)取得了一些成績(jī),但仍存在一些應(yīng)用方面的問(wèn)題。在未來(lái)的研究中,深度神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)領(lǐng)域的應(yīng)用也將會(huì)更加成熟,對(duì)復(fù)雜的研究對(duì)象的精確度和速度的提升面臨突破,也將會(huì)有高層次領(lǐng)域的應(yīng)用。

        猜你喜歡
        深度神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)視覺目標(biāo)檢測(cè)
        試論基于深度神經(jīng)網(wǎng)絡(luò)的汽車車型識(shí)別問(wèn)題
        深度神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀
        視頻中目標(biāo)檢測(cè)算法研究
        軟件(2016年4期)2017-01-20 09:38:03
        行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
        機(jī)器視覺技術(shù)發(fā)展及其工業(yè)應(yīng)用
        危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺監(jiān)控識(shí)別報(bào)警系統(tǒng)設(shè)計(jì)
        計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用
        基于計(jì)算機(jī)視覺的細(xì)小顆粒團(tuán)重量測(cè)量的研究
        基于深度神經(jīng)網(wǎng)絡(luò)的身份識(shí)別研究
        移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
        久久精品一区二区三区蜜桃| 欧美国产成人精品一区二区三区| 国产精品久久码一区二区 | 亚洲av男人免费久久| 中文字幕一二三四五六七区| 人妻 丝袜美腿 中文字幕| 成人免费看片又大又黄| 精品国产91天堂嫩模在线观看| 亚洲女同系列高清在线观看| 亚洲hd高清在线一区二区| 国产av激情舒服刺激| 屁屁影院ccyy备用地址| 99亚洲精品久久久99| 少妇熟女淫荡丰满| 偷拍一区二区三区黄片| 日本一区二区三区高清在线视频| 国产精品99精品无码视亚| 国产亚洲av手机在线观看| 丰满人妻AV无码一区二区三区| 91中文在线九色视频| 久久99热国产精品综合| 日本黄网站三级三级三级| 无码人妻丰满熟妇精品区| aa视频在线观看播放免费| 亚洲成人精品在线一区二区| 国产做无码视频在线观看| 亚洲欧美日韩人成在线播放| 亚洲男人天堂av在线| 少妇一区二区三区精选| 手机在线亚洲精品网站| 午夜福利啪啪片| 亚洲av日韩av综合aⅴxxx| 精品少妇白浆一二三区| 日本一区二区三区视频免费观看| 亚洲av日韩av天堂久久| 精品性高朝久久久久久久| 亚洲精品无人区一区二区三区| 人妻少妇av中文字幕乱码| 日本大乳高潮视频在线观看| 精品一区二区久久久久久久网站 | 电影内射视频免费观看|