亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于注意力機(jī)制的3D車輛檢測算法*

        2020-03-04 07:56:52萬思宇
        計算機(jī)工程與科學(xué) 2020年1期
        關(guān)鍵詞:機(jī)制特征檢測

        萬思宇

        (上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)

        1 引言

        3D車輛檢測是自動駕駛系統(tǒng)的重要組成部分。自動駕駛汽車需要在三維坐標(biāo)系中對障礙物進(jìn)行精確檢測和定位,以避免車禍的發(fā)生?,F(xiàn)代自動駕駛汽車普遍配備高精度攝像頭與深度傳感器,如測距激光雷達(dá),來提供車輛前方的準(zhǔn)確圖像以及車輛前方物體的深度信息,這些信息的具體數(shù)據(jù)形式如圖1所示。

        已有的車輛檢測研究主要分為2類,1類是基于攝像機(jī)圖像的檢測,另1類是基于激光雷達(dá)的點(diǎn)云信息的檢測?;趫D像的檢測算法通過提取圖像特征,獲得前方障礙物在圖像上的位置,但由于缺乏深度信息,在三維空間中無法定位物體。基于激光雷達(dá)的點(diǎn)云包含每1個點(diǎn)的空間信息,檢測算法通過提取每1個點(diǎn)的空間特征,再將所有點(diǎn)的空間特征進(jìn)行回歸,可以得到前方障礙物的位置與深度信息。但是,由于點(diǎn)云距離車輛越遠(yuǎn)越稀疏,對于較遠(yuǎn)位置的物體,檢測結(jié)果的準(zhǔn)確率有所降低。

        Figure 1 Example of image and pointcloud圖1 圖像與點(diǎn)云示例

        傳統(tǒng)的基于激光雷達(dá)的點(diǎn)云信息的檢測算法,首先通過卷積神經(jīng)網(wǎng)絡(luò)對點(diǎn)云中的每1個點(diǎn)提取特征,再通過最大池化層從所有點(diǎn)的特征中選出最顯著的特征,最后分別通過分類與回歸網(wǎng)絡(luò)確定前方障礙物的類別與位置。在這個過程中,所有點(diǎn)的重要程度是一致的,但在實(shí)際檢測時,這些點(diǎn)的重要程度可能有一定的不同。針對以上缺點(diǎn),本文引入注意力機(jī)制,首先通過已有的3D車輛檢測算法回歸一個車輛的初始位置;然后分別計算每個點(diǎn)與初始中心點(diǎn)位置的距離,再將這些距離值送入注意力網(wǎng)絡(luò),通過注意力網(wǎng)絡(luò)回歸得到每個點(diǎn)的權(quán)重;最后將注意力網(wǎng)絡(luò)得到的權(quán)重與每個點(diǎn)的特征相乘,送入最大池化層進(jìn)行最大池化操作。在此過程中,通過給予車輛點(diǎn)較高的權(quán)重,非車輛點(diǎn)較低的權(quán)重,使得車輛點(diǎn)的特征更容易通過最大池化層得到保留。

        在KITTI數(shù)據(jù)集[1]上對本文算法進(jìn)行了評估,并與現(xiàn)有的算法進(jìn)行了比較,在保證實(shí)時檢測的情況下,本文算法較現(xiàn)有方法具有更高的準(zhǔn)確度。

        2 相關(guān)工作

        車輛檢測是一個廣泛研究的課題。根據(jù)數(shù)據(jù)類型不同,車輛檢測算法可分為2類:基于圖像的2D車輛檢測和基于點(diǎn)云的3D車輛檢測。

        2.1 2D車輛檢測

        2D車輛檢測算法的本質(zhì)是基于圖像目標(biāo)檢測。常用的圖像檢測框架分為2類,分為提取候選框與回歸檢測結(jié)果的兩個步驟的神經(jīng)網(wǎng)絡(luò)算法,以及不提取候選框直接回歸檢測結(jié)果的一個步驟的神經(jīng)網(wǎng)絡(luò)算法。文獻(xiàn)[2]提出的FasterR-CNN是二階段(Two-stage)圖像檢測算法中廣泛應(yīng)用的框架。使用文獻(xiàn)[3]提出的VGG16網(wǎng)絡(luò)來獲取整幅圖像的特征圖,然后通過在整張?zhí)卣鲌D滑窗回歸得到候選框。然后,該算法將候選框的特征送入分類網(wǎng)絡(luò)與回歸網(wǎng)絡(luò)中,從而得到圖像中目標(biāo)的類別與位置。基于Faster-RCNN,文獻(xiàn)[4]提出了多尺度深度卷積神經(jīng)網(wǎng)絡(luò)MSCNN(Multi-Scale deep Convolutional Neural Network),它在VGG16網(wǎng)絡(luò)中不同的卷積層上提取得到多尺度的特征信息,并通過這些多尺度特征信息得到更加準(zhǔn)確的候選框,從而在多尺度上具有較好的性能。此外,在一步圖像檢測算法中,出現(xiàn)了SSD[5]與YOLO[6]等多種檢測算法,一步圖像檢測算法使用默認(rèn)的候選框代替生成的候選框,去除了生成候選框這一步驟,直接在默認(rèn)的候選框中進(jìn)行目標(biāo)檢測,從而具有更快的速度。

        2.2 3D車輛檢測

        3D車輛檢測算法分為基于點(diǎn)云的檢測算法和基于立體圖像的檢測算法。在基于立體圖像的檢測算法中,文獻(xiàn)[7]提出的3DOP算法從立體圖像中提取每個點(diǎn)的深度信息,然后通過平面圖像和深度信息生成用于檢測的3D候選框。而在基于點(diǎn)云的檢測方法中,文獻(xiàn)[8]提出的Voxelnet算法通過在三維空間中進(jìn)行三維空間滑窗從而得到三維空間中的候選體元,再將這些體元的特征送入三維分類器網(wǎng)絡(luò)和回歸網(wǎng)絡(luò)得到最后的檢測結(jié)果。而MV3D算法[9]使用前視圖和鳥瞰圖代替點(diǎn)云視圖,從而減少了尺寸和計算量。文獻(xiàn)[10]提出的另一種3D車輛檢測算法則是利用了車輛的CAD模型,首先通過圖像檢測算法找到車輛的二維圖像,再通過算法獲得車輛的關(guān)鍵點(diǎn)位置,最后將車輛的關(guān)鍵點(diǎn)與CAD模型匹配進(jìn)而得到車輛的空間位置。除了這些檢測算法,文獻(xiàn)[11]提出一種基于點(diǎn)云的端到端的3D車輛檢測算法--Pointnet,得到了廣泛的應(yīng)用。

        2.3 Pointnet

        Pointnet與之前的基于點(diǎn)云的3D車輛檢測算法不同,它是一種專門針對點(diǎn)云的檢測算法。Pointnet的輸入是包含點(diǎn)云中所有點(diǎn)的位置信息的數(shù)組,輸出為待檢測目標(biāo)的分類和位置。它是一個高效的基于點(diǎn)云的3D目標(biāo)檢測算法?;赑ointnet算法,文獻(xiàn)[12]提出了Pointnet++算法,在關(guān)注全局特征的同時針對局部特征進(jìn)行了優(yōu)化,從而得到了更好的檢測效果。

        2.4 國內(nèi)車輛檢測研究現(xiàn)狀

        隨著智能駕駛在國內(nèi)外的飛速發(fā)展,國內(nèi)的車輛檢測研究也在不斷發(fā)展。由文獻(xiàn)[13]可知,百度提出了Apollo智能駕駛解決方案,建立了國內(nèi)最大的道路車輛駕駛數(shù)據(jù)集,同時為客戶提供智能駕駛解決方案。由文獻(xiàn)[14]可知,阿里的人工智能實(shí)驗(yàn)室也在智能駕駛領(lǐng)域做出了不少貢獻(xiàn),阿里推動“ET城市大腦”的實(shí)驗(yàn),與各地政府建立“智慧城市”,幫助城市進(jìn)入智能交通新時代。

        Figure 2 Framework of 3D vehicle detection based on attention mechanism圖2 基于注意力機(jī)制的3D車輛檢測框架

        Figure 3 Structure of Pointnet圖3 Pointnet網(wǎng)絡(luò)結(jié)構(gòu)圖

        2.5 注意力網(wǎng)絡(luò)

        (1)

        za=a⊙z

        (2)

        3 基于注意力機(jī)制的3D車輛檢測算法

        Pointnet的提出推動3D車輛檢測算法的飛速發(fā)展。在Pointnet的基礎(chǔ)上,本文引入了注意力機(jī)制。圖2給出了基于注意力機(jī)制的3D車輛檢測算法的基本框架。其中,點(diǎn)云輸入為{Pi|i=1,2,3,…,n},Pi是1個三維數(shù)組(xi,yi,zi),代表點(diǎn)i在三維空間中的坐標(biāo)位置,n代表點(diǎn)云中點(diǎn)的數(shù)量。對應(yīng)每1組點(diǎn)云輸出為(x,y,z,w,h,l,α),其中(x,y,z)代表待檢測車輛的中心點(diǎn)在三維空間中的位置,(w,h,l)代表待檢測車輛的車型尺寸,α代表車輛在三維空間中圍繞y軸的方向。該算法分為4個部分:

        (1)采用基于Pointnet網(wǎng)絡(luò)結(jié)構(gòu)對三維點(diǎn)云進(jìn)行分割并通過回歸得到車輛的初始中心點(diǎn)位置(x′,y′,z′);

        (2)計算點(diǎn)云中每個點(diǎn)到初始中心點(diǎn)距離di:

        di=Pi-(x′,y′,z′)

        (3)

        之后將di送入注意力網(wǎng)絡(luò)中,得到每個點(diǎn)對應(yīng)的權(quán)重wi。

        (3)將di送入基于Pointnet的網(wǎng)絡(luò)結(jié)構(gòu)并提取每個點(diǎn)對應(yīng)的特征fdi,之后對每個點(diǎn)的特征fdi進(jìn)行加權(quán):

        f′di=fdi⊙wi

        (4)

        (5)

        3.1 特征提取網(wǎng)絡(luò)

        本文采用一種簡化的Pointnet網(wǎng)絡(luò)結(jié)構(gòu)來提取3D點(diǎn)云特征。簡化的Pointnet網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

        輸入的點(diǎn)云數(shù)據(jù)形式為n×3的數(shù)組,n為輸入點(diǎn)的個數(shù),對于每個點(diǎn)i(1≤i≤n),輸入(x,y,z)即為該點(diǎn)在空間中的坐標(biāo)位置。算法首先通過多層卷積神經(jīng)網(wǎng)絡(luò),提取每個點(diǎn)單獨(dú)的特征,將(x,y,z)維度擴(kuò)展為1 024。然后通過1個最大池化層,對n×1024維的特征向量在n維上進(jìn)行最大池化,找出最為顯著的特征,池化得到的1×1024維向量作為該點(diǎn)云的全局向量。最后將全局向量送入分類與回歸網(wǎng)絡(luò)就可以得到前方障礙物的種類與位置。

        3.2 注意力網(wǎng)絡(luò)

        通過前面的Pointnet網(wǎng)絡(luò),可以從每個點(diǎn)中提取得到1 024維特征,從而得到n×1024維的特征向量Vl,用平均池化得到的平均值Vavg來代替該點(diǎn)的特征。將每個點(diǎn)的特征送入注意力網(wǎng)絡(luò)可得到對應(yīng)的權(quán)重β1,具體計算公式如下(如圖4所示):

        b=tanh((WC?Vavg+bc)⊕Whcht-1)

        (6)

        β1=softmax(W′ib+b′i)

        (7)

        其中,Vavg為輸入特征的平均值,WC,Whc與W′i是變換矩陣,bc與b′i是偏差項。

        Figure 4 Structure of attention mechanism圖4 注意力網(wǎng)絡(luò)結(jié)構(gòu)

        4 實(shí)驗(yàn)結(jié)果

        4.1 數(shù)據(jù)集

        為了驗(yàn)證基于注意力機(jī)制的車輛檢測算法的有效性,本文在12 GB顯存,CPU型號為Intel?CoreTMi7-6700K的臺式計算機(jī)上進(jìn)行實(shí)驗(yàn)。使用基于Python的tensorflow框架對數(shù)據(jù)集進(jìn)行處理,數(shù)據(jù)源為1個專門進(jìn)行智能駕駛檢測的真實(shí)數(shù)據(jù)集KITTI。KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學(xué)院和豐田美國技術(shù)研究院聯(lián)合提供,是目前國際上最大的自動駕駛場景下的計算機(jī)視覺算法評測數(shù)據(jù)集。該數(shù)據(jù)集用于評測立體圖像、光流、視覺測距、3D物體檢測和3D跟蹤等計算機(jī)視覺技術(shù)在車載環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實(shí)圖像數(shù)據(jù),每幅圖像中最多達(dá)15輛車和30個行人,還有各種程度的遮擋與截斷。整個數(shù)據(jù)集由389對立體圖像和光流圖,39.2 km視覺測距序列以及超過200k 3D標(biāo)注物體的圖像組成[1]。

        4.2 實(shí)驗(yàn)結(jié)果

        KITTI使用同樣用于二維目標(biāo)檢測的Pascal標(biāo)準(zhǔn)評估三維目標(biāo)檢測性能。因此,KITTI數(shù)據(jù)集將根據(jù)圖像平面中的邊界框高度對遠(yuǎn)距離對象進(jìn)行過濾。因?yàn)橹挥性趫D像平面上出現(xiàn)的對象才會被標(biāo)記,所以不在圖像平面中的對象不會算作誤報。對于汽車圖像,KITTI要求檢測結(jié)果與標(biāo)簽有70%以上的三維邊界框重疊方可認(rèn)為檢測正確。KITTI將待檢測目標(biāo)分為3個難度:(1)簡單。最小邊界框高度:40像素,最大遮擋級別:完全可見,最大截斷:15%。(2)中等。最小邊界框高度:25像素,最大遮擋級別:部分遮擋,最大截斷:30%。(3)困難。最小邊界框高度:25 像素,最大遮擋級別:難以看到,最大截斷:50%。

        本文從KITTI訓(xùn)練集中選取3 712幅2D圖像與對應(yīng)的點(diǎn)云數(shù)據(jù)集進(jìn)行訓(xùn)練,從驗(yàn)證集中選取3 769幅2D圖像與對應(yīng)的點(diǎn)云數(shù)據(jù)集進(jìn)行測試,最后選取Pointnet的離線測試集進(jìn)行了結(jié)果測試。在KITTI上得到的最終測試結(jié)果如圖5、圖6和表1所示。

        Figure 5 Curves of precision-recall of Pointnet圖5 Pointnet的精度-召回率曲線

        Figure 6 Curves of precision-recall of vehicle detection algorithm based on attention mechanism圖6 基于注意力機(jī)制車輛檢測算法的精度-召回率曲線

        通過與Pointnet算法的對比可以看出,對于簡單難度的待檢測目標(biāo),基于注意力機(jī)制的車輛檢測算法有著與Pointnet較為相似的結(jié)果,而對于中等難度和困難難度的待檢測目標(biāo),本文算法有著優(yōu)于Pointnet算法的檢測結(jié)果。綜合所有結(jié)果來看,本文提出的基于注意力機(jī)制的車輛檢測算法的準(zhǔn)確度相對更高,有一個較明顯的提升。

        Table 1 Accuracy comparison of vehicle detection algorithms表1 車輛檢測算法準(zhǔn)確度對比(離線測試集) %

        4.3 實(shí)驗(yàn)結(jié)果分析

        從實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),引入注意力機(jī)制可以較好地改善中等難度與困難難度的車輛檢測結(jié)果。相比Pointnet算法,本文通過引入權(quán)重使得在將特征送入最大池化層時,一些重要的特征被保留下來。對于簡單難度(較近距離)的車輛,由于其空間信息較豐富,Pointnet算法的準(zhǔn)確度較高,基于注意力機(jī)制的檢測結(jié)果沒有顯著的提升。對于中等難度的車輛,本文算法可以通過給予關(guān)鍵點(diǎn)權(quán)重,獲得更加準(zhǔn)確的結(jié)果。而對于困難難度(較遠(yuǎn)距離)的車輛,由于其車輛距離較遠(yuǎn),點(diǎn)云過于稀疏,導(dǎo)致其點(diǎn)云數(shù)據(jù)本身不多,故引入權(quán)重的效果不佳。

        5 結(jié)束語

        本文基于注意力機(jī)制理論提出了一個基于注意力機(jī)制的3D車輛檢測算法。該算法首先預(yù)估了車輛可能的中心點(diǎn),然后將點(diǎn)云中每個點(diǎn)到預(yù)估中心點(diǎn)的距離送入注意力網(wǎng)絡(luò),從而得到每個點(diǎn)不同的權(quán)重。再將每個點(diǎn)的特征進(jìn)行加權(quán)后送入分類與回歸網(wǎng)絡(luò)處理。該算法彌補(bǔ)了現(xiàn)有算法對于點(diǎn)云內(nèi)所有點(diǎn)一視同仁的不足,通過提高部分重要點(diǎn)的權(quán)重得到更加準(zhǔn)確的檢測結(jié)果。本文僅在Pointnet上嘗試引入了注意力機(jī)制,未來可在一些更加前沿的算法上嘗試引入注意力機(jī)制,同時將研究不同的注意力機(jī)制對于檢測結(jié)果的影響。

        猜你喜歡
        機(jī)制特征檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        如何表達(dá)“特征”
        不忠誠的四個特征
        自制力是一種很好的篩選機(jī)制
        文苑(2018年21期)2018-11-09 01:23:06
        抓住特征巧觀察
        小波變換在PCB缺陷檢測中的應(yīng)用
        破除舊機(jī)制要分步推進(jìn)
        注重機(jī)制的相互配合
        中日无码精品一区二区三区| 日韩精品内射视频免费观看| 亚洲人成色777777老人头| 免费无码又爽又刺激高潮的视频网站 | 中国熟妇人妻xxxxx| 国产精品无码片在线观看| 91九色国产在线观看| 中文字幕本久久精品一区| 在熟睡夫面前侵犯我在线播放| 国产成人免费a在线视频| 亚洲国产高清在线视频| 国产高清在线一区二区不卡| 国产成人精品午夜视频| 伊人久久大香线蕉免费视频| 亚洲av乱码一区二区三区女同 | 国产一区二区av男人| 日韩精品熟女中文字幕| 99久久久无码国产精品6| 亚洲熟妇一区无码| 国产精品丝袜美腿诱惑| 天堂资源中文网| 丁香五香天堂网| 亚洲无线码1区| 日韩av在线不卡一区二区| 2019日韩中文字幕mv| 欧美精品一区二区性色a+v| 偷拍女厕尿尿在线免费看 | 一本丁香综合久久久久不卡网站| 久久亚洲中文字幕无码| 中文字幕第一页在线无码一区二区| 国产精品国产三级国产专区不| 久久精品国产成人| 久久久久亚洲女同一区二区| 国产精品久久一区二区蜜桃| 精品国产天堂综合一区在线 | 欧美精品久久久久久三级| 狼人精品剧情av在线观看| 国产69精品久久久久777| 国产精品三级在线观看| 国产一区二区三区特黄| 少妇被又大又粗又爽毛片|