亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)Faster R-CNN 網(wǎng)絡(luò)的航拍小目標(biāo)檢測研究

        2022-08-17 10:07:08劉晉川黎向鋒劉安旭左敦穩(wěn)趙康
        電子設(shè)計工程 2022年15期
        關(guān)鍵詞:特征提取特征檢測

        劉晉川,黎向鋒,劉安旭,左敦穩(wěn),趙康

        (南京航空航天大學(xué)機(jī)電學(xué)院,江蘇南京 210016)

        隨著航空航天技術(shù)的飛速發(fā)展,無人機(jī)技術(shù)及其航拍圖像在軍事和民用等領(lǐng)域應(yīng)用也越來越廣,如搜索救援、地形勘探、交通疏導(dǎo)以及智能停車等[1-4]。由于無人機(jī)拍攝高度高、視野廣,導(dǎo)致航拍圖像中的目標(biāo)存在尺度變化大、尺寸較小以及背景復(fù)雜等問題。而傳統(tǒng)的特征提取方法如SIFT 和HOG 算法需要人工設(shè)計特征[5-6],只能在特定的場景下才能取得較好的效果,適應(yīng)性和泛化能力差,不適合航拍圖像的檢測。

        近年來,基于深度學(xué)習(xí)的目標(biāo)檢測算法取得了重大進(jìn)展,其準(zhǔn)確性和實(shí)時性不斷提升?;谏疃葘W(xué)習(xí)的目標(biāo)檢測算法大致分為兩類:一類是以Faster RCNN[7]以及Cascade R-CNN[8]等算法為基礎(chǔ)的兩階段檢測算法,另一類是以YOLO[9]、RetinaNet[10]等算法為代表的一階段檢測算法。兩階段算法首先選擇候選區(qū)域,然后將候選區(qū)域進(jìn)行位置回歸和類別分類,這種方法檢測精度較高,但檢測速度較慢。而一階段算法則去掉了候選區(qū)域的選擇步驟,直接對圖像進(jìn)行分類和回歸,檢測速度較快,但檢測精度略低?;谏疃葘W(xué)習(xí)的目標(biāo)檢測方法在檢測精度和檢測速度上相較傳統(tǒng)方法有了很大提升,但無論是一階段還是兩階段檢測算法,在面對小目標(biāo)較多且各類目標(biāo)間尺度變化較大的圖像時,仍然存在召回率低、誤檢率高的問題。為此,國內(nèi)外學(xué)者進(jìn)行了大量研究:Zhang等人為恢復(fù)小目標(biāo)尺寸,在網(wǎng)絡(luò)中添加了反卷積層,改善了航拍圖像中小目標(biāo)的檢測精度,但該方法過于聚焦小目標(biāo),對不同尺寸的目標(biāo)檢測魯棒性較差[11];Kisantal 等人提出一種對圖像中的小目標(biāo)進(jìn)行復(fù)制和重復(fù)采樣的方法,通過豐富小目標(biāo)的訓(xùn)練樣本來提高檢測精度,然而這種數(shù)據(jù)增強(qiáng)的方法對于沒有實(shí)例分割的數(shù)據(jù)集較為繁瑣[12];劉英杰等人提出基于級聯(lián)區(qū)域建議網(wǎng)絡(luò)的航拍目標(biāo)檢測算法,通過設(shè)置多閾值級聯(lián)機(jī)構(gòu)優(yōu)化對小目標(biāo)的檢測,提高了航拍圖像中小目標(biāo)的檢測精度,但該類網(wǎng)絡(luò)的高計算成本限制了檢測的速度[13]。

        與一階段算法相比,F(xiàn)aster R-CNN 算法使用了RPN 網(wǎng)絡(luò),解決了訓(xùn)練過程中類別不均衡的問題。故該文基于Faster R-CNN 網(wǎng)絡(luò),改進(jìn)特征提取網(wǎng)絡(luò)并與特征金字塔網(wǎng)絡(luò)[14](Feature Pyramid Networks,F(xiàn)PN)結(jié)合,同時改進(jìn)錨框設(shè)置,提出了適合航拍圖像檢測的多尺度目標(biāo)檢測網(wǎng)絡(luò)MS-R-CNN(Multi-Scale R-CNN)。

        1 數(shù)據(jù)集及評價指標(biāo)

        1.1 數(shù)據(jù)集介紹

        DIOR 數(shù)據(jù)集[15]是西北工業(yè)大學(xué)于2019 年提出的,該數(shù)據(jù)集包含23 463 張圖片,圖片尺寸均為800×800 像素,共有192 472 個對象實(shí)例,覆蓋20 個類別目標(biāo)。該數(shù)據(jù)集中有車輛、船舶等小目標(biāo),也有高爾夫球場、公路收費(fèi)站等尺寸較大的目標(biāo),具有較大的尺寸變化,并且具有較高的類內(nèi)多樣性和類間相似性。

        1.2 評價指標(biāo)

        文中采用查準(zhǔn)率(Precision)、召回率(Recall)、平均精度(Average Precision,AP)和平均精度均值(Mean Average Precision,mAP)作為模型性能的評價指標(biāo)。AP 值為以查準(zhǔn)率為橫坐標(biāo)、召回率為縱坐標(biāo)繪制的曲線所圍的面積。查準(zhǔn)率與召回率定義如式(1)和式(2)所示:

        式中,TP(True Positive)表示分類器認(rèn)為是正樣本且確實(shí)是正樣本的例子,F(xiàn)P(False Positive)表示分類器認(rèn)為是正樣本但實(shí)際上不是正樣本的例子,F(xiàn)N(False Negative)表示分類器認(rèn)為是負(fù)樣本但實(shí)際上不是負(fù)樣本的例子。

        目標(biāo)檢測任務(wù)中最重要的一個指標(biāo)是平均精度均值,在多分類任務(wù)中,將所有類別的AP 求均值就可以得到mAP。

        2 Faster R-CNN算法改進(jìn)研究

        Faster R-CNN 自提出到現(xiàn)在,一直采用最經(jīng)典的兩階段檢測算法,其網(wǎng)絡(luò)框架如圖1 所示。該算法共分為四個階段:1)VGG 網(wǎng)絡(luò)提取待檢測圖片特征;2)特征圖進(jìn)入RPN 網(wǎng)絡(luò)后輸出候選框矩陣及其得分;3)ROI Pooling 層將RPN 的輸出和特征圖進(jìn)行處理,融合后生成大小一致的特征圖;4)全連接層將3)中得到的特征圖進(jìn)行類別分類和位置回歸,得到檢測框的位置信息及得分。

        圖1 Faster R-CNN網(wǎng)絡(luò)框架

        2.1 引入Res2Net的特征提取網(wǎng)絡(luò)

        對Faster R-CNN 算法的特征提取網(wǎng)絡(luò)進(jìn)行替換和改進(jìn),將其中的VGG 特征提取網(wǎng)絡(luò)替換為Res2Net[16]網(wǎng)絡(luò)。相比VGG 網(wǎng)絡(luò),Res2Net 可以提 取到更深層的語義信息,有效地改善了網(wǎng)絡(luò)梯度消失和梯度爆炸的問題,整體提高了遠(yuǎn)距離小目標(biāo)這種對分辨率要求較高的信息的特征提取和表達(dá)能力。

        Res2Net 網(wǎng)絡(luò)是通過改進(jìn)ResNet[17]網(wǎng)絡(luò)中的殘差塊得到的。殘差塊結(jié)構(gòu)如圖2(a)所示,輸入特征矩陣以兩個分支進(jìn)入殘差塊,直線分支經(jīng)過多個卷積層產(chǎn)生輸出特征矩陣后與shortcut 分支傳過來的特征矩陣相加,之后再使用激活函數(shù),由這種若干個殘差塊堆疊構(gòu)建而成的網(wǎng)絡(luò)叫做殘差網(wǎng)絡(luò)。深度較大的特征提取網(wǎng)絡(luò)能提取到更加豐富的特征,而殘差網(wǎng)絡(luò)保證了在網(wǎng)絡(luò)深度加深的同時不會產(chǎn)生梯度消失和梯度爆炸的問題。

        通常的特征提取網(wǎng)絡(luò)如ResNet 等都使用分層的方式表示多尺度特征,在每層網(wǎng)絡(luò)上運(yùn)用多尺度,而Res2Net 在一個殘差塊中構(gòu)建了分層的、多通道的殘差連接,以更細(xì)粒度級別來表示多尺度特征。如圖2(b)是Res2Net中的殘差塊示意圖,該殘差塊先獲得1×1卷積后的特征圖,對其通道數(shù)順序均分為s塊,圖中s=4,每一小塊Xi都會進(jìn)行一個3×3 的卷積,用Ki表示,卷積結(jié)果用Yi表示,Xi與Ki-1的輸出相加并送入Ki,這樣就可以得到s個輸出。最后將s個結(jié)果進(jìn)行拼接融合,然后進(jìn)行1×1 的卷積,這種先拆分后融合的思路可以得到多尺度的特征,更好地進(jìn)行特征融合。

        圖2 ResNet和Res2Net殘差塊對比

        圖3 是Res2Net 的網(wǎng)絡(luò)結(jié)構(gòu)圖。圖中Res2Net bottleneck 代表一個圖2(b)所示的Res2Net 殘差塊,選取Conv2_x、Conv3_x、Conv4_x、Conv5_x卷積后提取的特征圖作為多尺度特征圖,送入后續(xù)的檢測網(wǎng)絡(luò)。

        圖3 Res2Net網(wǎng)絡(luò)示意圖

        2.2 Res2Net網(wǎng)絡(luò)中部分標(biāo)準(zhǔn)卷積的替換

        航拍圖像由于拍攝高度以及拍攝視角不同,同一物體在圖像中出現(xiàn)時的角度、大小等差異較大,而標(biāo)準(zhǔn)卷積限于固定的幾何結(jié)構(gòu),并不能很好地對其進(jìn)行模擬,故提出在Res2Net 網(wǎng)絡(luò)中使用變形卷積[18](Deformable Convolution Networks,DCN)替換圖3 中Conv3_x、Conv4_x 和Conv5_x 中的標(biāo)準(zhǔn)卷積,以提高網(wǎng)絡(luò)對目標(biāo)變換的建模能力。

        變形卷積在標(biāo)準(zhǔn)卷積的常規(guī)采樣位置添加了偏移量,使采樣的網(wǎng)格變形,如圖4 所示。標(biāo)準(zhǔn)卷積的計算方式如下:

        圖4 標(biāo)準(zhǔn)卷積和變形卷積采樣圖示

        其中,pn是對采樣網(wǎng)格(卷積核)R中所有位置的枚舉,p0為輸出特征圖上對應(yīng)pn的位置。變形卷積在標(biāo)準(zhǔn)卷積的基礎(chǔ)上增加了一個偏移量,同樣位置的p0變?yōu)椋?/p>

        即在每個采樣網(wǎng)格上添加了一個偏移量Δpn。圖5 為3×3 變形卷積的流程,首先通過一個額外的卷積層學(xué)習(xí)偏移量,然后將得到的偏移量作用到常規(guī)卷積之中,得到不規(guī)則位置的采樣。

        圖5 3×3變形卷積

        2.3 融合FPN的特征提取網(wǎng)絡(luò)

        圖6為DIOR 數(shù)據(jù)集中某航拍圖像在網(wǎng)絡(luò)Conv3_4 和Conv5_3 階段的特征熱力圖,圖中顏色不同表示特征圖提取到的信息重要程度不同,顏色偏向框線區(qū)域表示網(wǎng)絡(luò)對其更加關(guān)注,偏向非框線則相反。從圖中可以看出,淺層(Conv3_4)特征圖更加注重飛機(jī)等小目標(biāo)信息,由此可知,淺層信息更加適合小目標(biāo)的檢測,而深層特征圖由于具有更大的感受野,所以對大目標(biāo)的檢測更加敏感。如果直接采用深層特征進(jìn)行檢測,容易忽略圖像中的小目標(biāo)。為了增強(qiáng)對小目標(biāo)的檢測性能,MS-R-CNN 引入了特征金字塔網(wǎng)絡(luò)FPN,F(xiàn)PN 通過自頂向下的路徑和橫向連接,將高分辨率、語義弱的特征和低分辨率、語義強(qiáng)的特征結(jié)合起來,可以對小目標(biāo)進(jìn)行更有效的檢測。

        圖6 Res2Net網(wǎng)絡(luò)不同層次的熱力特征圖

        如圖7(a)所示,特征金字塔網(wǎng)絡(luò)FPN 從深層到淺層融合特征。首先深層特征圖通過步長為2 的卷積操作使特征圖尺寸擴(kuò)大一倍,同時將特征提取網(wǎng)絡(luò)中對應(yīng)大小的特征圖使用1×1 的卷積層進(jìn)行降維,然后將兩者對應(yīng)元素相加得到融合后的特征圖,最后進(jìn)入后續(xù)網(wǎng)絡(luò)進(jìn)行預(yù)測。融入FPN 的MS-RCNN 算法結(jié)構(gòu)如圖8 所示,圖中c2-c5 為Res2Net 網(wǎng)絡(luò)生成的特征圖,p2-p7 為FPN 網(wǎng)絡(luò)產(chǎn)生的特征圖。

        圖7 融合FPN的主干網(wǎng)絡(luò)

        圖8 改進(jìn)后網(wǎng)絡(luò)結(jié)構(gòu)圖

        2.4 針對小目標(biāo)的錨框改進(jìn)

        Faster R-CNN 定義了錨框(anchor)檢測物體,anchor 本質(zhì)就是在特征圖的每個像素點(diǎn)上設(shè)置一組具有不同大小和比例的矩形框模板,隨后用這組矩形框檢測框內(nèi)是否包含物體。結(jié)合DIOR 數(shù)據(jù)集的特性來設(shè)置anchor 的數(shù)量及尺寸。

        Faster R-CNN 網(wǎng)絡(luò)中的錨框是基于VOC 數(shù)據(jù)集設(shè)置的,共有3 種尺寸大小,分別為128×128 像素,256×256 像素和512×512 像素,每種尺寸都對應(yīng)3 種不同的寬高比(1∶1、1∶2 和2∶1),故特征圖中的每一個點(diǎn)都會生成9 個錨框。但DIOR 數(shù)據(jù)集中超過一半的目標(biāo)是像素小于32×32 的小目標(biāo),所以對于該數(shù)據(jù)集,其錨框設(shè)計不太合理。

        為了設(shè)計符合數(shù)據(jù)集的錨框大小及比例,對該數(shù)據(jù)集中的目標(biāo)實(shí)例進(jìn)行統(tǒng)計分析。圖9 展示了數(shù)據(jù)集中192 472 個對象實(shí)例的尺寸分布,從圖中可以看出,數(shù)據(jù)集中目標(biāo)大小尺寸分布極不均勻,且多數(shù)目標(biāo)為中小目標(biāo),雖然部分目標(biāo)長寬比跨度較大,但絕大多數(shù)集中在0.5~2.0 之間。故在MS-R-CNN 算法中,設(shè)置anchor的尺寸分別為16×16像素,32×32像素,64×64 像素,128×128 像素,256×256 像素和512×512 像素,寬高比分別為1∶1、1∶2 和2∶1,這樣的設(shè)置基本能覆蓋各個尺寸的目標(biāo)。由于每個尺寸的特征圖只能對應(yīng)一種尺度的錨框,故在原FPN 的基礎(chǔ)上,通過對p6 特征圖進(jìn)行最大池化操作生成p7,如圖8 所示,p2-p7 分別對應(yīng)上述6 種錨框尺寸。

        圖9 尺寸分布

        3 實(shí)驗與分析

        3.1 模型訓(xùn)練

        采用SGD(Stochastic Gradient Descent)算法對模型進(jìn)行求解,共學(xué)習(xí)12 輪,在第8 輪和第11 輪調(diào)整學(xué)習(xí)率,降為原來的0.1,目的是為了保證模型可以穩(wěn)定收斂,避免發(fā)生梯度爆炸。其他參數(shù)設(shè)置如表1所示。

        表1 參數(shù)設(shè)置

        3.2 實(shí)驗結(jié)果分析

        采用mAP 作為評價指標(biāo),為驗證設(shè)計模型的先進(jìn)性和有效性,將標(biāo)準(zhǔn)Faster R-CNN網(wǎng)絡(luò)(VGG-16)、經(jīng)典Faster R-CNN(ResNet-101+FPN)網(wǎng)絡(luò)以及該文算法MS-R-CNN 進(jìn)行了對比實(shí)驗。消融對比結(jié)果如表2 所示。表中anchor 表示改進(jìn)anchor 設(shè)置并在FPN 網(wǎng)絡(luò)上添加p7 層特征圖。

        表2 各類算法在DIOR數(shù)據(jù)集上的mAP對比

        通過實(shí)驗對比可以看出,MS-R-CNN 網(wǎng)絡(luò)對提高檢測效果非常有效,較標(biāo)準(zhǔn)Faster R-CNN 網(wǎng)絡(luò)準(zhǔn)確率提高了16.1%,較經(jīng)典的Faster R-CNN 算法提高了6.2%。其中Res2Net-101 特征提取網(wǎng)絡(luò)、DCN方法以及對anchor 的改進(jìn)分別貢獻(xiàn)了3.3%、1.9%和1.0%的檢測精度。

        圖10 所示為經(jīng)典Faster R-CNN 算法與MS-RCNN 算法檢測效果的局部放大圖。從對比圖可知,經(jīng)典Faster R-CNN 算法會對圖像中小目標(biāo)船只造成漏檢以及誤檢的情況,而該文的MS-R-CNN 算法可以對圖像中的船只進(jìn)行正確的檢測和識別。

        圖10 不同算法檢測結(jié)果示例

        4 結(jié)論

        為了提高航拍圖像的檢測精度,文中基于Faster R-CNN 網(wǎng)絡(luò)提出一種多尺度航拍目標(biāo)檢測算法MS-R-CNN。MS-R-CNN 選用Res2Net 網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),同時用變形卷積替換該網(wǎng)絡(luò)Conv3_x、Conv4_x 和Conv5_x 中的標(biāo)準(zhǔn)卷積,提高了網(wǎng)絡(luò)對目標(biāo)深層信息的提取能力以及對目標(biāo)變換的建模能力,將Res2Net產(chǎn)生的多尺度特征圖通過FPN 網(wǎng)絡(luò)自上而下融合起來,有效改善了深層特征圖中小目標(biāo)位置信息不足的問題。針對數(shù)據(jù)集中目標(biāo)的大小設(shè)置合適比例和尺寸的anchor,使其能有效地對各個尺度的目標(biāo)進(jìn)行檢測。實(shí)驗顯示,該文提出的MSR-CNN 算法在DIOR 數(shù)據(jù)集上較Faster R-CNN 算法mAP 提高了16.1%,較經(jīng)典的Faster R-CNN 算法mAP 提高了6.2%,明顯降低了小目標(biāo)的漏檢率和誤檢率,取得了良好的檢測效果,驗證了該文方法的有效性。

        猜你喜歡
        特征提取特征檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        如何表達(dá)“特征”
        基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        不忠誠的四個特征
        抓住特征巧觀察
        一種基于LBP 特征提取和稀疏表示的肝病識別算法
        小波變換在PCB缺陷檢測中的應(yīng)用
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        91亚洲无码在线观看| 国模精品一区二区三区| 精品国产一区二区三区香蕉| 最新国产乱视频伦在线| 淫欲一区二区中文字幕| 午夜av天堂精品一区| 亚洲av日韩av天堂久久| 亚洲中文无码av在线| 国产亚洲AV片a区二区| 中文字幕中文字幕777| 2019最新中文字幕在线观看| 欧美最猛黑人xxxxx猛交| 26uuu欧美日本在线播放| 亚洲av午夜福利精品一区不卡| 朋友的丰满人妻中文字幕| 国产第19页精品| 亚洲乱码一区AV春药高潮| 亚洲一区二区三区av资源| 久久久久免费看成人影片| 国产在线白丝DVD精品| 亚洲二区三区四区太九| 99久久婷婷国产亚洲终合精品 | 免费看黄视频亚洲网站| 国产精品美女久久久久av超清| 亚洲国产精品一区二区久| 日本一区二区三区一级免费| 亚洲夫妻性生活免费视频| 性一交一乱一伦一色一情孩交 | 免费人成视频网站网址| 精品久久久无码中字| 无码人妻少妇久久中文字幕蜜桃| 国产三级精品三级在线| 国产精品午夜福利视频234区| 国产成人精品日本亚洲| 国语憿情少妇无码av| 亚洲成人精品在线一区二区| 在线成人爽a毛片免费软件| 久久久久亚洲女同一区二区| 中文字幕日韩精品亚洲精品| 隔壁老王国产在线精品| 推油少妇久久99久久99久久|