亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        采用深度可分離卷積和改進(jìn)特征融合的MSSD

        2021-04-25 05:38:52劉增力
        電視技術(shù) 2021年3期
        關(guān)鍵詞:卷積精度深度

        席 磊,劉增力

        (1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500;2.昆明理工大學(xué) 云南省人工智能重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)

        0 引 言

        基于近年來(lái)卷積神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)技術(shù)以及計(jì)算機(jī)技術(shù)的進(jìn)步,以神經(jīng)網(wǎng)絡(luò)為代表的目標(biāo)檢測(cè)技術(shù)日益凸顯出其卓越的性能和巨大的潛力。自AlexNet[1]誕生后,神經(jīng)網(wǎng)絡(luò)用來(lái)進(jìn)行目標(biāo)檢測(cè)的工作逐漸增多。各種目標(biāo)檢測(cè)模型層出不窮,同時(shí)檢測(cè)性能不斷提升。目前,目標(biāo)檢測(cè)模型主要分為兩類(lèi),一類(lèi)是以RCNN[2]為代表的雙階目標(biāo)檢測(cè)器,另一類(lèi)是以 SSD[3]和 YOLO[4]為代表的單階目標(biāo)檢測(cè)器。SSD是最早出現(xiàn)的單階檢測(cè)器之一,不僅達(dá)到了實(shí)時(shí)檢測(cè)要求,而且在精度上取得了較好的效果。但是,SSD本身的結(jié)構(gòu)并不完善。隨著技術(shù)的更迭,SSD的改進(jìn)版不斷出現(xiàn)。DSSD[5]利用性能更好的殘差網(wǎng)絡(luò)替代VGG。殘差網(wǎng)絡(luò)相對(duì)于VGG有著更好的特征提取能力,結(jié)合反卷積進(jìn)行特征融合后實(shí)現(xiàn)了更高的精度,特別是對(duì)小目標(biāo)的檢測(cè),取得了更好的效果。但是,由于殘差網(wǎng)絡(luò)計(jì)算量的增加,它的檢測(cè)速度稍慢。FSSD[6]同樣采用特征融合策略將低層的特征圖拼接融合,將得到的新的尺寸為38×38的低層特征作為基礎(chǔ)進(jìn)行后續(xù)的特征提取工作,提高了低層特征信息的提取能力。DenseSSD[7]在結(jié)構(gòu)中設(shè)計(jì)了DenseSkip模塊,模塊內(nèi)部采用類(lèi)似瓶頸結(jié)構(gòu),進(jìn)行多次1×1+3×3的卷積。它的特征復(fù)用類(lèi)似DenseNet,且使用特征金字塔方式進(jìn)行特征融合。RFBNet[8]則從感受野大小差異帶來(lái)的信息差異出發(fā),設(shè)計(jì)了易于遷移使用的RFB模塊,利用大小不同的感受野的卷積核進(jìn)行特征提取。

        本文提出一種改進(jìn)的目標(biāo)檢測(cè)模型MSSD,結(jié)合深度可分離卷積的優(yōu)勢(shì),采用新的特征融合方式,進(jìn)一步挖掘了模型本身的結(jié)構(gòu)優(yōu)勢(shì),有效提高了模型的檢測(cè)性能。

        1 相關(guān)工作

        SSD 的骨干網(wǎng)絡(luò)為 VGG16[9]。VGG 憑借其卓越的性能獲得了ImageNet 2014挑戰(zhàn)賽分類(lèi)的亞軍和定位的冠軍。VGG16包含13個(gè)卷積層、5個(gè)池化層以及3個(gè)全連接層。筆者將VGG16加以改動(dòng),去掉VGG16的全連接層后,添加卷積層conv6和conv7,13個(gè)卷積層不變,將原作的第5個(gè)池化層的尺寸從2×2變?yōu)?×3。此外,新增的conv6采用膨脹卷積的思想,在conv7后添加額外的卷積處理。

        SSD可接受的輸入尺寸有300×300和512×512兩種。SSD300 由 conv4-3、conv7、conv8-2、conv9-2、conv10-2及conv11-2輸出的特征圖做預(yù)測(cè),大小分別為38、19、10、5、3、1。在每個(gè)特征圖上依次設(shè)置不同尺寸的預(yù)選框,共計(jì)有8 732個(gè)預(yù)選框。每個(gè)待預(yù)測(cè)特征圖會(huì)通過(guò)各自的分類(lèi)和位置回歸網(wǎng)絡(luò),即如圖1所示的cls和loc。檢測(cè)框經(jīng)過(guò)NMS篩選、剔除,得到最終的目標(biāo)輸出。

        深度可分離卷積(Depthwise Separable Convolution)最早由 Sifre[10]提出。這種思想成為 Xception[11]和MobileNets[12]的核心。深度可分離卷積與普通卷積的不同在于卷積過(guò)程。若輸入特征圖尺寸為C×H×W,卷積核尺寸為k×k,C表為輸入通道數(shù),H和W分別為高和寬,O為輸出通道數(shù),則對(duì)于普通卷積可得到其參數(shù)量為k×k×O×C。

        對(duì)于深度可分離卷積,可以分為兩步進(jìn)行。第一步進(jìn)行卷結(jié)核為k×k的深度卷積。該卷積在通道空間上實(shí)現(xiàn),即針對(duì)輸入的C個(gè)通道分別進(jìn)行k×k的卷積,輸出通道數(shù)不變。該過(guò)程的參數(shù)量為k×k×C。第二步是對(duì)上述結(jié)果進(jìn)行逐點(diǎn)卷積(Pointwise Convolution),即1×1的卷積,輸出通道數(shù)為O,則參數(shù)量為1×1×C×O,總參數(shù)量為k×k×C+C×O,過(guò)程如圖2所示。

        圖1 SSD結(jié)構(gòu)

        圖2 深度可分離卷積

        以conv7的輸出特征圖1 024×19×19為例,當(dāng)卷積核為3×3、輸出通道數(shù)512時(shí),可以計(jì)算出深度可分離卷積的參數(shù)量只有普通卷積的參數(shù)量1/9左右。雖然深度可分離卷積的參數(shù)量有所減少,但是仍然能夠保證特征提取信息的質(zhì)量。

        2 MSSD的設(shè)計(jì)

        本文設(shè)計(jì)的MSSD(Modified SSD)模型結(jié)構(gòu)如圖3所示。其中,MDSC表示改進(jìn)的深度可分離卷積模塊,作為特征提取基礎(chǔ)單元,扮演的是原始SSD中額外層的角色。同時(shí),MSSD使用相鄰層特征融合的方式加強(qiáng)了特征的復(fù)用,使得獲取的新特征在信息表達(dá)層面更進(jìn)一步。

        2.1 MDSC模塊

        借鑒深度可分離卷積的思想,本文設(shè)計(jì)了一種改進(jìn)的深度可分離卷積模塊MDSC(Modified Depthwise Separable Convolution),結(jié)構(gòu)如圖4所示。圖4中的3×3表示深度卷積,1×1為逐點(diǎn)卷積,經(jīng)過(guò)批歸一化層(Batch Normalization,BN)和激活層(Rectified Linear Unit,ReLU)后緊跟另一個(gè)深度卷積和逐點(diǎn)卷積。雖然單純的兩次深度可分離卷積對(duì)參數(shù)量的減少有幫助,但不足以提高特征的表達(dá)。為了獲得更多有用的信息,在此基礎(chǔ)上增加兩個(gè)恒等映射連接進(jìn)行兩次信息融合。一次是在兩次深度可分離卷積后,另一次是在最大池化后。

        圖3 MSSD結(jié)構(gòu)

        圖4 MDSC模塊

        特征圖融合一般有兩種方式。第一種是通道合并,待融合特征圖的通道數(shù)可以不同,相當(dāng)于拓寬了特征圖的通道數(shù)。第二種是元素相加,要求合并前特征圖的通道數(shù)相同,合并后特征圖通道數(shù)不發(fā)生改變。本模型所有的融合方式均采用第二種方式。

        2.2 AFF融合方式

        SSD輸出6個(gè)特征圖預(yù)測(cè),相互之間并無(wú)交流。由于眾多模型已經(jīng)證明,不同特征圖之間的有效融合可以在一定程度上提高模型的性能,因此本文也將使用特征融合的方法對(duì)不同輸出層的特征圖進(jìn)行融合,期望得到更豐富的信息。

        較為流行的對(duì)特征融合的處理方式是特征金字塔 FPN[13],如圖 5(a)所示。通過(guò)對(duì)高層特征上采樣、逆向和低層特征融合以及高層語(yǔ)義信息和低層細(xì)節(jié)信息互補(bǔ),得到新的特征輸出,有效地將高低層特征的優(yōu)勢(shì)結(jié)合在一起。考慮到對(duì)于一系列尺寸逐漸減小的特征圖,相鄰尺寸特征圖之間的信息表達(dá)更加接近,相互之間的聯(lián)系更為緊密,因此對(duì)相鄰特征圖進(jìn)行單獨(dú)處理。FPN這種融合方式聯(lián)合了多層特征,在得到融合調(diào)整后不斷進(jìn)行上采樣,會(huì)帶來(lái)較多的冗余信息。因此,本文采用一種新的特征融合方式,即緊鄰特征圖融合(Adjacent Features Fusion,AFF),結(jié)構(gòu)如圖5(b)所示,其中紅色表示上采樣,綠色表示下采樣。第i層特征fi緊鄰上下兩層的特征分別為fi-1和fi+1,將i-1層進(jìn)行下采樣操作D,將i+1層進(jìn)行上采樣操作U,之后和fi融合得到新的特征輸出Fi,即:

        上采樣通過(guò)反卷積實(shí)現(xiàn),下采樣通過(guò)最大池化實(shí)現(xiàn)。所有添加的卷積層后緊跟BN層,達(dá)到加速模型訓(xùn)練和避免過(guò)擬合的目的。待融合特征圖通道數(shù)不同時(shí),則通過(guò)1×1卷積完成變換。

        圖5 兩種特征融合方式

        3 實(shí)驗(yàn)過(guò)程

        本次實(shí)驗(yàn)平臺(tái)為Ubuntu 18。在GPU上加速訓(xùn)練,GPU版本為GTX 1080Ti。深度學(xué)習(xí)框架為Pytorch。模型在PASCAL VOC 2007和VOC 2012訓(xùn)練集上訓(xùn)練,在VOC 2007測(cè)試集上測(cè)試。

        3.1 消融實(shí)驗(yàn)

        首先,訓(xùn)練SSD+MDSC的模型,即利用MDSC替換原始額外層。訓(xùn)練時(shí),設(shè)置batch_size為32,使用隨機(jī)梯度下降優(yōu)化算法,動(dòng)量設(shè)置為0.9。采用預(yù)熱訓(xùn)練策略進(jìn)行500次預(yù)熱訓(xùn)練后,學(xué)習(xí)率從0逐漸增大至0.001,之后開(kāi)始穩(wěn)定訓(xùn)練。隨后在80 000次和100 000次迭代時(shí),學(xué)習(xí)率依次衰減為0.1,共進(jìn)行120 000次訓(xùn)練。它的模型精度為78.3%,提升了1.1%,證明了所采用的MDSC模塊的有效性。

        其次,在SSD+MDSC的基礎(chǔ)上采用AFF融合方式進(jìn)行訓(xùn)練,即對(duì)本文提出的MSSD進(jìn)行訓(xùn)練。學(xué)習(xí)率衰減發(fā)生在90 000次和110 000次??紤]到模型復(fù)雜度的提升,調(diào)整訓(xùn)練次數(shù),共進(jìn)行130 000次訓(xùn)練。實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)去掉3×3特征圖的下采樣,且1×1特征圖不參與融合而獨(dú)立輸出預(yù)測(cè)時(shí),模型的檢測(cè)精度并未受到影響。為了減少模型計(jì)算量,最終采用的模型為去掉3×3下采樣的模型結(jié)構(gòu)??梢园l(fā)現(xiàn),在測(cè)試集上的精度由78.3%增長(zhǎng)至79.1%,性能提升0.8%。

        再次,為驗(yàn)證AFF的有效性,對(duì)特征金字塔融合方式進(jìn)行對(duì)比,即采用SSD+MDSC+FPN的模型進(jìn)行訓(xùn)練。該模型在測(cè)試集上的mAP為78.7%,與AFF的融合方式有0.4%的差距,表明所采用的緊鄰特征圖融合方法更有效。

        最后,對(duì)輸入尺寸為512×512的圖片進(jìn)行訓(xùn)練,batch_size設(shè)置為16,同樣進(jìn)行預(yù)熱訓(xùn)練,學(xué)習(xí)率0.001在90 000次和110 000次時(shí)依次減為原來(lái)的0.1,總計(jì)訓(xùn)練135 000次,測(cè)試集上其mAP達(dá)到81.8%。

        5種模型在VOC 2007測(cè)試集的訓(xùn)練結(jié)果,如表1所示。

        表1 VOC 2007測(cè)試集結(jié)果

        MSSD300和SSD300在各類(lèi)檢測(cè)中的性能對(duì)比,如表2所示。

        表2 MSSD和SSD對(duì)VOC2007測(cè)試集各類(lèi)別目標(biāo)的檢測(cè)精度mAP

        可以看出,除了對(duì)boat和cat兩類(lèi)目標(biāo)的檢測(cè)精度有所下降外,本文提出的MSSD在各個(gè)類(lèi)別目標(biāo)的檢測(cè)精度都有所提升,尤其是對(duì)bottle和plant的檢測(cè)精度,分別提升了7.10%和3.31%。

        MSSD與其他模型的檢測(cè)精度對(duì)比如表3所示。表3中的模型均在VOC 2007和VOC 2012訓(xùn)練集上訓(xùn)練,并且在VOC 2007測(cè)試集上測(cè)試,測(cè)試所采用的backbone也經(jīng)過(guò)預(yù)訓(xùn)練。對(duì)比本文提出的MSSD與SSD的各種代表性變體可以發(fā)現(xiàn),其檢測(cè)精度優(yōu)于SSD的眾多變體,且速度也占有優(yōu)勢(shì)。SSD樣本檢測(cè)結(jié)果如圖6所示,MSSD樣本檢測(cè)結(jié)果如圖7所示。

        表3 各種檢測(cè)模型的檢測(cè)精度對(duì)比

        圖6 SSD樣本檢測(cè)結(jié)果

        圖7 MSSD樣本檢測(cè)結(jié)果

        4 結(jié) 語(yǔ)

        本文提出了一種結(jié)合深度可分離卷積和新型特征融合方法的目標(biāo)檢測(cè)模型MSSD。采用改進(jìn)的深度可分離卷積模塊代替SSD中的部分卷積層,既提高了精度,又在一定程度上節(jié)省了參數(shù),并在此基礎(chǔ)上使用緊鄰特征圖融合的方法對(duì)輸出特征進(jìn)行重復(fù)利用,效果略?xún)?yōu)于特征金字塔式的融合方式。最終得到的改進(jìn)模型MSSD在速度和精度上取得了很好的平衡,其綜合性能優(yōu)于一些SSD的變體。下一步將對(duì)MSSD進(jìn)行優(yōu)化,對(duì)MDSC模塊做進(jìn)一步完善,對(duì)融合過(guò)程的采樣做優(yōu)化處理。

        猜你喜歡
        卷積精度深度
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        深度理解一元一次方程
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        深度觀察
        深度觀察
        深度觀察
        基于DSPIC33F微處理器的采集精度的提高
        電子制作(2018年11期)2018-08-04 03:25:38
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        GPS/GLONASS/BDS組合PPP精度分析
        改進(jìn)的Goldschmidt雙精度浮點(diǎn)除法器
        精品国产一区二区三区2021| 青青手机在线视频观看| 欧美亚洲综合激情在线| 日韩在线视精品在亚洲| 亚洲国产中文字幕九色| 日韩欧美中文字幕公布| 欧美极品少妇无套实战| 亚洲中文av一区二区三区| 一区两区三区视频在线观看| 极品尤物人妻堕落沉沦| 老色鬼在线精品视频| 成熟人妻av无码专区| 国产精品久久这里只有精品| 国产日韩精品视频一区二区三区| 亚洲国产综合久久天堂| 国产深夜男女无套内射| 人妻熟妇乱系列| 北岛玲亚洲一区二区三区| 亚洲av永久无码精品网站| 综合无码一区二区三区| 亚洲香蕉毛片久久网站老妇人| 国产精品又湿又黄九九九久久嫩草| 午夜男女很黄的视频| 欧美激情a∨在线视频播放| 欧美性xxx久久| 色av色婷婷18人妻久久久| 不卡日韩av在线播放| 18成人片黄网站www| 伊人狠狠色j香婷婷综合| 成人大片免费在线观看视频 | 欧美成人久久久| 国产成人自拍视频视频| 亚洲国产精品成人久久| 99精品视频在线观看免费| 蜜桃视频色版在线观看| 精品国产三区在线观看| 中文字幕亚洲综合久久菠萝蜜| 精品一区二区三区在线观看视频| 中文字幕日产人妻久久| 麻豆精品在线视频观看| 日本高清在线一区二区三区|