亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        注意力機(jī)制在計(jì)算機(jī)視覺(jué)中的應(yīng)用研究

        2021-04-12 01:44:18沈陽(yáng)理工大學(xué)黃海新劉孝陽(yáng)王瑞鵬
        電子世界 2021年5期
        關(guān)鍵詞:圖像識(shí)別注意力語(yǔ)義

        沈陽(yáng)理工大學(xué) 黃海新 劉孝陽(yáng) 王瑞鵬

        注意力機(jī)制是機(jī)器學(xué)習(xí)領(lǐng)域的主流方法和研究熱點(diǎn)之一,計(jì)算機(jī)視覺(jué)中的注意力機(jī)制旨在讓系統(tǒng)能夠忽略無(wú)關(guān)信息而更多的關(guān)注重點(diǎn)的有效信息,具有參數(shù)少、計(jì)算快、效果好的優(yōu)點(diǎn)。本文先對(duì)注意力的原理進(jìn)行探索,在此基礎(chǔ)上對(duì)一些經(jīng)典的注意力模型和當(dāng)前流行的注意力模型進(jìn)行詳細(xì)地分析討論,最后對(duì)注意力機(jī)制未來(lái)的發(fā)展進(jìn)行了一定的展望。

        注意力機(jī)制是機(jī)器學(xué)習(xí)任務(wù)中一個(gè)基礎(chǔ)性問(wèn)題,按照作用域的不同,可以分為空間域注意力機(jī)制、通道域注意力機(jī)制以及混合域注意力機(jī)制。由于其參數(shù)少、計(jì)算快、效果好三大優(yōu)點(diǎn)而在視覺(jué)任務(wù)的檢測(cè)、分類、分割、行為識(shí)別等方面有著良好的表現(xiàn)。

        1 基于視覺(jué)的注意力模型的研究

        視覺(jué)任務(wù)中,注意力可以是施加在空間域,也可以在通道域,或者是將二者結(jié)合施加在混合域??臻g域的注意力機(jī)制,首先對(duì)輸入特征圖進(jìn)行通道壓縮,然后利用壓縮之后的特征圖進(jìn)行相似度計(jì)算得到自相關(guān)矩陣,將自相關(guān)矩陣歸一化成為[0,1]之間的權(quán)重矩陣后與原特征矩陣相乘。通道域的注意力機(jī)制一般需要對(duì)輸入的特征圖C×H×W進(jìn)行全局池化得到一個(gè)一維向量1×1×C,然后對(duì)這個(gè)一維向量進(jìn)行特征交互,計(jì)算相關(guān)性,最后將交互之后的特征向量進(jìn)行歸一化得到通道權(quán)重向量,將通道權(quán)重向量施加到原特征圖中。混合域的注意力機(jī)制在空間域和通道域都需要做相關(guān)性處理,這種處理方式可以是先空間域后通道域(也可以是先通道域再空間域)的串行處理方式也可以是空間域和通道域并行處理的方式。

        2 主流注意力模型

        注意力按照作用域不同可以分為空間域注意力、通道域注意力、混合域注意力,下文基于這三個(gè)方面對(duì)當(dāng)前流行的一些注意力模型進(jìn)行介紹分析。

        2.1 空間域注意力模型

        空間域注意力機(jī)制主要依靠計(jì)算特征圖中每一個(gè)位置與其他所有位置的相關(guān)性得到注意力權(quán)重。Max Jaderberg等提出Spatial Transformer Networks通過(guò)注意力模型將空間信息進(jìn)行轉(zhuǎn)換實(shí)現(xiàn)對(duì)圖片旋轉(zhuǎn)、縮放變換的功能。XiaolongWang等提出Non-local方法通過(guò)計(jì)算自相關(guān)矩陣捕獲像素值與其他所有像素之間的長(zhǎng)期依賴。

        空間注意力機(jī)制的具體實(shí)現(xiàn)過(guò)程如圖1所示。

        2.2 通道域注意力模型

        通道域的注意力機(jī)制是為了捕獲通道間的依賴關(guān)系,將注意力權(quán)重施加在通道上實(shí)現(xiàn)。Hu Jie等提出SENET通過(guò)建模各個(gè)特征通道之間的依賴關(guān)系,給有效的特征通道施加更大的權(quán)重,忽略無(wú)效的通道;Changqian Yu等為了解決語(yǔ)義分割中類內(nèi)不一致性問(wèn)題,設(shè)計(jì)了一個(gè)平滑網(wǎng)絡(luò),通過(guò)信道注意塊和全局平均池來(lái)選擇更具區(qū)別性的特征。

        圖1 Non-local Neural Networks

        通道域注意力的計(jì)算分為三個(gè)部分:擠壓(squeeze),激勵(lì)(excitation),以及scale(attention),具體計(jì)算過(guò)程如圖2所示:

        圖2 通道域注意力計(jì)算過(guò)程

        圖3 并行混合域注意力機(jī)制

        (1)擠壓(squeeze)部分,對(duì)卷積后的特征圖U做全局平均池化,這一步相當(dāng)于得到所有特征通道的數(shù)值分布;(2)激勵(lì)(excitation)部分,對(duì)各個(gè)特征通道進(jìn)行交互,捕獲通道間的依賴關(guān)系,為每個(gè)特征通道生成權(quán)重;(3)scale(attention)部分,將生成的權(quán)重乘回到原輸入特征圖中。

        2.3 混合域注意力模型

        混合域的注意力模型兼顧空間域和通道域,混合域的注意力模型有很多,主要的區(qū)別在兩個(gè)方面:第一,在空間域注意力和通道域注意力的計(jì)算方式上存在差異;第二,有的注意力采用空間域通道域并行處理的方式,有的采用空間域通道域串行處理的方式Woo Sanghyun等提出Convolutional Block Attention Module,在通道域的處理上,先經(jīng)過(guò)通道壓縮得到一維向量之后對(duì)一維向量進(jìn)行操作,空間上則是將Max Pooling和Average Pooling兩種方式得到的特征圖直接拼接在一起之后進(jìn)行卷積操作;Yue Cao等提出將Non-local與SEnet融合的Global Context(GC)block,實(shí)現(xiàn)一種無(wú)Query依賴的建模方式;Jun Fu等提出Dual Attention Network,分別在通道域和空間域利用non-local的思想,使用自相關(guān)矩陣捕獲長(zhǎng)距離依賴。

        并行處理的混合域注意力和串行處理的混合域注意力的實(shí)現(xiàn)過(guò)程可分別總結(jié)為圖3和圖4所示:

        圖4 串行混合域注意力機(jī)制

        圖3所示為并行處理的混合域注意力機(jī)制,其處理過(guò)程可以總結(jié)為式(1)所示:

        3 注意力機(jī)制在視覺(jué)任務(wù)中的應(yīng)用比較

        3.1 注意力機(jī)制在圖像識(shí)別中的應(yīng)用

        圖像識(shí)別任務(wù)中,以CBAM、SENet等注意力模型為代表,在ImageNet數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表1所示:

        表1 圖像識(shí)別對(duì)比結(jié)果

        從表1得出,在ImageNet數(shù)據(jù)集上進(jìn)行圖像識(shí)別,Backbone為ResNet50的前提下,相較于不增加注意力模塊的ResNet-50,增加注意力模塊之后準(zhǔn)確率有明顯提升,有更好的表現(xiàn),證明了注意力機(jī)制在圖像識(shí)別任務(wù)中的有效性。

        3.2 注意力機(jī)制在語(yǔ)義分割中的應(yīng)用

        圖像語(yǔ)義分割方面,在Cityscapes數(shù)據(jù)集上,采用mIoU作為評(píng)價(jià)標(biāo)準(zhǔn),實(shí)驗(yàn)對(duì)比結(jié)果如表2所示:

        表2 語(yǔ)義分割對(duì)比結(jié)果

        從表2可以看出,Backbone為ResNet50的前提下,相較于沒(méi)有注意力機(jī)制的ResNet50,含有注意力機(jī)制的DANet和CCNet在語(yǔ)義分割任務(wù)中有更高的準(zhǔn)確率,證明注意力機(jī)制在語(yǔ)義分割任務(wù)中的有效性。

        4 總結(jié)

        本文著重研究了注意力機(jī)制的原理、主流注意力機(jī)制的實(shí)現(xiàn)方式、注意力機(jī)制在計(jì)算機(jī)視覺(jué)中的應(yīng)用及其效果對(duì)比。目前的主流空間注意力機(jī)制都是以計(jì)算相關(guān)性矩陣為主,主要的區(qū)別在于相關(guān)性矩陣的計(jì)算;在通道域的注意力機(jī)制則以全局池化或者平均池化為主,從而得到通道上的遠(yuǎn)距離依賴性,這種相關(guān)性可以幫助深度神經(jīng)網(wǎng)絡(luò)擴(kuò)大感受野,捕獲像素之間的依賴關(guān)系。

        這種利用相關(guān)性得到注意力機(jī)制的方式取得了不錯(cuò)的效果,但是還有很大的改進(jìn)空間,比如在計(jì)算方式、參數(shù)的優(yōu)化以及通道注意力和空間注意力的特征之間的融合等方面可以有進(jìn)一步的研究。

        猜你喜歡
        圖像識(shí)別注意力語(yǔ)義
        讓注意力“飛”回來(lái)
        語(yǔ)言與語(yǔ)義
        基于Resnet-50的貓狗圖像識(shí)別
        電子制作(2019年16期)2019-09-27 09:34:50
        高速公路圖像識(shí)別技術(shù)應(yīng)用探討
        圖像識(shí)別在物聯(lián)網(wǎng)上的應(yīng)用
        電子制作(2018年19期)2018-11-14 02:37:04
        圖像識(shí)別在水質(zhì)檢測(cè)中的應(yīng)用
        電子制作(2018年14期)2018-08-21 01:38:16
        “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
        A Beautiful Way Of Looking At Things
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        午夜麻豆视频在线观看| 激情欧美日韩一区二区| 国产人在线成免费视频麻豆| 丝袜美腿爆炒国产在线观看| 97青草超碰久久国内精品91| 人人人妻人人澡人人爽欧美一区| 亚洲av伊人久久综合密臀性色| 国产精品美女黄色av| 亚洲av区一区二区三区| 99re6在线视频精品免费| 最近日本免费观看高清视频| 中文人妻无码一区二区三区| 漂亮人妻被强中文字幕乱码| 欧美国产激情18| 国产男女猛烈视频在线观看| 乱人伦人妻中文字幕无码| av男人的天堂第三区| 亚洲av色香蕉一区二区三区| 中文字幕人妻av一区二区 | 久久夜色精品国产噜噜噜亚洲av| 日日噜噜噜夜夜狠狠久久蜜桃| 日韩av午夜在线观看| 无码一区二区三区老色鬼| 成美女黄网站18禁免费| 日本一区二区免费在线看| 国产成人无码av一区二区| 欧美极品第一页| 久久国产精品懂色av| 色综合久久蜜芽国产精品| 少妇人妻200篇白洁| 无码国产日韩精品一区二区| 成人高清在线播放视频| 男人的天堂无码动漫av| 亚洲国产美女精品久久| 色视频日本一区二区三区| 国产亚洲欧美精品永久| av潮喷大喷水系列无码| 白白色发布在线播放国产| 国产熟女自拍av网站| 欧美一区二区三区视频在线观看| 色综合久久丁香婷婷|