亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于注意力機制的文物圖像顯著性檢測方法

        2023-03-15 03:50:46雷雨晴
        大連民族大學學報 2023年1期
        關鍵詞:文物像素卷積

        雷雨晴,楊 楠,冉 勇,閆 宇

        (1.大連民族大學 a.計算機科學與工程學院;b.大連市漢字計算機字庫設計技術創(chuàng)新中心, 遼寧 大連 116650;2.德江儺堂戲博物館,貴州 銅仁 565200)

        視覺顯著性檢測是通過模擬人類視覺來提取圖像顯著區(qū)域的算法,在圖像重定位、圖像自動裁剪、圖像壓縮和目標識別領域具有重要的應用。1998年Itti等從視覺心理學對人類自下而上的視覺選擇性注意過程進行研究并提出了顯著性檢測模型[1]。顯著性目標檢測方法可分為傳統(tǒng)顯著性檢測方法和基于深度學習的顯著性檢測方法。傳統(tǒng)顯著性檢測方法研究中,Liu等提出將顯著性檢測定義為二元分割問題[2], Zhang L等利用背景和前景區(qū)分,進而構(gòu)建圖層排序的顯著性檢測方法[3], Hou X等通過觀察圖片背景的特征分布和屬性,通過剔除圖像背景信息得到顯著區(qū)域[4]。深度學習的顯著性方法研究中又分為傳統(tǒng)的卷積神經(jīng)網(wǎng)絡方法和完全卷積神經(jīng)網(wǎng)絡方法。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡方法中,Wang L等提出了一種結(jié)合局部估計和全局搜索的顯著性檢測算法[5],Li G等將嵌套窗口中提取的多尺度CNN特征與具有多個完全連接層的深度神經(jīng)網(wǎng)絡結(jié)合將圖像分為三個區(qū)域再對他們進行特征提取而后進行整和[6]。完全卷積神經(jīng)網(wǎng)絡中,Wu R等提出以VGG16作為基礎網(wǎng)絡附加互學習模塊、邊緣模塊和解碼模塊的模型[7],Wang W等通過完整的迭代前饋和反饋策略擴展深度顯著性目標檢測(Salient Object Detection,SOD)模型,使其足夠通用和靈活,涵蓋大多數(shù)其他基于全卷積網(wǎng)絡(Fully Convolutional Network,FCN)的顯著性模型[8], Liu J J等人基于U形結(jié)構(gòu)的模型[9]。

        顯著性檢測在文物圖像縮略圖生成時具有重要作用。在文物系統(tǒng)展示中需要對大量的文物圖像進行剪切顯著性區(qū)域,這些需要大量人工進行。本文通過分析文物圖像的背景屬性和規(guī)律,提出了一種基于注意力機制的文物圖像顯著性檢測方法。

        自2014年以來,深度學習在顯著性檢測方向以其優(yōu)異的性能,證明了其在顯著性檢測方向的可行性。然而,深層網(wǎng)絡在面對如書畫類文物圖像這樣圖像特征多樣化的情況下,現(xiàn)有的深度學習方法很難區(qū)分對象邊界和周圍相似區(qū)域域的像素,因此深層網(wǎng)絡可能會輸出高度模糊且邊界不準確的顯著圖。2017年pinghu等提出了一個深層次的“層次集”(Deep Level Sets)網(wǎng)絡來生成緊湊而統(tǒng)一的顯著性圖,即DLS[10]。DLS模型主要包括基于CNN的VGG16網(wǎng)絡、超像素過濾(GSF)層和重量函數(shù)(HF)三個部分。首先原始圖像通過基于CNN的VGG16網(wǎng)絡,并輸出全分辨率的粗略顯著圖像,于此同時對原始圖像使用gSLICr進行超像素分割,統(tǒng)一輸入到超像素過濾層,最后使用重量函數(shù)將GSF層的輸出轉(zhuǎn)換為最終顯著圖。但作用于文物圖像時會存在不足。

        (1)當文物圖像較為復雜,前景背景差異較小的情況下,基于CNN的VGG16網(wǎng)絡處理得到的粗略顯著圖會過于模糊,即使經(jīng)過與超像素結(jié)果優(yōu)化,得到的效果依舊不好。

        (2)文物圖像中會存在如圖1a這類圖像,圖像邊緣會有邊框?qū)⑵洳糠滞怀?,但對于網(wǎng)絡模型來說只能得出如圖1b的結(jié)果。

        a)邊緣突出類圖像 b)預測結(jié)果 圖1 邊緣突出類圖像及其預測結(jié)果

        2 本文方法

        2.1 DLS模型

        針對上文提到的問題,在DLS的基礎上對其進行修改。

        (1)基于CNN的VGG16網(wǎng)絡部分。首先使用膨脹的卷積層替換了最后三個Max-pooling層,并最后一個完全連接的層更改為卷積層和Sigmoid層,以便網(wǎng)絡獲取RGB圖像224×224。作為輸入并產(chǎn)生56×56。最后,添加沒有學習參數(shù)的上采樣層,以將圖像縮放到全分辨率。

        由于后續(xù)算法中使用了水平集的方法,因此將卷積神經(jīng)網(wǎng)絡輸出的顯著性值線性的轉(zhuǎn)移至[-0.5,0.5]并將其視為水平集。

        (2)超像素過濾(GSF)層部分。在CNN網(wǎng)絡運算的過程中,利用gSLICr將圖像分割為400×500個超像素,而后將其與CNN網(wǎng)絡產(chǎn)生后轉(zhuǎn)換為的水平集一同輸入GSF超像素過濾層。

        (3)重量函數(shù)(HF)部分。由于如果使用簡單的Heaviside函數(shù)作用于零水平集,會陷入局部最小值。為解決這種問題,采用了文獻中提出的近似重載函數(shù)(AHF),該函數(shù)作用于所有的水平曲線并趨向于尋找一個全局最小化器,最終即可得到最終顯著圖。

        其次設定閾值,在最終圖像輸出后對其進行判斷,如大于閾值則在處理后重新輸入網(wǎng)絡。修改后網(wǎng)絡模型如圖2。

        圖2 基于注意力機制的DLS模型

        其中網(wǎng)絡部分是對稱的編解碼器架構(gòu),編碼器組件基于ResNet-50來提取多級特征,編碼器結(jié)構(gòu)與解碼器結(jié)構(gòu)一一對應。A模型為注意力機制模塊[11],D模塊為自制的判別模塊,C模塊為圖像像素改變模塊。

        2.2 注意力機制模塊

        注意力機制是通過算法模擬生物觀察這一行為,將內(nèi)部經(jīng)驗和外部感覺融合,增加部分區(qū)域觀察仔細度的一個機制。而自注意力機制是在注意力機制的基礎上做出改進,可有效的減少對外部信息的依賴,與注意力機制相比,自注意力機制更擅長捕捉特征或數(shù)據(jù)的內(nèi)部相關性。

        在未引入自注意力機制之前,大多數(shù)用于圖像處理的模型都是用卷積操作堆疊起來的。但這存在一個明顯的問題,卷積運算僅僅關注整個圖像的局部區(qū)域,因此通過使用卷積層來建模圖像中的依存關系是無效的或效果不明顯的。而這導致了一個后果,對于多類別的數(shù)據(jù)集,哪怕是最新的生成模型,都難以捕捉某些類別中經(jīng)常出現(xiàn)的幾何或結(jié)構(gòu)模式。為了解決這些問題,通常在網(wǎng)絡中引入自注意力機制來緩解這一難題。

        在卷積神經(jīng)網(wǎng)絡中,每張圖片初始會由RGB三通道表示出來,之后經(jīng)過不同的卷積核之后,每一個通道又會生成新的信號,比如圖片特征的每個通道使用64核卷積,就會產(chǎn)生64個新通道的矩陣(H,W, 64),其中H,W分別表示圖片特征的高度和寬度每個通道的特征其實就表示該圖片在不同卷積核上的分量,類似于時頻變換,而這里面用卷積核的卷積類似于信號做了傅里葉變換,從而能夠?qū)⑦@個特征一個通道的信息給分解成64個卷積核上的信號分量。

        既然每個信號都可以被分解成核函數(shù)上的分量,產(chǎn)生的新的64個通道對于關鍵信息的貢獻肯定有多有少,如果我們給每個通道上的信號都增加一個權(quán)重,來代表該通道與關鍵信息的相關度的話,這個權(quán)重越大,則表示相關度越高,也就是我們越需要去注意的通道了。

        模塊的具體結(jié)構(gòu)如圖3。原始圖像通過編譯器,產(chǎn)生了新的特征信號U。U有C個通道,我們希望通過注意力模塊來學習出每個通道的權(quán)重,從而產(chǎn)生通道域的注意力。該注意力機制主要分成三個部分:擠壓(squeeze),激勵(excitation),以及注意(attention)。

        圖3 模塊具體結(jié)構(gòu)圖

        2.3 判別模塊

        當文物圖片有邊框突出的情況,進行顯著性檢測會將其突出部分視作顯著區(qū)域,因此對于網(wǎng)絡輸出的顯著圖S,置顯著圖S中顯著點個數(shù)為nums,總像素個數(shù)numall,這樣網(wǎng)絡輸出顯著圖的顯著率rr為

        (1)

        根據(jù)數(shù)據(jù)集標注人員對數(shù)據(jù)集圖像的判斷,最終決定設置閾值T="80%" ,如果顯著率rr大于閾值T,則會將顯著圖S輸入圖像像素改變模塊。

        2.4 圖像像素改變模塊

        該模塊主要接收判別模塊傳入的顯著率過大的顯著圖,在接收后會按照圖像寬高比例,去除圖像邊緣區(qū)域,直到得到的矩陣均為如圖1b圖中白色的區(qū)域。而后記錄裁切位置,將裁切后的圖像重新輸入至模型,直至生成的顯著圖的顯著率小于閾值,按照裁切的位置重新生成新的顯著圖像,過程與結(jié)果如圖4。

        a)裁剪后圖像 b)最終結(jié)果圖4 邊緣突出類圖像及其預測結(jié)果

        3 實驗結(jié)果與分析

        采用人手工標注的方法制作逐像素標注圖像,對于陶瓷、雕塑和青銅器具等物品展示類的文物圖,顯著目標區(qū)域通常為一個很明顯的區(qū)域,對于這部分的文物圖的標注通常是沒有爭議的,可以由一個人完成。而對于復雜的書畫類文物圖像,顯著目標通常并不明顯,因此該類文物標注由三個人分別完成,標注后采取少數(shù)服從多數(shù)的原則,最終決定圖像的標注區(qū)域。這兩類的文物圖的標注結(jié)果如圖5。

        a)物品展示類圖像 b)書畫類圖像圖5 物品展示類和書畫類圖像

        3.1 評估方法

        與其他顯著性檢測論文相同,本文主要使用定性分析和定量分析的以下三種數(shù)值比較方法,對所提到的文物顯著區(qū)域檢測算法進行評估:準確率(Precision)和召回率(Recall)構(gòu)成的PR曲線、真正率(True Positive Rate)和假正率(False Positive Rate)構(gòu)成的ROC曲線以及F值柱狀圖。

        3.2 性能評估

        本文從定性和定量兩方面對比傳統(tǒng)顯著性檢測算法與深度學習模型,包含的傳統(tǒng)方法有LC算法[12]和SBM算法[13],DLS模型[10]和SCRN模型[14]。

        (1)定性分析。對上述對比模型和本模型分別在上述文物數(shù)據(jù)集上進行訓練,并選取各類型圖像,在多種模型檢測方法內(nèi)得到的對比結(jié)果如圖6。

        從圖6中前四幅圖的對比結(jié)果可以看出深度學習的算法要優(yōu)于傳統(tǒng)算法,但是在最后一幅圖這樣有存在明顯邊框的圖像中基于深度學習的算法會將邊框突出部分認為顯著區(qū)域,而不會像傳統(tǒng)方法那樣依次計算每個像素點的顯著值。從以上對比可以看出,在手工標注的圖像顯著區(qū)域數(shù)據(jù)集中,相較于其他方法,本文提出的方法能夠更好的檢測出圖像顯著區(qū)域。

        (2)定量分析。為上述方法在手工標注的文物圖像顯著性數(shù)據(jù)集的準確率和召回率構(gòu)成的P-R曲線如圖7。P-R曲線就是精確率precision vs召回率recall曲線,以recall作為橫坐標軸,precision作為縱坐標軸??梢院侠淼脑u估檢測算法在輸入圖像上的運行效果,是計算機視覺領域中最常用的評估方法。準確率是指顯著性算法正確檢測出來的顯著性像素的總數(shù)與檢測到的像素總數(shù)的比率;召回率是指正確檢測出來的顯著性像素個數(shù)占標準集中顯著性像素總數(shù)的比率。

        圖6 文物圖像數(shù)據(jù)對比結(jié)果

        圖7 P-R曲線

        真正值率和假正值率構(gòu)成的ROC曲線如圖8。ROC曲線的全稱是ReceiverOperating Chara-cteristic Curve,中文名字叫“受試者工作特征曲線”,和PR曲線皆為類別不平衡問題中常用的評估方法,二者既有相同也有不同點。ROC曲線常用于二分類問題中的模型比較,主要表現(xiàn)為一種真正例率 (TPR) 和假正例率 (FPR) 的權(quán)衡。其中,真正類率(True Postive Rate)代表分類器預測的正類中實際正實例占所有正實例的比例,負正類率(False Postive Rate)代表分類器預測的正類中實際負實例占所有負實例的比例。

        F值柱狀圖如圖9。對于一個性能優(yōu)越的檢測算法來說,應該同時具備良好的準確率和召回率。但在實際情況中,通常是準確率的提高就意味著召回率的下降,反之亦然。綜合了P和R的結(jié)果,而當F較高時則能說明試驗方法比較有效,見表1。

        圖8 ROC曲線

        圖9 F值柱狀圖

        表1 對比結(jié)果

        4 總 結(jié)

        本文詳細的介紹了基于視覺顯著性的文物顯著區(qū)域提取方法。根據(jù)DLS顯著性檢測模型在文物數(shù)據(jù)集中存在的問題,對DLS模型部分功能進行修改,使其在上文中的文物數(shù)據(jù)集進行訓練并與現(xiàn)有比較經(jīng)典的視覺顯著性檢測算法結(jié)果進行比較。實驗結(jié)果表明:本文提出的檢測方法對于圖像顯著性區(qū)域的檢測非常有效。

        猜你喜歡
        文物像素卷積
        趙運哲作品
        藝術家(2023年8期)2023-11-02 02:05:28
        文物的棲息之地
        金橋(2022年6期)2022-06-20 01:35:46
        像素前線之“幻影”2000
        基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
        文物的逝去
        東方考古(2019年0期)2019-11-16 00:46:08
        文物超有料
        “像素”仙人掌
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標跟蹤算法
        高像素不是全部
        CHIP新電腦(2016年3期)2016-03-10 14:22:03
        久久精品视频按摩| 帮老师解开蕾丝奶罩吸乳视频| 亚洲欧美日韩综合久久| 老熟女熟妇嗷嗷叫91| 久久开心婷婷综合中文| 日本xxxx色视频在线观看| 俄罗斯老熟妇色xxxx| 精品国产免费久久久久久| 日本高清色一区二区三区| 亚洲av无码国产精品色午夜软件| 久久亚洲国产成人精品性色 | av成人资源在线播放| 美女午夜福利视频网址| 成人无码α片在线观看不卡| 国产99re在线观看只有精品| 丰满人妻被猛烈进入中文字幕护士| 亚洲天堂成人av在线观看| 欧美a级情欲片在线观看免费| 亚洲中文欧美日韩在线人| 亚洲一区二区三区在线激情| 婷婷五月深深久久精品| 无码人妻少妇色欲av一区二区 | 女人被躁到高潮嗷嗷叫免费软| 亚洲精品久久蜜桃av| 免费人成视频x8x8入口| 国产三级欧美| 亚洲精品国产二区在线观看| 国产欧美日韩一区二区加勒比| 国产成人麻豆精品午夜福利在线| 98精品国产高清在线xxxx| 亚洲sm另类一区二区三区| 玩50岁四川熟女大白屁股直播 | 日韩极品视频在线观看免费| 华人在线视频精品在线| 亚洲国色天香卡2卡3卡4| 欧美 亚洲 国产 日韩 综AⅤ| 亚洲精品国产av成拍色拍| 国产专区一线二线三线码| 99国产精品99久久久久久| 免费av网址一区二区| 强奸乱伦影音先锋|