亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        膠囊網(wǎng)絡(luò)下基于三元損失的圖像相似性學(xué)習(xí)

        2019-04-26 05:59:46潘執(zhí)政魏鵬飛
        關(guān)鍵詞:三元組路由損失

        潘執(zhí)政,楊 旻,魏鵬飛

        (煙臺(tái)大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,山東 煙臺(tái) 264005)

        圖像的檢索、識(shí)別、分類一直是科研和應(yīng)用領(lǐng)域中的重要問題,近年來,基于深度學(xué)習(xí)的方法[1-3]得到了充足的發(fā)展.在這些方法中,圖像相似性的測(cè)度選擇是影響算法性能的關(guān)鍵因素之一.近年來,利用三元組度量圖像的相似性[4-7]在類內(nèi)細(xì)粒度圖像甄別上取得了很好的效果.CHECHILK等[8]提出了一種在線三元稀疏被動(dòng)攻擊的圖像相似性學(xué)習(xí)算法,解決了由于CPU和存儲(chǔ)等限制,圖像語義相似性算法不能擴(kuò)展到大規(guī)模數(shù)據(jù)集等問題.BALNTAS等[9]利用三元組圖像訓(xùn)練得到了局部圖像探測(cè)器,用于尋找與特定圖像相匹配的圖像.

        而另一方面,網(wǎng)絡(luò)的層次與結(jié)構(gòu),尤其是特征提取部分的網(wǎng)絡(luò),對(duì)算法性能起著重要的影響.最近,SABOUR等[10]建立了一種源于生物視覺研究的特征提取網(wǎng)絡(luò)—膠囊網(wǎng)絡(luò)(capsule),其中膠囊是一組神經(jīng)元,表示圖像中存在的特定實(shí)體的各種屬性,其可以是不同類型的實(shí)例化參數(shù),如位置、方向、形變、速度、反射率、色調(diào)、紋理等等,膠囊用實(shí)例化參數(shù)向量的模表示實(shí)例存在概率.通過引入動(dòng)態(tài)路由協(xié)議,避免了重要特征的損失.在實(shí)際應(yīng)用中,應(yīng)用膠囊網(wǎng)絡(luò)都獲得了非常好的表現(xiàn).XI等[11]探索了MNIST手寫字體集和其他圖像集在膠囊網(wǎng)絡(luò)應(yīng)用的差異.ZHAO等[12]針對(duì)膠囊網(wǎng)絡(luò)在文本分類任務(wù)上的應(yīng)用做了深入研究,對(duì)于傳統(tǒng)的分類問題,膠囊網(wǎng)絡(luò)取得了較好性能,在多標(biāo)簽遷移的任務(wù)上,膠囊網(wǎng)絡(luò)的性能超過了卷積神經(jīng)網(wǎng)絡(luò)(CNN)和時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(LSTM).

        根據(jù)目前研究現(xiàn)狀,將膠囊網(wǎng)絡(luò)應(yīng)用于圖像相似性學(xué)習(xí)的工作還未有相關(guān)文獻(xiàn)研究.為此,本文提出了膠囊網(wǎng)絡(luò)下基于三元損失的圖像相似性學(xué)習(xí)方法,構(gòu)建了基于膠囊網(wǎng)絡(luò)的三元損失網(wǎng)絡(luò)結(jié)構(gòu).在此網(wǎng)絡(luò)中,每組三元樣本并行通過膠囊網(wǎng)絡(luò),分別完成特征提取,其結(jié)果匯總后,由三元損失函數(shù)得到該樣本組的損失,通過大量樣本的不斷訓(xùn)練,得到最優(yōu)模型.新方法不僅優(yōu)化了圖像提取質(zhì)量,提升了特征的準(zhǔn)確性,同時(shí)具備了對(duì)細(xì)粒度圖像的高識(shí)別性.本文最后的實(shí)驗(yàn)表明,相比于文獻(xiàn)[7]中基于排序損失函數(shù)的深度學(xué)習(xí)網(wǎng)絡(luò),其準(zhǔn)確率有極大的提高.

        本文結(jié)構(gòu)如下:第1節(jié)給出三元組及損失函數(shù)的定義,膠囊網(wǎng)絡(luò)的結(jié)構(gòu)及符號(hào)說明;第2節(jié),將三元損失與膠囊網(wǎng)絡(luò)有機(jī)結(jié)合在一起,建立了新型的網(wǎng)絡(luò)結(jié)構(gòu);第3節(jié),在人臉數(shù)據(jù)集Labeled Faces in the Wild(LFW)上,進(jìn)行了實(shí)驗(yàn)分析,并與文獻(xiàn)[7]的方法進(jìn)行了結(jié)果對(duì)比.

        1 三元組及膠囊網(wǎng)絡(luò)

        1.1 “三元組” 損失學(xué)習(xí)

        定義了2張圖像p與q的相似度:

        D(f(p),f(q))=‖f(p)-f(q)‖22,

        (1)

        其中f(·)是在歐幾里得空間上將圖像映射到d維的映射函數(shù).D(·)衡量2張圖像相似程度,2張圖像越相似,D(·)越?。芪墨I(xiàn)[4]和[7]啟發(fā),采用“三元組損失”來進(jìn)行模型的度量學(xué)習(xí).一個(gè)三元組包含標(biāo)準(zhǔn)樣本(xa)、正樣本(xp)、負(fù)樣本(xn),目的是保證通過三元組損失的學(xué)習(xí)使得xa和xp之間的距離最小,而和xn之間距離最大.其中xa為訓(xùn)練數(shù)據(jù)集中隨機(jī)選取的一個(gè)樣本,xp為和xa屬于同一類的樣本,而xp則為和xa不同類的樣本.故此有:

        D(f(xa),f(xp))+α<

        D(f(xa),f(xn)),?(xa,xp,xn)∈Ω,

        (2)

        其中α是人為給定的2張圖像相似與不相似的界定標(biāo)準(zhǔn),若取較大的參數(shù)值,則2張圖像不相似程度越大,會(huì)導(dǎo)致較大的損失;Ω是訓(xùn)練集中所有可能的三元組集合,大小為N.

        最小化的損失函數(shù)為L(zhǎng):

        L=∑Ni=1[‖f(xai)-f(xpi)‖22-

        ‖f(xai)-f(xni)‖22+α]+.

        (3)

        其中[]+表示[]內(nèi)的值大于零的時(shí)候,取該值為三元組樣本i的損失,小于零的時(shí)候,該三元組樣本i的損失為零.

        1.2 膠囊網(wǎng)絡(luò)

        膠囊網(wǎng)絡(luò)是為解決卷積神經(jīng)網(wǎng)絡(luò)(CNN)在特征提取中存在的不變性(invariance)問題而提出的.膠囊網(wǎng)絡(luò)和CNN都能夠得到樣本圖像的背景特征圖、輪廓特征圖以及紋理特征圖等等.盡管在CNN中,池化能夠帶來特征不變性(invariance)的效果,也就是當(dāng)樣本內(nèi)容發(fā)生很小的變化或有一些平移和旋轉(zhuǎn),CNN也能夠有效地識(shí)別內(nèi)容,但并不能學(xué)習(xí)到樣本中不同特征間的關(guān)聯(lián)性,且部分信息的丟失會(huì)對(duì)檢索、識(shí)別等結(jié)果產(chǎn)生很大的影響.在生物視覺系統(tǒng)的研究中,發(fā)現(xiàn)大腦皮層中存在大量的柱狀結(jié)構(gòu)(皮層微柱),其內(nèi)部含有上百個(gè)神經(jīng)元,并存在內(nèi)部分層.這就意味著人腦中的一層與神經(jīng)網(wǎng)絡(luò)(NN)的一層并不一樣,而是有著復(fù)雜的內(nèi)部結(jié)構(gòu),由此,文獻(xiàn)[10]提出了對(duì)應(yīng)的結(jié)構(gòu)-膠囊(capsule).

        與CNN不同,膠囊是一組神經(jīng)元,表示圖像中存在的特定實(shí)體的各種屬性,其輸入和輸出都是向量,膠囊的輸出向量長(zhǎng)度表示膠囊所代表的實(shí)體在當(dāng)前的輸入中存在的概率,所以,即使實(shí)體在圖片中的位置或方向發(fā)生了改變,但實(shí)體存在的概率沒有發(fā)生變化.使用一個(gè)非線性的擠壓函數(shù)(squashing)來確保將短的向量長(zhǎng)度壓縮到接近于0,將長(zhǎng)的向量長(zhǎng)度壓縮到略低于1,且方向始終不變,

        vj=‖sj‖21+‖sj‖2·sj‖sj‖,

        (4)

        其中vj是膠囊j的向量輸出,sj是其總輸入.

        除了膠囊體的第一層外的其他層,一個(gè)膠囊的總輸入sj是來自于低一層的膠囊所有“預(yù)測(cè)向量”uj|i的加權(quán)總合,而uj|i是通過用一個(gè)權(quán)重向量wij乘以一個(gè)低一層的膠囊的輸出ui得出的.

        sj=∑icijuj|i,uj|i=wijui,

        (5)

        其中cij是由迭代動(dòng)態(tài)路由過程決定的耦合系數(shù).膠囊i和高一層的所有膠囊j的耦合系數(shù)總和為1,即∑icij=1,并且是由路由softmax決定,該路由softmax初始邏輯bij是對(duì)數(shù)先驗(yàn)概率,即膠囊i與膠囊j的耦合為:

        cij=exp(bij)∑kexp(bik) .

        (6)

        如圖1所示,整個(gè)層級(jí)間的傳播和分配分為2個(gè)部分,第1部分是ui和uj|i的線性組合,第2部分是uj|i和sj的路由過程.底層膠囊u1和u2的輸入是向量,這兩個(gè)膠囊分別與不同的權(quán)重wij相乘得到預(yù)測(cè)向量uj|i,即低維特征到高維特征的概率;然后該預(yù)測(cè)向量和對(duì)應(yīng)的耦合系數(shù)cij相乘,傳入特定的后一層膠囊sj,不同膠囊的輸入sj是所有可能傳入的預(yù)測(cè)向量uj|i和耦合系數(shù)sj的乘積和;最后輸入向量sj通過擠壓函數(shù)(squashing)得到后一層膠囊的輸出向量vj.如果該預(yù)測(cè)向量uj|i與對(duì)應(yīng)的輸出vj之間存在著一個(gè)較大的標(biāo)量積,則會(huì)通過自頂而下的反饋機(jī)制來增加該可能的vj的耦合系數(shù)cij,從而降低其它的耦合系數(shù).這樣做的好處是:增加了當(dāng)前膠囊對(duì)vj的“貢獻(xiàn)”,也提高了當(dāng)前膠囊的預(yù)測(cè)向量與vj的輸出向量之間的標(biāo)量積,這種路由協(xié)議比最大池化法高效得多,最大池化機(jī)制只是激活每一個(gè)映射中的一個(gè)神經(jīng)元,其余的神經(jīng)元進(jìn)行抑制.

        圖1 膠囊層級(jí)結(jié)構(gòu)和動(dòng)態(tài)路由過程

        2 基于膠囊的三元網(wǎng)絡(luò)結(jié)構(gòu)

        本文提出的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,網(wǎng)絡(luò)開始以三元組圖片為輸入,一個(gè)三元組包含標(biāo)準(zhǔn)樣本、正樣本、負(fù)樣本3張圖片,此3張圖片同時(shí)分別輸入相同結(jié)構(gòu)的膠囊網(wǎng)絡(luò)進(jìn)行提取特征,最后將提取的特征輸入到損失層.

        圖2 基于膠囊的三元網(wǎng)絡(luò)結(jié)構(gòu)

        在本網(wǎng)絡(luò)中,原始圖像經(jīng)過處理,由原來的256×256縮放到28×28,以便于減少網(wǎng)絡(luò)的計(jì)算量.在膠囊網(wǎng)絡(luò)中主要包括3個(gè)層,分別為卷積層、初始膠囊層、膠囊層.卷積層是常規(guī)卷積,首先是將28×28像素的圖片通過一個(gè)9×9的卷積核,其通道為256,步長(zhǎng)為1,通過常規(guī)的CNN進(jìn)行卷積,得到特征圖大小為20, 通過一層卷積后得到20×20×256的特征圖,這一層將像素強(qiáng)度轉(zhuǎn)化為局部特征;第2層同樣采用9×9的卷積核,通道為32, 步長(zhǎng)為2的8次不同卷積,每次都得到一個(gè)6×6×8×32的輸出,再把這些輸出在6×6×1×32的第3維上堆疊(concatenate),故得到6×6×8×32的特征圖,特征圖大小為6,其6×6的特征圖上每個(gè)點(diǎn)都是一個(gè)8維的向量;在傳遞到第3層之前,先把6×6×8×32的特征圖重塑成1152×8的矩陣.在第3層需要經(jīng)過迭代路由操作,最后通過擠壓函數(shù)(squashing)得到10×16的矩陣;最后在10個(gè)維度為16的膠囊中,選取模長(zhǎng)最大的向量作為最后的輸出.3張圖像經(jīng)過膠囊得到的特征傳送到損失層.三元損失函數(shù)的目的就是使損失在不斷的訓(xùn)練迭代中越來越小,也就是通過不斷學(xué)習(xí),使得標(biāo)準(zhǔn)樣本與正樣本越來越近,標(biāo)準(zhǔn)樣本與負(fù)樣本越來越遠(yuǎn).

        3 實(shí)驗(yàn)及結(jié)果分析

        本文模型的運(yùn)行環(huán)境:Linux系統(tǒng) ubuntu16.04版本,Python3.6,CPU-i5-7500,GPU-gtx1070,pytorch-0.3.1.使用的數(shù)據(jù)集是Labeled Faces in the Wild(LFW),LFW是無約束自然場(chǎng)景人臉識(shí)別數(shù)據(jù)集,該數(shù)據(jù)集由13 000多張全世界知名人士互聯(lián)網(wǎng)自然場(chǎng)景不同朝向、表情和光照環(huán)境人臉圖片組成,共有5 000多人.

        對(duì)LFW進(jìn)行三元采樣,首先從數(shù)據(jù)集中隨機(jī)選取一張圖像作為標(biāo)準(zhǔn)樣本,再從數(shù)據(jù)集里面另外選取一張同一人的圖像作為正樣本,而負(fù)樣本是隨機(jī)選取一張不是同一人的圖像,以此類推,共選取6 484組三元組作為訓(xùn)練集和1 000組作為測(cè)試集.

        將本文提出的方法與基于排序損失的深度學(xué)習(xí)方法[7]進(jìn)行了實(shí)驗(yàn)比對(duì).epoch是所有訓(xùn)練圖像全部通過網(wǎng)絡(luò)訓(xùn)練的次數(shù);batch是對(duì)三元組進(jìn)行批處理的數(shù)量;acc是在每次epoch后在測(cè)試集上的精確度;loss是每次epoch后在測(cè)試集上損失,α為最小間隔閾值.2種方法的訓(xùn)練集和設(shè)置相同:學(xué)習(xí)率為0.001,α為0.000 8,訓(xùn)練batch為32,測(cè)試batch為32,epoch為100.

        實(shí)驗(yàn)結(jié)果由圖3和圖4給出,其中cap-曲線表示本文提出的方法所對(duì)應(yīng)結(jié)果,tri-曲線表示由基于排序損失函數(shù)的深度學(xué)習(xí)方法[7]得出的結(jié)果.由圖3可知,在初始階段tri-acc雖然高于cap-acc,但隨著模型的不斷訓(xùn)練,后者逐漸高于前者,最終本文精確度達(dá)到99.8%.而在圖4中,cap-loss始終低于tri-loss,本文最終損失為0.015 4. 經(jīng)過實(shí)驗(yàn)對(duì)比可知,基于膠囊網(wǎng)絡(luò)的三元損失新模型優(yōu)于基于排序損失的深度網(wǎng)絡(luò)模型.

        由于α是人為設(shè)定的,α的大小對(duì)模型有一定的影響.當(dāng)α設(shè)置偏小時(shí),會(huì)使得精確率出現(xiàn)很大偏差,損失偏大;當(dāng)α設(shè)置偏大時(shí),會(huì)使得精確率不穩(wěn)定,出現(xiàn)震蕩現(xiàn)象,同時(shí)損失收斂過快.因此,設(shè)置一個(gè)合理的α值很關(guān)鍵,這是衡量相似度的重要指標(biāo).實(shí)驗(yàn)表明,當(dāng)α為0.000 8時(shí),效果最佳.根據(jù)數(shù)據(jù)集和網(wǎng)絡(luò)模型的不同,α也要隨之調(diào)整.

        圖3 準(zhǔn)確率vs epoch

        圖4 損失 vs epoch

        猜你喜歡
        三元組路由損失
        基于語義增強(qiáng)雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
        少問一句,損失千金
        胖胖損失了多少元
        關(guān)于余撓三元組的periodic-模
        玉米抽穗前倒伏怎么辦?怎么減少損失?
        探究路由與環(huán)路的問題
        一般自由碰撞的最大動(dòng)能損失
        PRIME和G3-PLC路由機(jī)制對(duì)比
        三元組輻射場(chǎng)的建模與仿真
        日本一级二级三级不卡| av一区无码不卡毛片| 无码中文字幕av免费放| 亚洲av资源网站手机在线| 熟女不卡精品久久av| 日本美女在线一区二区| 天堂中文а√在线| 卡一卡二卡三无人区| 精品福利视频一区二区三区| 日本精品a在线观看| 男人的av天堂狠狠操| 日韩av一区二区观看| 毛片无码国产| 国模少妇一区二区三区| 久久精品国产丝袜| 欧美破处在线观看| 亚洲综合久久中文字幕专区一区 | 亚洲精品乱码久久久久久蜜桃不卡| 在线免费观看韩国a视频| 精品国产午夜久久久久九九| 精品国产日韩亚洲一区在线| 无码人妻精品一区二区三区夜夜嗨 | 邻居少妇张开腿让我爽视频| 色偷偷激情日本亚洲一区二区| 亚洲免费网站观看视频| 亚洲首页一区任你躁xxxxx| 高清无码精品一区二区三区| 人妻丰满熟妇av一区二区| 日韩人妻久久中文字幕| 亚洲精品一区久久久久一品av| wwww亚洲熟妇久久久久| 亚洲成人日韩| 韩国女主播一区二区三区在线观看| 精品国产一区二区三区性色| 色88久久久久高潮综合影院| 欧美成年黄网站色视频| 无码一区二区三区人| 国产成人自拍视频播放| 亚洲国色天香卡2卡3卡4| 亚洲av无码成人yellow| 风韵丰满妇啪啪区老老熟女杏吧 |