亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于遷移子空間的半監(jiān)督領(lǐng)域自適應(yīng)方法

        2021-08-23 04:11:56林飛鵬
        計算機工程與設(shè)計 2021年8期
        關(guān)鍵詞:分類實驗

        陶 洋,楊 雯,翁 善,林飛鵬

        (重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)

        0 引 言

        在實際應(yīng)用中,傳統(tǒng)機器學(xué)習(xí)算法面臨著缺乏標(biāo)簽樣本的困境。近年來,遷移學(xué)習(xí)和領(lǐng)域自適應(yīng)方法得到廣泛研究,這類方法將源域(訓(xùn)練集)豐富的知識遷移到目標(biāo)域(測試集)來解決缺乏標(biāo)簽問題[1-3]?;谔卣鞅磉_的領(lǐng)域適配方法通過原始空間或投影空間中的特征表示實現(xiàn)源域和目標(biāo)域之間的對齊[4-6]。Zhang等[7]提出了隱稀疏域遷移模型,在域之間聯(lián)合學(xué)習(xí)稀疏編碼和最優(yōu)子空間,挖掘子空間中源域和目標(biāo)域共有的隱藏結(jié)構(gòu)。B.Sun等[8]提出子空間分布對齊法,在子空間對齊的基礎(chǔ)上增加了概率分布自適應(yīng),對源域和目標(biāo)域進行二階特征變換,實現(xiàn)源域和目標(biāo)域數(shù)據(jù)對齊。然而這些方法都沒有很好地利用樣本的標(biāo)簽信息提高分類性能,因此一些方法結(jié)合了分類器設(shè)計和特征表示算法的優(yōu)點,利用了樣本的標(biāo)簽信息增強了模型的判別性[9-11],還有一些方法利用樣本標(biāo)簽,挖掘了重構(gòu)矩陣所包含的樣本之間的類內(nèi)與類間信息,提高模型的分類性能[12]。本文中,主要研究了基于特征表示的領(lǐng)域自適應(yīng),并提出了基于遷移子空間的半監(jiān)督領(lǐng)域自適應(yīng)方法(semi-supervised domain adaptation via transfer subspace,SSDTS)。該方法利用類別標(biāo)簽先驗信息,進一步分析同類樣本之間的相似性和異類樣本之間的差異性,得到鑒別性共享子空間和具有塊對角結(jié)構(gòu)的類重構(gòu)矩陣,最終提高模型的分類性能。

        1 相關(guān)理論

        1.1 子空間學(xué)習(xí)

        子空間學(xué)習(xí)(subspace learning,SL)是基于某一特定準(zhǔn)則,將原始高維的樣本變換到低維、有意義的子空間中,其目的是為了找出數(shù)據(jù)的內(nèi)在結(jié)構(gòu)[13,14],得到能反映原始樣本分類本質(zhì)的低維特征。子空間學(xué)習(xí)的任務(wù)有兩個,一是尋找針對模式最具鑒別性的描述,用較低維度的特征描述原始樣本并保留分類所需的鑒別信息。二是原始數(shù)據(jù)進行維度約減后,能減少后續(xù)運算的計算量,提高運算速度。

        1.2 稀疏表示和低秩表示

        子空間學(xué)習(xí)方法中的兩大重要理論包括稀疏表示(sparse representation,SR)和低秩表示(low-rank representation,LRR)。其中稀疏問題來自域信號處理領(lǐng)域的壓縮感知(compressive sensing,CS)。稀疏性是指為了更好地對復(fù)雜的多維圖像進行描述,可以將圖像信號看成是由適當(dāng)選取的一組過完備基中少數(shù)幾個基的線性組合,即用最少基的線性組合來表達圖像信號,得到信號在這組基上的稀疏表示。稀疏表示能從大量樣本中發(fā)掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu),具有良好的自適應(yīng)性和鑒別性,然而其在求解過程中缺乏對整體樣本結(jié)構(gòu)的全局約束,因此難以有效發(fā)掘樣本的全局結(jié)構(gòu)。矩陣的稀疏性可以通過秩來度量,具有很強的全局約束。低秩表示系數(shù)矩陣可以增強對噪聲的抵抗能力。當(dāng)數(shù)據(jù)來自多個獨立子空間時,低秩表示能夠準(zhǔn)確發(fā)現(xiàn)數(shù)據(jù)本身蘊含的多子空間結(jié)構(gòu)。此時獲得的低秩表示系數(shù)矩陣會呈現(xiàn)塊對角形式,每個塊對應(yīng)每個子空間。

        2 基于遷移子空間的半監(jiān)督領(lǐng)域自適應(yīng)方法

        2.1 方法概述

        圖1 SSDTS算法整體框架

        2.2 問題建模

        遷移子空間學(xué)習(xí)的目標(biāo)是找到一個投影矩陣,通過投影矩陣將源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)投影到共享子空間,在子空間中源域和目標(biāo)域樣本分布大致相同。本文提出的方法假設(shè)在共享子空間中目標(biāo)域數(shù)據(jù)可以由源域數(shù)據(jù)線性重構(gòu),可形式化的表示為

        (1)

        其中,φ(·)是原始特征空間到再生希爾伯特空間的非線性映射,P是投影矩陣,Z是重構(gòu)矩陣。稀疏表示是局部約束,能夠發(fā)現(xiàn)數(shù)據(jù)間的局部線性關(guān)系,對重構(gòu)矩陣Z施加稀疏約束,不僅可以保留數(shù)據(jù)的局部結(jié)構(gòu),而且使每個目標(biāo)域樣本可以被少量源域樣本更好地重構(gòu)。低秩性不僅有利于揭示塊對角結(jié)構(gòu),還能夠保留數(shù)據(jù)的全局結(jié)構(gòu)。對重構(gòu)矩陣Z施加低秩約束使矩陣具有塊對角結(jié)構(gòu),獲得源域樣本和目標(biāo)域樣本的一致表示,使源域樣本和目標(biāo)域樣本在共享子空間中可以很好地對齊。對重構(gòu)矩陣Z同時施加稀疏和低秩約束后可得

        (2)

        (3)

        (4)

        (5)

        利用樣本的先驗類別信息,將嚴格的二值標(biāo)簽矩陣松弛為變量矩陣,增大投影后不同類樣本之間的距離,挖掘樣本內(nèi)蘊含的鑒別信息,加強投影后子空間中樣本的判別性,以此提高分類性能。式(5)可以表示為

        (6)

        圖嵌入方法能夠保證相同類的樣本在轉(zhuǎn)換后能緊密地聚集在一起,避免過擬合。引入了類緊致圖(class compactness graph,CCG)作為正則項。在類緊致圖中,同一個類的兩個不同樣本通過無向邊連接,因此類緊致圖的權(quán)重定義為

        (7)

        其中,σ表示核參數(shù),可以通過下式(8)使得轉(zhuǎn)換后的同類樣本緊密聚集在一起

        (8)

        其中,fi=xiP表示轉(zhuǎn)換后的第i個訓(xùn)練樣本xi,L表示拉普拉斯圖,定義為L=D-W,D為對角矩陣,對角元素為Dij=∑jWij。聯(lián)合式(6)和式(8),最終定義的目標(biāo)函數(shù)如下

        (9)

        2.3 模型優(yōu)化求解

        (10)

        其中,k(·)是核函數(shù),滿足條件k(xi,xj)=〈φ(xi),φ(xj)〉=φ(xi)Tφ(xj)。令K=φ(X)Tφ(X),Ks=φ(X)Tφ(Xs)和Kt=φ(X)Tφ(Xt)表示核格列姆矩陣。通常最優(yōu)投影矩陣P可以直觀地表示為φ(X)的線性組合,即P=φ(X)Φ。將其代入到式(10)中,可以得到

        (11)

        為了求解式(11),采取了變量交替優(yōu)化策略,即固定其它變量來迭代更新每個變量。通過對重構(gòu)矩陣Z引入兩個輔助變量J和T,將引入新輔助變量的最小化問題重新寫成

        (12)

        通過增強的拉格朗日乘數(shù)(augmented lagrange multiplier,ALM),上述式(12)可以轉(zhuǎn)換為以下最小化問題

        (13)

        其中,Y1和Y2是拉格朗日乘子,μ>0是懲罰參數(shù)。上述式(13)問題可以通過不精確拉格朗日法(inexact augmented lagrange multiplier,IALM)解決,具體步驟如下所示:

        步驟1更新Φ,固定變量Z,J,T和N,解決優(yōu)化式(14)來更新Φ

        (14)

        (15)

        其中,式(15)中的A=Y+B⊙M。

        步驟2更新J,去掉與J無關(guān)的項后,式(13)可以重新寫成下列形式

        (16)

        式(16)可以進一步寫成下列形式

        (17)

        通過奇異值閾值(SVT)算子可以有效地解決式(17)。

        步驟3更新T,去掉與T無關(guān)的項后,式(13)可以重新寫成下列形式

        (18)

        式(18)可以進一步寫成下列形式

        (19)

        利用收縮算子對式(19)求解,結(jié)果如下所示

        (20)

        步驟4更新Z,去掉與Z無關(guān)的項后,式(13)可以重新寫成式(21)形式

        (21)

        通過式(21)很難得到Z的封閉解,根據(jù)梯度下降算子,可以得到解ZK+1的表達式

        (22)

        其中,Z的導(dǎo)數(shù)可以表示為式(23)

        (23)

        步驟5更新N,可以通過解決式(24)問題更新N

        (24)

        令ΦTK-Y=I,考慮N的第(i,j)項Nij,可以得到下式

        (25)

        Nij的最優(yōu)解是

        Nij=max(IijHij,0)

        (26)

        因此,N的最優(yōu)解也可以改寫為

        N=max(I⊙H,0)

        (27)

        表1中詳細總結(jié)了所提算法的迭代優(yōu)化過程。

        表1 SSDTS算法迭代流程

        3 實驗驗證與結(jié)果分析

        本文使用的基準(zhǔn)數(shù)據(jù)集分別是:Office、Caltech256、COIL、MNIST和USPS數(shù)據(jù)集。為了驗證本論文提出算法的性能,在上述基準(zhǔn)數(shù)據(jù)集上進行實驗,并與多個相關(guān)的經(jīng)典領(lǐng)域自適應(yīng)算法,即SGF、GFK、JDA、LTSL、SA、LSDT、CORAL、LRSR算法進行對比。本文提出的SSDTS算法選擇K-最近鄰分類器作為分類器。由于SSDTS算法是半監(jiān)督遷移學(xué)習(xí)算法,目標(biāo)域中存在部分標(biāo)簽,故使用源域樣本與少量有標(biāo)簽?zāi)繕?biāo)域樣本訓(xùn)練分類器,然后使用無標(biāo)簽?zāi)繕?biāo)域樣本測試分類效果。文中所有實驗均重復(fù)了20次,最后記錄平均分類正確率。

        3.1 數(shù)據(jù)集介紹

        Office數(shù)據(jù)集是可視化領(lǐng)域適配的基準(zhǔn)數(shù)據(jù),該數(shù)據(jù)集包括了來自亞馬遜(Amazon)、數(shù)碼單反(DSLR)和網(wǎng)絡(luò)攝像頭(Webcam)3個域中的常見對象類別。在Office數(shù)據(jù)集中,每個域包含31個不同的對象,共有4652張圖像。Caltech256數(shù)據(jù)集包含了256個類別,共有30 607幅圖像。Office和Caltech數(shù)據(jù)集的部分圖像樣例如圖2所示。將Amazon用符號A表示,DSLR用符號D表示,Webcam用符號W表示,Caltech256用符號C表示,利用這4個域中共有的10個類別進行實驗。任意選取兩個域作為源域和目標(biāo)域進行實驗,一共可以得到12組相關(guān)實驗。根據(jù)文獻[12]中的設(shè)置,實驗中,當(dāng)Amazon作為源域時,則從每類中隨機選擇20個樣本作為源域數(shù)據(jù)集,如果是DSLR、Webcam和Caltech256作為源域,則從每類中隨機選擇8個樣本作為源域數(shù)據(jù)集。當(dāng)4個域的樣本作為目標(biāo)域時,從每類中隨機選擇3個樣本作為目標(biāo)域數(shù)據(jù)集,剩下的作為測試數(shù)據(jù)集。對于Office和Caltech256數(shù)據(jù)集采用SURF特征和DeCAF6兩種特征進行實驗。

        圖2 Office和Caltech256數(shù)據(jù)集圖像樣例

        USPS和MNIST數(shù)據(jù)集都包含10個類,分別是數(shù)字0-9,兩個數(shù)據(jù)集的部分樣例如圖3所示。USPS數(shù)據(jù)集中,包含訓(xùn)練圖像7291張和測試圖像2007張,共有9298張圖像。MNIST數(shù)據(jù)集中,包含60 000張訓(xùn)練圖像和10 000張測試圖像,共有70 000張圖像。在實驗中,從兩個數(shù)據(jù)集中隨機選擇10 000張圖像分別作為實驗中的源域和目標(biāo)域,一共可以得到2組相關(guān)實驗。當(dāng)USPS和MNIST數(shù)據(jù)集作為源域時,則從每類中隨機抽取100個樣本作為源域數(shù)據(jù)集,當(dāng)USPS和MNIST數(shù)據(jù)集作為目標(biāo)域時,從每類中隨機抽取10個樣本,共100個樣本作為目標(biāo)域數(shù)據(jù)集,其余未抽取樣本作為測試數(shù)據(jù)集。

        圖3 USPS和MNIST數(shù)據(jù)集樣例

        COIL-20數(shù)據(jù)集包含了20類對象,共1440張圖片。該數(shù)據(jù)集中的部分樣例如圖4所示。

        圖4 COIL數(shù)據(jù)集樣例

        在本次實驗中,數(shù)據(jù)集被劃分為兩個子集C1和C2,兩個子集各有720張圖像。將C1和C2交替作為源域和目標(biāo)域可以得到2組實驗。當(dāng)C1和C2子集作為源域時,選取子集中的所有樣本作為源域數(shù)據(jù)集,當(dāng)C1和C2子集作為目標(biāo)域時,從所有類別的樣本中隨機抽取270個樣本作為目標(biāo)域數(shù)據(jù)集,剩余未抽取樣本作為測試數(shù)據(jù)集。

        3.2 實驗結(jié)果對比

        在Office+Caltech256(SURF)數(shù)據(jù)集上進行分類實驗的結(jié)果具體見表2,在Office-Caltech256(DeCAF6)數(shù)據(jù)集上進行分類實驗的結(jié)果見表3,在USPS和MNIST數(shù)據(jù)集上進行分類實驗的結(jié)果見表4,在COIL數(shù)據(jù)集上進行分類實驗的結(jié)果見表5。下面4個表中部分實驗結(jié)果引自文獻[12]和文獻[15],粗體數(shù)字為每個任務(wù)的最優(yōu)分類結(jié)果。

        表2 在Office+Caltech256數(shù)據(jù)集(SURF)上的分類結(jié)果

        綜合以上各組實驗結(jié)果可以看出,SSDTS算法在上述4個數(shù)據(jù)集共28個任務(wù)中,有21個任務(wù)的分類正確率超過了其它對比算法。除了Office-Caltech256數(shù)據(jù)集(SURF),SSDTS算法在其余的數(shù)據(jù)集中各任務(wù)的平均分類正確率均超過了其它算法,驗證了在對齊領(lǐng)域總體分布時考慮樣本的先驗類別信息有利于提高分類正確率。

        如表4所示,在USPS和MNIST數(shù)據(jù)集上,任務(wù)“M->U”的分類準(zhǔn)確率都不同程度高于任務(wù)“U->M”,這是因為MNIST數(shù)據(jù)集規(guī)模大于USPS數(shù)據(jù)集,提供的分類信息更加充足。如表5所示,在COIL數(shù)據(jù)集中的兩個任務(wù)都取得了最優(yōu)分類結(jié)果,平均分類準(zhǔn)確率達到了94.3%,比最優(yōu)對比方法LRSR提高了2.6%。如表3和表4所示,在(DeCAF6)Office-Caltech256數(shù)據(jù)集、USPS和MNIST數(shù)據(jù)集上的任務(wù)中,SSDTS算法的分類準(zhǔn)確率均高于LRSR算法,這表明利用樣本類標(biāo)簽,逐類考慮同類樣本的相似性和異類樣本的差異性,挖掘重構(gòu)矩陣中所蘊含的判別信息的有效性。

        表3 在Office+Caltech256數(shù)據(jù)集(DeCAF6)上的分類結(jié)果

        表4 在USPS和MNIST數(shù)據(jù)集上的分類結(jié)果

        表5 在COIL數(shù)據(jù)集上的分類結(jié)果

        3.3 重構(gòu)矩陣可視化

        引入樣本的類標(biāo)簽信息,獲得具有塊對角結(jié)構(gòu)的類重構(gòu)矩陣,可以進一步挖掘樣本中蘊含的鑒別信息,揭示同類樣本之間的相似性和不同類樣本之間的差異性,有助于提高分類性能。如圖5所示,在Office-Caltech256(DeCAF6)數(shù)據(jù)集的實驗中,對重構(gòu)矩陣Z進行可視化,可以看到重構(gòu)矩陣Z呈現(xiàn)出塊對角結(jié)構(gòu),也就是說目標(biāo)數(shù)據(jù)中的第c類樣本可以很好地由同類的源域數(shù)據(jù)線性表示。

        圖5 重構(gòu)矩陣可視化

        3.4 參數(shù)敏感性分析

        如式(10)所示,SSDTS算法模型有λ1和λ2兩個參數(shù)。為了驗證參數(shù)的有效性,本節(jié)實驗測試了λ1和λ2兩個參數(shù)不同值的組合下對SSDTS算法性能的影響。在Office-Caltech256(DeCAF6)數(shù)據(jù)集的A->D任務(wù)和USPS-MNIST數(shù)據(jù)集的M->U任務(wù)上進行實驗。參數(shù)λ1和λ2的取值范圍設(shè)置為{10-3,10-2,10-1,1,101,102}。不同參數(shù)組合對分類正確率的影響如圖6所示??梢钥闯觯煌姆诸惾蝿?wù)中對于參數(shù)λ1、λ2取值的敏感度不同。在A->D任務(wù)中,當(dāng)參數(shù)λ1=0.01,λ2=0.1時,得到最大分類準(zhǔn)確率,在M->U任務(wù)中,當(dāng)參數(shù)λ1=100,λ2=10時,得到最大分類準(zhǔn)確率。表明在不同跨域任務(wù)中,相同類之間的類內(nèi)依賴和不同類之間的類間獨立并不是同等重要。

        圖6 重構(gòu)矩陣可視化

        3.5 算法運行時間對比

        本節(jié)對比了SSDTS算法與GFK、JDA、LSDT和LTSL算法的運行時間。所有的測試都在一臺CPU為Intel 1.8 Ghz雙核處理器、內(nèi)存為8 GB的計算機上完成,軟件平臺選定為MATLAB R2018b。本節(jié)實驗在Office-Caltech256(DeCAF6)數(shù)據(jù)集的W->D任務(wù)和COIL數(shù)據(jù)集的C1->C2任務(wù)上進行實驗,各個算法的執(zhí)行時間見表6。其中LSDT算法的運行時間最短,其次是SSDTS算法。LTSL算法的運行時間最長,這是因為該算法的收斂速度相較于其它算法較慢。

        表6 算法運算時間對比/s

        4 結(jié)束語

        針對領(lǐng)域自適應(yīng)在跨領(lǐng)域圖像識別中存在領(lǐng)域偏差、數(shù)據(jù)特征分布不一致的問題,本文提出了一種基于遷移子空間的半監(jiān)督領(lǐng)域自適應(yīng)方法(SSDTS),通過投影矩陣將源域樣本和目標(biāo)域樣本投影到低維共享子空間中,使得目標(biāo)域樣本被同類別源域樣本線性重構(gòu),從而減少源域和目標(biāo)域之間的差異。此外,為充分發(fā)掘同類樣本之間的相似性和異類樣本之間的差異性,利用樣本的標(biāo)簽信息,得到具有塊對角結(jié)構(gòu)的類重構(gòu)矩陣。不同于現(xiàn)有的遷移子空間算法,SSDTS模型能夠充分發(fā)掘和利用領(lǐng)域間共享標(biāo)簽先驗知識,同時考慮子空間的判別性以及重構(gòu)矩陣蘊含的判別信息。在4個領(lǐng)域自適應(yīng)公開數(shù)據(jù)集(COIL、USPS-MNIST、Office-Caltech-SURF、Office-Caltech-DeCAF6)上進行實驗,結(jié)果表明SSDTS算法優(yōu)于現(xiàn)有大多數(shù)方法。

        猜你喜歡
        分類實驗
        記一次有趣的實驗
        微型實驗里看“燃燒”
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        做個怪怪長實驗
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        NO與NO2相互轉(zhuǎn)化實驗的改進
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        国产做无码视频在线观看浪潮| 久久久国产精品粉嫩av| 亚洲精品国产第一区三区| 产美女被爽到高潮免费a| 日日噜噜夜夜狠狠va视频| 免费中文熟妇在线影片| 久久久精品波多野结衣| 亚洲av无码成人网站www| 国产三级视频一区二区| 青青草手机在线免费观看视频| 国产永久免费高清在线| 男人扒开女人双腿猛进女人机机里 | 欧美熟妇精品一区二区三区| 91精品国产91久久综合桃花| 国产丝袜一区丝袜高跟美腿| 国产成人综合美国十次| 国产精品成人久久电影| 国产mv在线天堂mv免费观看| 亚洲Va中文字幕久久无码一区| 国产爆乳美女娇喘呻吟久久| av免费在线播放一区二区| 久久婷婷综合激情五月| 国内成+人 亚洲+欧美+综合在线 | 国产高潮精品久久AV无码| 亚洲国产免费一区二区| 国产精品亚洲av三区亚洲| 亚洲日韩精品无码专区网站| 久久久久久久妓女精品免费影院| 亚洲视频观看一区二区| 日本少妇高潮喷水视频| 中文字幕久久久人妻无码| 国产欧美精品在线一区二区三区| 国产传媒在线视频| 韩国一区二区三区黄色录像| 成人丝袜激情一区二区| 亚洲精品乱码久久久久久日本蜜臀| 中年人妻丰满AV无码久久不卡| 天堂av国产一区二区熟女人妻| 丰满大爆乳波霸奶| 国产乱人伦在线播放| AV无码中文字幕不卡一二三区|