亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向開放集圖像分類的模糊域自適應(yīng)方法

        2021-03-11 06:20:52劉曉龍王士同
        計(jì)算機(jī)與生活 2021年3期
        關(guān)鍵詞:源域類別分類器

        劉曉龍,王士同

        1.江南大學(xué) 人工智能與計(jì)算機(jī)學(xué)院,江蘇 無錫214122

        2.江南大學(xué) 江蘇省媒體設(shè)計(jì)與軟件技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫214122

        目前國內(nèi)外大多數(shù)的域自適應(yīng)的工作都假定目標(biāo)域樣本必然屬于源域的已知類,兩者有相同的類別空間,樣本特征分布雖然不同但是相似。在實(shí)際的開放情況中,這種情況大多是不存在的,測(cè)試的目標(biāo)域中大多還是有不同于源域的獨(dú)立類別樣本,把這些獨(dú)立類別稱為“未知類”,源域和目標(biāo)域完全相同的類別,稱為“共享類”。但是如果源域和目標(biāo)域除了包含共享類別之外還都有完全獨(dú)立的未知類別樣本,那么稱作這是一種開放集合領(lǐng)域場(chǎng)景。在此種開放的場(chǎng)景下,源域和目標(biāo)域的共享已知類樣本特征分布相似,差異較??;但是由于未知類的多樣性,源域和目標(biāo)域中未知類樣本與共享類樣本之間分布差異或大或小,簡單的線性分類器不能應(yīng)用到此種開放集的場(chǎng)景下。源域和目標(biāo)域在開放集場(chǎng)景下不再像在封閉集下那樣受限于共享相同的類別。圖1 展示了開放集和封閉集領(lǐng)域場(chǎng)景:圖(a)中源域和目標(biāo)域只包含同一組共享類別的圖像;圖(b)中源域和目標(biāo)域包含未知類別或存在其他領(lǐng)域的類別的樣本,即有共同的已知類別樣本之外,還有完全獨(dú)立的未知類別樣本。這種開放集合的領(lǐng)域是基于一種開放設(shè)置[1]的概念引申出來的。

        Fig.1 Closed set domain and open set domain圖1 封閉集合域與開放集合域

        為了解決源域中帶標(biāo)簽的數(shù)據(jù)集與目標(biāo)域中的非標(biāo)簽數(shù)據(jù)之間的轉(zhuǎn)移問題,從標(biāo)簽豐富的源域中訓(xùn)練分類器應(yīng)用到另一個(gè)目標(biāo)域樣本,國內(nèi)外學(xué)者也提出了許多域自適應(yīng)方法[2-6]。文獻(xiàn)[2]提出的對(duì)抗性區(qū)分域自適應(yīng)方法學(xué)習(xí)一種對(duì)抗無監(jiān)督適應(yīng)方法的通用框架,使用倒置標(biāo)簽生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)損失將優(yōu)化分為兩個(gè)獨(dú)立的目標(biāo),一個(gè)用于生成器,一個(gè)用于判別器,考慮了獨(dú)立的源映射和目標(biāo)映射(兩個(gè)流之間未共享的權(quán)重),從而可以學(xué)習(xí)領(lǐng)域特定的特征提取。文獻(xiàn)[3]提出了一種深度域自適應(yīng)方法,該方法利用域損失最小化,同時(shí)最大化不同域和類的標(biāo)記樣本之間的距離。文獻(xiàn)[4]利用了將實(shí)例分配給部分潛在的領(lǐng)域并通過優(yōu)化二進(jìn)制來解決分類情況的思想,將實(shí)際的測(cè)試數(shù)據(jù)與已知領(lǐng)域內(nèi)的帶標(biāo)記實(shí)例相關(guān)聯(lián),解決不平衡跨領(lǐng)域問題。文獻(xiàn)[6]基于對(duì)抗網(wǎng)絡(luò)方法提出了一種全新的度量源域和目標(biāo)域數(shù)據(jù)分布差異的方法。通過梯度翻轉(zhuǎn)層訓(xùn)練卷積網(wǎng)絡(luò)并結(jié)合損失將損失最小化用于域自適應(yīng)分類任務(wù)。由于不同領(lǐng)域的樣本有不同的特征,會(huì)降低不同領(lǐng)域分類器的性能,因此盡可能地要使源域數(shù)據(jù)和目標(biāo)數(shù)據(jù)之間有相似的分布且存在遷移的情況下訓(xùn)練判別分類器。這種特殊直推式遷移學(xué)習(xí),由于不需要高成本的標(biāo)簽注釋器就可以進(jìn)行源域和目標(biāo)域之間的知識(shí)傳遞,可以更好地解決現(xiàn)實(shí)問題,因此這種優(yōu)勢(shì)技術(shù)受到了更多的關(guān)注。文獻(xiàn)[7]提出的遷移成分分析(transfer component analysis,TCA)和文獻(xiàn)[8]提出的轉(zhuǎn)移均衡的分布式適應(yīng)(balanced distribution adaptation,BDA)都是基于邊緣分布的自適應(yīng)方法。文獻(xiàn)[9-10]利用兩個(gè)域之間存在某些共享子空間提出了測(cè)地線流式核方法(geodesic flow kernel,GFK)。最小化了源域和目標(biāo)域的二階統(tǒng)計(jì)特征的關(guān)聯(lián)對(duì)齊法(correlation alignment,CORAL)[11-12]形式簡單并且高效。這些域自適應(yīng)算法的測(cè)試數(shù)據(jù)大多都來源于訓(xùn)練數(shù)據(jù)。

        然而要進(jìn)行圖像分類和行為識(shí)別這種實(shí)際應(yīng)用,現(xiàn)實(shí)由于目標(biāo)域樣本示例沒有給定標(biāo)簽,因此不能確定所屬類別一定是在源域已知類別范圍之內(nèi),例如從共享網(wǎng)站收集的數(shù)據(jù)集與應(yīng)用程序需要處理的數(shù)據(jù)有很大差別。目前大多域自適應(yīng)算法不能解決源域和目標(biāo)域樣本類別不匹配的遷移問題。利用源域和目標(biāo)域的共享子空間和“未知類”有效解決這個(gè)問題,并且進(jìn)一步提出了一種基于開放集圖像分類的模糊域自適應(yīng)方法。鑒于復(fù)雜的目標(biāo)域樣本的復(fù)雜性和不同環(huán)境配置獲取的圖像樣本的特征相似性,利用歐式距離很難直接精確地判斷目標(biāo)域樣本標(biāo)簽問題,因此引進(jìn)的是模糊系統(tǒng)中的不確定性模糊隸屬度[13-14]。在分配偽標(biāo)記過程中,通過模糊聚類算法的思想獲得樣本模糊隸屬度,通過最小化分配的距離來學(xué)習(xí)從源域到目標(biāo)域的模糊映射,使兩個(gè)域相關(guān)聯(lián)并且分布在同一個(gè)空間中。在下一個(gè)迭代中使用轉(zhuǎn)換后的源域樣本重新模糊分配并更新轉(zhuǎn)換映射,直到在目標(biāo)域樣本上,學(xué)習(xí)的分類器達(dá)到最好的分類效果為止。通過是否預(yù)先給目標(biāo)域樣本固定部分標(biāo)簽,得到了無監(jiān)督模糊域自適應(yīng)和半監(jiān)督模糊域自適應(yīng)兩種情形。

        1 無監(jiān)督模糊域自適應(yīng)

        對(duì)目標(biāo)域樣本實(shí)例進(jìn)行模糊分配偽標(biāo)簽,利用源域的已知類別數(shù)據(jù)對(duì)每個(gè)目標(biāo)樣本分配偽標(biāo)簽。在開放數(shù)據(jù)集中,定義源域樣本包涵C個(gè)類別,包涵C-1 個(gè)已知樣本類別和一個(gè)額外的未知類別。利用模糊C 均值聚類算法(fuzzy C-means,F(xiàn)CM)的主要思想[13-14],計(jì)算目標(biāo)域樣本到源域類別中心的距離來得到一個(gè)模糊隸屬矩陣來反映樣本點(diǎn)屬于某一類別的隸屬程度,判斷樣本點(diǎn)上屬于某一類。目標(biāo)域n個(gè)樣本,則可以表示為T={t1,t2,…,tn},定義第k次迭代的源域所有樣本類別的均值為和V(k)由D維的樣本特征表示。表示第k次迭代中樣本tj屬于第i類的隸屬度,表示第k次迭代中樣本tj屬于奇異值的隸屬度。定義第k次迭代中樣本tj到第i個(gè)中心點(diǎn)的距離為:

        利用拉格朗日乘子法求解式,得到隸屬度公式:

        可以得到第k次迭代樣本對(duì)源域類別隸屬矩陣和樣本為奇異值的隸屬矩陣。相比直接二分類而言,模糊隸屬度更能符合現(xiàn)實(shí)情況和增加容錯(cuò)率。通過隸屬度目標(biāo)樣本得到一個(gè)帶隸屬度的偽標(biāo)簽。

        2 半監(jiān)督模糊域自適應(yīng)

        其他條件不變,當(dāng)給目標(biāo)樣本注少量標(biāo)簽時(shí),無監(jiān)督分配問題變成半監(jiān)督問題。在這種情況下,增加約束條件使帶注釋的目標(biāo)樣本不再改變類別標(biāo)簽。將τ表示樣本的先驗(yàn)標(biāo)簽集合,yrj=1 表示樣本tj帶r類標(biāo)簽。并且是第k次迭代中樣本tj被分配的偽標(biāo)簽,并且。

        式(6)、式(7)利用最小化目標(biāo)域樣本到源域類別中心的距離,完成對(duì)所有目標(biāo)域樣本實(shí)例的標(biāo)簽的初步分配,每個(gè)樣本得到一個(gè)偽標(biāo)簽。

        通過計(jì)算樣本類別均值,把定義各個(gè)類別均值之間的距離作為類別間的距離:第k次迭代源域中兩兩類別之間距離為:

        目標(biāo)域樣本實(shí)例tj標(biāo)簽為i類的代價(jià)通過來表示,添加第二項(xiàng)在半監(jiān)督目標(biāo)方程中。另外通過K近鄰算法得到tj的所有近鄰Nj,如果目標(biāo)域中一個(gè)樣本實(shí)例tj的一個(gè)鄰居樣本被分配到tj所屬類別之外的另一個(gè)類別,添加源域中類別之間的距離作為額外的代價(jià)。定義分配標(biāo)簽的距離代價(jià)目標(biāo)函數(shù)為:

        為了方便求解,把第k次迭代中樣本到已知類的距離和額外近鄰距離組合成新的距離損失:

        利用拉格朗日乘子法求解式,得到隸屬度公式:

        3 學(xué)習(xí)源域到目標(biāo)域映射

        為將源域和目標(biāo)域的樣本特征變換到相同的空間,需要學(xué)習(xí)一個(gè)映射函數(shù)W(k)∈?D×D來完成這個(gè)轉(zhuǎn)化。在學(xué)習(xí)這個(gè)映射過程中,選取每個(gè)樣本在隸屬矩陣U(k)和O(k)最大隸屬度,其設(shè)置為0,如果樣本的最大隸屬度出現(xiàn)在O中,那么實(shí)驗(yàn)場(chǎng)景拒絕這個(gè)樣本參與學(xué)習(xí)映射函數(shù)W(k)。表示的是第k次迭代中樣本tj為第i類的最大模糊隸屬度。那么表示樣本tj沒有分配第i類別。在無監(jiān)督和半監(jiān)督兩種場(chǎng)景下,都是通過最小化損失函數(shù)來估計(jì)映射W(k):

        表示第k次迭代中第i類樣本均值的轉(zhuǎn)置,用最小二乘法[15-16]求解這個(gè)凸目標(biāo)函數(shù)的最優(yōu)解W(k),學(xué)習(xí)源域到目標(biāo)域的模糊映射矩陣W(k)之后,將源樣本特征映射到與目標(biāo)域相同的空間中。每一次迭代會(huì)得到新的映射。在轉(zhuǎn)換后的源域數(shù)據(jù)上訓(xùn)練線性SVM分類器[17],更新分類器,獲得目標(biāo)域樣本的分類結(jié)果。對(duì)于半監(jiān)督設(shè)置的數(shù)據(jù)集合,實(shí)驗(yàn)還將帶注釋的目標(biāo)樣本添加到訓(xùn)練集中。

        輸出:隸屬度矩陣U(k)、O(k),模糊映射函數(shù)W(k),分類精度。

        步驟1初始化循環(huán)次數(shù)k=1。

        步驟2分無監(jiān)督、半監(jiān)督兩種場(chǎng)景:

        (1)無監(jiān)督場(chǎng)景下

        根據(jù)式(2)得到φ(k);

        根據(jù)式(4)、式(5)得到隸屬矩陣U(k)、O(k)。

        (2)半監(jiān)督場(chǎng)景下

        根據(jù)式(2)得到φ(k);

        根據(jù)式(10)~(12)迭代更新得到隸屬矩陣U(k)、O(k)。

        步驟3根據(jù)式(15)得到映射W(k)。

        步驟4W(k)×S(k):將源域和目標(biāo)域的樣本特征變換到相同的空間。

        步驟5在轉(zhuǎn)換后的源域上訓(xùn)練SVM 分類器,用于目標(biāo)域分類,作為下次循環(huán)的源域。

        步驟6判斷當(dāng)前迭代是否是最優(yōu)精度,若是則返回步驟1,令k=k+1循環(huán)繼續(xù);若否,但超過最大迭代次數(shù)K,則循環(huán)停止,輸出前K次迭代中的最優(yōu)精度。

        4 實(shí)驗(yàn)研究和分析

        通過具體的實(shí)驗(yàn)數(shù)據(jù)集驗(yàn)證了提出的模糊域自適應(yīng)方法的性能,在常用的Office數(shù)據(jù)集[18]上做了圖像的分類實(shí)驗(yàn)。并且根據(jù)預(yù)先設(shè)定好的開放集協(xié)議[19]和是否為目標(biāo)域樣本加標(biāo)記的設(shè)定,實(shí)驗(yàn)分為了無監(jiān)督下的開放集模糊域自適應(yīng)和半監(jiān)督下的開放集模糊域自適應(yīng)兩大部分內(nèi)容。相同的實(shí)驗(yàn)參數(shù)環(huán)境下,在Office 數(shù)據(jù)集[18]上進(jìn)行了圖像分類的實(shí)驗(yàn),并且與經(jīng)典的域自適應(yīng)算法進(jìn)行了對(duì)比。

        4.1 數(shù)據(jù)集以及參數(shù)設(shè)置

        在Office 數(shù)據(jù)集[18]上對(duì)本文方法進(jìn)行了評(píng)估和比較。它提供了3 個(gè)不同的領(lǐng)域,即Amazon (A)、DSLR(D)和Webcam(W)。Amazon 數(shù)據(jù)集包含白色背景上的中心對(duì)象,其他兩個(gè)包含在辦公環(huán)境下拍攝的不同質(zhì)量級(jí)別的照片??偣灿?個(gè)源域-目標(biāo)域的31個(gè)公共類的組合。有6個(gè)領(lǐng)域組合轉(zhuǎn)換(A→D,A→W,D→A,D→W,W→A,W→D)可以進(jìn)行實(shí)驗(yàn)的驗(yàn)證,從AlexNet模型的全連通層(fc7)中提取特征向量[20-21]。通過將Caltech 數(shù)據(jù)集[9]與Office 數(shù)據(jù)集[18]的10 個(gè)相同類別作為共享類,本文為該數(shù)據(jù)集引入了一個(gè)開放集協(xié)議[19]。按照字母順序,在源域中使用第11~20個(gè)類作為未知樣本類,類21~31作為目標(biāo)域中的未知樣本類,源和目標(biāo)域中選擇出來的10 個(gè)類作為共享類,其他分配的未知類不被共享。實(shí)驗(yàn)把獨(dú)立的未知類作為源域中單獨(dú)的一個(gè)類別,那么源域中就有共享的10個(gè)類別和另加一個(gè)未知類。同時(shí)設(shè)定了源域和目標(biāo)域兩者僅包含10個(gè)共享類的樣本的封閉集合(Close)協(xié)議。本文在封閉和開放集合協(xié)議[19]上都做了大量實(shí)驗(yàn)工作。

        為確保每個(gè)域轉(zhuǎn)化實(shí)驗(yàn)過程中有同樣參數(shù)配置環(huán)境,這樣訓(xùn)練出來的分類器才能體現(xiàn)本文的模糊域自適應(yīng)方法與無任何自適應(yīng)結(jié)果的對(duì)比的公平性。選擇最大迭代次數(shù)K=10,對(duì)于正則參數(shù)α的調(diào)整,在實(shí)驗(yàn)過程中,在[2-5,25]中以2 為步長尋找最優(yōu)值,直到達(dá)到最優(yōu)解。根據(jù)與文獻(xiàn)[11,16]中相似的分類任務(wù)實(shí)驗(yàn),使用線性核函數(shù)訓(xùn)練SVM分類器,得到了比較好的軟間隔優(yōu)化,因此基于先前的懲罰因子系數(shù)的選擇,在實(shí)驗(yàn)中取[10-5,100]范圍中以10為步長尋取本次實(shí)驗(yàn)最優(yōu)的懲罰因子,選取多個(gè)域轉(zhuǎn)換的效果最好的系數(shù)。為了體現(xiàn)實(shí)驗(yàn)的真實(shí)公平性,選取C=0.000 1 為本次所有基線算法和對(duì)比算法的懲罰因子系數(shù)。如果β設(shè)置為無窮大,那么這種情況就不考慮任何奇異值。若設(shè)置較低的參數(shù)值,那么幾乎拒絕所有已知類的分配標(biāo)簽,即都分配為奇異值,顯然這樣無法實(shí)驗(yàn),更不符合邏輯與現(xiàn)實(shí)情況。4.2節(jié)實(shí)驗(yàn)中分析了β取不同值帶來的實(shí)驗(yàn)性能的影響,由實(shí)驗(yàn)表明β=0.5時(shí)多半實(shí)驗(yàn)會(huì)有最優(yōu)效果,因此選取β=0.5作為實(shí)驗(yàn)的默認(rèn)值。

        4.2 無監(jiān)督模糊域自適應(yīng)實(shí)驗(yàn)

        同時(shí)報(bào)告了將數(shù)據(jù)轉(zhuǎn)換為普通低維子空間的方法結(jié)果,這些算法都是在域自適應(yīng)問題上表現(xiàn)非常顯著的。在Office 數(shù)據(jù)集[18]上對(duì)以下幾個(gè)算法進(jìn)行實(shí)驗(yàn),包括遷移成分分析法(TCA)[7],實(shí)驗(yàn)中設(shè)定使用線性核函數(shù)進(jìn)行映射,轉(zhuǎn)化后的維為d=2/D,D為樣本數(shù)據(jù)維度;構(gòu)建了一條測(cè)地線來使源域靠近目標(biāo)域的測(cè)地線流核(GFK),實(shí)驗(yàn)中利用子空間分歧度量(subspace disagreement measure,SDM)[9]和貪心算法求得這次實(shí)驗(yàn)中的最優(yōu)子空間維度d*。此外,還有最小化源域和目標(biāo)域的二階統(tǒng)計(jì)特征的CORAL[11],實(shí)驗(yàn)用k近鄰分類器,設(shè)置近鄰k=1;在無監(jiān)督情況下的實(shí)驗(yàn),避免兩個(gè)域之間適配條件分布和邊緣分布被平衡對(duì)待而導(dǎo)致的實(shí)際問題中不平衡的問題,同樣也對(duì)比了轉(zhuǎn)移均衡的分布式適應(yīng)算法(BDA),參考文獻(xiàn)[8]中的設(shè)置,實(shí)驗(yàn)使用線性核,平衡因子μ=1,循環(huán)次數(shù)為10次。為了更好地分析本文方法FDA(fuzzy domain adaptation)算法不同形式的變換形式,F(xiàn)DA 是拒絕所有奇異值的表現(xiàn),源域中的類別對(duì)目標(biāo)域所有樣本開放,即β=∞;FDAβ表示允許有奇異值的出現(xiàn),并且在參數(shù)β設(shè)置方面在實(shí)驗(yàn)部分有精確說明。將單獨(dú)用源域數(shù)據(jù)訓(xùn)練的SVM 分類器[17]作為比較對(duì)象,更好體現(xiàn)模糊域自適應(yīng)的有效性。在使用開放集設(shè)置上[19],本文的實(shí)驗(yàn)報(bào)告如表1 所示,明顯可以看到模糊映射自適應(yīng)方法的優(yōu)越性,本文方法FDA 在開放集和封閉集協(xié)議設(shè)定上都有顯著的分類效果,比其他算法提升幅度更大。對(duì)于所有開放集合設(shè)定下的精度都小于封閉集合下的精度,但是本文方法在所有方法中仍然是表現(xiàn)最好的。

        明顯得到,關(guān)于Amazon這種大數(shù)據(jù)集領(lǐng)域組合的轉(zhuǎn)換(A-D,A-W,D-A,W-A)改進(jìn)的幅度更大。Amazon 到Dslr 的開放數(shù)據(jù)集上提升了8.74 個(gè)百分點(diǎn),封閉數(shù)據(jù)集上提升了11.46個(gè)百分點(diǎn)。Amazon到Webcam數(shù)據(jù)開放集合和封閉集合上提升了16.31個(gè)百分點(diǎn)和11.55個(gè)百分點(diǎn)。從小樣本域到大樣本域的適應(yīng)過程提升幅度也會(huì)有很明顯的提升,并且提升幅度很大。Dslr到Amazon的開放集和封閉集上分別提升了6.15 個(gè)百分點(diǎn)和11.8 個(gè)百分點(diǎn)。而小樣本域(D,W)之間的遷移時(shí)提升幅度不是特別顯著,但是也有不錯(cuò)的效果。本文方法相比較沒有自適應(yīng)學(xué)習(xí)的環(huán)境,幅度有明顯提升。在Office 數(shù)據(jù)集[18]上,開放集合協(xié)議和封閉集合協(xié)議整體平均提升了8.01個(gè)百分點(diǎn)和9.08個(gè)百分點(diǎn)。相對(duì)于實(shí)驗(yàn)的其他域自適應(yīng)學(xué)習(xí)算法,提升幅度最顯著。

        參數(shù)β的影響:目標(biāo)樣本是否被視為異常值由φ取值確定,φ由樣本到已知類之間的距離和參數(shù)β決定。為了分析參數(shù)β給實(shí)驗(yàn)帶來的影響,取β=[0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9]共9 個(gè)不同的值在轉(zhuǎn)化域中都做實(shí)驗(yàn)。圖2 顯示了不同的β取值對(duì)實(shí)驗(yàn)精度的影響。在Office數(shù)據(jù)集[18]的6個(gè)轉(zhuǎn)化域中多半在β=0.5 左右取得了最佳結(jié)果。當(dāng)β接近0 時(shí),由于丟棄了太多的樣本,精度大幅下降。因此選取β=0.5 作為所有實(shí)驗(yàn)的默認(rèn)值。

        4.3 半監(jiān)督模糊域自適應(yīng)實(shí)驗(yàn)

        本文方法也在Office 數(shù)據(jù)集[18]上的半監(jiān)督設(shè)置中進(jìn)行了評(píng)估。在目標(biāo)域的已知類別樣本中,對(duì)每個(gè)已知類隨機(jī)抽取3 個(gè)樣本固定標(biāo)簽。其余未標(biāo)標(biāo)記。把未進(jìn)行域自適應(yīng)時(shí)訓(xùn)練支持向量機(jī)(SVM)分類器的準(zhǔn)確性作為基線,這些支持向量機(jī)僅在帶注釋的目標(biāo)樣本(a)和源域樣本和帶注釋樣本(a+s)上訓(xùn)練。半監(jiān)督設(shè)定下的開放集和封閉集下6 個(gè)域轉(zhuǎn)換的實(shí)驗(yàn)結(jié)果由表2所示,同時(shí)也對(duì)比了考慮奇異值和不考慮奇異值的情況,并且做了對(duì)比實(shí)驗(yàn)。本文也在有1 個(gè)近鄰約束(FDA-N1)和有2 個(gè)近鄰約束(FDA-N2)兩個(gè)不同條件下進(jìn)行了實(shí)驗(yàn)對(duì)比,并且分別考慮了有無奇異值約束的兩種情況,實(shí)驗(yàn)結(jié)果表明,差距不是很大。但是與預(yù)期一樣,在半監(jiān)督場(chǎng)景下,模糊域自適應(yīng)效果比其余的都要好。

        在半監(jiān)督場(chǎng)景下,每一個(gè)已知類隨機(jī)選取了3個(gè)樣本加固定標(biāo)簽作為帶有先驗(yàn)信息的樣本,這樣的樣本有普遍性,近鄰距離影響可能較小或者沒有,在目標(biāo)函數(shù)中不具有能決定分配偽標(biāo)簽的效果。具有特殊先驗(yàn)信息的半監(jiān)督設(shè)定下6 個(gè)域轉(zhuǎn)化實(shí)驗(yàn)精度的均值和方差如表3 所示。導(dǎo)致運(yùn)行本次半監(jiān)督實(shí)驗(yàn)結(jié)果的魯棒性很強(qiáng)。考慮現(xiàn)實(shí)情況,如果在特殊人為的先驗(yàn)條件下,憑經(jīng)驗(yàn)?zāi)艽_定部分具有代表性的和容易判斷錯(cuò)誤的樣本標(biāo)簽,那么這類樣本對(duì)整個(gè)分類判別分析的影響會(huì)很大,并且在選取少量固定標(biāo)簽樣本情況下變化幅度也會(huì)很大,通過實(shí)驗(yàn)來驗(yàn)證本文的猜想。在這樣的假設(shè)條件下,優(yōu)先選擇具有代表性的或者容易分配為錯(cuò)誤標(biāo)簽的樣本,一個(gè)特殊的半監(jiān)督場(chǎng)景:在第一次通過目標(biāo)域樣本到已知類中心的距離判斷偽標(biāo)簽的時(shí)候,選擇出那些判斷錯(cuò)誤的樣本,作為半監(jiān)督場(chǎng)景下加注釋的部分。在優(yōu)先選擇這些強(qiáng)注釋樣本條件下,同樣每個(gè)類別隨機(jī)抽取3個(gè)樣本加標(biāo)簽注釋,形成特殊的半監(jiān)督環(huán)境。實(shí)驗(yàn)驗(yàn)證了本文的猜想,并且與先前驗(yàn)證實(shí)驗(yàn)效果一致。

        Table 1 Accuracy comparison of 6 domain transformation experiments under unsupervised settings表1 無監(jiān)督設(shè)定下6個(gè)域轉(zhuǎn)化實(shí)驗(yàn)的精度對(duì)比 %

        Fig.2 Influence of different parameter β on accuracy of 6 domain transformation experiments圖2 不同的參數(shù)β 對(duì)6個(gè)域轉(zhuǎn)化實(shí)驗(yàn)精度的影響

        Table 2 Accuracy comparison of 6 domain transformation experiments under semi-supervised settings表2 半監(jiān)督設(shè)定下6個(gè)域轉(zhuǎn)化實(shí)驗(yàn)的精度對(duì)比 %

        Table 3 Mean and variance of 6 domain transformation experiments accuracy under semi-supervised settings with special prior information表3 具有特殊先驗(yàn)信息的半監(jiān)督設(shè)定下6個(gè)域轉(zhuǎn)化實(shí)驗(yàn)精度的均值和方差 %

        為了保證實(shí)驗(yàn)結(jié)果真實(shí)準(zhǔn)確,對(duì)每個(gè)域轉(zhuǎn)化下的數(shù)據(jù)集都進(jìn)行了3次實(shí)驗(yàn),然后取平均值作為最終結(jié)果并且用標(biāo)準(zhǔn)差來評(píng)估預(yù)測(cè)的離散程度。

        5 結(jié)束語

        現(xiàn)實(shí)場(chǎng)景更具有開放性,目標(biāo)域與源域有完全獨(dú)立的類別樣本。鑒于獨(dú)立類別樣本的復(fù)雜性和重復(fù)性,本文提出的面向開放集合的模糊域自適應(yīng)的方法基于源域和目標(biāo)域的共享子空間對(duì)齊,通過計(jì)算目標(biāo)樣本模糊隸屬度的方法得到帶有模糊隸屬度的偽標(biāo)簽,迭代更新源域到目標(biāo)域的模糊映射函數(shù),將源域和目標(biāo)域的樣本特征變換到相同的空間。實(shí)驗(yàn)結(jié)果證明,本文算法有效解決了傳統(tǒng)域自適應(yīng)算法解決不了的開放性問題,并且在無監(jiān)督和半監(jiān)督場(chǎng)景下都能獲得比較顯著的結(jié)果。模糊域自適應(yīng)的方法也可以應(yīng)用于圖像分類的行為動(dòng)作識(shí)別和視角檢測(cè)上等更廣泛的開放場(chǎng)景。

        猜你喜歡
        源域類別分類器
        多源域適應(yīng)方法綜述
        基于參數(shù)字典的多源域自適應(yīng)學(xué)習(xí)算法
        BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        可遷移測(cè)度準(zhǔn)則下的協(xié)變量偏移修正多源集成方法
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        少妇下面好爽好紧好湿一区二区| 国内视频偷拍一区,二区,三区| 成人国产自拍在线播放| 日本亚洲系列中文字幕| 无码国产精品久久一区免费| 亚洲av中文无码字幕色三| 国产精品久久久久免费a∨不卡| 美女丝袜诱惑在线播放蜜桃| 国产aⅴ无码专区亚洲av| 国产超碰人人做人人爱ⅴa| 一区二区免费电影| 久久开心婷婷综合中文| 精品久久久久久无码专区| 国产人妖网站在线视频| 亚洲精品无码久久久久去q| 中文无码成人免费视频在线观看 | 亚洲av永久无码天堂网小说区| 猫咪免费人成网站在线观看| 亚洲Av无码专区尤物| 国产精品久久婷婷免费观看| 亚洲字幕av一区二区三区四区| 亚洲色欲在线播放一区| 精品蜜桃视频在线观看| 久久精品国产av一级二级三级| 久久亚洲国产成人精品性色 | 特级毛片爽www免费版| 最新国产午夜福利| 日韩黄色大片免费网站| 欧美老肥婆牲交videos| 初尝黑人巨砲波多野结衣| 99久久精品国产亚洲av天| 粉嫩av最新在线高清观看| 国产av丝袜旗袍无码网站| 亚洲免费一区二区三区视频| 按摩少妇高潮在线一区| 全黄性性激高免费视频| 国产成人精品日本亚洲18| 国产av区亚洲av毛片| 亚洲综合图色40p| 全免费a级毛片| 午夜人妻中文字幕福利|