亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于邊際Fisher 準則和遷移學習的小樣本集分類器設計算法

        2016-11-04 07:58:44舒醒于慧敏鄭偉偉謝奕胡浩基唐慧明
        自動化學報 2016年9期
        關鍵詞:特征

        舒醒 于慧敏,2 鄭偉偉 謝奕 胡浩基 唐慧明

        基于邊際Fisher 準則和遷移學習的小樣本集分類器設計算法

        舒醒1于慧敏1,2鄭偉偉1謝奕1胡浩基1唐慧明1

        如何利用大量已有的同構標記數(shù)據(jù)(源域)設計小樣本訓練數(shù)據(jù)(目標域)的分類器是一個具有很強應用意義的研究問題.由于不同域的數(shù)據(jù)特征分布有差異,直接使用源域數(shù)據(jù)對目標域樣本進行分類的效果并不理想.針對上述問題,本文提出了一種基于遷移學習的分類器設計算法.首先,本文利用內積度量的邊際Fisher準則對源域進行特征映射,提高源域中類內緊湊性和類間區(qū)分性.其次,為了篩選合理的訓練樣本對,本文提出一種去除邊界奇異點的算法來選擇源域密集區(qū)域樣本點,與目標域中的標記樣本點組成訓練樣本對.在核化空間上,本文學習了目標域特征到源域特征的非線性轉換,將目標域映射到源域.最后,利用鄰近算法(k-nearest neighbor,kNN)分類器對映射后的目標域樣本進行分類.本文不僅改進了邊際Fisher準則方法,并且將基于自適應樣本對篩選的遷移學習應用到小樣本數(shù)據(jù)的分類器設計中,提高域間適應性.在通用數(shù)據(jù)集上的實驗結果表明,本文提出的方法能夠有效提高小樣本訓練域的分類器性能.

        小樣本集分類器,遷移學習,邊際Fisher準則,kNN分類器,域間轉換

        引用格式舒醒,于慧敏,鄭偉偉,謝奕,胡浩基,唐慧明.基于邊際Fisher準則和遷移學習的小樣本集分類器設計算法.自動化學報,2016,42(9):1313-1321

        在模式識別和計算機視覺領域中,物體分類識別方法已經(jīng)得到廣泛的研究,現(xiàn)存的算法也比較成熟.但是在一個標記樣本很少的數(shù)據(jù)庫上,這些傳統(tǒng)的方法并不能得到較高的識別準確度,這是因為幾乎所有的監(jiān)督學習算法[1-2]都需要大量的標記樣本作為訓練數(shù)據(jù).

        近年來,基于一個大量標記的同構數(shù)據(jù)集上的物體識別模型,設計一種基于遷移學習的分類器算法來提高新的只有少量標記樣本的數(shù)據(jù)集上的識別準確度是一個越來越受關注的研究方向,其中大樣本和小樣本數(shù)據(jù)集分別被稱作源域和目標域[3],其主要原因是獲取大量標記樣本是一個昂貴、極其耗費人力和時間的過程,同時不可避免人為標記錯誤的情況[4].借助于源域來優(yōu)化目標域的分類模型能很好地解決上述問題.但是源域訓練得到的分類器直接應用在目標域中并不能得到理想的效果,這是因為不同域的特征分布有差異.導致域間差異的因素有很多,比如相機參數(shù)、光線、視角、分辨率、背景和姿態(tài)等[3,5-6],如圖1所示.因此,我們可以將源域作為目標域的先驗知識,利用域間的相關性,通過遷移學習的方法來提高目標域的分類準確率[6-8].

        圖1 源域(上)與目標域(下)是存在差異的(與源域相比,目標域中的背景更復雜,分辨率更低,視角更多樣)Fig.1There exist differences between source domain(top)and target domain(bottom)(Compared with the source domain,the target domain contains more complex backgrounds,the lower solution,and more camera angles.)

        利用大樣本數(shù)據(jù)學習小樣本數(shù)據(jù)分類器問題的算法從采用的參數(shù)模型的角度主要可以分為三類:基于支持向量機(Support vector machine,SVM)的算法、基于深度學習的算法和基于域間特征轉換的算法.基于SVM的算法,比如文獻[9-13],通過改變在源域上訓練得到的支持向量機中的參數(shù)或者目標函數(shù)來適應目標域.基于SVM的算法最大的缺點是不能夠將算法擴展到目標域中標記樣本未出現(xiàn)過的新類別的情況.基于深度學習的算法是將在大量已知標記樣本集上訓練得到的神經(jīng)網(wǎng)絡應用到一個相對少量標記的數(shù)據(jù)域上.文獻[14]是基于ILSVRC2012數(shù)據(jù)庫上訓練好的CNNs(Cellular neural netwarks),利用目標域上的標記樣本重新訓練了全連接層.文獻[15]是基于在ILSVRC13數(shù)據(jù)庫上訓練得到的OverFeat網(wǎng)絡模型,利用目標域中的少量標記樣本以及OverFeat學習出來的特征,訓練出適應目標域的分類器.基于深度學習的算法的局限性是需要海量訓練數(shù)據(jù)來保證分類準確度.基于域間特征轉換的算法也有很多,比如文獻[3,16-19]等.文獻[18]提出了一種將源域和目標域中的高維特征映射到低維特征空間中,實現(xiàn)域間遷移的學習算法.基于域間特征轉換的算法剛好可以克服掉基于SVM的算法的最大缺點,例如文獻[16]提出的ARC-t算法.但是ARC-t(Asymmetric regularized cross-domain transformation)算法對源域中類別的可分離性以及學習特征空間轉換中訓練點的選擇缺乏充分的考慮.

        綜上,為了充分利用源域的標記同構數(shù)據(jù)和保證目標域中不同類映射到源域后盡可能相互不重疊,本文提出了一種新的基于域間特征轉換的遷移學習方法.首先,針對源域的樣本,本文基于邊際Fisher準則,提出了特征向量點積作為距離度量標準,盡可能最大化類間分離性和最小化類內緊湊性,這個過程將直接影響后面的轉換學習的效果.其次,本文設計了一種去除邊緣奇異點的算法,基于K-medoids思想從源域中選取合理的樣本點,學習與目標域標記樣本間的特征轉換,實現(xiàn)目標域到源域的映射.本文采用該去除奇異點算法的原因有兩個:1)由于源域中每個類別中樣本點的分散性,必然在邊界附近存在部分奇異點,所以采用K-medoids思想能夠避免將目標域相應類別映射到源域的邊界附近;2)kmeans算法同樣可以達到以上效果,但是該算法計算類的中心點時會受到奇異點的影響,并不能將目標域映射到源域中樣本密集分布區(qū)域.由于線性的特征轉換有時在特征空間上不能令不同類別可區(qū)分,所以為實現(xiàn)特征的非線性轉換,本文利用了核化特征,最后訓練鄰近算法(k-nearest neighbor,kNN)分類器并在通用數(shù)據(jù)庫上計算物體分類識別準確度.

        本文的結構如下:第1節(jié)介紹本文所提算法涉及的相關工作;第2節(jié)詳細闡述本文提出的基于邊際Fisher準則和遷移學習的分類器設計算法;第3節(jié)是實驗,給出了本文算法的具體實現(xiàn)過程,并把本文算法與近年來一些具有代表性的基于遷移學習的小樣本分類器設計算法進行了性能對比;第4節(jié)是論文總結及后續(xù)研究方向.

        1 相關工作

        在近年來,利用大樣本數(shù)據(jù)集來提高小樣本集分類器性能的問題吸引了越來越多的關注.國內外很多學者針對該問題做了許多研究工作,也提出了很多思路[6].目前提出的方法從目標域是否進行特征映射的角度主要分為以下兩類:一類是在保持源域和目標域在特征分布空間不變的前提下,在目標域上通過調節(jié)分類器的適應性參數(shù)來達到提高小樣本數(shù)據(jù)分類準確率的目的;另一類是在保持目標域中的特征分布不變的前提下,將目標域上的點在特征空間中映射到源域中,直接利用在源域中訓練好的分類器.在第一類方法中,文獻[9]提出一種自適應SVM算法,通過增加擾動函數(shù)和目標域中的標記樣本來更新源域中訓練好的分類器fA( xxx),即目標域上的分類器為,其中是擾動函數(shù).文獻[11]中將轉換SVMs應用到了適應性學習中.同時,很多工作是基于第二類的思想進行研究的.文獻[20]提出的算法是基于測地流核的特征遷移學習算法實現(xiàn)的.在文獻[21]中,Long等學習了一種能夠直接使源域和目標域間的特征分布相匹配的域間不變核,從而達到域間遷移學習的目的.文獻[22]通過一種自動域間適應的特征學習算法來適應不同圖片數(shù)據(jù)域的特征差異性.在文獻[3]中,Saenko等提出了一種基于信息論矩陣學習[23]的特征轉換算法(Symm算法),在特征空間上將目標域映射到源域,通過源域上的分類器對目標域進行分類.在文獻[16]中,Kulis等提出了一種叫做ARC-t的算法,該算法的核心是一種基于域間特征核化非線性轉換的模型并訓練出kNN分類器.

        與本文相關的工作還有文獻[24-25],它們提出了邊際Fisher分析算法(Marginal Fisher analysis,MFA),該算法是使用歐氏距離作為度量標準并基于邊際Fisher準則來設計特征映射,不僅對數(shù)據(jù)分布沒有嚴格的要求,而且能更好地表達出類內緊湊性和類外分離性,有助于將不同類別更好地區(qū)分開.為了提高域間適應性,雖然基于信息論矩陣學習的算法和ARC-t算法能夠將目標域在特征空間中映射到源域中,但是存在兩個明顯的問題:1)源域內不同類如果在特征空間中相互交錯,不具有很好的類別差異性,那么目標域中的類別映射到源域也不能保證相互之間是可區(qū)分的.2)在特征轉換訓練過程中,源域中的訓練樣本是隨機選取并與目標域中的標記樣本組成訓練對,如果該過程選取的點是在源域對應類別的邊界上,那么目標域樣本也會被映射到源域的邊界區(qū)域,這樣勢必會影響類別間的分類.綜上考慮,首先我們需要將源域中的樣本點降維到類間可分離的特征空間中,使得在該空間中,源域的不同類別相互可區(qū)分.另外,為了保證目標域的映射結果具有較高的分類準確度以及訓練樣本對的選擇要避免邊緣區(qū)域的樣本點,本文算法的設計正是基于上述考慮.

        2 基于邊際Fisher準則和遷移學習的小樣本集分類器設計算法

        為了利用大量已有的同構標記數(shù)據(jù)提高小樣本集的分類器性能,本文提出了基于邊際Fisher準則和遷移學習的小樣本數(shù)據(jù)的分類器設計算法.該算法的思路是首先為了提高源域的類內緊湊性和類間區(qū)分性,本文根據(jù)內積度量的邊際Fisher準則優(yōu)化源域特征分布,其次利用篩選算法得到的訓練樣本對學習目標域到源域的非線性特征轉換的遷移學習算法,將目標域映射到源域,提高域間適應性,最后利用在源域上訓練得到的kNN分類器對目標域的樣本進行分類.本文的分類器設計算法流程圖見圖2.

        圖2 基于邊際Fisher準則和遷移學習的小樣本數(shù)據(jù)分類器設計算法流程圖Fig.2The flow diagram of classifier-designing algorithm on a small dataset based on margin Fisher criterion and transfer learning

        首先,我們考慮到了源域內特征分布,利用內積度量的邊際Fisher準則對源域進行特征映射,提高源域中類內緊湊性和類間區(qū)分性.其次,在目標域到源域的特征轉換的學習過程中,為了篩選合理的訓練樣本對,本文提出一種去除邊界奇異點的算法來選擇源域密集區(qū)域樣本點,與目標域中的標記樣本點組成訓練樣本對.并在核化空間上,本文學習了目標域特征到源域特征的非線性轉換,將目標域映射到源域.最后,利用kNN分類器對映射后的目標域樣本進行分類.與其他小樣本集分類器的算法相比,本文算法考慮了域間轉換的學習過程的細節(jié).以下是本文提出算法的具體描述.

        2.1內積度量的邊際Fisher準則

        為了提高類內緊湊性和類間可分性,本文首先利用根據(jù)邊際Fisher準則將源域的特征映射到新的特征空間中.本文對原始MFA[26]方法進行了改進.改進后的邊際Fisher準則與原始MFA方法的區(qū)別在于:本文方法的距離度量方式是內積,而不是歐幾里得距離.這是為了優(yōu)化算法的求解過程,同時與后面的遷移學習算法中的距離度量方式保持一致,以保證算法求解的一致性.邊際Fisher準則是基于圖嵌入的框架,設計出描述類內緊湊性的本征圖和類間區(qū)分性的懲罰圖,如圖3所示.

        圖3 邊際Fisher準則的圖結構:本征圖和懲罰圖Fig.3The graph structure of margin Fisher criterion:intinsic graph and penalty graph

        在本征圖Gc中,同類點間的鄰近關系是由每一個樣本與k1個與其同類并近鄰的樣本點的距離之和描述.在懲罰圖Gp中,類間邊界點鄰近關系是由邊界奇異點與k2個與其異類并近鄰的邊界點的距離之和描述.因此本征圖Gc中類內緊湊性Sc可以表示為

        其中,M代表特征變換矩陣,Nk1(i)表示k1個與樣本 xi同類并與 xi近鄰的樣本點的索引集.

        懲罰圖Gp中的類間分離性Sp可以表示為

        其中,Pk2(ci)表示(i,j),i∈πci,j/∈πci中k2個最鄰近的邊界樣本對集.根據(jù)邊界Fisher準則,最小化類內緊湊性和最大化類間分離性,則特征變換矩陣M可以利用圖嵌入結構得到:

        本文算法創(chuàng)新點之一就是本文通過改進傳統(tǒng)的邊界Fisher準則并將其與域間遷移學習相結合,這樣更加充分地利用了源域的標記樣本信息.本文的實驗分別對集成了原始MFA的算法(實驗部分的mmf-Euclid算法)和集成了改進后的邊際Fisher準則算法(實驗部分的mmf算法)進行了實驗.我們通過對比實驗結果可以驗證,集成了改進后的邊際Fisher準則的算法比集成了原始MFA的算法更有效地提高分類器的準確率.

        2.2自適應訓練樣本篩選和域間遷移學習

        針對域間特征分布的差異性以及相關性,本文通過信息矩陣學習的方式,學習出目標域到源域的映射矩陣.源域A和目標源B的類別數(shù)均為c,其中A有nA個樣本點,設為, B中有nB個樣本點,設為

        2.2.1訓練樣本對自適應篩選

        訓練樣本對的選擇會直接影響到訓練結果的好壞.在文獻[16]提出的ARC-t算法,對于樣本對的選擇是隨機選取的.但是事實上,如果樣本對恰好選擇到源域中的奇異點,那么目標域就會被映射到對應類別的邊界區(qū)域,類間差異性就會變得不明顯,如圖4所示.

        為了避免源域中奇異點對于學習特征轉換的影響,特征映射學習的訓練樣本對不能隨機選取.本文其中一個主要的創(chuàng)新點是考慮到域間特征轉換學習的效果與訓練樣本對的質量是緊密相關的,我們提出了一種通過去除邊緣奇異點篩選出訓練樣本對的算法,算法詳細過程如下:

        圖4 圓形虛線內是源域的同類樣本的密集區(qū),源域的其他樣本點被稱為奇異點Fig.4The concentrated region of samples belonging to the same category in the source domain is surrounded by the round dashed line,while the other samples in the source domain are called singular points

        1)計算每一個樣本點 xxxi與同類其余樣本點間的距離,記為Sij,在本文中,距離統(tǒng)一都用點積作為度量標準,即

        3)針對每個i(1≤i≤ne)對Si按降序進行排序,倒數(shù)k3個樣本點會被認為是奇異點,其余樣本點組成樣本候選集;

        4)從上述候選集中隨機均勻選出kA個樣本點,該集合記為T(A),這些點將與B域中的kB個標記樣本點(記為T(B))組成樣本對.隨機選取是為了避免將B域中的樣本過分地映射到A域的中心位置,而是均勻地映射到A域的較密集區(qū)域.

        至此,域轉換學習中所用到的訓練樣本對的選擇結束.算法最后得到的樣本對將作為域間特征轉換的訓練樣本對.

        圖5 域間特征轉換示意圖(灰色表示源域,黑色表示目標域)Fig.5The diagrammatic sketch of features transformation between the target domain and source domain(The gray points represent the target domain,while the balck ones represent the source domain.)

        2.2.2域間遷移學習

        樣本間相似性函數(shù)可表示為

        其中,fi(XTWY)是域間的約束條件.為了簡化算法,可以選擇對W使用LogDet正則化.正則化函數(shù)γ(W)可以寫成W的奇異值之和的形式,即如果σ1,σ2,···,σp是W的奇異值,那么γ(W)可以寫成的形式,γj是一個標量函數(shù).但是這個方法有一個很大的局限性就是使用LogDet正則化需要W是正定矩陣,為避免這個限制條件,本文提出用樣本之間特征向量的點乘來表示樣本間的相似性函數(shù)[16],該問題的目標函數(shù)可以用內積的形式表示.設內積KA=XTX,KB=YTY,該問題的最優(yōu)解,其中L是一個nA×nB的矩陣[12].那么,該問題的約束函數(shù)可以表示為

        因此算法的計算過程中只涉及特征向量內積的計算問題.

        其中,l和u分別是兩個樣本點相似性的上限和下限參數(shù).對于同一類別的樣本對來說,相似性應該更大;對于不同類別的樣本對來說,相似性應該更小.

        綜上,域間遷移學習的過程可以表述如下.設σ1,σ2,···,σp是W的奇異值,γj是一個標量函數(shù),本文采用的標量函數(shù),那么就是一個弗羅貝尼烏斯范數(shù)形式.則該遷移學習問題的求解可以用以下形式描述:

        線性轉換有時并不能很好地表達出域間的映射關系,而非線性轉換則能較好地表達,所以算法可以引入特征的核化空間.該算法的核化就是將算法中出現(xiàn)特征向量內積的地方用相應的核化函數(shù)表示.當引入原始核函數(shù),核化之后,則W表示的是在希爾伯特(Hilbert)空間中的一個算子,維度與和的維度相關.因此,如果引入的原始核函數(shù)為徑向基函數(shù)(Radial basis function,RBF)核,則W的維數(shù)就是無窮大.盡管不能顯式計算W,但是仍然可以根據(jù)文獻[23]中的核化算法將W遞歸展開成如下形式:

        其中,為約束訓練樣本對,σij為Bregman投影系數(shù)(Bregman projection parameter).此時我們可定義一個新的核函數(shù)則核化之后的相似性函數(shù)可以用新引入的核化函數(shù)表示,即,因此算法中出現(xiàn)特征向量內積的地方用相應的核函數(shù)表示,算法的核化就完成了.該凸優(yōu)化問題有很多方法可以求解,本文采用Bregman迭代算法進行求解,可以很快得到收斂解,具體求解過程可以參考文獻[27].

        3 實驗結果

        本文提出的算法采用Matlab編程實現(xiàn).

        3.1數(shù)據(jù)庫

        實驗所用數(shù)據(jù)庫[3]包含了三個子數(shù)據(jù)域,分別是webcam,amazon和dslr.在這三個域中分別有31個物體類別,涵蓋了生活中常見的物體,例如椅子、背包、鍵盤等.這三個數(shù)據(jù)域相互之間是有差異的.首先,webcam域中的圖片是帶有閃關燈的網(wǎng)絡攝像頭拍攝得到的,具有姿態(tài)各異,低分辨率(640×480),背景變化等的特點,每一類別中有5個不一樣的對象且每個對象平均有3個不同的視角,webcam域共有795張圖片.其次,amazon域中的圖片是從網(wǎng)上收集的,具有畫面單一、物體居中、白色背景等特點,每一類別中平均有90張圖片,共計2813張圖片.最后,dslr域中的圖片是由數(shù)碼單鏡頭反光(Single lens reflex,SLR)相機在自然環(huán)境中拍攝得到的,具有背景多樣,高分辨率4288×2848,自然光線的特點,每一類別中有5個不同對象,每個對象平均有3個不同的視角.dslr域共有498張圖片.

        圖6 webcam,amazon和dslr中椅子類別中的樣例圖Fig.6The samples image of chair in three domain:webcam,amazon,dslr

        3.2本文算法的具體實現(xiàn)和參數(shù)

        本文提出算法(記為mmf)實驗的具體實現(xiàn)方案如下.如果每個算法采用的圖像特征不是統(tǒng)一的,那么很難對這些算法做比較.為了能更好地與前人取得的成果做對比,本實驗中所用到的圖像特征均采用文獻[3]中提供的SURF(Speeded up robust features)特征,將所有圖片灰度化并提取其SURF特征,最后被量化成800維的特征.為保證各對比算法實驗結果的可比性,所有算法中的參數(shù)KA和KB均保持一致.從A中選取KA個樣本點(當A域為amazon時,取KA=20,當A域為webcam或dslr時,取KA=15),與B域中隨機選擇的3個樣本點組成樣本對,取KB=3.首先訓練出映射矩陣M,本文借鑒了對比方法中采用的核函數(shù),利用的是高斯RBF核函數(shù),其中σ=1,λ=103.通過迭代學習出域間的轉換W,本實驗采用kNN分類器,其中k=1,通過20次的隨機實驗,最終取所有實驗的分類準確率的平均值作為本實驗的平均分類準確率.具體的實驗參數(shù)設置如表1所示.

        表1 本文算法的實驗參數(shù)設置Table 1The experiment parameters set of our method

        3.3實驗結果及分析

        本文方法與近年來具有代表性的一些相關研究成果進行了實驗對比.基于深度學習的算法需要源域是目標域的父集[15]并且需要海量訓練數(shù)據(jù)保證其準確率.考慮到本文實驗所用的數(shù)據(jù)庫沒有其對應的大樣本庫且其最小的數(shù)據(jù)域的樣本僅有498個,我們沒有加入基于深度學習的算法對比.對比實驗中的基于SVM的算法和基于域間特征轉換的算法描述如下:

        1)kNN-ab是在A域中的標記樣本上訓練出kNN分類器,直接將B域中的測試數(shù)據(jù)用在該kNN分類器上計算分類的準確率.

        2)kNN-bb是將B域中的標記樣本和A域中的標記樣本作為訓練樣本訓練出kNN分類器.其余樣本作為測試樣本計算分類準確率.

        3)symm是Saenko等提出的算法[3].該算法主要通過信息論矩陣學習實現(xiàn)域間轉換并訓練出kNN分類器來提高目標域上的分類準確率.

        4)ARC-t是Kulis等提出的算法[16].該算法是利用域間的非線性轉換的學習解決域間差異性問題,結合源域訓練的kNN分類器對目標域樣本進行分類.

        5)gfk是文獻[20]中提出的算法,是通過基于測地流核(Geodesic flow kernel)的遷移學習來訓練目標域上的kNN分類器.

        6)svm-s是利用A域中的標記樣本訓練出的SVM分類器.

        7)hfa是文獻[28]提出的,該方法提出了一種新的邊緣最大化的特征表示和svm損失函數(shù)相結合的算法,最終通過SVM分類器達到提高目標域的分類準確度的目的.

        表2 在三個數(shù)據(jù)域上的分類準確率(%)(加粗字體表示最佳性能,縮寫:a:amazom,w:webcam,d:dslr)Table 2Accuracy rates in the three domains(%)(The bold font represents the best performance,abbreviation:a:amazom,w:webcam,d:dslr.)

        表2給出了本文算法和其他算法的對比結果.其中mmf-Euclid是集成了原始MFA的分類器算法,mmf是集成了本文改進后的邊際Fisher準則的分類器算法.從實驗結果可以看出,mmf的分類準確度要比mmf-Euclid更高,因此本文采用改進后的邊際Fisher準則比原始MFA更有助于提高本文的分類器算法的準確率.與kNN-ab和kNN-bb的實驗結果相比較,本文提出的算法通過將目標域的樣本映射到源域的學習過程而不是簡單地融合了兩個域的標記樣本數(shù)據(jù),有效提高了目標域上的分類準確率.從基于SVM的算法和基于域間特征轉換的算法的對比實驗結果中,我們可以看出本文的算法充分考慮了源域和目標域的特征分布及其差異性,通過對源域和目標域的特征映射的學習過程使得目標域的分類準確率上有提高,并且在平均的識別準確率上是最高的.

        最后,我們不僅驗證了本文提出的算法能夠獲得高準確率,而且在圖7中還驗證了該算法的性能隨著目標域可用標記樣本數(shù)的增大而提升.源域中的訓練樣本數(shù)為20,目標域中可用標記的樣本數(shù)從1到5變化.從圖7可以看到這5種方法都是遞增的趨勢,本文的方法在整體上要比其他方法好.

        綜上,與其他算法相比,本文提出的小樣本集的分類器設計算法能夠更充分考慮到了源域中不同類間的可分離性、同類間的緊湊性、域間特征分布的差異性以及域間特征轉換學習中學習樣本對的選擇過程,并實現(xiàn)了目標到源域特征適應性更好的非線性轉換.通過目標域中少量標記樣本特征的轉換學習,隨著標記樣本數(shù)的增加,學習的分類器性能就越好.

        圖7 在目標域上的分類準確率隨目標域中可用標記樣本數(shù)量的變化曲線(其中源域中選擇了20個標記樣本,源域為dslr,目標域為webcam)Fig.7The accuracy rate curves in the target domain varying with the number of labeled samples in the target domain(Where 20 labeled samples in source domain is selected,the source domain here is dslr,while the target domain is webcam.)

        4 結論

        本文提出了一種新的基于邊際Fisher準則和遷移學習的小樣本集的分類器設計算法.通過對源域數(shù)據(jù)的特征分布的優(yōu)化和目標域到源域的遷移學習,實現(xiàn)了利用大量標記同構樣本集來提升小樣本集上分類準確率.與最近針對小樣本數(shù)據(jù)集上的分類器設計問題的算法進行對比,本文提出的算法不僅在小樣本數(shù)據(jù)集上的分類器準確率有所提高,并且隨著小樣本集中的標記樣本數(shù)量的增加,本文提出的分類器設計算法的性能提升得也更明顯.

        實驗結果雖然證實了本文算法的有效性,但依然有待改進的地方.其中一個是可以將該算法在邊際Fisher準則的基礎上引入核化函數(shù);另外一點是實驗中用的是800維的SURF特征,不排除有更好的特征表示方法.因此,以上兩點將是以后工作研究的重點.

        References

        1 Cristianini N,Shawe-Taylor J,Kandola J S.Spectral kernel methods for clustering.In:Proceedings of the 2001 Advances in Neural Information Processing Systems 14(NIPS01).London:MIT,2002.649-655

        2 Bosch A,Zisserman A,Munoz X.Representing shape with a spatial pyramid kernel.In:Proceedings of the 6th ACM International Conference on Image&Video Retrieval.New York:ACM,2007.401-408

        3 Saenko K,Kulis B,F(xiàn)ritz M,Darrell T.Adapting visual category models to new domains.In:Proceedings of the 11th European Conference on Computer Vision,Lecture Notes in Computer Science.Heraklion,Crete,Greece:Springer,2010.213-226

        4 Patel V M,Gopalan R,Li R,Chellappa R.Visual domain adaptation:a survey of recent advances.IEEE Signal Processing Magazine,2015,32(3):53-69

        5 Hoffman J,Rodner E,Donahue J,Darrell T,Saenko K.Efficient learning of domain-invariant image representations. arXiv:1301.3224,2013.

        6 Shao L,Zhu F,Li X.Transfer learning for visual categorization:a survey.IEEE Transactions on Neural Networks &Learning Systems,2015,26(5):1019-1034

        7 Gu Xin,Wang Shi-Tong,Xu Min.A new cross-multidomain classificationalgorithmanditsfastversionforlarge datasets.Acta Automatica Sinica,2014,40(3):531-547(顧鑫,王士同,許敏.基于多源的跨領域數(shù)據(jù)分類快速新算法.自動化學報,2014,40(3):531-547)

        8 Zhang Qian,Li Ming,Wang Xue-Song,Cheng Yu-Hu,Zhu Mei-Qiang.Instance-based transfer learning for multi-source domains.Acta Automatica Sinica,2014,40(6):1176-1183(張倩,李明,王雪松,程玉虎,朱美強.一種面向多源領域的實例遷移學習.自動化學報,2014,40(6):1176-1183)

        9 Yang J,Yan R,Hauptmann A G.Cross-domain video concept detection using adaptive SVMS.In:Proceedings of the 15th ACM International Conference on Multimedia.New York:ACM,2007.188-197

        10 Wang Xue-Song,Pan Jie,Cheng Yu-Hu,Cao Ge.Selfadaptive transfer for decision trees based on similarity metric.Acta Automatica Sinica,2013,39(12):2186-2192(王雪松,潘杰,程玉虎,曹戈.基于相似度衡量的決策樹自適應遷移.自動化學報,2013,39(12):2186-2192)

        11 Bergamo A,Torresani L.Exploiting weakly-labeled web images to improve object classification:a domain adaptation approach.In:Proceedings of the Advances in Neural Information Processing Systems 23.Vancouver,British Columbia,Canada:Curran Associates,Inc.,2010.181-189

        12 Li X.Regularized Adaptation:Theory,Algorithms and Applications[Ph.D.dissertation],University of Washington,USA,2007

        13 Dong Ai-Mei,Wang Shi-Tong.A shared latent subspace transfer learning algorithm using SVM.Acta Automatica Sinica,2014,40(10):2276-2287(董愛美,王士同.共享隱空間遷移SVM.自動化學報,2014,40(10):2276-2287)

        14 Oquab M,Bottou L,Laptev I,Sivic J.Learning and transferring mid-level image representations using convolutional neural networks.In:Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Columbus,OH:IEEE,2014.1717-1724

        15 Razavian A S,Azizpour H,Sullivan J,Carlsson S.CNN features off-the-shelf:an astounding baseline for recognition. Computer Vision&Pattern Recognition Workshops,2014. 512-519

        16 Kulis B,Saenko K,Darrell T.What you saw is not what you get:domain adaptation using asymmetric kernel transforms.In:Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Providence,RI:IEEE,2011.1785-1792

        17 Farhadi A,Tabrizi M K.Learning to recognize activities from the wrong view point.In:Proceedings of the 10th European Conference on Computer Vision—ECCV 2008. Marseille,F(xiàn)rance:Springer,2008.154-166

        18 Chopra S,Balakrishnan S,Gopalan R.DLID:deep learning for domain adaptation by interpolating between domains. In:Proceedings of the ICML Workshop on Representation Learning.Atlanta,Georgia,USA,2013.

        19 Wang H,Nie F P,Huang H,Ding C.Dyadic transfer learning for cross-domain image classification.In:Proceedings of the 2011 IEEE International Conference on Computer Vision.Barcelona:IEEE,2011.551-556

        20 Gong B,Shi Y,Sha F,Grauman,K.Geodesic flow kernel for unsupervised domain adaptation.In:Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition.Providence,RI:IEEE,2012.2066-2073

        21 Long M,Wang J,Sun J,Yu P S.Domain invariant transfer kernel learning.IEEE Transactions on Knowledge&Data Engineering,2015,27(6):1519-1532

        22 Shao L,Liu L,Li X L.Feature learning for image classification via multiobjective genetic programming.IEEE Transactions on Neural Networks and Learning Systems,2014,25(7):1359-1371

        23 Davis J V,Kulis B,Jain P,Sra S,Dhillon I S.Informationtheoretic metric learning.In:Proceedings of the 24th International Conference on Machine Learning.Corvallis,Oregon,USA:ACM,2007.209-216

        24 Yan S C,Xu D,Zhang B Y,Zhang H J,Yang Q,Lin S.Graph embedding and extensions:a general framework for dimensionality reduction.IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(1):40-51

        25 Li Y L,Liu P,Du H S,Li Z,Liu J H,Yu D Y,Li M Q. Marginal fisher analysis-based feature extraction for identification of drug and explosive concealed by body packing. Analytical Methods,2013,5(22):6331-6337

        26 Wang Z Q,Sun X.Optimal kernel marginal fisher analysis for face recognition.Journal of Computers,2012,7(9):2298-2305

        27 Al Censor Y,Zenios S A.Parallel optimization:theory,algorithms and applications.Scalable Computing:Practice& Experience.New York:Oxford University Press,1997.

        28 Duan L X,Xu D,Tsang I W.Learning with augmented features for heterogeneous domain adaptation.In:Proceedings of the 29th International Conference on Machine Learning. Edinburgh,Scotland,UK:Omnipress,2012.711-718

        舒醒浙江大學信息與電子工程學院碩士研究生.主要研究方向為計算機視覺,圖像分類.

        E-mail:21331093@zju.edu.cn

        (SHU XingMaster student at the CollegeofInformationScienceand Electronic Engineering,Zhejiang University.Her research interest covers computer vision and image classification.)

        于慧敏浙江大學信息與電子工程學院教授.主要研究方向為醫(yī)學圖像處理,計算機視覺.本文通信作者.

        E-mail:yhm2005@zju.edu.cn

        (YU Hui-MinProfessor at the College of Information Science and Electronic Engineering,Zhejiang University.His research interest covers medical image processing and computer vision.Corresponding author of this paper.)

        鄭偉偉浙江大學信息與電子工程學院博士研究生.主要研究方向為圖像匹配,跟蹤技術.

        E-mail:3090102748@zju.edu.cn

        (ZHENG Wei-WeiPh.D.candidate at the College of Information Science and Electronic Engineering,Zhejiang University.His research interest covers object matching and target tracking.)

        謝奕浙江大學信息與電子工程學院博士研究生.主要研究方向為圖像匹配,跟蹤技術.

        E-mail:Yixie@zju.edu.cn

        (XIE YiPh.D.candidate at the CollegeofInformationScienceand Electronic Engineering,Zhejiang University.His research interest covers object matching and target tracking.)

        胡浩基浙江大學信息與電子工程學院副教授.主要研究方向為圖像處理,計算機視覺.

        E-mail:haoji_hu@zju.edu.cn

        (HU Hao-JiAssistant professor at the College of Information Science and Electronic Engineering,Zhejiang University.His research interest covers image processing and computer vision.)

        唐慧明浙江大學信息與電子工程學院副教授.主要研究方向為圖像識別,計算機視覺.

        E-mail:tanghm@isee.zju.edu.cn

        (TANG Hui-MingAssistant professor at the College of Information Science and Electronic Engineering,Zhejiang University.His research interest covers image recognition and computer vision.)

        Manuscript September 9,2015;accepted December 11,2015

        Classifier-designing Algorithm on a Small Dataset Based on Margin Fisher Criterion and Transfer Learning

        SHU Xing1YU Hui-Min1,2ZHENG Wei-Wei1XIE Yi1HU Hao-Ji1TANG Hui-Ming1

        It has great practical significance to design a classifier on a small dataset(target domain)with the help of a large dataset(source domain).Since feature distribution varies on different datasets,the classifiers trained on the source domain cannot perform well on a target domain.To solve the problem,we propose a novel classifier-designing algorithm based on transfer learning theory.Firstly,to improve the compass of the same category and separateness of different categories in the source domain,this paper utilizes the extended margin Fisher criterion where the distance is measured by the inner product between data.Secondly,to select good sample pairs for transfer learning,this paper presents an algorithm to get rid of marginal singular points by selecting high-density samples in the source domain.The non-linear feature transformation mapping the target domain to the source domain is learned in the kernel space.Finally,k-nearest neighbor(kNN)classifiers are trained for classification.Compared with the existing works,this paper not only extends the margin Fisher criterion,but also applies the transfer learning theory based on the algorithm of selecting training sample pairs to design classifiers of a small dataset.We experimentally demonstrate the superiority of our method to effectively improve the performance of classifiers on the general datasets.

        Classifiers on a small dataset,transfer learning,margin Fisher criterion,k-nearest neighbor(kNN)classifiers,domain transformation

        10.16383/j.aas.2016.c150560

        2015-09-09錄用日期2015-12-11

        國家自然科學基金(61471321),教育部-中國移動科研基金(MCM20150503),國家自然科學基金(61202400),浙江省自然科學基金(LQ12F02014)資助

        Supported by National Natural Science Foundation of China(61471321),Ministry of Education-China Mobile Research Fund(MCM20150503),National Natural Science Foundation of China(61202400),and Natural Science Foundation of Zhejiang Province(LQ12F02014)

        本文責任編委胡清華

        Recommended by Associate Editor HU Qing-Hua

        1.浙江大學信息與電子工程學院杭州3100272.浙江大學CAD&CG國家重點實驗室杭州310027

        1.College of Information Science and Electronic Engineering,Zhejiang University,Hangzhou 3100272.The State Key Laboratory of CAD&CG,Zhejiang University,Hangzhou 310027

        Shu Xing,Yu Hui-Min,Zheng Wei-Wei,Xie Yi,Hu Hao-Ji,Tang Hui-Ming.Classifier-designing algorithm on a small dataset based on margin Fisher criterion and transfer learning.Acta Automatica Sinica,2016,42(9):1313-1321

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機變量的分布列與數(shù)字特征
        具有兩個P’維非線性不可約特征標的非可解群
        月震特征及與地震的對比
        如何表達“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        詈語的文化蘊含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        日本高清乱码中文字幕| 亚洲av永久青草无码精品| 一区二区免费中文字幕| 久久精品人妻少妇一二三区| 蜜桃久久精品成人无码av| 久久永久免费视频| 另类人妖在线观看一区二区| 亚洲美女毛片在线视频| 性无码免费一区二区三区在线| 四虎永久免费一级毛片| 日韩少妇人妻一区二区| 日本黑人乱偷人妻在线播放| 国产av一区二区三区传媒| 久久麻豆精品国产99国产精| 久久国产精品一区二区| 黄污在线观看一区二区三区三州 | 永久免费av无码入口国语片| 国产精品三级一区二区按摩| 色视频日本一区二区三区| av素人中文字幕在线观看| 极品新婚夜少妇真紧| 亚洲色欲Aⅴ无码一区二区| 日韩亚洲国产中文字幕| 欧美肥妇毛多水多bbxx水蜜桃| 亲子乱aⅴ一区二区三区下载| 欧美日一本| 亚洲黄色av一区二区三区| 亚洲av无码一区二区三区乱子伦 | 国内精品久久久久久久久蜜桃| 日产分东风日产还有什么日产| 久久久久亚洲精品无码蜜桃| 国产精品麻豆最新AV| 国产av区亚洲av毛片| 免费a级毛片在线播放| 亚洲熟女综合一区二区三区| 成人综合亚洲欧美一区h| 国产情侣亚洲自拍第一页| 无码任你躁久久久久久老妇| 久久人妻AV无码一区二区| 少妇高潮精品正在线播放| 国内免费高清在线观看|