亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自適應(yīng)嵌入的半監(jiān)督多視角特征降維方法

        2019-01-07 12:22:56孫圣姿
        計算機應(yīng)用 2018年12期
        關(guān)鍵詞:降維投影標(biāo)簽

        孫圣姿,萬 源,曾 成

        (武漢理工大學(xué) 理學(xué)院,武漢 430070)(*通信作者電子郵箱wanyuan@whut.edu.cn)

        0 引言

        當(dāng)數(shù)據(jù)從不同數(shù)據(jù)源獲得或者由不同的特征集來共同表示,這類數(shù)據(jù)稱為多視角數(shù)據(jù)。比如圖像可以由灰度值、尺度不變特征變換(Scale-Invariant Feature Transform, SIFT)特征[1]、方向梯度直方圖(Histogram of Oriented Gradients, HOG)特征[2]等多種特征來表示;網(wǎng)頁可以由網(wǎng)站地址、網(wǎng)站名稱等多種特征表示。多視角數(shù)據(jù)的各個視角之間通常能夠提供互補和相關(guān)的信息,而傳統(tǒng)方法并不考慮這一點,因此如何有效提取不同視角的特征且保留各個視角之間的相關(guān)性來實現(xiàn)特征降維成為機器學(xué)習(xí)和數(shù)據(jù)挖掘近年來的研究熱點。基于結(jié)構(gòu)信息保持的特征提取方法通過最大程度上保持原始數(shù)據(jù)的結(jié)構(gòu),包括全局結(jié)構(gòu)[3-4]和局部流形結(jié)構(gòu)[5-6]來實現(xiàn)特征降維。這些結(jié)構(gòu)可以通過圖約束模型來表示,如樣本成對相似圖[4]、K最近鄰(K-Nearest Neighbors,K-NN)圖[7]、局部判別模型[8]、局部線性嵌入(Locally Linear Embedding, LLE)[3]等。在近年來的研究進(jìn)展中,嵌入矩陣被廣泛引入到各類特征提取方法中[9-10],這些方法通過重構(gòu)各數(shù)據(jù)點與全局信息之間的關(guān)系,來保留原始的結(jié)構(gòu)。但是將這些方法應(yīng)用于多視角特征提取時,它們大多只是單獨對單視角的特征進(jìn)行選擇,然后將各視角直接相連,導(dǎo)致了各個視角間特征的相關(guān)性和部分原始信息的缺失。

        在實際應(yīng)用中,收集到的數(shù)據(jù)存在少量標(biāo)簽數(shù)據(jù)和大量無標(biāo)簽數(shù)據(jù)是非常常見的。對數(shù)據(jù)加注標(biāo)簽信息會耗費大量時間精力,因此半監(jiān)督特征降維方法通過同時使用有標(biāo)簽和無標(biāo)簽兩類數(shù)據(jù),來保留原始的結(jié)構(gòu)信息。近年來半監(jiān)督特征降維已取得一些研究成果。半監(jiān)督判別分析(Semi-supervised Discriminant Analysis, SDA)方法[11],使用帶標(biāo)簽的數(shù)據(jù)點來最大化不同類別之間的可分離性,通過標(biāo)記數(shù)據(jù)點來估計數(shù)據(jù)的固有幾何結(jié)構(gòu)。Xu等[12]通過最大化不同類別之間的分類邊界來選擇特征,利用幾何概率分布來生成標(biāo)記的和未標(biāo)記的數(shù)據(jù),并將其轉(zhuǎn)化成凸凹優(yōu)化問題。Coelho等[13]提出了一種基于單變量相關(guān)性度量的半監(jiān)督特征選擇方法,在Pareto最優(yōu)集合中決策最優(yōu)解的過程中,嘗試最大化每個特征的相關(guān)性指標(biāo),確定最小的相關(guān)特征集,同時確定最優(yōu)模型。

        然而這些方法直接應(yīng)用于多視角數(shù)據(jù)進(jìn)行特征降維效果并不理想。多視角問題中,針對全局結(jié)構(gòu)的保持項,非監(jiān)督自適應(yīng)性特征選擇(unsupervised Feature Selection with Adaptive Structure Learning, FSASL)方法[14]提出了一種多視角下自適應(yīng)性的全局結(jié)構(gòu)保持方法,通過稀疏重構(gòu)來保留數(shù)據(jù)的原始結(jié)構(gòu)。將各個視角的數(shù)據(jù)信息映射到一個最優(yōu)稀疏組合權(quán)重矩陣。同時,一些改進(jìn)的半監(jiān)督模式下的多視角學(xué)習(xí)方法被相繼提出。半監(jiān)督多視角特征選擇(Semi-supervised Multi-view Feature Selection, Semi-MFS)方法[15]通過將多個數(shù)據(jù)點分解成多個有意義且不相關(guān)的組別來生成不同的視圖,每個組別代表一個視角,每個視角描述一個數(shù)據(jù)特征。Sun等[16]提出一種通過遺傳算法構(gòu)建多視圖的特征選擇方法,用于尋找可能的特征子集。多視角黑賽半監(jiān)督低維特征選擇(Multi-view Hessian Semi-supervised sparse Feature Selection for multimedia analysis, MHSFS)方法[17],利用多視圖學(xué)習(xí)來揭示和利用不同視圖間的相關(guān)和互補信息,從而直接實現(xiàn)多視圖稀疏特征選擇。Zhu等[18]提出了一個新的多視角半監(jiān)督學(xué)習(xí)框架,利用圖像中偽標(biāo)簽包含的信息提高圖像分類的預(yù)測性能。

        這些方法仍然存在兩個主要問題:1)嵌入思想類似于單視角問題的研究。大多數(shù)已有方法在各個單視角下引入的嵌入矩陣都是相同的,并未考慮到不同視角間特征的差異性。2)一些半監(jiān)督特征降維方法,僅僅局限于局部結(jié)構(gòu)的保持項,并未考慮到全局范圍的特征降維,且部分方法由于缺乏對降維后的低維矩陣的稀疏約束,無法避免噪聲和其他不相關(guān)特征的影響。

        針對以上兩個問題,本文提出了一種自適應(yīng)嵌入的半監(jiān)督多視角特征降維方法(Semi-Supervised Adaptive Multi-View Embedding method for feature dimension reduction, SS-AMVE),將嵌入思想直接引入到多視角問題中,考慮各視角下特征的差異性,將投影從單視角下相同的自適應(yīng)矩陣擴展到多視角間不同的矩陣。在半監(jiān)督模式下引入全局結(jié)構(gòu)的保持項,將不含標(biāo)簽信息的數(shù)據(jù)利用無監(jiān)督模式方法進(jìn)行嵌入投影;對于含有標(biāo)簽的數(shù)據(jù),結(jié)合分類的判別信息進(jìn)行線性投影。然后,將多投影映射到一個統(tǒng)一的低維空間,使用組合權(quán)重矩陣保留全局結(jié)構(gòu),并引入正則化參數(shù)。實驗結(jié)果表明,所提方法較好地保留了多視角間特征的相關(guān)性,捕獲了更多的具有判別信息的特征。

        1 相關(guān)工作

        相關(guān)學(xué)者相繼提出各種多視角特征降維方法[19-20]。對于多維特征,通過引入嵌入思想,構(gòu)建各視角間的相似性矩陣來保留原始的結(jié)構(gòu)信息,已經(jīng)取得了一定的研究成果。FSASL方法[14]提出了一種多視角下自適應(yīng)性的全局結(jié)構(gòu)保持方法,通過稀疏重構(gòu)來保留數(shù)據(jù)的原始結(jié)構(gòu)。將各個視角的數(shù)據(jù)信息映射到一個最優(yōu)稀疏組合權(quán)重矩陣,并在重構(gòu)過程中引入行變換矩陣W,具體表達(dá)式如下:

        (1)

        s. t.Qii=0,WTXXTW=I

        式中:X={x1,x2,…,xn}∈Rd×n為原始的數(shù)據(jù)矩陣;α為約束低維矩陣的正則化參數(shù);Q為全局特征投影到低維空間下的組合權(quán)重矩陣。約束WTXXTW=I可以避免受到小樣本量數(shù)據(jù)的影響。l1范數(shù)正則化可以產(chǎn)生稀疏權(quán)值矩陣,即產(chǎn)生一個稀疏模型,用于特征提取使得特征系數(shù)變?yōu)?。

        在半監(jiān)督模式下,多視角間局部特征結(jié)構(gòu)的保持顯得尤為重要。對于有標(biāo)簽和無標(biāo)簽的數(shù)據(jù),一個統(tǒng)一的半監(jiān)督特征降維框架(a unified framework for Semi-Supervised Dimensionality Reduction, SSDR)方法[21]提出利用兩者在投影空間中的正則化項,可以以一種共同的方法來提取視角的局部結(jié)構(gòu)信息,在一定程度上保留原始結(jié)構(gòu)信息和成對約束信息。最終得到以下正則化目標(biāo)函數(shù):

        (2)

        式中:Mij為相似性矩陣;L為拉普拉斯矩陣。

        進(jìn)一步,半監(jiān)督模式下,對于正則化線性判別(Regularization Linear Discriminant Analysis, RLDA)方法及正則化最大距離準(zhǔn)則(Regularization Maximum Margin Criterion, RMMC)方法,投影矩陣W的求解可以分別通過以下形式得到:

        (3)

        (4)

        其中,類內(nèi)散布矩陣Sw和類間散布矩陣Sb定義為:

        (5)

        2 半監(jiān)督模式下多視角特征降維框架

        在半監(jiān)督模式下,以上提到的FSASL方法沒有考慮各單視角投影矩陣的差異。SSDR方法在特征降維時僅僅引入局部結(jié)構(gòu)的保持項,且由于缺乏對低維矩陣的稀疏約束,有時無法避免噪聲和其他不相關(guān)特征的影響。因此,針對以上問題,本文提出了SS-AMVE。目標(biāo)函數(shù)可以分成兩個部分,分別為全局結(jié)構(gòu)保持項和局部結(jié)構(gòu)保持項。同時,對每個視角上的投影矩陣添加行稀疏約束,具體的流程如圖1所示。

        圖1 SS-AMVE流程Fig. 1 Flow chart of SS-AMVE

        2.1 保持局部結(jié)構(gòu)的半監(jiān)督多視角學(xué)習(xí)

        設(shè)第v個視角上的投影矩陣為Wv=[Wv1,Wv2,…,Wv,dn]∈RDn×dn,則第v個視角上的低維嵌入為WvTXv,由此得到表達(dá)式:

        (6)

        對各投影矩陣添加稀疏性約束,局部保持項的目標(biāo)函數(shù)變?yōu)?

        (7)

        同樣,在有標(biāo)簽和無標(biāo)簽的數(shù)據(jù)信息同時存在的條件下,本文針對多視角半監(jiān)督模式下的RLDA方法及RMMC方法中的投影矩陣進(jìn)行具體的求解,以保留局部的流形結(jié)構(gòu)信息。

        2.1.1 半監(jiān)督多視角RLDA局部結(jié)構(gòu)保持

        將RLDA方法由單視角推廣到多視角問題,各視角下投影矩陣的表達(dá)式為:

        (8)

        式(8)通過最大限度地減少類內(nèi)特征的分散性,來保留局部的流形結(jié)構(gòu)。參數(shù)α、β則用來平衡正則化的形式。

        2.1.2 半監(jiān)督多視角RMMC局部結(jié)構(gòu)保持

        類似的,將正則化最大距離準(zhǔn)則(RMMC)方法推廣到多視角半監(jiān)督特征降維,各視角下投影矩陣的表達(dá)式轉(zhuǎn)化為:

        (9)

        2.2 保持全局結(jié)構(gòu)的半監(jiān)督多視角自適應(yīng)嵌入

        2.2.1 無標(biāo)簽數(shù)據(jù)信息的全局結(jié)構(gòu)保持

        對于不含標(biāo)簽的數(shù)據(jù),可以直接將其看作非監(jiān)督模式下的特征降維。非監(jiān)督自適應(yīng)性特征選擇(FSASL)方法,并未考慮不同視角特征的差異性,認(rèn)為得到的投影矩陣都是相同的。對此,進(jìn)行一定程度上的推廣與改進(jìn)。

        對每個視角分別定義一個行稀疏特征選擇和變換矩陣Wv∈Rd×c。為了保留更多的特征,將各單視角下得到的投影求和作為最終選定的特征空間。對于每個特定的單視角,得到以下的結(jié)構(gòu)保持項:

        s. t.WTW=I,Tii=0

        進(jìn)一步,將其推廣到多視角問題,對各個視角下提取出的特征進(jìn)行求和,得到多視角下全局結(jié)構(gòu)的表達(dá)式:

        (10)

        s. t.WvTWv=I,Tii=0

        與成對相似性相比,稀疏表示具有一定的識別性:在所有的候選樣本中,它選擇距離目標(biāo)最近的樣本,舍掉所有其他不夠緊湊的候選樣本。由此,可以進(jìn)一步優(yōu)化對嵌入矩陣的求解。

        2.2.2 含標(biāo)簽數(shù)據(jù)信息的全局結(jié)構(gòu)保持

        在半監(jiān)督學(xué)習(xí)模式中,對于包含標(biāo)簽的一些數(shù)據(jù),需要結(jié)合標(biāo)簽信息,對不同視角下的特征投影進(jìn)行說明。在此,同樣對正則化線性判別(RLDA)方法及正則化最大距離準(zhǔn)則(RMMC)方法在半監(jiān)督模式下的特征投影矩陣進(jìn)行具體的求解。類似的,不同視角下的特征存在差異性,需要對單視角的投影矩陣分別進(jìn)行定義。

        考慮數(shù)據(jù)的標(biāo)簽信息時,對于正則化線性判別(RLDA)方法,在特定的第v個視角下,投影矩陣的定義如式(8)。對于正則化最大距離準(zhǔn)則(RMMC)方法,在第v個視角下,投影矩陣定義如式(9)。

        2.3 多視角半監(jiān)督模式下的自適應(yīng)嵌入特征降維

        由此,將嵌入思想直接引入到半監(jiān)督多視角問題中,同時對各個視角下的數(shù)據(jù)進(jìn)行特征降維,完成了整體特征的重構(gòu)以及局部特征的保持,最終得到目標(biāo)函數(shù):

        (11)

        3 算法求解

        LT=(I-T)(I-T)T

        L=LT+Lv

        目標(biāo)函數(shù)變?yōu)?

        又由于μ‖T‖為獨立項,與Wv無關(guān),可轉(zhuǎn)化為:

        (12)

        其中Dv是一個對角矩陣,對角線上的元素為:

        (13)

        s. t.WvTWv=I

        交替迭代更新式(12)即可得到Wv對應(yīng)的特征向量。

        變量T只存在于第一項中,當(dāng)固定其他變量時,已知約束條件Tii=0,故可由求解以下問題來對T進(jìn)行優(yōu)化:

        s. t.Tii=0

        對T求偏導(dǎo),有:

        μ=0

        通過求解得到:

        (14)

        為方便表示,定義:

        優(yōu)化函數(shù)可以表示為:

        利用拉格朗日方程,得到以下等式:

        其中,σ為拉格朗日系數(shù),化簡得:

        根據(jù)約束條件:

        則:

        (15)

        由此,本文分別得到了三個變量的優(yōu)化表達(dá)式,具體的更新過程如算法1所示。

        算法1 自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)。

        初始化:

        迭代更新:

        Forv=1 ToV(循環(huán)v個視角)

        計算各視角下的Sw,Sb;

        s. t.WvTWv=I

        通過交替迭代得到Wv對應(yīng)的特征向量;

        對于多視角正則化線性判別(MV-SSLDA)方法,根據(jù)式(8),計算特征值及特征向量;

        對于多視角正則化最大距離準(zhǔn)則(MV-SSMMC)方法,根據(jù)式(9),計算特征值及特征向量;

        直到收斂。

        分別對v個視角下Xv的特征進(jìn)行排序,選取前kv個特征作為結(jié)果。

        4 實驗結(jié)果及分析

        本文設(shè)計了4組實驗來驗證自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)的性能和效果。

        4.1 實驗數(shù)據(jù)集和實驗設(shè)置

        在實驗中,本文使用4個圖像數(shù)據(jù)集,來測試自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法( SS-AMVE)的性能。具體包括:Yale face(http://www.oalib.com/references/9283312),Handwritten digits(http://yann.lecun.com/exdb/mnist),WebKB(http://www.cs.umd.edu/~sen/lbc-proj/LBC.html),Labelme(http://labelme2.csail.mit.edu/Release3.0/index.php),以上分別為不同領(lǐng)域下不同類別的圖片資源。

        圖2給出了部分樣本圖像。具體的圖像提取信息如表1所示。其中,維度是標(biāo)簽的一種屬性。每個樣本的標(biāo)簽信息,可以表示一個特定維度的數(shù)據(jù)標(biāo)識;而對于多視角特征提取,標(biāo)簽通常代表多種含義。因此對于同一個樣本,本文選取多個維度進(jìn)行數(shù)據(jù)集的測試實驗。對于4個數(shù)據(jù)集,隨機將每個數(shù)據(jù)集中的數(shù)據(jù)分為含標(biāo)簽信息的數(shù)據(jù)和不含標(biāo)簽信的數(shù)據(jù)。將本文方法與拉普拉斯得分(Laplacian Score, LS)、半監(jiān)督判別分析(SDA)、半監(jiān)督特征降維框架(SSDR)、多視角半監(jiān)督特征降維(Multiple View Semi-Supervised Dimensionality Reduction, MVSSDR)四種方法進(jìn)行對比,各方法內(nèi)容介紹如下:

        1)LS方法[7]:該方法通過計算特征對于原始結(jié)構(gòu)的局部保持能力,根據(jù)得分大小選擇與最高分相對應(yīng)的特征。

        2)SDA方法[11]:該方法使用帶標(biāo)簽的數(shù)據(jù)點來最大化不同類別之間的可分離性,通過標(biāo)記數(shù)據(jù)點來估計數(shù)據(jù)的固有幾何結(jié)構(gòu)。

        3)SSDR方法[21]:半監(jiān)督降維方法中,通過成對約束矩陣平衡每個視角的嵌入投影。同時,引入線性變換使得不同視角下的不同嵌入特征矩陣具有可比性。

        4)MVSSDR方法[22]:該方法將SSDR方法引入到多視角數(shù)據(jù)中,且利用稀疏正則方式進(jìn)行半監(jiān)督多視角特征降維。

        圖2 部分樣本圖像Fig. 2 Some sample images表1 樣本數(shù)據(jù)集信息Tab. 1 Information of sample datasets

        數(shù)據(jù)集樣本數(shù)特征數(shù)維度數(shù)數(shù)據(jù)集樣本數(shù)特征數(shù)維度數(shù)Yale face1653066WebKB8775648Digits179710010Labelme1206474

        在4種方法LS、SDA、SSDR、MVSSDR中設(shè)置最近鄰個數(shù)為5,參數(shù)β、γ通過格點搜索來確定。同時,將本文方法中的參數(shù)μ設(shè)為1,設(shè)定各個視角上所選特征數(shù)總數(shù)為100。對于單視角特征選擇算法LS,仍按各個視角上特征數(shù)的比例來決定各個視角上要選擇的特征的數(shù)量,采用逐個視角上特征降維的策略。對于MVSSDR方法,在數(shù)據(jù)上運行算法,得到各個視角上的投影矩陣來選擇特征。進(jìn)一步,改變含標(biāo)簽信息的數(shù)據(jù)量,本文對所有算法進(jìn)行了15次實驗,并記錄了聚類準(zhǔn)確率(ACC)的平均值和標(biāo)準(zhǔn)差。考慮到聚類性能隨初始聚類中心的選擇而變化,本文在4種算法中調(diào)節(jié)譜聚類形式20次。

        4.2 實驗結(jié)果與分析

        4.2.1 半監(jiān)督模式下不同方法的聚類結(jié)果

        對于LS方法,采用逐個視角上特征降維的策略,通過調(diào)整各個視角上特征數(shù)的比例來確定各個視角上要提取的特征的數(shù)量。對于SSDR和MVSSDR方法,通過各個視角上的投影矩陣得到提取結(jié)果。改變含標(biāo)簽信息的數(shù)據(jù)量,比較含標(biāo)簽信息的數(shù)量不同的情況下特征降維的結(jié)果。

        對于半監(jiān)督的方法,利用所有可見數(shù)據(jù)集合,包括有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù),對其進(jìn)行訓(xùn)練。5種算法和基線的聚類準(zhǔn)確率(ACC)結(jié)果如表2所示。

        從表2可以看出,除了數(shù)據(jù)集Digits外,本文提出的SS-AMVE在其他數(shù)據(jù)集中都優(yōu)于其他4種方法。在WebKB數(shù)據(jù)集上,SS-AMVE比其他方法的最佳結(jié)果增加了10%以上。在Labelme數(shù)據(jù)集上,SS-AMVE平均的提升比例也接近9%。與SDA和SSDR方法相比,SS-AMVE整體上能夠得到更好的結(jié)果。應(yīng)用本文方法SS-AMVE,人臉圖像可以被映射到由“半監(jiān)督特征面”構(gòu)成的半監(jiān)督判別子空間中??梢钥闯?,SS-AMVE考慮了不同視角下的投影矩陣的差異,并將其統(tǒng)一映射到一個組合空間中,通過引入低維矩陣可以消除不相關(guān)特征的影響。而對于Digits數(shù)據(jù)集的ACC結(jié)果,SS-AMVE雖未達(dá)到基準(zhǔn)線,但仍然優(yōu)于其他方法。

        表2 不同算法聚類準(zhǔn)確率(ACC)的平均值和標(biāo)準(zhǔn)偏差 %Tab. 2 Average and standard deviation of different algorithm clustering accuracy (ACC) %

        4.2.2 不同特征數(shù)下各方法的性能比較

        為了更直觀地觀察不同方法之間的性能差異,對于4個數(shù)據(jù)集,5種算法在不同數(shù)量特征下的聚類準(zhǔn)確率(ACC)如圖3所示。

        圖3 不同特征數(shù)下不同方法的ACCFig. 3 ACC of different methods under different feature numbers

        從圖3(a)可以看出,隨著所選特征數(shù)量的增加,本文方法的聚類準(zhǔn)確率呈現(xiàn)平穩(wěn)上升趨勢,除了所選特征數(shù)為50時,本文方法都有最高的聚類準(zhǔn)確率,且當(dāng)特征數(shù)大于80時,本文方法的準(zhǔn)確率基本趨于穩(wěn)定。

        從圖3(b)中可以看出,對比的4個方法整體上均呈現(xiàn)平穩(wěn)上升的趨勢,并當(dāng)特征數(shù)大于70時保持穩(wěn)定,當(dāng)所選特征數(shù)量為60~100時,本文方法雖然略低于基準(zhǔn)線,但都有最高的聚類準(zhǔn)確率。

        從圖3(c)可以看出,本文方法在處理WebKB數(shù)據(jù)集時有很好的聚類準(zhǔn)確率,在所選特征數(shù)量是40~100時均優(yōu)于基準(zhǔn)線,并且準(zhǔn)確率較穩(wěn)定。

        從圖3(d)可以看出,本文方法的聚類準(zhǔn)確率整體上變化幅度很小,當(dāng)所選特征數(shù)量為20~60和80~100時能得到最優(yōu)的聚類準(zhǔn)確率。

        由上述分析可知,在大多數(shù)情況下,SS-AMVE的聚類準(zhǔn)確率優(yōu)于其他方法。一方面,在選擇的特征數(shù)量相同的情況下,本文的方法可以更加緊湊地保留數(shù)據(jù)的結(jié)構(gòu)信息;另一方面,SS-AMVE可以實現(xiàn)更高效的降維,特別是在數(shù)據(jù)集WebKB中。

        在Digits和Labelme中,自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法( SS-AMVE)的ACC值很接近或者有時略大于半監(jiān)督特征降維框架(SSDR)方法,而在其他數(shù)據(jù)集中則不是很接近這種情況,表明SS-AMVE在處理部分?jǐn)?shù)據(jù)方面有其自身的優(yōu)勢。

        當(dāng)特征數(shù)量較大時,SSDR有著更好的聚類性能,表明SSDR方法能有效地獲得原始數(shù)據(jù)的全局和內(nèi)在幾何結(jié)構(gòu),從而獲得更多的判別信息。

        4.2.3 不同平衡程度下的樣本集結(jié)果比較

        在數(shù)據(jù)集WebKB和Labelme中,不同平衡程度下SS-AMVE樣本集結(jié)果如表3可知。由表3可以看出,兩個數(shù)據(jù)集中,在有無標(biāo)簽比例為1∶1時,本文方法的聚類準(zhǔn)確率(ACC)最高,且均大于50%。由此可見本文提出的半監(jiān)督方法,更適用于一些特定的數(shù)據(jù)集;當(dāng)有無標(biāo)簽比例改變時,SS-AMVE聚類準(zhǔn)確率稍有變化,但仍大于50%,具有一定的普適性。

        表3 不同平衡程度下SS-AMVE樣本集結(jié)果Tab. 3 Sample set results of SS-AMVE at different equilibrium levels

        4.2.4 算法靈敏度分析

        本文進(jìn)行了大量的實驗來測試參數(shù)的靈敏度,并選定WebKB和Labelme作為實驗數(shù)據(jù)集。當(dāng)β固定為1,改變γ取值時,本文方法SS-AMVE在數(shù)據(jù)集上的ACC結(jié)果如圖4所示。當(dāng)γ固定為1,改變β取值時,本文方法SS-AMVE在數(shù)據(jù)集上的ACC結(jié)果如圖5所示。由圖4~5可以發(fā)現(xiàn),相較于參數(shù)β,SS-AMVE對參數(shù)γ更為敏感。在圖4中, 在數(shù)據(jù)集WebKB中,當(dāng)γ=1時,SS-AMVE有較高的ACC值。在圖5中, 對參數(shù)β而言,SS-AMVE的ACC值相對穩(wěn)定,尤其在數(shù)據(jù)集WebKB中;值得注意的是,在Labelme數(shù)據(jù)集中,當(dāng)β=1時,SS-AMVE的ACC值幾乎是不變的。

        4.2.5 算法收斂性

        自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)在數(shù)據(jù)集WebKB和Labelme下的收斂性曲線如圖6所示。由圖6可以看出,目標(biāo)函數(shù)值在迭代期間不增加,并最終收斂到固定值,SS-AMVE在10次迭代內(nèi)收斂,表明了該方法具有較為快速的收斂速度。

        圖5 SS-AMVE在不同特征數(shù)和β下的ACC(γ=1)Fig. 5 ACC of SS-AMVE under different feature numbers and β (γ=1)

        4.2.6 算法復(fù)雜度

        圖6 不同迭代次數(shù)下SS-AMVE的目標(biāo)函數(shù)值Fig. 6 Objective function values of SS-AMVE under different iterations

        5 結(jié)語

        本文提出了一種半監(jiān)督特征降維方法,即自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE),直接將嵌入思想引入到多視角中,并將從各個視角提取的特征映射到一個統(tǒng)一的空間,以保持整體的全局結(jié)構(gòu)。考慮到不同視角下的特征可能不同,本文將各單視角下相同的嵌入投影矩陣推廣到多視角間的不同矩陣。對于有標(biāo)簽與無標(biāo)簽的信息同時存在的高維數(shù)據(jù),在局部特征得到保留的基礎(chǔ)上,增加了全局結(jié)構(gòu)的保持項。將不含標(biāo)簽信息的數(shù)據(jù)利用無監(jiān)督模式方法進(jìn)行嵌入投影;對于含有標(biāo)簽的數(shù)據(jù),結(jié)合分類的判別信息進(jìn)行線性投影。使用組合權(quán)重矩陣來保留全局結(jié)構(gòu),很大程度上消除了噪聲及不相關(guān)因素的影響。實驗結(jié)果表明,自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)是保持全局和局部結(jié)構(gòu)的有效方法,在半監(jiān)督多視角問題中可以更好地提取出具有判別信息的特征。

        本文所提方法涉及到了特征值分解,而這一過程的時間復(fù)雜度對于計算機的內(nèi)存要求大,且時間效率不夠高,因此需要尋求更好更快的解決方法。同時,方法中參數(shù)的設(shè)定值影響提取效果,而如何確定參數(shù)的最優(yōu)值,是進(jìn)一步需要研究的方向。

        猜你喜歡
        降維投影標(biāo)簽
        Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
        解變分不等式的一種二次投影算法
        基于最大相關(guān)熵的簇稀疏仿射投影算法
        降維打擊
        海峽姐妹(2019年12期)2020-01-14 03:24:40
        找投影
        找投影
        無懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        標(biāo)簽化傷害了誰
        基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
        計算機工程(2015年8期)2015-07-03 12:20:27
        亚洲中文字幕乱码一二三区| 亚洲精品天天影视综合网| 麻豆精品国产精华液好用吗| 国产全肉乱妇杂乱视频| 在线亚洲+欧美+日本专区| 少妇一区二区三区乱码| 国产精品亚洲一区二区三区在线| 人人妻人人添人人爽欧美一区| 一区二区三区乱码在线 | 欧洲| 欧美变态口味重另类在线视频| 中文字幕av无码一区二区三区电影| 超短裙老师在线观看一区| 亚洲乱码av乱码国产精品| 挺进邻居丰满少妇的身体| 人妻少妇邻居少妇好多水在线 | 国产成人喷潮在线观看| 色悠久久久久综合欧美99| 人片在线观看无码| 国产精品女丝袜白丝袜美腿| 精品精品久久宅男的天堂| 亚洲avav天堂av在线网毛片| 草莓视频成人| 国产一区二区三区视频了| 日本午夜精品一区二区三区| 国产无套粉嫩白浆在线| 国内老熟妇对白xxxxhd| 狠狠色丁香婷婷久久综合2021| 麻豆国产精品伦理视频| 亚洲精品久久久久一区二区| 国产激情久久久久影院老熟女免费| 中文亚洲爆乳av无码专区 | 麻豆三级视频网站在线观看| 精品人妖一区二区三区四区| 国精产品推荐视频| 加勒比无码专区中文字幕| 一级午夜理论片日本中文在线| 国产乱码精品一区二区三区久久| 在线天堂www中文| 国产精品亚洲一区二区杨幂| 天堂av中文在线官网| 日本av一区二区三区视频|