亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

自適應(yīng)嵌入的半監(jiān)督多視角特征降維方法

2019-01-07 12:22:56孫圣姿

計算機應(yīng)用 2018年12期

孫圣姿，萬源，曾成

(武漢理工大學(xué) 理學(xué)院，武漢 430070)(*通信作者電子郵箱wanyuan@whut.edu.cn)

0 引言

當(dāng)數(shù)據(jù)從不同數(shù)據(jù)源獲得或者由不同的特征集來共同表示，這類數(shù)據(jù)稱為多視角數(shù)據(jù)。比如圖像可以由灰度值、尺度不變特征變換(Scale-Invariant Feature Transform, SIFT)特征[1]、方向梯度直方圖(Histogram of Oriented Gradients, HOG)特征[2]等多種特征來表示；網(wǎng)頁可以由網(wǎng)站地址、網(wǎng)站名稱等多種特征表示。多視角數(shù)據(jù)的各個視角之間通常能夠提供互補和相關(guān)的信息，而傳統(tǒng)方法并不考慮這一點，因此如何有效提取不同視角的特征且保留各個視角之間的相關(guān)性來實現(xiàn)特征降維成為機器學(xué)習(xí)和數(shù)據(jù)挖掘近年來的研究熱點。基于結(jié)構(gòu)信息保持的特征提取方法通過最大程度上保持原始數(shù)據(jù)的結(jié)構(gòu)，包括全局結(jié)構(gòu)[3-4]和局部流形結(jié)構(gòu)[5-6]來實現(xiàn)特征降維。這些結(jié)構(gòu)可以通過圖約束模型來表示，如樣本成對相似圖[4]、K最近鄰(K-Nearest Neighbors,K-NN)圖[7]、局部判別模型[8]、局部線性嵌入(Locally Linear Embedding, LLE)[3]等。在近年來的研究進(jìn)展中，嵌入矩陣被廣泛引入到各類特征提取方法中[9-10]，這些方法通過重構(gòu)各數(shù)據(jù)點與全局信息之間的關(guān)系，來保留原始的結(jié)構(gòu)。但是將這些方法應(yīng)用于多視角特征提取時，它們大多只是單獨對單視角的特征進(jìn)行選擇，然后將各視角直接相連，導(dǎo)致了各個視角間特征的相關(guān)性和部分原始信息的缺失。

在實際應(yīng)用中，收集到的數(shù)據(jù)存在少量標(biāo)簽數(shù)據(jù)和大量無標(biāo)簽數(shù)據(jù)是非常常見的。對數(shù)據(jù)加注標(biāo)簽信息會耗費大量時間精力，因此半監(jiān)督特征降維方法通過同時使用有標(biāo)簽和無標(biāo)簽兩類數(shù)據(jù)，來保留原始的結(jié)構(gòu)信息。近年來半監(jiān)督特征降維已取得一些研究成果。半監(jiān)督判別分析(Semi-supervised Discriminant Analysis, SDA)方法[11]，使用帶標(biāo)簽的數(shù)據(jù)點來最大化不同類別之間的可分離性，通過標(biāo)記數(shù)據(jù)點來估計數(shù)據(jù)的固有幾何結(jié)構(gòu)。Xu等[12]通過最大化不同類別之間的分類邊界來選擇特征，利用幾何概率分布來生成標(biāo)記的和未標(biāo)記的數(shù)據(jù)，并將其轉(zhuǎn)化成凸凹優(yōu)化問題。Coelho等[13]提出了一種基于單變量相關(guān)性度量的半監(jiān)督特征選擇方法，在Pareto最優(yōu)集合中決策最優(yōu)解的過程中，嘗試最大化每個特征的相關(guān)性指標(biāo)，確定最小的相關(guān)特征集，同時確定最優(yōu)模型。

然而這些方法直接應(yīng)用于多視角數(shù)據(jù)進(jìn)行特征降維效果并不理想。多視角問題中，針對全局結(jié)構(gòu)的保持項，非監(jiān)督自適應(yīng)性特征選擇(unsupervised Feature Selection with Adaptive Structure Learning, FSASL)方法[14]提出了一種多視角下自適應(yīng)性的全局結(jié)構(gòu)保持方法，通過稀疏重構(gòu)來保留數(shù)據(jù)的原始結(jié)構(gòu)。將各個視角的數(shù)據(jù)信息映射到一個最優(yōu)稀疏組合權(quán)重矩陣。同時，一些改進(jìn)的半監(jiān)督模式下的多視角學(xué)習(xí)方法被相繼提出。半監(jiān)督多視角特征選擇(Semi-supervised Multi-view Feature Selection, Semi-MFS)方法[15]通過將多個數(shù)據(jù)點分解成多個有意義且不相關(guān)的組別來生成不同的視圖，每個組別代表一個視角，每個視角描述一個數(shù)據(jù)特征。Sun等[16]提出一種通過遺傳算法構(gòu)建多視圖的特征選擇方法，用于尋找可能的特征子集。多視角黑賽半監(jiān)督低維特征選擇(Multi-view Hessian Semi-supervised sparse Feature Selection for multimedia analysis, MHSFS)方法[17]，利用多視圖學(xué)習(xí)來揭示和利用不同視圖間的相關(guān)和互補信息，從而直接實現(xiàn)多視圖稀疏特征選擇。Zhu等[18]提出了一個新的多視角半監(jiān)督學(xué)習(xí)框架，利用圖像中偽標(biāo)簽包含的信息提高圖像分類的預(yù)測性能。

這些方法仍然存在兩個主要問題：1)嵌入思想類似于單視角問題的研究。大多數(shù)已有方法在各個單視角下引入的嵌入矩陣都是相同的，并未考慮到不同視角間特征的差異性。2)一些半監(jiān)督特征降維方法，僅僅局限于局部結(jié)構(gòu)的保持項，并未考慮到全局范圍的特征降維，且部分方法由于缺乏對降維后的低維矩陣的稀疏約束，無法避免噪聲和其他不相關(guān)特征的影響。

針對以上兩個問題，本文提出了一種自適應(yīng)嵌入的半監(jiān)督多視角特征降維方法(Semi-Supervised Adaptive Multi-View Embedding method for feature dimension reduction, SS-AMVE),將嵌入思想直接引入到多視角問題中，考慮各視角下特征的差異性，將投影從單視角下相同的自適應(yīng)矩陣擴展到多視角間不同的矩陣。在半監(jiān)督模式下引入全局結(jié)構(gòu)的保持項,將不含標(biāo)簽信息的數(shù)據(jù)利用無監(jiān)督模式方法進(jìn)行嵌入投影；對于含有標(biāo)簽的數(shù)據(jù)，結(jié)合分類的判別信息進(jìn)行線性投影。然后，將多投影映射到一個統(tǒng)一的低維空間，使用組合權(quán)重矩陣保留全局結(jié)構(gòu)，并引入正則化參數(shù)。實驗結(jié)果表明，所提方法較好地保留了多視角間特征的相關(guān)性，捕獲了更多的具有判別信息的特征。

1 相關(guān)工作

相關(guān)學(xué)者相繼提出各種多視角特征降維方法[19-20]。對于多維特征，通過引入嵌入思想，構(gòu)建各視角間的相似性矩陣來保留原始的結(jié)構(gòu)信息，已經(jīng)取得了一定的研究成果。FSASL方法[14]提出了一種多視角下自適應(yīng)性的全局結(jié)構(gòu)保持方法，通過稀疏重構(gòu)來保留數(shù)據(jù)的原始結(jié)構(gòu)。將各個視角的數(shù)據(jù)信息映射到一個最優(yōu)稀疏組合權(quán)重矩陣，并在重構(gòu)過程中引入行變換矩陣W，具體表達(dá)式如下：

(1)

s. t.Qii=0,WTXXTW=I

式中：X={x1,x2,…,xn}∈Rd×n為原始的數(shù)據(jù)矩陣；α為約束低維矩陣的正則化參數(shù)；Q為全局特征投影到低維空間下的組合權(quán)重矩陣。約束WTXXTW=I可以避免受到小樣本量數(shù)據(jù)的影響。l1范數(shù)正則化可以產(chǎn)生稀疏權(quán)值矩陣，即產(chǎn)生一個稀疏模型，用于特征提取使得特征系數(shù)變?yōu)?。

在半監(jiān)督模式下，多視角間局部特征結(jié)構(gòu)的保持顯得尤為重要。對于有標(biāo)簽和無標(biāo)簽的數(shù)據(jù)，一個統(tǒng)一的半監(jiān)督特征降維框架(a unified framework for Semi-Supervised Dimensionality Reduction, SSDR)方法[21]提出利用兩者在投影空間中的正則化項，可以以一種共同的方法來提取視角的局部結(jié)構(gòu)信息，在一定程度上保留原始結(jié)構(gòu)信息和成對約束信息。最終得到以下正則化目標(biāo)函數(shù)：

(2)

式中：Mij為相似性矩陣；L為拉普拉斯矩陣。

進(jìn)一步，半監(jiān)督模式下，對于正則化線性判別(Regularization Linear Discriminant Analysis, RLDA)方法及正則化最大距離準(zhǔn)則(Regularization Maximum Margin Criterion, RMMC)方法，投影矩陣W的求解可以分別通過以下形式得到：

(3)

(4)

其中，類內(nèi)散布矩陣Sw和類間散布矩陣Sb定義為:

(5)

2 半監(jiān)督模式下多視角特征降維框架

在半監(jiān)督模式下，以上提到的FSASL方法沒有考慮各單視角投影矩陣的差異。SSDR方法在特征降維時僅僅引入局部結(jié)構(gòu)的保持項，且由于缺乏對低維矩陣的稀疏約束，有時無法避免噪聲和其他不相關(guān)特征的影響。因此，針對以上問題，本文提出了SS-AMVE。目標(biāo)函數(shù)可以分成兩個部分，分別為全局結(jié)構(gòu)保持項和局部結(jié)構(gòu)保持項。同時，對每個視角上的投影矩陣添加行稀疏約束，具體的流程如圖1所示。

圖1 SS-AMVE流程Fig. 1 Flow chart of SS-AMVE

2.1 保持局部結(jié)構(gòu)的半監(jiān)督多視角學(xué)習(xí)

設(shè)第v個視角上的投影矩陣為Wv=[Wv1,Wv2,…，Wv,dn]∈RDn×dn，則第v個視角上的低維嵌入為WvTXv，由此得到表達(dá)式:

(6)

對各投影矩陣添加稀疏性約束，局部保持項的目標(biāo)函數(shù)變?yōu)?

(7)

同樣，在有標(biāo)簽和無標(biāo)簽的數(shù)據(jù)信息同時存在的條件下，本文針對多視角半監(jiān)督模式下的RLDA方法及RMMC方法中的投影矩陣進(jìn)行具體的求解，以保留局部的流形結(jié)構(gòu)信息。

2.1.1 半監(jiān)督多視角RLDA局部結(jié)構(gòu)保持

將RLDA方法由單視角推廣到多視角問題，各視角下投影矩陣的表達(dá)式為:

(8)

式(8)通過最大限度地減少類內(nèi)特征的分散性，來保留局部的流形結(jié)構(gòu)。參數(shù)α、β則用來平衡正則化的形式。

2.1.2 半監(jiān)督多視角RMMC局部結(jié)構(gòu)保持

類似的，將正則化最大距離準(zhǔn)則(RMMC)方法推廣到多視角半監(jiān)督特征降維，各視角下投影矩陣的表達(dá)式轉(zhuǎn)化為:

(9)

2.2 保持全局結(jié)構(gòu)的半監(jiān)督多視角自適應(yīng)嵌入

2.2.1 無標(biāo)簽數(shù)據(jù)信息的全局結(jié)構(gòu)保持

對于不含標(biāo)簽的數(shù)據(jù)，可以直接將其看作非監(jiān)督模式下的特征降維。非監(jiān)督自適應(yīng)性特征選擇(FSASL)方法，并未考慮不同視角特征的差異性，認(rèn)為得到的投影矩陣都是相同的。對此，進(jìn)行一定程度上的推廣與改進(jìn)。

對每個視角分別定義一個行稀疏特征選擇和變換矩陣Wv∈Rd×c。為了保留更多的特征，將各單視角下得到的投影求和作為最終選定的特征空間。對于每個特定的單視角，得到以下的結(jié)構(gòu)保持項:

s. t.WTW=I,Tii=0

進(jìn)一步，將其推廣到多視角問題，對各個視角下提取出的特征進(jìn)行求和，得到多視角下全局結(jié)構(gòu)的表達(dá)式:

(10)

s. t.WvTWv=I,Tii=0

與成對相似性相比，稀疏表示具有一定的識別性：在所有的候選樣本中，它選擇距離目標(biāo)最近的樣本，舍掉所有其他不夠緊湊的候選樣本。由此，可以進(jìn)一步優(yōu)化對嵌入矩陣的求解。

2.2.2 含標(biāo)簽數(shù)據(jù)信息的全局結(jié)構(gòu)保持

在半監(jiān)督學(xué)習(xí)模式中，對于包含標(biāo)簽的一些數(shù)據(jù)，需要結(jié)合標(biāo)簽信息，對不同視角下的特征投影進(jìn)行說明。在此，同樣對正則化線性判別(RLDA)方法及正則化最大距離準(zhǔn)則(RMMC)方法在半監(jiān)督模式下的特征投影矩陣進(jìn)行具體的求解。類似的，不同視角下的特征存在差異性，需要對單視角的投影矩陣分別進(jìn)行定義。

考慮數(shù)據(jù)的標(biāo)簽信息時，對于正則化線性判別(RLDA)方法，在特定的第v個視角下，投影矩陣的定義如式(8)。對于正則化最大距離準(zhǔn)則(RMMC)方法，在第v個視角下，投影矩陣定義如式(9)。

2.3 多視角半監(jiān)督模式下的自適應(yīng)嵌入特征降維

由此，將嵌入思想直接引入到半監(jiān)督多視角問題中，同時對各個視角下的數(shù)據(jù)進(jìn)行特征降維，完成了整體特征的重構(gòu)以及局部特征的保持，最終得到目標(biāo)函數(shù):

(11)

3 算法求解

LT=(I-T)(I-T)T

L=LT+Lv

目標(biāo)函數(shù)變?yōu)?

又由于μ‖T‖為獨立項，與Wv無關(guān)，可轉(zhuǎn)化為：

(12)

其中Dv是一個對角矩陣，對角線上的元素為：

(13)

s. t.WvTWv=I

交替迭代更新式(12)即可得到Wv對應(yīng)的特征向量。

變量T只存在于第一項中，當(dāng)固定其他變量時，已知約束條件Tii=0，故可由求解以下問題來對T進(jìn)行優(yōu)化：

s. t.Tii=0

對T求偏導(dǎo)，有:

μ=0

通過求解得到：

(14)

為方便表示，定義：

優(yōu)化函數(shù)可以表示為：

利用拉格朗日方程，得到以下等式:

其中，σ為拉格朗日系數(shù)，化簡得:

根據(jù)約束條件:

則:

(15)

由此，本文分別得到了三個變量的優(yōu)化表達(dá)式，具體的更新過程如算法1所示。

算法1 自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)。

初始化：

迭代更新：

Forv=1 ToV(循環(huán)v個視角)

計算各視角下的Sw,Sb；

s. t.WvTWv=I

通過交替迭代得到Wv對應(yīng)的特征向量；

對于多視角正則化線性判別(MV-SSLDA)方法，根據(jù)式(8)，計算特征值及特征向量；

對于多視角正則化最大距離準(zhǔn)則(MV-SSMMC)方法，根據(jù)式(9)，計算特征值及特征向量；

直到收斂。

分別對v個視角下Xv的特征進(jìn)行排序，選取前kv個特征作為結(jié)果。

4 實驗結(jié)果及分析

本文設(shè)計了4組實驗來驗證自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)的性能和效果。

4.1 實驗數(shù)據(jù)集和實驗設(shè)置

在實驗中，本文使用4個圖像數(shù)據(jù)集，來測試自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法( SS-AMVE)的性能。具體包括：Yale face(http://www.oalib.com/references/9283312)，Handwritten digits(http://yann.lecun.com/exdb/mnist)，WebKB(http://www.cs.umd.edu/～sen/lbc-proj/LBC.html)，Labelme(http://labelme2.csail.mit.edu/Release3.0/index.php)，以上分別為不同領(lǐng)域下不同類別的圖片資源。

圖2給出了部分樣本圖像。具體的圖像提取信息如表1所示。其中，維度是標(biāo)簽的一種屬性。每個樣本的標(biāo)簽信息，可以表示一個特定維度的數(shù)據(jù)標(biāo)識；而對于多視角特征提取，標(biāo)簽通常代表多種含義。因此對于同一個樣本，本文選取多個維度進(jìn)行數(shù)據(jù)集的測試實驗。對于4個數(shù)據(jù)集，隨機將每個數(shù)據(jù)集中的數(shù)據(jù)分為含標(biāo)簽信息的數(shù)據(jù)和不含標(biāo)簽信的數(shù)據(jù)。將本文方法與拉普拉斯得分(Laplacian Score, LS)、半監(jiān)督判別分析(SDA)、半監(jiān)督特征降維框架(SSDR)、多視角半監(jiān)督特征降維(Multiple View Semi-Supervised Dimensionality Reduction, MVSSDR)四種方法進(jìn)行對比，各方法內(nèi)容介紹如下：

1)LS方法[7]：該方法通過計算特征對于原始結(jié)構(gòu)的局部保持能力，根據(jù)得分大小選擇與最高分相對應(yīng)的特征。

2)SDA方法[11]：該方法使用帶標(biāo)簽的數(shù)據(jù)點來最大化不同類別之間的可分離性，通過標(biāo)記數(shù)據(jù)點來估計數(shù)據(jù)的固有幾何結(jié)構(gòu)。

3)SSDR方法[21]：半監(jiān)督降維方法中，通過成對約束矩陣平衡每個視角的嵌入投影。同時，引入線性變換使得不同視角下的不同嵌入特征矩陣具有可比性。

4)MVSSDR方法[22]：該方法將SSDR方法引入到多視角數(shù)據(jù)中，且利用稀疏正則方式進(jìn)行半監(jiān)督多視角特征降維。

圖2 部分樣本圖像Fig. 2 Some sample images表1 樣本數(shù)據(jù)集信息Tab. 1 Information of sample datasets

數(shù)據(jù)集樣本數(shù)特征數(shù)維度數(shù)數(shù)據(jù)集樣本數(shù)特征數(shù)維度數(shù)Yale face1653066WebKB8775648Digits179710010Labelme1206474

在4種方法LS、SDA、SSDR、MVSSDR中設(shè)置最近鄰個數(shù)為5，參數(shù)β、γ通過格點搜索來確定。同時，將本文方法中的參數(shù)μ設(shè)為1，設(shè)定各個視角上所選特征數(shù)總數(shù)為100。對于單視角特征選擇算法LS，仍按各個視角上特征數(shù)的比例來決定各個視角上要選擇的特征的數(shù)量，采用逐個視角上特征降維的策略。對于MVSSDR方法，在數(shù)據(jù)上運行算法，得到各個視角上的投影矩陣來選擇特征。進(jìn)一步，改變含標(biāo)簽信息的數(shù)據(jù)量，本文對所有算法進(jìn)行了15次實驗，并記錄了聚類準(zhǔn)確率(ACC)的平均值和標(biāo)準(zhǔn)差。考慮到聚類性能隨初始聚類中心的選擇而變化，本文在4種算法中調(diào)節(jié)譜聚類形式20次。

4.2 實驗結(jié)果與分析

4.2.1 半監(jiān)督模式下不同方法的聚類結(jié)果

對于LS方法，采用逐個視角上特征降維的策略，通過調(diào)整各個視角上特征數(shù)的比例來確定各個視角上要提取的特征的數(shù)量。對于SSDR和MVSSDR方法，通過各個視角上的投影矩陣得到提取結(jié)果。改變含標(biāo)簽信息的數(shù)據(jù)量，比較含標(biāo)簽信息的數(shù)量不同的情況下特征降維的結(jié)果。

對于半監(jiān)督的方法，利用所有可見數(shù)據(jù)集合，包括有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)，對其進(jìn)行訓(xùn)練。5種算法和基線的聚類準(zhǔn)確率(ACC)結(jié)果如表2所示。

從表2可以看出，除了數(shù)據(jù)集Digits外，本文提出的SS-AMVE在其他數(shù)據(jù)集中都優(yōu)于其他4種方法。在WebKB數(shù)據(jù)集上，SS-AMVE比其他方法的最佳結(jié)果增加了10%以上。在Labelme數(shù)據(jù)集上，SS-AMVE平均的提升比例也接近9%。與SDA和SSDR方法相比，SS-AMVE整體上能夠得到更好的結(jié)果。應(yīng)用本文方法SS-AMVE，人臉圖像可以被映射到由“半監(jiān)督特征面”構(gòu)成的半監(jiān)督判別子空間中?？梢钥闯?，SS-AMVE考慮了不同視角下的投影矩陣的差異，并將其統(tǒng)一映射到一個組合空間中，通過引入低維矩陣可以消除不相關(guān)特征的影響。而對于Digits數(shù)據(jù)集的ACC結(jié)果，SS-AMVE雖未達(dá)到基準(zhǔn)線,但仍然優(yōu)于其他方法。

表2 不同算法聚類準(zhǔn)確率(ACC)的平均值和標(biāo)準(zhǔn)偏差 %Tab. 2 Average and standard deviation of different algorithm clustering accuracy (ACC) %

4.2.2 不同特征數(shù)下各方法的性能比較

為了更直觀地觀察不同方法之間的性能差異，對于4個數(shù)據(jù)集，5種算法在不同數(shù)量特征下的聚類準(zhǔn)確率(ACC)如圖3所示。

圖3 不同特征數(shù)下不同方法的ACCFig. 3 ACC of different methods under different feature numbers

從圖3(a)可以看出，隨著所選特征數(shù)量的增加，本文方法的聚類準(zhǔn)確率呈現(xiàn)平穩(wěn)上升趨勢，除了所選特征數(shù)為50時，本文方法都有最高的聚類準(zhǔn)確率，且當(dāng)特征數(shù)大于80時，本文方法的準(zhǔn)確率基本趨于穩(wěn)定。

從圖3(b)中可以看出，對比的4個方法整體上均呈現(xiàn)平穩(wěn)上升的趨勢，并當(dāng)特征數(shù)大于70時保持穩(wěn)定，當(dāng)所選特征數(shù)量為60～100時，本文方法雖然略低于基準(zhǔn)線，但都有最高的聚類準(zhǔn)確率。

從圖3(c)可以看出，本文方法在處理WebKB數(shù)據(jù)集時有很好的聚類準(zhǔn)確率，在所選特征數(shù)量是40～100時均優(yōu)于基準(zhǔn)線，并且準(zhǔn)確率較穩(wěn)定。

從圖3(d)可以看出，本文方法的聚類準(zhǔn)確率整體上變化幅度很小，當(dāng)所選特征數(shù)量為20～60和80～100時能得到最優(yōu)的聚類準(zhǔn)確率。

由上述分析可知，在大多數(shù)情況下，SS-AMVE的聚類準(zhǔn)確率優(yōu)于其他方法。一方面，在選擇的特征數(shù)量相同的情況下，本文的方法可以更加緊湊地保留數(shù)據(jù)的結(jié)構(gòu)信息；另一方面，SS-AMVE可以實現(xiàn)更高效的降維，特別是在數(shù)據(jù)集WebKB中。

在Digits和Labelme中，自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法( SS-AMVE)的ACC值很接近或者有時略大于半監(jiān)督特征降維框架(SSDR)方法，而在其他數(shù)據(jù)集中則不是很接近這種情況,表明SS-AMVE在處理部分?jǐn)?shù)據(jù)方面有其自身的優(yōu)勢。

當(dāng)特征數(shù)量較大時，SSDR有著更好的聚類性能，表明SSDR方法能有效地獲得原始數(shù)據(jù)的全局和內(nèi)在幾何結(jié)構(gòu)，從而獲得更多的判別信息。

4.2.3 不同平衡程度下的樣本集結(jié)果比較

在數(shù)據(jù)集WebKB和Labelme中，不同平衡程度下SS-AMVE樣本集結(jié)果如表3可知。由表3可以看出，兩個數(shù)據(jù)集中，在有無標(biāo)簽比例為1∶1時，本文方法的聚類準(zhǔn)確率(ACC)最高，且均大于50%。由此可見本文提出的半監(jiān)督方法，更適用于一些特定的數(shù)據(jù)集;當(dāng)有無標(biāo)簽比例改變時，SS-AMVE聚類準(zhǔn)確率稍有變化，但仍大于50%，具有一定的普適性。

表3 不同平衡程度下SS-AMVE樣本集結(jié)果Tab. 3 Sample set results of SS-AMVE at different equilibrium levels

4.2.4 算法靈敏度分析

本文進(jìn)行了大量的實驗來測試參數(shù)的靈敏度，并選定WebKB和Labelme作為實驗數(shù)據(jù)集。當(dāng)β固定為1，改變γ取值時，本文方法SS-AMVE在數(shù)據(jù)集上的ACC結(jié)果如圖4所示。當(dāng)γ固定為1，改變β取值時，本文方法SS-AMVE在數(shù)據(jù)集上的ACC結(jié)果如圖5所示。由圖4～5可以發(fā)現(xiàn)，相較于參數(shù)β，SS-AMVE對參數(shù)γ更為敏感。在圖4中, 在數(shù)據(jù)集WebKB中，當(dāng)γ=1時，SS-AMVE有較高的ACC值。在圖5中, 對參數(shù)β而言，SS-AMVE的ACC值相對穩(wěn)定，尤其在數(shù)據(jù)集WebKB中；值得注意的是，在Labelme數(shù)據(jù)集中，當(dāng)β=1時，SS-AMVE的ACC值幾乎是不變的。

4.2.5 算法收斂性

自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)在數(shù)據(jù)集WebKB和Labelme下的收斂性曲線如圖6所示。由圖6可以看出，目標(biāo)函數(shù)值在迭代期間不增加，并最終收斂到固定值，SS-AMVE在10次迭代內(nèi)收斂，表明了該方法具有較為快速的收斂速度。

圖5 SS-AMVE在不同特征數(shù)和β下的ACC(γ=1)Fig. 5 ACC of SS-AMVE under different feature numbers and β (γ=1)

4.2.6 算法復(fù)雜度

圖6 不同迭代次數(shù)下SS-AMVE的目標(biāo)函數(shù)值Fig. 6 Objective function values of SS-AMVE under different iterations

5 結(jié)語

本文提出了一種半監(jiān)督特征降維方法，即自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)，直接將嵌入思想引入到多視角中，并將從各個視角提取的特征映射到一個統(tǒng)一的空間，以保持整體的全局結(jié)構(gòu)。考慮到不同視角下的特征可能不同，本文將各單視角下相同的嵌入投影矩陣推廣到多視角間的不同矩陣。對于有標(biāo)簽與無標(biāo)簽的信息同時存在的高維數(shù)據(jù)，在局部特征得到保留的基礎(chǔ)上，增加了全局結(jié)構(gòu)的保持項。將不含標(biāo)簽信息的數(shù)據(jù)利用無監(jiān)督模式方法進(jìn)行嵌入投影；對于含有標(biāo)簽的數(shù)據(jù)，結(jié)合分類的判別信息進(jìn)行線性投影。使用組合權(quán)重矩陣來保留全局結(jié)構(gòu)，很大程度上消除了噪聲及不相關(guān)因素的影響。實驗結(jié)果表明，自適應(yīng)嵌入的半監(jiān)督多視角特征間降維方法(SS-AMVE)是保持全局和局部結(jié)構(gòu)的有效方法，在半監(jiān)督多視角問題中可以更好地提取出具有判別信息的特征。

本文所提方法涉及到了特征值分解，而這一過程的時間復(fù)雜度對于計算機的內(nèi)存要求大，且時間效率不夠高，因此需要尋求更好更快的解決方法。同時，方法中參數(shù)的設(shè)定值影響提取效果，而如何確定參數(shù)的最優(yōu)值，是進(jìn)一步需要研究的方向。