亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用稀疏自編碼的局部譜聚類映射算法*

        2018-01-24 07:53:41陳秀宏何佳佳
        傳感器與微系統(tǒng) 2018年1期
        關(guān)鍵詞:鄰域聚類編碼

        萬 月, 陳秀宏, 何佳佳

        (江南大學(xué) 數(shù)字媒體學(xué)院,江蘇 無錫 214122)

        0 引 言

        深度學(xué)習(xí)能發(fā)現(xiàn)高維數(shù)據(jù)中深層次復(fù)雜結(jié)構(gòu)特征,并提取數(shù)據(jù)從低維到高維的層次特征,最終提升對數(shù)據(jù)的分類以及預(yù)測的準確性[1]。文獻[2]通過神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí),文獻[3]探究了深度學(xué)習(xí)可以幫助特征學(xué)習(xí)獲取更佳的特征表示。

        譜聚類算法由于能識別任意形狀結(jié)構(gòu)數(shù)據(jù),且收斂于全局最優(yōu)解而被廣泛應(yīng)用[4,5]。傳統(tǒng)譜聚類通過高斯核函數(shù)建立鄰接矩陣,而高斯核參數(shù)σ均由人工設(shè)置[6]。文獻[7]在基于圖嵌入的半監(jiān)督算法中提出了具有局部差異的圖嵌入算法。文獻[8]將譜聚類應(yīng)用到圖像處理中,提出了一種彩色圖像分割算法。

        考慮到深度學(xué)習(xí)和譜聚類算法各自的優(yōu)勢,本文提出了一種利用稀疏自編碼的局部譜聚類映射算法,利用稀疏自編碼提取數(shù)據(jù)高層特征代替原始數(shù)據(jù);構(gòu)建鄰接矩陣時拋棄了傳統(tǒng)高斯核函數(shù)建立方法,避免了參數(shù)調(diào)節(jié),利用數(shù)據(jù)的流形性質(zhì)建立更能反映數(shù)據(jù)鄰域結(jié)構(gòu)的相似矩陣,算法在聚類同時引入數(shù)據(jù)映射的協(xié)同訓(xùn)練實現(xiàn)了映射與聚類的協(xié)同學(xué)習(xí)與訓(xùn)練,并更新類指標,進而獲得更精確的聚類結(jié)果。

        1 稀疏自編碼

        1.1 反向傳播算法

        稀疏自編碼建立在反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的具有三層的神經(jīng)網(wǎng)絡(luò)模型如圖1所示。

        圖1 基本的三層神經(jīng)網(wǎng)絡(luò)模型

        (1)

        n個數(shù)據(jù)的樣本集{x1,x2,…,xn},設(shè)與輸入值xi對應(yīng)的目標值yi,則對全部n個樣本數(shù)據(jù)的代價函數(shù)為

        (2)

        式中nl為網(wǎng)絡(luò)總層數(shù);sl為第l層的節(jié)點數(shù)(不包括偏置)。第一項為均方差項,第二項為權(quán)重衰減項,用以防止過擬合。

        1.2 稀疏性

        (3)

        (4)

        其中稀疏性參數(shù)ρ為充分小的正數(shù)。于是,稀疏自編碼的目標函數(shù)可以表示為

        (5)

        2 譜聚類

        2.1 譜聚類思想與算法

        定義Y=[y1,y2,…,yn]T∈{0,1}n×C,其中yi∈{0,1}C為xi的聚類指標向量,若xi屬于第C類,則yij=1;否則,yij=0,j=1,2,…,C,i=1,2,…,n。定義標量化的聚類指標矩陣[9]F=[F1,F2,…,Fn]T=Y(YTY)-1/2,其中Fi為xi的標量化聚類指標向量,F(xiàn)的第j列為

        (6)

        式中nj為屬于第j類數(shù)據(jù)的個數(shù)。則譜聚類可表示為以下優(yōu)化問題

        min tr(FTLF),s.t.F=Y(YTY)-1/2

        (7)

        傳統(tǒng)譜聚類中,由高斯核建立鄰接矩陣

        (8)

        式中Nk(·)為數(shù)據(jù)的k近鄰。由于式(7)中的F為離散量,直接求解比較困難,所以需要對F進行松弛轉(zhuǎn)換為連續(xù)量后聚類。

        2.2 局部譜聚類

        以上譜聚類的鄰接矩陣并未考慮數(shù)據(jù)的流形性質(zhì),以及局部鄰域結(jié)構(gòu),文獻[10]以每個數(shù)據(jù)與其鄰域點的線性組合進行線性重構(gòu),并利用重構(gòu)的權(quán)值矩陣Sl建立數(shù)據(jù)的相似矩陣,其目標函數(shù)為

        (9)

        (10)

        (11)

        3 局部譜聚類與映射的協(xié)同訓(xùn)練

        局部譜聚類雖然考慮了數(shù)據(jù)的局部流形結(jié)構(gòu),但只是單一聚類,借鑒文獻[11]的思路,本文每個樣本與其所屬類別可以建立一個明確的映射關(guān)系,即在聚類過程中將樣本映射到類指標矩陣上修正聚類指標。對于數(shù)據(jù)集X∈Rd×n,通過XTW將數(shù)據(jù)集映射到類指標矩陣F上,誤差最小化的問題可以用如下線性回歸模型來進行

        (12)

        式中 回歸系數(shù)W∈Rd×c;Ω(W)為對回歸系數(shù)的正則約束;β為約束系數(shù)。使用‖W‖2,1作為W的正則約束項。結(jié)合局部譜聚類,聚類算法與映射可以同時得到學(xué)習(xí)與調(diào)整,協(xié)同訓(xùn)練算法的目標函數(shù)轉(zhuǎn)換為

        s.t.FTF=I

        (13)

        定義一個d×d的對角矩陣U,其第j個對角元素Ujj為

        (14)

        則式(13)轉(zhuǎn)換為

        s.t.FTF=I

        (15)

        目標函數(shù)關(guān)于W求偏導(dǎo)數(shù)并令其為零得到

        W=α(αX(XT)+βU)-1XF

        (16)

        令A(yù)=α(αX(XT)+βU)-1,則W=AXF,代入式(15)

        βtr(FTXTATUAXF)s.t.FTF=I

        (17)

        式(13)可簡化為

        min tr(FTHF),s.t.FTF=I

        (18)

        式中H=(L1-αXTAX+αL)。通過對H進行特征分解,再用k-means對特征向量聚類即可。

        4 利用稀疏自編碼的局部譜聚類映射算法

        首先對數(shù)據(jù)進行稀疏自編碼提取高層特征,并以此類特征數(shù)據(jù)作為輸入進行局部譜聚類與映射(local spectral clustering mapping,LSCMS)協(xié)同訓(xùn)練。算法的具體過程如下:

        1)預(yù)處理階段:對于來自真實世界的圖片,采用ZCA白化算法對數(shù)據(jù)X進行預(yù)處理,消除數(shù)據(jù)冗余度,得到新的數(shù)據(jù)X1。在X1上進行稀疏自編碼訓(xùn)練,選擇合適的隱含層個數(shù),得到訓(xùn)練后提取的高層特征trainFeatures。

        2)協(xié)同訓(xùn)練階段:用提取的數(shù)據(jù)高層特征trainFeatures作為輸入數(shù)據(jù)X進行局部譜聚類和協(xié)同訓(xùn)練。

        b.由式(16)計算對角矩陣U,計算A=α(αX(XT)+βU)-1和H=(L1-αXTAX+αI);

        c.利用H的前C個特征向量來更新F;

        d.由W=AXF更新W,若某收斂條件滿足則停止迭代;否則,轉(zhuǎn)步驟(b);

        4)對得到的F的每一行進行k-means聚類,得到最終聚類結(jié)果。

        5 實驗與結(jié)果分析

        5.1 數(shù)據(jù)集以及實驗設(shè)置

        實驗中所使用的數(shù)據(jù)集包括6個UCI(University of California,Irvine)數(shù)據(jù)集、MNIST手寫數(shù)據(jù)集以及ORL和Yale人臉數(shù)據(jù)集,如表1所示。參數(shù)α和β取值均為1,并將本文算法與k-means算法[12]、模糊c均值[13](fuzzyc-means,F(xiàn)CM,隸屬度值為2)算法、傳統(tǒng)譜聚類(spectral clustering,SC)算法[14]以及通過高斯核建立鄰接矩陣的本文算法(spectral clustering and mapping algorithm using sparse autoencoders,SCMSA)進行對比。每種算法均重復(fù)20次后取平均結(jié)果。實驗硬件為Interl(R)Xeon(R)CPU E5-4607,2.60GHz(2)處理器,內(nèi)存為32GB,軟件為Win764位操作系統(tǒng)和MATLAB2014b。

        表1 數(shù)據(jù)集描述

        5.2 零相位成分分析白化

        零相位成分分析(zero-phase component analysis,ZCA)白化處理即將圖像相鄰像素間的冗余除去,使得白化后數(shù)據(jù)的特征之間相關(guān)性較低,并具有相同的方差。

        5.3 評價指標

        為了評價聚類效果,采用了以下兩種標準評價方法,兩個指標均值越大效果越好。

        1)F-measure

        (19)

        式中P為精確率(precision);R為召回率(recall);TP為正類被判定為正類的個數(shù);FP為負類被判定為正類的個數(shù);FN為正類判定為負類的個數(shù)。

        2)歸一化互信息

        兩個隨機向量X與Y間的歸一化互信息(normalized mutual information,NMI)為

        (20)

        式中I(X,Y)為X和Y之間的互信息;H(X)和H(Y)分別為X和Y的熵。

        5.4 實驗結(jié)果與分析

        表2、表3分別為數(shù)據(jù)集在不同算法中的F-measure值與NMI值的對比結(jié)果;圖2為在鄰域k的不同取值下,相關(guān)數(shù)據(jù)F-measure值與NMI值的變化情況,由于Wine和Seeds的鄰域選擇較少時聚類效果很差,所以,k從5開始,Olivetti 研究室(Olivetti research laboratory,ORL)與Yale人臉庫則從2開始取值。圖3為在k=5,α,β分別取10-4~104,間隔102時人臉數(shù)據(jù)ORL與Yale的聚類結(jié)果。

        圖2 鄰域k的取值對NMI與F-measure的影響

        圖3 α和β的取值對NMI與F-measure的影響

        圖2看出,UCI數(shù)據(jù)集中,當(dāng)k值從5開始增加,Wine和Seeds的聚類效果逐漸提升,k=25時達最大值,k超過25后聚類效果下降。人臉數(shù)據(jù)集中,k=5時,Yale與ORL數(shù)據(jù)庫聚類效果達到最佳,k超過25后,Yale數(shù)據(jù)集的聚類效果略下降,ORL數(shù)據(jù)集基本保持不變。所以k的選取對最終聚類效果有很大的影響。

        圖3中當(dāng)α,β過大時聚類效果很差,當(dāng)α=1,β=100時兩個數(shù)據(jù)集的NMI與F-measure值均最佳,由此看出數(shù)據(jù)映射對聚類效果有一定程度影響。

        從表2,表3可以看出LSCMS算法效果相較于其他聚類算法有明顯提高。證實了局部譜聚類與數(shù)據(jù)映射的協(xié)同訓(xùn)練有助于提升最終聚類效果。

        6 結(jié)束語

        提出了利用稀疏自編碼的局部譜聚類映射算法。首先對圖片進行ZCA白化處理消除圖片的冗余信息,然后進行稀疏自編碼特征提取代替原始數(shù)據(jù),通過鄰域重構(gòu)相似矩陣,并結(jié)合數(shù)據(jù)映射的協(xié)同訓(xùn)練進行聚類,驗證了本文算法的有效性與可行性。

        [1] 余 凱,賈 磊,陳雨強,等.深度學(xué)習(xí)的昨天,今天和明天[J].計算機研究與發(fā)展,2013,50(9):1799-1804.

        表2 相關(guān)算法的F-measure值

        表3 相關(guān)算法的的NMI

        [2] Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.

        [3] Bengio Y,Courville A,Vincent P.Representation learning:A review and new perspectives[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8):1798-1828.

        [4] Jia H,Ding S,Xu X,et al.The latest research progress on spectral clustering[J].Neural Computing and Applications,2014,24(7-8):1477-1486.

        [5] 李昌興,黃艷虎,支曉斌,等.基于加速k均值的譜聚類圖像分割算法改進[J].傳感器與微系統(tǒng),2016,35(9):137-140.

        [6] Ng A Y,Jordan M I,Weiss Y.On spectral clustering:Analysis and an algorithm[J].Advances in Neural Information Processing Systems,2002,2:849-856.

        [7] 梁興柱,林玉娥,林玉榮.半監(jiān)督有局部差異的圖嵌入算法[J].傳感器與微系統(tǒng),2014,33(7):144-146.

        [8] 張 琦,盧志茂,徐 森,等.基于相似度矩陣的譜聚類集成圖像分割[J].傳感器與微系統(tǒng),2013,32(10):21-23.

        [9] Ye J,Zhao Z,Wu M,et al.Discriminativek-means for cluste-ring[C]∥Proceedings of the Annual Conference on Advances in Neural Information Processing Systems,2007:1649-1656.

        [10] Wang F,Zhang C.Label propagation through linear neighborhood-s[J].IEEE Transactions on knowledge and Data Engineering,2008,20(1):55-67.

        [11] 汪荊琪,徐林莉.一種基于多視圖數(shù)據(jù)的半監(jiān)督特征選擇和聚類算法[J].數(shù)據(jù)采集與處理,2015,30(1):106-116.

        [12] Jain A K.Data clustering:50 years beyondk-means[J].Pattern recognition letters,2010,31(8):651-666.

        [13] Bezdek J C,Ehrlich R,Full W.FCM:The fuzzyc-means clustering algorithm[J].Computers & Geosciences,1984,10(2-3):191-203.

        [14] Ng A Y,Jordan M I,Weiss Y.On spectral clustering:Analysis and an algorithm[J].Advances in Neural Information Processing Systems,2002,2:849-856.

        猜你喜歡
        鄰域聚類編碼
        基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達圖像配準
        《全元詩》未編碼疑難字考辨十五則
        稀疏圖平方圖的染色數(shù)上界
        子帶編碼在圖像壓縮編碼中的應(yīng)用
        電子制作(2019年22期)2020-01-14 03:16:24
        Genome and healthcare
        基于鄰域競賽的多目標優(yōu)化算法
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        關(guān)于-型鄰域空間
        基于改進的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        欧美又粗又长又爽做受| 成年女人18毛片观看| 国产专区国产精品国产三级| 熟妇人妻无码中文字幕老熟妇| 久久精品无码免费不卡| 中日韩欧美高清在线播放| 日本成人中文字幕亚洲一区| 18禁免费无码无遮挡不卡网站 | 久久九九久精品国产| 日本a在线免费观看| 国产一区二区三区在线影院| 人人超碰人人爱超碰国产| 午夜成人精品福利网站在线观看| 午夜短无码| 少妇我被躁爽到高潮在线影片| 国产精品久久久爽爽爽麻豆色哟哟| 久久久久久久久久久国产 | 中文字幕一区二区人妻秘书| 国产av综合影院| 国产va免费精品高清在线观看| 精品久久免费国产乱色也| 99久久久无码国产精品性| 双乳被一左一右吃着动态图| 国产成人亚洲精品2020| 日本加勒比精品一区二区视频 | 日韩偷拍一区二区三区视频| 国产av一区二区网站| 超碰色偷偷男人的天堂| 精品性高朝久久久久久久| 久久久亚洲精品免费视频| 国产熟人精品一区二区| 日产无人区一线二线三线乱码蘑菇| 女高中生自慰污免费网站| 国产影片免费一级内射| 国产精品国产精品国产专区不卡| 玩弄人妻少妇500系列网址| 久久成人黄色免费网站| 青青草大香蕉视频在线观看| 熟女熟妇伦av网站| 国产精品亚洲综合色区韩国| 91盗摄偷拍一区二区三区|