亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于結構化多視圖稀疏限定的監(jiān)督特征選擇算法研究

        2018-02-23 05:17:00史彩娟段昌鈺谷志斌
        圖學學報 2018年6期
        關鍵詞:重要性數(shù)據(jù)庫監(jiān)督

        史彩娟,段昌鈺,谷志斌

        ?

        基于結構化多視圖稀疏限定的監(jiān)督特征選擇算法研究

        史彩娟,段昌鈺,谷志斌

        (華北理工大學,河北 唐山 063210)

        為了有效利用多視圖數(shù)據(jù)信息提升監(jiān)督特征選擇的性能,構建了一種結構化多視圖稀疏限定,并基于該稀疏限定提出了一種監(jiān)督特征選擇方法,即結構化多視圖監(jiān)督特征選擇方法(SMSFS)。該方法在特征選擇過程中能夠同時考慮不同視圖特征的重要性以及同一視圖中不同特征的重要性,從而有效的結合多視圖數(shù)據(jù)信息,提升監(jiān)督特征選擇的性能。SMSFS目標函數(shù)是非凸的,設計了一個有效的迭代算法對目標函數(shù)進行求解。將所提結構化多視圖監(jiān)督特征選擇方法SMSFS應用到了圖像標注任務,在NUS-WIDE和MSRA-MM2.0圖像數(shù)據(jù)庫上進行了實驗,并與其他特征選擇算法進行了比較,實驗結果表明該算法能夠有效結合多視圖數(shù)據(jù)信息,提升特征選擇性能。

        多視圖學習;結構化稀疏限定;監(jiān)督特征選擇

        近年,隨著信息技術以及計算機視覺技術的迅猛發(fā)展,圖像、視頻等數(shù)據(jù)被表示為不同類型的特征,如形狀特征、顏色特征、紋理特征等。每一種類型的特征都是從某一特定空間對圖像及視頻數(shù)據(jù)進行了描述,傳統(tǒng)上把這種由不同類型特征組成的數(shù)據(jù)稱為多視圖數(shù)據(jù)[1]。然而,這些多視圖數(shù)據(jù)中包含許多不相關特征,甚至是噪聲,因此,如何有效去除多余特征及噪聲,從而降低“維數(shù)災難”的特征選擇技術成為當前的研究熱點。面對多視圖數(shù)據(jù),傳統(tǒng)的單一視圖特征選擇算法已不能獲得較好的特征選擇效果,許多多視圖特征選擇方法被廣泛研究和提出。其中,最直接的方法就是將多視圖特征直接串接成一個長的特征向量,然后采用單一視圖特征選擇方法進行特征選擇[2-3]。該方法思路簡單,但將多視圖特征直接串接為一個長向量之后再進行特征選擇,破壞了不同視圖特征間的潛在關聯(lián),同時也缺乏物理解釋,使特征選擇的性能受到了影響。

        近年來,多視圖學習被廣泛應用到特征選擇算法之中,利用不同視圖之間的互補性及一致性來提升特征選擇的性能[1,4-5]。然而,現(xiàn)有的多視圖特征選擇方法基本上是將一個視圖數(shù)據(jù)看作一個整體,在特征選擇過程中僅僅考慮每一個視圖特征整體的重要性,而忽略了同一視圖中不同特征的重要性,使特征選擇性能受到影響。如果在多視圖稀疏特征選擇過程中,不僅考慮每一個視圖的重要性,選擇最具判別性的視圖特征外,同時考慮同一視圖中每一個特征的重要性,必將能夠更好地結合多視圖數(shù)據(jù)信息,從而提升特征選擇的性能。文獻[6]提出了組1范數(shù)(1-范數(shù)),能夠很好地判定同一視圖中不同特征的重要性。文 獻[7]通過引入組1范數(shù)(1-范數(shù))提出了一種稀疏多模態(tài)學習方法來整合多視圖異質特征。文獻[8]基于1范數(shù)(1-范數(shù))提出了一種新的非監(jiān)督深度稀疏特征選擇方法,特征選擇性能得到了提升。

        因此,為了更好地利用多視圖數(shù)據(jù)信息,本文提出了一種基于結構化多視圖稀疏限定的監(jiān)督特征選擇算法,即結構化多視圖監(jiān)督特征選擇(structured multi-view supervised feature selection,SMSFS)。結構化多視圖稀疏限定能夠使SMSFS在特征選擇過程中不僅考慮每一個視圖的重要性,同時考慮同一視圖中不同特征的重要性。SMSFS算法被應用到了圖像標注任務中,并在圖像數(shù)據(jù)庫NUS-WIDE[9]和MSRA-MM 2.0[10]上進行了實驗,結果表明該算法優(yōu)于其他特征選擇算法,能夠更好地結合多視圖數(shù)據(jù)信息來提升特征選擇的性能。

        1 相關工作

        本文相關工作為多視圖學習和結構化稀疏限定。

        1.1 多視圖學習

        現(xiàn)實中存在許多多視圖數(shù)據(jù),如圖像經(jīng)常被表示為形狀、顏色、紋理等不同的視覺特征,視頻被表示為視覺特征及聲音特征,網(wǎng)頁被表示為網(wǎng)頁內(nèi)容及相關鏈接等等。每一個視圖數(shù)據(jù)都具有一定的特征空間,具有特定的物理意義和統(tǒng)計特性。近年,多視圖學習得到廣泛研究,能夠揭示多視圖數(shù)據(jù)間的關聯(lián)及有效地結合不同視圖數(shù)據(jù)間的信息。根據(jù)多視圖間信息結合方式的不同,可以將現(xiàn)有的多視圖學習算法大致分成3類:①將多視圖數(shù)據(jù)直接串接為一個特征向量,然后采用單一視圖方法的多視圖學習算法[11-12]。該算法實現(xiàn)簡單,但不能有效揭示不同視圖特征之間的關聯(lián)及補充信息,既沒有考慮不同視圖特征的重要性,也沒有考慮同一視圖中不同特征的重要性。②將每一個視圖特征看成一個整體,將同一視圖中的所有特征賦予相同的系數(shù)。雖然該算法能夠很好的利用不同視圖特征之間的關聯(lián)性和互補性[13-16],但沒有考慮同一視圖特征中不同特征的重要性。③在學習過程中能夠同時考慮不同視圖的重要性以及同一視圖中不同特征的重要性[7-8]。

        1.2 結構化稀疏限定

        近年來,多種結構化稀疏限定被廣泛研究并被應用到特征選擇算法之中。文獻[17]對現(xiàn)有的特征選擇方法進行了綜述,根據(jù)所采用的兩種不同的結構化稀疏限定1范數(shù)(LASSO)[18]和l,p(0<≤1)矩陣范數(shù)[17],將特征選擇方法分成了基于向量的特征選擇方法和基于矩陣的特征選擇方法。1范數(shù)作為懲罰項對特征選擇系數(shù)施以約束,能夠使被選擇的特征盡可能稀疏,使訓練的模型具有稀疏性和可解釋性,因此被廣泛應用到特征選擇方法中。對于l,p(0<≤1)矩陣范數(shù),當=2,=1,即為2,1范數(shù)[19]。NIE等[20]將2,1范數(shù)應用到了特征選擇之中,該限定能夠保證在特征選擇過程中充分考慮不同特征之間的關聯(lián),聯(lián)合的選取特征。WANG和CHEN[21]提出了2,p(0<≤1)矩陣范數(shù),并指出當=1/2時,即2,1/2矩陣范數(shù)具有最好的性能。文 獻[2]基于2,1/2矩陣范數(shù)提出了一種圖拉普拉斯半監(jiān)督稀疏特征選擇方法。

        2 SMSFS算法

        本節(jié)提出一個新的基于結構化多視圖稀疏限定的監(jiān)督特征選擇框架,既結構化多視圖監(jiān)督特征選擇(structured multi-view supervised feature selection,SMSFS)。首先介紹結構化多視圖稀疏限定,然后提出了SMSFS算法,最后給出求解目標函數(shù)的迭代算法。

        2.1 結構化多視圖稀疏限定

        映射矩陣的組1-范數(shù)(1范數(shù))定義為

        映射矩陣的2,1/2矩陣范數(shù)定義為

        因此,由2,1/2范數(shù)和1-范數(shù)構建的用于特征選擇的結構化多視圖稀疏限定可以表示為

        結構化多視圖稀疏限定中1-范數(shù)強調每一個視圖的重要性,而2,1/2矩陣范數(shù)可以很好地考慮不同特征的重要性。因此,結構化多視圖稀疏限定能夠保證在特征選擇的過程中不僅考慮每一個視圖的重要性,同時考慮每一個視圖中不同特征的重要性,更好地結合多視圖數(shù)據(jù)信息,從而達到很好的特征選擇性能。

        2.2 SMSFS算法

        特征選擇框架一般可以表示為求解下面的最小化經(jīng)驗誤差

        本文損失函數(shù)選擇最簡單的最小二乘函數(shù),正則項為結構化多視圖稀疏限定,因此,本文提出的結構化多視圖監(jiān)督特征選擇算法SMSFS的目標函數(shù)可以表示為

        2.3 優(yōu)化求解

        由于2,1/2范數(shù)是非凸的,因此本文提出的結構化多視圖監(jiān)督特征選擇框架式(5)也是非凸的,下面提出了一個有效迭代方法來求解目標函數(shù)。

        此時目標函數(shù)式(5)可以寫成

        因此,可得到

        算法1. SMSFS 算法給出了求解目標函數(shù)式(5)的迭代算法。

        ②重復計算對角矩陣

        對于g(1≤≤),

        =+1;

        直到收斂;

        3 實 驗

        將SMSFS算法應用到圖像標注任務中,并在兩個大規(guī)模圖像數(shù)據(jù)庫NUS-WIDE[9]和MSRA- MM 2.0[10]上進行了實驗。

        3.1 數(shù)據(jù)庫及實驗設置

        NUS-WIDE數(shù)據(jù)庫包含269 648幅圖像,81個概念;MSRA-MM2.0數(shù)據(jù)庫包含50 000幅圖像,100個概念。實驗中對于兩個數(shù)據(jù)庫,均選用144維的顏色相關圖、128維的小波紋理和73維(NUS-WIDE數(shù)據(jù)庫)或者75維(MSRA-MM2.0數(shù)據(jù)庫)的邊緣方向直方圖和3種底層視覺特征作為圖像的3種視圖特征。

        實驗中隨機采樣3 000個圖像形成訓練數(shù)據(jù)集,剩余數(shù)據(jù)作為測試集。隨機進行10次試驗,將10次結果平均作為最終的標注結果。目標函數(shù)式(5)中的正則化參數(shù)和設定為{0.00001,0.001,0.1,1,10,1000,100000},采用交叉驗證方法記錄最好結果。

        實驗中將算法SMSFS與算法SMML[6]和SFUS[3]進行了比較。采用3種評估準則來評價算法性能,即平均準確率均值(mean average precision,MAP),ROC曲線下面積AUC的兩種情況MicroAUC和MacroAUC。

        3.2 與其他特征選擇算法的性能比較

        實驗中將本文算法SMSFS與另外兩種監(jiān)督特征選擇算法SFUS和SMML進行了比較,在兩個數(shù)據(jù)庫上進行了實驗,結果見表1,最好結果用黑體標識。

        表1 不同特征選擇方法性能比較

        從表1可以看出,無論是基于MAP,還是MacroAUC和MicroAUC,本文算法SMSFS性能優(yōu)于SFUS和SMML算法,說明SMSFS算法能夠利用結構化多視圖稀疏限定有效的結合多視圖數(shù)據(jù)信息,從而選取更具判別性的稀疏特征,獲得更好的特性選擇性能。

        3.3 選擇特征個數(shù)的影響

        本實驗驗證所選特征數(shù)目對標注性能的影響。設定所選特征數(shù)目分別為100、150、200、250和300以及全部特征(對于NUS-WIDE數(shù)據(jù)庫是345維,對于MSRA-MM數(shù)據(jù)庫是347維)。采用MAP作為評估準則,實驗結果如圖1所示。

        圖1顯示了算法SMSFS標注性能隨著所選特征數(shù)目變化而變化的情況。從圖1可以看出:①當所選用的特征數(shù)很少時(如特征數(shù)為100)對應的MAP要低于不進行特征選擇時(特征數(shù)為345或347)的MAP。這歸因于選擇的特征數(shù)很少時,一些有用信息被丟失。②當采用所有底層視覺特征(特征數(shù)為345或347)的時候,標注性能并不是最好,說明最初的底層視覺特征中包含一些冗余特征,影響了標注性能。③在兩個數(shù)據(jù)庫上,3種算法達到最好性能時所選用的特征數(shù)目均為250,但是算法SMSFS性能優(yōu)于另外兩種算法。因此,與另外兩種特征選擇算法相比,本文算法SMSFS能夠有效結合多視圖數(shù)據(jù)信息,選取更具判別性的特征,從而獲得最好的特征選擇性能,降低噪聲影響。

        圖1 性能MAP隨著選擇特征數(shù)目的變化而變化情況

        3.4 參數(shù)敏感性測試

        在目標函數(shù)式(5)中存在兩個正則化參數(shù)和,本節(jié)通過交叉驗證的方式驗證這兩個正則化參數(shù)對特征選擇性能的影響,其大小設定為{0.00001,0.001,0.1,1,10,1000,10000}。采用MAP作為評估準則,實驗結果如圖2所示。

        從圖2可以看出,不同的和組合對應不同的MAP結果,該算法對于參數(shù)和比較敏感。對于NUS-WIDE數(shù)據(jù)庫,當=1000、=10時具有最好的性能;對于MSRA-MM數(shù)據(jù)庫,當==10時性能最好。

        圖2 正則化參數(shù)敏感性分析

        4 結束語

        本文提出了一個新的基于結構化多視圖稀疏限定的監(jiān)督特征選擇算法SMSFS。本文算法能夠在特征選擇過程中同時考慮不同視圖的重要性以及同一視圖中不同特征的重要性,有效結合多視圖數(shù)據(jù)信息,從而提升特征選擇的性能。其目標函數(shù)是非凸的,本文設計了一個有效的迭代算法對目標函數(shù)進行求解。將該算法應用到了圖像標注任務中,并在兩個圖像數(shù)據(jù)庫上進行了實驗,結果表明該算法優(yōu)于現(xiàn)有的特征選擇算法,很好地實現(xiàn)了特征選擇。

        [1] FENG Y F, XIAO J, ZHUANG Y T, et al. Adaptive unsupervised multi-view feature selection for visual concept recognition [C]//11th IEEE Asian Conference on Computer Vision (ACCV), 2012. New York: IEEE Press, 2012: 343-357.

        [2] SHI C J, RUAN Q Q, AN G Y, et al. Sparse feature selection based on graph Laplacian for web image annotation [J]. Image and Vision Computing, 2014, 32(3): 189-201.

        [3] MA Z G, NIE F P, YANG Y, et al. Web image annotation via subspace-sparsity collaborated feature selection [J]. IEEE Transactions on Multimedia, 2012, 14(4): 1021-1030.

        [4] SHI C J, RUAN Q Q, AN G Y, et al. Semi-supervised sparse feature selection based on multi-view laplacian regularization [J]. Image and Vision Computing, 2015, 33(41): 1-10.

        [5] XU X X, LI W, XU D, et al. Co-labeling for multi-view weakly labeled learning [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2016, 38(6): 1113-1125.

        [6] WANG H, NIE F P, HUANG H, et al. Identifying disease sensitive and quantitative trait-relevant biomarkers from multidimensional heterogeneous imaging genetics data via sparse multimodal multitask learning [J]. Bioinformatics, 2012, 28(12): 1127-1136.

        [7] WANG H, NIE F P, HUANG H, et al. Heterogeneous visual features fusion via sparse multimodal machine [C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2013. New York: IEEE Press, 2013: 3097-3102.

        [8] CONG Y, WANG S, FAN B J, et al. UDSFS: unsupervised deep sparse feature selection [J]. Neurocomputing, 2016, 196: 150-158.

        [9] CHUN T, TANG JH, HONG R, et al. NUS-WIDE: a real-world web image dataset from National University of Singapore [C]//Proceeding of the ACM International Coference on Image and Video Retrieval (CIVR), 2009. New York: ACM Press, 2009: 1-9.

        [10] LI H, WANG M, HUA X S. MSRA-MM2. 0: a large-scale web multimedia dataset [C]//IEEE International Conference on Data Mining Workshops (ICDMW), 2009. New York: IEEE Press, 2009: 164-169.

        [11] MA Z G, NIE F P, YANG Y, et al. Discriminating joint feature analysis for multimedia data understanding [J]. IEEE Transactions on Multimedia, 2012, 14(6): 1662-1672.

        [12] LIU W F, TAO D C, Multiview hessian regularization for image annotation [J]. IEEE Transactions on Image Processing, 2013, 22(7): 2676-2687.

        [13] WANG S P, GUO W Z. Sparse multi-graph embedding for multimodal feature representation [J]. IEEE Transactions on Multimedia, 2017, 19(7): 1454-1466.

        [14] XUE X W, NIE F P, WANG S, et al. Multi-view correlated feature learning by uncovering shared component [EP/OL]. [2-18-01-10]. https://aaai.org/ ocs/index.php/AAAI/AAAI17/paper/view/14439.

        [15] JING X Y, WU FI, DONG X W, et al. Semi-supervised multi-view correlation feature learning with application to webpage classification [EP/OL]. [2018-01-20]. https://aaai.org/ocs/index.php/AAAI/AAAI17/paper/view/14582.

        [16] SHI C J, RUAN Q Q, AN G Y, et al. Semi-supervised sparse feature selection based on multi-view laplacian regularization [J]. Image and Vision Computing, 2015, 41(C): 1-10.

        [17] GUI J, SUN Z N, JI S W, et al. Feature selection based on structured sparsity: a comprehensive study [J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(7): 1490-1507.

        [18] SCH?LKOPF B, PLATT J, HOFMANN T. Sparse multinomial logistic regression via bayesian1regularisation [C]//Advances in Neural Information Processing Systems 19: Proceedings of the 2006 Conference. New York: MIT Press, 2006: 209-216.

        [19] DING C, ZHOU D, HE X F, et al.1-PCA: rotational invariant1-norm principal component analysis for robust subspace factorization [C]//ICML’06 Proceedings of the 23rd International Conference on Machine Learning (ICML), 2006. New York: ACM Press, 2006: 281-288.

        [20] NIE F P, XU D, HUNG T, et al. Flexible manifold embedding: A framework for semi-supervised and unsupervised dimension reduction [J]. IEEE Transactions on Image Processing. 2010, 19 (7): 1921-1932.

        [21] WANG L P, CHEN S G.2, pmatrix norm and its application in feature selection [EP/OL]. [2018-01-08].

        https://www.researchgate.net/publication/301850380_l_2p_Matrix_Norm_and_Its_Application_in_Feature_Selection.

        Research of Supervised Feature Selection Algorithm Based on Structured Multi-View Sparse Regularization

        sHI caijuan, DUANChangyu, GU Zhibing

        (North China University of Science and Technology, Tangshan Hebei 063210, China)

        In order to effectively utiliz the multi-view data information and enhance the feature selection performance, the structured multi-view sparse regularization was constructed, based on which a novel supervised feature selection method, namely structured multi-view supervised feature selection (SMSFS), was proposed. SMSFS could simultaneously consider the importance of each view features and the importance of individual feature in each view to combine the multi-view data information effectively in the feature selection process, and then to boost the supervised feature selection performance. Because theobjective function of SMSFS is non-convex, an effective iterative algorithm was proposed to solve the objective function. The proposed structured multi-view supervised feature selection method SMSFS was applied into image annotation task and extensive experiments were performed on NUS-WIDE and MSRA-MM2.0 image datasets. The proposed method SMSFS was compared with other feature selection methods and the experimental results demonstrated the effectiveness of SMSFS, which means that it could effectively utilize the multi-view data information to boost the feature selection performance.

        multi-view learning; structured sparse regularization; supervised feature selection

        TP 391.4

        10.11996/JG.j.2095-302X.2018061036

        A

        2095-302X(2018)06-1036-06

        2018-04-16;

        2018-07-24

        國家自然科學基金項目(61502143);河北省自然科學基金面上項目(F2016209165);華北理工大學杰出青年基金項目(JQ201715);華北理工大學博士科研啟動基金(201510);河北省高等學??茖W技術研究項目(QN2018115)

        史彩娟(1977-),女,河北豐潤人,副教授,博士。主要研究方向為圖像處理與分析、多媒體內(nèi)容分析、計算機視覺、機器學習等。E-mail:scj-blue@163.com

        猜你喜歡
        重要性數(shù)據(jù)庫監(jiān)督
        “0”的重要性
        論七分飽之重要性
        突出“四個注重” 預算監(jiān)督顯實效
        人大建設(2020年4期)2020-09-21 03:39:12
        幼兒教育中閱讀的重要性
        甘肅教育(2020年21期)2020-04-13 08:09:24
        監(jiān)督見成效 舊貌換新顏
        人大建設(2017年2期)2017-07-21 10:59:25
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        夯實監(jiān)督之基
        人大建設(2017年9期)2017-02-03 02:53:31
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        讀《邊疆的重要性》有感
        唐山文學(2016年11期)2016-03-20 15:26:04
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        日本久久久| 极品老师腿张开粉嫩小泬| 天堂中文官网在线| 国产麻无矿码直接观看| 欧美亚洲h在线一区二区| 久久久精品国产av麻豆樱花| 亚洲av高清在线观看一区二区 | 国产午夜福利精品久久2021| 日韩无码尤物视频| 中文字幕中文字幕777| 国产精久久一区二区三区 | 国产少妇高潮在线视频| 亚洲综合激情另类小说区| 国产乱子伦视频大全| 国产传媒在线视频| 国产av丝袜熟女丰满一区二区| 欧美三级不卡在线观看| 亚洲国产精品一区二区第四页| 久久91精品国产91久久麻豆 | 国产喷白浆精品一区二区豆腐| 寂寞人妻渴望被中出中文字幕| 欧美aaaaaa级午夜福利视频| 亚洲制服无码一区二区三区| 人妻露脸国语对白字幕| 吃奶摸下高潮60分钟免费视频| 国产色综合天天综合网| 国产精品一区二区午夜久久| 国产成人大片在线播放| 伊人久久大香线蕉av网禁呦| 日韩欧美国产自由二区| 国产激情小视频在线观看| 乱人伦精品视频在线观看| 狠狠躁夜夜躁人人爽超碰97香蕉| 扒开非洲女人大荫蒂视频| 中国国产不卡视频在线观看| 中文国产日韩欧美二视频| 无码区a∨视频体验区30秒| 人妻精品人妻一区二区三区四区| 内射爽无广熟女亚洲| 国产原创精品视频| 午夜视频一区二区三区在线观看|