亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于牛頓梯度優(yōu)化的彈性多核學習*

        2018-01-27 01:41:26何佳佳陳秀宏
        傳感器與微系統(tǒng) 2018年2期
        關鍵詞:范數(shù)集上正則

        何佳佳,陳秀宏,田 進,萬 月

        (江南大學 數(shù)字媒體學院,江蘇 無錫 214122)

        0 引 言

        多核學習(multiple kernel learning,MKL)[1]是機器學習領域的熱門研究課題,已成功應用于生物信息學[2]、計算機視覺[3]、數(shù)據(jù)挖掘等方向。與利用單一核的核方法相比,MKL通過組合多個基本核函數(shù)代替單一核函數(shù),使得核函數(shù)的應用更為靈活;由于其不依賴樣本數(shù)據(jù),故具有更強的可解釋性和可擴展性。

        本文提出了一種基于牛頓梯度優(yōu)化方法的彈性MKL (Newton gradient optimization method for elastic MKL,NO-EMKL)算法,根據(jù)彈性理論,將混合范數(shù)作為正則化項加入目標函數(shù),使得MKL在實現(xiàn)自適應目的的同時能平衡解的稀疏性,采用二階牛頓梯度下降法提高MKL的效率。結果表明:以上方法能計算多核學習的黑塞(Hessian)矩陣,獲得的下降方向比快速下降法更好,進一步減少了算法的迭代次數(shù)。

        1 MKL框架

        給定數(shù)據(jù)集{(xi,yi)}ni=1,xi∈χ,χ為輸入空間;yi表示數(shù)據(jù)xi的標簽,對二分類問題,yi∈{+1,-1}。核方法通過映射φ:χ→h將數(shù)據(jù)變換到Hilbert空間h中,核函數(shù)定義為h中的內(nèi)積,表明可通過核函數(shù)k(x,z)隱式地計算映射函數(shù)φ在h中的內(nèi)積k(x,z)=〈φ(x),φ(z)〉,避免了維數(shù)災難。在MKL中,核函數(shù)通常表示為多個基本核函數(shù)的加權相加或相乘。

        根據(jù)Bach分塊理論[4],MKL即為尋找以下問題的最優(yōu)解

        w.r.t.ω=(ω1,…,ωM)∈Rk1×…×RkM,

        ?i∈{1,…,n}

        (1)

        MKL的決策函數(shù)為

        f(z)=〈ω,z〉+b

        (2)

        式中μm為核函數(shù)的加權系數(shù),可通過求解問題(1)的對偶形式獲得。MKL分塊階段的l1范數(shù)將導致ω的稀疏性。

        2 NO-EMKL

        2.1 EMKL

        多元線性回歸的Lasso模型為

        (3)

        式中 ‖·‖為l2范數(shù);‖·‖為l1范數(shù)。目標函數(shù)(3)第二項為正則化項,用來控制參數(shù)的稀疏性。Zou H等人[5]將式(3)中的正則項用混合范數(shù)代替以達到自適應調(diào)整稀疏性的目的,即考慮以下彈性優(yōu)化模型

        (4)

        該模型通過正則化參數(shù)(λn,μn)調(diào)節(jié)l1范數(shù)項和l2范數(shù)項。

        根據(jù)l1范數(shù)項的變分公式[6,7],并引入混合范數(shù)的正則項的彈性思想,得到以下EMKL模型

        ω=(ω1,…,ωM)∈Rk1×…×RkM,

        ξi∈Rn,b∈R

        (5)

        式中θ為變量,0<θ<1,用于平衡稀疏性。

        2.2 EMKL的牛頓梯度法

        本文EMKL框架考慮的合成核K(xi,xj)是一些基本核km(xi,xj)的線性組合

        (6)

        (7)

        (8)

        (9)

        文獻[6]指出,僅需用簡單的梯度下降法即可解決該凸優(yōu)化問題,且收斂較快。本文在快速梯度下降的基礎上引入二階牛頓優(yōu)化來求解問題(9)以進一步提高收斂速度。

        記問題(7)的目標函數(shù)為J(α,d),對d和α使用交替法求解。對于給定的d,式(7)即為標準SVM式(8),設其解為α*,相應的支持向量集為sv;求解式(9),計算J(α*,d)關于d的梯度

        (10)

        為了獲得二階信息,在對gm求導時需計算?α*/?dm。由于所有支持向量均處于最大間隔邊界面上[9],故有

        (11)

        (12)

        (13)

        (14)

        (15)

        (16)

        約束項保證了任何解都落在區(qū)間[d,d+s]中,從而滿足原始約束式(9)。

        3 實驗與結果分析

        為了驗證本文NO-EMKL方法的有效性,與標準核SVM和基于快速梯度下降法的Simple MKL進行了實驗比較。

        3.1 參數(shù)設置和實驗數(shù)據(jù)

        Simple MKL和NO-EMKL實驗中所使用的基本核函數(shù)包括:10個高斯核函數(shù),其帶寬σ,分別取0.5,1,2,5,7,10,12,15,17,20;3個多項式核函數(shù),其中a=1,指數(shù)b的取值分別為1,2,3。對每個基本核函數(shù)分別計算核矩陣。通常核SVM中用到的單核為高斯核函數(shù),其帶寬σ取10;超參數(shù)C=100。本文討論的是二分類問題,選取加州大學歐文分校提供的標準測試數(shù)據(jù)集(University of California,Irvine,UCI)中8種2類別數(shù)據(jù)集進行實驗,這些數(shù)據(jù)集的構成如表1所示。

        表1 UCI數(shù)據(jù)集

        3.2 正則項參數(shù)θ選取

        根據(jù)本文NO-EMKL算法,采用5折交叉驗證的方法為表2中的8個UCI數(shù)據(jù)集分別選取合適的正則項參數(shù)θ。θ的取值分別為{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9};將每個數(shù)據(jù)集中的樣本數(shù)據(jù)分別分成5組,輪流將其中4組作為訓練集而另外1組作為測試集,并分別計算分類精度,取5次實驗結果的均值作為對應θ的分類結果,其對應關系如表2所示。對最高分類精確度進行標粗,如果不同的θ值對應著相同的最高分類精確度,選擇其中一個標粗。

        表2 數(shù)據(jù)分類精確度與θ關系 %

        從表2可以看出,不同的θ值影響著NO-EMKL算法的分類精度,且不同數(shù)據(jù)集的最高分類精度對應的θ值一般也不相同,說明每個數(shù)據(jù)集均具有最合適的θ值。NO-EMKL算法可以根據(jù)數(shù)據(jù)集調(diào)節(jié)到最合適的θ值,使模型的分類效果達到最好。

        3.3 分類精確度比較

        根據(jù)表2,分別為8個UCI數(shù)據(jù)集選取最合適的θ值用于NO-EMKL算法,8個數(shù)據(jù)集Sonar,Thyroid,Liver,Ionosphere,Breast,Blood,Diabetis及Image對應的θ取值分別為0.3,0.6,0.8,0.6,0.5,0.2,0.7及0.3。隨機選取8個UCI數(shù)據(jù)集中50 %的數(shù)據(jù)作為訓練集,剩下的數(shù)據(jù)作為測試集;訓練數(shù)據(jù)歸一化為均值0及單位方差的數(shù)據(jù),測試數(shù)據(jù)使用訓練數(shù)據(jù)的均值和方差進行歸一化。每種算法在每個數(shù)據(jù)集上運行10次求平均;對于Simple MKL和NO-EMKL,選擇對偶間隙小于0.01或迭代次數(shù)大于500次作為終止條件;最后得到的3種算法對數(shù)據(jù)集的平均分類精度如表3所示,對分類精度最高的數(shù)據(jù)進行標粗。

        表3 3種算法的分類精度比較 %

        從表3中可以看出,單核的SVM分類結果較差,本文提出的NO-EMKL算法在大部分的數(shù)據(jù)集上(除了數(shù)據(jù)集Diabetis)相較其他兩種算法有較好的分類精度,Simple MKL的分類結果處于兩者之間。

        3.4 迭代次數(shù)比較

        Simple MKL和NO-EMKL在8個數(shù)據(jù)集上進行實驗,并比較當達到停止迭代條件時迭代次數(shù)和對偶間隙的關系,如圖1所示??梢钥闯觯涸陂_始階段,Simple MKL的對偶間隙較NO-EMKL算法下降快,但是接近最優(yōu)解時,收斂速度明顯低于NO-EMKL,甚至出現(xiàn)了振蕩,并導致迭代次數(shù)大幅度增加,從而增加了計算成本。由此可見,采用二階牛頓梯度下降法的效果明顯好于快速梯度下法。

        圖1 NO-EMKL和 Simple MKL收斂速度

        3.5 訓練時間比較

        所考慮的訓練時間不包含核矩陣的生成時間。由于標準SVM不需要對核系數(shù)進行學習,所以,NO-EMKL和Simple MKL 2種算法在8個數(shù)據(jù)集上的訓練時間,在各數(shù)據(jù)集上運行10次后的平均訓練時間如表4所示,正則項參數(shù)θ的選取根據(jù)表2確定。因此,Simple MKL算法相對于NO-EMKL長,尤其當數(shù)據(jù)集較大時,訓練時間的差異更明顯,這主要是因為在計算權系數(shù)時,兩種方法所采用的梯度下降法不同,導致收斂速度不同,進一步說明了NO-EMKL算法的性能更優(yōu)。

        表4 訓練時間 s

        4 結束語

        針對稀疏多核學習算法在產(chǎn)生權系數(shù)和收斂速度上的問題,提出了NO-EMKL算法。該算法根據(jù)彈性理論而在目標函數(shù)中引入彈性項,使得多個基本核函數(shù)能自適應地融合,從而能更好地保留有用信息;而在算法優(yōu)化階段,算法采用二階牛頓梯度下降法,使算法在更少的迭代次數(shù)內(nèi)即可達到收斂。實驗結果表明:NO-EMKL算法相對于Simple MKL和SVM不僅具有更好的分類精度,還具有較快的收斂速度。

        [1] Lanckriet G R G,Cristianini N,Bartlett P,et al.Learning the kernel matrix with semidefinite programming[J].The Journal of Machine Learning Research,2004,5:27-72.

        [2] Damoulas T,Girolami M A.Probabilistic multi-class multi-kernel learning:On protein fold recognition and remote homology detection[J].Bioinformatics,2008,24(10):1264-1270.

        [3] Duan L,Tsang I W,Xu D,et al.Domain transfer svm for video concept detection[C]∥IEEE Conference on Computer Vision and Pattern Recognition,2009:1375-1381.

        [4] Bach F R,Lanckriet G R G,Jordan M I.Multiple kernel lear-ning,conic duality,and the SMO algorithm[C]∥Proceedings of the twenty-first International Conference on Machine Learning,ACM,2004:6.

        [5] Zou H,Hastie T.Regularization and variable selection via the elastic net[J].Journal of the Royal Statistical Society:Series B(Sta-tistical Methodology),2005,67(2):301-320.

        [6] Alain R,Francis R B,Phane C,et al.Simple MKL[J].Journal of Machine Learning Research,2008,9:2491-2521.

        [7] Sch?lkopf B,Smola A J.Learning with kernels:Support vector machines,regularization, optimization,and beyond[M].Boston:MIT Press,2002.

        [8] Bousquet O,Herrmann D J L.On the complexity of learning[C]∥Advances in Neural Information Processing Systems 15:Procee-dings of the 2002 Conference,MIT Press,2003:415.

        [9] Chapelle O,Rakotomamonjy A.Second order optimization of kernel parameters[C]∥Proc of the NIPS Workshop on Kernel Learning:Automatic Selection of Optimal Kernels,2008:87.

        猜你喜歡
        范數(shù)集上正則
        Cookie-Cutter集上的Gibbs測度
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        剩余有限Minimax可解群的4階正則自同構
        類似于VNL環(huán)的環(huán)
        復扇形指標集上的分布混沌
        基于加權核范數(shù)與范數(shù)的魯棒主成分分析
        矩陣酉不變范數(shù)H?lder不等式及其應用
        有限秩的可解群的正則自同構
        一類具有準齊次核的Hilbert型奇異重積分算子的范數(shù)及應用
        幾道導數(shù)題引發(fā)的解題思考
        午夜无码片在线观看影视| 91精品国产综合久久精品密臀| 中国一级特黄真人片久久| 亚洲av无码一区二区乱孑伦as| 国产黑丝在线| 国产精品一区区三区六区t区| 亚洲男人免费视频网站| 狠狠噜狠狠狠狠丁香五月| 亚洲精品视频在线一区二区| 亚洲av永久无码精品放毛片| 猫咪www免费人成网最新网站| 精品一区二区三区人妻久久| 中文字幕av长濑麻美| 米奇7777狠狠狠狠视频影院| 欧美专区在线| 热门精品一区二区三区| 精品婷婷国产综合久久| 亚洲av永久无码精品古装片| 99久久国产综合精品麻豆| 亚洲日本无码一区二区在线观看| 青青草手机视频免费在线播放| 婷婷色香五月综合缴缴情| 久久久精品人妻一区亚美研究所 | 亚洲AV日韩Av无码久久| 亚洲日本中文字幕乱码在线| 国产成人无码18禁午夜福利p| jizz国产精品免费麻豆| 男女性搞视频网站免费| 色婷婷av一区二区三区久久| 人人妻人人澡人人爽久久av| 日韩成人精品日本亚洲| 日本一区二区三区四区啪啪啪| 中文字幕乱码一区av久久不卡 | 久久伊人亚洲精品视频| 亚洲中文字幕成人无码| 午夜tv视频免费国产区4| 亚洲大胆美女人体一二三区| 亚洲av高清在线观看一区二区| 国产精品99久久免费| 日本少妇比比中文字幕| 国产亚洲欧美精品永久|