亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于局部有效性的選擇性決策樹集成

        2017-09-20 17:34:04邵明月胡霽芳
        科教導刊·電子版 2017年22期
        關(guān)鍵詞:集成學習機器學習決策樹

        邵明月+胡霽芳

        摘 要 集成學習通過為同一個問題訓練出多個個體學習器并將結(jié)論進行合成,可以顯著地提高學習系統(tǒng)的泛化能力。本文對此進行了研究,并通過在局部樣本空間上選擇學習器,提出了一種基于局部有效性的選擇性集成算法Lovsen。該算法使用 k 近鄰來確定個體學習器在局部樣本空間的有效性,從而為待預測的樣本選擇合適的個體學習器進行集成。實驗結(jié)果表明,Lovsen可以較為穩(wěn)定地生成泛化能力較強的決策樹集成。

        關(guān)鍵詞 機器學習 集成學習 選擇性集成 決策樹 惰性學習

        中圖分類號:TP181 文獻標識碼:A

        0引言

        機器學習(Machine Learning)是對計算機如何通過經(jīng)驗的積累,從而自動提高系統(tǒng)性能的機制的研究。集成學習是為同一個問題訓練一組學習器,并將這些學習器聯(lián)合起來執(zhí)行預測任務。按照個體學習器的生成方式,目前的集成學習方法大致可以分為個體學習器可以并行訓練的方法,以及個體學習器只能串行訓練的方法。研究表明,集成學習是目前泛化能力最強的機器學習技術(shù)之一。最近的研究發(fā)現(xiàn),從所訓練的學習器中選擇一部分進行集成預測,能夠得到更好的泛化能力。這種思想稱為選擇性集成(Selective Ensemble)。本文對選擇性集成進行了研究,提出對待預測樣本所屬的局部空間進行分析,僅利用在這個局部空間上有效的個體學習器進行集成,從而提出了Lovsen(LOcal Validity based Selective ENsemble)算法。具體而言,在訓練階段,產(chǎn)生一批學習器后,LOVSEN 利用 k 近鄰來估計出每個學習器最“擅長”的區(qū)域,當給出一個測試樣本時,選擇在其鄰域中的最佳學習器構(gòu)成集成。

        1集成學習

        1.1集成學習

        集成學習的方法首先在訓練集上訓練出 m 個學習器,當給出新樣本時,讓每一個學習器都進行預測,產(chǎn)生結(jié)果。然后通過某種方法,例如相對多數(shù)投票(majority voting),產(chǎn)生集成的預測結(jié)果y。Krogh 和Vedelsby以回歸學習器的集成推導出重要的集成學習的泛化誤差公式,這個公式對于分類器的集成有著同樣的意義。對于n 個學習器,它們的集成的誤差E=EA,其中,E為 n 個學習器的絕對誤差的加權(quán)平均,A為 n 個學習器相對于集成的誤差的加權(quán)平均。E指示出學習器固有的誤差,A指示出這些學習器之間的差異。這個式子表明了要獲得好的集成就需要降低個體學習器的誤差并增加學習器間的差異。

        1.2選擇性集成

        由于降低學習器之間的相關(guān)性可以提高集成的泛化能力,因此研究者們把目光集中在如何通過加入擾動產(chǎn)生這樣的學習器上。而 Zhou 等人則把目光放到已經(jīng)構(gòu)造出的學習器上:在構(gòu)造好一組學習器后通過篩選掉其中“壞的”學習器,從而得到高質(zhì)量的集成。

        2 Lovsen 算法

        集成學習器LE的泛化誤差E可以定義為:E=dxp(x)I(LE(x)yx),Gasen通過取得最佳的LE使得上式右端最小得:EGASEN=dxp(x)I(L(x)yx)又注意到和式∑與積分∫的可加性,將樣本空間D分割為n個不交疊的區(qū)域{D1,D2,…,Dn},即D=Di。從而,可以等價地寫作:

        下面,假設在每一個區(qū)域Di上,都取得了對于這個區(qū)域最優(yōu)的集成 optD1,則這時的泛化誤差為:

        這說明了在樣本空間的子區(qū)域上分別優(yōu)化集成,將取得不壞于在整個空間上進行的優(yōu)化更強的泛化能力。并且粗糙地說,劃分的子區(qū)域數(shù)量越多,泛化能力越強。但是,值得注意的是,定理 1 成立的前提是當子區(qū)域增多的時候,在各子區(qū)域上取得的最優(yōu)集成的泛化能力沒有降低。

        3總結(jié)

        本文基于 Zhou 等人提出的選擇性集成思想,通過分析局部化與泛化能力的關(guān)系,提出了一種新的選擇性集成方法Lovsen。Lovsen在對具體樣本進行預測時,根據(jù)該樣本的近鄰,動態(tài)選擇合適的學習器構(gòu)成集成。以 J4.8 決策樹作為基學習器的實驗表明,Lovsen具有較高的泛化能力和較為穩(wěn)定的性能。Lovsen算法有兩個參數(shù)需要確定。一個是近鄰數(shù) k,用于確定局部區(qū)域的范圍。在實驗中比較了 k =3 和 k =5 兩種配置,結(jié)果表明這兩種配置對算法沒有很大的影響。但是不保證其他的 k 值對算法會有較大的影響。另一個參數(shù)是校正函數(shù) F,在實驗中比較了兩種校正函數(shù)和不使用校正函數(shù)對算法的影響。以下幾個方面的內(nèi)容值得進一步研究:(1)Lovsen使用了 HVDM 來度量離散值之間的距離。利用其他最近發(fā)現(xiàn)的離散屬性距離度量方法,例如 SDM以及使用樣本流形(manifold)上的距離度量,是否能夠使算法更準確地尋找出近鄰樣本。 (2) 是否有其他更穩(wěn)定的校正函數(shù),以及校正函數(shù)引入的閾值參數(shù)€%d對算法會造成什么樣的影響。(3)當校正函數(shù)不能完全提供無噪音的訓練樣本時,在 k 近鄰上選擇完全預測正確的個體學習器這一要求過于苛刻。是否存在其它選擇方式,例如在 k 近鄰上選擇預測“基本正確”的個體學習器。(4)是否存在其他的局部化方法,例如使用決策樹對樣本進行劃分。

        參考文獻

        [1] 陸建江.加權(quán)關(guān)聯(lián)規(guī)則挖掘算法的研究[J]. 計算機研究與發(fā)展,2002,(10):1281-1286.

        [2] Cheung D W. Efficient mining of association rules in distributed databases[J]. IEEE Transactions on Knowledge and Data Engineering,1996,8(6):910-921.

        [3] Ganter B, Wille R. Formal Concept Analysis:Mathematical Foundations[M]. Berlin:Springer 1999. 131-139.

        [4] 馮玉才,馮劍琳.關(guān)聯(lián)規(guī)則的增量式更新算法[J].軟件學報,1998,9(4):301-306.

        [5] Srkant R, AgrawalR. Mining association rules [A]. Proc of the 21th International Conference on Very Large Database[C]. Zurich, Switerland,Sept 1995.407-419.

        [6] 羅可,吳杰.關(guān)聯(lián)規(guī)則衡量標準的研究[J]. 控制與決策,2003(08):419-424.endprint

        猜你喜歡
        集成學習機器學習決策樹
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        基于稀疏編碼器與集成學習的文本分類
        基于屬性權(quán)重的Bagging回歸算法研究
        基于機器學習的圖像特征提取技術(shù)在圖像版權(quán)保護中的應用
        基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        科教導刊(2016年26期)2016-11-15 20:19:33
        基于支持向量機的金融數(shù)據(jù)分析研究
        基于決策樹的出租車乘客出行目的識別
        基于改進的LogitBoost算法的垃圾網(wǎng)頁檢測研究
        科技視界(2015年27期)2015-10-08 11:01:28
        中文字幕大屁股熟女乱| 中文字幕人妻在线少妇| 久久天堂精品一区二区三区四区 | 久久国产亚洲精品超碰热| 毛片无码国产| 三年片免费观看大全国语| 精品一区二区av天堂| 元码人妻精品一区二区三区9| 亚洲性av少妇中文字幕| 亚洲一区二区三区在线视频| 日韩av免费一区二区| 日韩综合无码一区二区| 亚洲一卡2卡3卡4卡5卡精品| 亚洲综合av在线在线播放| 亚洲伊人久久成人综合网| 狠狠亚洲超碰狼人久久老人| 97成人精品在线视频| 丰满少妇人妻无码| 久久精品国产网红主播| 欧美亚洲日本国产综合在线| 99热成人精品国产免国语的| 日本女优中文字幕在线观看| 一二三四在线观看视频韩国| 久久精品亚洲精品国产色婷| 婷婷久久久亚洲欧洲日产国码av| 色伊人国产高清在线| 精品一区二区三区长筒靴| 日本免费精品一区二区| 无码熟妇人妻av在线影片最多| 18禁裸男晨勃露j毛免费观看| 一区二区久久不射av| av高清视频在线麻豆免费观看| av在线观看免费天堂| 九色九九九老阿姨| 亚洲国产午夜精品乱码| 五月婷婷激情六月开心| 成人麻豆视频免费观看| 最新欧美精品一区二区三区| 国语精品一区二区三区| 国产一区二区精品久久凹凸| 亚洲av高清一区三区三区|