亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        交叉驗證中類別切分不均衡對分類性能的影響分析

        2013-11-21 10:38:02趙存秀王瑞波李濟洪
        關(guān)鍵詞:總體類別分類器

        趙存秀 王瑞波 李濟洪

        *(1.山西大學 數(shù)學科學學院,山西 太原030006;2.山西大學 計算中心,山西 太原030006)

        0 引言

        統(tǒng)計機器學習模型被廣泛使用到自然語言處理、圖像識別等應(yīng)用領(lǐng)域之中.泛化誤差(Generalization Error)是統(tǒng)計機器學習模型的重要評價指標,在統(tǒng)計中,泛化誤差常用交叉驗證方法來估計.早期的一些工作發(fā)現(xiàn),留一交叉驗證估計雖然可以作為回歸問題的漸近無偏估計,但是Shao Jun[1]的研究表明,在分類模型中不具有漸近無偏這樣良好性質(zhì).因此,Hastie T等人[2]使用五折交叉驗證、十折交叉驗證來估計分類模型泛化誤差.

        在分類模型比較中,標準交叉驗證方法同樣被廣泛使用.Dietterich T.G[3]系統(tǒng)地比較了 McNemar檢驗、成對t檢驗、標準K折交叉驗證檢驗和基于5×2交叉驗證的t檢驗.他的實驗結(jié)果表明,在分類模型比較問題上,相對其他檢驗方法,基于5×2交叉驗證的t檢驗有較優(yōu)的勢.他認為,2折交叉驗證方法具有訓練集之間沒有重疊、測試集的規(guī)模較大這些特點,并且通過5次重復(fù)實驗來得到2折交叉驗證估計的方差,這樣可以使t檢驗更加有效.之后Alpaydin E.[7]提出了5×2交叉驗證的F檢驗方法改進了5×2交叉驗證t檢驗.

        Gilles Celeux[4]和Padhraic Smyth[5]等工作均建議使用2折交叉驗證來進行模型的選擇,并且可以通過借助多次的2折交叉驗證重復(fù)來減少2折交叉驗證估計的方差.B.Hafidi[6]給出了重復(fù)2折交叉驗證方法的理論性質(zhì),他證明重復(fù)2折交叉驗證的模型選擇方法和TIC準則在一定條件下是漸近等價的.另外,如上文所述,Dietterich T.G以及E.Alpaydin[7]等人發(fā)現(xiàn)使用多次重復(fù)的2折交叉驗證來構(gòu)造統(tǒng)計量可以有效地檢驗出兩個分類模型之間的性能差異.

        關(guān)于標準交叉驗證估計中切分的不同對分類模型性能的影響吸引了很多研究者.L.Brei-man[8]以及C.Schaffer[9]等對分類數(shù)據(jù)在交叉驗證集中類別分布的不同對模型的性能影響進行了研究 .他們提出使用分層的方法來處理分類數(shù)據(jù),使得類別在交叉驗證集中的分布盡量均勻,這有助于減小模型性能估計的方差.N.A.Diamantidis[10]進一步提出了無監(jiān)督的分層交叉驗證方法修正模型性能的估計.他們除了考慮分類數(shù)據(jù)類別分布均衡外,還提出了使用無監(jiān)督的方法來校正分類數(shù)據(jù)中特征矩陣的分布均衡性.

        Thomas Oommen[11]詳細討論了類別抽樣偏差(Sampling Bias)和類別不均衡對2類分類問題的影響.他基于Logistic回歸分類器來研究類別抽樣偏差對模型性能估計的影響,以及總體分布中類別的不均衡對模型性能估計的影響.但他的實驗中沒有使用標準交叉驗證的方法來估計模型性能.在自然語言處理、信息檢索領(lǐng)域中分類模型的性能指標一般采用準確率、召回率、F值來度量.在自然語言處理中,特征(自變量)多為離散變量,相應(yīng)地在許多模型中模型的設(shè)計矩陣為0,1取值的矩陣.為此,本文基于這樣的數(shù)據(jù),通過數(shù)值模擬,來分析2折交叉驗證中類別不均衡對模型性能的影響情況.

        1 Logistic回歸模型

        Logistic回歸模型源于這樣一種愿望:通過x的線性函數(shù)對K個類的后驗概率建模,而同時確保它們的和為1,并都在[0,1]中.該模型具有如下的形式:

        該模型用K-1個對數(shù)概率確定.盡管模型使用最后一個作為概率的分母,但是分母的選擇是任意的,因為估計在該選擇下等價.簡單的計算得到:

        當K=2的時候,該模型特別簡單,因為只有一個線性函數(shù).本文就是關(guān)于兩類的討論.Logistic函數(shù)的優(yōu)點是它能取到-∞到+∞,然而輸出卻限制在到1之間.

        2 模型的評價指標

        Marina Sokolova和Guy Lapalme針對分類模型中給出了很多評價指標.其中很多都是基于混淆矩陣提出的.表1給出的混淆矩陣度量了2類分類模型(分別用0類,1類表示)的性能,其中TP(True Positive)表示預(yù)測為1類,觀測也為1類,F(xiàn)P(False Positive)表示預(yù)測為1類觀測為0類,F(xiàn)N(False Negative)表示預(yù)測為0類觀測為1類,TN(True Negative)為預(yù)測為0類觀測為0類.

        在此基礎(chǔ)上,本文主要使用了準確率(precision)、召回率(recall)、F值和精確率(Accuracy)來考察分類模型的性能.論文中使用了2折交叉驗證做估計,而且訓練出來的模型在類別不均衡的樣本上進行預(yù)測,會出現(xiàn)分類器將所有的分為一類,我們在此可以將交叉驗證的兩個混淆矩陣相加后平均再計算準確率(P)、召回率(R)、F值和精確率(A).

        表1 混淆矩陣

        實驗結(jié)果中給出的P1,R1,F(xiàn)1指的是對于1類而言的,相應(yīng)P2,R2,F(xiàn)2則是對0類的估計,具體給出:

        在表達式中,P1表示分類器預(yù)測對1類的準確率.其中,TP表示兩折中正確預(yù)測為1類的總和,F(xiàn)P表示兩折中預(yù)測為1類但是觀測為0類的總和.P2表示分類器預(yù)測對0類的準確率.

        召回率=預(yù)測正確的某類別個數(shù)/測試集中該類別總數(shù)

        在表達式中,R1表示分類器預(yù)測對1類的召回率.其中,TP表示兩折中正確預(yù)測為1類的總和,F(xiàn)N表示兩折中預(yù)測為0類但是觀測為1類的總和.R2表示分類器預(yù)測對0類的準確率.

        精確率(A)是指該分類器正確預(yù)測對的所有類別數(shù)與總的樣本個數(shù)的比值.

        3 模擬實驗設(shè)置

        本文的數(shù)據(jù)產(chǎn)生方式借鑒了Agresti A[12]等的工作.與該工作不同,本文主要考慮兩個預(yù)測變量的情況.設(shè)模擬數(shù)據(jù)樣本為(yi,xi),1≤i≤n,其中=(xi1,xi2)為兩維的預(yù)測變量且xi1~B(1,p1),xi2~B(1,p2)對于每個觀測的相應(yīng)變量,本文假設(shè)yi|xi~B(1,π(xi,α,β))其中,參數(shù)π(xi,α,β)根據(jù) Logistic回歸模型進行設(shè)定

        α,βT=(β1,β2)是待定的回歸系數(shù).

        為了產(chǎn)生出類別分布不同的樣本,本文對xi1,xi2的先驗分布中的參數(shù)p1,p2以及模型回歸系數(shù)進行了調(diào)整,具體見表2.

        表2 參數(shù)設(shè)置

        需要指出的是,上述的參數(shù)設(shè)置只能近似地得到相應(yīng)的分布比例.本文分別模擬類別分布比例不同(樣本容量n=1 000)的四種樣本集,即50∶50,60∶40,70∶30,80∶20.然后,使用2折交叉驗證,對這些數(shù)據(jù)進行切分,人為設(shè)置上述四種樣本集中的數(shù)據(jù)在2折交叉驗證中分割的類別規(guī)律為:一份中負例所占總體負例個數(shù)的0.5,0.6,0.7,0.8,0.9倍.以便于考察在樣本中類別比例不同的情況下,2折交叉驗證對模型性能的影響.模擬數(shù)據(jù)的產(chǎn)生采用R軟件中的rbinom函數(shù),做擬合的時候使用的是glm函數(shù).

        4 實驗結(jié)果及分析

        在模擬實驗中,取4個總體,按照表1中實驗參數(shù)設(shè)置,其中y的類別比例大致分別為50∶50,60∶40,70∶30,80∶20,分別產(chǎn)生模擬數(shù)據(jù)n=1 000,然后對每個總體我們按其中一份中0類個數(shù)占總體0類的不同比例來切分2份作交叉驗證,做5次實驗(0.5是指第一份中0類所占的比例是總體1 000中0類個數(shù)的50%.0.6,0.7,0.8,0.9同理),每次取兩次交叉實驗所得的混淆矩陣的和的均值作最后的估計.

        圖1 4種比例下各指標的比較

        表3 4個總體2份切分的兩類別個數(shù)分布

        我們統(tǒng)計了對于每次實驗每份中的類別個數(shù)如表3,從表3中可以看出4個總體類別比例大致為50∶50,60∶40,70∶30,80∶20.而且我們可以看出在0.5的時候,兩份中0類和1類的比例和總體是一致的,但是兩份切分隨著第一份中0類的增加,1類的減少,第二份中0類的減少,1類的增加,使得每種分類類別越來越不均衡也即是與總體類別比例有了差別.

        在每種類別比例下使用2折交叉驗證,運用Logistic回歸模型,使用準確率、召回率、F值和精確率作評價估計分類器的好壞,得到結(jié)果表4以及圖1.從表4中大體可以看到隨著切分比例的不均衡,準確率、召回率和F值在逐漸的減小,精確率也在減小,但是也存在幾個異常的值,在表4中紅色字體標出.更重要的是在4個實驗中,隨著總體類別比例的差異,精確率在增加,1類的準確率、召回率、F值逐漸的增加,而類的準確率、召回率、F卻逐漸的減小.

        表4 實驗結(jié)果

        本文模擬的4個總體內(nèi)兩類別越來越不均衡,對每個總體做2折交叉驗證的時候,人為地切分,使得兩份之間類別比例有差異并且與總體類別也有差異,出現(xiàn)了類別分割不均衡的情況,在此我們從實驗結(jié)果表4以及圖1中可以得出:

        1)在4個總體類別分布不相同的實驗中,都隨著類別分割不均衡,準確率、召回率和F值在逐漸的減小,精確率也在減小.因此,在使用2折交叉驗證時,總體的切分對分類器的性能是有影響的.

        2)對4個總體類別分布不同的總體,隨著總體類別分布的差異越大,精確率在增加,1類的準確率、召回率、F值也逐漸的增加,而類的準確率、召回率、F值卻逐漸地減小.

        3)在實驗一中0.8的時候所有評價指標都會有明顯地減小,而實驗二中,在0.9的情況下,精確率也會有明顯的減小,但是,實驗3和實驗4的時候不會出現(xiàn).這可能與2折類別分割的兩類的比例與總體兩類類別比例之間差異程度有關(guān),差異越大,指標就變化越大.

        4)切分時與總體類別分布越一致,影響越小,而不是在兩份中兩類類別比例越接近,分類器效果最好.說明實驗中,應(yīng)盡可能地切分成與總體的兩類比例一致的兩份來做實驗.

        5 總結(jié)與展望

        我們分析了總體不均衡和類別分割不均衡對Logistic分類器的性能影響.方法采用了模擬多種類別不均衡情形下的Logistic回歸模型數(shù)據(jù),我們對模擬數(shù)據(jù)人為的類別分割為2份,做交叉驗證,實驗結(jié)果表明當2折交叉驗證中數(shù)據(jù)的類別分布與總體類別相差較大的時候,模型性能的估計明顯變差.因此在實驗中切分數(shù)據(jù)時每份數(shù)據(jù)應(yīng)盡量保持與總體類別分布一致.

        接下來的工作集中在如何從樣本中識別原總體的類別分布.以及在高維數(shù)據(jù)的時候,會不會有相同的實驗結(jié)果,又應(yīng)該如何切分數(shù)據(jù),這是我們進一步要研究的內(nèi)容.

        [1]Shao Jun,Rao J N K.Standard errors for low income proportions estimated from stratified multi-stage samples[J].The Indian Journal of Statistics 1993,55:393-414

        [2]Hastie T,Tibshirani R.The elements of statistical learning[J].The Mathematical Iutelligencer,2005,27(2):83-85

        [3]Dietterich T G.Approximate statistical tests for comparing supervised cassification learning algorithms[J].MIT Press,1998,10:1 895-1 924

        [4]Guillaume Bouchard,Gilles Celeux.Choosing a model in a classifcation purpose[C].International Environmental Modelling and Software Society(iEMSS),Ottawa,David A Swayne,Wanhong Yong,Voinov A A,F(xiàn):Latova,2010:2 046-2 056

        [5]Padhraic Smyth.Model selection for probabilistic clustering using cross-validated likelihood.Statistics and Compution[J].Journal of the American Statistical Association,2002,97:63-72

        [6]Hafidi B,Mkhadri A.Repeated half sampling criterion for model selection[J].The Indian Journal of Statistics,2004,66:566-581

        [7]Alpaydin E.Combined 5x2CVFtest for comparing supervised classification learning algorithms[J].Massachusetts Institute of Technogy,1999,11(8):1 885-1 892

        [8]Breiman L,Spector P.Submodel Selection and Evaluation in Regression[J].Wiley Interdisciplinary Reviews,2011,1(1):14-23

        [9]Schaffer C.Selecting a Classification Method by Cross-Validation[J].Machine Learning,1993,13:135-143

        [10]Diamantidis N A,Karlis D,Giakoumakis E A.Unsupervised Stratification of Cross-Validation for Accuracy Estimation[J].Artificial Intelligence,2000,116:1-16

        [11]Thomas Oommen,Laurie G Baise,Richard M Vogel.Sampling bias and class imbalance in maximum-likely-h(huán)ood logistic regression[J].Math Geosci,2011,43:99-120

        [12]Agresti A Wiley.Series in Probability and Statistics[EB/OL].http:∥onlinelibrary.wiley.com/doi/co,publis hed online:2008-05-27

        猜你喜歡
        總體類別分類器
        用樣本估計總體復(fù)習點撥
        2020年秋糧收購總體進度快于上年
        外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
        中國外匯(2019年6期)2019-07-13 05:44:06
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        直擊高考中的用樣本估計總體
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
        极品美女扒开粉嫩小泬图片| 久久久午夜毛片免费| 99RE6在线观看国产精品| 日本精品啪啪一区二区| 亚洲av综合色区一区二区| 国产av天堂亚洲国产av天堂| 色 综合 欧美 亚洲 国产| 免费大片黄在线观看| 一区二区丝袜美腿视频| 国产人妖在线观看一区二区三区| 国产精品18久久久白浆| 亚洲av无码一区二区三区天堂古代 | 麻豆蜜桃av蜜臀av色欲av| 无码成人aaaaa毛片| 中文字幕永久免费观看| 中文字幕人妻少妇精品| 人妻少妇69久久中文字幕| 国产二区交换配乱婬| 国产又色又爽无遮挡免费| 日日噜噜夜夜狠狠2021| 国产超碰在线91观看| 在线免费观看一区二区| 色妞ww精品视频7777| 91久久国产精品视频| 一区二区三区视频在线免费观看| 亚洲中文字幕精品视频| 亚洲av无码成人精品区狼人影院 | 国产在线高清无码不卡| 一本色道加勒比精品一区二区| 精品人妻系列无码人妻漫画| 亚洲亚洲人成综合网络| 精品综合久久久久久8888| 精品蜜臀国产av一区二区| 亚洲 另类 小说 国产精品| 三年在线观看免费大全下载| 国产精品原创av片国产日韩| 国产免费一区二区三区三| 亚洲视频在线一区二区| 亚洲男人av天堂午夜在| 色噜噜狠狠色综合中文字幕| 日韩日本国产一区二区 |