【摘要】 討論了在中草藥數(shù)據(jù)分類應(yīng)用中兩種分類器算法filteredclassifier和adaboostM1的分類性能的問題,在weka平臺(tái)上實(shí)驗(yàn)可知,這兩種分類器算法中adaboostM1的分類精度比較高。
【關(guān)鍵詞】 中草藥 AdaBoostM1 weka
一、概述
傳統(tǒng)的單分類器算法在草藥數(shù)據(jù)的分類應(yīng)用是以前比較流行的方法,但隨著研究的深入,研究人員發(fā)現(xiàn)單分類器對(duì)不同的數(shù)據(jù)有不同的偏向性,無法滿足同時(shí)對(duì)不同數(shù)據(jù)的分類需求,adaboostM1是一種組合分類器算法,該算法用組合的思想來彌補(bǔ)單分類器算法的不足,filteredclassifier分類器算法是在WEKA平臺(tái)上的一種傳統(tǒng)的單分類器算法。本文首先在weka平臺(tái)上用兩種分類器算法對(duì)草藥數(shù)據(jù)集進(jìn)行分類,然后再對(duì)這兩種算法的分類精度進(jìn)行對(duì)比,實(shí)驗(yàn)表明:在實(shí)驗(yàn)數(shù)據(jù)集為輸入樣本集的情況下,AdaboostM1算法的分類精度比較高。
二、AdaBoost 算法介紹
1988 年,Kearns 等在研究 PAC 學(xué)習(xí)模型時(shí)提出了一個(gè)有趣的問題:弱可學(xué)習(xí)是否等價(jià)于強(qiáng)可學(xué)習(xí),即 Boosting 問題,如果這一問題有肯定的回答,意味著只要找到比隨機(jī)猜測(cè)略好的弱學(xué)習(xí)算法,就可以將其提升為強(qiáng)學(xué)習(xí)算法,而不必直接去尋找通常情況下很難獲得的強(qiáng)學(xué)習(xí)算法,這對(duì)學(xué)習(xí)算法的設(shè)計(jì)有著重要的意義。在更深入的研究中,F(xiàn)reund 等發(fā)現(xiàn):在線分配問題與 Boosting 問題之間存在著很強(qiáng)的相似性,引入在線分配算法的設(shè)計(jì)思想,有助于設(shè)計(jì)出更實(shí)用的 Boosting 算法,他們將加權(quán)投票的相關(guān)研究成果與在線分配問題結(jié)合,并在 Boosting 問題框架下進(jìn)行對(duì)應(yīng)推廣,得到了著名的 AdaBoost算法,該算法不再要求預(yù)知弱學(xué)習(xí)算法的任何先驗(yàn)知識(shí),在實(shí)踐中獲得了極大的成功[1]。
三、在Weka上用AdaBoost算法及幾種單分類算法對(duì)草藥數(shù)據(jù)進(jìn)行分類
本文所進(jìn)行的實(shí)驗(yàn)在Weka3-7-1平臺(tái)上完成,用三種草藥三七、人參、西洋參的指紋圖譜數(shù)據(jù)作為實(shí)驗(yàn)的數(shù)據(jù)集。本實(shí)驗(yàn)采用的方法是對(duì)輸入數(shù)據(jù)集采用5重交叉驗(yàn)證,取其分類精度為的分類性能,分類精度越高表示分類效果越好。
filteredclassifier的參數(shù)設(shè)置如下:
Filter為discretize,基分類器為decisionstump,其他的為默認(rèn)參數(shù)設(shè)置。
AdaboostM1的參數(shù)設(shè)置如下:
基分類器為decisionstump,numiteration為10,seed為1,weightThresold為100。
之后執(zhí)行RUN界面的START指令,再進(jìn)入ANALYSE界面載入文件選擇分析分類精度,可得到這些算法的平均分類精度如表1所示。
四、實(shí)驗(yàn)結(jié)果與分析
從表1可以看出,對(duì)實(shí)驗(yàn)輸入的中草藥數(shù)據(jù)集分類中,AdaBoostM1算法的分類精度大于classificationviaregression算法的分類精度。
五、結(jié)論
綜上所述,在中草藥分類領(lǐng)域,在與classificaitnoviaregression算法比較下,可以用AdaBoostM1算法來提高傳統(tǒng)單分類器算法的分類性能,從而給了我們一個(gè)啟發(fā),即可以使用AdaBoostM1算法來進(jìn)行草藥數(shù)據(jù)集的分類以達(dá)到高的精度。
參 考 文 獻(xiàn)
[1] 曹瑩,苗啟廣,劉家辰,高琳. AdaBoost算法研究進(jìn)展與展望[J]. 自動(dòng)化學(xué)報(bào),2013,06:745-758