甘冬連 張永 劉博
摘要:針對(duì)垃圾郵件大量存在的問(wèn)題,提出基于MapReduce并行SVM的垃圾郵件分類算法,用支持向量機(jī)作為分類器,基于MapReduce將各子分類器進(jìn)行合并,并通過(guò)重訓(xùn)練得到模型,利用該模型對(duì)測(cè)試集進(jìn)行分類,得到結(jié)果。為解決算法精度損失、準(zhǔn)確率低等問(wèn)題,引入KNN,在原算法基礎(chǔ)上進(jìn)行循環(huán)迭代。
關(guān)鍵詞:MapReduce;SVM;KNN分類算法
DOIDOI:10.11907/rjdk.161466
中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2016)006-0010-03
參考文獻(xiàn):
[1]杜玲玲.基于MapReduce的數(shù)據(jù)挖掘算法研究與應(yīng)用[D].桂林:桂林電子科技大學(xué),2012.
[2]邰建華.Hadoop平臺(tái)下的海量數(shù)據(jù)存儲(chǔ)技術(shù)研究[D].大慶:東北石油大學(xué),2012.
[3]曹聰.云計(jì)算支持下的數(shù)據(jù)挖掘算法及其應(yīng)用[D].廣州:廣州大學(xué),2012.
[4]???基于Hadoop云平臺(tái)的分布式支持向量機(jī)研究[D].臨汾:山西師范大學(xué),2014.
[5]汪海燕,黎建輝,楊風(fēng)雷.支持向量機(jī)理論及算法研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2014(5):1281-1286.
[6]張國(guó)云.支持向量機(jī)算法及其應(yīng)用研究[D].長(zhǎng)沙:湖南大學(xué),2006.
[7]桑應(yīng)賓.基于K近鄰的分類算法研究[D].重慶:重慶大學(xué),2009.