亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Spark框架的高效KNN中文文本分類算法

        2017-01-13 20:13:00于蘋蘋倪建成姚彬修李淋淋曹博
        計(jì)算機(jī)應(yīng)用 2016年12期
        關(guān)鍵詞:分類號框架聚類

        于蘋蘋+倪建成+姚彬修+李淋淋+曹博

        摘 要:針對K-最近鄰(KNN)分類算法時(shí)間復(fù)雜度與訓(xùn)練樣本數(shù)量成正比而導(dǎo)致的計(jì)算量大的問題以及當(dāng)前大數(shù)據(jù)背景下面臨的傳統(tǒng)架構(gòu)處理速度慢的問題,提出了一種基于Spark框架與聚類優(yōu)化的高效KNN分類算法。該算法首先利用引入收縮因子的優(yōu)化K-medoids聚類算法對訓(xùn)練集進(jìn)行兩次裁剪;然后在分類過程中迭代K值獲得分類結(jié)果,并在計(jì)算過程中結(jié)合Spark計(jì)算框架對數(shù)據(jù)進(jìn)行分區(qū)迭代實(shí)現(xiàn)并行化。實(shí)驗(yàn)結(jié)果表明,在不同數(shù)據(jù)集中傳統(tǒng)K-最近鄰算法、基于K-medoids的K-最近鄰算法所耗費(fèi)時(shí)間是所提Spark框架下的K-最近鄰算法的一個(gè)范圍3.92~31.90倍,所提算法具有較高的計(jì)算效率,相較于Hadoop平臺有較好的加速比,可有效地對大數(shù)據(jù)進(jìn)行分類處理。

        關(guān)鍵詞:K-最近鄰;聚類;收縮因子;K-medoids;Spark;并行化計(jì)算

        中圖分類號: TP391.1

        文獻(xiàn)標(biāo)志碼:A

        文章編號:1001-9081(2016)12-3292-06

        猜你喜歡
        分類號框架聚類
        框架
        廣義框架的不相交性
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        WTO框架下
        法大研究生(2017年1期)2017-04-10 08:55:06
        A Study on the Change and Developmentof English Vocabulary
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種基于OpenStack的云應(yīng)用開發(fā)框架
        Translation on Deixis in English and Chinese
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        The law of exercise applies on individual behavior change development
        日本一级特黄aa大片| 99精品视频69v精品视频免费| 成在线人免费视频播放| 久久中文字幕暴力一区| 国产精品久久成人网站| 99久久免费精品高清特色大片| 亚洲国产剧情在线精品视| 亚洲精品一区二在线观看| 国产亚洲精品久久久久久国模美| 久久精品国产亚洲av蜜臀| 亚洲综合五月天欧美| 蜜桃视频永久免费在线观看| 国产精品美女久久久免费| 公粗挺进了我的密道在线播放贝壳| 97中文字幕在线观看| 中文字幕人妻久久一区二区三区| 久久久久av综合网成人| 成人区人妻精品一熟女| 在线视频中文字幕乱人伦| 精品一区2区3区4区| 久久人人爽av亚洲精品| 日韩精品一区二区亚洲av| 国产在线天堂av| 国产在线精品成人一区二区三区| 欧美大屁股xxxx高跟欧美黑人| 免费无码肉片在线观看| 自拍视频国产在线观看| 亚洲av手机在线网站| 狼人香蕉香蕉在线28 - 百度| 欧美黑人性色黄在线视频| 女同中文字幕在线观看| 插鸡网站在线播放免费观看| 久久精品无码专区免费青青| 亚洲AV乱码毛片在线播放| 91一区二区三区在线观看视频| 欧美另类人妖| 成人激情四射网| 国产高清在线精品一区不卡 | 人人妻人人澡人人爽欧美一区双 | 亚洲图片日本视频免费| 91spa国产无码|