亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進遺傳算法的支持向量機微信垃圾文章識別

        2016-03-25 17:43:27梁闊洋?k
        計算技術與自動化 2015年4期
        關鍵詞:參數(shù)優(yōu)化支持向量機特征選擇

        梁闊洋?k

        摘要:近幾年,隨著微信的快速發(fā)展和普及,微信已經(jīng)成為智能移動設備必備的應用之一,但與之同時也出現(xiàn)了大量微信詐騙信息、垃圾廣告等,給人們帶來了極大的困擾。本文將從搜狗微信搜索中抽取微信文章樣本,將微信垃圾文章識別看做文本分類問題,采用支持向量機對樣本進行分類模型的訓練,并應用改進的遺傳算法對支持向量機的參數(shù)進行優(yōu)化。文中詳細的介紹了改進遺傳算法在支持向量機上的應用,相比傳統(tǒng)的支持向量機,采用改進遺傳算法對支持向量機參數(shù)進行優(yōu)化,提升了模型準確率和優(yōu)化效率。在文章的最后進行了由15000篇微信文章所形成的測試集上的分類模型效果實驗,實現(xiàn)結(jié)果表明,本方法能夠達到94.7%的準確率,非常準確的識別微信垃圾文章。

        關鍵詞:支持向量機;遺傳算法;特征選擇;參數(shù)優(yōu)化;垃圾文章

        中圖分類號:TP391.1文獻標識碼:A

        1引言

        隨著微信應用的快速發(fā)展和普及,微信已經(jīng)成為移動智能設備中必備的應用之一,與之同時也出現(xiàn)了大量微信詐騙信息,垃圾廣告等垃圾文章。這些信息不僅浪費了用戶的帶寬和時間,同時也對互聯(lián)網(wǎng)的安全構(gòu)成了較大的威脅。因此如何識別此類微信文章顯得格外重要。

        傳統(tǒng)的解決方案為黑名單方法,黑名單方法收集發(fā)表垃圾文章的用戶,將用戶ID加入垃圾用戶黑名單列表。但由于微信用戶量大、并且增長速度快、黑名單方法不僅實施周期長,并且工作量大。

        微信垃圾文章識別的過程可視為一個文本分類的過程,對于文本分類問題,樣本經(jīng)過特征選擇后,每一個樣本被當做一個n維特征向量空間中的向量、作為機器學習算法的輸入。常用的機器學習方法有:K-近鄰(K-Near Neighbor)[1]、樸素貝葉斯(Na

        4實驗結(jié)果

        實驗數(shù)據(jù)來源于搜狗微信搜索數(shù)據(jù)源,實驗共選取了5組訓練集,和2組測試集。

        第一,采用不同數(shù)量的訓練集對模型進行訓練,記錄模型訓練的準確率、召回率、F值,如表2:

        通過對不同數(shù)量的訓練集對模型進行訓練,可以看出,當采用TRAIN1,數(shù)量為685對模型進行訓練,準確率、召回率、F值非常低,隨著訓練樣本的增多,準確率、召回率、F值的提升非???,這說明訓練樣本數(shù)量對模型整體的訓練效果有非常大的影響。

        采用TRAIN5所訓練的模型,進行3組不同數(shù)量測試上的實驗,幾率其準確率、召回率、F值,如表3:

        從上表可以看出,使用同一訓練集,準確性稍有升高,幅度不大,表明模型是相當穩(wěn)定的。召回率與F值稍有下降,說明訓練集中并沒有覆蓋所有實際情況,某些特殊實例沒有被包含進來。

        從上面兩組實驗結(jié)果可以得到,基于改進遺傳算法的支持向量機微信垃圾文章識別,對于搜狗微信搜索數(shù)據(jù)源具有良好的效果,其實驗結(jié)果有益于后續(xù)研究的繼續(xù)進行。訓練所得模型的準確率、召回率、F值能夠滿足實際應用的需求。

        5結(jié)論與展望

        本文采用支持向量機對微信文章垃圾文章進行識別,并應用改進的遺傳算法對支持向量機進行參數(shù)優(yōu)化,最終得到最優(yōu)的參數(shù)組合,從了得到了能夠進行良好分類的分類器。今后的主要工作集中在優(yōu)化特征選擇,對某些重要特征進行加權(quán)處理,并考慮平衡數(shù)據(jù)和費平衡數(shù)據(jù)對分類器訓練效果的影響,使得分類的準確率、召回率、F值獲得更大程度的提高。

        參考文獻

        [1]ANDROUTSPOULOS I,PALIOURAS G,KARKALETSIS V,et al. Learning to filter spam email: A Comparison of a Naive Bayesian and a MemoryBased Approach[C].Proceedings of the workshop on machine learning and textual information access, 4th European conference on principles and practice of knowledge discovery in databases. Lyon, France: [sn.].2000:1-13

        [2]ANDROUTSOPOULOS I,KOUTSIAS J,CHANDRINOS K, et al. An evaluation of nave Bayesian antispam filtering[C].Proceedings of the 11th European conference on machine learning.Barcelona, Spain:[sn.].2000:9-17.

        [3]CARRERAS X,MARQUEZ L. Boosting trees for antispam email filtering[C].The Forth International Conference on Recent Advances in Natural Language Processing. Bulgaria: Tzigov Chark.2001:58-64.

        [4]CORTES C,VAPNIK V. Support vector networks[J].Machine Learning.1995,20(1):273 –329.

        [5]平源. 基于支持向量機的聚類及文本分類研究[D].北京:北京郵電大學,2012.

        [6]KUBAT T M,MATWIN S. Addressing the Curse of Imbalanced Training Sets: OneSide Selection[C]. Proceedings of the 14th International Conference on Machine Learning. USA: Nashville.1997:217-225.)

        [7]李人厚.智能控制理論和方法[M].陜西:西安電子科技大學出版社,2005.

        [8]楊淑瑩,著.模式識別與智能計算—— Matlab技術實現(xiàn)[M].北京:電子工業(yè)出版社,2008..

        [9]施聰鶯,徐朝軍,楊曉江. TFIDF算法研究綜述[J]. 計算機應用,2009,S1:167-170+180.

        [10]DASH M, LIU H. Feature Selection for Classification[J]. Intelligent Data Analysis, 1997, 1(3): 131-156.

        猜你喜歡
        參數(shù)優(yōu)化支持向量機特征選擇
        Kmeans 應用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        基于神經(jīng)網(wǎng)絡的動力電池組焊接參數(shù)優(yōu)化研究
        動態(tài)場景中的視覺目標識別方法分析
        論提高裝備故障預測準確度的方法途徑
        價值工程(2016年32期)2016-12-20 20:36:43
        研究LTE與WCDMA系統(tǒng)間小區(qū)互操作與參數(shù)優(yōu)化
        基于熵技術的公共事業(yè)費最優(yōu)組合預測
        價值工程(2016年29期)2016-11-14 00:13:35
        基于磁流變技術的汽車發(fā)動機隔振系統(tǒng)的參數(shù)優(yōu)化
        科技視界(2016年23期)2016-11-04 08:17:36
        基于支持向量機的金融數(shù)據(jù)分析研究
        上向進路式尾砂膠結(jié)充填采礦法采場結(jié)構(gòu)參數(shù)優(yōu)化研究
        聯(lián)合互信息水下目標特征選擇算法
        亚洲乱码一区二区三区成人小说| 国产午夜在线视频观看| 激情内射亚洲一区二区| 国产精品自拍网站在线| 国产一区二区三区激情视频| 国内最真实的xxxx人伦| 日韩a无v码在线播放| 亚洲av日韩av一卡二卡| 伊人久久大香线蕉综合av| 亚洲乱码av乱码国产精品| 免费a级毛片无码a∨中文字幕下载 | 免费无码又爽又刺激聊天app| 中文字幕人妻中文| 日韩色久悠悠婷婷综合| 国产av一级片在线观看| 免费人成年激情视频在线观看| 亚洲熟妇无码av另类vr影视| 91亚洲欧洲日产国码精品| 亚洲国产精品嫩草影院久久av| 中文字日产幕码三区的做法大全| 亚洲国产欧美日韩欧美特级 | 一本大道加勒比东京热| 亚洲精品一区三区三区在线| 亚洲欧美色一区二区三区| 蜜臀aⅴ国产精品久久久国产老师| 人妻中文字幕不卡精品| 国产亚洲中文字幕久久网| 日韩欧美在线综合网另类 | 精品国产品香蕉在线| 国产在线精品一区二区在线看 | 精品人妻无码视频中文字幕一区二区三区 | 白白视频在线免费观看| 亚洲国产精品久久久婷婷| 麻豆md0077饥渴少妇| 国产在线精品一区二区| 亚洲AV无码日韩综合欧亚 | 亚洲国内精品一区二区在线| 日本一区二区三区高清在线视频| 一本一道久久综合久久| 久久九九青青国产精品| 精品黄色一区二区三区|