馬曉寧 王 婷 董松月
(中國(guó)民航大學(xué) 天津 300300)
網(wǎng)絡(luò)輿情是指一定社會(huì)群體在一定時(shí)間內(nèi),對(duì)某種事件的看法,是網(wǎng)民對(duì)社會(huì)輿論情況的反映。隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)民通過(guò)網(wǎng)絡(luò)平臺(tái)發(fā)表自己的見(jiàn)解和看法越來(lái)越普遍。由于網(wǎng)絡(luò)具有虛擬性和開(kāi)放性,導(dǎo)致網(wǎng)民在工作、生活中遇到不快,均可以通過(guò)網(wǎng)絡(luò)進(jìn)行宣泄,網(wǎng)絡(luò)上的負(fù)面言論對(duì)社會(huì)穩(wěn)定會(huì)產(chǎn)生不利影響[1]。加之用戶的評(píng)論沒(méi)有質(zhì)量控制機(jī)制,網(wǎng)民可以在互聯(lián)網(wǎng)上發(fā)布任何觀點(diǎn)甚至包括惡意的言論,從而導(dǎo)致網(wǎng)民生成的評(píng)論中存在許多噪聲或者虛假的垃圾[2]內(nèi)容,例如商家可以雇傭“水軍”(寫(xiě)手)為自己歌功頌德、對(duì)競(jìng)爭(zhēng)對(duì)手口誅筆伐。最早對(duì)垃圾評(píng)論的定義是出現(xiàn)在文獻(xiàn)[13]中,而且應(yīng)用的場(chǎng)景是在商品評(píng)論中,文獻(xiàn)中的定義是垃圾評(píng)論指的是那些為了促銷某種商品而給出一些與實(shí)際不相符的積極的評(píng)論,或者是為了詆毀某種商品或品牌而給出一些虛假的負(fù)面評(píng)論,試圖故意誤導(dǎo)閱讀的人或自動(dòng)的數(shù)據(jù)挖掘和情感分析系統(tǒng)的“不合法”的活動(dòng)。本論文將垃圾評(píng)論應(yīng)用于網(wǎng)絡(luò)輿情領(lǐng)域中,網(wǎng)民生成的垃圾評(píng)論的目的大致可能是為了宣泄或者是針對(duì)政府,還有的評(píng)論可能是由懷有惡意的和情緒失控的人所寫(xiě)[4]。因此,這在很大程度上影響了用戶對(duì)某個(gè)話題的看法,不僅對(duì)輿論的導(dǎo)向產(chǎn)生無(wú)法逆轉(zhuǎn)的影響,而且影響輿情監(jiān)管部門對(duì)輿情的處置,使其不能夠做出正確的輿論引導(dǎo)和正確的輿情分析。所以,清除網(wǎng)絡(luò)垃圾,凈化網(wǎng)絡(luò)環(huán)境,為人們提供一個(gè)真實(shí)可信的信息平臺(tái)是必要的。
國(guó)內(nèi)外學(xué)者對(duì)垃圾網(wǎng)頁(yè)和垃圾郵件的研究非常廣泛,但是對(duì)垃圾觀點(diǎn)的識(shí)別研究相對(duì)較少。而且大多數(shù)對(duì)垃圾觀點(diǎn)的識(shí)別主要集中在產(chǎn)品評(píng)論[5]、互聯(lián)網(wǎng)銷售等[11~12]領(lǐng)域,對(duì)網(wǎng)絡(luò)輿情領(lǐng)域的垃圾觀點(diǎn)的識(shí)別研究幾乎沒(méi)有。因此如何從海量的網(wǎng)絡(luò)輿情觀點(diǎn)中有效地識(shí)別出不真實(shí)的、垃圾的評(píng)論,是一個(gè)亟待解決的課題。
為了有效識(shí)別網(wǎng)絡(luò)輿情垃圾觀點(diǎn),本文首先對(duì)網(wǎng)絡(luò)輿情垃圾觀點(diǎn)進(jìn)行詳細(xì)的界定,同時(shí)設(shè)計(jì)和采用粒子群優(yōu)化的支持向量機(jī)模型[6~7]對(duì)評(píng)論進(jìn)行識(shí)別,并且和未被優(yōu)化的支持向量機(jī)模型進(jìn)行了比較,實(shí)驗(yàn)結(jié)果表明本文所提出的識(shí)別模型能對(duì)輿情垃圾觀點(diǎn)進(jìn)行有效的識(shí)別。此外,將界定垃圾觀點(diǎn)的特征多少和不同特征對(duì)垃圾觀點(diǎn)識(shí)別的影響進(jìn)行了分析,并通過(guò)實(shí)驗(yàn)說(shuō)明選擇合適的特征對(duì)于垃圾觀點(diǎn)識(shí)別的重要性。
對(duì)網(wǎng)絡(luò)輿情垃圾觀點(diǎn)的識(shí)別,最主要的是界定什么類型的評(píng)論屬于垃圾,不真實(shí)的。而盡可能正確地界定垃圾觀點(diǎn)對(duì)隨后的識(shí)別模型效果有直接的影響。本論文中的垃圾觀點(diǎn)特征的界定是在借鑒了文獻(xiàn)[2]、[3]和[13]基礎(chǔ)上,結(jié)合和研究了微博上關(guān)于網(wǎng)絡(luò)輿情事件中網(wǎng)民評(píng)論的特點(diǎn),總結(jié)出將以下六個(gè)特征作為網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別的特征,因此含有這六個(gè)特征的評(píng)論即界定為垃圾觀點(diǎn),這六個(gè)特征如下:
1)評(píng)論者是否匿名:多數(shù)情況下,非匿名評(píng)論比匿名評(píng)論真實(shí)性強(qiáng),可信度更高。蓄意誤導(dǎo)價(jià)值觀,或具有反社會(huì)傾向的評(píng)論者,以引導(dǎo)輿論,擾亂社會(huì)為目的,通常會(huì)隱藏身份,選擇匿名的可能性較大。
2)評(píng)論是否重復(fù)出現(xiàn):普通評(píng)論者發(fā)表評(píng)論目的較單純,重在表達(dá)意見(jiàn),抒發(fā)情感。而發(fā)布垃圾信息的評(píng)論者,其重點(diǎn)在于誤導(dǎo)民眾情感,以達(dá)到引導(dǎo)輿論的目的,在這一前提下,通常認(rèn)為虛假評(píng)論者希望盡可能擴(kuò)大網(wǎng)絡(luò)影響力,在微博中重復(fù)發(fā)表十分相似的評(píng)論,尤其是重復(fù)評(píng)論,因此本文認(rèn)為,重復(fù)出現(xiàn)的評(píng)論可以作為識(shí)別垃圾評(píng)論的重要特征。
3)評(píng)論中是否出現(xiàn)主要評(píng)論對(duì)象的名稱:經(jīng)過(guò)對(duì)大量評(píng)論的統(tǒng)計(jì)分析,垃圾評(píng)論通常針對(duì)國(guó)家、政府或非政府機(jī)構(gòu),在引導(dǎo)民眾對(duì)它們產(chǎn)生負(fù)面情感的過(guò)程中,評(píng)論者會(huì)忽略評(píng)論對(duì)象本身。例如馬航事件中,評(píng)論者會(huì)忽略“馬航”而著重強(qiáng)調(diào)政府詞匯。
4)評(píng)論中正面情感詞出現(xiàn)次數(shù)/評(píng)論中所有情感詞出現(xiàn)次數(shù):一些垃圾評(píng)論制造者可能會(huì)使用情感詞來(lái)過(guò)分贊揚(yáng)或者詆毀某一事件。因此,如果一條評(píng)論含有多個(gè)情感傾向較大的詞匯,則該評(píng)論作為垃圾評(píng)論的可能性就比較大。
5)評(píng)論中負(fù)面情感詞出現(xiàn)次數(shù)/評(píng)論中所有情感詞出現(xiàn)次數(shù)。
6)評(píng)論中政府部門的出現(xiàn)次數(shù)/評(píng)論中所有評(píng)論對(duì)象的出現(xiàn)次數(shù):經(jīng)過(guò)對(duì)大量評(píng)論的研究統(tǒng)計(jì),在事件的評(píng)論中,大多垃圾評(píng)論內(nèi)容是關(guān)于貶低、污蔑國(guó)家政府,這一特征已成為大多垃圾評(píng)論的共性。
對(duì)網(wǎng)絡(luò)輿情垃圾觀點(diǎn)進(jìn)行識(shí)別前,需要先對(duì)判定為垃圾觀點(diǎn)的六個(gè)特征進(jìn)行權(quán)重的計(jì)算,權(quán)重的計(jì)算采用信息增益(IG)算法。在對(duì)網(wǎng)絡(luò)輿情垃圾觀點(diǎn)進(jìn)行識(shí)別時(shí),選擇合適的數(shù)學(xué)模型非常重要。對(duì)于垃圾觀點(diǎn)的識(shí)別其實(shí)本質(zhì)上屬于文本的分類問(wèn)題,分類算法通過(guò)對(duì)已知類別訓(xùn)練集的分析,從中發(fā)現(xiàn)分類規(guī)則,以此預(yù)測(cè)新數(shù)據(jù)的類別。而目前關(guān)于文本的分類算法主要有BP神經(jīng)網(wǎng)絡(luò),貝葉斯分類器,決策樹(shù)分類算法等。其中,基于基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的支持向量機(jī)(SVM)模型在解決小樣本、非線性及高維模式識(shí)別問(wèn)題中有明顯的優(yōu)勢(shì),SVM解決問(wèn)題時(shí),和樣本的維數(shù)是無(wú)關(guān)的,這使得SVM很適合用來(lái)解決文本分類問(wèn)題[9]。但是SVM模型的分類效果在很大程度上依賴于懲罰參數(shù)C和核函數(shù)參數(shù)g選取的準(zhǔn)確程度,為了提高懲罰參數(shù)C和核函數(shù)參數(shù)g的選擇準(zhǔn)確率[8],采用啟發(fā)式的粒子群優(yōu)化算法對(duì)懲罰參數(shù)C和核函數(shù)參數(shù)g進(jìn)行尋優(yōu)。
網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別的模型圖如圖1所示。
圖1 模型整體流程
粒子群算法[10]是由Kennedy和Eberhart于1995年提出,他的尋優(yōu)思想源于對(duì)鳥(niǎo)群捕食行為的研究,其基本思想是把每個(gè)優(yōu)化問(wèn)題的潛在解看成是搜索空間中的粒子,每個(gè)粒子都有一個(gè)適應(yīng)值,它由要優(yōu)化的目標(biāo)函數(shù)決定,每個(gè)粒子還有一個(gè)速度向量,它決定了該粒子在搜索空間中飛行的距離和方向。假設(shè)在一個(gè)D維的搜索空間中,由n個(gè)粒子組成的種群 x=(x1,x2,…,xn),其中第 i個(gè)粒子在D維搜索空間中的位置亦代表問(wèn)題的一個(gè)潛在解。根據(jù)目標(biāo)函數(shù)即可計(jì)算出每個(gè)粒子位置xi對(duì)應(yīng)的適應(yīng)度值。第i個(gè)粒子的速度為vi=(vi1,vi2,…,viD)T,其個(gè)體極值為 pi=(pi1,pi1,…,piD)T,全局極值為 pg=(pg1,pg2,…,pgD)T。在每一次迭代中,粒子通過(guò)跟蹤個(gè)體極值和全局極值更新自身的速度和位置,直到搜索到最優(yōu)位置為止,更新公式如下:
式 中 ,w 為 慣 性 權(quán) 重 ;d=1,2,…,D ;i=1,2,…,n;k為當(dāng)前迭代次數(shù);vid為粒子的速度;c1和c2為非負(fù)常數(shù),稱為加速度因子;r1和r2為分布于[0,1]之間的隨機(jī)數(shù)。為了防止粒子的盲目搜索,一般將其位子和速度限制在一定的區(qū)間[-xmax,xmax]、[-vmax,vmax]。
粒子群算法尋優(yōu)流程圖如圖2所示。
圖2 粒子群算法參數(shù)尋優(yōu)流程圖
本文選擇PSO算法來(lái)優(yōu)化SVM分類器的懲罰參數(shù)C和核函數(shù)參數(shù)g,用兩個(gè)粒子分別代表C和g,基于PSO-SVM的網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別算法主要步驟如下:
1)選用評(píng)論是否匿名、評(píng)論是否重復(fù)出現(xiàn)、評(píng)論中是否出現(xiàn)主要評(píng)論對(duì)象的名稱、評(píng)論中正(負(fù))面情感詞占比、評(píng)論中政府部門出現(xiàn)的占比這6個(gè)特征界定是否為垃圾觀點(diǎn),并把這6個(gè)特征表示為向量形式,具體表示為:x=(x1,x2,x3,x4,x5,x6)。通過(guò)信息增益(IG)計(jì)算出每個(gè)特征的信息增益值,特征的信息增益值越大,表示其對(duì)于垃圾觀點(diǎn)的識(shí)別貢獻(xiàn)越大,對(duì)分類也越重要;
2)將從微博上爬取的每一條輿情事件的評(píng)論都用以上特征向量表示,分別選取一部分作為訓(xùn)練集,一部分作為測(cè)試集,并且將這些特征向量的數(shù)據(jù)進(jìn)行歸一化處理;
3)將粒子群算法中的懲罰參數(shù)C和核函數(shù)參數(shù)g進(jìn)行初始化,隨機(jī)產(chǎn)生C和g的位置和速度;
4)結(jié)合輿情事件評(píng)論的訓(xùn)練集計(jì)算初始的懲罰參數(shù)C和核函數(shù)參數(shù)g的適應(yīng)度值;
5)根據(jù)適應(yīng)度值通過(guò)式(1)和式(2)更新當(dāng)前的懲罰參數(shù)C和核函數(shù)參數(shù)g的位置和速度;
6)當(dāng)?shù)螖?shù)或者適應(yīng)度值滿足最優(yōu)解時(shí),則停止迭代,否則返回步驟(2);
7)利用評(píng)論訓(xùn)練集和最佳的參數(shù)C、g進(jìn)行SVM的訓(xùn)練;PSO-SVM的形成是通過(guò)選取訓(xùn)練集的6維評(píng)論樣本,通過(guò)SVM算法計(jì)算出5維超平面(將6維空間一分為二的超平面比6維少一維)作為分類的邊界,將6維空間一分為二,二分以后的兩個(gè)空間分別代表真實(shí)評(píng)論的特征向量集合和垃圾觀點(diǎn)評(píng)論的特征向量集合。運(yùn)用PSO-SVM計(jì)算出的5維超平面的數(shù)學(xué)表達(dá)式如下:
該最優(yōu)化問(wèn)題的求解需要聯(lián)立式(4)和式(5)
其中的約束是指要求各個(gè)數(shù)據(jù)點(diǎn)到分類面的距離大于等于1。由SVM數(shù)學(xué)模型可知,需要求解的是支持向量機(jī)系數(shù) αi(i=1,2,…,m),自適應(yīng)函數(shù)為
步驟(3)中粒子的初始位置應(yīng)該滿足以下條件:
得到的函數(shù)屬于二次規(guī)劃問(wèn)題,使用拉格朗日函數(shù)結(jié)合優(yōu)化問(wèn)題和約束,再使用對(duì)偶理論,即可計(jì)算出超平面的數(shù)學(xué)表達(dá)式。
8)將預(yù)測(cè)集輸入進(jìn)訓(xùn)練好的PSO-SVM分類器中進(jìn)行垃圾觀點(diǎn)的識(shí)別;
9)通過(guò)評(píng)測(cè)指標(biāo):準(zhǔn)確率、召回率和F-mea?sure進(jìn)行垃圾觀點(diǎn)識(shí)別準(zhǔn)確率的評(píng)測(cè)。
PSO優(yōu)化SVM網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別算法的流程圖如圖3所示。
圖3 PSO-SVM網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別流程圖
本實(shí)驗(yàn)以2014年3月8日發(fā)生的馬來(lái)西亞航班失蹤事件為主題,隨機(jī)從新浪微博上爬取有關(guān)該事件的200條評(píng)論,選擇6名實(shí)驗(yàn)人員,分別對(duì)這200條評(píng)論進(jìn)行垃圾評(píng)論和非垃圾評(píng)論的人工標(biāo)注,選擇標(biāo)注結(jié)果相同的評(píng)論作為實(shí)驗(yàn)的數(shù)據(jù)集。其中50條垃圾評(píng)論,50條有意義的評(píng)論。實(shí)驗(yàn)的結(jié)果是為了識(shí)別這100條評(píng)論是否是垃圾評(píng)論,用T代表垃圾評(píng)論,F(xiàn)代表有意義評(píng)論。
1)先對(duì)界定為垃圾觀點(diǎn)的6個(gè)特征進(jìn)行信息增益的權(quán)重計(jì)算,計(jì)算結(jié)果如表1。
表1 信息增益權(quán)重表
2)未優(yōu)化參數(shù)的SVM訓(xùn)練與預(yù)測(cè)
實(shí)驗(yàn)選擇40條評(píng)論作為訓(xùn)練集,進(jìn)行SVM分類器的訓(xùn)練,然后用剩下的60條作為測(cè)試集測(cè)試分類器的識(shí)別性能。此時(shí)懲罰參數(shù)C和g是隨機(jī)選擇的,未被優(yōu)化的。其中C=3,g=4,所得實(shí)驗(yàn)結(jié)果如圖4。
3)PSO-SVM訓(xùn)練與預(yù)測(cè)
用粒子群算法優(yōu)化的適應(yīng)度變化曲線如圖5,優(yōu)化后的最佳懲罰參數(shù)C=18.0918,最佳的核函數(shù)參數(shù)g=0.94346。經(jīng)過(guò)PSO-SVM的識(shí)別圖如圖6,通過(guò)對(duì)比SVM和PSO-SVM的結(jié)果,可以得出經(jīng)過(guò)優(yōu)化懲罰參數(shù)和核函數(shù)參數(shù)g使得識(shí)別效果有明顯提高。
圖4 SVM網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別圖
圖5 PSO適應(yīng)度曲線
圖6 PSO-SVM網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別
4)將PSO-SVM中的6維特征輸入改成5維特征,用來(lái)檢測(cè)輸入特征對(duì)識(shí)別結(jié)果的影響。
首先將輸入的信息增益值最小的評(píng)論對(duì)象名稱這一特征去掉并進(jìn)行識(shí)別實(shí)驗(yàn),然后再將信息增益值最大的政府部門這一特征去掉進(jìn)行識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如圖7和圖8,實(shí)驗(yàn)結(jié)果表明評(píng)價(jià)對(duì)象這一特征對(duì)識(shí)別結(jié)果影響不大,而政府部門這一特征由于信息增益值比較大,所以對(duì)識(shí)別結(jié)果影響較大。
圖7 去掉特征(1)垃圾觀點(diǎn)識(shí)別圖
圖8 去掉特征(6)的垃圾觀點(diǎn)識(shí)別圖
5)網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別性能評(píng)測(cè)
對(duì)識(shí)別性能的評(píng)測(cè),實(shí)驗(yàn)采用準(zhǔn)確率,召回率和F-measure作為網(wǎng)絡(luò)輿情垃圾觀點(diǎn)識(shí)別的評(píng)判標(biāo)準(zhǔn)。實(shí)驗(yàn)中,準(zhǔn)確率是指評(píng)論被分類器分類到類別ci而且這個(gè)分類正確的概率。召回率就是一條評(píng)論應(yīng)該屬于類別ci,而分類器也確實(shí)將其分類到類別 ci的概率。計(jì)算結(jié)果通式(9),(10)和(11)計(jì)算得出。
準(zhǔn)確率和召回率的計(jì)算公式分別為
其中a表示測(cè)試評(píng)論集中本來(lái)屬于類別ci而且被分類器分到類別ci的評(píng)論數(shù);b表示測(cè)試評(píng)論集中本來(lái)不屬于類別ci但卻被分類器錯(cuò)誤分類到類別ci的評(píng)論數(shù);c表示本來(lái)應(yīng)該屬于類別ci但被分類器分到別的類別的評(píng)論數(shù)。
F-measure的計(jì)算采用由Van Rijsbergen提出使用綜合考慮準(zhǔn)確率和召回率兩種指標(biāo)來(lái)計(jì)算,計(jì)算公式如下:
將以上不同各實(shí)驗(yàn)結(jié)果進(jìn)行比較結(jié)果如表2所示。
由表得出優(yōu)化了參數(shù)的SVM識(shí)別效果比未被優(yōu)化的SVM要好。而垃圾識(shí)別特征的界定對(duì)分類的準(zhǔn)確率也有很重要的影響,通過(guò)實(shí)驗(yàn)可得,信息增益值越大的特征對(duì)分類效果影響越大,從而可知這個(gè)特征在垃圾觀點(diǎn)評(píng)論中越重要。
表2 不同實(shí)驗(yàn)的比較結(jié)果
1)總體上,對(duì)于垃圾觀點(diǎn)的識(shí)別研究是一個(gè)比較新的領(lǐng)域,關(guān)鍵是提取垃圾觀點(diǎn)特征上,不同的事件特征有可能不同[14],但是融合評(píng)論內(nèi)容和評(píng)論人這兩方面特征適用于多數(shù)的垃圾觀點(diǎn)識(shí)別,并且特征越多,對(duì)于垃圾觀點(diǎn)的識(shí)別越有效。
2)在實(shí)現(xiàn)技術(shù)上,由于存在標(biāo)注的偏差,基于機(jī)器學(xué)習(xí)的分類方法存在一定的局限性,所以在實(shí)現(xiàn)技術(shù)上還需進(jìn)一步的探索。
3)在Web2.0互聯(lián)網(wǎng)環(huán)境中用戶的隱私保護(hù)和信息安全問(wèn)題是垃圾觀點(diǎn)識(shí)別研究發(fā)展的制約,垃圾觀點(diǎn)識(shí)別研究是為了將網(wǎng)絡(luò)中存在的大量水軍或者垃圾評(píng)論進(jìn)行識(shí)別并且對(duì)其采取防治的措施[15]。所以,實(shí)驗(yàn)分析中如何避免涉及用戶的個(gè)人信息同時(shí)還能將網(wǎng)絡(luò)水軍和垃圾觀點(diǎn)高校的識(shí)別出來(lái),是研究中的一個(gè)難點(diǎn)。
[1]陳曉美.網(wǎng)絡(luò)評(píng)論觀點(diǎn)知識(shí)發(fā)現(xiàn)研究[D].長(zhǎng)春:吉林大學(xué),2014.
CHEN Xiaomei.Network review opinions knowledge dis?covery research[D].Changchun:Jilin University,2014.
[2]李霄,丁晟春.垃圾商品評(píng)論信息的識(shí)別研究[J].情報(bào)分析與研究,2013,229(1):63-68.
LI Xiao,DING Maochun.Rubbish goods comments infor?mation recognition research[J].Intelligence Analysis and Research,2013,229(1):63-68.
[3]董松月,陳潤(rùn)雨,劉西菩,等.網(wǎng)絡(luò)民航事件虛假評(píng)論的識(shí)別研究[J].智能計(jì)算機(jī)與應(yīng)用,2016,6(4):28-31.
DONG Songyue,CHEN Runyu,LIU Xipu,et al.False comments identifying research about network of civil avia?tion events[J].Intelligent Computer and Application,2016,6(4):28-31.
[4]韓曉暉.Web社會(huì)媒體中信息的質(zhì)量評(píng)價(jià)及應(yīng)用研究[D].濟(jì)南:山東大學(xué),2012.
HANG Xiaohui.Web information quality evaluation and application of research in social media[D].Jinan:Shan?dong University,2012.
[5]莫倩,楊珂.網(wǎng)絡(luò)水軍識(shí)別研究[J].軟件學(xué)報(bào),2014,25(7):1505-1526.
MO Qian,YANG Ke.Network water army recognition re?search[J].Journal of Software,2014,25(7):1505-1526.
[6]李明.改進(jìn)PSO-SVM在說(shuō)話人識(shí)別中的應(yīng)用[J].電子科技大學(xué)學(xué)報(bào),2007,36(6):1345-1349.
LI Ming.Improved PSO-SVM application in speaker rec?ognition[J].Journal of University of Electronic Science and Technology,2007,36(6):1345-1349.
[7]朱鳳明,樊明龍.混沌粒子群算法對(duì)支持向量機(jī)模型參數(shù)的優(yōu)化[J].計(jì)算機(jī)仿真,2010,27(11):183-186.
ZHU Fengming,F(xiàn)AN Minglong.Chaotic particle swarm optimization algorithm for support vector machine(SVM)model parameters optimization[J].Computer Simulation,2010,27(11):183-186.
[8]胡云艷,彭敏放,田成來(lái).基于粒子群算法優(yōu)化支持向量機(jī)的模擬電路診斷[J].計(jì)算機(jī)應(yīng)用研究,2012,29(11):4053-4055.
HU Yunyan,PENG Minfang,TIAN Chenlai.Based on par?ticle swarm algorithm to optimize the analog circuit diagno?sis of support vector machine(SVM)[J].Computer Appli?cation and Research,2012,29(11):4053-4055.
[9]谷文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機(jī)研究[J].北京理工大學(xué)學(xué)報(bào),2014,34(7):705-709.
GU Wencheng,CHAI Baoren,TENG Yanping.Support vector machine research based on particle swarm optimiza?tion algorithm[J].Journal of Beijing institute of Technolo?gy,2014,34(7):705-709.
[10]楊鐘瑾.粒子群和遺傳算法優(yōu)化支持向量機(jī)的破產(chǎn)預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(18):265-270.
YANG Zhongjin.Particle swarm optimization and genetic algorithm of support vector machine(SVM)bankruptcy prediction[J].Computer Engineering and Applications,2013,49(18):265-270.
[11]鄧冰娜.一種應(yīng)用于博客的垃圾評(píng)論識(shí)別方法[J].鄭州大學(xué)學(xué)報(bào),2011,43(1):65-69.
DENG Bingna.A kind of application in blog comment spam recognition method[J].Journal of Zhengzhou Uni?versity,2011,43(1):65-69.
[12]馬煥強(qiáng).論壇垃圾回帖的識(shí)別與過(guò)濾[D].保定:河北大學(xué),2014.
MA Huanqiang.BBS spam reply identification and filter?ing[D].Baoding:Hebei University,2014.
[13]Jindal N,Liu B.Review Spam Detection[C]//In:Pro?ceedings of the 16th International Conference on World Wide Web,Banff,Al-berta,Canada.New York,NY,USA:ACM,2007:1189-1190.
[14]Mukherjee A,Liu B,Wang J,etal.Detecting Group Re?view Spam[C]//In:Proceedings of the 28th ACM Interna?tional Conference on Information and Knowledge Manage?ment,Hyderabad,India.New York,NY,USA:ACM,2011:1123-1126.
[15]Lim E-P,Nguyen V-A,Jindal N,et al.Detecting prod?uct reviews spammers using rating behaviors[C]//In Pro?ceedings of the 19th ACM International Conference on In?formation and Knowledge Management.Toronto,ON,Canada:ACM,2010:930-948.
[16]Jindal N,Liu B,Lim E-P.Finding a typicalreview pat?terns for detecting opinion spammers[R].2010.
[17]Jindal N.Liu B,Lim E P.Finding Unusual Review Pat?terns using Unexpected Rules[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management,2010:1549-1552.
[18]WU G,Greene D,Smyth B,et al.Distortion as a Valida?tion Criterion in the Identification of Suspicious Reviews[C]//1st Worksh op on Social Media Analytics.Washing?ton,DC,U SA,2010.
[19]Wang G,Xie S H,Liu B,et al.Identify Online Store Re?view Spammers via Social Review Graph[J].ACM Trans?actions on Intelligent Systems and Technology(TIST),2012,3(04).
[20]Xie S H,Wang G,Lin S Y,et al.Review Spam Detection via Temporal Pattern Discovery[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowl?edge Discovery and Data Mining,2012:823-831.