穆云翔, 盛志偉, 盧嘉中
(成都信息工程大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,四川 成都 610225)
網(wǎng)絡(luò)水軍是指在網(wǎng)絡(luò)中針對特定內(nèi)容發(fā)布特定信息的、被雇傭的網(wǎng)絡(luò)寫手,簡稱水軍,又名網(wǎng)絡(luò)槍手。他們通?;钴S在電子商務(wù)網(wǎng)站平臺中,通過發(fā)布虛假的商品評價來影響正常消費者的決策。
網(wǎng)絡(luò)的快速發(fā)展為水軍提供了滋生條件。一方面,網(wǎng)絡(luò)環(huán)境提供的便利:網(wǎng)絡(luò)開放性、即時性、自由性、交互性等特點為網(wǎng)絡(luò)水軍的發(fā)展壯大提供了環(huán)境支撐。網(wǎng)絡(luò)的開放性為網(wǎng)絡(luò)水軍提供了自由出入的媒體門戶,不需要提供任何真實信息即可徜徉于各大論壇、貼吧,在網(wǎng)絡(luò)上任意發(fā)表言論;網(wǎng)絡(luò)的即時性則有助于網(wǎng)絡(luò)水軍引導(dǎo)網(wǎng)民對輿情的推動,讓受眾在缺乏理性分析的前提下引爆預(yù)設(shè)議題。網(wǎng)絡(luò)的自由性塑造了無中心的狂歡廣場,任何網(wǎng)民都可自由發(fā)布信息,也為網(wǎng)絡(luò)水軍的“灌水”行為提供了便利。網(wǎng)絡(luò)的交互性為政府、媒體、網(wǎng)民之間的交流互動提供了便利,從而形成“圍觀”的力量。另一方面,網(wǎng)絡(luò)受眾的媒介素養(yǎng)偏低。中國網(wǎng)民群體龐大,但媒介素養(yǎng)參差不齊,整體不容樂觀,在一定程度上縱容了網(wǎng)絡(luò)水軍的發(fā)展壯大。一些年輕網(wǎng)民由于心態(tài)不成熟,往往不能客觀、全面、辯證地看待社會問題,容易受網(wǎng)絡(luò)負面情緒影響。面對網(wǎng)絡(luò)水軍故意炒作的熱點事件,極易非理性地跟風(fēng)發(fā)帖,成為網(wǎng)絡(luò)水軍的“幫兇”。一些在經(jīng)濟上比較失意的網(wǎng)民則容易產(chǎn)生“仇富”心態(tài),當(dāng)網(wǎng)絡(luò)上曝出諸如“房妹”等新聞熱點時,他們會不自覺地與網(wǎng)絡(luò)水軍站在同一戰(zhàn)壕;一些網(wǎng)民對娛樂化的追求不斷削弱主流媒體的權(quán)威性與影響力,為更能把握網(wǎng)民心理的網(wǎng)絡(luò)水軍提供了搶占先機的機會。
電子商務(wù)平臺提供在線評論系統(tǒng)作為商家與消費者的橋梁。消費者通過瀏覽評論細節(jié)來決定是否購買產(chǎn)品,產(chǎn)品評論成為影響消費者購買欲望的重要因素。由于消費者傾向于購買好評產(chǎn)品,而放棄購買負面評論產(chǎn)品,因此在競爭激烈的電商市場中,許多商家通過雇傭“水軍”,在自己的店鋪下用圖片偽造好評,操縱評論。并在競爭對手的門店下進行惡意評論,誤導(dǎo)消費者。水軍虛假評論的存在干擾了產(chǎn)品描述的真實性,對電商平臺和消費者產(chǎn)生了顯著的負面影響。因此,識別網(wǎng)絡(luò)水軍評論并保護消費者權(quán)益非常重要。總而言之,通過大量同質(zhì)行為或內(nèi)容形成回聲室效應(yīng),從而影響其他用戶的觀點和決策,是網(wǎng)絡(luò)水軍的最終目的。
在電商平臺中,網(wǎng)絡(luò)水軍采取發(fā)布不實信息來混淆視聽。對于消費者而言,水軍的存在影響購買意愿;對于商家而言,如何請水軍刷好評變成了影響銷售的最大因素;對于市場而言,水軍擾亂了原有的市場秩序。這對于行業(yè)的發(fā)展具有很大的影響力,因此網(wǎng)絡(luò)水軍的監(jiān)管成為一個亟待解決的難題。
本文主要關(guān)注Yelp 系統(tǒng)中的水軍。關(guān)于這類水軍識別器主要有以下缺點:(1)大多數(shù)識別器都假設(shè)水軍有相同的特征,并且可以根據(jù)這個特征來識別水軍。但是在現(xiàn)實世界里有很多種水軍,他們有不同的目標(biāo)、對象和策略。如一個水軍可能想要推廣某一件商品,而另一個水軍想要貶低競爭對手。(2)專業(yè)水軍會研究最新的識別技術(shù),并從中發(fā)掘新的策略來逃過識別器[1-2]。(3)現(xiàn)有的識別器大都基于精確率和召回率作為識別目標(biāo)。而根據(jù)Luca[3]利用市場研究的現(xiàn)有成果,從商品評分變化的角度定義了網(wǎng)絡(luò)水軍的實際效應(yīng)。實際效應(yīng)可以用來表示水軍和平臺在對抗過程中的實際目標(biāo),假設(shè)水軍的目標(biāo)是推廣目標(biāo)商品,那么平臺的目標(biāo)就是盡可能地減少推廣的程度。文獻[3]也通過實驗證明,即使在召回率很高的情況下,水軍依然可以達到很高的推廣效果。
本文提出一種利用用戶行為特征的水軍識別算法(FBS),將FBS 應(yīng)用到一個水軍對抗模型,最終訓(xùn)練出的識別器在公開數(shù)據(jù)集YelpChi 上取得了不錯的性能表現(xiàn)。并利用網(wǎng)絡(luò)水軍賬號的一些特點,提出幾種新的用戶特征和一個基于用戶行為特征分析的水軍識別算法(FBS)。將FBS 應(yīng)用到一個水軍對抗模型中,最終訓(xùn)練出的識別算法性能相較于以前有明顯提升。
AP(affinity propagation)算法[4]無需事先指定聚類數(shù)目,且沒有明確的質(zhì)心(聚類中心點),樣本中的所有數(shù)據(jù)點都可能成為AP 算法中的質(zhì)心。根據(jù)現(xiàn)實環(huán)境中網(wǎng)絡(luò)水軍種類繁多,且同類型水軍之間較為類似的特點,再基于AP 算法的上述特征,將其應(yīng)用到水軍對抗模型。
目前最常見的分類器有人工神經(jīng)網(wǎng)絡(luò)、K-近鄰(K-NN)、樸素貝葉斯和決策樹。盡管這些分類算法在幾十年的發(fā)展中衍生出很多的改進算法,但是仍然沒有一種完美的分類算法能適應(yīng)所有的環(huán)境問題。根據(jù)Kotsiantis[5]在主流分類算法性能比較,人工神經(jīng)網(wǎng)絡(luò)和支持向量機對大規(guī)模數(shù)據(jù)訓(xùn)練比較困難,且對缺失數(shù)據(jù)敏感;K-NN 時間復(fù)雜度和空間復(fù)雜度高,可解釋性差;樸素貝葉斯通常準(zhǔn)確率較低,且只能用于處理二分類問題;相對于其他幾種分類算法,決策樹計算量簡單,可解釋性強,比較適合處理有缺失屬性值的樣本,能夠處理不相關(guān)的特征。此外,決策樹能夠很好地處理同時具有離散和連續(xù)屬性的分類問題。因此,使用決策樹算法進行分類識別最為合適,詳情如表1 所示。
表1 機器學(xué)習(xí)常用分類算法比較
2020年Dou 等[6]利用強化學(xué)習(xí)建立的水軍對抗模型,提出一種全新的水軍識別性能的評測指標(biāo)PE(practical effect)。該模型利用多個水軍識別算法和多種水軍攻擊策略進行博弈,將博弈過程轉(zhuǎn)換為兩條相互依賴的馬爾可夫決策過程。利用雙方博弈直至達到納什均衡,此時的水軍識別算法即可認為是當(dāng)前環(huán)境下的最優(yōu)算法。本文將提出FBS 并將其應(yīng)用到對抗模型中,以此訓(xùn)練出的水軍識別算法達到的效果相較于以前PE 提升了8%。
現(xiàn)有識別網(wǎng)絡(luò)水軍的方法主要有3 種:基于文本與情感分析法、基于行為特征分析法和基于圖結(jié)構(gòu)法。其中,基于文本與情感分析需要花費較長時間進行訓(xùn)練,且隨著NLP 等人工智能算法的發(fā)展,水軍文本內(nèi)容已經(jīng)和普通用戶的評論文本差別越來越小。因此,基于文本分析法的性能相較于其他兩種普遍偏低。
早期的水軍由于發(fā)布的評論信息都很類似,因此研究方法大多基于語言學(xué)特征。其中,詞袋特征是大部分研究者的首選語言特征。M Mccord 等[7]提取重復(fù)評論的bigram 特征,在推特數(shù)據(jù)集訓(xùn)練回歸模型,利用隨機森林分類器識別只關(guān)注品牌的評論和評論文本無關(guān)的兩類垃圾評論,精確率高達95.7%。
Li 等[8]基于新擴展的黃金標(biāo)準(zhǔn)數(shù)據(jù)集識別網(wǎng)絡(luò)水軍,該數(shù)據(jù)集由來自3 個不同領(lǐng)域(酒店、餐廳、醫(yī)生)的數(shù)據(jù)組成,每個領(lǐng)域都包含3 種類型的評論,即客戶生成的真實評論、網(wǎng)絡(luò)水軍生成的欺騙性評論和員工(領(lǐng)域?qū)<?生成的欺瞞性評論。該文試圖捕捉欺騙性評論和真實評論之間語言特征的一般差異和水軍檢測的領(lǐng)域遷移性問題。實驗表明該模型在餐廳數(shù)據(jù)集上分類準(zhǔn)確率都能達到75%左右,而在醫(yī)生數(shù)據(jù)集上準(zhǔn)確率只有50%左右。實驗表明該特征用于水軍的虛假評論檢測的領(lǐng)域遷移性差。
Noekhah S 等[9]通過提取分析詞頻、信息豐富度、內(nèi)容定罪等特征,實現(xiàn)了基于欺騙性語言的評論文本在線欺騙識別系統(tǒng)。將這些特征集應(yīng)用到之前使用的3 個分類器(支持向量機、樸素貝葉斯和C4.5 決策樹),并使用5 倍交叉驗證。最終的實驗結(jié)果表明,識別欺騙性評論的準(zhǔn)確率達到80%,但是該識別方法時間復(fù)雜度很高,并不適用于一些較大的數(shù)據(jù)集。
Wang 等[10]首先提出虛假評價檢測中的冷啟動問題,在Yelp 評價數(shù)據(jù)上提取一部分“新的評價”,即該用戶只發(fā)布了一條評價。作者將之前研究中提到的文本和行為特征檢測模型應(yīng)用到這些新評價上,發(fā)現(xiàn)檢測的效果并不好。為解決這種冷啟動問題,一種直觀的想法是從歷史數(shù)據(jù)中去尋找和這個新評價發(fā)布者特征相似的評論者,然后把最相似的評價者或者評價的標(biāo)簽作為該新評價的標(biāo)簽。總而言之,雖然新評價信息很少,但可以通過深度學(xué)習(xí),在歷史數(shù)據(jù)上學(xué)習(xí)到有效的關(guān)系嵌入(embedding),然后利用該模型得到新的數(shù)據(jù)嵌入,這樣就可以結(jié)合歷史嵌入和其標(biāo)簽來預(yù)測新數(shù)據(jù)的標(biāo)簽。
Hooi B 等[11]利用二部圖提出了Fraudar 算法。Fraudar 定義了一個可以表達結(jié)點平均可疑度的全局度量G(·),在逐步貪心移除可疑度最小結(jié)點的迭代過程中,使G(·)達到最大的留存結(jié)點組成可疑度最高的致密子圖。在此算法中,由于無法模仿每個節(jié)點與其他節(jié)點的聯(lián)系,因此準(zhǔn)確率大幅度提升。但是Fraudar 的一個缺點是它的串行運算特性導(dǎo)致在大規(guī)模二部圖上運算緩慢,其每次迭代只動態(tài)地刪除一個結(jié)點并更新剩余結(jié)點狀態(tài)。
Wang 等[12]除了利用用戶本身的一些信息,還利用用戶在社交網(wǎng)絡(luò)中的好友關(guān)系對一些可疑用戶進行識別。作者基于圖結(jié)構(gòu)的方法將水軍和水軍的虛假評論識別看作聯(lián)合分類或排序問題,再采用馬爾科夫隨機場模型和LBP[13](loopy belief propagation)計算每個節(jié)點的可疑程度。還對LBP 算法進行優(yōu)化,提高了算法的效率并且有收斂性的保證。實驗表明,該模型在新浪微博數(shù)據(jù)集上的分類Accuracy 都能達到75%。
Shah N 等[14]提出利用網(wǎng)絡(luò)結(jié)構(gòu)特征來識別在亞馬遜上通過眾包發(fā)送水軍虛假評論的用戶,提出TwoFace 算法,更多關(guān)注召回率,該算法有的召回率能夠達到91%。該算法也有缺點,ground truth 的可信度不是很高。
S Rayana[2]提出SPEAGLE 框架來做網(wǎng)絡(luò)水軍識別,利用關(guān)聯(lián)數(shù)據(jù)和元數(shù)據(jù),結(jié)合了圖、行為和文本進行水軍識別,該方法中圖由user-review-product 圖構(gòu)成,3 種類型的結(jié)點都有標(biāo)簽,user:水軍與否,review:虛假與否,product:為被攻擊目標(biāo)與否。論文用圖來做分類,用metadata 來估計有關(guān)節(jié)點的類分布的先驗知識。該算法在數(shù)據(jù)集YelpZip 上的準(zhǔn)確率可以達到79.4%。
盡管研究者們都針對不同情況下的用戶特征進行深入研究,但其往往集中在某幾個方面。隨著平臺和水軍的發(fā)展,上述方法大多只能識別出某一類水軍,適用性并不夠廣泛。
由于現(xiàn)實環(huán)境中電商平臺的網(wǎng)絡(luò)水軍復(fù)雜且多樣,因此水軍檢測主要面臨的困難在于水軍檢測涉及的特征難以規(guī)范化表達。一方面,水軍覆蓋范圍廣,在不同平臺其特征不盡相同,導(dǎo)致沒有一個標(biāo)準(zhǔn)的水軍特征集;另一方面,水軍經(jīng)過多年發(fā)展,不斷通過模仿正常用戶來偽裝自己,導(dǎo)致識別模型準(zhǔn)確率不高。因此特征的選擇變得尤為重要,應(yīng)選用水軍無法模仿的一些特征加入特征集。
在Yelp 系統(tǒng)中,刻畫用戶的特征有很多,如MNR(一天內(nèi)寫的最大評論數(shù))、PR(積極評論比例)、NR(負面評論比例)等。結(jié)合Mukherjee 等[1]的研究,選取了4 個原始特征,如表2 所示。
表2 原始特征描述
針對當(dāng)前網(wǎng)絡(luò)水軍特征覆蓋面不足導(dǎo)致識別率不高的問題,綜合Yelp 系統(tǒng)中水軍用戶與正常用戶的差異性,結(jié)合水軍用戶的一些突出特征,本文提出AW、ISR、ERD、ETG、SQD 等5 個新特征,以此來擴充現(xiàn)有特征集對網(wǎng)絡(luò)水軍特征的覆蓋面。
定義1 AW 是用戶發(fā)表的第一條評論和最后一條評論的時間差。通常情況下,水軍的時間差較短。因為部分水軍可能只是為了某幾次完成任務(wù)而注冊,且完成刷分之后便棄用賬號。
定義2 ISR 是用戶是否僅有唯一評論。水軍賬號的注冊可能僅是為了某一次的刷分行為,在之后便不再使用,而正常用戶的使用大多是長期的。
定義3 ERD 是用戶評論的時間分布熵。分布熵是對不同概率分布的刻畫,它是概率分布的不確定性的期望值。值越大,表示時間分布的不確定性越大。正常用戶的評論時間一般是長期且穩(wěn)定的,不會在短時間內(nèi)出現(xiàn)大量的評論,因此時間分布的不確定性較大,分布熵較大。而水軍大多情況下,在任務(wù)集中時存在爆發(fā)式的評論。因此,時間分布的不確定性較低,分布熵較小。
其中pi表示第i個類別出現(xiàn)的概率,一般可以通過用屬于此類別的樣本數(shù)量除以樣本容量來估計該值。
定義4 ETG 是用戶評論的評分分布熵。一般來說,正常用戶的評分分布不穩(wěn)定,而水軍的評分分布大多分布在最高分和最低分。因此,正常用戶的評分分布熵較高,而水軍的評分分布熵較低。
定義5 SQD 是用戶評分中最高評分和最低評分在全部評論中的占比。因水軍是為了提高或降低某一商品的評分,故水軍的最高評分和最低評分在全部評論中的占比較高,正常用戶占比較低。
為驗證所選取特征與構(gòu)建的新特征的有效性,本文利用卡方檢驗算法[13]對上述特征進行相關(guān)性驗證,得到的特征P值排序結(jié)果,如表3 所示。
表3 特征P 值排序
從表3 可以看出,所提出的SQD、ISR、AW、ERD、ETG 的特征P值分別排在第2 名、第4 名、第5 名、第7 名、第8 名。因此,新構(gòu)造的5 個特征和數(shù)據(jù)任務(wù)相關(guān)性較強,具有一定的有效性。因此,將采用這9 個特征作為水軍特征集。
結(jié)合網(wǎng)絡(luò)水軍與正常用戶之間的差異,給出一個能準(zhǔn)確反映水軍和正常用戶之間差異的特征集合,采用AP 聚類算法的特征集,引入AP 聚類算法,通過刻畫用戶和用戶之間的相似性,結(jié)合同一類別水軍高度相似的特點,解決多類別水軍適應(yīng)性問題,再通過引入一個合適的歐氏距離閾值Radius,將閾值之內(nèi)所有未標(biāo)注用戶標(biāo)注為其所屬質(zhì)心的標(biāo)簽,再將擴充后的標(biāo)注集通過C4.5 決策樹算法進行分類模型訓(xùn)練,其流程如圖1 所示。
圖1 FBS 流程
具體算法描述如下。
輸入:Yelp 用戶信息集合U{u1,u2,u3,…,un}
輸出:每個Yelp 用戶u,為水軍的可能性大小y,
方法:按以下步驟執(zhí)行
步驟1:對于Yelp 用戶u1,按照表2 的內(nèi)容提取原始特征;
步驟2:利用上一步提取的基礎(chǔ)特征,分別計算AW、ISR、ERD、ETG、SQD;
步驟3:將按上述步驟處理好特征后的數(shù)據(jù)集輸入到AP 聚類模型中進行聚類,對以標(biāo)注數(shù)據(jù)為質(zhì)心的簇,引入Radius 閾值,將Radius 范圍內(nèi)所有未標(biāo)注數(shù)據(jù)標(biāo)注未與其所屬質(zhì)心同一標(biāo)簽;
步驟4:將步驟3 中得到的新標(biāo)注集和原始標(biāo)注集一起輸入到C4.5 決策樹中進行模型訓(xùn)練;
步驟5:將測試集輸入到步驟4 中訓(xùn)練好的分類模型中,輸出識別結(jié)果每個Yelp 用戶u,為水軍的可能性大小y;
步驟6:計算模型PE 值,算法結(jié)束。
將提出的FBS 算法引入到Dou 等[6]提出的水軍對抗模型中,訓(xùn)練出在YelpChi 上性能更好的識別器。具體使用到的識別算法和水軍攻擊策略如下:
識別器:采用如下幾種識別算法作為博弈中的水軍識別方。
(1)GANG[14]:基于馬爾科夫隨機場的識別器,利用有向圖模型識別水軍用戶的方法。
(2)SpEagle[2]:對用戶、評論與商品組成的馬爾科夫隨機場進行概率推算的識別器。
(3)fBox[14]:基于SVD 的識別器,利用子圖密度尋找小規(guī)模的可疑用戶。
(4)Fraudar[11]:找出所有用戶中最善于偽裝的水軍簇的識別器。
(5)FBS:基于用戶行為特征的水軍識別器。
水軍攻擊策略:采用Dou 等[6]提出的IncBP、IncDS、IncPR、Singleton 攻擊方法,具體如下:
(1)IncBP:利用VIP 用戶,盡量避開利用用戶行為特征的FBS 識別器和利用圖形信息的GANG 和SpEagle 識別器。具體是利用在用戶節(jié)點組成的馬爾科夫隨機場上進行置信傳播,用可疑度最低的用戶節(jié)點發(fā)布水軍的虛假評論。
(2)IncDS:每輪先計算用戶節(jié)點組成的子圖密度,用子圖密度最小的用戶節(jié)點發(fā)布水軍的虛假評論。
(3)IncPR:每輪攻擊前計算用戶行為特征的可疑程度,用可疑程度最小的用戶節(jié)點發(fā)布水軍的虛假評論。
(4)Singleton:創(chuàng)建新用戶,用新用戶發(fā)布水軍的虛假評論。
訓(xùn)練過程如圖2 所示。
圖2 訓(xùn)練過程
水軍攻擊的實際效應(yīng):假設(shè)p為水軍的攻擊策略,q為識別器的策略,R(p,q)則為水軍策略為p、識別器策略為q時一輪攻擊之后未被識別出的水軍用戶。這輪水軍攻擊的實際效應(yīng)算法如下:
水軍的目標(biāo)就是優(yōu)化策略p,使PE(v;R,p,q)的值最大化。
識別器的實際目標(biāo):優(yōu)化識別策略q,使PE(v;R,p,q)的值最小化。
水軍和識別器的目標(biāo)已經(jīng)確定:水軍要使目標(biāo)商品的銷售額提升,而識別器要抑制這種提高。雙方將在實際的場景中進行零和博弈,假設(shè)水軍攻擊策略為p,識別器策略為q,則雙方的博弈目標(biāo):
利用上述的幾種水軍識別算法和水軍攻擊算法進行訓(xùn)練,最終訓(xùn)練出Hybrid detect。如此訓(xùn)練出的水軍識別算法為當(dāng)前環(huán)境下性能最優(yōu)的水軍識別算法。
實驗運行環(huán)境為:Windows10 操作系統(tǒng),2.90GHz 6 核處理器,16 GB 內(nèi)存,算法的性能實驗利用PyCharm 軟件實現(xiàn)。
平均評分的提升或降低會實際影響產(chǎn)品的銷售額,在M Luca 的研究中發(fā)現(xiàn),平均評分每提升1 分(滿分5 分),其銷售額會增長5% ~9%。并且普通用戶與VIP 用戶的評論對商品的銷售額的影響也有所不同,VIP 用戶的評論對產(chǎn)品收益[3]的影響更大。因為他們在評論系統(tǒng)中對產(chǎn)品的評價更重要,比普通用戶的評論更頻繁地呈現(xiàn)給客戶。利用這項研究的結(jié)果,設(shè)計了一種更能表現(xiàn)水軍實際影響力的指標(biāo):實際效應(yīng)PE。計算方法:
其中,ERI 用來計算VIP 用戶評論的影響,RI 用來計算所有用戶評論的影響。β0和β1是兩種影響的系數(shù),β0=0.035,β1=0.036。這兩個系數(shù)的值是用Yelp 的數(shù)據(jù)估算的。
為準(zhǔn)確地驗證本文所提算法的效果,準(zhǔn)備了2 套數(shù)據(jù)集。第一套為公開數(shù)據(jù)集YelpChi[1],數(shù)據(jù)集中包含標(biāo)記的水軍的虛假評論和正常評論。第二套數(shù)據(jù)集(YMX)通過購買的方式獲得,其中有300 條水軍的虛假評論為新用戶所發(fā),正常評論是公開數(shù)據(jù)集YelpNYC[1]中被標(biāo)記的正常評論。兩套數(shù)據(jù)集均是在Yelp 平臺獲得的數(shù)據(jù)。YMX 將作為訓(xùn)練集使用,YelpChi 將作為測試集使用。
兩個數(shù)據(jù)集的詳細情況如表4 所示。
表4 數(shù)據(jù)集詳細信息
水軍攻擊策略設(shè)置:在測試集中共添加600 條水軍的虛假評論,包含450 個用戶和100 件商品。
識別策略設(shè)置:每一次識別器進行節(jié)點可疑度計算之后,將可疑度排名靠前的1%節(jié)點作為水軍刪除。
VIP 用戶選擇:由于無法從Yelp 抓取這些用戶的VIP 信息,Yelp 將用戶評論的數(shù)量作為是否為VIP 的關(guān)鍵因素,因此把每個數(shù)據(jù)集中單個用戶評論超過10 條的作為VIP 用戶,分別占YelpChi 的1.4%,YMX 的1.2%。
為驗證FBS 算法在Hybrid detect 中的有效性和其在識別模型中的影響,在本文所構(gòu)建的水軍識別模型的基礎(chǔ)上,將利用加入FBS 的Hybrid detect 和未加入FBS 的Hybrid detect 在數(shù)據(jù)集YelpChi 的實際效應(yīng)進行對比,實驗結(jié)果如圖3 所示。
圖3 不同的Hybrid detect 的實際效應(yīng)
由圖3 可以看出,不包含F(xiàn)BS 的Hybrid detect 的實際效應(yīng)高,能達到4.11。而加入FBS 之后,實際效應(yīng)能夠降到3.69,說明FBS 能夠有效地識別出原本識別不出的網(wǎng)絡(luò)水軍,使模型性能提高。
為驗證本文算法的有效性,實驗選擇的對比算法有GANG、SpEagle、fBox、Fraudar、Nash detect 算法。首先驗證了以GANG、SpEagle、fBox、Fraudar、Prior 算法為基礎(chǔ)訓(xùn)練出的Nash detect 在數(shù)據(jù)集(YelpChi)上的效果,再驗證以GANG、SpEagle、fBox、Fraudar、FBS 算法為基礎(chǔ)在訓(xùn)練出的Hybrid detect 在數(shù)據(jù)集(YelpChi)上的效果,以此驗證引入FBS 的有效性。再將Hybrid detect 與當(dāng)前先進的水軍識別模型Tow Face 做對比。
表5 顯示了單個識別器面對單個攻擊時的實際效果??梢钥吹?每個識別器只有識別特定類型的水軍效果較好。如果識別器選用了單個的識別器,那么水軍可以采用相應(yīng)策略使其效果大大減弱。
表5 識別器對抗各種攻擊的實際效果
在訓(xùn)練階段,每種識別器的權(quán)重每一輪都在改變,變化如圖4 所示,每種識別算法的遺漏水軍數(shù)量如圖5所示。
圖4 每種識別器在多輪博弈后的權(quán)重
圖5 每種識別器每輪未檢測到的水軍數(shù)量
從圖4 可以看出,Hybrid detect 在前40 輪訓(xùn)練中,各水軍識別算法的權(quán)重都在平穩(wěn)地向最優(yōu)配置移動。并且在40 輪訓(xùn)練之后,各個權(quán)重都已趨于平穩(wěn),說明此時Hybrid detect 已經(jīng)收斂到最優(yōu)配置。
從圖5 可以看出,Hybrid detect 在40 輪訓(xùn)練后漏檢的水軍數(shù)量是最少的,并且在40 輪后漏檢水軍數(shù)量也不會發(fā)生明顯變化,這一結(jié)果也和圖4 的結(jié)論相同。
在訓(xùn)練階段,在訓(xùn)練集上進行了60 輪訓(xùn)練,混合識別器在最終訓(xùn)練完成后PE 值明顯低于Nash detect和Tow Face。混合識別器在測試集上也取得了最優(yōu)的成績,其PE 值達到3.69,而其余識別器的PE 值都高于3.9,性能提升約8%。結(jié)果如圖6 和圖7 所示。
圖6 每種檢測器在多輪博弈后的實際效應(yīng)
圖7 幾種識別器在測試集的實際效應(yīng)
分析了現(xiàn)有的水軍識別器存在的一些問題,利用博弈論的知識對現(xiàn)有識別器進行改進。針對不同場景的水軍,只要設(shè)計好目標(biāo)函數(shù)、攻擊方法和識別器,通過運行該算法,就可以在線下找到最優(yōu)的識別器配置。為解決傳統(tǒng)水軍識別方法中存在的一些問題,提出一種新的水軍識別方法,該方法能充分利用用戶信息的特征。最后,將Hybrid detect 與Nash detect、Two Face這兩種識別器進行對比,實驗結(jié)果表明本文的方法具有更好的性能。