邵珠峰 姬東鴻
(武漢大學(xué)計算機學(xué)院 湖北 武漢 430072)
?
基于情感特征和用戶關(guān)系的虛假評論者的識別
邵珠峰姬東鴻
(武漢大學(xué)計算機學(xué)院湖北 武漢 430072)
摘要隨著電子商務(wù)的迅速發(fā)展,人們越來越親睞于網(wǎng)上購物。在網(wǎng)上購物之前,消費者往往會參考該產(chǎn)品相關(guān)的評價以決定是否購買。因此虛假評論者的識別具有非常重要的意義?;谔摷僭u論者和真實評論者在情感極性上存在的差異,在特征建模過程中增加了評論文本的情感特征,并結(jié)合用戶之間對于特定商品之間的關(guān)系,創(chuàng)建了一個多邊圖的模型并提出了一種識別虛假評論者的方法。實驗結(jié)果驗證了該算法的有效性。
關(guān)鍵詞電子商務(wù)虛假評論者情感特征用戶關(guān)系
0引言
Web 2.0的到來極大地改變了人與人之間交流的方式,人們可以在各種社交平臺上發(fā)表自己的觀點。Web 2.0 網(wǎng)絡(luò)應(yīng)用中,電子商務(wù)是發(fā)展最快的領(lǐng)域之一。因此,網(wǎng)上購物越來越受到人們的歡迎。消費者在購買商品之前,通常會閱讀與此產(chǎn)品相關(guān)的評論,根據(jù)評論的好壞再決定是否購買。但是,不是所有的評論都是真實的,一些虛假評論者在利益的誘引下寫下虛假評論以誤導(dǎo)消費者。所以,虛假評論者的識別對于電子商務(wù)的發(fā)展有很重要的意義。
在網(wǎng)上購物時,評論信息可以直接影響消費者的購買決策。因此,在利益的驅(qū)動下,一些商家雇人為自己的商品發(fā)布一些不切實際的正面評論以提高信譽,或者為了詆毀競爭對手而發(fā)布一些惡意的負面評論。這些虛假評論者嚴重影響了電商平臺上的正常競爭。通過總結(jié)之前研究者對虛假評論者的認識,本文將虛假評論者分為以下2類:
1) 類型1(欺騙性評論發(fā)布者):蓄意發(fā)布一些正面評論以提高商家名聲,或者故意寫下惡意評論破壞商家聲譽。
2) 類型2(破壞性評論發(fā)布者):發(fā)布一些與商品無關(guān)的評論、廣告。
因為人們可以很容易地識別破壞性評論,所以破壞性發(fā)布者的危害不大。但是欺騙性評論發(fā)布者可以刻意地掩飾自己所發(fā)表的虛假評論,使其與正常評論看似沒有差別,即使是人工識別方法也難以檢測。而且,到目前為止,欺騙性評論者的檢測方法不是很多,且效果不好。本文主要面向于這種識別難度更大的欺騙性虛假評論者的研究,創(chuàng)新性地采用了評論者之間情感方面的差異來構(gòu)建特征模型,并結(jié)合用戶之間的關(guān)系構(gòu)造出一種多邊圖的模型,最后計算出用戶不可靠分數(shù)來識別虛假評論者。
1相關(guān)研究
最近幾年,虛假評論者的識別已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域最為活躍的研究之一。相關(guān)研究者提出了許多新穎的方法,但是仍然有許多問題存在。由于在很多情況下,正常用戶也無法識別一個評論是否為虛假評論,從而造成標注數(shù)據(jù)不足以及難以評估檢測效果,這也是虛假評論者識別研究中所面臨的最大問題之一。
自從Jindal等人提出虛假評論的廣泛存在[1],研究者已經(jīng)提出了許多識別技術(shù)。其中一個主要的是有監(jiān)督的學(xué)習(xí)方法。Jindal、Liu通過提取評論文本、評論者和商品的特征進行建模來區(qū)分重復(fù)評論和非重復(fù)評論[1,2]。Li等人[4]利用評論和評論者的特征提出一種雙視圖、聯(lián)合訓(xùn)練的半監(jiān)督學(xué)習(xí)方法,取得了很好的效果。
由于缺乏標注數(shù)據(jù),無監(jiān)督的學(xué)習(xí)方法也被提出識別虛假評論者。Jindal等利用一種基于用戶行為的無監(jiān)督方法識別那些操縱特定商品評分等級的虛假評論者。Lai等人[5]根據(jù)高階概念關(guān)聯(lián)的挖掘方法提供一種基本術(shù)語關(guān)聯(lián)知識的無監(jiān)督識別方法。Wang等人[6]通過捕捉評論者、評論和商家之間的關(guān)系提出一種基于關(guān)系圖的無監(jiān)督方法。Mukherjee等人[7]發(fā)現(xiàn)了評論者之間不同的行為分布,總結(jié)出9類用戶行為特征。Liang等人[8]將用戶之間關(guān)系和用戶特征結(jié)合起來,識別準確率取得了很大的提高。
由于虛假評論者團體可以很輕松地提高或破壞特定商品的聲譽,虛假評論者團體的識別成了近幾年研究的熱點。Liu等人[9]首次提出通過計算虛假評論指標值來檢測虛假評論者,然后他們又構(gòu)造了一種團體、個人評論者以及他們所評論商品之間的關(guān)系模型[10]。
2用戶情感分析及特征定義
2.1用戶情感分析
傳統(tǒng)的評論文本分析大多基于客觀的要素,而忽略了其中所蘊含的主觀要素,比如用戶的情感信息、心理特征等。近年來,對評論文本的情感分析成為信息科學(xué)研究的熱點,心理學(xué)關(guān)于情感的研究成果也對分析網(wǎng)絡(luò)信息具有重要的參考價值。由于虛假評論是蓄意發(fā)布以提高或破壞產(chǎn)品名聲,虛假評論者在寫評論時的情緒、情感等心理特征和正常評論者必然存在一定差異。因此,本文創(chuàng)新性的在建模過程中加入了用戶的情感特征。
2.2特征定義
根據(jù)先前研究者對特征定義和構(gòu)建的方法[2],并結(jié)合用戶心理語言學(xué)知識以及情感極性的分析,本文總結(jié)了以下8個特征。每個特征的取值范圍為[0,1],特征值越大,該用戶為虛假評論者的可能性就越大。表1列出了相關(guān)符號的定義。
表1 符號定義
續(xù)表1
2.2.1商品屬性詞提及度
商品屬性詞匯量是指評論中描述商品各項屬性的詞的個數(shù)。如果評論中商品屬性詞出現(xiàn)頻率越高,評論內(nèi)容與商品的相關(guān)度就越大,該用戶為垃圾評論者的可能性就越小,反之可能性就越大。本文采用評論中屬性詞所占總詞匯的比重作為商品屬性詞提及度。
(1)
因為設(shè)定的特征值得分越高,越可能為虛假評論者,因此定義此特征為:
f1=1-RPW(r)
(2)
2.2.2第一人稱代詞詞頻
在評論中使用第一人稱代詞可以把評論者置于顯現(xiàn)的位置從而增強評論的真實性和親切感。所以本文認為虛假評論者應(yīng)會更多地使用第一人稱代詞,以加強評論的可信性。
(3)
2.2.3詞匯的多樣性
詞匯的多樣性是指句子中使用不同詞語的比例。其中形容詞和副詞可以更準確地表達評論者的情感。本文認為虛假評論者使用詞匯的多樣性少于正常評論者。這里采用形容詞和副詞的占總詞匯的比例代表詞匯的多樣性。
(4)
f3(r)=1-LV(r)
(5)
2.2.4用戶活躍度
虛假評論者一般不是某一網(wǎng)站的長期用戶[10],然而真實的用戶會經(jīng)常使用自己賬戶購買東西并發(fā)表相關(guān)評論。這里通過計算用戶第一次評論與最后一次評論之間時間間隔來判定評論者的活躍度,評論時間間隔越久,評論者為虛假評論者的可疑性就越高。
(6)
其中ζ為時間間隔閾值,本文根據(jù)下文所構(gòu)建的數(shù)據(jù)集,利用啟發(fā)式的方法設(shè)定閾值,此處ζ設(shè)定為60天。
2.2.5用戶積極性
用戶在網(wǎng)上購買商品時往往依賴于該商品靠前面的評論來抉擇是否購買。因此,虛假評論者會盡量搶占評論靠前的位置以迷惑消費者[4]。本文通過計算評論者對某商品的評論時間與該商品第一條評論之間的時間間隔來判斷評論者的積極性。
(7)
其中β為時間閾值,此處設(shè)定β為150天。當用戶評論時間與該商品第一條評論時間間隔小于150天時,我們認為此用戶可能為虛假評論者。間隔時間越短,該用戶的可疑度就越大。
2.2.6用戶極端評分
虛假評論者更容易給出極端的評分(5分或1分)以最大限度地提高或損害商品的名聲。當用戶評分為5分或1分時,我們設(shè)定此特征值為1,其他評分時則設(shè)置特征值為0。
(8)
2.2.7情感表達強度
情感是人對客觀現(xiàn)實的一種特殊反映形式。因此,用戶對產(chǎn)品的使用體會越深刻,在評論中所表達的情感的顯性程度越大。而虛假評論者往往沒有商品體驗經(jīng)歷,情感表達強度會偏低。本文通過建立情感詞典,并計算情感詞占總詞匯的比例來代表情感表達強度。
(9)
2.2.8平均評分的偏差
虛假評論者通常是給質(zhì)量不好的商品以好的評價,而給質(zhì)量好的商品以差的評價。因此,虛假評論者的平均評分和總的用戶平均評分有一定偏差。本文認為偏差越大,該用戶為虛假評論者的可能性就越大。
(10)
2.3特征組合
我們將前面總結(jié)的8個特征組合在一起,并根據(jù)實驗和經(jīng)驗對每個特征賦予一定的權(quán)重,來計算用戶的特征初始得分,這一步對識別虛假評論者很關(guān)鍵。首先分別計算每個評論者的這8個特征值,然后根據(jù)式(11)得出該用戶得分的初始值。得分越高,該用戶為虛假評論者的可能性就越大。
(11)
3用戶關(guān)系模型構(gòu)建
3.1用戶關(guān)系分析
虛假評論者是被商家雇傭以促進自己商品銷售或中傷競爭對手的商品。因此,評論者、評論和商品之間必然存在著一定的聯(lián)系:
1) 虛假評論者通常對于目標商品會給出一樣或者相似的評分,而與真實評論者的評分卻有一定的偏差。
2) 虛假評論者通常被信譽不好的商家所雇傭以促進自己商品的銷售,而信譽好的商家一般不會。
3) 評論的真實性取決于所評論商品的可靠性以及與該商品其他評論的一致性。
4) 商品的可靠性取決于信譽高的評論者所給出的評分。
3.2模型構(gòu)建
為了說明評論者、評論和商品之間存在的聯(lián)系,本文構(gòu)建了一個異構(gòu)圖的模型,如圖1所示。圖中有三種類型節(jié)點:評論者、評論和商品。同時,圖中有兩種類型的邊:(i)評論者節(jié)點與他所發(fā)表的評論節(jié)點之間的邊。(ii)評論節(jié)點指向其所評論商品節(jié)點的邊。
圖1 用戶、評論、商品之間關(guān)系
由圖1可知,不同評論者對于商品有著相同或相反的評論。例如用戶1給商品1差評,而用戶2給商品1好評,評分相反;用戶2給商品3好評,用戶3也給商品3好評,評分相同。為了更好地闡述他們之間的關(guān)系,本文根據(jù)圖1構(gòu)建了用戶之間關(guān)系的多邊圖的模型,如圖2所示。圖中每個節(jié)點代表一個評論者,兩個節(jié)點之間的邊代表評論者之間的關(guān)系。在此模型中定義了兩種類型的邊:
? “支持邊”:如果兩個評論者對于商品評價相同或相似,兩個節(jié)點之間添加一條“支持邊”。如評論者2與評論者3對于商品3的評價相同,因此他們之間就添加一條關(guān)于商品3的“支持邊”。
? “反對邊”:如果兩個評論者對于商品評價相反或相差很大,兩個節(jié)點之間添加一條“反對邊”。如評論者1與評論者2關(guān)于商品1的評價不同,在他們之間添加一條關(guān)于商品1“反對邊”。
圖2 用戶之間關(guān)系
4虛假評論者識別
4.1數(shù)據(jù)集構(gòu)建
本文采用httpclient模擬瀏覽器從亞馬遜購物網(wǎng)站上(http://www.amazon.cn/)獲取了關(guān)于日用商品的一些評論信息。每個評論信息包含以下屬性:用戶編號、商品編號、商品評分、評論日期以及評論文本。通過對評論信息的一些預(yù)處理操作,最后獲得5961條評論、2342位評論者以及412個商品作為實驗數(shù)據(jù)集。然后根據(jù)以上據(jù)數(shù)據(jù)集構(gòu)建了評論者之間的關(guān)系模型,其中有21 675條同意邊以及10 184條反對邊。
4.2用戶不可靠分數(shù)
本文基于TrustRank[11]方法,并結(jié)合上文所構(gòu)造的用戶關(guān)系模型和特征工程計算評論者不可靠分數(shù)。我們根據(jù)以下準則計算用戶的不可靠分數(shù):
1) 評論者的不可靠分數(shù)不是根據(jù)所評論的數(shù)量多少,而是根據(jù)所評論的真實性。虛假評論越多,評論者不可靠分數(shù)越高,該評論者為虛假評論者的可疑度就越大。
2) 評論者的分數(shù)應(yīng)當增加/減少如果和其他評論者之間有同意邊/反對邊,因為虛假評論者通常都協(xié)同合作,對特定商品給一樣或相似的評價。
3) 不可靠分數(shù)由評論者特征初始值和用戶之間關(guān)系共同決定。
因此,我們定義用戶的不可靠分數(shù)的計算方法為:
(12)
其中score(r)由式(11)所得,表示用戶的特征初始值,本文α設(shè)定為0.2。此公式采用了以e為底的指數(shù)函數(shù)作為削減函數(shù)。由公式可知,當有其他評論者支持該用戶評論時,不可靠分數(shù)會增加;反之,當有其他評論者反對此評論時,該用戶的不可靠分數(shù)會相應(yīng)減少。特別的,如果當前用戶沒有相關(guān)聯(lián)的支持邊,公式的第一項值為0,不可靠分數(shù)則由用戶特征初始值決定。
4.3虛假評論者識別
本文采用的識別虛假評論者的方法既考慮了評論者的情感特征又考慮了評論者之間的關(guān)系。具體步驟如下:
輸入:用戶、評論、商品數(shù)據(jù)集合
輸出:虛假評論者候選集合
步驟1構(gòu)建評論者之間的關(guān)系圖。
步驟2根據(jù)式(11)計算所有用戶的特征初始值。
步驟3歸納用戶相對應(yīng)的支持邊與反對邊的集合。
步驟4根據(jù)式(12)計算用戶最終的不可靠分數(shù)。
步驟5將用戶不可靠分數(shù)按照降序排列,排名越靠前的用戶放入虛假評論者的候選集合。
5實驗結(jié)果評估與分析
5.1評估策略
本文采用基于信息檢索的評估策略,首先選取不可靠分數(shù)排名靠前的用戶作為虛假評論者的候選。然后我們邀請三位標記人對候選者進行人工標記,以判斷候選者是否為虛假評論者。相似的評估方法在之前的研究中已經(jīng)被廣泛運用了[2,4],因此這是一個完善的評估方法。具體評估流程如下:
(1) 選擇候選集合
我們選擇得分最高的100個最有可能為虛假評論者的用戶,把他們放入候選集合之中。然后將他們隨機排序,這樣他們的順序和不可靠分數(shù)就沒有關(guān)聯(lián)。
(2) 對候選者進行人工識別
由于在評論信息中沒有虛假評論者的標簽,因此采用人工評估是必要的。我們的標記人為計算機專業(yè)學(xué)生并且擁有豐富的網(wǎng)上購物經(jīng)驗。人工識別虛假評論者是一項非常復(fù)雜的工作,不僅要研究評論者所發(fā)表的評論,而且要查看所評價的商品和商家的其他評論以及他們的品質(zhì)和信譽。在識別過程中還可能受到主觀和直覺因素的影響,因此我們制定了一些虛假評論者的識別準則:
?經(jīng)常與其他大多數(shù)評論者評論相反。
?經(jīng)常發(fā)布重復(fù)或者相似的評論。
?經(jīng)常給聲譽不好的商家以正面評論。
?經(jīng)常是某些特定商品的前排評論者。
?經(jīng)??鋸埖刭潛P某商品完全沒有任何缺點。
5.2實驗結(jié)果
在選取的候選集合中,3位標記人根據(jù)自己的經(jīng)驗以及上文制定的準則獨立的進行標記。一個用戶如果同時被2位及以上的標記人標記為虛假評論者,則該用戶被認為是虛假評論者。最終,61個用戶被標記為虛假評論者(49個用戶得到3票,12個用戶得到2票),準確率為61%,對于49%的準確率有很大的提高[1]。表2給出了標記結(jié)果以及標記人之間的一致度。
表2 人工標記結(jié)果
5.3結(jié)果分析
根據(jù)表2,我們可以看出3位標記人分別標記了57、59、68個虛假評論者。標記人1與標記人2有52個相同結(jié)果與標記人3有56個相同結(jié)果;標記人2與標記人3有58個相同結(jié)果。為了研究標記人之間的一致性,我們采用Fleiss’ kappa[12]方法,得到本次的標記信度為62.4%,達到了實質(zhì)上一致性的區(qū)間[0.61,0.80],證明了本次人工標記的有效性。
6結(jié)語
本文基于用戶在情感極性方面的差異,總結(jié)了用戶情感特征。并結(jié)合用戶之間復(fù)雜的關(guān)系創(chuàng)新性的構(gòu)造了評論者之間多邊圖模型,提出一種無監(jiān)督虛假評論者的識別方法。最后通過實驗證明了該方法的有效性。
目前此方法仍有一些不足,如對用戶情感特征分析不是很全面,人工標記存在一定的偏差,影響實驗結(jié)果的評估。未來將更透徹分析不同用戶之間情感差別,并將用戶更多主觀特征加入特征集構(gòu)建中。為了更好地評估方法效果,改進評估策略也是本文下一步的工作。
參考文獻
[1] Jindal N,Liu B.Review spam detection[C]//Proceedings of the 16th international conference on World Wide Web,Banff,AB,Canada,May 08-12,2007.New York,NY,USA:ACM,2007:1189-1190.
[2] Jindal N,Liu B.Opinion spam and analysis[C]//Proceedings of the international conference on Web search and web data mining,California,USA,Feb 11-12,2008.New York,NY,USA:ACM,2008:219-230.
[3] Li F,Huang M,Yang Y,et al.Learning to identify review spam[C]//Proceedings of the 22nd international joint conference on Artificial Intelligence,Barcelona,Spain,Jul 16-22,2011.Palo Alto,CA,USA:AAAI,2011:2488-2493.
[4] Lim E,Nguyen V,Jindal N,et al.Detecting product review spammers using rating behaviors[C]//Proceedings of the 19th ACM international conference on Information and knowledge management,Toronto,ON,Canada,October 26-30,2010.New York,NY,USA:ACM,2010:939-948.
[5] Lai C,Xu K,Lau R,et al.High-order concept associations mining and inferential language modeling for online review spam detection[C]//Data Mining Workshops (ICDMW),2010 IEEE International Conference,Sydney,NSW,Australia,Dec 13-13,2010.Washington,DC,USA:IEEE,2010:1120-1127.
[6] Wang G,Xie S H,Liu B,et al.Review Graph Based Online Store Review Spammer Detection[C]//Proceedings of the 11th International Conference on Data Mining,Mesa,Arizona,USA,April 28-30,2011.Washington,DC,USA:IEEE,2011:1242-1247.
[7] Mukherjee A,Kumar A,Liu B,et al.Spotting opinion spammers using behavioral footprints[C]//Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining,Chicago,IL,USA,August 11-14,2013.New York,NY,USA:ACM,2013:632-640.
[8] Liang D X,Liu X Y,Shen H.Detecting Spam Reviewers by Combing Reviewer Feature and Relationship[C]//Informative and Cybernetics for Computational Social Systems (ICCSS),2014 International Conference,Qingdao,Shandong,China,Oct 9-10 2014.Washington,DC,USA:IEEE,2014:102-107.
[9] Mukherjee A,Liu B,Wang J,et al.Detecting group review spam[C]//Proceedings of the 20th international conference companion on World wide web,Hyderabad,India,March 28-April 01,2011.New York,NY,USA:ACM,2011:93-94.
[10] Mukherjee A,Liu B,Glance N.Spotting fake reviewer groups in consumer reviews[C]//Proceedings of the 21st international conference on World Wide Web,Lyon,France April 16-20,2012.New York,NY,USA:ACM,2012:191-200.
[11] Gy?ngyi Z,GarciaMolina H,Pedersen J.Combating web spam with TrustRank[C] //Proceedings of the Thirtieth international conference on Very large data bases,Toronto,Canada,August 31-September 3 2004.San Fransisco,CA 94104,USA:Morgan Kaufmann,2004:576-587.
[12] Fleiss J L,Cohen J.The equivalence of weighted kappa and the intraclass correlation coefficient as measures of reliability[J].Educational and Psychological Measurement,1973,33(3):613-619.
SPOTTING FAKE REVIEWERS BASED ON SENTIMENT FEATURES AND USERS’ RELATIONSHIP
Shao ZhufengJi Donghong
(SchoolofComputer,WuhanUniversity,Wuhan430072,Hubei,China)
AbstractWith the rapid development of e-commerce, online shopping becomes more and more appealing. Before shopping online, consumers usually tend to refer to the relevant comments to decide whether to buy the products or not. Therefore, to identify fake reviewers is of great significance. Based on the difference of emotional polarities between fake reviewers and real reviewers, we added the sentiment features of comment text to feature modelling process. Combined with the inter-relationship between users and specific commodities, we constructed a multi-edge graph model and came up with a method of spotting fake reviewers. Experimental results verified the effectiveness of the proposed algorithm.
KeywordsE-commerceFake reviewersSentiment featuresUsers relationship
收稿日期:2015-01-12。邵珠峰,碩士,主研領(lǐng)域:自然語言處理。姬東鴻,教授。
中圖分類號TP3
文獻標識碼A
DOI:10.3969/j.issn.1000-386x.2016.05.039