王逸勐
摘要:隨著各式電商平臺(tái)、社交平臺(tái)的興起,相關(guān)利益群體開(kāi)始利用平臺(tái)機(jī)制,操控輿論,影響正常用戶認(rèn)知并以此謀利。相關(guān)惡性事件頻頻發(fā)生,平臺(tái)生態(tài)的治理成為一個(gè)日漸嚴(yán)峻的問(wèn)題。本文通過(guò)梳理相關(guān)研究的四條脈絡(luò),總結(jié)出三條相關(guān)研究未來(lái)發(fā)展的有效途徑,并提出基于無(wú)監(jiān)督學(xué)習(xí)的惡性用戶治理方法以解決當(dāng)下研究遇到的困境。
關(guān)鍵詞:惡性用戶? 水軍 社交網(wǎng)絡(luò) 無(wú)監(jiān)督學(xué)習(xí) 電商平臺(tái)
引言
用戶是電商平臺(tái)生態(tài)中的核心元素之一。
以用戶評(píng)論為例,相較于實(shí)體店,電商平臺(tái)無(wú)法提供直接的產(chǎn)品體驗(yàn),用戶在進(jìn)行商品選擇時(shí),在很大程度上要依靠于其他用戶對(duì)產(chǎn)品的評(píng)價(jià)[1]。一個(gè)好的用戶評(píng)論體系能夠顯著提高電商平臺(tái)對(duì)入駐商家的治理水平,降低監(jiān)督成本,形成一系列良性連鎖反應(yīng)。
然而,當(dāng)下各電商平臺(tái)中刷單現(xiàn)象嚴(yán)重,各商家用戶評(píng)論中充斥著的各種水軍與刷單機(jī)器人的言論,并在極大程度上決定了電商平臺(tái)中目標(biāo)產(chǎn)品的評(píng)價(jià)輿論場(chǎng),從而影響用戶決策[2]。
楊珂等[3]指出,目前電子商務(wù)領(lǐng)域多盛行電商水軍與商家合作,對(duì)目標(biāo)產(chǎn)品造勢(shì)營(yíng)銷(xiāo),以影響消費(fèi)者。如今,社會(huì)上存在著一群職業(yè)套利群體. 他們通過(guò)機(jī)器人, 注冊(cè)機(jī), 模擬器, 貓池等多種形式在平臺(tái)上注冊(cè)大量虛假用戶賬號(hào), 從而擾亂平臺(tái)環(huán)境、利用平臺(tái)漏洞并以此謀利。
在2018 年中國(guó)信通院和騰訊聯(lián)合發(fā)布的《數(shù)字金融反欺詐》[ 4]中列舉了 2018 年發(fā)生的多起較嚴(yán)重的職業(yè)“羊毛黨”套利事件: 某“羊毛黨”發(fā)現(xiàn)國(guó)內(nèi)某知名電商平臺(tái)存在漏洞, 利用這個(gè)漏洞可以無(wú)限制領(lǐng)取 100 元無(wú)門(mén)檻全場(chǎng)通用券, 于是他通過(guò)手中大量該電商賬號(hào)領(lǐng)券, 并以每張券不足 1 元購(gòu)買(mǎi) 100 元話費(fèi)或 QQ 幣的形式套現(xiàn). 最后為了逃避被追責(zé), 該“羊毛黨”將漏洞發(fā)到羊毛群中, 引發(fā)大量“羊毛黨”瘋狂“薅羊毛”, 最終造成電商平臺(tái)巨額損失. 據(jù)官方通告, 損失在千萬(wàn)元級(jí)別。
另外需要指出的是,在電商平臺(tái)與社交平臺(tái)逐步融合的當(dāng)下,網(wǎng)絡(luò)水軍對(duì)電商平臺(tái)的影響力正在逐步擴(kuò)大。研究表明[5],現(xiàn)階段,“機(jī)器人水軍” 的發(fā)展已經(jīng)影響到社會(huì)政治、經(jīng)濟(jì)等多元深層結(jié)構(gòu)與領(lǐng)域。“機(jī)器人水軍”推動(dòng)的虛假信息和營(yíng)造的網(wǎng)絡(luò)環(huán)境被傳播、放大后,直接影響經(jīng)濟(jì)市場(chǎng),被渲染、傳播的網(wǎng)絡(luò)熱點(diǎn)事件,會(huì)對(duì)民眾形成誤導(dǎo),深刻影響民眾的社會(huì)生活。
近期,央視曝光明星流量造假問(wèn)題,并表示要求相關(guān)部門(mén)嚴(yán)打流量造假行為。就此,新浪微博作出回應(yīng):
首先,外掛軟件刷數(shù)據(jù),流量“競(jìng)賽”已蛻變?yōu)榛ヂ?lián)網(wǎng)黑產(chǎn),在這種“競(jìng)賽”中,微博作為平臺(tái)不僅收獲不到正常的用戶和流量,反而要承擔(dān)由此帶來(lái)的風(fēng)險(xiǎn),微博是完全不愿意見(jiàn)到這種“競(jìng)賽”繼續(xù)下去,并且也做出了相關(guān)的產(chǎn)品調(diào)整。
其次,刷數(shù)據(jù)主要表現(xiàn)為刷轉(zhuǎn)發(fā)、刷評(píng)論,目前這種已經(jīng)脫離常識(shí)的數(shù)據(jù)也都并非由真人粉絲完成,而主要是借助各種可以登錄多個(gè)微博賬號(hào)的“外掛”軟件完成,而“外掛”的開(kāi)發(fā)運(yùn)營(yíng)者,則依靠登錄賬號(hào)的數(shù)量賺取利潤(rùn)。
針對(duì)以上現(xiàn)象中可能存在違法犯罪行為,從去年開(kāi)始微博已經(jīng)多次向公安機(jī)關(guān)提供所掌握的證據(jù)材料進(jìn)行報(bào)案。[6]
水軍相關(guān)的產(chǎn)業(yè)在暗處悄悄生長(zhǎng),其破壞力已不容小覷。
2019年6月10日晚間,“蔡徐坤1億微博轉(zhuǎn)發(fā)量的幕后操盤(pán)手星援App已被查封”的消息引爆網(wǎng)絡(luò)。
去年8月,蔡徐坤通過(guò)微博發(fā)布原創(chuàng)歌曲MV《Pull Up》,僅用10天左右的時(shí)間便實(shí)現(xiàn)轉(zhuǎn)發(fā)量破億次,但與高轉(zhuǎn)發(fā)量相對(duì)應(yīng)的卻是,評(píng)論量?jī)H約240萬(wàn)次,點(diǎn)贊量則約106萬(wàn)次,差距最高可達(dá)95倍,使得造假的質(zhì)疑愈演愈烈。
這條被懷疑數(shù)據(jù)造假的微博也受到監(jiān)管部門(mén)的關(guān)注,在公安部開(kāi)展“凈網(wǎng)2019”專項(xiàng)行動(dòng)的過(guò)程中,北京市公安局網(wǎng)安總隊(duì)會(huì)同豐臺(tái)網(wǎng)安對(duì)此介入調(diào)查。隨后在今年3月,警方鎖定位于福建省泉州市豐澤區(qū)某辦公樓內(nèi)的星援網(wǎng)絡(luò)科技有限公司,將4名涉案人員全部抓獲。其中,該公司法人蔡某因涉嫌破壞計(jì)算機(jī)信息系統(tǒng)已被豐臺(tái)檢察院批捕,同時(shí)警方正對(duì)另外三人開(kāi)展進(jìn)一步工作。且經(jīng)調(diào)查發(fā)現(xiàn),不到一年的時(shí)間,“星援”App便非法獲利近800萬(wàn)元。
不僅如此,北京商報(bào)記者經(jīng)調(diào)查發(fā)現(xiàn),“星援”App只是眾多刷量軟件的冰山一角,市面上還存在多個(gè)提供刷微博轉(zhuǎn)發(fā)量、評(píng)論量、點(diǎn)贊量的軟件。[7]
可見(jiàn),從電商平臺(tái)到社交平臺(tái),相關(guān)惡性群體已在暗處悄然發(fā)展壯大,乃當(dāng)今社會(huì)的一大隱患。
簡(jiǎn)而言之,對(duì)于現(xiàn)有各類平臺(tái),都有必要在構(gòu)建平臺(tái)伊始便有意識(shí)地構(gòu)造對(duì)于水軍的系統(tǒng)性防范工程。而相關(guān)研究正是旨在為平臺(tái)提供相關(guān)建議,幫助平臺(tái)建立高效的網(wǎng)絡(luò)水軍防范系統(tǒng)。
研究背景
Web 2.0 時(shí)代的到來(lái),改變了網(wǎng)站設(shè)計(jì)和使用的 方式,其一大特征就是用戶生成內(nèi)容( User-Generated Content,UGC) ,即網(wǎng)站等線上內(nèi)容由用戶創(chuàng)作、貢獻(xiàn)
而成。對(duì)于多數(shù)用戶來(lái)說(shuō),其創(chuàng)造內(nèi)容的動(dòng)力主要是——自我表達(dá)、獲得他人的認(rèn)可、解決遇到的問(wèn)題等,他們往往是主動(dòng)地、自發(fā)地創(chuàng)造內(nèi)容,是內(nèi)在需要主要驅(qū)動(dòng)的。其中,社交網(wǎng)絡(luò)作為互聯(lián)網(wǎng)最重要的平臺(tái),在內(nèi)容分享、娛樂(lè)交友、電子商務(wù)等各方面發(fā)揮不可替代的作用。
網(wǎng)絡(luò)水軍則是被雇傭以發(fā)布特定的內(nèi)容,來(lái)達(dá)到宣傳、營(yíng)銷(xiāo)、炒作等目的,這種行為往往是被動(dòng)的、利益驅(qū)動(dòng)的內(nèi)容創(chuàng)造。并且隨著社交網(wǎng)絡(luò)的逐步興起與壯大,其自身也成為了網(wǎng)絡(luò)水軍生長(zhǎng)的溫床。
發(fā)展脈絡(luò)
綜合該領(lǐng)域研究,可以發(fā)現(xiàn)以下四條清晰的發(fā)展線索。
反水軍戰(zhàn)場(chǎng)——從郵件系統(tǒng)到社交媒體
早期的水軍主要活躍在國(guó)外的郵件系統(tǒng)中,因而關(guān)于水軍識(shí)別方面的研究最早也是起源于國(guó)外對(duì)于垃圾郵件的識(shí)別領(lǐng)域。其研究方法以內(nèi)容分析為主,郵件特征提取是反垃圾郵件和識(shí)別水軍的核心。在這個(gè)時(shí)期,僅通過(guò)簡(jiǎn)單的文本分類即可取得較好的識(shí)別效果。
該時(shí)期的研究主要集中于基于郵件文本內(nèi)容、基于異常行為和基于圖片特征提取等方面。其中代表性工作包括三方面的內(nèi)容:
首先,基于文本內(nèi)容的特征提取主要利用了詞匯袋法(bag-ofwords,BoW ) 、稀疏二元多項(xiàng)式哈希(space binary polynomial hashing,SBPH) 、正交稀疏詞匯(orthogonal space bigrams,OSB) 、人工免疫系統(tǒng)(biological immune system,BIS)等方法;其次,基于行為的垃圾郵件檢測(cè)是通過(guò)提取垃圾郵件區(qū)別于正常郵件的行為特征來(lái)檢測(cè)過(guò)濾垃圾郵件。常用的有基于郵件頭部信息及系統(tǒng)日志的行為特征 、基于附件的行為特征和基于網(wǎng)絡(luò)的行為特征等;最后,基于圖片的特征提取關(guān)鍵在于提取有效的圖片特征。
隨著Web2.0時(shí)代的到來(lái),博客、微博等社交平臺(tái)與電商平臺(tái)的興起給了網(wǎng)絡(luò)水軍一個(gè)嶄新的舞臺(tái),在不同活動(dòng)領(lǐng)域的水軍具有截然不同的活動(dòng)特征,相應(yīng)的分析方法也因而有所不同。由于在社交平臺(tái)和電商平臺(tái)上水軍產(chǎn)生影響力的方式不同,研究工作一般基于用戶的屬性特征和行為特征進(jìn)行展開(kāi)。
近年來(lái),網(wǎng)絡(luò)水軍的行動(dòng)越發(fā)呈現(xiàn)出專業(yè)化、組織化、隱蔽化等特征,水軍們開(kāi)始有計(jì)劃有組織地展開(kāi)行動(dòng),電商與水軍之間互相勾結(jié)的狀況也屢見(jiàn)不鮮。因而以往基于用戶行為特征、文本內(nèi)容的和融合特征的分析方法也開(kāi)始喪失功效,正是在這種背景下,各種基于社交網(wǎng)絡(luò)的分析方法開(kāi)始被提出。
特征選取——從文本與行為特征到網(wǎng)絡(luò)特征
如吳恩達(dá)所說(shuō):“應(yīng)用機(jī)器學(xué)習(xí)其實(shí)就是在做特征工程,特征工程是非常難、耗時(shí)、也是需要專業(yè)知識(shí)的一個(gè)工作。鑒于水軍識(shí)別本質(zhì)上是一個(gè)分類問(wèn)題,特征選取是解決該問(wèn)題的核心。也正因?yàn)槿绱?,多?shù)水軍識(shí)別領(lǐng)域的研究都集中于特征的選取上。如楊臻等[8]提出“評(píng)論數(shù)偏多、原創(chuàng)話題較少、活動(dòng)時(shí)間集中、評(píng)論情感偏向明顯”等特征;謝忠紅等[9]通過(guò)分析正常用戶和水軍的關(guān)系圖,提出了粉絲數(shù)、關(guān)注數(shù)、好友粉絲比、注冊(cè)時(shí)間、活躍度、關(guān)注速率、雙向關(guān)注比和互粉數(shù)八個(gè)特征,張艷梅[10]等提出了粉絲關(guān)注比、平均發(fā)布微博數(shù)、互相關(guān)注數(shù)、綜合質(zhì)量評(píng)價(jià)、收藏?cái)?shù)和陽(yáng)光信用六個(gè)特征。
然而以上種種基于文本、用戶行為以及綜合特征的特征選取方法在新環(huán)境下的水軍識(shí)別中已經(jīng)不再適用。隨著各方對(duì)水軍防范意識(shí)的增加,水軍的作戰(zhàn)策略也在改變,以往的特征已經(jīng)不能有效辨別他們。在這種背景下,各種基于社交網(wǎng)絡(luò)分析的方法也應(yīng)運(yùn)而生。
如李濤[11]等通過(guò)水軍賬戶與普通賬戶之間深層次的區(qū)別,找到了事件參與度、二階關(guān)聯(lián)性、關(guān)系緊密度等特征;文獻(xiàn)[12]提出將網(wǎng)絡(luò)水軍看作為整個(gè)網(wǎng)絡(luò)用戶中的離群點(diǎn),崔麗娟[13]等在此基礎(chǔ)上利用頻繁子圖和離群點(diǎn)算法挖掘出來(lái)的用戶群體定義為疑似網(wǎng)絡(luò)水軍團(tuán)體。
除此之外,還有一些研究者獨(dú)辟蹊徑,發(fā)現(xiàn)了一些有趣的特征選取方法。如陳彤等在發(fā)現(xiàn)了水軍團(tuán)體的“對(duì)抗性”行為特征后,提出了1用戶評(píng)論情感與用戶打分不一致、用戶文字評(píng)論與用戶上傳圖片評(píng)論都極其相似、用戶上傳與產(chǎn)品沒(méi)有任何關(guān)系的圖片評(píng)論三個(gè)“隱性特征”。
另外,考慮到水軍識(shí)別系統(tǒng)最終要實(shí)現(xiàn)實(shí)時(shí)性的在線識(shí)別,李巖[15]等使用計(jì)算波動(dòng)率的方式構(gòu)造了社交網(wǎng)絡(luò)用戶的動(dòng)態(tài)行為特征,構(gòu)造的特征計(jì)算量小、便于實(shí)際運(yùn)用。相較于以往的靜態(tài)特征,動(dòng)態(tài)特征更符合水軍識(shí)別系統(tǒng)的需要。
然而,到底哪些行為特征對(duì)水軍識(shí)別較為有效,學(xué)術(shù)界和工業(yè)界均尚無(wú)定論。
分析對(duì)象——從個(gè)體到團(tuán)體
研究伊始,各種研究的關(guān)注點(diǎn)都放在對(duì)個(gè)體水軍的判別上。然而,隨著網(wǎng)絡(luò)水軍團(tuán)體的發(fā)展,一方面,越來(lái)越多的網(wǎng)絡(luò)水軍之間已形成一定的組織結(jié)構(gòu),開(kāi)始有目的有組織地行動(dòng);另一方面水軍之間為了隱藏自己的內(nèi)容、行為等異常特征形成了緊密的聯(lián)系,其個(gè)體呈現(xiàn)出的特征趨向于正常用戶,導(dǎo)致以檢測(cè)單個(gè)網(wǎng)絡(luò)水軍為主的方法準(zhǔn)確率不高。
不少研究者開(kāi)始將網(wǎng)絡(luò)水軍團(tuán)體作為研究對(duì)象,他們先利用以往的水軍識(shí)別技術(shù)發(fā)現(xiàn)網(wǎng)絡(luò)水軍,再利用聚類、社區(qū)劃分等算法挖掘網(wǎng)絡(luò)水軍團(tuán)體。然而由于以上提到的種種原因,水軍往往表現(xiàn)出與正常用戶相似的行為,使得基于聚類的方法不夠有效,另外楊柯等研究發(fā)現(xiàn),對(duì)隱藏性較高不共享大量目標(biāo)產(chǎn)品的電商水軍團(tuán)體,單純以行為特征構(gòu)建排序或分類識(shí)別模型的識(shí)別準(zhǔn)確率存在瓶頸。
以往都是以識(shí)別單個(gè)水軍為主的研究方法,很少有研究者對(duì)網(wǎng)絡(luò)水軍的整體性進(jìn)行研究。而Chunlong等人[16]通過(guò)大量的實(shí)驗(yàn)發(fā)現(xiàn)網(wǎng)絡(luò)水軍是一個(gè)有組織的、具有高度協(xié)作性的群體,為網(wǎng)絡(luò)水軍團(tuán)體的識(shí)別研究提供了有效證據(jù)。
楊柯等利用電商水軍在電子商務(wù)平臺(tái)中形成的用戶關(guān)系網(wǎng)絡(luò),探查其異常用戶關(guān)系,從而定位密集活動(dòng)的大規(guī)模電商水軍團(tuán)體。崔麗娟等利用改進(jìn)的頻繁子圖挖掘算法找出經(jīng)常一起出現(xiàn)在多個(gè)炒作博文 下的用戶群體。通過(guò)利用圖結(jié)構(gòu),更直觀,更清晰地呈現(xiàn)出水軍團(tuán)體成員之間的關(guān)系,體現(xiàn)了網(wǎng)絡(luò)水軍團(tuán)體的結(jié)構(gòu)特征。在此基礎(chǔ)上,利用網(wǎng)絡(luò)水軍團(tuán)體與普通用戶群體之間的不同特征,訓(xùn)練了一個(gè)基于 C4.5 決策樹(shù)的網(wǎng)絡(luò)水軍團(tuán)體分類系統(tǒng),對(duì)疑似網(wǎng)絡(luò)水軍團(tuán)體判定,得到網(wǎng)絡(luò)水軍團(tuán)體。
算法設(shè)計(jì)關(guān)注點(diǎn)——從準(zhǔn)確度到兼顧效率與可拓展性
現(xiàn)有研究多致力于提升檢測(cè)算法的準(zhǔn)確性,較少關(guān)注算法的效率和擴(kuò)展性,難以有效應(yīng)對(duì)真實(shí)環(huán)境中的大規(guī)模用戶數(shù)據(jù)。大數(shù)據(jù)分析從來(lái)都是一個(gè)工程問(wèn)題,不管研究什么問(wèn)題,都必須從準(zhǔn)確度、效率、可拓展性、實(shí)時(shí)性等多維度綜合考慮,
對(duì)此,張 璐等提出一種高效的水軍群組檢測(cè)算法,從兩個(gè)方面提升算法效率。首先,提出基于余弦模式挖掘的候選群組提取算法,通過(guò)余弦相似度衡量群組成員間的耦合性,更加精準(zhǔn)地提取候選群組,降低后續(xù)識(shí)別的計(jì)算量。其次,利用組投影技術(shù)和 Spark 計(jì)算框架設(shè)計(jì)分布式群組提取算法,提升算法的運(yùn)行速度和擴(kuò)展性。
未來(lái)發(fā)展方向
從研究發(fā)展的發(fā)展脈絡(luò),不難總結(jié)如下三條發(fā)展方向。
首先,在網(wǎng)絡(luò)水軍日益專業(yè)化、組織化、隱蔽化的大背景下,以往那些僅僅關(guān)注于文本特征、行為特征和綜合特征的研究方法已經(jīng)不再有效,亟待根據(jù)水軍活動(dòng)的現(xiàn)狀,從新的視角展開(kāi)研究。而基于社交網(wǎng)絡(luò)的研究方法是一條有效路徑。
此外,以往的研究缺乏對(duì)工程上可實(shí)施性、實(shí)時(shí)性的關(guān)注,僅僅從水軍分辨的準(zhǔn)確度這單一維度設(shè)計(jì)算法。然而在實(shí)際的應(yīng)用中,在巨量的數(shù)據(jù)、有限的計(jì)算資源以及對(duì)實(shí)時(shí)結(jié)果的要求下,準(zhǔn)確度并沒(méi)有那么重要。因此,在相關(guān)的研究分析中,應(yīng)該站在工程的角度,通盤(pán)考慮這個(gè)問(wèn)題,這是以往很多研究所欠缺的。
最后,楊柯還指出,電商水軍識(shí)別結(jié)果的不易評(píng)價(jià)是困擾電商水軍研究者們的一關(guān)鍵問(wèn)題。識(shí)別模型的真實(shí)用戶評(píng)論集表現(xiàn)需結(jié)合準(zhǔn)確的用戶分類標(biāo)記進(jìn)行,但在電子商務(wù)領(lǐng)域中為保護(hù)用戶隱私信息,無(wú)法百分百精確建立用戶分類標(biāo)記。已有電商水軍識(shí)別的結(jié)果多數(shù)以專家和眾包服務(wù)所建立的用戶標(biāo)記為基準(zhǔn),計(jì)算識(shí)別結(jié)果準(zhǔn)確率難以得到有效提高。
因此,在這種數(shù)據(jù)標(biāo)簽極難獲取的情況下, 如果一位地使用當(dāng)前主流的大數(shù)據(jù)擬合小目標(biāo)的監(jiān)督式建模框架, 就必須通過(guò)人工標(biāo)注來(lái)獲取訓(xùn)練數(shù)據(jù),如此一來(lái)會(huì)耗費(fèi)大量的人力物力資源。不僅如此, 模型的效果很大程度取決于特征的完備性, 而特征工程往往強(qiáng)依賴業(yè)務(wù)經(jīng)驗(yàn), 開(kāi)發(fā)出一個(gè)有效的特征可能會(huì)需要一個(gè)人或團(tuán)隊(duì)花上幾周甚至幾個(gè)月的時(shí)間。這大大降低了識(shí)別的效率與準(zhǔn)確率,完全不符合平臺(tái)對(duì)于惡性用戶識(shí)別的“實(shí)時(shí)性”、“魯棒性”等要求。
如何通過(guò)無(wú)監(jiān)督、自監(jiān)督的建??蚣埽脽o(wú)標(biāo)簽的數(shù)據(jù)實(shí)現(xiàn)對(duì)于平臺(tái)潛在惡性用戶的識(shí)別與挖掘是今后的一大發(fā)展方向。然而時(shí)下在惡性用戶識(shí)別領(lǐng)域則鮮有對(duì)該方向的研究,如前所述,大部分研究者將對(duì)于惡性用戶的識(shí)別定位為一個(gè)“二分類問(wèn)題”。該定位首先意味著將研究的底座放在了監(jiān)督式框架之上,則必然會(huì)遇到之前所提到的若干問(wèn)題;另外,“二分類”問(wèn)題會(huì)導(dǎo)致數(shù)據(jù)間“關(guān)系型”數(shù)據(jù)的丟失,而正如之前所提到的,在未來(lái)通過(guò)“社交網(wǎng)絡(luò)”進(jìn)行分析是研究的一大趨勢(shì)。
因此,在未來(lái)的研究中有必要重新定義惡性用戶識(shí)別問(wèn)題的本質(zhì),綜合考慮惡性用戶群體的發(fā)展特性、識(shí)別算法與模型的工程可行性等多方面因素。
參考文獻(xiàn):
[1]Chevalier J A, Mayzlin D. The Effect of Word of Mouth on Sales: Online Book Reviews[J]. Journal of Marketing Research
[2]李璐旸,秦兵,劉挺. 虛假評(píng)論檢測(cè)研究綜述[J]. 計(jì)算機(jī) 學(xué)報(bào). 2018, 41(04): 946-968.
[3]電子商務(wù)網(wǎng)絡(luò)水軍的智能識(shí)別研究 楊珂 莫倩
[4]騰訊&中國(guó)信通院. 2018.11. 數(shù)字金融反欺詐-洞察與攻略
http://www.caict.ac.cn/kxyj/qwfb/bps/201811/t20181127_189555.htm
[5]中國(guó)信息安全測(cè)評(píng)中心 趙爽 馮浩宸? “機(jī)器人水軍”發(fā)展與影響評(píng)析
[6]錢(qián)玉娟 經(jīng)濟(jì)觀察報(bào) http://www.eeo.com.cn/2019/0224/348529.shtml
[7]“星援”App被端 流量造假得不償失 北京商報(bào) 2019-06-12
[8]基于多特征的網(wǎng)絡(luò)水軍識(shí)別方法 楊 臻,張明慧,肖 漢
[9]基于邏輯回歸算法的微博水軍識(shí)別 謝忠紅,張 穎,張 琳
[10]基于貝葉斯模型的微博網(wǎng)絡(luò)水軍識(shí)別算法研究 張艷梅 黃瑩瑩 甘世杰 丁熠 馬志龍