亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向電商平臺(tái)的營銷水軍集成識(shí)別研究

        2021-08-09 03:24:02王雷陳大文
        電子技術(shù)與軟件工程 2021年11期
        關(guān)鍵詞:水軍電商節(jié)點(diǎn)

        王雷 陳大文

        (江蘇金盾檢測技術(shù)有限公司 江蘇省南京市 210042)

        1 引言

        隨著互聯(lián)網(wǎng)的發(fā)展與應(yīng)用,人們邁進(jìn)Web2.0 的時(shí)代,使人們由信息的接收者轉(zhuǎn)向信息貢獻(xiàn)者和信息創(chuàng)造者,大眾之間的虛擬交流變的更加頻繁。在各大網(wǎng)絡(luò)平臺(tái),用戶注冊數(shù)量不端攀升,根據(jù)之前微博的財(cái)報(bào)顯示,目前微博的月活躍用戶已經(jīng)超過3.76 億,美國點(diǎn)評網(wǎng)站Yelp 擁有超過1.08 億條評論信息,評論年增長超過0.18 億[1]。隨著阿里巴巴、郵件服務(wù)、網(wǎng)絡(luò)論壇等眾多領(lǐng)域都取得了飛速發(fā)展[2],大量不法分子發(fā)現(xiàn)了其中的巨大利益,利用網(wǎng)絡(luò)賬號(hào)發(fā)布謠言,欺騙公眾,造成了市場的混亂和社會(huì)的不穩(wěn)定。網(wǎng)絡(luò)水軍指那些由商業(yè)利益驅(qū)動(dòng),為達(dá)到不正當(dāng)目的,通過操縱水軍賬號(hào),在互聯(lián)網(wǎng)中制造、傳播虛假信息和垃圾意見等網(wǎng)絡(luò)垃圾意見生產(chǎn)者的總稱[3],在電商平臺(tái)中則是營銷水軍。

        在網(wǎng)絡(luò)上購物時(shí),用戶留下的評論信息可以直接影響消費(fèi)者的購買意愿。購買者對商品留下的評論信息往往具有重要的參考價(jià)值,可以了解到商品的真實(shí)情況。由于利益的驅(qū)動(dòng),一些商家會(huì)雇傭水軍為自己的商品散布一些不真實(shí)的正面評論以提高銷量,或是發(fā)布關(guān)于其他商家商品的負(fù)面評價(jià)。這些營銷水軍的存在嚴(yán)重影響了電商平臺(tái)的正常競爭機(jī)制。因此如何通過相關(guān)技術(shù)手段來識(shí)別這些網(wǎng)絡(luò)水軍已經(jīng)成為了一個(gè)日益迫切的問題。

        網(wǎng)絡(luò)水軍識(shí)別主要運(yùn)用Web 信息挖掘技術(shù),定義高區(qū)分度特征及行為模式發(fā)現(xiàn)隱藏的網(wǎng)絡(luò)水軍[4]。由于早期網(wǎng)絡(luò)環(huán)境并不復(fù)雜,獲得郵箱的途徑便捷且代價(jià)很小,所以傳統(tǒng)網(wǎng)絡(luò)水軍多是通過用戶郵箱來進(jìn)行欺詐活動(dòng),其數(shù)量規(guī)模也不大,隱蔽性也不高,垃圾信息也較為單一,因而識(shí)別方法主要基于垃圾信息內(nèi)容分析,例如郵件內(nèi)容分析[5]來檢測水軍。而面對Web2.0 時(shí)代的新型網(wǎng)絡(luò)水軍,傳統(tǒng)的檢測方法已無法滿足要求,需要結(jié)合新的技術(shù)來解決問題。

        2 相關(guān)技術(shù)與方法

        表1:傳統(tǒng)水軍識(shí)別與新型水軍識(shí)別的比較

        國內(nèi)外網(wǎng)絡(luò)水軍識(shí)別研究取得了很大的進(jìn)展,但是還是存在很多問題需要解決。從最早集中于郵件內(nèi)容的研究,到如今針對各大網(wǎng)絡(luò)平臺(tái)上水軍的識(shí)別研究,出現(xiàn)了很多有效的技術(shù)和識(shí)別方法。

        2.1 基于內(nèi)容特征的水軍識(shí)別研究

        Niu、Chen 等人[6]從論壇網(wǎng)站,用戶瀏覽行為和論壇水軍這幾個(gè)角度分析后,提出了基于內(nèi)容特征來識(shí)別水軍制造的垃圾信息。劉鴻宇、趙妍妍等人[7]對評論內(nèi)容進(jìn)行了對象抽取和傾向性判斷,從而識(shí)別區(qū)別于正常用戶的水軍。

        2.2 基于用戶特征的水軍識(shí)別研究

        Husna 等人[8]分析了郵件機(jī)器人的行為特征,例如內(nèi)容長度、垃圾郵件到達(dá)時(shí)間、垃圾郵件頻率等,還計(jì)算了郵件水軍的相似性對其聚類分析。Lim 等人[9]捕捉了Amazon 中幾種具有代表性的網(wǎng)絡(luò)水軍行為,并設(shè)計(jì)了基于商品評價(jià)偏離的識(shí)別方法。Sawaya、Kubota 等人[10]首次發(fā)現(xiàn)了移動(dòng)服務(wù)商骨干網(wǎng)絡(luò)中的水軍有嚴(yán)格的時(shí)間序列特征和發(fā)送模式,并利用這些特征對其進(jìn)行聚類分析。

        2.3 基于環(huán)境特征的水軍識(shí)別研究

        Uddin 等人[11]利用邊緣路由器IP 沖突記錄,通過網(wǎng)絡(luò)流量來得到水軍的網(wǎng)絡(luò)級別行為特征。Schatzmann 等人[12]提出了從網(wǎng)絡(luò)核心部分分析網(wǎng)絡(luò)水軍行為,以實(shí)現(xiàn)復(fù)雜網(wǎng)絡(luò)水軍的探測。Las-Casas 等人[13]提出從網(wǎng)絡(luò)水軍產(chǎn)生源頭進(jìn)行識(shí)別的方法,即基于水軍產(chǎn)生時(shí)的網(wǎng)絡(luò)特征識(shí)別。

        3 網(wǎng)絡(luò)營銷水軍特征分析

        在Web 2.0 時(shí)代,網(wǎng)絡(luò)環(huán)境的劇烈變化而引發(fā)的新問題早已超出了傳統(tǒng)方案解決的能力。早期的傳統(tǒng)營銷水軍模式單一,行為復(fù)雜度不高,而今的營銷水軍通過多種手段和渠道進(jìn)行欺詐,散布謠言等活動(dòng),其行為模式也更為隱蔽,使其加大了對營銷水軍識(shí)別的難度。如表1 所示。

        目前網(wǎng)絡(luò)上營銷水軍的運(yùn)作模式還是以散布廣告,虛假文本信息為主,例如,在我們熟知的新浪微博中,首先會(huì)有一個(gè)主管人向水軍用戶發(fā)布相關(guān)任務(wù),每個(gè)水軍得到大致任務(wù)后,再根據(jù)具體要求向其他正常用戶發(fā)送信息。這其中,有的水軍可能會(huì)被分配向那些擁有很多粉絲的大咖發(fā)送營銷文案,另外一部分可能會(huì)被安排向較為活躍的普通用戶發(fā)送廣告,這些不同的用戶群體構(gòu)成了不同的圈子,組織者會(huì)根據(jù)不同圈子的特點(diǎn)來組織水軍進(jìn)行營銷,其內(nèi)容也會(huì)根據(jù)不同用戶而改變。營銷水軍組織形式如圖1 所示。

        不管每個(gè)水軍的行為模式和組織團(tuán)體如何變化,它們在網(wǎng)絡(luò)中與正常用戶的關(guān)系結(jié)構(gòu)是大致相同的,即每個(gè)營銷用戶都會(huì)與大量正常用戶節(jié)點(diǎn)產(chǎn)生信息交流。假設(shè)網(wǎng)絡(luò)中的所有用戶為節(jié)點(diǎn),用戶之間產(chǎn)生的聯(lián)系為邊,則可以構(gòu)建如圖2 的分布特性。

        因?yàn)樗娦枰l(fā)布大量的信息給不同用戶,基于這個(gè)性質(zhì)可以發(fā)現(xiàn)水軍基本上會(huì)和大量用戶產(chǎn)生關(guān)聯(lián)關(guān)系。從上圖中來看,營銷水軍的出度普遍要大于入度,而普通用戶并沒有這一規(guī)律。出度為本節(jié)點(diǎn)向另外的節(jié)點(diǎn)發(fā)送信息,入度為本節(jié)點(diǎn)接收來自其他節(jié)點(diǎn)的信息。

        4 虛假評論檢測模型

        網(wǎng)絡(luò)營銷水軍在各大電商平臺(tái)的涌現(xiàn),也隨之帶來了大量的營銷信息,這些營銷信息多是在商品評論區(qū)作為載體進(jìn)行散布。正是因?yàn)檫@些信息具有不符合實(shí)際的因素,從而可以被稱為虛假評論。這些虛假評論鼓吹和夸大商品特點(diǎn),影響用戶正確的選擇和消費(fèi)行為。如何在網(wǎng)絡(luò)平臺(tái)中識(shí)別這些虛假評論一直是國內(nèi)外研究的重點(diǎn)。

        目前虛假評論的識(shí)別研究技術(shù)主要是在兩個(gè)方面:基于評論內(nèi)容的方法和基于評論者行為的方法。為了增加營銷信息發(fā)布的范圍和傳播速度,水軍做出的評論一般都具有高重復(fù),形式單一等特點(diǎn),基于評論內(nèi)容的方法主要通過自然語言處理的相關(guān)技術(shù)來識(shí)別評論中的顯著特征,以此來判斷評論真假。Stringhini 和Kruegel 等人[14]在幾個(gè)主流社交網(wǎng)站上使用自己的“誘捕器”收集了水軍的行為數(shù)據(jù),發(fā)現(xiàn)了與正常用戶的不同之處。例如,水軍集中性的發(fā)布評論會(huì)給網(wǎng)絡(luò)帶來異常流量,所以它們會(huì)故意避開工作時(shí)間段發(fā)布信息。

        圖3 展示了一般的虛假評論檢測方法框架,第一步是選擇使用的數(shù)據(jù)集,早期使用的數(shù)據(jù)以評論文本為主,往后又加入了評論者的行為數(shù)據(jù)以提高檢測精度。然后經(jīng)過數(shù)據(jù)預(yù)處理階段過濾無效樣本,下一步中,通過特征工程來選取與任務(wù)最相關(guān)的特征,這也是影響最終結(jié)果關(guān)鍵的一步,一旦確定了特征之后即可將相關(guān)特征送入機(jī)器學(xué)習(xí)模型,通過計(jì)算后得出判斷結(jié)果。

        5 模型和方案

        從目前的研究來看,現(xiàn)有的方法仍然有不少不足之處。使用行為特征的檢測模型是基于營銷水軍的行為與正常用戶不同這一假設(shè)而來,但是隨著網(wǎng)絡(luò)環(huán)境的復(fù)雜化,用戶意識(shí)到大量水軍的存在并加強(qiáng)了對水軍的警惕性,導(dǎo)致營銷水軍不斷調(diào)整營銷策略。這樣一來營銷水軍的行動(dòng)更為隱蔽,一般的行為識(shí)別機(jī)制已無法探測。另外,作為營銷手段的營銷文案也有越來越多樣化的趨勢,不同于直接復(fù)制發(fā)送的單一形式,現(xiàn)有的評論還會(huì)加入圖片,表情等多種元素,導(dǎo)致模型難以進(jìn)行有效的檢測。

        本文針對電商平臺(tái)上的營銷水軍識(shí)別從三個(gè)方面入手,首先對用戶的行為特征進(jìn)行重新選取,考慮每個(gè)特征與實(shí)驗(yàn)的相關(guān)性,選擇最佳的行為特征作為整個(gè)模型輸入的一部分。其次,擴(kuò)展對評論文本的分析范圍,不僅考慮評論的重復(fù)性,最長公共子串的長度和語義分析,還增加了詞匯多樣性檢測,表達(dá)形式豐富性統(tǒng)計(jì)等,進(jìn)一步提高檢測準(zhǔn)確度。此外,還加入了水軍的網(wǎng)絡(luò)結(jié)構(gòu)特征進(jìn)行分析,因?yàn)樗姆€(wěn)定性,不會(huì)輕易被用戶行為所影響,營銷水軍也不能掩飾他們在網(wǎng)絡(luò)上的結(jié)構(gòu)特征,甚至還可以發(fā)現(xiàn)水軍團(tuán)體。營銷水軍模型框架如圖4 所示。

        針對電商平臺(tái)上的用戶行為特征,經(jīng)過計(jì)算我們挑選了6 個(gè)特征:用戶評論數(shù)量,用戶好評數(shù)量,用戶差評數(shù)量,用戶評論頻繁程度,用戶購買商品數(shù)量,此外還引入了用戶極端性評論數(shù)量。然后通過K 均值聚類算法基于行為對用戶聚類,K 均值算法會(huì)先選取K 個(gè)聚類質(zhì)心點(diǎn)(μ1,μ2,μ3,…,μk)∈Rn,然后初始化簇C={C1,C2,…,Ck},計(jì)算樣本xi和各個(gè)質(zhì)心點(diǎn)μj(j=1,2,…k)的距離,根據(jù)樣本到質(zhì)心點(diǎn)的距離來對樣本進(jìn)行簇類劃分,當(dāng)劃分完畢后重新計(jì)算每個(gè)簇的質(zhì)心點(diǎn)μj,重復(fù)上述步驟直到質(zhì)心點(diǎn)不再更新或更新很小。距離公式和質(zhì)心點(diǎn)更新公式如(1)(2)所示。

        營銷水軍散布的文案中一般都會(huì)使用單一的詞匯或詞性,比起正常評論帶有豐富的情感和詞匯,虛假評論就會(huì)顯得較為機(jī)械性。所以我們利用評論中形容詞和副詞數(shù)量占整個(gè)總詞匯量的比例來表示詞匯多樣性。公式如(3)所示。

        這里的rei為第i 個(gè)評論,Nadj為形容詞數(shù)量,Madv為副詞數(shù)量,total(review)為評論詞匯數(shù)量。

        另外對于評論帶有的非文本因素也給予了考量,作為表達(dá)形式豐富性進(jìn)行量化。假設(shè)評論中帶有圖片,表情,視頻,文字這四種形式,若第i 個(gè)評論中的第j 個(gè)圖片為Pij,第k 個(gè)表情為Eik,第s個(gè)視頻為Vis,則有以下公式(4)來表示形式豐富性。

        利用用戶網(wǎng)絡(luò)關(guān)系拓?fù)浣Y(jié)構(gòu)圖可以分析營銷水軍在網(wǎng)絡(luò)中的“足跡”,傳播模式和影響力等重要性質(zhì),故而在文本中加入網(wǎng)絡(luò)結(jié)構(gòu)特征進(jìn)一步提高水軍識(shí)別能力。用戶結(jié)構(gòu)圖以G(V,E)表示,其中節(jié)點(diǎn)數(shù)n=|V|,Vi代表節(jié)點(diǎn)i,eij代表節(jié)點(diǎn)i 和節(jié)點(diǎn)j 之間的邊,aij為鄰接矩陣的元素。我們用節(jié)點(diǎn)的出度和入度,節(jié)點(diǎn)中心度作為水軍在網(wǎng)絡(luò)結(jié)構(gòu)中的特征因子。

        公式(5)為節(jié)點(diǎn)中心度的計(jì)算方程,主要用來衡量網(wǎng)絡(luò)節(jié)點(diǎn)對其鄰居的影響力。公式(6)和公式(7)為節(jié)點(diǎn)的入度和出度的計(jì)算公式,與用戶相關(guān)行為的指標(biāo)可以用它來表示,例如點(diǎn)贊數(shù),評論數(shù),回帖數(shù)等。

        通過對評論內(nèi)容,用戶行為和用戶網(wǎng)絡(luò)結(jié)構(gòu)的綜合分析,可以取長補(bǔ)短,提高模型對營銷水軍識(shí)別的綜合能力。特別是對新型營銷水軍大肆泛濫的今天,通過單一方面的檢測已經(jīng)很難達(dá)到滿意的效果,融合多種不同場景的特征分析可以勝任更艱巨的任務(wù)。

        6 結(jié)論

        本文基于電商平臺(tái)上的用戶評論、行為和網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行研究,分析了目前營銷水軍的行為特點(diǎn),在網(wǎng)絡(luò)平臺(tái)上的組織結(jié)和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),在虛假評論檢測模型中引入了新的特征,對用戶行為進(jìn)行聚類,提出了結(jié)合虛假評論檢測,用戶行為識(shí)別和用戶網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析的模型框架,為網(wǎng)絡(luò)營銷水軍識(shí)別提供了新思路和可靠方案。

        猜你喜歡
        水軍電商節(jié)點(diǎn)
        “網(wǎng)絡(luò)水軍”作惡,該打!
        電商助力“種得好”也“賣得火”
        CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
        Analysis of the characteristics of electronic equipment usage distance for common users
        基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建
        電商鄙視鏈中的拼多多
        網(wǎng)絡(luò)水軍
        方圓(2017年12期)2017-07-17 17:50:26
        水軍
        黃河之聲(2016年24期)2016-04-22 02:39:44
        抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)
        電商下鄉(xiāng)潮
        国产亚洲午夜高清国产拍精品不卡| 中文字幕亚洲在线第一页| 最新日本女优中文字幕视频| 亚洲精品岛国av一区二区| 天天做天天摸天天爽天天爱| 亚洲色成人网站www永久| 欧美xxxx色视频在线观看| 精品香蕉久久久午夜福利| 亚洲一区综合精品狠狠爱| 午夜国产精品久久久久| av永远在线免费观看| 涩涩鲁精品亚洲一区二区| 国产精品无码制服丝袜| 精品无码av无码专区| 精品水蜜桃久久久久久久| 亚洲熟妇在线视频观看| 一区二区免费中文字幕| 黄色国产精品福利刺激午夜片| 亚洲av永久中文无码精品综合| 亚洲处破女av日韩精品| 亚洲成av人在线观看无堂无码| 久久精品有码中文字幕1| 99精品国产综合久久麻豆| 麻豆国产精品va在线观看不卡| 亚洲啪啪综合av一区| 美女视频很黄很a免费国产| 蜜桃久久综合一区二区| 变态调教一区二区三区女同| 麻豆av一区二区三区| 波多野结衣亚洲一区二区三区 | 久久九九精品国产不卡一区| 亚洲人成网网址在线看| 久久综合九色综合欧美狠狠| 爱a久久片| 和少妇人妻邻居做爰完整版| 韩国一区二区三区黄色录像| 男人的天堂免费a级毛片无码| 国产成人亚洲不卡在线观看| 2021最新久久久视精品爱| 日韩免费精品在线观看| 国产亚洲日本精品无码|