亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò)Spammer檢測技術(shù)

        2018-05-29 07:36:33曲強(qiáng)于洪濤黃瑞陽
        關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)特征向量準(zhǔn)確率

        曲強(qiáng),于洪濤,黃瑞陽

        (國家數(shù)字交換系統(tǒng)工程技術(shù)研究中心,河南 鄭州 450002)

        1 引言

        隨著移動互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,在線社交網(wǎng)絡(luò)由于具有便捷、靈活、內(nèi)涵豐富的特性而快速成為人們生活重要的組成部分,如Facebook、Twitter、Google、新浪微博、微信等流行社交網(wǎng)絡(luò)。目前,在線社交網(wǎng)絡(luò)的用戶數(shù)量呈指數(shù)級別增長,據(jù)統(tǒng)計(jì),2018年春節(jié)期間微信和 WeChat的合并月活躍賬戶數(shù)超過10億[1]。由于社交網(wǎng)絡(luò)蘊(yùn)含的巨大用戶隱私信息及其廣闊的商業(yè)價(jià)值,社交網(wǎng)絡(luò)成為不法分子圖謀不軌的目標(biāo),其中,異常用戶是不法分子攻擊社交網(wǎng)絡(luò)的主要手段之一,異常用戶的類型由于社交網(wǎng)絡(luò)類型不同也呈現(xiàn)出多種形態(tài),如表1所示。Spammer作為一類重要異常用戶,它是指未經(jīng)接收者允許,大量地發(fā)送對接受者無關(guān)的廣告信息的用戶。根據(jù) 2013年的社交網(wǎng)絡(luò)垃圾信息統(tǒng)計(jì)報(bào)告[2],2013年 1月~6月,社交垃圾信息數(shù)量增長了355%,每200條社交信息中有1條是垃圾信息,它們對5%的社交應(yīng)用App造成了一定程度的威脅。通過收集用戶的個(gè)人信息,Spammer向用戶發(fā)送特定的垃圾信息以達(dá)到誘導(dǎo)用戶進(jìn)入惡意網(wǎng)站或者購買劣質(zhì)產(chǎn)品的目的[3~5],進(jìn)而對社交網(wǎng)絡(luò)的可用性以及安全性造成影響。

        表1 在線社交網(wǎng)絡(luò)的異常用戶種類

        針對社交網(wǎng)絡(luò) Spammer的廣泛存在與潛在危害特性,國內(nèi)網(wǎng)學(xué)者對社交網(wǎng)絡(luò)Spammer的檢測進(jìn)行了大量的研究,研究人員主要采用監(jiān)督算法、無監(jiān)督算法以及圖算法來檢測社交網(wǎng)絡(luò)Spammer。Benevenuto等[6]利用支持向量機(jī)檢測Twitter中的Spammer,通過向支持向量機(jī)中引入?yún)?shù)J給出Spammer占比的先驗(yàn)分布,調(diào)節(jié)J來平衡準(zhǔn)確率或者召回率的提升,并且通過gain與卡方檢驗(yàn)選出幾種比較具有區(qū)分性的特征。Gao等[7]根據(jù)文本的MD5相似性以及URL指向目標(biāo)的相同性聚類構(gòu)建相似的群組,再通過Spammer的分布覆蓋以及時(shí)間爆發(fā)判定每個(gè)群組是否為Spammer群組。Hu等[8,9]將內(nèi)容矩陣和構(gòu)造的隨機(jī)游走網(wǎng)絡(luò)矩陣結(jié)合,利用譜分解方式求解最佳權(quán)重,識別 Twitter中 Spammer。后來,Hu[10]又將情感信息矩陣融入內(nèi)容矩陣和鄰接矩陣中,優(yōu)化目標(biāo)函數(shù)求得最佳權(quán)重。上述3種方法各有利弊:監(jiān)督算法需要具有區(qū)分度的特征指標(biāo),無監(jiān)督算法需要合理的相似性指標(biāo),這2種指標(biāo)是研究人員根據(jù)經(jīng)驗(yàn)設(shè)定的指標(biāo),屬于可認(rèn)知的淺層特征,Spammer利用根據(jù)淺層特征容易逃過檢測,但方法的效率很高。盡管圖算法能夠獲取深層特征,但是由于圖數(shù)據(jù)量級太大和稀疏性導(dǎo)致計(jì)算復(fù)雜度過高,效率低。

        針對上述監(jiān)督算法與無監(jiān)督算法提取的淺層特征和圖算法的計(jì)算復(fù)雜度過高問題,本文提出了基于GCN的Spammer檢測技術(shù),主要內(nèi)容如下。

        1) 本文基于網(wǎng)絡(luò)結(jié)構(gòu)信息,通過引入網(wǎng)絡(luò)表示學(xué)習(xí)算法提取網(wǎng)絡(luò)局部結(jié)構(gòu)特征,結(jié)合重正則化技術(shù)條件下的 GCN算法[11]獲取網(wǎng)絡(luò)全局結(jié)構(gòu)特征,提出基于GCN的Spammer檢測技術(shù),有效利用了網(wǎng)絡(luò)結(jié)構(gòu)的局部特征與全局特征,淺層特征與深層特征。

        2) 本文從直交多項(xiàng)式的角度推導(dǎo)出重正則化技術(shù)條件下的 GCN算法,有效降低了圖算法的高計(jì)算復(fù)雜度。

        3) 本文基于 Tagged社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行了大量實(shí)驗(yàn),實(shí)驗(yàn)表明,該方法具有通用性、高準(zhǔn)確與高效率等特點(diǎn)。

        2 相關(guān)工作

        2.1 網(wǎng)絡(luò)表示學(xué)習(xí)

        網(wǎng)絡(luò)表示學(xué)習(xí)是指從網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)到每個(gè)節(jié)點(diǎn)的向量表示,并將向量表示作為節(jié)點(diǎn)的特征應(yīng)用于后續(xù)的網(wǎng)絡(luò)應(yīng)用任務(wù)[12,13]。一般的網(wǎng)絡(luò)表示學(xué)習(xí)算法可以分成兩類:基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí);帶有信息的網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)。由于文中數(shù)據(jù)未包含節(jié)點(diǎn)標(biāo)簽屬性信息,因此此處僅對基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)進(jìn)行闡述。

        在基于網(wǎng)絡(luò)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)算法中,DeepWalk[14]、Node2vec[15]、Struc2vec[16]以及LINE[17]是該領(lǐng)域主流的網(wǎng)絡(luò)表示學(xué)習(xí)算法,它們在鏈路預(yù)測、引文文本分類等領(lǐng)域廣泛應(yīng)用。但是,上述網(wǎng)絡(luò)表示學(xué)習(xí)算法僅考慮局部游走,即網(wǎng)絡(luò)局部結(jié)構(gòu)信息。

        2.2 圖卷積網(wǎng)絡(luò)

        2010年以來,神經(jīng)網(wǎng)絡(luò)由于具有從大規(guī)模數(shù)據(jù)中提取高維深度特征的性質(zhì),受到學(xué)術(shù)界以及工業(yè)界的青睞,尤其是提取以圖像視頻為代表的低維規(guī)則網(wǎng)格的深度特征,進(jìn)一步識別圖像、視頻或文檔的種類等[18,19],隨后研究人員又提出循環(huán)神經(jīng)網(wǎng)絡(luò)[20]、帶門控機(jī)制的神經(jīng)網(wǎng)絡(luò)[21]等。然而,這些神經(jīng)網(wǎng)絡(luò)無法適用高維不規(guī)則網(wǎng)格,如社交網(wǎng)絡(luò)、腦部連接網(wǎng)絡(luò)、計(jì)算機(jī)網(wǎng)絡(luò)等。因此,Kipf等[11]利用信號處理技術(shù)中小波變換[22]以及數(shù)值計(jì)算中的多項(xiàng)式逼近理論[23],提出了圖卷積網(wǎng)絡(luò),用于圖像檢測[24]以及引文網(wǎng)絡(luò)節(jié)點(diǎn)分類[11]。但是,GCN網(wǎng)絡(luò)算法需要大量特征字段,在現(xiàn)實(shí)情況下很難滿足。

        下面簡要介紹經(jīng)過卷積變換與多項(xiàng)式逼近后的GCN算法表達(dá)形式以及目標(biāo)函數(shù)形式,如式(1)和式(2)所示。

        其中,x表示節(jié)點(diǎn)的特征向量。L為圖G的經(jīng)過標(biāo)準(zhǔn)化的 Laplacian矩陣:L=IN-gθ為頻譜卷積變換的操作符,其中,θ ∈ RN表示傅里葉變換系數(shù)。θk∈RK表示多項(xiàng)式的權(quán)重系數(shù)。 Tk(?)表示k階極小化極大多項(xiàng)式,K表示逼近多項(xiàng)式局部階數(shù)。z表示經(jīng)GCN算法預(yù)測的樣本標(biāo)簽。

        其中,Lγ表示擁有標(biāo)簽的樣本集合,F(xiàn)表示類別數(shù)目,Y表示樣本實(shí)際標(biāo)簽集合,Z表示經(jīng)GCN算法預(yù)測的樣本標(biāo)簽集合,其中,l表示樣本的標(biāo)號,f表示類別的標(biāo)號。

        3 基于圖卷積網(wǎng)絡(luò)的Spammer檢測技術(shù)

        基于GCN的社交網(wǎng)絡(luò)Spammer檢測技術(shù)的流程如圖1所示,其中,矩形表示不同結(jié)構(gòu)的數(shù)據(jù),帶箭頭的矩形表示不同處理方式,虛線表示不同處理模塊。根據(jù)圖1,基于GCN的社交網(wǎng)絡(luò)Spammer檢測技術(shù)分為3個(gè)模塊:數(shù)據(jù)處理模塊、特征學(xué)習(xí)模塊、Spammer檢測模塊。數(shù)據(jù)處理模塊將在4.1節(jié)進(jìn)行介紹。本節(jié)主要介紹后面2個(gè)模塊,其中,3.1節(jié)介紹特征學(xué)習(xí)模塊,即不同的網(wǎng)絡(luò)表示學(xué)習(xí)算法;3.2節(jié)介紹Spammer檢測模塊,即重正則化技術(shù)條件下的GCN算法。

        3.1 網(wǎng)絡(luò)表示學(xué)習(xí)

        面對僅含網(wǎng)絡(luò)結(jié)構(gòu)的社交數(shù)據(jù),本文方法利用網(wǎng)絡(luò)表示學(xué)習(xí)提取局部網(wǎng)絡(luò)結(jié)構(gòu)信息的特征向量,主要使用了下面3種網(wǎng)絡(luò)表示學(xué)習(xí)算法。

        圖1 基于GCN的社交網(wǎng)絡(luò)Spammer檢測技術(shù)流程

        1) DeepWalk[14]:第一次將深度學(xué)習(xí)中的技術(shù)引入網(wǎng)絡(luò)表示學(xué)習(xí)領(lǐng)域,該方法利用網(wǎng)絡(luò)結(jié)構(gòu)中隨機(jī)游走序列的信息獲取節(jié)點(diǎn)的特征表示向量。該方法只考慮了網(wǎng)絡(luò)局部結(jié)構(gòu)的同質(zhì)性。

        2) Node2vec[15]:通過改變隨機(jī)游走序列生成的方式進(jìn)一步擴(kuò)展DeepWalk 算法,DeepWalk選取隨機(jī)游走序列中下一個(gè)節(jié)點(diǎn)的方式是均勻隨機(jī)分布的,而Node2vec通過引入2個(gè)參數(shù)p和q,將寬度優(yōu)先搜索和深度優(yōu)先搜索引入隨機(jī)游走序列的生成過程。該方法只考慮了網(wǎng)絡(luò)局部結(jié)構(gòu)的同質(zhì)性與同構(gòu)性。

        3) Struc2vec[16]:通過嚴(yán)格定義節(jié)點(diǎn)的結(jié)構(gòu)同構(gòu)性,Struc2vec利用M層結(jié)構(gòu)同質(zhì)性的圖重構(gòu)節(jié)點(diǎn)相似性的多層混合圖,然后利用隨機(jī)游走與語言模型獲取節(jié)點(diǎn)的特征向量表示。該方法只考慮了網(wǎng)絡(luò)全局結(jié)構(gòu)的同構(gòu)性。

        3.2 重正則化技術(shù)條件下的GCN

        在使用重正則化技術(shù)的條件下,研究人員[11]發(fā)現(xiàn)使用Chebyshev-I多項(xiàng)式的GCN算法具有較高的正確率與較小的時(shí)間消耗,優(yōu)于高階多項(xiàng)式的實(shí)驗(yàn)效果。由于 Chebyshev-I多項(xiàng)式是典型的直交多項(xiàng)式,因此本文試圖從直交多項(xiàng)式角度推導(dǎo)出使用重正則化技術(shù)條件下的GCN,并利用該形式GCN開展社交網(wǎng)絡(luò)的Spammer檢測工作。

        根據(jù)算法 1,需要選取極小化極大多項(xiàng)式,并且這種多項(xiàng)式是存在且唯一。然而,根據(jù)文獻(xiàn)[23]以及Lagrange多項(xiàng)式插值逼近原理,極小化極大多項(xiàng)式可以用以 Chebyshev-I多項(xiàng)式為代表的直交多項(xiàng)式進(jìn)行逼近,其誤差與使用極小化極大多項(xiàng)式進(jìn)行估計(jì)幾乎一致,但是降低了由構(gòu)造極小化極大多項(xiàng)式所帶來的計(jì)算復(fù)雜度。本文給出直交多項(xiàng)式的定義以及構(gòu)造方法。

        定義1 設(shè) pj(x)是j次實(shí)系數(shù)多項(xiàng)式,若多項(xiàng)式系中任意2個(gè)多項(xiàng)式在區(qū)間[a, b]上關(guān)于權(quán)函數(shù)W( x)都直交,即滿足條件

        則稱為區(qū)間[a, b]關(guān)于權(quán)函數(shù)W( x)的直交多項(xiàng)式,并稱為區(qū)間[a, b]關(guān)于權(quán)函數(shù)的n次直交多項(xiàng)式。

        定理1 對給定的權(quán)函數(shù)W( x),在區(qū)間[a, b]上關(guān)于權(quán)函數(shù)W( x)的k次首一直交多項(xiàng)式 pk(x)(k為任意的一個(gè)自然數(shù)或0)存在,唯一,且滿足遞推關(guān)系式

        由于典型直交多項(xiàng)式的逼近性質(zhì)好于其他多項(xiàng)式,因此本文選取5種典型的直交多項(xiàng)式逼近頻譜卷積操作符,表達(dá)形式如表2所示,從直交多項(xiàng)式的角度推導(dǎo)重正則化技術(shù)條件下的 GCN算法。

        表2 典型直交多項(xiàng)式

        本文選取 5種直交多項(xiàng)式中最復(fù)雜的Languerre多項(xiàng)式來推導(dǎo)重正則化技術(shù)條件下的GCN算法,推導(dǎo)如下。

        同理,其余幾種直交多項(xiàng)式可以得到同樣的表達(dá)形式,因此,在重正則化技術(shù)的條件下,單層 GCN表達(dá)形式為,其中,。本文最終使用兩層GCN 網(wǎng)絡(luò)結(jié)構(gòu),即其中,,F(xiàn)是類別數(shù)目。

        4 實(shí)驗(yàn)

        4.1 實(shí)驗(yàn)設(shè)置

        1) 數(shù)據(jù)處理

        本文使用的數(shù)據(jù)來自Tagged.com社交平臺,Tagged社交平臺使用不同的方法檢測Spammer。例如,它利用傳統(tǒng)的內(nèi)容和注冊信息建立過濾器檢測Spammer;同時(shí),Tagged采用舉報(bào)系統(tǒng)與管理安全系統(tǒng)檢測 Spammer。因此,本文 Tagged數(shù)據(jù)集是已經(jīng)通過 Tagged.com傳統(tǒng)過濾器檢測的數(shù)據(jù)集,數(shù)據(jù)集中包含的Spammer需要安全團(tuán)隊(duì)的人工檢驗(yàn)。

        Tagged數(shù)據(jù)集包含 2個(gè)數(shù)據(jù)文件:userdata.csv和relations.csv。用戶數(shù)據(jù)集包含5 607 447用戶信息,分為5個(gè)字段:userID、sex、timePassedValidations、ageGroup和label。關(guān)系數(shù)據(jù)集包含858 247 099條網(wǎng)絡(luò)鏈接信息,分為5個(gè)字段:day、time_ms、src、dst和 relation,字段具體含義如表3所示。

        本文方法使用用戶數(shù)據(jù)集的userID與label;通過在時(shí)間序列上的采樣,本文方法使用第三天23~24 h的關(guān)系數(shù)據(jù)集的src與dst,數(shù)據(jù)處理流程如圖2的數(shù)據(jù)處理模塊所示。

        2) 實(shí)驗(yàn)環(huán)境

        在數(shù)據(jù)處理模塊,使用的實(shí)驗(yàn)環(huán)境是Ubuntu14.04的系統(tǒng), 32個(gè)CPU處理器以及125.8 GB內(nèi)存,編程語言為Python2.7;而在特征提取模塊與 Spammer檢測模塊,使用的實(shí)驗(yàn)環(huán)境為Ubuntu16.04系統(tǒng),8個(gè)CPU處理器以及23.5 GB內(nèi)存,編程語言為Python3.6。

        4.2 實(shí)驗(yàn)結(jié)果

        實(shí)驗(yàn)中提取不同種類的網(wǎng)絡(luò)結(jié)構(gòu)特征向量的網(wǎng)絡(luò)表示學(xué)習(xí)算法的默認(rèn)設(shè)置為:特征向量維度64,隨機(jī)游走數(shù)量10,隨機(jī)游走長度40,skip-gram的序列窗口大小5,工作CPU核數(shù)4。Node2vec的隨機(jī)游走概率參數(shù) p=1,q=2。在方法訓(xùn)練過程中,訓(xùn)練集與測試集比例為7:3,GCN方法訓(xùn)練200輪。如果沒有特殊說明,方法默認(rèn)設(shè)置不變。實(shí)驗(yàn)中特征學(xué)習(xí)模塊采用3種網(wǎng)絡(luò)表示學(xué)習(xí)算法(DeepWalk、Node2vec、Struc2vec),Spammer檢測模塊選取了 3種典型的監(jiān)督算法(感知機(jī)、邏輯回歸、隨機(jī)森林)和文中提出的重正則化技術(shù)條件下的GCN(簡記為GCN)。

        實(shí)驗(yàn)1 不同算法對社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率的影響

        表3 Tagged數(shù)據(jù)集

        表4展示了不同的社交網(wǎng)絡(luò)Spammer檢測方法的準(zhǔn)確率。首先,在特征學(xué)習(xí)模塊中,采用不同網(wǎng)絡(luò)表示學(xué)習(xí)算法的Spammer檢測方法準(zhǔn)確率相對于基準(zhǔn)正確率一般為 DeepWalk> Node2vec>Struc2vec,這也證明了網(wǎng)絡(luò)局部結(jié)構(gòu)的同質(zhì)性對Spammer檢測的貢獻(xiàn)程度大于網(wǎng)絡(luò)局部結(jié)構(gòu)同構(gòu)性與網(wǎng)絡(luò)全局結(jié)構(gòu)的同構(gòu)性。

        其次,在Spammer檢測模塊中,3種監(jiān)督算法中邏輯回歸算法的準(zhǔn)確率大于感知機(jī)和隨機(jī)森林,但是邏輯回歸算法的準(zhǔn)確率低于 GCN算法(DeepWalk+邏輯回歸

        表4 社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率

        實(shí)驗(yàn) 2 特征向量維度對社交網(wǎng)絡(luò) Spammer檢測方法準(zhǔn)確率的影響

        圖 2展示了特征向量維度對 4種社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率的影響,其中,橫軸表示特征向量維度,縱軸表示準(zhǔn)確率。根據(jù)圖3,隨著特征向量維度的增長,DeepWalk與Node2vec方法準(zhǔn)確率在特征向量維度為16時(shí)達(dá)到最大,隨后下降;而 DeepWalk+GCN與Node2vec+GCN方法準(zhǔn)確率在特征向量維度為64時(shí)達(dá)到最大,隨后下降。整體上,當(dāng)特征向量維度大于32時(shí),DeepWalk+GCN方法準(zhǔn)確率最高,其次為 Node2vec+GCN方法,好于DeepWalk與Node2vec方法的準(zhǔn)確率。

        圖2 特征向量維度對社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率的影響

        實(shí)驗(yàn) 3 訓(xùn)練集特征向量所占百分比對社交網(wǎng)絡(luò)Spammer檢測方法效率的影響

        圖3展示了訓(xùn)練集特征向量占總數(shù)據(jù)集的特征向量的百分比對于4種社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率的影響,其中,橫軸表示訓(xùn)練集特征向量所占百分比(或者說含有標(biāo)簽的數(shù)據(jù)占總數(shù)據(jù)集的百分比),縱軸表示準(zhǔn)確率。根據(jù)圖4,隨著總數(shù)據(jù)集中含標(biāo)簽樣本百分比的增長,DeepWalk+GCN與Node2vec+GCN方法準(zhǔn)確率不斷增長,而DeepWalk與Node2vec方法準(zhǔn)確率相對穩(wěn)定??傮w上,當(dāng)含標(biāo)簽樣本百分比大于50%時(shí),DeepWalk+GCN方法準(zhǔn)確率最高,其次為Nodezvec+GCN方法,好于DeepWalk與Node2vec方法準(zhǔn)確率。即使在含標(biāo)簽樣本百分比為10%時(shí),DeepWalk+GCN方法準(zhǔn)確率好于任何含標(biāo)簽樣本百分比下的DeepWalk與Node2vec方法,因此該方法可以通過訓(xùn)練較少的樣本形成模型,實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集Spammer檢測的目的。

        實(shí)驗(yàn)4 數(shù)據(jù)規(guī)模對于社交網(wǎng)絡(luò)Spammer檢測方法效率的影響

        圖 4展示了數(shù)據(jù)規(guī)模對于社交網(wǎng)絡(luò)Spammer檢測方法效率的影響,橫軸表示網(wǎng)絡(luò)邊的數(shù)據(jù)量,縱軸表示 200輪訓(xùn)練所需時(shí)間。根據(jù)圖4,隨著邊的數(shù)量規(guī)模增長,DeepWalk+GCN與Node2vec+GCN方法時(shí)間不斷增長,呈現(xiàn)亞線性的關(guān)系。即使在100 000條邊的情況下,本文方法需要大約5 min,遠(yuǎn)遠(yuǎn)低于普通的圖算法,檢測效率大大提升,適用于大規(guī)模數(shù)據(jù)Spammer檢測。

        圖3 訓(xùn)練集特征向量所占百分比對社交網(wǎng)絡(luò)Spammer檢測方法準(zhǔn)確率的影響

        圖4 數(shù)據(jù)規(guī)模對社交網(wǎng)絡(luò)Spammer檢測方法效率的影響

        5 結(jié)束語

        針對現(xiàn)有社交網(wǎng)絡(luò) Spammer檢測方法提取淺層特征與計(jì)算復(fù)雜度高的問題,本文提出了一種基于圖卷積網(wǎng)絡(luò)的社交網(wǎng)絡(luò) Spammer檢測技術(shù)。該方法基于網(wǎng)絡(luò)結(jié)構(gòu)信息,通過引入網(wǎng)絡(luò)表示學(xué)習(xí)算法提取網(wǎng)絡(luò)局部結(jié)構(gòu)特征,結(jié)合重正則化技術(shù)條件下的 GCN算法獲取網(wǎng)絡(luò)全局結(jié)構(gòu)特征去檢測Spammer。本文在Tagged.com社交網(wǎng)絡(luò)數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)本文方法的具有高準(zhǔn)確與高效率,并且對于網(wǎng)絡(luò)圖數(shù)據(jù)結(jié)構(gòu)具有普遍的適用性。

        參考文獻(xiàn):

        [1]MA HUATENG. Normal and reasonable competition is good for business[C]//World Fortune Forum. 2017.

        [2]HAROLD NGUYEN. 2013 state of social media spam. Technical report[R]. 2013

        [3]STRINGHINI G, KRUEGEL C, VIGNA G. Detecting Spammers on social networks[C]//The 26th Annual Computer Security Applications Conference. 2010: 1-9.

        [4]RAYANA S, AKOGLU L. Collective opinion spam detection:bridging review networks and metadata[C]//The 21th ACM Sigkdd International Conference On Knowledge Discovery And Data Mining. 2015: 985-994.

        [5]LIM E P, NGUYEN V A, JINDAL N, et al. Detecting product review Spammers using rating behaviors[C]//The 19th ACM International Conference On Information and Knowledge Management.2010: 939-948.

        [6]BENEVENUTO F, MAGNO G, RODRIGUES T, et al. Detecting Spammers on twitter[C]//Collaboration, Electronic Messaging, Anti-Abuse And Spam Conference (CEAS 2010). 2010: 12.

        [7]GAO H, HU J, WILSON C, et al. Detecting and characterizing social spam campaigns[C]//The 10th ACM SIGCOMM Conference on Internet Measurement. 2010: 35-47.

        [8]HU X, TANG J, ZHANG Y, et al. Social Spammer detection in microblogging[C]//(IJCAI 2013). 2013: 2633-2639.

        [9]HU X, TANG J, LIU H. Online social Spammer detection[C]//AAAI. 2014: 59-65.

        [10]HU X, TANG J, GAO H, et al. Social Spammer detection with sentiment information[C]//2014 IEEE International Conference on Data Mining (ICDM). 2014: 180-189.

        [11]KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[C]// ICLR. 2017.

        [12]涂存超, 楊成, 劉知遠(yuǎn), 等. 網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 科學(xué)通報(bào),1998, 43: 1681.TU C C, YANG C, LIU Z Y, et al. Network representation learning:an overview [J]. Chinese Science Bulletin, 1998, 43: 1681.

        [13]CUI P, WANG X, PEI J, et al. A survey on network embedding[J].Social and Information Networks(Cornell University Library),2017.

        [14]PEROZZI B, AL-RFOU R, SKIENA S. DeepWalk: online learning of social representations[C]//The 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM,2014: 701-710.

        [15]GROVER A, LESKOVEC J. Node2vec: scalable feature learning for networks[C]//The 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2016:855-864.

        [16]RIBEIRO L F R, SAVERESE P H P, FIGUEIREDO D R.Struc2vec: learning node representations from structural identity[C]//The 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2017: 385-394.

        [17]TANG J, QU M, WANG M, ET AL. Line: large-scale information network embedding[C]//The 24th International Conference on World Wide Web. 2015: 1067-1077.

        [18]HENAFF M, BRUNA J, LECUN Y. Deep convolutional networks on graph-structured data[J]. Computer Science, 2015.

        [19]HE K, ZHANG X, REN S, ET Al. Deep residual learning for image recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition. 2016: 770-778.

        [20]JAIN A, ZAMIR A R, SAVARESE S, et al. Structural-RNN: deep learning on spatio-temporal graphs[C]//IEEE Conference on Computer Vision and Pattern Recognition. 2016: 5308-5317.

        [21]LI Y, TARLOW D, BROCKSCHMIDT M, ET AL. Gated graph sequence neural networks[J]. Computer Science, 2015.

        [22]SHUMAN D I, NARANG S K, FROSSARD P, et al. The emerging field of signal processing on graphs: extending high-dimensional data analysis to networks and other irregular domains[J]. IEEE Signal Processing Magazine, 2013, 30(3): 83-98.

        [23]HAMMOND D K, VANDERGHEYNST P, GRIBONVAL R.Wavelets on graphs via spectral graph theory[J]. Applied and Computational Harmonic Analysis, 2011, 30(2): 129-150.

        [24]DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]//Advances in Neural Information Processing Systems.2016: 3844-3852.

        [25]CHUNG F R K. Spectral graph theory[C]// CBMS Regional Conference Series in Mathematics. 1996.

        猜你喜歡
        網(wǎng)絡(luò)結(jié)構(gòu)特征向量準(zhǔn)確率
        二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
        克羅內(nèi)克積的特征向量
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        高速公路車牌識別標(biāo)識站準(zhǔn)確率驗(yàn)證法
        一類特殊矩陣特征向量的求法
        EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
        基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
        知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機(jī)制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
        国产精品亚洲一区二区麻豆| 午夜一级在线| 久久国产A∨一二三| 久久亚洲av熟女国产| 亚洲精品久久久久一区二区| 国产精品福利自产拍在线观看| 99视频在线国产| 国产一区二区三区影片| 人妻制服丝袜中文字幕| 国产男女免费完整视频| 五月天综合在线| 女优av福利在线观看| 亚洲黄片av在线播放| 一区二区三区国产| 欧美极品第一页| 丰满少妇一区二区三区专区 | 亚洲人成网址在线播放| 乱伦一区二| 久久狠狠髙潮曰十八女人| 国产欧美va欧美va香蕉在线| 18禁裸男晨勃露j毛免费观看| 国产精品自产拍在线观看中文| 久久2020精品免费网站| 亚洲a∨无码精品色午夜| 国产人妻无码一区二区三区免费| 国产精品无码久久久久久蜜臀AV| 最新天堂一区二区三区| 国产精品 亚洲 无码 在线| 亚洲一区二区三区偷拍女厕| 国产福利一区二区三区视频在线看 | 久久精品中文字幕极品| 日韩va高清免费视频| 欧洲熟妇色xxxx欧美老妇软件| 亚洲av无码av吞精久久| 国产精品国产三级国产av主| 亚洲综合日韩一二三区| 欧美黑人性暴力猛交喷水黑人巨大| 97中文字幕在线观看| av国产自拍在线观看| 少妇扒开毛茸茸的b自慰| 伊人网视频在线观看|