亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于灰狼優(yōu)化算法的社交網(wǎng)絡(luò)影響力識(shí)別算法

2021-10-18 01:50:46李淑霞楊俊成河南工業(yè)職業(yè)技術(shù)學(xué)院電子信息工程學(xué)院河南南陽(yáng)473000

計(jì)算機(jī)應(yīng)用與軟件 2021年10期

李淑霞楊俊成(河南工業(yè)職業(yè)技術(shù)學(xué)院電子信息工程學(xué)院河南南陽(yáng) 473000)

0 引言

隨著社交網(wǎng)絡(luò)的蓬勃發(fā)展，社交網(wǎng)絡(luò)中用戶的影響逐漸受到人們的關(guān)注，目前與社交影響力有關(guān)的研究方向主要有發(fā)現(xiàn)意見(jiàn)領(lǐng)袖和影響力傳播[1]。通過(guò)用戶之間的社交活動(dòng)可觀察出社交影響力的強(qiáng)弱，具體表現(xiàn)為影響力大的用戶能夠使其他用戶的行為和思想發(fā)生改變。當(dāng)前，影響力分析在推薦系統(tǒng)[2]、鏈路預(yù)測(cè)[3]、市場(chǎng)營(yíng)銷[4]和突發(fā)事件檢測(cè)[5]等領(lǐng)域發(fā)揮了重要的作用。

社交網(wǎng)絡(luò)包含復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)，這為用戶的影響力分析增加了難度。在目前常用的影響力分析方法中，一般將社交網(wǎng)絡(luò)分為若干的社區(qū)，然后分別識(shí)別每個(gè)社區(qū)內(nèi)影響力高的用戶[6-7]。文獻(xiàn)[8]提出OLMiner算法從大規(guī)模社交網(wǎng)絡(luò)檢測(cè)出意見(jiàn)領(lǐng)袖，該研究解決了社交用戶的影響力重疊問(wèn)題，通過(guò)縮小候選解數(shù)量降低算法的計(jì)算復(fù)雜度。文獻(xiàn)[9]提出基于擴(kuò)展獨(dú)立級(jí)聯(lián)模型，并融入網(wǎng)絡(luò)結(jié)構(gòu)特征、個(gè)體屬性和行為特征的意見(jiàn)領(lǐng)袖挖掘模型，該模型利用懶惰向前(Lazy forward,LF)算法挖掘網(wǎng)絡(luò)中影響力較大的個(gè)體。該模型考慮了信息傳播中交互特征的問(wèn)題，但是其計(jì)算成本較大。文獻(xiàn)[10]提出一種基于上下文感知和用戶影響力的好友推薦算法，首先根據(jù)通信數(shù)據(jù)計(jì)算用戶間的通信社交信任度，再利用用戶之間的地理位置數(shù)據(jù)計(jì)算位置信任度，根據(jù)兩方面的數(shù)據(jù)得到用戶間的綜合社交影響力。文獻(xiàn)[11]結(jié)合MapReduce編程計(jì)算模型和PageRank模型，提出一種基于MapReduce并行化計(jì)算模型的微博用戶影響力排名優(yōu)化算法。

目前大量的研究結(jié)果顯示，社交網(wǎng)絡(luò)可分為社區(qū)形式，每個(gè)社區(qū)內(nèi)均包含影響力大的意見(jiàn)領(lǐng)袖[12]，因此許多專家將識(shí)別每個(gè)社區(qū)的影響力作為主要的研究工作。文獻(xiàn)[13]利用Louvain算法劃分社交網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)，再通過(guò)語(yǔ)義分析檢測(cè)每個(gè)社區(qū)的高影響力用戶，該算法在真實(shí)數(shù)據(jù)集上完成了驗(yàn)證，取得了理想的結(jié)果。受文獻(xiàn)[13]啟發(fā)，本文設(shè)計(jì)了社區(qū)檢測(cè)和影響力分析算法。

傳統(tǒng)的社區(qū)檢測(cè)算法主要通過(guò)兩個(gè)節(jié)點(diǎn)的共同鄰居節(jié)點(diǎn)來(lái)估計(jì)節(jié)點(diǎn)間的相似性，再通過(guò)模塊度評(píng)價(jià)社區(qū)結(jié)構(gòu)的強(qiáng)度。但該方法對(duì)連接密集型網(wǎng)絡(luò)的性能不佳，同時(shí)模塊度僅僅基于節(jié)點(diǎn)間的連接而定義，忽略了鄰居節(jié)點(diǎn)間的連接。本文同時(shí)考慮了鄰居節(jié)點(diǎn)和非鄰居節(jié)點(diǎn)來(lái)決定兩者的相似性，有助于提高社區(qū)檢測(cè)的準(zhǔn)確性。此外，在社區(qū)用戶的影響力識(shí)別算法中，利用灰狼優(yōu)化算法尋找影響力高的用戶，為傳統(tǒng)灰狼優(yōu)化算法設(shè)計(jì)了兩個(gè)變異算子，從而防止灰狼優(yōu)化算法發(fā)生局部收斂。

1 模塊度社區(qū)檢測(cè)算法

1.1 節(jié)點(diǎn)相似性

如果兩個(gè)節(jié)點(diǎn)間存在許多相同的屬性，那么這兩個(gè)節(jié)點(diǎn)的相似性高。設(shè)G=(V,E)為無(wú)向圖，其中V為圖的節(jié)點(diǎn)集合，E為邊集合。如果兩個(gè)節(jié)點(diǎn)a,b∈V具有多個(gè)相同鄰居節(jié)點(diǎn)，那么認(rèn)為a的b之間相似性較高。因此可通過(guò)統(tǒng)計(jì)節(jié)點(diǎn)a和b之間相同的鄰居數(shù)量來(lái)度量?jī)烧叩南嗨菩裕x為：

(1)

式中：Γa、Γb分別表示a、b的鄰居節(jié)點(diǎn)集。該度量方法僅對(duì)存在直接連接的情況有效，在真實(shí)網(wǎng)絡(luò)中存在大量無(wú)連接的情況，所以該方法無(wú)法準(zhǔn)確地解決社區(qū)檢測(cè)問(wèn)題。

1.2 社區(qū)模塊度

模塊度是一種常用的社區(qū)結(jié)構(gòu)度量指標(biāo)，該指標(biāo)統(tǒng)計(jì)相同社區(qū)內(nèi)每對(duì)節(jié)點(diǎn)的連接數(shù)量，通過(guò)和閾值比較決定社區(qū)的結(jié)構(gòu)。設(shè)G=(V,E)表示無(wú)向網(wǎng)絡(luò)，網(wǎng)絡(luò)包含n=|V|個(gè)頂點(diǎn)和m條邊。將網(wǎng)絡(luò)表示為鄰接矩陣A=(aij)，其元素aij=1表示節(jié)點(diǎn)vi和vj之間存在連接；aij=0表示節(jié)點(diǎn)vi和vj之間沒(méi)有連接。設(shè)NC為G的社區(qū)數(shù)量，G的模塊度定義為：

(2)

式中：di和dj分別為節(jié)點(diǎn)vi和vj的度；δ()表示克羅內(nèi)克函數(shù)，如果節(jié)點(diǎn)ci和cj屬于同一個(gè)社區(qū)；δ(ci,cj)等于1，否則為0。將式(2)改寫(xiě)為：

(3)

式中：Is為簇s的邊數(shù)量；ds為s內(nèi)節(jié)點(diǎn)的度之和。式(3)可以直觀反映實(shí)際連接數(shù)量和期望連接數(shù)量之間的差異。

1.3 基于廣義模塊度的社區(qū)檢測(cè)技術(shù)

目前主要通過(guò)兩個(gè)節(jié)點(diǎn)的共同鄰居估計(jì)節(jié)點(diǎn)間的相似性，而本文考慮了鄰居節(jié)點(diǎn)和非鄰居節(jié)點(diǎn)來(lái)決定兩者的相似性。如果節(jié)點(diǎn)x和節(jié)點(diǎn)y連接，且x和另一個(gè)節(jié)點(diǎn)z也連接，那么y也應(yīng)該和z連接。本文的相似性度量檢查網(wǎng)絡(luò)中的所有節(jié)點(diǎn)來(lái)評(píng)估兩個(gè)節(jié)點(diǎn)間的關(guān)系，節(jié)點(diǎn)vi和節(jié)點(diǎn)vj間的連接定義為：

(4)

設(shè)sim為相似性指標(biāo)，如果節(jié)點(diǎn)vi和節(jié)點(diǎn)vj連接，然后尋找和vi、vj均連接的另一個(gè)節(jié)點(diǎn)vk，可獲得節(jié)點(diǎn)vi和vj之間連接評(píng)分的計(jì)算式：

(5)

式中：n為網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量，如果adj(vi,vj)=1，且adj(vi,vk)=adj(vi,vk)，那么Di,j的最小值為2。最終節(jié)點(diǎn)vi和vj之間的相似性定義為：

(6)

如果Di,j的最小值為2，那么sim(vi,vj)的最大值為1。當(dāng)兩個(gè)節(jié)點(diǎn)的鄰居和非鄰居均相同，此時(shí)兩個(gè)節(jié)點(diǎn)之間sim為最大值。sim的最小值為1/(n-1)。sim的取值范圍為[1/(n-1),1]，n值越高，則sim值越小，表示節(jié)點(diǎn)間越不相似。sim相似性具有對(duì)稱性，即sim(vi,vj)=sim(vj,vi)。兩個(gè)節(jié)點(diǎn)的共同鄰居越多，則認(rèn)為它們的相似性越高。

(7)

(8)

綜上，將式(7)改寫(xiě)為：

(9)

1.4 基于廣義模塊度的社區(qū)劃分算法

(10)

社區(qū)劃分算法的具體步驟如下：

Step1社交網(wǎng)絡(luò)建模為無(wú)向、無(wú)權(quán)重的網(wǎng)絡(luò)G。

(11)

Step6重復(fù)上述步驟，直至模塊度的增量為0或者為負(fù)值。

2 社交網(wǎng)絡(luò)分析

2.1 社交網(wǎng)絡(luò)模型

在意見(jiàn)領(lǐng)袖的模型中社交網(wǎng)絡(luò)建模為有向圖，設(shè)G={V,E}為社交網(wǎng)絡(luò)，其中V為用戶集，E為邊集，E表示了用戶間的關(guān)系，用戶關(guān)系依賴于用戶的興趣、行為、社區(qū)、工作環(huán)境等屬性。

2.2 社交網(wǎng)絡(luò)的中心度量指標(biāo)

采用三個(gè)中心度量指標(biāo)計(jì)算用戶影響力的目標(biāo)函數(shù)。

(1) 介數(shù)中心。根據(jù)節(jié)點(diǎn)在網(wǎng)絡(luò)中的最短路徑計(jì)算其介數(shù)中心性(Betweenness Centrality,BC)，該指標(biāo)反映了目標(biāo)節(jié)點(diǎn)作為傳播橋梁的貢獻(xiàn)度。BC定義為：

(12)

式中：c(i,j)(x)表示經(jīng)過(guò)x的最短路徑i→j總數(shù)量；c(i,j)表示i和j之間最短路徑i→j總數(shù)量。

(2) 緊密中心性(closeness centrality,CC)。CC反映了某個(gè)節(jié)點(diǎn)到達(dá)其他節(jié)點(diǎn)的難易程度，定義為節(jié)點(diǎn)到達(dá)網(wǎng)絡(luò)所有其他節(jié)點(diǎn)的最短距離之和，其計(jì)算式為：

(13)

式中：d(x,y)為節(jié)點(diǎn)x和節(jié)點(diǎn)y間的最短距離。

(3) 度中心性度中心性(Degree Centrality,DC)。根據(jù)網(wǎng)絡(luò)直接連接的概念定義節(jié)點(diǎn)的度中心性DC，定義為和節(jié)點(diǎn)x關(guān)聯(lián)的所有直接連接之和，其計(jì)算式為：

DC(x)=dig(x)

(14)

式中：dig(x)表示節(jié)點(diǎn)x的度。

2.3 社交影響力的目標(biāo)函數(shù)

本文基于BC、CC和DC定義了目標(biāo)函數(shù)Ob：

(15)

3 灰狼優(yōu)化算法的增強(qiáng)

3.1 灰狼優(yōu)化算法

灰狼優(yōu)化算法(GWO)共有4種不同領(lǐng)導(dǎo)力的狼：α狼、β狼、δ狼和ω狼，α狼、β狼和δ狼分別為最優(yōu)解、次優(yōu)解、第三優(yōu)解，ω狼為候選解。狼群圍補(bǔ)獵物的過(guò)程表示為以下的數(shù)學(xué)模型：

D=|C·Xp-X(t)|

(16)

X(t+1)=|Xp(t)-A·D|

(17)

式中：Xp和X分別表示第t次迭代獵物和灰狼的位置。A和C為系數(shù)向量，分別定義為：

A=|2a·rand1-a|

(18)

C=2·rand2

(19)

式中：rand1和rand2均為[0,1]之間的隨機(jī)量。a的模在迭代過(guò)程中從2線性下降至0，其計(jì)算式為：

(20)

式中：iter表示最大迭代次數(shù)。

圖1所示是二維的位置向量和灰狼的下一個(gè)可能位置，圖中(X,Y)為灰狼agent的位置，(X*,Y*)為獵物的位置。

捕獵過(guò)程中α狼、β狼和δ狼更新位置的方法為：

(21)

X1=Xα-A1·(Dα),Dα=|C1·Xα-X|

(22)

X2=Xβ-A2·(Dβ),Dβ=|C2·Xβ-X|

(23)

X3=Xδ-A3·(Dδ),Dδ=|C3·Xδ-X|

(24)

式中：X1、X2和X3分別為α狼、β狼和δ狼的位置。

GWO算法在攻擊獵物的過(guò)程中，每只狼根據(jù)它的當(dāng)前位置和獵物的位置更新下一次迭代的位置。在搜索獵物階段，α狼、β狼和δ狼彼此遠(yuǎn)離來(lái)擴(kuò)大搜索范圍，在攻擊獵物階段，α狼、β狼和δ狼開(kāi)始收斂。

3.2 增強(qiáng)的灰狼優(yōu)化算法(EnGWO)

本文對(duì)灰狼優(yōu)化算法進(jìn)行了增強(qiáng)處理，記為EnGWO。EnGWO包括初始化階段、目標(biāo)函數(shù)評(píng)價(jià)階段、轉(zhuǎn)換函數(shù)階段和變異階段。

(1) 初始化階段。初始化階段采用隨機(jī)初始化機(jī)制，生成n個(gè)狼(稱為agent)。每個(gè)agent表示一個(gè)可能解，灰狼搜索的目標(biāo)是搜索聲譽(yù)最高的目標(biāo)用戶，將社交網(wǎng)絡(luò)的用戶位置組織成如下二維矩陣形式：

(2) 評(píng)價(jià)指標(biāo)。GWO的適應(yīng)度函數(shù)為式(15)。

(3) 精英算子和變異算子。為了增強(qiáng)GWO的全局搜索能力。設(shè)計(jì)了一個(gè)精英算子和一個(gè)變異算子見(jiàn)算法1和算法2。精英算子的目標(biāo)是保留高聲望的用戶，同時(shí)隨機(jī)刪除一部分高聲望用戶，參考許多遺傳算法的研究文獻(xiàn)，將變異算子的Mp設(shè)為0.1，從而平衡收斂速度和變異效果。變異算子的目標(biāo)是引入一部分聲望較低的用戶，避免發(fā)生局部收斂的情況。

算法1精英算子

輸入：Xα。

//原解

輸出：Xα。

//處理后的解

1.fit=計(jì)算Xα的適應(yīng)度；

2.分配向量pos來(lái)保存Xα已訪問(wèn)的top-N位置；

3.分配變量Xmut=Xα；

4.fori=1 tolenth_of(pos)

//遍歷當(dāng)前的top-N特征

5.生成[0,1]的隨機(jī)數(shù)rand；

6.ifrand

//Mp設(shè)為0.1

7.Xmu[pos[i]]=0；

//刪除部分最優(yōu)用戶

8.fitmu←Xmu1的適應(yīng)度；

//計(jì)算新的適應(yīng)度

9.iffitmu

10.fit=fitmu；

11.Xα=Xmu1；

12.end for

13.end for

14.end for

算法2變異算子

輸入：Xα。

//原解

輸出：Xα。

//處理后的解

1.分配向量zer保存N個(gè)未被訪問(wèn)的隨機(jī)用戶；

2.分配變量Xmut2；

3.forj=1 tolenth_of(zer)；

//遍歷N個(gè)未被訪問(wèn)的用戶

4.生成[0,1]內(nèi)的隨機(jī)數(shù)rand；

5.if(rand

6.Xmu2[zer[j]]=1

7.fitmu←Xmu2的適應(yīng)度；

8.if(fitmu

9.fit=fitmu；

10.Xα=Xmu2；

11.end if

12.end if

13.end for

(4) EnGWO算法的實(shí)現(xiàn)。算法3所示為本文所設(shè)計(jì)的EnGWO算法流程。

算法3增強(qiáng)的灰狼優(yōu)化算法。

1.初始化灰狼種群Xi；

2.每個(gè)灰狼表示為一個(gè)向量；

3.初始化參數(shù)；

4.分配迭代變量t=0；

5.計(jì)算每個(gè)灰狼的適應(yīng)度f(wàn)it；

6.分配三個(gè)最優(yōu)解Xα、Xβ、Xδ；

7.fortfrom 1 toITERmax

8.foreach 灰狼 agent

9.更新灰狼的位置；

//式(21)

10.end for

11.更新a,A,C；

12.計(jì)算每個(gè)灰狼的適應(yīng)度；

13.更新最優(yōu)灰狼Xα、Xβ、Xδ；

14.t++；

15.對(duì)Xα運(yùn)用精英算子和變異算子；

16.更新Xα的適應(yīng)度；

17.檢查是否滿足收斂條件；

18.end for

4 實(shí) 驗(yàn)

4.1 實(shí)驗(yàn)數(shù)據(jù)集

采用真實(shí)數(shù)據(jù)集Slashdot[14]驗(yàn)證本文算法的有效性，Slashdot是與技術(shù)相關(guān)的新聞網(wǎng)站，允許用戶對(duì)于每個(gè)條目進(jìn)行“好友”和“敵人”的標(biāo)注。該數(shù)據(jù)集共有13 182個(gè)節(jié)點(diǎn)、28個(gè)社區(qū)和34 621條邊，每條邊表示了用戶之間的好友關(guān)系，網(wǎng)絡(luò)的密度為5.198 1。大約76.7%的用戶之間存在好友關(guān)系，其他用戶之間為對(duì)手關(guān)系。Slashdot數(shù)據(jù)集中一些用戶之間沒(méi)有好友或者對(duì)手關(guān)系，通過(guò)幾何平均數(shù)方法計(jì)算全部節(jié)點(diǎn)的度，補(bǔ)全缺失的社交連接。

4.2 社區(qū)檢測(cè)算法的性能

本文設(shè)計(jì)了無(wú)監(jiān)督的社區(qū)檢測(cè)算法以滿足社交網(wǎng)絡(luò)影響力分析的要求，首先驗(yàn)證本文社區(qū)檢測(cè)算法的有效性。選擇兩種算法與本文算法進(jìn)行比較，Louvain算法是一個(gè)常用的經(jīng)典社區(qū)檢測(cè)算法，基于模塊度實(shí)現(xiàn)，但該算法需要預(yù)先指定社區(qū)數(shù)量。ESMCD算法[15]在計(jì)算模塊度的過(guò)程中采用部分標(biāo)注信息，提高社區(qū)檢測(cè)的性能。本文社區(qū)檢測(cè)算法對(duì)相似性進(jìn)行了補(bǔ)充，以提高模塊度評(píng)估的性能，所以選擇這兩個(gè)基于模塊度的社區(qū)檢測(cè)算法作為對(duì)比方法。

本文實(shí)驗(yàn)硬件環(huán)境為PC，i7處理器的主頻為3.2 GHz，16 GB內(nèi)存，操作系統(tǒng)為Windows 10，使用Python語(yǔ)言編程實(shí)現(xiàn)本文算法。表1所示是三個(gè)社區(qū)檢測(cè)算法的實(shí)驗(yàn)結(jié)果，每種算法分別獨(dú)立地運(yùn)行100次，三種算法的平均模塊度分別為0.852 2、0.712 1和0.724 1，三種算法各有優(yōu)劣，但是Louvain算法和ESMCD算法均需要社交網(wǎng)絡(luò)的先驗(yàn)信息，而本文算法是一種無(wú)監(jiān)督的自適應(yīng)檢測(cè)算法，無(wú)需任何先驗(yàn)信息。

4.3 性能評(píng)價(jià)指標(biāo)和參數(shù)設(shè)置

本文采用準(zhǔn)確率、精度、召回率和F1-score作為社交網(wǎng)絡(luò)影響力識(shí)別的性能評(píng)價(jià)指標(biāo)。準(zhǔn)確率的計(jì)算式為：

式中：TP、TN、FP和FN分別表示判斷為正向的正確率、判斷為負(fù)向的正確率、把負(fù)向判斷成正向的誤報(bào)率和把正向判斷成負(fù)向的漏報(bào)率。

精度的計(jì)算式為：

召回率的計(jì)算式為：

F1-score的計(jì)算式為：

通過(guò)一組預(yù)處理實(shí)驗(yàn)尋找合適的灰狼優(yōu)化算法參數(shù)，最終選定表2所示的值作為灰狼優(yōu)化算法對(duì)于Slashdot數(shù)據(jù)集的相關(guān)參數(shù)。

4.4 社交影響力分析實(shí)驗(yàn)

選擇以下三種社交影響力識(shí)別算法作為對(duì)比方法：OLRS[16]是一種意見(jiàn)領(lǐng)袖識(shí)別算法，該算法并不包含社區(qū)劃分處理，且無(wú)需社交網(wǎng)絡(luò)的拓?fù)湫畔?，選擇該算法可以觀察本文算法對(duì)社交網(wǎng)絡(luò)結(jié)構(gòu)的利用效果；MOL[17]是一種高效率的大數(shù)據(jù)意見(jiàn)領(lǐng)袖挖掘算法，該算法中通過(guò)隨機(jī)化機(jī)制提高算法的挖掘效率，選擇該算法可以觀察本文算法對(duì)社交網(wǎng)絡(luò)全局意見(jiàn)領(lǐng)袖的識(shí)別效果；SAIIN[18]是一種基于迭代和語(yǔ)義分析的意見(jiàn)領(lǐng)袖挖掘算法，本文算法則是基于迭代和網(wǎng)絡(luò)結(jié)構(gòu)的影響力分析算法，選擇該算法可以比較網(wǎng)絡(luò)結(jié)構(gòu)和語(yǔ)義分析對(duì)影響力識(shí)別的性能差異。

(1) 局部社交影響力實(shí)驗(yàn)。采用四種社交影響力識(shí)別算法檢測(cè)每個(gè)社區(qū)的意見(jiàn)領(lǐng)袖，結(jié)果如表3所示，表中的粗體表示正確識(shí)別的每個(gè)社區(qū)意見(jiàn)領(lǐng)袖。MOL算法對(duì)第6、26社區(qū)識(shí)別的社交領(lǐng)袖出現(xiàn)偏差，OLRS算法對(duì)第7、8、10、13、21、22、26和28社區(qū)識(shí)別的社交領(lǐng)袖出現(xiàn)偏差，OLRS算法對(duì)第13、15、17、20、24和28社區(qū)識(shí)別的社交領(lǐng)袖出現(xiàn)偏差。本文算法所檢測(cè)的28個(gè)社區(qū)的意見(jiàn)領(lǐng)袖均正確。

表3 局部社交影響力的實(shí)驗(yàn)結(jié)果

續(xù)表3

(2) 全局社交影響力實(shí)驗(yàn)。采用四種社交影響力識(shí)別算法檢測(cè)Slashdot數(shù)據(jù)集的全局影響力，表4中第2列是top-10影響力的節(jié)點(diǎn)編號(hào)。MOL算法所檢測(cè)的top-10影響力節(jié)點(diǎn)較為準(zhǔn)確，但是影響力的排名存在偏差。OLRS算法所檢測(cè)的top-10影響力節(jié)點(diǎn)存在偏差。本文算法所檢測(cè)的top-10影響力節(jié)點(diǎn)較為準(zhǔn)確，并且影響力的排名也較為準(zhǔn)確。

表4 全局社交影響力的實(shí)驗(yàn)結(jié)果

在社交網(wǎng)絡(luò)中往往存在多個(gè)社交影響力較大的用戶，因此通過(guò)本文算法檢測(cè)每個(gè)社區(qū)top-50的高影響力節(jié)點(diǎn)。通過(guò)準(zhǔn)確率、精度、召回率和F1-score評(píng)價(jià)四種算法的社交影響力總體識(shí)別性能，結(jié)果如圖2所示。OLRS算法檢測(cè)少量社交領(lǐng)袖的性能較好，但是該算法并未考慮影響力排序，導(dǎo)致對(duì)非社交領(lǐng)袖的識(shí)別能力不足。MOL算法和SAIIN算法的準(zhǔn)確率、精度、召回率和F1-score的性能均較為理想，足以提供高質(zhì)量的影響力分析效果。本文算法采用增強(qiáng)的灰狼優(yōu)化算法也實(shí)現(xiàn)了理想的識(shí)別準(zhǔn)確率，并且略優(yōu)于MOL算法和SAIIN算法。

圖2 社區(qū)top-50影響力的平均識(shí)別性能

5 結(jié) 語(yǔ)

本文設(shè)計(jì)了無(wú)監(jiān)督的社區(qū)劃分算法，通過(guò)社區(qū)劃分減小社交影響力識(shí)別的復(fù)雜度。此外，本文利用灰狼優(yōu)化算法參數(shù)少、收斂速度快的優(yōu)點(diǎn)尋找影響力大的用戶，通過(guò)引入兩個(gè)變異算子增強(qiáng)種群的多樣性，減小局部收斂的概率。目前本文算法僅支持靜態(tài)社交網(wǎng)絡(luò)的影響力識(shí)別問(wèn)題，無(wú)法用于動(dòng)態(tài)社交網(wǎng)絡(luò)。另外，社交網(wǎng)絡(luò)中包含粉絲數(shù)量、關(guān)注數(shù)量、用戶語(yǔ)義和用戶登錄次數(shù)等大量的上下文信息，這些信息對(duì)用戶影響力的判斷具有巨大的潛在價(jià)值。未來(lái)將研究社交網(wǎng)絡(luò)中的非拓?fù)浣Y(jié)構(gòu)信息對(duì)社交影響力的貢獻(xiàn)，進(jìn)一步提高算法的性能和實(shí)用價(jià)值。