黃立赫
(1.西北工業(yè)大學(xué)馬克思主義學(xué)院 西安 710129;2.華北水利水電大學(xué)馬克思主義學(xué)院 鄭州 450046)
伴隨著Web2.0的快速發(fā)展,以天涯、新浪等為代表的社交網(wǎng)絡(luò)已日漸成為我國網(wǎng)民發(fā)表觀點、宣泄情感的主要渠道。興趣相似的用戶圍繞相關(guān)事件或話題展開討論,逐漸形成網(wǎng)絡(luò)主題社區(qū)(Network Topic Community)[1]。意見領(lǐng)袖(Opinion Leader)作為網(wǎng)絡(luò)主題社區(qū)內(nèi)引領(lǐng)輿情趨勢、加速信息擴(kuò)散的高影響力用戶,能夠?qū)ι鐣W(wǎng)絡(luò)成員間的交互關(guān)系演化起到關(guān)鍵性作用[2]。因此,挖掘網(wǎng)絡(luò)主題社區(qū)內(nèi)的意見領(lǐng)袖,有助于提升虛擬化社會網(wǎng)絡(luò)環(huán)境的治理能力,為網(wǎng)絡(luò)輿情管控提供必要的決策依據(jù)。
目前,意見領(lǐng)袖的識別方法主要可分為基于用戶內(nèi)容和交互行為的識別方法[3,4],以及基于用戶多特征的屬性融合方法[5,6]?;谟脩魞?nèi)容和交互行為的識別方法主要包括基于文本特征、交互關(guān)系、情感分析等的用戶影響力計算模型,如陳芬等提出一種基于文本傾向性分析的意見領(lǐng)袖識別方法(TSA),該方法依據(jù)Word2Vec算法劃分微博用戶的情感傾向,識別虛假意見領(lǐng)袖[7]。吳渝等在PageRank算法的基礎(chǔ)上提出基于用戶影響力的意見領(lǐng)袖發(fā)發(fā)現(xiàn)算法(UILR),該方法依據(jù)提取的用戶活躍度屬性特征,確定用戶間的鏈接關(guān)系,并以此為基礎(chǔ)計算用戶綜合影響力[8]。樊興華等提出一種基于改進(jìn)的影響力擴(kuò)散概率模型(IDPM),該模型將用戶節(jié)點間的交互關(guān)系,轉(zhuǎn)化成用戶間在興趣帖上的影響傳播概率計算[9]。朱茂然等提出基于情感分析的意見領(lǐng)袖識別方法(LPR),該方法在主題空間上,通過構(gòu)建用戶情感權(quán)重矩陣,改善了評論文本中情感極性分布不均衡的問題,從網(wǎng)絡(luò)結(jié)構(gòu)和情感傾向角度識別正面意見領(lǐng)袖[10]?;谟脩魞?nèi)容和交互行為的識別方法重點關(guān)注用戶節(jié)點自身的單一屬性特征,忽視了多維屬性交互對影響力計算的作用。基于用戶多特征的屬性融合方法,本質(zhì)上通過分析用戶節(jié)點的交互行為、網(wǎng)絡(luò)結(jié)構(gòu)、情感語義等屬性特征,實現(xiàn)用戶影響力的綜合排序。曹玖新等通過聯(lián)合建模用戶結(jié)構(gòu)、行為以及情感特征,實現(xiàn)面向用戶多維影響力分布的意見領(lǐng)袖識別(MFP)[11]。陳淑娟等提出面向主題社團(tuán)的意見領(lǐng)袖挖掘方法(QMOLA),該方法通過構(gòu)建基于用戶興趣的隱狄利克雷分布,獲取用戶間主題相似度,再依據(jù)傳播特征與情感特征識別主題社團(tuán)高影響力用戶[12]。張繼東等通過將用戶交互關(guān)系與情感分析相結(jié)合,提出一種面向移動社交網(wǎng)絡(luò)的影響力計算模型(IBET),該方法綜合了用戶節(jié)點的活躍度與文本情感極性,識別出具有較高支持率的意見領(lǐng)袖[13]。
綜上所述,本文從社區(qū)用戶的興趣傳播視角,研究了網(wǎng)絡(luò)社區(qū)中用戶興趣在時間維上的演化特點,將興趣繼承概念引入用戶節(jié)點多維屬性分析,提出一種基于興趣繼承的意見領(lǐng)袖識別方法(IIOLR),該模型假設(shè)t時刻的網(wǎng)絡(luò)社區(qū)是t-1時刻的興趣后驗,同時繼承了t-1時刻的用戶節(jié)點興趣度。通過構(gòu)建平滑時間維上的高影響力用戶多維特征繼承因子,度量用戶在興趣維上的影響力分布,實現(xiàn)意見領(lǐng)袖的在線識別。
興趣社區(qū)是網(wǎng)絡(luò)用戶依據(jù)自身的愛好,圍繞某一主題進(jìn)行交流而逐漸形成的移動社交網(wǎng)絡(luò)[14]。意見領(lǐng)袖可視為在特定時段內(nèi)興趣社區(qū)中具有相對較大影響力的用戶,故可將t時刻基于特定興趣主題的意見領(lǐng)袖識別問題,轉(zhuǎn)化成用戶影響力的計算與排序問題。興趣社區(qū)的高影響力用戶挖掘主要包括興趣主題識別、興趣社區(qū)構(gòu)建、用戶節(jié)點多維特征分析以及用戶影響力計算。
總體技術(shù)框架如圖1所示。a.興趣主題識別。依據(jù)用戶的文本信息進(jìn)行主題識別,獲取用戶在不同興趣維下的主題,建立用戶與興趣主題間的映射。b.興趣社區(qū)構(gòu)建。根據(jù)用戶間的語義關(guān)系,完善興趣社區(qū)拓?fù)浣Y(jié)構(gòu),建立用戶間加權(quán)邊映射。c.用戶節(jié)點多維特征分析。在分析興趣社區(qū)中用戶屬性特征的基礎(chǔ)上,利用節(jié)點的興趣度繼承信息,構(gòu)建用戶節(jié)點特征矩陣,形成目標(biāo)用戶集合。d.用戶影響力計算。綜合用戶多維屬性特征以及情感極性分析,計算用戶綜合影響力,從而識別出意見領(lǐng)袖。
圖1 興趣社區(qū)意見領(lǐng)袖挖掘框架
1.1興趣主題識別本文采用基于ATM(Author Topic Model)[15]的用戶興趣主題識別方法,該方法是在LDA主題模型的基礎(chǔ)上增加作者信息,使其在分析文檔主題分布的同時,獲取用戶的興趣分布。ATM模型的核心是建立用戶-主題概率分布,即假設(shè)用戶文檔中每個用戶是用戶-主題的混合多項分布,每個主題又是主題-詞匯的混合多項分布。用戶依特定的概率抽取主題,主題依特定的概率選擇特征詞匯。ATM是一個多層Bayes網(wǎng)絡(luò),如圖2所示。
圖2 ATM模型示意圖
圖2中,θ是文檔的T個主題分布矩陣,φ是主題詞分布矩陣,ad是用戶集合,x是選定某個詞的用戶,z是詞的主題,w表示詞本身。ATM模型假設(shè)每個用戶均存在K個主題的興趣分布。首先從用戶集合ad中選擇給定的用戶x,生成其對應(yīng)文檔的主題分布并生成主題,再從該主題的詞匯分布中選擇詞匯。ATM模型的聯(lián)合后驗概率分布如公式(1)所示。將公式(1)通過Gibbs抽樣,獲取用戶-主題分布以及主題-特征詞分布。
(1)
1.2興趣社區(qū)拓?fù)錁?gòu)建興趣社區(qū)構(gòu)建主要通過分析在線社交網(wǎng)絡(luò)用戶的文本數(shù)據(jù),抽取具有不同偏好需求的用戶興趣主題,并建立用戶與主題間的關(guān)系映射[16]。為便于表述,本文使用三元組(U,R,W)表示興趣社區(qū)I,其中,U為用戶節(jié)點集合,R為用戶節(jié)點間的邊集合,W是邊上的權(quán)重。興趣社區(qū)拓?fù)錁?gòu)建主要分成兩個過程:首先基于ATM模型識別用戶-興趣主題矩陣,建立用戶-主題映射和主題-特征詞映射,并通過用戶-文檔矩陣,實現(xiàn)主題-用戶的語義關(guān)聯(lián),構(gòu)建用戶節(jié)點集合U。其次,獲取集合U內(nèi)任意(ui,uj)間關(guān)聯(lián)關(guān)系,建立用戶節(jié)點間的加權(quán)邊,得到興趣社區(qū)的拓?fù)浣Y(jié)構(gòu)。興趣社區(qū)拓?fù)錁?gòu)建過程如圖3所示。
圖3 興趣社區(qū)拓?fù)錁?gòu)建圖
現(xiàn)實場景中,用戶影響力往往隨著用戶興趣變化而波動,意見領(lǐng)袖的識別需要考慮興趣社區(qū)拓?fù)浣Y(jié)構(gòu)的動態(tài)演化[17]。意見領(lǐng)袖作為影響力數(shù)值較高的一類用戶,其在時間維上往往表現(xiàn)出較為強(qiáng)烈的動量特性,即用戶u在t時刻對某一主題的興趣度會對其在t+1時刻的影響力產(chǎn)生影響,且在沒有環(huán)境突變的情況下,表現(xiàn)出一種緩慢傳遞的特性。如意見領(lǐng)袖因“興趣遷移”,使得其興趣特征值降低,但其在興趣社區(qū)內(nèi)的綜合影響力會因為其以往在大眾傳播中的“優(yōu)勢地位”,而不會驟然降低。本文將用戶興趣度在時間維上對影響力變化產(chǎn)生的作用稱為興趣繼承。IIOLR模型認(rèn)為興趣社區(qū)的形成主要依賴于兩種內(nèi)在牽引力,即興趣牽引力與情感牽引力。興趣牽引力主要由環(huán)境特征、主題特征以及行為特征所決定,環(huán)境特征主要指由長期興趣關(guān)注而出現(xiàn)的好友關(guān)注、圈友關(guān)聯(lián)等,主題特征主要指由短期興趣變化引起的主題分布漂移等,行為特征主要指由不同興趣強(qiáng)度而產(chǎn)生的用戶社區(qū)活躍度與傳播度等。情感牽引力主要通過分析用戶節(jié)點的文本情感極性,挖掘用戶間的語義情感傾向。由于用戶的興趣繼承性質(zhì),作用于用戶影響力的節(jié)點特征需要綜合考慮多種牽引力繼承因子。因此,用戶節(jié)點興趣繼承可細(xì)化為環(huán)境特征繼承、主題特征繼承、行為特征繼承和情感特征繼承。
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
t-1時刻的上述三種特征分量通過節(jié)點的興趣屬性實現(xiàn)“繼承傳遞”,并以興趣牽引力的形式作用于t時刻的興趣社區(qū)。因此,依據(jù)t-1時刻的社區(qū)興趣牽引力,構(gòu)造t時刻的興趣繼承算子,計算t時刻用戶興趣牽引力ITRt(ui),如公式(11)所示。
(11)
2.4情感特征繼承在外部環(huán)境不發(fā)生強(qiáng)烈變化的條件下,用戶對興趣主題的情感通常具有“慣性”特征,表現(xiàn)為意見領(lǐng)袖在社區(qū)情感上具有較強(qiáng)的傾向性引領(lǐng)[18]。群體用戶對某一用戶文本的正向評價次數(shù),往往能夠體現(xiàn)對其支持的程度,從而增加其作為意見領(lǐng)袖的概率。同樣,反向評價則會減少其作為意見領(lǐng)袖的概率。情感字典的情感極性包括正面情感、負(fù)面情感和中性情感[19]。依據(jù)情感字典獲取用戶文本的情感特征詞,進(jìn)行情感極性分析,得到用戶節(jié)點對其興趣主題的情感值,計算如公式(12)所示。興趣社區(qū)用戶群的情感牽引力計算如公式(13)所示。
(12)
(13)
2.5用戶影響力計算用戶影響力需要綜合考慮用戶節(jié)點在社區(qū)結(jié)構(gòu)中的興趣牽引力,以及用戶節(jié)點間信息傳遞所產(chǎn)生的情感牽引力。本文用戶節(jié)點興趣繼承綜合分析了環(huán)境特征繼承、主題特征繼承、行為特征繼承和情感特征繼承,利用t-1時刻的興趣繼承算子構(gòu)建t時刻的特征向量分布,由此得到t時刻的用戶影響力INFt(ui),計算如公式(14)所示。
(14)
其中,σ、1-σ分別為用戶興趣牽引力與情感牽引力的權(quán)重參數(shù);ITRt(ui)max為用戶ui在t時刻興趣牽引力的最大值。用戶影響力計算具體實現(xiàn)如算法1所示。
算法1 興趣社區(qū)意見領(lǐng)袖挖掘算法
輸入:用戶節(jié)點集合U,用戶間加權(quán)邊集合
輸出:用戶節(jié)點影響力排名TOP-K
1. Initializeφ//初始化支持度閾值
2.Compute Et(ui) //計算節(jié)點ui的環(huán)境特征
3.Compute Ct(ui) //計算節(jié)點ui的主題特征
4.Compute Bt(ui) //計算節(jié)點ui的行為特征5. If (ITR(uij) >φ) //選取興趣支持度大于閾值周圍節(jié)點
6.Bt(ui) = Bt(ui)+ ITR(uij)
7.ITR(ui)= Et(ui)+ Ct(ui)+ Bt(ui)//計算節(jié)點ui的興趣牽引力
8. ComputeSt(ui) //計算鄰居節(jié)點對ui的邊情感特征值
9.ComputeINF(|U|) //計算節(jié)點集合U的影響力
10. Sort (INF(|U|)) //進(jìn)行用戶影響力排序并輸出數(shù)值較大的K個節(jié)點
3.1實驗數(shù)據(jù)實驗數(shù)據(jù)來源于天涯微博社區(qū),通過設(shè)計多線程爬蟲工具收集2020年7月1日-8月30日的網(wǎng)站用戶發(fā)帖及回帖數(shù)據(jù),獲取有效用戶評論372459條,涉及用戶64533人。在經(jīng)過文本分詞,去除停用詞等預(yù)處理后,建立用戶-文本短語映射矩陣Maru。選取規(guī)模較大的“科研人員集體出走”、“騰訊起訴老干媽”、“林丹退役”、“源代碼泄露”等四個事件作為興趣主題集,分別標(biāo)記為MaruD1-MaruD4,統(tǒng)計信息如表1所示。以每個事件的發(fā)生時間作為數(shù)據(jù)流起始點,以“周”為劃分單位,連續(xù)統(tǒng)計4周,標(biāo)記為t1-t4,并分別創(chuàng)建相應(yīng)時間片下的興趣網(wǎng)絡(luò)拓?fù)洹?/p>
表1 四類興趣主題集信息
3.2參數(shù)分析IIOLR模型通過構(gòu)建高影響力用戶多維特征繼承因子,計算用戶在興趣維上的影響力分布,實現(xiàn)意見領(lǐng)袖的在線識別。在計算用戶影響力之前,需要確定模型中相關(guān)參數(shù)的取值。為便于說明,本文將IIOLR模型中的參數(shù)整體劃分為三類:繼承類參數(shù),特征分量參數(shù)以及特征牽引力參數(shù),具體見表2。
表2 IIOLR模型參數(shù)對照表
(15)
圖4 行為特征分量參數(shù)的相關(guān)性分析
興趣牽引力σ與情感牽引力1-σ反映了興趣因素與情感因素對意見領(lǐng)袖識別的影響程度。本文通過對比不同情感牽引力1-σ的取值,預(yù)測高影響力用戶在社區(qū)情感上的準(zhǔn)確率,選擇最能表達(dá)情感牽引力變化的權(quán)重參數(shù),計算如公式(16)所示。
(16)
圖5 情感牽引預(yù)測準(zhǔn)確率對比
3.3實驗結(jié)果與分析
3.3.1 用戶興趣群體識別 依據(jù)最小困惑度[20],計算不同興趣主題集在連續(xù)時間片下的最優(yōu)主題數(shù),分別確定t1-t4時間片的最優(yōu)主題數(shù)。采用主題分析ATM算法及Gibbs抽樣,以MaruD1為例,構(gòu)建的部分用戶-主題映射表如表3所示。
表3 “科研人員集體出走”社區(qū)用戶-主題映射表(部分)
3.3.2 節(jié)點影響力計算 依次構(gòu)建“科研人員集體出走”事件在4個時間片下的社區(qū)拓?fù)浣Y(jié)構(gòu),并將其帶入IIOLR模型,分別計算對應(yīng)時間片內(nèi)所含用戶節(jié)點的影響力INFt(ui)。圖6是以t1時間片下影響力數(shù)值較高的“血紅如斯”“砍柴少女”“小飛俠”“殘破的斜陽”“泡沫”等五位用戶節(jié)點為例,繪制在t2時間片存在話題共存現(xiàn)象(Topic2與Topic3)的影響力演化圖。
圖6 不同主題下用戶節(jié)點的影響力演化圖
分析圖6可知,用戶節(jié)點的影響力存在如下演化信息:在時間維上,a.用戶的影響力呈現(xiàn)出波動的特點。如“血紅如斯”用戶的影響力值在t3時刻急劇下降,結(jié)合用戶-主題映射表可知,其在t3時刻的主題特征繼承值較低,興趣遷移較明顯,使得其在Topic2的影響力變化較大。b.部分用戶在一段時間內(nèi)具有相對較穩(wěn)定的影響力。如Topic3的“小飛俠”與“泡沫”用戶。在興趣維上,c.不同興趣主題下,用戶的影響力存在差異。如“砍柴少女”用戶在Topic2與Topic3內(nèi),在t1-t4時間片下的影響力數(shù)值差異較明顯,經(jīng)人工分析發(fā)現(xiàn)該用戶的認(rèn)證身份為領(lǐng)域技術(shù)專家,該類用戶發(fā)展為“單一型”意見領(lǐng)袖的可能性較高。d.個別用戶在不同興趣主題下,影響力均較靠前。如“血紅如斯”用戶,分析后發(fā)現(xiàn),其認(rèn)證身份為社會知名網(wǎng)友(大V用戶),其在t1-t4時間片下的行為特征繼承值較高,該類用戶通常具有“綜合型”意見領(lǐng)袖的潛質(zhì)。
3.3.3 意見領(lǐng)袖識別 意見領(lǐng)袖作為是興趣社區(qū)中具有較高影響力的用戶,通常是在線社區(qū)中熱門話題的發(fā)起者或意見(情感)的引領(lǐng)者。前者往往通過其自身較高的活躍度,形成一定的輿論影響力;而后者則通過自身的情感表達(dá),引領(lǐng)大眾用戶發(fā)生情感變化[23]。因此,本文將上述兩類群體作為意見領(lǐng)袖識別對象,通過分析t時刻意見領(lǐng)袖的興趣牽引力與其所在主題社區(qū)普通用戶在t+1時刻興趣牽引力的相關(guān)性,識別第一類意見領(lǐng)袖。類似地,通過分析t時刻意見領(lǐng)袖的情感牽引力與其所在主題社區(qū)普通用戶在t+1時刻情感牽引力的相關(guān)性,識別第二類意見領(lǐng)袖。具體識別過程如下:首先計算MaruD1中4個主題在不同時間片下的用戶影響力INFt(ui),選取影響力指數(shù)較高的TOP-400用戶,再分別計算ti時刻用戶ui與其所在主題內(nèi)其余用戶群體在ti+1時刻的興趣牽引力以及情感牽引力之間的相關(guān)系數(shù),最終選出相關(guān)系數(shù)最大數(shù)值下的TOP-K意見領(lǐng)袖。以t1和t2時刻共存的Topic2主題為例,圖7是TOP-400用戶的牽引力相關(guān)性示意圖。
圖7 Topic2中TOP-400用戶的牽引力相關(guān)系數(shù)
依據(jù)圖7,當(dāng)K分別為83和108時,t1和t2時刻的意見領(lǐng)袖與普通用戶在興趣牽引力以及情感牽引力上的相關(guān)系數(shù)取到最大值,故選取相應(yīng)的高影響力用戶作為Topic2社區(qū)的意見領(lǐng)袖。
3.4模型分析
3.4.1 評價指標(biāo) 為了相對客觀的驗證本文提出的IIOLR模型的有效性,實驗使用覆蓋率和支持率兩種評價指標(biāo)進(jìn)行對比分析。覆蓋率主要從興趣主題的傳播視角,衡量意見領(lǐng)袖在興趣牽引力方面的影響力,具體計算如公式(17)所示。支持率主要從話題情感的擴(kuò)散角度,衡量意見領(lǐng)袖在情感牽引力方面的支持程度,具體計算如公式(18)所示。
(17)
其中,|forward(uj)|表示興趣社區(qū)內(nèi)轉(zhuǎn)發(fā)用戶ui的用戶數(shù),N表示興趣社區(qū)內(nèi)的用戶總數(shù)。
(18)
其中,|Positive(uj)|表示興趣社區(qū)內(nèi)對用戶ui持有正向評價的用戶數(shù),N表示興趣社區(qū)內(nèi)的用戶總數(shù)。
3.4.2 對比實驗 為了驗證IIOLR算法的有效性,實驗分別選取標(biāo)記為MaruD2“騰訊起訴老干媽”、MaruD3“林丹退役”數(shù)據(jù)集,按照上述實驗流程,分別與MFP[11],UILR[8],IDPM[24],QMOLA[12]四種方法進(jìn)行對比分析,依據(jù)各自算法計算用戶節(jié)點影響力指數(shù),并根據(jù)TOP-K排序,綜合評估算法在MaruD2上的覆蓋率(結(jié)果見圖8),以及在MaruD3上的支持率(結(jié)果見圖9)。
圖8 算法覆蓋率的實驗對比 圖9 算法支持率的實驗對比
由圖8的實驗結(jié)果,可以得出以下結(jié)論:首先,基于多特征的影響力計算方法IIOLR、MFP和QMOLA的覆蓋率要明顯高于基于用戶單特征的意見領(lǐng)袖挖掘算法UILR、IDPM,該結(jié)論進(jìn)一步驗證了在大規(guī)模社會網(wǎng)絡(luò)中,面向用戶節(jié)點真實狀態(tài)的多維屬性文本分析,能夠有效還原意見領(lǐng)袖在用戶交互以及觀點傳遞方面的中介作用。其次,IIOLR算法在250≤K≤600的范圍內(nèi),覆蓋率值明顯高于QMOLA與MFP算法,其主要是因為MFP算法雖然能夠融合網(wǎng)絡(luò)拓?fù)涮卣髋c話題情感傾向,實現(xiàn)社會網(wǎng)絡(luò)內(nèi)容的語義感知,但未考慮到節(jié)點屬性間在時間維上的傳遞依賴;而QMOLA算法雖然在意見領(lǐng)袖較少時,在數(shù)據(jù)集上的主題覆蓋率較高,但后期隨著意見領(lǐng)袖數(shù)的增多,覆蓋率逐漸下降,其原因是該模型將多維網(wǎng)絡(luò)傳播特征作為用戶間主題相似度的決定因素,與情感特征的融合度較低,無法有效解決復(fù)雜網(wǎng)絡(luò)下用戶影響力中斷問題。而IIOLR算法通過計算不同時間快照下的用戶興趣牽引力,有效融合用戶節(jié)點的環(huán)境特征、主題特征以及行為特征,從而降低了虛假影響力的擴(kuò)散可能。
分析圖9可以得到以下結(jié)論:a.UILR與IDPM算法均基于用戶節(jié)點的局部特征,無法將用戶文本情感與主題特征進(jìn)行聯(lián)合建模,因而算法在話題情感方面的支持率較低;b.MFP算法依賴于獨(dú)立時間片下的情感識別,沒有將意見領(lǐng)袖的屬性特征變化與在線社區(qū)的興趣演化相關(guān)聯(lián),難以捕獲社交網(wǎng)絡(luò)的動態(tài)特性;c.QMOLA算法雖然將用戶興趣屬性融入主題社團(tuán)劃分,但未考慮到用戶因興趣遷移而發(fā)生的情感遺傳問題[25];d.IIOLR算法在K≥650時,模型的支持率較高,其原因主要是IIOLR算法利用t時刻意見領(lǐng)袖與t+1時刻社區(qū)一般用戶間情感牽引力的的相關(guān)性,建立面向興趣維的情感傳遞,從而提高了意見領(lǐng)袖的識別精度。
本文將興趣繼承概念引入意見領(lǐng)袖節(jié)點挖掘中,提出一種多屬性繼承的主題社區(qū)意見領(lǐng)袖識別方法(IIOLR),該方法通過捕獲t-1時刻用戶節(jié)點的環(huán)境特征、主題特征、行為特征和情感特征,實現(xiàn)t時刻用戶節(jié)點影響力的先驗分析,然后基于用戶綜合影響力TOP-K用戶,計算社區(qū)普通用戶在t+1時刻的牽引力相關(guān)系數(shù),最終實現(xiàn)意見領(lǐng)袖精準(zhǔn)識別。通過與傳統(tǒng)意見領(lǐng)袖挖掘算法進(jìn)行對比驗證,證明了該模型在動態(tài)網(wǎng)絡(luò)環(huán)境中,具有相對較高的覆蓋率與支持率。然而,考慮到復(fù)雜社會性網(wǎng)絡(luò)中意見領(lǐng)袖的時空特性,未來可從話題與意見領(lǐng)袖聯(lián)合演化,意見領(lǐng)袖動態(tài)興趣識別等角度,提升算法的魯棒性。