亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶情感傾向的意見領(lǐng)袖發(fā)現(xiàn)算法研究

        2018-12-10 09:13:16汪洋李英娜李川
        軟件導(dǎo)刊 2018年9期
        關(guān)鍵詞:意見領(lǐng)袖

        汪洋 李英娜 李川

        摘要:隨著互聯(lián)網(wǎng)的普及和網(wǎng)絡(luò)信息傳播速度的加快,意見領(lǐng)袖在網(wǎng)絡(luò)信息傳播控制中起到至關(guān)重要的引導(dǎo)作用。針對當前有關(guān)意見領(lǐng)袖的研究方法忽略了網(wǎng)絡(luò)用戶行為與情感傾向之間的關(guān)聯(lián)性,或者只是將回復(fù)次數(shù)當作用戶節(jié)點權(quán)重而進行簡單累加的缺陷,提出一種基于用戶情感傾向的意見領(lǐng)袖發(fā)現(xiàn)算法以提高意見領(lǐng)袖識別的精準度。不僅綜合考慮了回復(fù)者對發(fā)帖者情感傾向,還將回復(fù)文本中大量存在的匿名回帖納入計算,得到實名、匿名相融合的用戶領(lǐng)袖值。以某論壇數(shù)據(jù)設(shè)計實驗,結(jié)果表明,該算法具有更高的識別準確度。

        關(guān)鍵詞:意見領(lǐng)袖;情感傾向;PageRank算法;匿名回帖

        DOIDOI:10.11907/rjdk.181143

        中圖分類號:TP312

        文獻標識碼:A文章編號文章編號:16727800(2018)009009506

        英文標題Study of Opinion Leaders Discovering Algorithm Based on the Emotional Tendency of Users

        --副標題

        英文作者WANG Yang,LI Yingna,LI Chuan

        英文作者單位(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)

        英文摘要Abstract:With the popularity of the Internet and the acceleration of network information dissemination,opinion leaders play a crucial guiding role in dissemination and control of network information.In view of the current research methods about the opinion leader,which ignore the correlation between the behavior and the emotional tendency of network users,and bears the defects of only regarding the reply frequencies as the node weight of users to carry on simple accumulation,a detection algorithm based on the emotional tendency of users is proposed in order to improve the accuracy of recognizing the opinion leaders.The emotional tendency of the respondents to the post is taken into comprehensive consideration and a large number of anonymous replies existed in the response text are included to obtain the value of opinion leaders,which combines the real names and anonyms of users.The result of the experiment based on the data of a forum shows that the proposed algorithm in this paper has higher recognition accuracy.

        英文關(guān)鍵詞Key Words:opinion leaders; emotional tendency; PageRank algorithm; anonymous replies

        0引言

        隨著網(wǎng)絡(luò)的飛速發(fā)展以及網(wǎng)絡(luò)自身具有的匿名性、虛擬性,越來越多的人已習(xí)慣通過論壇、博客、貼吧等網(wǎng)絡(luò)平臺參與社會熱點話題討論。在話題討論互動中,人們對話題的評論和回復(fù)相互影響,但其中影響力差別巨大。人們往往通過用戶發(fā)表的內(nèi)容和質(zhì)量判斷信息可靠性,在群體網(wǎng)絡(luò)結(jié)構(gòu)中相對重要的角色被稱作“意見領(lǐng)袖”。意見領(lǐng)袖可以給用戶不斷提出大量引人關(guān)注的意見,并能夠?qū)ζ渌巧a(chǎn)生一定影響,同時對網(wǎng)絡(luò)營銷戰(zhàn)略實施和社會輿論發(fā)展走向等都起著至關(guān)重要的作用。因此更精準的意見領(lǐng)袖識別既有深遠的社會意義也有極高的商業(yè)價值。

        國內(nèi)外有關(guān)學(xué)者對論壇意見領(lǐng)袖的識別方法研究已經(jīng)取得了一定成果:石矛等[1]提出IDM模型分析及影響力改進算法,計算各通信個體間的相互影響和距離,以簡單量化的方式選取意見領(lǐng)袖,大體上根據(jù)詞語的交集確定選取的精準度,但面對林林總總的中文語義,僅依靠簡單的詞語交集進行信息傳遞很難有效反映用戶真實影響力。胡勇[2]、王玨[3]、蔣翠清等[4]總結(jié)分析了意見領(lǐng)袖的屬性特征,但忽略了不同用戶間的關(guān)聯(lián)性,比如某些用戶發(fā)表的觀點貼和回復(fù)貼數(shù)量龐大,但得到其他用戶的有效回復(fù)卻屈指可數(shù),顯然以該方式得到數(shù)值較大的影響力不客觀。吳渝等[5]綜合考慮了用戶自身影響因素以及用戶間的關(guān)聯(lián)性,但忽視了不同用戶間存在情感關(guān)系交互,故所得結(jié)果也不理想。

        PageRank算法在計算意見領(lǐng)袖時綜合考慮用戶被關(guān)注程度以及自身影響力大小,因而不少學(xué)者青睞于在此算法基礎(chǔ)上進行更深入研究。Haveliwala等[6]基于PageRank算法提出PersonalRank算法,期望通過計算物品節(jié)點相對于某一用戶節(jié)點的相關(guān)性并對其進行有序排列,最終實現(xiàn)物品的智能推送功能。吳凱等[7]通過引入微博特性和貪婪思想,研究分析了微博中影響力最大化問題并提出Weibo Influence Rank算法。

        針對當前有關(guān)意見領(lǐng)袖的研究方法沒有考慮網(wǎng)絡(luò)用戶行為與情感傾向的關(guān)聯(lián)性,或者只是將回復(fù)次數(shù)當作用戶間權(quán)重值進行簡單累加的缺陷,本文提出基于用戶情感傾向的意見領(lǐng)袖發(fā)現(xiàn)方法(Leader Rank Algorithm Based on Sentiment of Users,LASU)。在融合回復(fù)者對發(fā)帖者情感傾向的同時,還考慮到回復(fù)文本中大量存在的匿名用戶,使實名、匿名兩者有機結(jié)合計算最終的領(lǐng)袖值,并通過具體方案驗證本文算法的正確性。

        1相關(guān)工作

        PageRank算法[8]通過分析網(wǎng)頁節(jié)點的網(wǎng)絡(luò)拓撲性質(zhì),衡量該網(wǎng)頁相對于索引中其它網(wǎng)頁的受歡迎程度。用戶之間的聯(lián)系類似于相互鏈接的網(wǎng)頁,頁面被鏈接次數(shù)的多少決定著網(wǎng)頁的重要程度,擁有較多鏈入次數(shù)的頁面具有較高等級,倘若一個頁面被少數(shù)較重要頁面鏈接,則同樣具有較高等級,因此利用PageRank算法規(guī)律計算用戶影響力是可行的。公式表示如下:

        PR(u)=1-d+d∑v∈RuPR(v)N(v)(1)

        其中PR(u)、PR(v)分別是網(wǎng)頁u、v的PageRank值,Ru是鏈接到頁面u的所有頁面集合,N(v)是頁面v對外頁面的鏈接數(shù),d是阻尼系數(shù)。

        吳凱等[7]基于PageRank算法提出WIR(Weibo Influence Rank)算法,公式表示如下:

        WIR(u)=d+(1-d)∑v∈Nu[WIR(v)·Svu](2)

        Svu=I(v,u)∑t∈TvI(v,t)(3)

        其中WIN(u)、WIN(v)分別是用戶u、v的WIR值,Nu是u的粉絲集合,Svu是u占v的影響力比例系數(shù),d是阻尼系數(shù),I(v,u)是v對于u的影響值,迭代方法與PageRank算法相似,最終得到全部用戶影響力值。

        吳渝等[5]通過PageRank算法結(jié)合用戶行為提出UILR(Userinfluencebased Leader Rank algorithm)算法,公式表示如下:

        R(u)=(1-d)+d∑v∈TuR(v)·Wvu(4)

        Wuv=Iu·kvu∑p∈BvIp·kvp(5)

        其中R(u)是用戶u的影響力值,Tu是回復(fù)u的用戶群體,Wvu是u在v的影響力值中所占比例,d是阻尼系數(shù),Iu、Ip分別是u、p的初始影響值,kvu和kvp表示v分別對u、p的回復(fù)次數(shù),Bv是v回復(fù)用戶的集合。

        2基于用戶情感傾向的意見領(lǐng)袖挖掘算法

        2.1算法基本思路

        實際網(wǎng)絡(luò)的意見領(lǐng)袖識別影響用戶的因素錯綜復(fù)雜,在計算過程中往往忽略網(wǎng)絡(luò)用戶行為與情感傾向之間的關(guān)聯(lián),使計算出的領(lǐng)袖值不能真實反映實際情況。本文在沿用吳渝等[5]結(jié)合用戶行為提出的意見領(lǐng)袖挖掘算法的同時,將回復(fù)者的情感值融入計算,還將回復(fù)文本中大量存在的匿名用戶考慮進來,最終得到更加準確的領(lǐng)袖值。該算法的具體過程可描述為以下4步:①提取用戶原始特征信息并計算用戶影響力初值;②計算回復(fù)者主觀情感傾向并構(gòu)建用戶情感傾向值矩陣;③通過用戶之間存在的交互情感關(guān)系計算用戶領(lǐng)袖值;④將匿名用戶納入計算,獲得最終領(lǐng)袖值。意見領(lǐng)袖發(fā)現(xiàn)流程如圖1所示。

        2.2用戶節(jié)點影響力初值計算

        用戶影響力的初值主要包含用戶自身活躍度和他人關(guān)注度,發(fā)帖數(shù)和回復(fù)數(shù)是用戶對話題的觀點和主張,在線時長可反映用戶等級,這些都體現(xiàn)了用戶活躍程度。被回復(fù)數(shù)、被引用數(shù)和被瀏覽數(shù)體現(xiàn)出文本消息在傳播過程中的直接影響力。用戶特征信息提取如圖2所示。

        用戶初始影響力值I的計算方法如下:

        Ia=∑6i=1wiCi,a∈U,∑Ci=1(6)

        其中Ia是節(jié)點a的初始影響力值,wi是圖2中依次排列的用戶特征信息,Ci是對應(yīng)于wi的權(quán)重。

        將上述提取的用戶特征信息進行歸一化處理,使其數(shù)值落在[0,1]范圍內(nèi)。然后利用Saaty的10級重要性等級表和判別矩陣計算特征信息的相對重要性[9],計算提取的用戶特征信息對應(yīng)權(quán)重如表1所示。

        2.3用戶回帖的情感傾向值計算

        本文引入?yún)菨珊獾萚10]的情感分析模型對用戶回貼進行情感傾向分析。為了提高分析效率和精確性,先進行主客觀文本分類,然后運用基于PMI(Pointwise Mutual Information)和知網(wǎng)相融合的方法對詞語情感極性進行計算,并利用上下文關(guān)系求得短語的情感極性,再通過用戶情感傾向值矩陣的構(gòu)建,將極性累加計算回復(fù)貼的情感傾向,得到用戶回帖情感傾向值e。

        2.3.1主客觀文本分類

        提取回帖的情感特征,以計算互信息的方式剔除特征性不強的詞,公式如下:

        |I(f,C1)-I(f,C2)|>θ(7)

        其中f表示文本特性,I是f對于主、客觀類別C1、C2的互信息量,當其大于閾值θ時抽取f。文本特征抽取完畢后,采用樸素貝葉斯分類算法[11]進行主客觀文本分類。

        2.3.2基于PMI和知網(wǎng)相融合的詞語情感極性計算

        基于PMI的詞語情感極性算法,以新詞與選定的基準詞在語料庫同時出現(xiàn)的幾率推斷新詞情感傾向。任意兩個詞W和W′的PMI值計算表達式如下:

        PMI(W,W′)=logP(W&W;′)P(W)P(W′)(8)

        其中P(W)、P(W′)分別是詞W、W′各自單獨出現(xiàn)的概率,P(W&W;′)是W和W′共現(xiàn)的概率。

        假定褒義基準詞記為CWord={cword1,…,cwordn},相對應(yīng)的貶義基準詞記為DWord={dword1,…,dwordn},則對于某個新詞NWord的情感傾向值計算公式為:

        EPMI(NWord)=∑ni=1PMI(NWord,cwordi)-∑ni=1PMI(NWord,dwordi)(9)

        基于知網(wǎng)的詞語情感極性算法主要通過計算新詞與選定的基準詞之間的相似程度推斷新詞情感傾向。引入劉群[12]基于知網(wǎng)詞匯語義相似度計算方法sim(W,W′),假設(shè)W和W′分別有n、m個概念,集合表示為{C11,C12,...C1n}和{C21,C22,...C2m},那么新詞NWord極性計算公式如下:

        EHowNet(NWord)=∑ni=1sim(NWord,cwordi)-∑ni=1sim(NWord,dwordi)(10)

        sim(W,W')=maxi=1...n,j=1...msim(C1i,C2j)(11)

        其中sim(W,W′)代表W與W′的語義相似度。詞語最終的情感傾向值可通過擴展同義詞的方式進行計算,算法步驟如下:

        (1)假定新來詞表示為nword,首先利用知網(wǎng)對其進行同義詞擴展操作,并將經(jīng)過擴展的同義詞集合記為HowNetSimGroup(nword)={word1,word2,…,wordn}。

        (2)計算nword及同義詞與基準詞的相似度,取出最大值MaxSim并與預(yù)設(shè)閾值比較,若大于閾值則按照公式(10)計算新來詞的情感傾向,否則按照公式(9)計算新來詞情感極性。

        2.3.3用戶情感傾向值矩陣構(gòu)建

        文本情感傾向值計算公式如下:

        EPage(pagei)=1m∑ni=1EP(wi)(12)

        其中,EP(wi)表示文本中某一詞語或短語wi的情感傾向值,n、m分別是文本中詞語或者短語和句子的數(shù)目。對其進行歸一化處理,使取值范圍落在[-1,1]之間。

        評論信息通常由一系列的文本組成,用戶之間的回復(fù)次數(shù)一般為多次,因此對用戶i、j的有效評估即為用戶間評論信息情感傾向值的綜合計算,這與實際情況相符[13]。根據(jù)式(12)的計算方法,用戶j對i所發(fā)文本信息的主觀情感傾向值可由以下公式得到:

        Eij=∑eijnij,Eij∈[-1,1],i≠j(13)

        其中∑eij是用戶j對i所發(fā)文本信息的主觀情感傾向值系數(shù)之和,nij是在同一評論下用戶j對i的回復(fù)數(shù)。

        評論回帖者中匿名用戶為數(shù)眾多,甚至遠超過實名用戶回帖數(shù),為了使情感傾向值可以真實反映全體用戶的主觀情感,確保意見領(lǐng)袖識別的精準性,匿名用戶的有效評論數(shù)據(jù)必須考慮在內(nèi)。匿名用戶的主觀情感傾向值計算方法如下:

        Eii=eim(14)

        其中m、ei分別是匿名用戶對用戶i的回帖數(shù)量和主觀情感傾向值。倘若需要評價的用戶數(shù)量為n,則情感傾向矩陣為E={Eij}。

        2.4改進的意見領(lǐng)袖發(fā)現(xiàn)算法

        2.4.1用戶間網(wǎng)絡(luò)鏈接EleaderRank圖模型建立

        本文基于PageRank算法并考慮到用戶間情感傾向值和自身影響力,以用戶節(jié)點出度和入度建立整個網(wǎng)絡(luò)鏈接EleaderRank圖模型?;静襟E如下:①若用戶回復(fù)的帖子來自于自己,不建立節(jié)點間聯(lián)系;②若用戶評論文本無人回應(yīng)或僅本人回復(fù),刪除該節(jié)點;③若用戶信息為空,刪除該節(jié)點;④若用戶A回復(fù)用戶B,則建立A指向B的邊,邊的權(quán)值由回復(fù)次數(shù)和用戶B對A的情感傾向值EAB共同確定。

        2.4.2基于用戶情感傾向的意見領(lǐng)袖發(fā)現(xiàn)算法

        本文借鑒吳渝等[5]引入用戶影響力的意見領(lǐng)袖發(fā)現(xiàn)算法思想,提出基于用戶情感傾向的意見領(lǐng)袖發(fā)現(xiàn)方法,簡稱LASU。若用戶x與用戶y存在交互行為,則LASU算法對于實名用戶x的領(lǐng)袖值計算方法如下:

        Inf(x)=(1-d)+d∑y∈R(x)D(x,y)·Inf(y)(15)

        D(x,y)=I(x)·Eyx·wyx∑r∈R′(y)I(r)·Eyr·wyr(16)

        其中Inf(x)、Inf(y)分別是x、y的用戶領(lǐng)袖值,R(x)、R′(y)分別是在社交平臺上回復(fù)x的用戶群集和全部被y回復(fù)的用戶群集,I(x)、I(r)分別是x和r的初始影響力值,d是評論帖子的概率,取值0.85,Eyx、Eyr分別是回帖者用戶y對于x、r的情感傾向值,可由式(13)計算得出,wyx、wyr分別是y回帖x、r的次數(shù)。

        2.4.3意見領(lǐng)袖值計算過程優(yōu)化

        將匿名用戶和實名用戶共同考慮到意見領(lǐng)袖的計算過程中,此時用戶x的領(lǐng)袖值L(x)可表示為:

        L(x)=λInf(x)+(1-λ)aInf(x)(17)

        aInf(x)=Exx·Inf(x)min(18)

        其中Inf(x)是實名用戶領(lǐng)袖值,aInf(x)是匿名用戶領(lǐng)袖值,Exx是主觀情感傾向值,可由式(14)計算得出,Inf(x)min是由Inf(x)迭代計算出的最小領(lǐng)袖值。

        由上述2.4.1節(jié)建立的圖模型,通過迭代計算獲取各用戶節(jié)點的領(lǐng)袖值aInf。LASU算法描述如下:

        輸入:N個節(jié)點的原始特征信息C,回帖數(shù)w及交互文本數(shù)據(jù),賦值收斂標志ε。

        輸出:用戶情感傾向矩陣E,實名用戶領(lǐng)袖值Inf,用戶領(lǐng)袖值L。

        執(zhí)行步驟如下:

        (1)初始化相應(yīng)參數(shù),將各用戶節(jié)點的領(lǐng)袖值Inf賦值為0.1。

        (2)根據(jù)公式(6)結(jié)合交互文本數(shù)據(jù)得到初始影響力值I。

        (3)通過PMI和知網(wǎng)相融合的情感值計算,根據(jù)公式(12)(13)計算情感傾向矩陣E。

        (4)根據(jù)公式(15)(16)計算全部領(lǐng)袖值Inf。

        (5)將(4)中的所有Inf與前一次計算的Infp依次作差,若|Inf-Infp|<ε則執(zhí)行(7),否則執(zhí)行(6)。

        (6)將每個節(jié)點的Inf賦值給Infp,執(zhí)行(4)。

        (7)按照Inf的遞減順序輸出到集合U,并搜索確定最小領(lǐng)袖值Infmin。

        (8)根據(jù)公式(18)結(jié)合(7)中得到的Infmin依次計算用戶的匿名領(lǐng)袖值aInf。

        (9)根據(jù)公式(17)重新計算各用戶領(lǐng)袖值L并降序輸出。

        3實驗與結(jié)果分析

        3.1實驗數(shù)據(jù)

        本文以貓撲貼貼論壇的“美食廣場”、“奇聞趣事”、“數(shù)碼快訊”、“?;ㄐ2荨?個版塊作為數(shù)據(jù)來源,通過網(wǎng)頁采集器獲取2016年11月-12月的用戶評論數(shù)據(jù)作為實驗數(shù)據(jù)集,獲取的數(shù)據(jù)集共包含貼子數(shù)181 759個,從中過濾出100字以上文本,約有主貼15 000條,回帖167 000條,參與話題討論用戶近10萬人。

        3.2評價指標

        當下國內(nèi)外研究中并沒有一個權(quán)威性、絕對合理的意見領(lǐng)袖評估方法,本文選用的意見領(lǐng)袖評價指標為節(jié)點影響覆蓋率[5],公式表示如下:

        p(k)=∑ki=iL(i)∑Ni=1L(i)(19)

        其中p(k)是前k個節(jié)點的影響覆蓋率,L(i)是N個用戶中排名為i的節(jié)點影響其它節(jié)點的個數(shù)。

        3.3實驗設(shè)計

        本文實驗的軟硬件環(huán)境包括:①CPU:Inter(R) Core(TM)2 i52450M 2.5GHz;②內(nèi)存:4G;③操作系統(tǒng):Win7 64bit;④編程語言:Java1.7。

        實驗方案包括:①預(yù)處理;②實名、匿名用戶權(quán)重系數(shù)選取對算法性能的影響實驗;③本文算法與UILR算法[5]、WIR算法[7]、PR算法[14]的性能對比實驗;④意見領(lǐng)袖識別的準確性對比實驗。

        3.4實驗結(jié)果與分析

        利用LASU算法計算意見領(lǐng)袖時考慮了大量存在的匿名回復(fù)文本,所以匿名用戶的影響力取值所占權(quán)重決定了LASU算法的整體性能。根據(jù)公式(17)結(jié)合節(jié)點影響覆蓋率指標,探究λ的不同取值對LASU算法挖掘效果的影響。選取排名前80的用戶計算影響覆蓋率,實驗結(jié)果如圖3所示。

        在圖3中,橫坐標為λ值,縱坐標表示節(jié)點的影響覆蓋率值,該曲線圖描述的是前80名用戶影響覆蓋率值在不同λ取值下的變化規(guī)律。由該曲線圖可以看出:當λ=0時,用戶領(lǐng)袖值L(x)=aInf(x),LASU算法只考慮匿名回帖者的領(lǐng)袖值;當λ≤0.2時,節(jié)點影響覆蓋率值較小,算法性能也很一般,因為過多地將匿名回帖者對領(lǐng)袖值的影響考慮到意見領(lǐng)袖的計算過程中,造成實名用戶影響削弱,而LASU算法是針對實名用戶構(gòu)建的圖模型,所以導(dǎo)致節(jié)點影響覆蓋率值較低,所獲得的領(lǐng)袖值也無法精準反映實際情況。隨著λ值增大,曲線上升并趨于平穩(wěn),當λ=0.7時,曲線達到峰值,此時算法性能為最佳狀態(tài)。當λ=1時,用戶領(lǐng)袖值L(x)=Inf(x),LASU算法表示只計算實名回帖者的領(lǐng)袖值。因此,在LASU算法與其它算法的對比實驗中,給定λ值為0.7進行計算。

        為了定性評估LASU算法的有效性,比較下列4種算法前100名用戶的影響覆蓋率,實驗結(jié)果如圖4所示。在圖4中,橫坐標為前100名用戶群,縱坐標表示節(jié)點的影響覆蓋率值。LASU算法指本文提出的基于用戶情感傾向的意見領(lǐng)袖挖掘算法,UILR算法[5]指基于用戶影響力的意見領(lǐng)袖算法,WIR算法[7]指基于微博網(wǎng)絡(luò)的影響力算法,PR算法[14]指基于興趣的意見領(lǐng)袖算法。

        由圖4中4種算法的比較可以看出:在前10名用戶群中,LASU算法影響覆蓋率略低于UILR算法,但在更多情況下LASU算法的性能顯著高于另外3種算法,說明將回復(fù)者的情感傾向考慮到意見領(lǐng)袖的計算中,對于算法挖掘的性能提升有顯著影響。此外,圖中顯示W(wǎng)IR算法性能低于其它3種算法,因為本文選取的實驗數(shù)據(jù)以論壇作為站點來源,WIR算法更傾向于處理微博數(shù)據(jù),所以在面對論壇數(shù)據(jù)處理時其精準度受到一定影響。

        4種算法的實驗結(jié)果如表2所示,圖表列舉了算法排名前10的用戶。表中字母A-Q分別表示“在牛A和牛C之間”、“CharmyWrng”、“西湖帥唐僧”、“四書五經(jīng)”、“湑水漁夫”、“JIUZHOU209”、“禪海商道”、“股市游俠2015”、“雨城的小夕”、“ztlovewz”、“Cindy小寶”、“__一夢”、“詹妮娟jenny”、“我辛永狠”、“ty_小千853”、“GomesJustin”、“如果人生源于夢”17位用戶。

        由表3顯然可以看出,用戶N、O、P在話題探討中最為頻繁,這就意味著用戶N、O、P較其余6名用戶具有更大可能性成為“領(lǐng)袖”。結(jié)合表2發(fā)現(xiàn)用戶N存在于算法UILR和WIR結(jié)果中,用戶O、P存在于算法LASU結(jié)果中,實驗結(jié)果表明本文提出的LASU算法在意見領(lǐng)袖計算中具有更高精準度。

        4結(jié)語

        在意見領(lǐng)袖挖掘過程中,用戶情感傾向和匿名回帖是影響意見領(lǐng)袖識別精準度的兩個重要因素。為了提高意見領(lǐng)袖識別精準度,本文對UILR算法加以改進,通過對用戶影響力初值和情感傾向值矩陣的構(gòu)建,計算用戶領(lǐng)袖值,將回復(fù)者的情感傾向和匿名回帖納入領(lǐng)袖值的計算過程中,得到實名、匿名相融合的綜合領(lǐng)袖值。實驗結(jié)果表明本文提出的LASU算法在計算意見領(lǐng)袖時具有更高精準度。

        在意見領(lǐng)袖計算過程中,合理選取收斂值具有一定難度;決定實名、匿名用戶權(quán)重的關(guān)鍵系數(shù)λ值對于本文算法性能影響較大,通過實驗得出λ值取0.7時算法性能達到最佳狀態(tài),在以后的研究中需要采取更合理的方法確定這兩個系數(shù)的值。

        參考文獻參考文獻:

        [1]石矛,方勇,曾祥平,等.IDM模型分析及其影響力改進算法[J].成都信息工程學(xué)院學(xué)報,2008,23(1):6972.

        [2]HU Y,ZHANG C B,WANG Z X,et al.Leader formation model during public opinion formation in internet[J].Journal of Sichuan University:Natural Science Edition,2008,45(2):135139.

        [3]王 玨,曾劍平,周葆華,等.基于聚類分析的網(wǎng)絡(luò)論壇意見領(lǐng)袖發(fā)現(xiàn)方法[J].計算機工程,2011,37(5):4447.

        [4]JIANG C Q,ZHU Y S,DING Y.On discovery of opinion leaders based on UGC[J].Journal of Intelligence,2011,30(10):8285.

        [5]吳渝,馬璐璐,林茂,等.基于用戶影響力的意見領(lǐng)袖發(fā)現(xiàn)算法[J].小型微型計算機系統(tǒng),2015(03):561565.

        [6]HAVELIWALA T H.Topicsensitive PageRank:a contextsensitive ranking algorithm for web search[J].IEEE Transactions on Knowledge & Data Engineering,2003,15(4):784796.

        [7]吳凱,季新生,郭進時,等.基于微博網(wǎng)絡(luò)的影響力最大化算法[J].計算機應(yīng)用,2013,33(8):20912094.

        [8]DUMAIS S T.Latent semantic indexing (LSI),TREC3 report[C].Proceedings of the 3rd Text Retrieval Conference(TREC3),1995:105115.

        [9]DING X F,HU Y,ZHAO W,et al.A study on the characters of the public opinion leader in web BBS[J].Journal of Sichuan University:Engineering Science Edition,2010,42(2):147150.

        [10]吳澤衡.基于話題檢測和情感分析的互聯(lián)網(wǎng)熱點分析與監(jiān)控技術(shù)研究[D].廣州:華南理工大學(xué),2011.

        [11]章棟兵.互聯(lián)網(wǎng)輿情分析關(guān)鍵技術(shù)的研究與實現(xiàn)[D].武漢:武漢理工大學(xué),2010.

        [12]劉群,李素建.基于《知網(wǎng)》的詞匯語義相似度計算[C].臺北:第三屆漢語詞匯語義學(xué)研討會,2002.

        [13]肖宇,許煒,夏霖.一種基于情感傾向分析的網(wǎng)絡(luò)團體意見領(lǐng)袖識別算法[J].計算機科學(xué),2012,39(2):3437.

        [14]ZHAI Z,XU H,JIA P.Identifying opinion leaders in BBS[C].IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology,2008:398.

        責(zé)任編輯(責(zé)任編輯:江艷)

        猜你喜歡
        意見領(lǐng)袖
        微信下大學(xué)生意見領(lǐng)袖的發(fā)展、應(yīng)用及其啟示
        跨境電商平臺的社群形成機理及作用
        傳播學(xué)視角下應(yīng)用型專業(yè)思想政治教育有效性研究
        亞太教育(2016年34期)2016-12-26 21:02:15
        微博動員、維權(quán)倡議與記者的利益表達機制
        新聞界(2016年13期)2016-12-23 14:32:59
        新形勢下高校網(wǎng)絡(luò)文化建設(shè)管理機制研究
        微信營銷意見領(lǐng)袖培養(yǎng)現(xiàn)狀研究
        今傳媒(2016年10期)2016-11-22 11:38:32
        淺析網(wǎng)絡(luò)意見領(lǐng)袖對涉軍輿情的影響及對策
        今傳媒(2016年8期)2016-10-17 23:59:53
        輿論反轉(zhuǎn)研究的文獻綜述
        今傳媒(2016年7期)2016-09-07 00:00:51
        大學(xué)生網(wǎng)絡(luò)意見領(lǐng)袖的特征及其對高校思政教育的影響研究
        “民粹”的利益合謀是如何形成的
        人民論壇(2016年13期)2016-05-28 10:24:51
        国产精品98福利小视频| 亚洲精品国产av天美传媒| 国产午夜福利小视频合集| 91情侣视频| 亚洲一区二区三区资源| 水野优香中文字幕av网站| 午夜福利院电影| 五月综合高清综合网| 性色av手机在线观看| 日韩极品视频免费观看| 亚洲国产欧美日韩欧美特级| 国产精品一区二区暴白浆| 粉嫩av一区二区在线观看| 中文字幕中文字幕在线中二区| 鲁一鲁一鲁一鲁一曰综合网| 日韩毛片在线看| 亚洲免费人成网站在线观看| 中文字幕乱码熟女人妻在线| 无码一区二区三区亚洲人妻 | 亚洲一区二区三区厕所偷拍| 国产区女主播在线观看| 久久久噜噜噜www成人网 | 久久精品中文字幕免费| 日韩精品中文一区二区三区在线 | 黄色毛片视频免费| 日本精品啪啪一区二区| 国产99久久久国产精品~~牛| 日本护士吞精囗交gif| 国产九九在线观看播放| av一区二区在线网站| 国产精品人妻一码二码| 国产香蕉尹人综合在线观| 国产视频一区二区三区在线看 | 全部孕妇毛片丰满孕妇孕交| 91亚洲人成手机在线观看| 自拍偷区亚洲综合激情| 久久久久国产精品| 91麻豆国产香蕉久久精品| 极品少妇一区二区三区四区| 综合亚洲伊人午夜网| 999久久久免费精品国产|