亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社交網(wǎng)絡傳播節(jié)點影響力建模分析

        2016-05-25 00:37:18朱曉明王直杰
        電子設計工程 2016年23期
        關鍵詞:影響力社交節(jié)點

        朱曉明,王直杰

        (東華大學 上海 201620)

        社交網(wǎng)絡傳播節(jié)點影響力建模分析

        朱曉明,王直杰

        (東華大學 上海 201620)

        針對現(xiàn)有社交網(wǎng)絡研究未能充分考慮網(wǎng)絡拓撲結構的現(xiàn)狀,通過提取更多的影響轉發(fā)行為的特征因素,利用邏輯斯蒂回歸模型得到用戶間的信息轉發(fā)概率,進而建立完整的網(wǎng)絡拓撲模型。在轉發(fā)預測模型的基礎上,給出網(wǎng)絡節(jié)點的影響力評估指標,并對PageRank算法進行改進。最后通過在數(shù)據(jù)集上的試驗,試驗結果證明給出的拓撲模型能較好的模擬信息在網(wǎng)絡中傳播過程,改進后的PageRank算法能較好的對節(jié)點影響力進行評估和排序。

        微博;用戶影響力;信息傳播;PageRank算法

        信息的快速傳播是社交網(wǎng)絡的最大特點。通過用戶之間的關注及轉發(fā),借助社交網(wǎng)絡的級聯(lián)效應,信息以前所未有的速度在社交網(wǎng)絡中擴散。社交網(wǎng)絡的特性使得每個互聯(lián)網(wǎng)用戶都可以通過信息的傳播影響更多人。

        目前,微博的信息傳播機制研究大多從用戶個體的微觀角度出發(fā),分析用戶個體的信息傳播能力,預測信息的傳播效果。然而,微博作為一種新興的社交工具,其信息傳播是通過眾多個體的信息行為而形成級聯(lián)型的網(wǎng)絡傳播。單一從微觀層面的研究并不能準確描述微博中信息的擴散效應[1]。

        微博影響力的研究大多利用節(jié)點度數(shù)相關的概念去衡量用戶影響力,將影響力簡單等同于粉絲數(shù),這種評估方式忽略了微博網(wǎng)絡的應用特點。因此,有必要對微博網(wǎng)絡中的傳播影響力進行合理定義,分析決定傳播影響力的因素,建立微博網(wǎng)絡的影響力模型,并對用戶影響力進行度量[2]。

        文中以微博這一社交網(wǎng)絡的典型代表作為研究對象,分析其傳播機制并進一步構建微博信息傳播模型和影響力衡量模型。

        1 社交網(wǎng)絡消息傳播模型

        1.1 問題描述

        定義 1(消息轉發(fā)行為預測):在給定微博網(wǎng)絡r,用戶網(wǎng)絡G=(U,E)和歷史轉發(fā)消息集合M的情況下,對用戶微博u轉發(fā)微博r的概率進行預測。

        yu表示用戶u的轉發(fā)行為,取值為0或1,yu=1表明用戶u對消息r進行轉發(fā)。對消息轉發(fā)行為的預測是機器學習中的二分類問題。在給定用戶網(wǎng)絡的情況下,通過對歷史消息集合M進行訓練,可以得到用戶u對微博r的轉發(fā)行為分類結果。邏輯回歸(logistic regression,LR)模型[3]可以在誤差較小的情況下很好的完成分類任務,并且得到概率型的分類結果。在LR模型的基礎上,去建立微博消息轉發(fā)模型。

        1.2 特征提取

        特征的選取將在很大程度上影響轉發(fā)預測的準確性,通過對微博應用特點的分析,影響轉發(fā)行為的因素主要來自微博內容、用戶屬性和網(wǎng)絡關系。接下來對這幾個因素進行特征提取[4]。

        1)微博內容與用戶興趣:微博原文內容與用戶興趣的相似程度可以看作是消息內部對消息傳播起到驅動作用的動力。簡單來說,如果用戶所關注的用戶發(fā)布了一條微博,而這條微博的內容與用戶興趣的相似程度很高,那意味著該用戶轉發(fā)該微博的概率很高。

        2)微博用戶社會關系:在社交網(wǎng)絡中,用戶之間的信息傳播是通過用戶間的轉發(fā)完成的,而轉發(fā)的基礎是關注與被關注。但與此同時,關注和被關注之間的關系是不對等的,被關注者的信息更容易傳播給關注者,而關注者的信息傳播給被關注者的概率更小,除非雙方是相互關注的關系[5]。

        3)微博文本與用戶屬性:基于歷史統(tǒng)計數(shù)據(jù)表明:微博消息的文本特征將對用戶的轉發(fā)行為產生影響。相關研究指出,微博中是否含有Hashtag、URL、@等特殊符號,都影響著用戶的轉發(fā)行為[6]。包含這些符號表明微博內容具有更多的延伸信息,這些延伸信息決定了用戶對微博的接受程度。

        4)受激活次數(shù):社會網(wǎng)絡中,當鄰居節(jié)點頻繁對目標節(jié)點傳遞信息時,目標節(jié)點對該信息的接受程度將相應的發(fā)生變化[7]。因此,可以認為在微博網(wǎng)絡中,當用戶的朋友中轉發(fā)微博的人數(shù)增多時,用戶轉發(fā)微博的傾向性將發(fā)生變化。

        1.3 傳播模型建立

        根據(jù)之前的分析,文中共提取了如表1所示的影響轉發(fā)行為的數(shù)值化特征[8]。其中特征1、2描述興趣相似程度;特征3~9表示社會關系的影響;特征10~15表示文本特征與用戶屬性的影響;特征16為用戶受激活次數(shù)的影響。

        表 1 影響消息轉發(fā)特征列表

        在這些特征中,特征5、10、11、和12采用布爾量表示,0表示否,1表示是,其余特征可以從歷史數(shù)據(jù)集中直接提取。這些特征與轉發(fā)行為呈現(xiàn)出線性關系[9],可以通過訓練得到特征權重,從而建立用戶轉發(fā)行為的概率預測公式:

        其中x表示了微博與用戶的屬性集合,F(xiàn)(r,G)為影響用戶u轉發(fā)行為的特征集合,ω為權值向量,權值的獲取利用極大似然函數(shù)的方法,對用戶u利用N條歷史記錄微博數(shù)據(jù)形成訓練集。

        2 社交網(wǎng)絡節(jié)點影響力

        2.1 影響力定義

        微博影響力主要是通過微博用戶間的關系進行體現(xiàn)的,當微博用戶對其他用戶的作用越大,該用戶的影響力也就越大[10]。

        定義 2(微博用戶影響力網(wǎng)絡定義)考慮微博網(wǎng)絡G=(U,E),其中節(jié)點u∈U表示網(wǎng)絡中的所有用戶,邊(u,v)∈E表示用戶u與v之間的關注關系,定義用戶轉發(fā)行為構成的網(wǎng)絡是用戶關系網(wǎng)絡的一個子網(wǎng),即用戶只轉發(fā)來自關注節(jié)點的消息[11]。定義節(jié)點i所關注的節(jié)點集合為:A(i)={j|(i,j)∈E},定義節(jié)點j的粉絲節(jié)點集合:N(j)={i|(i,j)∈E}。

        微博網(wǎng)絡是一個由關注關系形成的信息傳播網(wǎng)絡。依據(jù)這種關注關系可以構建出一個有向網(wǎng)絡[12],建立關注關系矩陣如下:

        其中矩陣元素滿足:

        2.2 影響力關鍵因素

        根據(jù)上述影響力定義,本節(jié)提出了一套評估微博用戶傳播影響力的指標和體系,該體系從用戶面向的信息傳播的受眾廣度、信息傳播的活躍程度、信息的被傳播度3個方面引入指標來評價微博用戶的影響力。

        1)信息傳播度:信息傳播度是指微博用戶發(fā)布一條微博得到的擴散效果,包括擴散范圍、被轉發(fā)數(shù)、被評論數(shù)等等,是一個用戶信息傳播能力的體現(xiàn)。此外,信息傳播度同樣是信息質量的一種體現(xiàn),發(fā)布微博的質量越高,越能吸引粉絲對微博的轉發(fā)及評論行為[13]。

        2)傳播活躍程度:微博是一種廣播式的信息傳播平臺,用戶通過關注的方式來獲取自己感興趣博主所發(fā)布的微博,所有的微博將按照時間的先后順序呈現(xiàn)給用戶,因此,博主發(fā)布微博的頻率越高,激活其粉絲發(fā)生信息行為的機會就越多,相應的用戶傳播影響力也就越高。博主發(fā)布微博的頻率被定義為傳播活躍程度,活躍度可以用單位時間內發(fā)表的微博數(shù)量來表示。

        3)傳播受眾廣度:傳播受眾廣度表示了用戶通過信息行為可以激活的用戶范圍,粉絲數(shù)量及粉絲質量是體現(xiàn)受眾廣度的重要方面。圖1所示的有向圖是一個由6個節(jié)點組成的微博網(wǎng)絡結構示意。

        圖1 微博網(wǎng)絡結構示意圖

        圖中的有向邊表明了用戶間的關注關系,例如用戶 D關注了用 A,則形成了一條由 D指向 A的邊。圖中顯示了用戶A的粉絲數(shù)達到了5個,B、C、E分別有一個粉絲,D、F沒有粉絲,用戶 A相比于其余節(jié)點,其發(fā)布的信息可以迅速的傳播到整個網(wǎng)絡中,因此,用戶 A具有更高的影響力。此外,比較B、C、E 3個用戶,雖然他們的粉絲數(shù)都為1,但由于用戶A關注了 E,E發(fā)布的信息將會被A接收,從而有可能繼續(xù)在網(wǎng)絡中擴散,因此,用戶 E在網(wǎng)絡中的影響力高于用戶B、C。

        可見,用戶的粉絲越多,激發(fā)其他用戶產生信息行為的潛力就越大,越容易影響到其他人,且所花費的代價也越小,反之亦然。同時,粉絲與粉絲之間也不能同等對待,粉絲自身的影響力以及網(wǎng)絡的用戶規(guī)模也是衡量用戶影響力的重要指標。

        2.3 影響力度量算法

        微博中的拓撲結構類似于網(wǎng)頁之間的鏈入鏈出關系,PageRank算法是計算網(wǎng)頁重要性的經(jīng)典算法,可以很好的體現(xiàn)網(wǎng)絡拓撲的影響。因此,本節(jié)將在微博影響力模型的基礎上,融合PageRank算法,提出一種新的微博影響力度量算法MIR(Microblog Influence Rank)[14]。

        根據(jù)上節(jié)分析,得到用戶影響力關聯(lián)網(wǎng)絡,如圖2所示。其中 f(i,j)表示節(jié)點之間的影響權值,用轉發(fā)預測模型的轉發(fā)概率表示。

        圖2 用戶影響力關聯(lián)網(wǎng)絡

        根據(jù)上一節(jié)提出的影響力網(wǎng)絡模型,建立微博中的影響力轉移矩陣,如下所示:

        其中,sij表示用戶i向其關注節(jié)點j的影響力轉移概率,其表達式如下所示:

        A(i)為節(jié)點i的關注節(jié)點集合。

        2.4 MIR算法的提出

        在PageRank算法中,PR(PageRank)值是根據(jù)反向鏈接的數(shù)目均勻分配給相應的關系節(jié)點的,而在微博中,用戶之間的關聯(lián)緊密程度卻是不盡相同的,平均分配PR值無法體現(xiàn)微博網(wǎng)絡中用戶間的影響力關聯(lián)強度。在影響力轉移矩陣的基礎上改進PageRank的算法思想,建立了MIR算法,表達式如下:

        算法中使用MIR值衡量用戶的影響力大小,將所有節(jié)點的初始MIR值設為0.1,通過迭代可以得到所有用戶的MIR值。N(j)是節(jié)點j的粉絲集合,sij是影響力轉移概率,表示節(jié)點i的影響力分配給節(jié)點j的比例因子,體現(xiàn)了節(jié)點j在所有影響節(jié)點i的節(jié)點中所占的比重[15]。

        在MIR算法中,表征用戶影響力的MIR值并不是依靠關注數(shù)目平均分配,而是根據(jù)計算得到的每條邊的影響率權值進行分配,這樣做可以使影響關系更緊密的用戶得到更多的MIR值,通過多次迭代,最終使微博網(wǎng)絡中的影響力度量更加合理。

        MIR算法主要的偽代碼如下所示:

        Input:微博網(wǎng)絡G(V,E),網(wǎng)絡節(jié)點個數(shù)K,迭代次數(shù)M

        2.5 算法結果分析

        為了驗證MIR算法在微博網(wǎng)絡節(jié)點影響力評估的有效性,文中使用新浪微博提供的API接口獲取真實的微博數(shù)據(jù)作為實驗數(shù)據(jù)集,依據(jù)用戶的關注關系獲取了6 302個活躍節(jié)點信息,組成了一個信息傳播網(wǎng)絡,并且獲取了相應節(jié)點在一周時間內所進行的相關信息行為數(shù)據(jù),如發(fā)布、轉發(fā)、評論等。數(shù)據(jù)集的具體描述如表2所示。

        表2 數(shù)據(jù)集描述

        我們運用MIR算法在數(shù)據(jù)集中進行了實證分析,得到的影響力排名前10的節(jié)點如表3所示。

        表3 用戶影響力排序表

        從表3中可以看出,用戶影響力與粉絲數(shù)量具有明顯的正比關系,微博作為一個廣播型的信息擴散平臺,粉絲數(shù)量表明了一個用戶在網(wǎng)絡中的信息受眾群體大小,進而決定了用戶所處的地位。當然,粉絲數(shù)量多少并不是與影響力成絕對正比,從表中還可以看到一些用戶本身粉絲數(shù)量雖然有限,但憑借其發(fā)布微博的數(shù)量優(yōu)勢躋身前十名。這說明在微博中,通過努力的多傳播有價值的信息,同樣可以獲得相當大的影響力[16]。

        3 結 論

        在對微博用戶傳播影響力進行定義的基礎上提出了評估用戶影響力的指標體系,并詳細分析了決定用戶影響力的3大因素,包括用戶粉絲數(shù),活躍度以及信息傳播度,提出了衡量用戶之間影響力關聯(lián)大小的影響率的概念,進而建立了有向加權的微博網(wǎng)絡影響力模型。最后,在影響力模型的基礎上改進用于網(wǎng)頁排序的 PageRank算法,提出了度量微博用戶影響力的MIR算法,能夠基于此算法找出微博影響力大的用戶。

        [1]劉軍.社會網(wǎng)絡分析導論[M].北京:社會科學文獻出版社,2004.

        [2]張腸,路榮,楊青.微博客中轉發(fā)行為的預測研究[J].中文信息學報,2012,26(4):109-114.

        [3]李航.統(tǒng)計機器學習[M].北京:清華大學出版社,2012.

        [4]王曉光.微博客用戶行為特征與關系特征實證分析—以“新浪微博”為例[J].圖書情報工作,2010,54(14):66-70.

        [5]楊長春,俞克非,葉施仁,等.一種新的中文微博社區(qū)博主影響力的評估方法[J].計算機工程與應用,2012,38(25): 229-233.

        [6]王晶,朱珂,汪斌強.基于信息數(shù)據(jù)分析的微博研究綜述[J].計算機應用,2012,32(7):2027-2029,2037.

        [7]Narayanam R,Narahari Y.A shapley value-based approach to discover influential nodes in social networks[J].IEEE Transactions on Automation Science and Engineering,2011,8(1):130-147.

        [8]李英樂,于洪濤,劉力雄.基于SVM的微博轉發(fā)規(guī)模預測方法.計算機應用研究,2013(9):2594-2597.

        [9]張旸,路榮,楊青.微博客中轉發(fā)行為的預測研究[J].中文信息學報,2012,26(4):109-114.

        [10]郭浩,陸余良,王宇,等.基于信息傳播的微博用戶影響力度量[J].山東大學學報:理學版,2012,47(5):1-6.

        [11]陳一帆社交網(wǎng)絡中節(jié)點影響力的評價與優(yōu)化機制研究[D].長沙:中南大學信息科學與工程學院,2014.

        [12]謝婧,劉功申,蘇波,等.社交網(wǎng)絡中的用戶轉發(fā)行為預測[J].上海交通大學學報,2013,47(4):584-588.

        [13]張亞明,唐朝生,李偉鋼.微博機制和轉發(fā)預測研究[J].情報學報,2013,32(8):868-876.

        [14]詹圣君,邵雄凱,劉建舟.一種考慮用戶行為的改進N—PageRank算法[J].計算機技術與發(fā)展,2011,21(8):137-140.

        [15]王琛,陳庶樵.一種改進的微博用戶影響力評價算法[J].信息工程大學學報,2013,14(3):380-384.

        [16]劉志明,劉魯.微博網(wǎng)絡輿情中的意見領袖識別及分析[J].系統(tǒng)工程,2011,29(6):8-9.

        Modeling analysis of the influence of social network communication node

        ZHU Xiao-ming,WANG Zhi-jie
        (Donghua University,Shanghai 201620,China)

        Since the existing studies don't take full consideration of the network topology of social network.In this paper,by extracting more characteristics which will influencethe information transfer behavior,then using logistic regression model to get the probability between two users,thereby establishinga complete network topology model.Base on the information transfer model,then given the influence of the assessment indicators of network nodes,and improve the PageRank algorithm.The test results on the dataset proved that topology model simulate the process of information disseminationin the network very well,and the improved PageRank algorithm can better assess and sort the influence of the nodes.

        microblogging;user influence;information dimension;PageRank algorithm

        TN915.41

        A

        1674-6236(2016)23-0058-04

        2015-11-18稿件編號:201511175

        朱曉明(1992—),男,湖南常德人,碩士研究生。研究方向:復雜網(wǎng)絡。

        猜你喜歡
        影響力社交節(jié)點
        社交之城
        英語世界(2023年6期)2023-06-30 06:28:28
        CM節(jié)點控制在船舶上的應用
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        Analysis of the characteristics of electronic equipment usage distance for common users
        基于AutoCAD的門窗節(jié)點圖快速構建
        社交距離
        你回避社交,真不是因為內向
        文苑(2018年17期)2018-11-09 01:29:28
        天才影響力
        NBA特刊(2018年14期)2018-08-13 08:51:40
        黃艷:最深遠的影響力
        人大建設(2017年11期)2017-04-20 08:22:49
        抓住人才培養(yǎng)的關鍵節(jié)點
        国产成人精品男人的天堂网站| 中国女人内谢69xxxx免费视频| 欧美人与动人物牲交免费观看| 日韩丝袜亚洲国产欧美一区| 国产噜噜亚洲av一二三区| 成人影院视频在线免费观看| 国产精品嫩草99av在线| 人妻在卧室被老板疯狂进入国产| 亚洲大尺度动作在线观看一区| 少妇人妻精品久久888| 国产精品毛片无遮挡| 国产精品.xx视频.xxtv| 少妇无码av无码一区| 91精品国产综合成人| 视频国产精品| av网站韩日在线观看免费| 婷婷精品国产亚洲av麻豆不片| 成人爽a毛片免费视频| 久久人人爽人人爽人人片av麻烦| 日本久久精品免费播放| 精品黄色国产一区二区| 国产电影无码午夜在线播放| 日本在线观看| 黄片在线观看大全免费视频| 最好的99精品色视频大全在线| 99国产精品久久久久久久成人热| 亚洲av综合av国产av| 日韩av中出在线免费播放网站| 国产一区二区黑丝美胸| 亚洲成av人在线播放无码| 少妇高潮潮喷到猛进猛出小说| 成人国产精品999视频| 国产精品每日更新在线观看| 日本高清成人一区二区三区| 中文字幕av中文字无码亚| 国产人在线成免费视频| 欧洲AV秘 无码一区二区三| 国产三级不卡一区不卡二区在线| 日韩人妻无码精品久久久不卡| 国产亚洲精久久久久久无码苍井空| 久久偷拍国内亚洲青青草|