王小紅(陜西省委黨校 陜西 西安 710061)
基于SNA的微博輿情傳播核心節(jié)點分析研究
王小紅
(陜西省委黨校 陜西 西安710061)
負(fù)面網(wǎng)絡(luò)輿情對社會穩(wěn)定具有危害性,因此為了引導(dǎo)輿情良性發(fā)展,快速找到網(wǎng)絡(luò)輿情傳播中的核心節(jié)點是非常重要的。文中以社會網(wǎng)絡(luò)分析為基礎(chǔ),通過對微博信息和微博用戶網(wǎng)絡(luò)結(jié)構(gòu)進行分析,提出一種新穎的網(wǎng)絡(luò)成員重要度評價算法。給出了節(jié)點粉絲影響度的概念,并對節(jié)點粉絲影響度中心度算法進行了改進。實驗分析顯示,文中算法排序精度在整體上高于SNA算法,因而對準(zhǔn)確預(yù)測微博輿情傳播中的核心節(jié)點具有很好的參考價值。
社會網(wǎng)絡(luò)分析;微博;輿情;核心節(jié)點
網(wǎng)絡(luò)輿情(Network Public opinion)是指在互聯(lián)網(wǎng)上流行的對社會問題不同看法的網(wǎng)絡(luò)輿論,是社會輿論的一種表現(xiàn)形式,是通過互聯(lián)網(wǎng)傳播的公眾對現(xiàn)實生活中某些熱點、焦點問題所持有的較強影響力、傾向性的言論和觀點[1]。網(wǎng)絡(luò)開放、便捷、交互為網(wǎng)民營造了良好的交流模式,但負(fù)面輿情如洪水,嚴(yán)重影響居民生活和社會穩(wěn)定。為了減少危害信息對社會穩(wěn)定的影響,輿情研究、特別是對輿情傳播中核心主體的研究迫在眉睫。
網(wǎng)絡(luò)輿情一般發(fā)源于博客、BBS論壇、新聞跟帖、轉(zhuǎn)貼、新聞?wù)搲?、微博等。微博即時、簡潔且可通過多種途徑登陸,深得大眾喜愛。各社會團體、地方政府、企業(yè)、名人都在微博上有自己的陣地,且粉絲眾多,其輿情傳播影響力巨大。因此,對其輿情傳播主體研究具有很重要的現(xiàn)實意義[2]。
為了很快找到微博輿情傳播主體中的核心節(jié)點。傳統(tǒng)社會網(wǎng)絡(luò)分析方法,它根據(jù)某節(jié)點的鏈入節(jié)點數(shù)來判斷該節(jié)點的重要程度。然而粉絲數(shù)可以通過金錢買賣圈到,水軍和僵尸粉的存在使得分析得到的重要節(jié)點往往和真實情況有很大偏差。要克服這一缺陷,更加高效找出微博中的核心節(jié)點,進而找到重要網(wǎng)絡(luò)成員,就必須對原有算法進行改進。
社會網(wǎng)絡(luò)分析[3](Social Network Analysis,SNA)是20世紀(jì)30年代由英國著名人類學(xué)家布朗在對物理學(xué)適應(yīng)性網(wǎng)絡(luò)結(jié)構(gòu)進行研究時提出的。它對心理學(xué),情報學(xué),信息檢索,社會學(xué)等多個領(lǐng)域的發(fā)展研究都起著舉足輕重的作用。現(xiàn)實中個體與個體之間的關(guān)系強弱不一,這種關(guān)系映射在網(wǎng)絡(luò)中,會產(chǎn)生不同的影響。
社會網(wǎng)絡(luò)分析融合了圖論、數(shù)學(xué)、統(tǒng)計等多學(xué)科,已經(jīng)發(fā)展成綜合性結(jié)構(gòu)化方法。利用社會網(wǎng)絡(luò)分析法可以從多個角度對個體網(wǎng)絡(luò)行為分析,比如網(wǎng)絡(luò)位置、角色、結(jié)構(gòu)參數(shù)、凝聚子群等進行分析。目前,社會網(wǎng)絡(luò)分析法已被多行業(yè)采納。
社會網(wǎng)絡(luò)主要由行動者 (Actor),關(guān)系紐帶(Relational Tie),二人組(Dyad),3人組(Triad),子群(Subgroup),群體(Group)這些元素構(gòu)成[3]。行動者指社會個體,可以是一個人、一個團體、一個組織、或是一個國家,在網(wǎng)絡(luò)中用節(jié)點(Node)表示 ;關(guān)系紐帶指社會個體之間的關(guān)系,在網(wǎng)絡(luò)中用節(jié)點之間的連線表示,是多種多樣的,如血緣關(guān)系、工作關(guān)系、競爭關(guān)系等;二人組是僅由兩個節(jié)點組成,是社會網(wǎng)絡(luò)分析的基礎(chǔ);3人組由3個節(jié)點組成;子群是社會個體之間某些相互關(guān)聯(lián)節(jié)點的子集;群體是整個社會網(wǎng)絡(luò)中社會個體的集合。
社會網(wǎng)絡(luò)分析(Social Network Analysis)是一種獨立、結(jié)構(gòu)化的研究方法,主要研究社會網(wǎng)絡(luò)中個體及個體的關(guān)系、網(wǎng)絡(luò)結(jié)構(gòu)、連接模式,以此來反應(yīng)某個節(jié)點在整個網(wǎng)絡(luò)中的作用或是整個社會網(wǎng)絡(luò)之間的關(guān)系。
文中主要分析節(jié)點的重要度,點度中心度指某節(jié)點和其他節(jié)點直接關(guān)聯(lián)越多代表其重要度越高,其在網(wǎng)絡(luò)中處于核心地位的機率就越大。在無向圖中,點度中心度由節(jié)點的度決定,在有向圖中,點度中心度又被分為外向點度中心度和內(nèi)向點度中心度,分別由節(jié)點的入度和出度決定[4]。
網(wǎng)絡(luò)的核心成員一般來自網(wǎng)絡(luò)中的意見領(lǐng)袖或者網(wǎng)絡(luò)大V,他們的言論風(fēng)向作用明顯,極易影響網(wǎng)絡(luò)團體中其它成員的思想,并對言論傳播速度影響極大[5-6]。因此,可以通過意見領(lǐng)袖的言論,使網(wǎng)絡(luò)輿情向積極的方向發(fā)展,所以準(zhǔn)確的找到網(wǎng)絡(luò)核心成員也變得非常重要。
3.1系統(tǒng)總體流程
該系統(tǒng)總體框架如圖1所示。
圖1 系統(tǒng)總體流程圖
網(wǎng)絡(luò)構(gòu)建部分完成樣本選取,基礎(chǔ)圖構(gòu)建(節(jié)點代表用戶,節(jié)點間的關(guān)系表示用戶之間關(guān)注與被關(guān)注),擴展圖構(gòu)建(為了更精確研究基礎(chǔ)圖中的主體,引入其它用戶節(jié)點后構(gòu)建的圖)。基礎(chǔ)圖和擴展圖的構(gòu)建好之后,將表結(jié)構(gòu)存入關(guān)系數(shù)據(jù)庫中,為數(shù)據(jù)采集部分將采集數(shù)據(jù)存入數(shù)據(jù)庫中做好準(zhǔn)備。
數(shù)據(jù)采集部分:首先由爬蟲獲取頁面,包括新浪微博登陸及其之后的數(shù)據(jù)訪問;然后頁面分析模塊對爬取結(jié)果進行分析,提取出需要的數(shù)據(jù)并存入數(shù)據(jù)庫。
網(wǎng)絡(luò)核心成員的發(fā)現(xiàn)與研究部分:在點度中心度研究分析的基礎(chǔ)上,提出基于粉絲影響度的網(wǎng)絡(luò)成員重要度評價算法。該算法核心是對節(jié)點屬性值,粉絲影響度值以及節(jié)點重要度的判定標(biāo)準(zhǔn),最后根據(jù)節(jié)點重要度值來判定圖中節(jié)點的重要程度,重要度越高,則越有可能為網(wǎng)絡(luò)中的核心成員。
3.2基于粉絲影響度的微博成員重要度評價算法
點度中心度算法用節(jié)點的入度數(shù)表示該節(jié)點在網(wǎng)絡(luò)中的重要程度[7]。但在微博實際使用中,節(jié)點入度數(shù)并不能真實反映此節(jié)點是否為真實的核心節(jié)點。因為雖然一個節(jié)點擁有很多粉絲,可它極有可能是花錢買來的僵尸粉,而另外一個節(jié)點可能只有一個粉絲,但這個粉絲節(jié)點是網(wǎng)絡(luò)大V,擁有上千、上萬個粉絲[8-10]。所以,一個影響力高的粉絲的節(jié)點,一定比擁有許多僵尸粉的節(jié)點的重要度高更多。通過分析微博特性可以看出只是用節(jié)點的入度來決定一個節(jié)點重要度的高低,很不合理,文中提出的節(jié)點的重要度,不僅僅由指向它的節(jié)點的數(shù)量來決定,而是由指向它的節(jié)點的粉絲影響度來決定,此法更適合于從微博中尋找網(wǎng)絡(luò)核心成員[11-12]。
3.2.1節(jié)點屬性值
1)節(jié)點絕對屬性值
節(jié)點自身的絕對屬性值是由轉(zhuǎn)發(fā),評論和點贊3個屬性共同決定的[13]:
代表平均轉(zhuǎn)發(fā)量,數(shù)值越高表明此微博被擴散機率大,節(jié)點重要度高。
代表平均被評論量,數(shù)值越高表明此微博成為輿論焦點的幾率越大,博主地位更核心。
代表平均被點贊數(shù),數(shù)值越大表明該微博成為正面輿論焦點的機率越大,博主地位越核心。
w1代表節(jié)點i平均被轉(zhuǎn)發(fā)量的權(quán)重,w2代表節(jié)點i平均被評論量的權(quán)重,w3代表節(jié)點i平均被點贊量的權(quán)重(w1>w2>w3)。
2)節(jié)點相對屬性值
對節(jié)點的絕對屬性值進行歸一化,得到節(jié)點相對屬性值:
其中,Attr(ni)′為節(jié)點i的相對屬性值,p為擴展圖中所有節(jié)點的個數(shù)。
3.2.2節(jié)點的粉絲影響度
通過前面研究發(fā)現(xiàn),一個節(jié)點是否為核心節(jié)點,不僅由粉絲數(shù)量決定,而是由粉絲的屬性值確定。節(jié)點的粉絲影響度由自己所有粉絲節(jié)點的相對屬性值決定:
其中,Imp(ni)為節(jié)點i的粉絲影響度值,Attr(nj)′為節(jié)點i的第j個粉絲節(jié)點的相對屬性值,|fansi|為節(jié)點i的全部粉絲數(shù)。
3.2.3節(jié)點的重要度
基礎(chǔ)圖中,節(jié)點的重要度由關(guān)注自己的節(jié)點的粉絲影響度決定。
1)節(jié)點的絕對重要度:
其中,Sig(ni)為節(jié)點的絕對重要度,|focusi|為基礎(chǔ)圖中指向(關(guān)注)節(jié)點i的節(jié)點數(shù),Imp(nj)為節(jié)點i在基礎(chǔ)圖中第j個關(guān)注者(粉絲)的粉絲影響度。
2)節(jié)點的相對重要度:
其中,Sig(ni)′為節(jié)點i的相對重要度,Sig(ni)為節(jié)點i的絕對重要度,Imp(nj)為節(jié)點j的粉絲影響度,j∈[1,m],m為基礎(chǔ)圖節(jié)點的個數(shù)。
文中實驗樣本為某大學(xué)計算機技術(shù)工碩40位同學(xué)在兩天內(nèi)的新浪微博作為研究對象。分別用基于粉絲影響度的網(wǎng)絡(luò)成員重要度評價算法和社會網(wǎng)絡(luò)分析的點度中心度算法對實驗數(shù)據(jù)進行排序,結(jié)果發(fā)現(xiàn):社會網(wǎng)絡(luò)分析算法進行的排序結(jié)果,40位員工并列到24名便結(jié)束,很不合實際情況。而本文算法排序結(jié)果比較有序,并列的名次只有4個,這種情況也更加的符合實際情況。每次選取排名前n的用戶節(jié)點進行比較,n∈(3,25)。排序精度比較結(jié)果如圖2所示。可以看出本文算法排序精度在整體上高于SNA算法。兩種算法時間排序復(fù)雜度實驗結(jié)果表明,文中方法時間消耗只有0.5 s。綜合來看,文中方法在整體排序效果上有著比較明顯的優(yōu)勢,具有很高的實用價值。
圖2 兩種算法排序精度對比
網(wǎng)絡(luò)時代,為引導(dǎo)輿情良性發(fā)展,需要快速準(zhǔn)確找到微博輿情傳播主體中的核心節(jié)點,文中算法克服了點度中心度算法缺陷,從更高的信息層面來分析節(jié)點的重要度,使分析結(jié)果更加準(zhǔn)確且符合實際情況。實驗結(jié)果顯示,文中方法在一定程度上使節(jié)點的重要度值更加精確。目前,該方法對簡單的微博團體中核心用戶預(yù)測具有很好的實用價值,對網(wǎng)絡(luò)輿論良性化有一定的現(xiàn)實意義。
[1]網(wǎng)絡(luò)輿情定義[EB/OL].http://baike.baidu.com/view/2143779. htm.
[2]袁園,孫霄凌,朱慶華.微博用戶關(guān)注興趣的社會網(wǎng)絡(luò)分析[J].現(xiàn)代圖書情報技術(shù),2012,28(2):60-75.
[3]社會網(wǎng)絡(luò)分析定義 [EB/OL].https://en.wikipedia.org/wiki/ Social_network_analysis.
[4]平亮,宗利永.基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究——以Sina微博為例[J].圖書情報知識,2010(6):90-95.
[5]王曉光.博客社區(qū)內(nèi)的互動交流結(jié)構(gòu):基于評論行為的實證研究[J].新聞與傳播研究,2010(4):45-58.
[6]袁園,孫霄凌,朱慶華.微博用戶關(guān)注興趣的社會網(wǎng)絡(luò)分析[J].現(xiàn)代圖書情報技術(shù),2012,28(2):66-73.
[7]麥藝華.面向中文微博的社會網(wǎng)絡(luò)分析及應(yīng)用[D].廣東:華南理工大學(xué),2012.
[8]宋恩梅,左慧慧.新浪微博中的 “權(quán)威”與 “人氣”:以社會網(wǎng)絡(luò)分析為方法[J].圖書情報知識,2012(3):40-55.
[9]劉志明,劉魯.微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識別及分析[J].系統(tǒng)工程,2011,29(6):6-17.
[10]夏雨禾.微博互動的結(jié)構(gòu)與機制——基于對新浪微博的實證研究[J].新聞與傳播研究,2010(4):55-67.
[11]楊小朋,何躍.騰訊微博用戶的特征分析[J].情報雜志,2012(3):80-87.
[12]陸毅.微博社會網(wǎng)絡(luò)構(gòu)造與分析技術(shù)研究[D].上海:復(fù)旦大學(xué),2011.
[13]康書龍.基于用戶行為及關(guān)系的社交網(wǎng)絡(luò)節(jié)點影響力評價[D].北京:北京郵電大學(xué),2011.
Based on SNA microblogging public opinion transmission core node analysis
WANG Xiao-hong
(Shaanxi Provincial Party School of the CPC,Xi’an 710061,China)
Negative public sentiment is harmful to social stability,so it is important to quickly find core nodes in public sentiment communication network for guiding the benign development of public sentiment.In this paper,a novel algorithm for evaluating the significance of network members is proposed by analyzing micro-blogs and the user structure residing in them based on social network analysis(SNA).The concept of fans'influence of a node is defined,and the node centrality algorithm is also improved for fans'influence.The experiments show that the algorithm proposed in this paper overall has more precise sorting than the traditional SNA algorithm,and therefore has a promising potential for predicting core members in public sentiment communication network.
SNA;micro-blog;public sentiment;central node
TN302
A
1674-6236(2016)11-0001-03
2016-01-27稿件編號:201601247
國家自然科學(xué)基金項目(61372184)
王小紅(1975—),女,陜西寶雞人,講師。研究方向:數(shù)據(jù)挖掘與知識工程。