姜偉偉+顧程
1.廣西互聯(lián)網(wǎng)新聞傳播研究中心,廣西南寧 530000 2.上海微趣網(wǎng)絡(luò)科技有限公司,上海 200235
摘 要 當前對社交媒體的研究集中于關(guān)注微博、微信的用戶使用行為分析,缺乏對微博尤其是微博信息實時影響力的動態(tài)性研究。本研究以頁面評級(Page Rank)算法為基礎(chǔ),提出改進的社會評級(Social Rank)算法,結(jié)合用戶微博使用行為分析得出的權(quán)重值,并將時間因素納入微博動態(tài)影響力評估模型之中。通過具體實例探討了微博動態(tài)影響力指數(shù)構(gòu)建的重要性和實用性。研究認為社交媒體中大量數(shù)據(jù)的深度分析與挖掘可以更好地幫助市場營銷以及輿情監(jiān)管部門及時掌握信息的發(fā)展動態(tài),從而更有效地推進品牌傳播和干預(yù)輿論信息的走向。
關(guān)鍵詞 新媒體;微博;信息傳播;動態(tài)影響力
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2017)11-0045-02
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,許多社交平臺也從最初的萌芽逐漸發(fā)展成熟,人與人之間的空間距離得以進一步拉近。特別是微博、微信等社交工具的出現(xiàn),也更進一步地推動了互聯(lián)網(wǎng)的發(fā)展,人們可以借助微博、微信,以及一些移動客戶端隨時進行信息的瀏覽、關(guān)注與分享。大量的信息瀏覽、關(guān)注與分享也產(chǎn)生了大量的數(shù)據(jù),數(shù)據(jù)尤其是實時數(shù)據(jù)的深度分析挖掘可以幫助輿情監(jiān)管部門及時發(fā)現(xiàn)影響力最強的信息,從而有針對性地對其可能產(chǎn)生的負面影響及時進行干預(yù),避免負面信息更大范圍傳播所帶來的負面影響。
互聯(lián)網(wǎng)信息的影響力主要通過信息排序獲取,排序越靠前的信息人們對它的關(guān)注程度越高,影響力也就越大。本研究認為新的微博影響力評估方法應(yīng)強調(diào)信息辨識的問題,并考慮怎樣解決時間因素對于信息影響力衰減的影響,進而實現(xiàn)一個兼顧全面性、及時性和真實性的實時互聯(lián)網(wǎng)信息列表構(gòu)建?;谝陨戏治觯狙芯恳晕⒉┬畔檠芯繉ο?,結(jié)合以往有關(guān)網(wǎng)頁排序的Page Rank算法,在此基礎(chǔ)上提出了Social Rank的計算方法,得到相應(yīng)微博用戶的權(quán)重信息,并將時間因素納入到信息影響力排名計算之中,構(gòu)建了更為合理的微博動態(tài)影響力指數(shù)。
1 基于社會評級(Social Rank)的微博影響力權(quán)重計算
騰訊和新浪微博是中國最主要的2個微博平臺,其各自所擁有的注冊用戶超過3億。用戶與用戶之間通過相互關(guān)注、單方面的關(guān)注或被關(guān)注,不僅可以實現(xiàn)微博使用者資訊獲取或交流的目的,還可以滿足使用者間情感交流的訴求。根據(jù)以往國內(nèi)外學(xué)者的研究,微博使用者所發(fā)布的信息可以在其粉絲群中得到廣泛和迅速的傳播,從而擴大其信息傳播的影響力。微博所具有的傳播快、影響大、覆蓋廣、社會動員能力強等特點,使其在某種程度上成為推動社會發(fā)展的一個重要工具,因此,有效微博影響力的獲取,可以更為準確合理的向公眾傳遞更有價值的信息。
Page Rank近似于一個用戶,是指在互聯(lián)網(wǎng)上隨機地單擊鏈接將會到達特定網(wǎng)頁的可能性。通常,能夠從更多地方到達的網(wǎng)頁更為重要,因此具有更高的網(wǎng)頁排名。每個到其他網(wǎng)頁的鏈接,都增加了該網(wǎng)頁的排名。具有較高排名的網(wǎng)頁一般都是通過更多其他網(wǎng)頁的鏈接而提高的??紤]到Page Rank算法涉及的網(wǎng)頁數(shù)量和網(wǎng)頁鏈接與微博平臺用戶關(guān)系間的相似性,本研究將用戶與用戶之間的鏈接網(wǎng)絡(luò)看作網(wǎng)頁與網(wǎng)頁之間的超鏈接,并由此計算出大部分活躍用戶的社交權(quán)重值,即用戶的Social Rank值。Social Rank的等級范圍介于0到10之間,10級為滿分,SR值越高說明用戶(或信息)越受歡迎(越重要、影響力越大)。例如,SR值為1的用戶表明該用戶不太受歡迎,而SR值為7到10則表明該用戶非常受歡迎(或者說極其重要)。另外,Page Rank方法不僅考慮網(wǎng)頁鏈接數(shù)量,還考慮了網(wǎng)頁質(zhì)量因素,因此,對于Social Rank來說,被權(quán)重高的人關(guān)注(或信息被高權(quán)重的人關(guān)注或分享),微博用戶自身的權(quán)重值也會相應(yīng)提高。
所以一個微博自媒體的Social Rank值是由其他自媒體的Social Rank值計算得到。與Page Rank
算法的原理基本相同,Social Rank剛開始賦予每個微博用戶或者每條微博信息相同的重要性得分,通過迭代遞歸計算來更新每個用戶或信息節(jié)點的Social Rank得分,直到得分穩(wěn)定為止?;诖罅康臄?shù)據(jù)和計算,最終可以獲取每個微博用戶或每條微博信息穩(wěn)定的Social Rank值,通過實際比對,該值可以線性地評估各個微博自媒體賬號及其所發(fā)布信息的傳播價值。從排名計算過程可以看到Social Rank計算的結(jié)果與用戶特征及其所發(fā)布的信息主題是沒有任何關(guān)系的,即該算法是用戶與主題無關(guān)的,因此Social Rank算法能夠較好的獲取微博的影響力。
2 微博實時動態(tài)影響度計算
確定了微博用戶及微博信息影響力的權(quán)重之后,就獲取了微博信息實時影響力測量的基礎(chǔ)。考慮到信息傳播影響度的實用價值性,需要從實時動態(tài)性及最終靜態(tài)性兩個角度測量信息的影響度。
信息的實時動態(tài)性強調(diào)關(guān)注信息傳播過程中實時變化的影響力,微博使用者一條信息發(fā)布后,如果該信息影響力足夠大,那么它可能很快獲取更多受眾的關(guān)注,并且在某種程度上可能會對人們的日常生活產(chǎn)生影響。因此,快速處理最近的消息并同時處理新出現(xiàn)的信息,在很短時間內(nèi)評估出某一時刻信息的傳播影響力,并將其隨時間變化而出現(xiàn)的衰減性特征納入信息影響力分析框架,則可能會更有針對性的對某些不好的信息采取提前干預(yù)的手段,避免其對人們的日常生活產(chǎn)生負面影響。實時動態(tài)性信息影響力的獲取對于網(wǎng)信辦快速發(fā)現(xiàn)重要輿情并快速處理大量輿情相關(guān)信息聚焦輿論關(guān)注點,爭取應(yīng)對時間方面有著較強的實戰(zhàn)意義。對于最終靜態(tài)信息,其測量無需考慮時間的衰減,獲取微博所傳播信息在各新媒體平臺上所達到的最終用戶數(shù)進行累加,即獲取了該微博信息的影響力。由于信息發(fā)布后存在一段時間的衰減性,其衰減時限基本為7天,因此該靜態(tài)值基本可以在信息發(fā)布后的7天后進行測量。
借助數(shù)億個微博使用者歷史數(shù)據(jù)分析,通過Social Rank算法測量出微博使用者的使用權(quán)重函數(shù)后,就可以進一步評估微博信息的傳播影響力。一條信息某段時間內(nèi)在微博自媒體中傳播影響的一個量化的數(shù)值被看作該條信息的時間傳播影響度。實時信息傳播影響度數(shù)值越高,那么這條信息的受眾也就越多,并且該條信息被繼續(xù)擴散的可能性也就越大。因此,實時信息傳播影響力本身是一個相對值,即只有兩條信息比較后才使其具有一定意義,體現(xiàn)出其實用價值。信息實時傳播影響力指標構(gòu)建時涉及到三個主要參數(shù):(1)單位時間內(nèi)轉(zhuǎn)發(fā)的媒體數(shù)增量;(2)每個轉(zhuǎn)發(fā)節(jié)點的Social Rank權(quán)重;(3)發(fā)布時間距離現(xiàn)在的時間。
信息實時傳播影響力指數(shù)計算過程中計入時間的因素,考慮了時間的對信息衰減的作用,更適合表達當前信息的受關(guān)注程度。信息的最終靜態(tài)傳播影響力關(guān)注的則是信息隨時間衰減后的最終影響力,即信息最終達到了多少受眾,影響了多少人群。因此,如果只是計算或評估信息在完整傳播周期中的影響力,可以直接評估信息的最終靜態(tài)傳播影響力,信息傳播的7天周期結(jié)束后,將實時傳播影響力算法理論公式中的時間衰減項剔除后,便可以得到最終靜態(tài)傳播影響力的算法。
由于7天之后可以獲取信息的最終靜態(tài)傳播影響力,與7天之內(nèi)該信息的實時影響力價值相比,其價值有效性或?qū)θ藗內(nèi)粘I畹挠绊懥ο鄬^弱,因此,本研究更關(guān)注信息的實時影響力。
3 結(jié)論
本研究在以往學(xué)者研究的基礎(chǔ)上,結(jié)合互聯(lián)網(wǎng)數(shù)據(jù)采集與大數(shù)據(jù)處理分析技術(shù),對Page Rank網(wǎng)頁排名算法進行改進后,在獲取大量微博使用者及其發(fā)布信息數(shù)據(jù)的基礎(chǔ)上,根據(jù)微博特點設(shè)計了測量微博當前影響力指數(shù)的計算方法并通過計算機實現(xiàn)了快速的數(shù)據(jù)處理計算,以獲取實時的微博影響力信息排名,并對信息進行自動化更新處理,以尋找到當前輿論最關(guān)注的相關(guān)信息。
研究結(jié)合微博信息的實時數(shù)據(jù)通過兩組數(shù)據(jù)的對比發(fā)現(xiàn),將微博發(fā)布時間考慮在內(nèi)的實時微博信息排行能夠更有效地發(fā)現(xiàn)最具影響力的微博信息?;赑age Rank方法所改進的Social Rank微博動態(tài)影響力指數(shù)構(gòu)建考慮了微博用戶與用戶、用戶與信息、信息與信息之間的聯(lián)系,并結(jié)合相應(yīng)微博使用者的影響力以及時間變化的因素,將這些因素共同納入微博信息影響力指數(shù)的構(gòu)建之中,因此可以得到相對準確的信息影響力排名,從而幫助輿情監(jiān)管部門對信息進行有效的監(jiān)管。由于7天的周期會使得信息衰減到一個最終的靜態(tài)排名狀態(tài),而該狀態(tài)更多的依賴于微博用戶自身的用戶權(quán)值,時間并不會對其影響力產(chǎn)生實質(zhì)性的影響,因此,本研究并未對其進行深入探討。實時性信息影響力分析,更有助于為有限人力的互聯(lián)信息辦公室提供幫助,依靠信息技術(shù),實現(xiàn)其高效捕捉高影響力信息進行監(jiān)管的業(yè)務(wù)目標。
參考文獻
[1]劉璐佳.微博影響力的直覺模糊評價方法[J].電腦知識與技術(shù),2011,7(33):8195-8196.
[2]郭林,陳潔,顧程.新媒體信息傳播影響度測量方法的研究[J].軟件產(chǎn)業(yè)與工程,2016(2):51-56.