摘要:"通過分析短視頻網(wǎng)站的視頻轉(zhuǎn)發(fā)數(shù)據(jù),提出一種用戶個體影響力的判斷和計算方法,進行了活躍用戶群體的轉(zhuǎn)發(fā)特征統(tǒng)計實驗,對分析電商用戶行為和社交輿情傳播具有重要意義。結(jié)果表明,高影響力和低影響力個體的粉絲數(shù)和追隨者數(shù)量幾乎沒有相關(guān)性;當(dāng)影響力達到一定值時,粉絲和追隨者的數(shù)量具有強相關(guān)性;高影響力的用戶轉(zhuǎn)發(fā)相同短視頻的頻率一般都比較低,其轉(zhuǎn)發(fā)對象的分布律一般較高。與粉絲互動的頻率因個人認證名人用戶、企業(yè)、媒體機構(gòu)和其他認證用戶的需求而異;當(dāng)短視頻形成廣泛傳播趨勢時,轉(zhuǎn)發(fā)數(shù)量非常接近評論數(shù)量,甚至顯著超過評論數(shù)量,而對評論的答復(fù)數(shù)量與個人影響力之間沒有顯著相關(guān)性。
關(guān)鍵詞:個體影響力""群體行為""關(guān)注者"""粉絲"""傳播行為特征
中圖分類號:TP393.092
Research"on"the"Dissemination"Behavior"Characteristics"Analysis"and"Influence"Judgment"Methods"Based"on"Followers'"Contribution"Quantification
HUANG"Haojing""LU"Fei""CAO"De’an
Guangdong"Open"University(Guandong"Polytechnic"Institute),"School"of"Engineering"and"Technology"Guangzhou,"Guangdong"Province,"510091"China
Abstract:"By"analyzing"video"forwarding"data"from"short"video"websites,"this"paper"proposes"a"method"to"assess"and"calculate"the"individual"influence"of"users,"conductes"a"statistical"experiment"on"the"forwarding"characteristics"of"active"user"groups,"which"is"of"great"significance"for"analyzing"e-commerce"user"behavior"and"social"public"opinion"dissemination."The"results"reveal"that"there"is"virtually"no"correlation"between"the"number"of"fans"and"followers"of"individuals"with"high"or"low"influence;"When"the"influence"reaches"a"certain"threshold,"there"is"a"strong"correlation"between"the"number"of"fans"and"followers;"Users"with"high"influence"generally"exhibit"a"lower"frequency"of"forwarding"the"same"short"video,"yet"their"distribution"of"forwarding"targets"tends"to"be"more"diverse."The"frequency"of"interaction"with"fans"differs"based"on"the"needs"of"individual"verified"celebrity"users,"businesses,"media"organizations,"and"other"verified"entities."When"short"videos"form"a"trend"of"widespread"dissemination,"the"number"of"forwards"is"very"close"to"the"number"of"comments,"or"even"significantly"surpasses"it,"while"there"is"no"significant"correlation"between"the"number"of"replies"to"comments"and"personal"influence.
Key"Words:"Individual"influence;"Group"behavior;"Followers;"Fans;"Dissemination"behavior"characteristics
在短視頻站點中,個體的影響力是個體之間互動產(chǎn)生的相互作用,也是一種個體能夠影響其他個體,使之進行分享、轉(zhuǎn)發(fā)和評論等傳播行為的能力,是造成信息傳播的先決條件之一。具有高影響力的真實用戶個體,在短視頻站點中對信息的傳播有重要的推動作用,一般是信息傳播的源節(jié)點或骨干轉(zhuǎn)發(fā)節(jié)點。如果能準確地判斷用戶的影響力,就能預(yù)測信息的傳播的方向、路徑和范圍,為社會輿論的傳播預(yù)測、企業(yè)的精準營銷策略、主題的傳播范圍等應(yīng)用提供真實有效的數(shù)據(jù)和結(jié)論支持。對群體數(shù)據(jù)深入挖掘和統(tǒng)計分析,是獲得個體興趣愛好與行為規(guī)律的主要方法。本文面向短視頻站點,對于關(guān)注與粉絲群體的數(shù)量、比例、轉(zhuǎn)發(fā)、評論等數(shù)據(jù)進行實證分析,研究群體的傳播行為和過程,總結(jié)出群體行為特征與個體影響力的關(guān)系,分析判斷個體影響力的幾個關(guān)鍵因素,提出了用戶影響力判斷方法,最后進行實驗分析。
1""相關(guān)研究
國內(nèi)外對網(wǎng)絡(luò)個體影響力判斷方法以及對社交信息傳播的影響,進行了豐富而卓有成效的研究。王璿等人[1]提出,影響力最大化的研究,是在某種社交網(wǎng)絡(luò)傳播模型中,如何選取一組種子用戶,使信息通過這些用戶實現(xiàn)最大范圍的傳播?,F(xiàn)有算法主要存在兩個問題:一是由于影響范圍有限,時間復(fù)雜度高,難以適用于大規(guī)模社交網(wǎng)絡(luò);二是僅局限于特定傳播模型,只能解決單一類型社交網(wǎng)絡(luò)下的影響力最大化問題,當(dāng)使用在不同類型社交網(wǎng)絡(luò)上時效果較差。劉小洋等人[2]提出了一種基于局部節(jié)點以及度折扣的社交網(wǎng)絡(luò)節(jié)點影響力推薦系統(tǒng),包括網(wǎng)絡(luò)節(jié)點獲取模塊、計算篩選模塊和擴散推薦模塊,可以用于向節(jié)點進行產(chǎn)品推薦。劉鑫哲等人[3]提出了一個基于圖表示學(xué)習(xí)的框架,可以解決競爭場景下的群體影響力識別問題。張海粟等人[4]融合拓撲勢和因子圖,提出影響力因子圖模型,可以推斷網(wǎng)絡(luò)用戶節(jié)點間影響力,并對每個節(jié)點分配不同影響參數(shù)。葉佳鑫等人[5]提出了一種基于影響力傳播的社交網(wǎng)絡(luò)群推薦方法,綜合考慮個體興趣與其受核心群體影響而產(chǎn)生的興趣,從而進行社交網(wǎng)絡(luò)群推薦服務(wù)。Mikolov"T等人[6]提出一種學(xué)習(xí)網(wǎng)絡(luò)中節(jié)點隱藏表達式的算法,它通過隨機行走模型獲得網(wǎng)絡(luò)中的節(jié)點序列,然后使用Word2Vec的思想將節(jié)點轉(zhuǎn)換為低維向量并用于分類。楊杰等人[7]提出了一種融合覆蓋范圍和結(jié)構(gòu)洞的影響力的最大化算法NCSH,解決了傳統(tǒng)算法只考慮單一的網(wǎng)絡(luò)中心性,沒有綜合考慮節(jié)點特性和網(wǎng)絡(luò)拓撲結(jié)構(gòu)的問題。Thakoor"S等人[8]使用對比學(xué)習(xí)的思想從圖中隨機刪除邊緣,以進行數(shù)據(jù)增強。毋東等人[9]提出了一種基于時間約束的影響力最大化方法。Pandit."S等人[10]提出了在給定鄰居節(jié)點可以相互影響的網(wǎng)絡(luò)中,把一條信息可以分布到k個節(jié)點,可以通過找到k個節(jié)點來最大化信息傳播效果,并通過現(xiàn)有的傳輸模型來判斷信息傳輸量。Jingxuan"L"I等人[11]提出了一種有利于提高信息傳播量并且可擴展的多項式時間算法,其優(yōu)點是它不明顯依賴于任何類型的調(diào)諧參數(shù),還提出了一種用于預(yù)測社交網(wǎng)站用戶的基于連續(xù)時間馬爾可夫過程的動態(tài)信息傳輸模型。
2""群體行為特征數(shù)據(jù)分析
通過分析短視頻站點的用戶群體數(shù)據(jù)后,本文對群體的具體行為數(shù)據(jù)進行研究和分析。研究內(nèi)容包括:對發(fā)送和轉(zhuǎn)發(fā)的短視頻,評論、粉絲和關(guān)注的分布特征等內(nèi)容進行數(shù)據(jù)統(tǒng)計,總結(jié)特征分布的原因和群體的行為規(guī)律。
2.1.1"""群體行為分析
在短視頻站點中,關(guān)注是節(jié)點獲取其他節(jié)點信息的主要方法,當(dāng)A節(jié)點關(guān)注節(jié)點B后,A增加了一個關(guān)注,而B增加了一個粉絲。因此,在節(jié)點數(shù)量不變的情況下,在整個短視頻站點中,關(guān)注與粉絲的總數(shù)量是相等的。
節(jié)點的關(guān)注和粉絲的數(shù)量取決于節(jié)點自身的行為活躍度??砂延脩舾鶕?jù)活躍度和行為分為三類節(jié)點:傳播源點,經(jīng)常更新和發(fā)送短視頻信息,較少關(guān)注或轉(zhuǎn)發(fā)他人信息;傳播節(jié)點,經(jīng)常閱讀關(guān)注傳播源節(jié)點的信息,會轉(zhuǎn)發(fā)其信息;傳播終點,不管是否有閱讀短視頻,均不會轉(zhuǎn)發(fā)信息的節(jié)點。短視頻用戶群體的行為也可以分為兩種:在線瀏覽和發(fā)送短視頻(轉(zhuǎn)發(fā)、評論等)。
通過分析短視頻站點用戶關(guān)注數(shù)量和粉絲數(shù)量的分布發(fā)現(xiàn),短視頻用戶的關(guān)注數(shù)量分布沒有明顯的規(guī)律。產(chǎn)生這種現(xiàn)象的原因是,短視頻用戶之間的關(guān)系是一種單向的興趣鏈接,也就是說用戶只要對其他用戶有社會交往或瀏覽短視頻等興趣,就可以單向鏈接對方,而無須經(jīng)過對方同意,也無須雙方產(chǎn)生相互的興趣。這種拓撲結(jié)構(gòu)導(dǎo)致大量用戶的關(guān)注數(shù)量小于粉絲數(shù)量,其關(guān)注數(shù)量分布在160~450范圍內(nèi),關(guān)注分布近似服從冪律分布。用戶的粉絲數(shù)量基本服從冪律分布,擁有大量粉絲的用戶數(shù)量少,大部分用戶的粉絲數(shù)量并不多;隨著粉絲數(shù)量增加,用戶數(shù)量呈下降趨勢。
對用戶行為特征研究后,發(fā)現(xiàn)用戶觀看短視頻的在線時間越長,關(guān)注數(shù)量發(fā)生變化的概率越大。一般情況下,關(guān)注數(shù)量隨在線時間呈上升趨勢,但用戶在線時間與粉絲數(shù)量的變化并沒有明顯的相關(guān)性。其次,如果用戶經(jīng)常在線發(fā)短視頻,或者轉(zhuǎn)發(fā)其他短視頻;當(dāng)節(jié)點關(guān)注的數(shù)量提高時,粉絲的數(shù)量也會發(fā)生相應(yīng)的變化。因此,可以判斷短視頻的數(shù)量和質(zhì)量與粉絲數(shù)量有強關(guān)聯(lián)性。正常情況下,短視頻數(shù)量大,內(nèi)容質(zhì)量高的用戶,粉絲數(shù)量大。
2.1.2""四類個體行為分析
名人、媒體等高影響力賬號的關(guān)注較少,而粉絲數(shù)量很大,這是短視頻站點作為輿情傳播媒體的重要特征,即高影響力節(jié)點引發(fā)信息傳播。由于明星和媒體的粉絲數(shù)量遠遠大于關(guān)注數(shù)量,引發(fā)信息大面積傳播的概率也大于一般的個人。這些用戶賬號的在線時間較長,發(fā)送、轉(zhuǎn)發(fā)和評論短視頻的數(shù)量多,一般粉絲數(shù)量遠遠大于關(guān)注數(shù)量。大部分用戶賬號在線時,主要以閱讀關(guān)注者的短視頻為主,活躍度低,較少發(fā)送和轉(zhuǎn)發(fā)短視頻,一般粉絲數(shù)量小于關(guān)注數(shù)量。目前,還有一種針對信息傳播或提高帳號等級等行為而創(chuàng)建的賬號,這類賬號通?;钴S度極低,只轉(zhuǎn)發(fā)某些固定的廣告或信息,關(guān)注數(shù)量和粉絲數(shù)量的差距非常大,如表1所示。
關(guān)注和粉絲的比例是判斷一個用戶的影響力的關(guān)鍵因素,可以把短視頻的各種用戶總結(jié)為四類,分別是活躍用戶、普通用戶、僵尸用戶和虛假用戶。一般來說,活躍用戶包括獲得個人認證的明星或普通人帳號、獲得機構(gòu)認證的媒體、企業(yè)帳號、短視頻達人帳號等,他們經(jīng)常發(fā)送或轉(zhuǎn)發(fā)短視頻,是引發(fā)信息大面積傳播的傳播源點,擁有龐大的粉絲數(shù)量和很少的關(guān)注數(shù)量,因此關(guān)注與粉絲的數(shù)量比值非常小,影響力很大。普通用戶主要包括獲得個人認證的用戶賬號、普通的短視頻會員賬號等,以瀏覽短視頻或轉(zhuǎn)發(fā)短視頻為主,有較多的關(guān)注和較少的粉絲,其比值較大,是傳播節(jié)點或傳播終點,引發(fā)信息廣泛傳播的概率較小,影響力低。僵尸用戶是指一些活躍度低,在線時間很少的認證或非認證用戶賬號,關(guān)注和粉絲數(shù)量都很少,其比值與活躍用戶相似,很難引發(fā)信息傳播,影響力很小。虛假用戶以關(guān)注其他用戶和轉(zhuǎn)發(fā)各種廣告信息為主要目的,因此粉絲數(shù)量很少,關(guān)注數(shù)量較大,其比值也大,無法引發(fā)信息傳播,幾乎沒有影響力。
分析結(jié)果表明,影響力大和較小的用戶,粉絲數(shù)量和關(guān)注數(shù)量之間幾乎無相關(guān)性,影響力達到一定的數(shù)值時,粉絲數(shù)量和關(guān)注數(shù)量為強相關(guān)性。
2.1.3"""粉絲數(shù)量和質(zhì)量
部分研究認為,粉絲數(shù)量大,影響力高,粉絲數(shù)量大的節(jié)點,容易在較短的時間達到信息傳播的最大范圍,個體的粉絲數(shù)量是判斷個體影響力的一個重要因素,用戶的粉絲越多,影響力越大。但是近年來,隨著短視頻營銷的流行,越來越多的企業(yè)機構(gòu)或個人利用信息傳播銷售產(chǎn)品或發(fā)送廣告。網(wǎng)上出現(xiàn)了許多刷粉絲、購買粉絲的行為,導(dǎo)致短視頻的虛假用戶和被盜用的僵尸用戶數(shù)量急劇增加。因此,單純計算粉絲數(shù)量無法判斷個體真實的影響力,還需要判斷粉絲的類型和活躍度,只有符合影響力判斷標準的粉絲數(shù)量才能成為計算的有效數(shù)據(jù)。
用戶活躍度是反映用戶參與社交活動的積極程度的指標,也是一種判斷粉絲質(zhì)量的方法。把用戶在短視頻站點中的活躍度定義為單位時間內(nèi)用戶發(fā)表的原創(chuàng)短視頻數(shù)量、轉(zhuǎn)發(fā)短視頻數(shù)量或評論數(shù)量的和。有的用戶經(jīng)常發(fā)送短視頻、與粉絲互動,有的用戶只瀏覽別人的短視頻,自己很少發(fā)送或評論。如果經(jīng)常發(fā)送短視頻或者評論別人的短視頻,證明用戶具備較強的信息傳播能力,在網(wǎng)絡(luò)的活躍度高。
2.1.4""轉(zhuǎn)發(fā)對象分布與轉(zhuǎn)發(fā)頻率
轉(zhuǎn)發(fā)行為是最直接的信息傳播行為,用戶閱讀了感興趣的短視頻后,發(fā)送到自己的短視頻頁面中,也可同時提醒給其他用戶查看。轉(zhuǎn)發(fā)的對象是用戶的關(guān)注者following的短視頻,正常來說,用戶會轉(zhuǎn)發(fā)哪些關(guān)注者是沒有規(guī)律的,其對象的分布是離散的。如果其對象分布相對集中,可能這部分關(guān)注者對用戶產(chǎn)生了較大的影響力。對于虛假用戶,通常呈現(xiàn)出轉(zhuǎn)發(fā)分布高度集中的特點。
一般情況下,用戶只會對感興趣的短視頻轉(zhuǎn)發(fā)一次,不會多次轉(zhuǎn)發(fā)同一條短視頻。用戶多次轉(zhuǎn)發(fā)相同的短視頻,極有可能是發(fā)送廣告等商業(yè)營銷行為。用戶轉(zhuǎn)發(fā)相同的短視頻頻率越高,其身份為虛假用戶或僵尸用戶的可能性越大。這類用戶雖然也會傳播信息,但大多是人為地傳播某種廣告,并不是用戶自發(fā)的信息傳播行為,會嚴重干擾預(yù)測正常的信息傳播和輿論方向。
2.1.5""信息傳播行為分析
當(dāng)個體瀏覽關(guān)注者的短視頻時,如果對這條短視頻產(chǎn)生了興趣相似性或觀點一致性的意見時,用戶可以對該短視頻進行留言評論,或轉(zhuǎn)發(fā)到自己的短視頻主頁。當(dāng)自己的粉絲看到這條短視頻時,也可能做出相同的行為,從而形成了短視頻傳播的過程,這種行為可以稱為信息傳播行為。當(dāng)關(guān)注者看到粉絲的評論或留言,可以對評論進行回復(fù),這就產(chǎn)生了社交互動。關(guān)注者和粉絲頻繁互動有利于強化彼此的友誼以及相互的影響力。
如圖1所示,在粉絲數(shù)量和活躍度較高,短視頻內(nèi)容質(zhì)量高的前提下,用戶發(fā)送短視頻的數(shù)量越大,可能被陌生粉絲轉(zhuǎn)發(fā)和評論的概率和數(shù)量越高。從理論上看,短視頻數(shù)量與被轉(zhuǎn)發(fā)的數(shù)量有成正比的規(guī)律。有趣的是,越是熟悉的人,產(chǎn)生轉(zhuǎn)發(fā)的概率和數(shù)量卻呈下降趨勢。這與易成岐等人[12]的傳播研究得出的結(jié)論一致,越是關(guān)系好和熟悉的人,越容易形成觀點的封閉空間,轉(zhuǎn)發(fā)對方的視頻的概率和數(shù)量都很低。
如圖2所示,明星賬號擁有海量的粉絲,短視頻更新速度快、數(shù)量大,每條短視頻的都會產(chǎn)生大量的評論和轉(zhuǎn)發(fā),但明星很少會回復(fù)一般粉絲的留言和評論。因此,互動中的評論和回復(fù),并沒有明顯的正比關(guān)系。相反,用戶與自己熟悉了解的朋友或認識的人,產(chǎn)生互動的頻率和概率遠遠高于陌生的粉絲,朋友之間的評論與回復(fù)數(shù)量幾乎完全成正比。
3"個體影響力判斷方法設(shè)計
通過對群體行為數(shù)據(jù)分析和研究,決定判斷個體影響力的若干關(guān)鍵因素,設(shè)個體影響力判斷方法如式(1)所示:
其中,設(shè)發(fā)送(含轉(zhuǎn)發(fā))和評論短視頻的行為表示forwording,關(guān)注表示following,粉絲表示follower,N表示行為或節(jié)點的數(shù)量。因此fforwording表示轉(zhuǎn)發(fā)(評論)相同短視頻的頻率,Nforwording表示發(fā)送(評論)短視頻的數(shù)量,dforwording表示最近200次轉(zhuǎn)發(fā)(評論)短視頻的分布率,Nfollowing和Nfollower表示關(guān)注的數(shù)量和粉絲的數(shù)量,兩者的商為關(guān)注節(jié)點與粉絲節(jié)點的比例。Ix表示x用戶個體的影響力,?y"follows"x"."Iay→x表示x的粉絲y對x的影響力貢獻;(1-fforwording).Nforwording表示發(fā)送內(nèi)容不同的短視頻數(shù)量。對于個體x的粉絲y對x的影響力貢獻表示?y"follows"x"."Iay→x。部分研究者認為y的影響力是平均分配給每一個關(guān)注者的。但實際上,粉絲關(guān)注了許多朋友,并不是對所有朋友的關(guān)注程度都一致。短視頻站點為用戶提供了特別關(guān)注功能。該功能可以把用戶希望經(jīng)常關(guān)注的朋友進行分組,并提供快速閱讀特別關(guān)注者的短視頻等功能。設(shè)對每一個關(guān)注者的影響力貢獻為一個數(shù)列,數(shù)列中的每一個數(shù)是對每一個關(guān)注者的影響力貢獻項,如:{yn}="y1,"y2,"y3,"...,yn,...,n為關(guān)注者的數(shù)量。把該影響力貢獻數(shù)列yn=f(n),當(dāng)n趨向于無窮大時,對應(yīng)的yn=f(n)會無限接近于某個確定的數(shù)值。根據(jù)對短視頻站點用戶影響力的研究和極限的定義,數(shù)列f(n)與常數(shù)k有下列關(guān)系:設(shè)k為個體的影響力值當(dāng)對于任意小的給定的正數(shù)q,總存在正整數(shù)N,使得ngt;N時一切均成立,則可以證明影響力貢獻數(shù)列收斂于k。因此,公式可以化為如式(2)所示:
4"實驗分析
根據(jù)前面章節(jié)獲取的短視頻數(shù)據(jù)和總結(jié)的群體行為特點,對個體影響力判斷計算,進行活躍用戶屬性與轉(zhuǎn)發(fā)特點數(shù)據(jù)統(tǒng)計實驗與分析。表2是統(tǒng)計了個體的基本屬性和短視頻轉(zhuǎn)發(fā)的特點,對用戶的影響力進行計算后獲得的用戶影響力排名。統(tǒng)計的個體均為活躍用戶,基本屬性包括短視頻、粉絲和關(guān)注的數(shù)量;轉(zhuǎn)發(fā)特點包括轉(zhuǎn)發(fā)或評論其他用戶的分布律,以及轉(zhuǎn)發(fā)或評論相同短視頻的頻率。如表2所示,數(shù)據(jù)說明,高影響力的個體轉(zhuǎn)發(fā)相同短視頻頻率的一般都比較低,其轉(zhuǎn)發(fā)對象的分布律一般較高。這與高影響力的演員、歌手、CEO和傳媒這些用戶,都是信息的傳播源點有關(guān),他們較少關(guān)注其他用戶,轉(zhuǎn)發(fā)同一條短視頻的可能性非常低;而轉(zhuǎn)發(fā)他人短視頻的行為只集中在少數(shù)熟人或朋友用戶上,因此集中分布律較高。從用戶的基本屬性看,活躍用戶的影響力與短視頻和粉絲的數(shù)量有直接的關(guān)系,而關(guān)注數(shù)量通常較小,說明個體影響力與關(guān)注數(shù)量并無關(guān)聯(lián)。
5""結(jié)論
根據(jù)短視頻用戶群體傳播數(shù)據(jù)分析的結(jié)果,本文提出一種個體影響力判斷及計算方法。該方法以粉絲和關(guān)注的數(shù)量、轉(zhuǎn)發(fā)和評論的數(shù)量,轉(zhuǎn)發(fā)分布律和粉絲對節(jié)點的影響力貢獻為條件,通過影響力貢獻數(shù)列計算粉絲對不同的關(guān)注者不同的影響力貢獻。統(tǒng)計結(jié)果解釋了社交網(wǎng)絡(luò)的群體傳播現(xiàn)象,總結(jié)了個體影響力與活躍用戶自身屬性、轉(zhuǎn)發(fā)特點和粉絲行為的關(guān)系。本方法可以為社會輿論的傳播預(yù)測、企業(yè)的精準營銷策略、主題的傳播范圍等應(yīng)用提供有效的個體影響力量化方法。但是,研究是從活躍個體的傳播行為角度進行分析的,只能說明傳播源節(jié)點自身影響力的部分規(guī)律,下一步還需要從傳播群體的興趣相似性和消息主題的重疊性方面做深入分析才能發(fā)現(xiàn)更多潛在的規(guī)律。
參考文獻