許寧菲 程生雪 王虎 程艷霞 江長(zhǎng)斌
摘要:社會(huì)化電商中的意見(jiàn)領(lǐng)袖在產(chǎn)品的選擇和購(gòu)買上對(duì)其他用戶產(chǎn)生較大的影響,同時(shí)引導(dǎo)著社區(qū)的話題討論。為了更加準(zhǔn)確識(shí)別社會(huì)化電商中的意見(jiàn)領(lǐng)袖,從網(wǎng)絡(luò)結(jié)構(gòu)的角度出發(fā),借鑒了PageRank算法的基本思想,綜合考慮了用戶的行為特征,基于多指標(biāo)綜合評(píng)價(jià)方法設(shè)計(jì)了ActivityRank算法對(duì)用戶的活躍度進(jìn)行排序,以此識(shí)別意見(jiàn)領(lǐng)袖。據(jù)此,綜合考慮了用戶行為和社會(huì)網(wǎng)絡(luò)結(jié)構(gòu),提高了意見(jiàn)領(lǐng)袖識(shí)別的準(zhǔn)確性。
關(guān)鍵詞:社會(huì)化電商;意見(jiàn)領(lǐng)袖;ActivityRank算法;PageRank算法
中圖分類號(hào):F27文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.1672-3198.2019.15.022
1引言
隨著網(wǎng)購(gòu)用戶的大規(guī)模增長(zhǎng),信息傳播方式從線下到線上的轉(zhuǎn)變,網(wǎng)絡(luò)營(yíng)銷的價(jià)值逐漸得到商家的認(rèn)可和重視,企業(yè)營(yíng)銷信息開(kāi)始利用社交社區(qū)傳播。擁有社會(huì)化特征的社交網(wǎng)絡(luò)結(jié)合了傳統(tǒng)電子商務(wù),慢慢演化成社會(huì)化電子商務(wù)。社會(huì)化電子商務(wù)(Social Commerce)也稱“社交電商”,是傳統(tǒng)電子商務(wù)的一種衍生模式。主要指利用社交媒介和網(wǎng)絡(luò)媒介進(jìn)行傳播,借助社交互動(dòng)、用戶自生內(nèi)容等方式來(lái)促進(jìn)產(chǎn)品的消費(fèi)的一種電子商務(wù)模式。社會(huì)化電子商務(wù)目前主要有三種形式: 基于傳統(tǒng)電商發(fā)展的社區(qū),如淘寶的微淘、網(wǎng)易考拉的種草社區(qū),都是在傳統(tǒng)電商的基礎(chǔ)上發(fā)展起來(lái)的;也有與社交媒體結(jié)合的電商模式,典型的有微博、微信等依靠平臺(tái)進(jìn)行營(yíng)銷的模式;以及社區(qū)與電商同步發(fā)展的第三方社會(huì)化電商平臺(tái),典型的例如小紅書(shū)、蘑菇街等平臺(tái)。
意見(jiàn)領(lǐng)袖在通常意義上理解為可以通過(guò)各種形式對(duì)他人的態(tài)度或者行為產(chǎn)生一定影響甚至改變的個(gè)人。社會(huì)化電商社區(qū)中的意見(jiàn)領(lǐng)袖不僅通過(guò)發(fā)表自身的產(chǎn)品使用感受將產(chǎn)品印象傳達(dá)給更多潛在消費(fèi)者,而且借助其個(gè)人特質(zhì)魅力引領(lǐng)消費(fèi)者的購(gòu)物趨勢(shì),從而對(duì)潛在消費(fèi)者的購(gòu)買決策和品牌認(rèn)知態(tài)度產(chǎn)生影響和改變。報(bào)告《2018年社會(huì)化電子商務(wù)》中的數(shù)據(jù)顯示,社會(huì)化電商的意見(jiàn)領(lǐng)袖在社會(huì)化電商社區(qū)中發(fā)揮著重要作用。 越來(lái)越多的企業(yè)開(kāi)始重視各類社交網(wǎng)絡(luò)中意見(jiàn)領(lǐng)袖的識(shí)別,以期通過(guò)意見(jiàn)領(lǐng)袖引導(dǎo)網(wǎng)絡(luò)信息傳播,達(dá)到最佳的傳播效果。因此,如何正確識(shí)別社會(huì)化商務(wù)平臺(tái)中的意見(jiàn)領(lǐng)袖對(duì)于企業(yè)和平臺(tái)來(lái)說(shuō)都具有重要價(jià)值。
2PageRank算法介紹
在社會(huì)化電商平臺(tái)社區(qū)中,意見(jiàn)領(lǐng)袖通常指在某段時(shí)間內(nèi)具有較大影響力的用戶,因此,如何識(shí)別意見(jiàn)領(lǐng)袖可以轉(zhuǎn)化為如何計(jì)算用戶影響力。目前研究節(jié)點(diǎn)影響力的算法中已經(jīng)存在較多成果,大部分算法基于PageRank算法和HITS算法的基礎(chǔ)上進(jìn)行改進(jìn)。
PageRank是一種衡量網(wǎng)頁(yè)重要度的經(jīng)典算法,最早是由Larry Page和Sergey Brin提出,并且成果應(yīng)用在Google網(wǎng)站。PageRank是基于“被很多高質(zhì)量的網(wǎng)頁(yè)鏈接到的網(wǎng)頁(yè)一定也是高質(zhì)量網(wǎng)頁(yè)” 的回歸關(guān)系,來(lái)判定所有網(wǎng)頁(yè)的重要性。其核心思想有兩點(diǎn):(1)網(wǎng)頁(yè)的重要性由其他網(wǎng)頁(yè)的鏈接數(shù)量衡量,鏈接網(wǎng)頁(yè)的數(shù)量越多說(shuō)明網(wǎng)頁(yè)越重要。(2)如果一個(gè)網(wǎng)頁(yè)被一個(gè)高PageRank值的網(wǎng)頁(yè)鏈接到,那么該網(wǎng)頁(yè)的PageRank值也會(huì)較高。
PageRank算法的基本原理是每個(gè)網(wǎng)頁(yè)都有一個(gè)初始的PR值,通過(guò)鏈接關(guān)系將每個(gè)網(wǎng)頁(yè)的PR值進(jìn)行均勻分,經(jīng)過(guò)反復(fù)迭代之后最終達(dá)到穩(wěn)定收斂的網(wǎng)頁(yè)P(yáng)R值狀態(tài)。如圖1所示,圖中的4個(gè)網(wǎng)頁(yè)存在相互鏈接的關(guān)系。 PR值會(huì)均勻地傳遞給這鏈接到的兩個(gè)網(wǎng)頁(yè),在原有PR值的基礎(chǔ)上增加傳遞過(guò)來(lái)的PR值,同時(shí)將累加的PR值繼續(xù)均勻分配給下一層鏈接到的網(wǎng)頁(yè)。根據(jù)這樣的規(guī)律, PR值多層均勻傳遞最終每個(gè)網(wǎng)頁(yè)都會(huì)有一個(gè)穩(wěn)定的PR值。因此對(duì)于任意網(wǎng)頁(yè)i,它的PageRank值可表示為如公式(1)所示
PRvi=1-dn+d∑vj∈E(vi)PR(vj)N(vj)(1)
PRvi:網(wǎng)頁(yè)vi的PageRank值;
PR(vj):網(wǎng)頁(yè)vj的PageRank值;
N(vj):網(wǎng)頁(yè)vj鏈出到其他網(wǎng)頁(yè)的鏈接數(shù)量;
E(vi):鏈入到網(wǎng)頁(yè)vi的網(wǎng)頁(yè)合集;
n:網(wǎng)絡(luò)中網(wǎng)頁(yè)總數(shù);
d:阻尼系數(shù),通常取0.85,表示用戶在瀏覽某個(gè)網(wǎng)頁(yè)后瀏覽鏈出網(wǎng)頁(yè)的概率,1-dn表示重新選擇一個(gè)隨機(jī)網(wǎng)頁(yè)瀏覽的概率。
3ActivityRank算法構(gòu)建
社會(huì)化電商社區(qū)中,用戶的行為主要有瀏覽筆記、發(fā)布筆記、分享鏈接、評(píng)論、點(diǎn)贊、收藏、關(guān)注等,例如像小紅書(shū) APP,社區(qū)里的用戶主要行為集中在發(fā)表和瀏覽筆記、評(píng)論及回復(fù)等。社區(qū)中的用戶影響力可以結(jié)合用戶之間的互動(dòng)來(lái)進(jìn)行衡量。陳芬融合多種用戶特征,包括影響力、活躍度、專業(yè)性、支持度和傳播力構(gòu)建了系統(tǒng)的網(wǎng)絡(luò)意見(jiàn)領(lǐng)袖識(shí)別指標(biāo)體系,基于新浪微博的真實(shí)數(shù)據(jù)對(duì)意見(jiàn)領(lǐng)袖進(jìn)行識(shí)別。根據(jù)其他學(xué)者的研究,同時(shí)考慮社會(huì)化電子商務(wù)的具體特點(diǎn),創(chuàng)造性系數(shù)可以以用戶發(fā)布內(nèi)容情況表示;互動(dòng)性系數(shù)則以多個(gè)用戶之間的關(guān)注狀況表示;認(rèn)可度系數(shù)通過(guò)用戶發(fā)表內(nèi)容所獲得的點(diǎn)贊和收藏量來(lái)表示,如圖2所示可以將以上系數(shù)轉(zhuǎn)換為社會(huì)化電商社區(qū)中用戶的活躍度,因此分配AR值的依據(jù)就是活躍度。
ActivityRank算法的主要思路是在各個(gè)用戶之間關(guān)注關(guān)系的基礎(chǔ)上,利用用戶的創(chuàng)造性、互動(dòng)性和認(rèn)可度等用戶行為特征指標(biāo)轉(zhuǎn)化成用戶活躍度,利用用戶活躍度來(lái)分配用戶之間 AR值。采取綜合指標(biāo)評(píng)價(jià)的方法同時(shí)考慮多種因素對(duì)用戶節(jié)點(diǎn)活躍度的影響,可以避免均勻分配AR值,使算法更加貼近現(xiàn)實(shí),更加科學(xué)合理。
3.1創(chuàng)造性系數(shù)
社會(huì)化電商社區(qū)中的用戶最主要的動(dòng)作就是發(fā)表和瀏覽,用戶生產(chǎn)的內(nèi)容往往會(huì)影響其在社會(huì)化電商社區(qū)中的影響力。通常用戶發(fā)表的內(nèi)容數(shù)量與其創(chuàng)造力成正比,因此本文的用戶創(chuàng)造力系數(shù)主要用用戶發(fā)表內(nèi)容數(shù)表示。設(shè)社會(huì)化電商社區(qū)的一個(gè)用戶 u,Nu(t0,tw)指用戶u從注冊(cè)時(shí)間t0到tw內(nèi)發(fā)表的內(nèi)容數(shù),則tw時(shí)刻用戶u的創(chuàng)造力系數(shù)Createu如下:
Createu(tw)=Nu(t0,tw)tw-t0(2)
3.2互動(dòng)性系數(shù)
一般來(lái)說(shuō),用戶關(guān)注他人越多,越容易關(guān)注其他用戶的動(dòng)態(tài),粉絲數(shù)越多,其他用戶越可能進(jìn)行交流,互動(dòng)程度越高。設(shè)社會(huì)化電商社區(qū)網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)為用戶u,F(xiàn)ollowut0,tw表示用戶u從注冊(cè)時(shí)間t0到tw內(nèi)關(guān)注其他用戶數(shù)量,F(xiàn)ansu(t0,tw)為用戶u從注冊(cè)時(shí)間t0到tw內(nèi)獲得的粉絲數(shù),其中α和β分別代表用戶u關(guān)注他人數(shù)量和粉絲數(shù)量的權(quán)值系數(shù)。則tw時(shí)刻用戶u互動(dòng)性系數(shù)Interactu如下:
Interactu(tw)=
α·Followut0,tw+β·Fansu(t0,tw)tw-t0(3)
3.3認(rèn)可度系數(shù)
認(rèn)可度系數(shù)可以用用戶每篇發(fā)布內(nèi)容的平均獲贊和收藏的數(shù)量情況,以此來(lái)避免低價(jià)值的高頻內(nèi)容對(duì)最終排名產(chǎn)生的影響。因此,用戶的認(rèn)可度系數(shù)越高,表示用戶發(fā)布的內(nèi)容獲得了越多人的喜愛(ài)和收藏,內(nèi)容質(zhì)量得到的認(rèn)可度越高,具有更大的影響力。設(shè)社會(huì)化電商社區(qū)中的一個(gè)用戶為u,Likeu(t0,tw)為用戶u從注冊(cè)時(shí)間t0到tw內(nèi)發(fā)布內(nèi)容所獲得的點(diǎn)贊數(shù),Collectu(t0,tw)為用戶u從注冊(cè)時(shí)間t0到tw內(nèi)發(fā)布的內(nèi)容獲得的收藏?cái)?shù),Nu(t0,tw)為用戶u在時(shí)間t內(nèi)發(fā)表的內(nèi)容數(shù),則tw時(shí)刻用戶u的發(fā)布內(nèi)容的認(rèn)可度系數(shù)Recognitionu如下:
Recognitionu(tw)=γ·Likeu(t0,tw)+δ·Collectu(t0,tw)Nu(t0,tw)(4)
綜上所述,用戶的創(chuàng)造性系數(shù)、互動(dòng)性系數(shù)和認(rèn)可度系數(shù),均可以反映用戶在社會(huì)化電商社區(qū)中的影響力。 ActivityRank算法中可以看到,用戶的創(chuàng)造性越大、互動(dòng)性越高以及內(nèi)容的認(rèn)可度越高,則用戶在社會(huì)化電商社區(qū)中的活躍度就越大,用戶影響力也越大。因此用戶活躍度的計(jì)算主要分為兩步:每個(gè)指標(biāo)的無(wú)量綱轉(zhuǎn)以及指標(biāo)權(quán)重的計(jì)算。第一步的主要目的是將現(xiàn)實(shí)情況中具有不同計(jì)量單位的指標(biāo)轉(zhuǎn)化成無(wú)量綱的數(shù)據(jù),進(jìn)行標(biāo)準(zhǔn)化處理。第二步的目的是為了科學(xué)衡量每個(gè)指標(biāo)對(duì)用戶活躍度的貢獻(xiàn)。因此在ActivityRank算法中首先將指標(biāo)進(jìn)行歸一化,使最終數(shù)據(jù)取值均為(0,1]。 由于特征數(shù)據(jù)跨度較大,如用戶粉絲數(shù)高的用戶可以達(dá)到百萬(wàn)級(jí)別,低的用戶甚至一個(gè)粉絲都沒(méi)有,因此本文采用對(duì)數(shù)歸一化處理方法。 這種處理方式計(jì)算簡(jiǎn)單、運(yùn)算速度快、處理后數(shù)據(jù)跨度小。 因此社會(huì)化電商社區(qū)中用戶u的活躍度Au的表示方法如下:
Au=ω1·lgCreateulgCreatemax+ω2·lgInteractulgInteractmax+ω3·lgRecognitionulgRecognitionmax(5)
在指標(biāo)權(quán)重的計(jì)算中,一般的我們可以用平均加權(quán)的方法計(jì)算用戶間的影響力,即三者權(quán)重相等。由于本文選取的指標(biāo)采用層次化的分層結(jié)構(gòu),其結(jié)構(gòu)與思想正好與層次分析法相吻合,為了使評(píng)價(jià)模型更加準(zhǔn)確,本文采用層次分析法確定權(quán)重系數(shù)。最終各特征指標(biāo)的權(quán)重向量為(0.11,0.309,0.581)。
現(xiàn)假設(shè)社會(huì)化電商社區(qū)中一個(gè)用戶v關(guān)注m個(gè)用戶,u是被關(guān)注用戶中的一個(gè),則 A(v,u)表示用戶v給用戶u的分配的ActivityRank值的比例,該值由用戶u的活躍度Au來(lái)決定,用戶活躍度的分配計(jì)算公式為
Av,u=Au∑mi=1Ai(6)
則ActivityRank算法如下:
ARu=1-dn+d∑u∈E(u)Av,uAR(v)(7)
從ActivityRank算法的角度來(lái)看,用戶的活躍度越高,表示粉絲對(duì)該用戶的關(guān)注越高,則這個(gè)用戶分配到的AR值越高。相反用戶的活躍度越低,表示粉絲對(duì)該用戶的關(guān)注程序越低,則這個(gè)用戶分配到的AR值越低。ActivityRank算法中可以發(fā)現(xiàn)粉絲對(duì)不同用戶之間的關(guān)注情況有高有低,而具體的關(guān)注程度則可以用用戶的活躍度來(lái)表示。因此ActivityRank算法也更加符合生活中的實(shí)際情況,通常在團(tuán)隊(duì)中我們會(huì)更加關(guān)注活躍度高的用戶。
4實(shí)證分析
本文選取了小紅書(shū)社區(qū)中護(hù)膚分類下隨機(jī)選取的用戶,按照雪球采樣的方法爬取用戶信息以及用戶之間的關(guān)注關(guān)系。對(duì)爬取的用戶信息進(jìn)行處理,將關(guān)注數(shù)與粉絲數(shù)都很少同時(shí)幾乎從未發(fā)布過(guò)筆記的用戶刪除,實(shí)驗(yàn)共抓取了4626個(gè)用戶的信息。將這部分用戶信息進(jìn)行出入度分析,分析結(jié)果顯示這部分用戶的關(guān)注數(shù)量以及粉絲數(shù)量都遵循冪率分布,且具有胖尾特性,表明該社會(huì)網(wǎng)絡(luò)有無(wú)標(biāo)度特性,符合使用社會(huì)網(wǎng)絡(luò)分析方法的條件。
根據(jù)用戶相互之間的關(guān)注情況,生成用戶關(guān)注矩陣。 若用戶A關(guān)注用戶B,則值為1;若用戶A未關(guān)注B,則值為0。ActivityRank算法是根據(jù)用戶關(guān)注關(guān)系來(lái)決定AR值的分配情況。
根據(jù)第一階段中的ActivityRank算法的計(jì)算公式,利用matlab實(shí)現(xiàn) ActivityRank算法,其中阻尼系數(shù) d取值為0.85,在52次迭代運(yùn)行后得到收斂的結(jié)果,用戶的AR值都趨于穩(wěn)定。
根據(jù)ActivityRank算法可以得到用戶活躍度排序,經(jīng)過(guò)ActivityRank值的排序,用戶影響力的評(píng)價(jià)在用戶關(guān)注關(guān)系的基礎(chǔ)上增加了用戶本身的行為特性。排名前十的用戶如表1所示。
從排名中可以看到排名第一的用戶為“林允 Jelly”,其粉絲數(shù)最高,雖然她發(fā)布的筆記不是很多,但是發(fā)布的筆記內(nèi)容大多都以視頻的形式呈現(xiàn),質(zhì)量很高,而且其明星身份加成,獲得了較多的點(diǎn)贊和收藏,因此其ActivityRank值遠(yuǎn)高于其他用戶,活躍度值最高。用戶“Bunny0905”雖然粉絲數(shù)較少,但是她發(fā)布的筆記數(shù)較多,由于其表現(xiàn)相對(duì)較為活躍,排名仍然比粉絲數(shù)更多的后面幾位用戶更高。
5結(jié)論
本文基于 PageRank算法的思想提出 ActivityRank算法,從用戶的創(chuàng)造性、互動(dòng)性和認(rèn)可度幾個(gè)維度綜合計(jì)算用戶活躍度,并利用用戶活躍度進(jìn)行社會(huì)化電商平臺(tái)的意見(jiàn)領(lǐng)袖識(shí)別。意見(jiàn)領(lǐng)袖往往是社會(huì)化電商社區(qū)網(wǎng)絡(luò)中較為活躍的節(jié)點(diǎn)用戶。但是不僅僅依靠用戶的粉絲數(shù)量來(lái)判斷用戶在社會(huì)化電商社區(qū)中的影響力。還要綜合考慮用戶的創(chuàng)造性、互動(dòng)性和認(rèn)可度等因素。 對(duì)于平臺(tái)和商家來(lái)說(shuō),可以發(fā)掘綜合指數(shù)較高的網(wǎng)絡(luò)節(jié)點(diǎn)用戶,培養(yǎng)這批用戶成為社區(qū)內(nèi)的意見(jiàn)領(lǐng)袖。識(shí)別早期的意見(jiàn)領(lǐng)袖,可以借助意見(jiàn)領(lǐng)袖引導(dǎo)社區(qū)的話題,促進(jìn)社區(qū)的交流氛圍。
參考文獻(xiàn)
[1]Travers J,Milgram S.An Experimental Study of the Small World Problem[J].Sociometry,1969,32(4).
[2]Chi S W,Zang J B,Mele A,et al.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps[J].Nature,2009,460(7254).
[3]徐德志,申紅婷.網(wǎng)頁(yè)排名算法及其應(yīng)用[J].貴州大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,(5).
[4]陳芬,陳佩帆,吳鵬,薛春香.融合用戶特征與多級(jí)文本傾向性分析的網(wǎng)絡(luò)意見(jiàn)領(lǐng)袖識(shí)別[J].情報(bào)理論與實(shí)踐,2018,41(07).
[5]吳慧,張紹武,林鴻飛.微博社交網(wǎng)絡(luò)的用戶影響力評(píng)價(jià)方法[J].中文信息學(xué)報(bào),2017,(04).