張建同 褚威超
(同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,上海 200092)
隨著虛擬社區(qū)的日益增長,越來越多的學(xué)者加入到虛擬社區(qū)的研究中。為探究用戶價(jià)值和用戶創(chuàng)利能力,學(xué)者們已經(jīng)從不同的角度對用戶進(jìn)行分類,希冀為社區(qū)制定完善的管理政策。
早期學(xué)者主要以用戶的參與程度為切入點(diǎn)來進(jìn)行用戶分類。Armstrong和 Hagel根據(jù)用戶的參與程度及價(jià)值兩個(gè)維度將用戶劃分為購買者、貢獻(xiàn)者、潛水者、瀏覽者,其中購買者往往被認(rèn)為最有價(jià)值,瀏覽者價(jià)值最低。Kozinets根據(jù)用戶行為和消費(fèi)行為將虛擬社區(qū)的成員定性分為瀏覽者、社交者、貢獻(xiàn)者、內(nèi)部者,但未考慮這兩個(gè)指標(biāo)量化的過程。同時(shí),他也提出虛擬社區(qū)可以通過文化和社會(huì)強(qiáng)化消費(fèi)來提升用戶的忠誠度,使得游覽者和社交者“升級”為貢獻(xiàn)者和內(nèi)部者。Wang和Fesenmaier從用戶參與與用戶貢獻(xiàn)角度出發(fā),通過構(gòu)建結(jié)構(gòu)方程提出了類似的分類,將用戶分為游客、社交者、貢獻(xiàn)者和內(nèi)部者,為旅行社區(qū)提供有關(guān)關(guān)系營銷和品牌建設(shè)的指導(dǎo)意見。
近年來,研究學(xué)者則多從用戶之間的互動(dòng)行為以及用戶發(fā)帖行為等更為細(xì)致的角度出發(fā),且研究的主體大多為社會(huì)化問答社區(qū)。毛波和尤雯雯以發(fā)帖數(shù)、回帖數(shù)、原發(fā)文章、精華數(shù)為衡量指標(biāo),利用層次性聚類與相似性聚類,將知識共享性虛擬社區(qū)成員分為領(lǐng)袖、呼應(yīng)者、瀏覽者、共享者與學(xué)習(xí)者五類,為分析虛擬社區(qū)成員行為模式提供了基礎(chǔ)。彭希羨等用計(jì)量學(xué)的方法,并利用決策樹、相關(guān)性分析和關(guān)聯(lián)規(guī)則對新浪微博的用戶進(jìn)行了分析,基于關(guān)注數(shù)、粉絲數(shù)、微文量將用戶分為8類。陳娟等運(yùn)用層次聚類法構(gòu)建了以粉絲為因變量的Tobit模型,將用戶細(xì)分為信息搜尋型、專家型和自我學(xué)習(xí)型。
除了聚類法、計(jì)量法等,社會(huì)網(wǎng)絡(luò)分析在用戶分類領(lǐng)域中也日趨流行,這主要得益于社會(huì)網(wǎng)絡(luò)分析可以很好地量化用戶之間的互動(dòng)性行為。宮輝和徐渝根據(jù)虛擬社區(qū)用戶關(guān)注與被關(guān)注變量,利用社會(huì)網(wǎng)絡(luò)分析將社區(qū)成員分為精英型、實(shí)力型、活躍型和孤獨(dú)型四類,并為社區(qū)信息傳播改善提出指導(dǎo)意見。何黎等以點(diǎn)度中心度為衡量指標(biāo),篩選出微博中的核心用戶,為構(gòu)建微博社區(qū)提供指導(dǎo)性的意見。Toral等以點(diǎn)出度和中間中心度為指標(biāo),將社區(qū)成員分為外圍用戶、正式成員和社區(qū)成員。徐小龍和黃丹則從虛擬社區(qū)成員的互動(dòng)行為出發(fā),提出了更為詳細(xì)的衡量指標(biāo),分別是主帖量、點(diǎn)入度、點(diǎn)出度、交往規(guī)模、互動(dòng)程度和帖子內(nèi)容。谷斌等從知識共享中心度和用戶價(jià)值出發(fā),利用聚類和社會(huì)網(wǎng)絡(luò)分析將人大經(jīng)濟(jì)論壇分為核心用戶、咨詢者、邊緣用戶、信息獲取者。
此外,社會(huì)網(wǎng)絡(luò)分析在知識共享領(lǐng)域也占據(jù)主要地位。李長玲等為評估企業(yè)內(nèi)部知識的傳播效率,利用社會(huì)網(wǎng)絡(luò)分析中密度、中心勢、小世界分析三個(gè)指標(biāo),從知識共享的網(wǎng)絡(luò)角度對企業(yè)內(nèi)部知識的傳播效率進(jìn)行了分析,通過實(shí)證分析得出,網(wǎng)絡(luò)密度越大,知識交流的密度越大,知識的傳播效率也就越高。劉佩、林如鵬采用內(nèi)容分析和社會(huì)網(wǎng)絡(luò)分析探討知乎用戶的知識共享與知識分享行為,發(fā)現(xiàn)知乎社區(qū)呈現(xiàn)典型的“小世界”網(wǎng)絡(luò)關(guān)系,并根據(jù)分析結(jié)果為社區(qū)提出改善建議,促進(jìn)知識共享效率提升。王忠義等利用社會(huì)網(wǎng)絡(luò)分析和熵權(quán)法分析了知識領(lǐng)袖在網(wǎng)絡(luò)問答社區(qū)中的知識能力和傳播影響力,并根據(jù)網(wǎng)絡(luò)的“小世界”特征,提出了一種基于Cowan模型的知識共享模型,并根據(jù)實(shí)證結(jié)果提出了改善建議,以提升用戶在社會(huì)化問答社區(qū)的學(xué)習(xí)效果。
綜合以上文獻(xiàn),定量分析是當(dāng)下研究的主流趨勢。在用戶分類上,研究學(xué)者多從用戶之間的互動(dòng)性行為角度出發(fā),構(gòu)建詳細(xì)的分類指標(biāo),且分類結(jié)果也愈發(fā)細(xì)致。研究學(xué)者也會(huì)用聚類法、計(jì)量法、社會(huì)網(wǎng)絡(luò)分析進(jìn)行實(shí)證研究,并為社區(qū)提出改善意見??紤]到知乎的固有屬性——知識共享,本文將從知識共享的角度出發(fā),通過網(wǎng)絡(luò)圖和社會(huì)網(wǎng)絡(luò)分析評估當(dāng)今知乎社區(qū)的知識共享現(xiàn)狀,并對知乎用戶進(jìn)行分類,最后為社區(qū)提出一些相應(yīng)的改善意見。
在社會(huì)化網(wǎng)絡(luò)問答社區(qū)中,為了解決分類模型指標(biāo)過于單一的問題,需要從多個(gè)維度對用戶進(jìn)行分類。結(jié)合社會(huì)化問答社區(qū)的特征,用戶在社區(qū)中主要存在兩種關(guān)系:(a)用戶之間的關(guān)系,即用戶知識共享中心度。其建立在用戶間的特征行為上,即點(diǎn)贊、評論、關(guān)注、受關(guān)注等,反映了知識的共享以及傳播情況。(b)用戶與社區(qū)之間的關(guān)系,即用戶價(jià)值。其表現(xiàn)在用戶自身的行為上,即其登錄社區(qū)的頻率、文章數(shù)、提問數(shù)等,反映了用戶的自身價(jià)值。因此,針對社會(huì)化問答社區(qū)的特點(diǎn),本文采用了一個(gè)二維的用戶分類模型,并對各個(gè)維度下具體的指標(biāo)做出了改進(jìn),兩個(gè)維度分別是用戶知識共享中心度和用戶價(jià)值。
用戶知識共享中心度表示用戶之間的知識共享與傳播情況,在虛擬社區(qū)中,它反映了某一用戶成為網(wǎng)絡(luò)中一個(gè)中心的程度。中心度越高的個(gè)體,越有可能是網(wǎng)絡(luò)中的一個(gè)中心,即“意見領(lǐng)袖”,其與更多用戶存在關(guān)系。在社會(huì)網(wǎng)絡(luò)分析中,中心度的指標(biāo)有多種,如點(diǎn)度中心度、中間中心度和接近中心度。基于社會(huì)化問答社區(qū)的特征,本文將選取點(diǎn)度中心度和中間中心度來構(gòu)建用戶知識共享中心度指標(biāo)。具體原因如下:
(1)點(diǎn)度中心度反映了用戶的影響力和權(quán)威性。本文將采用點(diǎn)出度,即用戶的關(guān)注作為具體指標(biāo)。由于點(diǎn)入度(粉絲)往往過于龐大,點(diǎn)出度與其差距較大,因此兩者不宜同時(shí)使用。另外,龐大的數(shù)據(jù)會(huì)使得網(wǎng)絡(luò)圖過于混亂、結(jié)果不夠明顯,因此點(diǎn)入度并不適宜。此外,點(diǎn)出度與點(diǎn)入度相比,前者是主動(dòng)性行為,更具有代表性。
(2)中間中心度則反映了在知識共享途徑上目標(biāo)用戶對其他用戶的控制能力。在虛擬社區(qū)中,一部分用戶可能未和很多用戶建立直接聯(lián)系,但其卻和一些關(guān)鍵的核心用戶有著緊密的聯(lián)系,從而影響到外圍的用戶,發(fā)揮著間接的作用。
RFM模型是典型的傳統(tǒng)用戶價(jià)值模型,Bult和Wansbeek對其做出了如下解釋:(a)最近一次消費(fèi)(R):顧客最近一次的購買行為和分析時(shí)間的間隔天數(shù)。(b)消費(fèi)頻率(F):計(jì)算期內(nèi)顧客購買產(chǎn)品或服務(wù)的次數(shù)。(c)消費(fèi)金額(M):計(jì)算期內(nèi)客戶購買的總金額。
此外,該模型被廣泛應(yīng)用于多個(gè)領(lǐng)域。Tsai和Chiu基于客戶采購產(chǎn)品類型和歷史記錄對用戶進(jìn)行分類,并利用RFM模型分析各類用戶的購買能力,為營銷策略提供依據(jù)。劉偉和丁志慧則將RFM模型應(yīng)用于虛擬社區(qū)中,從而構(gòu)建了LAT模型,該模型的衡量指標(biāo)為近度、頻度、值度。他以五菱車友會(huì)論壇作為實(shí)證對象,利用聚類分析將用戶分為重要成員、瀏覽者、沉沒成員三類。
對于虛擬社區(qū)而言,LAT模型的三項(xiàng)指標(biāo)可以比較好地反映用戶在虛擬社區(qū)的個(gè)人價(jià)值,但其選取的指標(biāo)本質(zhì)上只考慮了用戶的訪問時(shí)間和用戶的貢獻(xiàn)程度兩個(gè)維度。但在社會(huì)化問答社區(qū)中,就知乎而言,用戶還存在獲得感謝數(shù)、獲得贊同數(shù)等指標(biāo),這些指標(biāo)可以很好地反映該用戶被其他用戶認(rèn)可的程度。因此,綜合考慮時(shí)間、文章、獲得贊同數(shù)等指標(biāo),可使得后續(xù)分類更具代表性。但考慮到初始指標(biāo)數(shù)量過多,因此需要對其進(jìn)行因子分析,來選取新的衡量指標(biāo)作為用戶的分類標(biāo)準(zhǔn)。
綜上,用戶在社會(huì)化問答社區(qū)中僅存兩種社會(huì)關(guān)系:(1)用戶之間的關(guān)系;(2)用戶與社區(qū)的關(guān)系。本文將以用戶的關(guān)注行為作為用戶之間關(guān)系的衡量指標(biāo),以用戶的文章數(shù)、專欄數(shù)等作為用戶與社區(qū)關(guān)系的衡量指標(biāo)??紤]到知乎社區(qū)的固有屬性——知識共享,因此將上述兩種關(guān)系定性為用戶知識共享中心度和用戶價(jià)值。每一個(gè)維度下用戶都可以被分為3類,即低、中和高,從而形成3×3的矩陣,共9種類別。但考慮到過多的類別可能會(huì)造成彼此之間的界限過于模糊,且各類別的特征不夠鮮明,因此后續(xù)將對分類結(jié)果做進(jìn)一步完善與優(yōu)化,共得到5種類別。
本文利用Python爬取知乎的用戶數(shù)據(jù)。數(shù)據(jù)爬取的基本思想是從某一用戶(初始用戶)開始,首先獲取他的個(gè)人信息以及他的粉絲和關(guān)注列表,之后二次遞歸遍歷上述列表中每一個(gè)用戶的個(gè)人信息及他們各自的粉絲和關(guān)注列表,并將數(shù)據(jù)存儲到數(shù)據(jù)庫MongoDB中。其中,初始用戶最好具有代表性,即所謂的領(lǐng)袖人物,其延伸開來的社交網(wǎng)絡(luò)在一定程度上可以作為社區(qū)的縮影。這類用戶在社區(qū)中比重很小,但是其往往有很大的粉絲數(shù)。因此,選取的初始用戶要確保其粉絲數(shù)上萬,從而保證爬取到的用戶數(shù)據(jù)量充足且可以較好地反映社區(qū)現(xiàn)狀。在爬取過程中,獲取的用戶信息主要涉及用戶的姓名、用戶類型、關(guān)注列表的姓名等,具體見表1。
表1 用戶的信息列表
第一部分?jǐn)?shù)據(jù)共收集到6624名用戶的個(gè)人信息,截止時(shí)間為2019年4月12日。在該數(shù)據(jù)的基礎(chǔ)上,隨機(jī)選取80位用戶作為獲取第二部分?jǐn)?shù)據(jù)的種子,具體見表2。據(jù)統(tǒng)計(jì),刪除“已注銷”“已重置”“涉嫌違規(guī)”以及use_type為組織(org)的用戶。表2的用戶及其關(guān)注名單累積達(dá)10168名。
表2 選取的80名用戶及其關(guān)注列表的姓名
該部分?jǐn)?shù)據(jù)后續(xù)將用于社會(huì)網(wǎng)絡(luò)分析,用戶作為網(wǎng)絡(luò)圖的節(jié)點(diǎn),用戶之間的“關(guān)注”作為邊。若直接將所有用戶用來構(gòu)建網(wǎng)絡(luò)圖,會(huì)造成節(jié)點(diǎn)數(shù)量過多、網(wǎng)絡(luò)圖過于混亂。因此,需要對網(wǎng)絡(luò)圖進(jìn)行簡化,并保證簡化后的網(wǎng)絡(luò)圖與原網(wǎng)絡(luò)圖有相同的結(jié)構(gòu)。因?yàn)榫W(wǎng)絡(luò)圖中低度節(jié)點(diǎn)比重較大,所以刪除這些節(jié)點(diǎn)可以較好地維持原有的網(wǎng)絡(luò)結(jié)構(gòu)。簡化的方法是不斷刪除點(diǎn)度為1的用戶,再不斷刪除點(diǎn)度小于等于2的用戶,直到某一個(gè)臨界值。公式(1)如下:
(1)
其中,Pc表示移除節(jié)點(diǎn)的臨界百分比,k是平均節(jié)點(diǎn)度。計(jì)算求得原網(wǎng)絡(luò)的Pc為92.78%,因此本文選取的節(jié)點(diǎn)最小度為3,移除了91.5%的節(jié)點(diǎn),簡化后的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為862,即862名用戶。
第二部分?jǐn)?shù)據(jù)在第一部分?jǐn)?shù)據(jù)預(yù)處理的基礎(chǔ)上獲得。通過selenium虛擬瀏覽器遍歷862名用戶的url_token和user_type來訪問其用戶主頁,用作后續(xù)的價(jià)值評估。獲取的信息共計(jì)12個(gè),第一個(gè)為姓名用作標(biāo)識符,截止時(shí)間為2019年9月26日10時(shí),具體見表3其中,近度表示用戶最近1次發(fā)布動(dòng)態(tài)的時(shí)間距離檢測時(shí)間的差值,頻度表示用戶最近7次發(fā)布動(dòng)態(tài)的平均時(shí)間。
表3 從知乎上獲取的初始指標(biāo)
為便于后續(xù)的數(shù)據(jù)分析,除姓名以外,需要對另外11個(gè)指標(biāo)進(jìn)行數(shù)據(jù)預(yù)處理。首先,近度和頻度兩個(gè)指標(biāo)都乘以負(fù)1,使得所有指標(biāo)都滿足數(shù)值越大、用戶價(jià)值越高的準(zhǔn)則。其次,為解決各指標(biāo)量綱不統(tǒng)一問題,對數(shù)據(jù)進(jìn)行歸一化處理。此處采用Z-標(biāo)準(zhǔn)化方法,使得數(shù)值滿足標(biāo)準(zhǔn)正態(tài)分布。公式(2)如下:
(2)
在對數(shù)據(jù)進(jìn)行相應(yīng)的預(yù)處理后,本文將對第一部分?jǐn)?shù)據(jù)(用戶知識共享中心度)進(jìn)行社會(huì)網(wǎng)絡(luò)分析,對第二部分?jǐn)?shù)據(jù)(用戶價(jià)值)進(jìn)行因子分析。
將上述成員關(guān)系矩陣導(dǎo)入U(xiǎn)cinet中,得到用戶之間的知識共享網(wǎng)絡(luò)圖,利用Gephi根據(jù)用戶的點(diǎn)出度大小來設(shè)置節(jié)點(diǎn)的大小和顏色,其中節(jié)點(diǎn)越大,顏色越深,代表其點(diǎn)出度越大,具體見圖1。
圖1 用戶之間的知識共享網(wǎng)絡(luò)圖
由圖1可以看出越突出的節(jié)點(diǎn),表示該用戶與其他用戶共現(xiàn)的次數(shù)越多,即與其他用戶的關(guān)系更為緊密,在知識共享過程中也就起到較為重要的作用。用戶如董峰、Jack tang、學(xué)而時(shí)習(xí)等處于網(wǎng)絡(luò)圖的中間,與其他人的聯(lián)系較多,而在網(wǎng)絡(luò)圖邊緣的用戶與其他用戶的聯(lián)系則較少。
在網(wǎng)絡(luò)圖的分析過程中,第一,從網(wǎng)絡(luò)的角度出發(fā),對該網(wǎng)絡(luò)的集中性進(jìn)行評估。網(wǎng)絡(luò)密度是網(wǎng)絡(luò)集中性很好的衡量指標(biāo),數(shù)值越大,說明該網(wǎng)絡(luò)越具有凝聚力,其信息傳播速度會(huì)越快。通過計(jì)算得出,該網(wǎng)絡(luò)的密度為0.01,遠(yuǎn)遠(yuǎn)小于0.5,因此用戶之間的聯(lián)系不是很緊密,難以實(shí)現(xiàn)有效且快速的知識共享。其主要原因是邊緣用戶與其他用戶之間的聯(lián)系不夠緊密,核心用戶受到的關(guān)注較少。
第二,從點(diǎn)的角度出發(fā),利用一些量化的指標(biāo)來看待網(wǎng)絡(luò)圖,這也使得后續(xù)的分類結(jié)果更為科學(xué)。根據(jù)用戶之間的共現(xiàn)矩陣,分別計(jì)算各個(gè)用戶的點(diǎn)度中心度和中間中心度,并作描述性統(tǒng)計(jì),具體見表4。網(wǎng)絡(luò)平均點(diǎn)度中心度為8.9,即每個(gè)人平均同8.9個(gè)人發(fā)生直接交互,但其標(biāo)準(zhǔn)差為25.4,中間中心度的標(biāo)準(zhǔn)差則更為夸張,達(dá)到了4696.8。這表明在社區(qū)中,用戶的兩極化非常明顯,大多數(shù)用戶之間的聯(lián)系不是很緊密,但都高度集中于個(gè)別核心用戶上。
表4 用戶的點(diǎn)度中心度和中間中心度描述性統(tǒng)計(jì)
點(diǎn)度中心度的冪律分布曲線見圖2,求得回歸曲線公式為y=0.1474x(-1.372),相關(guān)系數(shù)R2為0.8469,因此該曲線的相關(guān)性較好,整個(gè)網(wǎng)絡(luò)符合冪律分布,這進(jìn)一步說明網(wǎng)絡(luò)中的節(jié)點(diǎn)存在帕累托效應(yīng),即大多數(shù)用戶的點(diǎn)度中心度低,少數(shù)用戶的點(diǎn)度中心度高。其中,點(diǎn)度中心度為3的用戶共計(jì)367人,占總?cè)藬?shù)的42.58%;在3~14,用戶的分布數(shù)量急劇下降;而在大于14的區(qū)間中,用戶分布較為平均,差別幾乎不大,且數(shù)量較少。基于此可以推斷出,知識共享的主要形式是從一些核心用戶出發(fā),然后向周圍的一些用戶進(jìn)行擴(kuò)散。這些核心用戶在社區(qū)中往往有著較高的話語權(quán)和地位,他們發(fā)布的評論、提問等會(huì)對其他人造成較大的影響,從而控制知識共享的效率以及方式。因此,識別這些核心用戶對知識共享效率的提升起著至關(guān)重要的作用。
圖2 點(diǎn)度中心度的分布
由上文可以看出,用戶知識共享中心度指標(biāo)主要涉及點(diǎn)度中心度和中間中心度兩個(gè)方面。在數(shù)據(jù)預(yù)處理搭建共現(xiàn)矩陣的時(shí)候,篩選的基準(zhǔn)是共現(xiàn)頻次大于等于3。其次,由前文得出知乎存在帕累托效應(yīng),即“二八原則”。
因此,用戶知識共享中心度高的用戶篩選基準(zhǔn)如下:(a)絕對點(diǎn)度中心度大于3;(b)中間中心度大于80%的分位點(diǎn),即254.881。經(jīng)過篩選后,一共得到167位用戶,占比為19%,這類用戶無論是從點(diǎn)度中心度出發(fā),還是從中間中心度出發(fā),都位于前列,對促進(jìn)社區(qū)知識共享起到較為關(guān)鍵的作用。用戶知識共享中心度低的用戶篩選基準(zhǔn)如下:絕對點(diǎn)度中心度小于等于3,占比43%。這類用戶對于社區(qū)中的知識共享所起的作用微乎其微,但其龐大的數(shù)量是社區(qū)存在的堅(jiān)實(shí)基礎(chǔ)。剩余的用戶則是知識共享中心度為中,占比38%。盡管這一類用戶在知識共享過程中并不占據(jù)主導(dǎo)地位,但隨著時(shí)間的推移,一部分用戶會(huì)慢慢轉(zhuǎn)化成高知識共享中心度用戶,從而起到領(lǐng)袖作用。
將第二部分?jǐn)?shù)據(jù)導(dǎo)入SPSS軟件中選取主成分法進(jìn)行因子分析。對標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),結(jié)果見表5。因?yàn)镵MO值為0.597且Bartlett′s檢驗(yàn)的P值小于0.05,所以可以進(jìn)行因子分析。
表5 KMO 和 Bartlett 的檢驗(yàn)
分析結(jié)果若以特征值大于1為篩選標(biāo)準(zhǔn),則共提取出4個(gè)公共因子,但第四個(gè)公共因子的特征值為1.093,貢獻(xiàn)率只達(dá)到9.934%,接近于原先一個(gè)初始因子的貢獻(xiàn)率,予以剔除。因此,分析結(jié)果中共提取出3個(gè)公共因子,累積貢獻(xiàn)率為63.934%。其中,第一個(gè)公共因子的貢獻(xiàn)率為32.067%;第二個(gè)公共因子的貢獻(xiàn)率為17.372%;第三個(gè)公共因子的貢獻(xiàn)率為14.495%。因子載荷矩陣及其貢獻(xiàn)率見表6。
表6 因子載荷矩陣及貢獻(xiàn)率
為較為直觀地觀察各個(gè)因子中哪些因素的比重較大,對因子載荷矩陣按照最大方差法進(jìn)行旋轉(zhuǎn),結(jié)果見表7。其中,第一個(gè)公共因子主要綜合了獲得感謝數(shù)、獲得收藏?cái)?shù)、獲得贊同數(shù)、粉絲數(shù)四個(gè)變量,故將其概括為用戶的認(rèn)可度;第二個(gè)公共因子主要綜合了想法數(shù)、問題數(shù)、回答數(shù)、專欄數(shù)、文章數(shù)五個(gè)變量,故將其概括為用戶的貢獻(xiàn)度;第三個(gè)公共因子主要綜合了近度和頻度,故將其概括為用戶的黏度,表示用戶對社區(qū)的依賴程度。因此,在用戶價(jià)值維度中,認(rèn)可度、貢獻(xiàn)度、黏度將作為新的衡量指標(biāo)。
表7 旋轉(zhuǎn)因子載荷矩陣
每個(gè)用戶在各個(gè)公共因子下的得分是其評價(jià)的依據(jù),可根據(jù)原始指標(biāo)的標(biāo)準(zhǔn)化數(shù)據(jù)和對應(yīng)的因子載荷得出,公式(3)如下
(3)
其中:Fnj代表第n個(gè)用戶在第j項(xiàng)公共因子的得分;Xni代表第n個(gè)用戶在第i項(xiàng)原始指標(biāo)的標(biāo)準(zhǔn)化數(shù)據(jù);Aij代表第i項(xiàng)原始指標(biāo)在因子載荷矩陣中第j項(xiàng)公共因子的數(shù)值;λj代表第j項(xiàng)公共因子的特征值。
求得所有用戶在三個(gè)衡量指標(biāo)下的得分后,將每一個(gè)指標(biāo)的得分與該指標(biāo)的均值進(jìn)行比較,其結(jié)果可能大于(等于)或小于均值,則三項(xiàng)指標(biāo)分類的情況共有23=8類。其用戶分類準(zhǔn)則如下:若三項(xiàng)指標(biāo)中三項(xiàng)都大于均值,成員的用戶價(jià)值為高,共計(jì)89人。盡管這類用戶數(shù)量較少,但其往往具備深厚的知識底蘊(yùn),為社區(qū)注入了源源不斷的文化知識,并在用戶之間廣為傳閱。若三項(xiàng)指標(biāo)中,有且僅有兩項(xiàng)大于均值,成員的用戶價(jià)值為中,共計(jì)213人,這一類用戶是用戶價(jià)值協(xié)同進(jìn)化中的中堅(jiān)力量,其中有一項(xiàng)低于均值,可能是受注冊時(shí)間的限制。若三項(xiàng)指標(biāo)中,有兩項(xiàng)及以上小于均值,成員的用戶價(jià)值則為低,共計(jì)560人。
根據(jù)用戶知識共享中心度和用戶價(jià)值這兩個(gè)維度,可以初步將用戶分為九類,如表8所示。
表8 用戶分類初步結(jié)果
可以看出,不同類別之間的用戶數(shù)量差距較為懸殊,且彼此之間的界限較為模糊,不能很好地突出各類別用戶的個(gè)性特征。此外,對于虛擬社區(qū)來說,用戶進(jìn)入社區(qū)的時(shí)間先后在很大程度上決定了用戶當(dāng)今所處的位置,所以過多的分類會(huì)使得結(jié)果存在失真的問題。
因此,本文對上述分類結(jié)果進(jìn)行部分合并,最終分類結(jié)果見表9。第一類用戶為核心用戶,即分類1,共計(jì)17人。他們往往是形成知識板塊的領(lǐng)袖人物,不僅有著扎實(shí)的專業(yè)基礎(chǔ),同時(shí)又有著良好的群眾基礎(chǔ),且熱衷于在平臺上分享自己的人生經(jīng)驗(yàn)和知識,是推動(dòng)社區(qū)知識共享的強(qiáng)大動(dòng)力。第二類用戶為詢問者,即分類2和3。這兩類用戶的知識共享中心度為高,但在用戶價(jià)值角度看尚有不足,需要進(jìn)一步提高,共計(jì)149人。他們在社區(qū)中很少發(fā)表自己的看法與意見,卻關(guān)注了很多用戶,形成了密集的社交網(wǎng)絡(luò),以此來了解一些實(shí)時(shí)動(dòng)態(tài),豐富自己的知識。第三類用戶為回答者,即分類4和7,其分類依據(jù)與詢問者類似,共計(jì)72人。這類用戶往往具備一些專業(yè)知識且愿意在知乎上分享自己的問題與見解,也有著比較好的群眾基礎(chǔ),但與其他用戶的互動(dòng)較少,更愿意做一個(gè)知識的發(fā)源地。第四類用戶為潛水者,即分類9,共計(jì)240人。這類用戶往往缺乏專業(yè)知識,且沒有足夠的群眾基礎(chǔ),也不愿意關(guān)注一些核心用戶,探索自己感興趣的內(nèi)容,因此這類用戶往往對社區(qū)的黏度最低,是最容易流失的用戶。第五類用戶為活躍者,即分類5、6和8,該類用戶至少有一項(xiàng)指標(biāo)為中,表明這些用戶有一定的社交基礎(chǔ)或者知識架構(gòu),他們可以看作從潛水用戶向詢問者和回答者過渡的用戶,共計(jì)384人。這類用戶典型的代表現(xiàn)象就是用戶為滿足自身的知識需求,通過關(guān)注一些核心用戶,從而實(shí)時(shí)獲取相關(guān)領(lǐng)域的內(nèi)容。但相較于詢問者和回答者,目前這些用戶尚且并不具備專業(yè)的知識和廣闊的人脈,對于社區(qū)的一些規(guī)則和內(nèi)容還處于摸索階段。但不可否認(rèn)的是,他們是社區(qū)中至關(guān)重要的角色,是知乎社區(qū)進(jìn)化過程中的中堅(jiān)力量,象征著社區(qū)的潛在底蘊(yùn),在一定程度上決定了社區(qū)未來的發(fā)展方向。
表9 用戶分類最終結(jié)果
根據(jù)最后的分類結(jié)果可以看出,在選取的樣本中,活躍者最多,潛水者次之,核心用戶最少。這也進(jìn)一步證實(shí)了知乎社區(qū)中存在典型的二八原則,只有少數(shù)用戶在知乎處于主導(dǎo)地位,對知識的傳播起著關(guān)鍵性作用。但由于潛水者幾乎起不到促進(jìn)知識共享的作用,結(jié)合其龐大的用戶數(shù)量,使得社區(qū)中的知識共享效率大打折扣。不過,大量活躍者的存在在一定程度上證明了知乎社區(qū)的巨大潛力,因此社區(qū)需要制定相應(yīng)的策略對其進(jìn)行激勵(lì),來改善目前社區(qū)中知識共享效率低下的現(xiàn)象。
知乎是一個(gè)社會(huì)化問答社區(qū),它既是一個(gè)社交平臺,也是一個(gè)分享知識的平臺,這是其能夠在眾多虛擬社區(qū)中脫穎而出的關(guān)鍵。隨著知乎的日益成長,越來越多的用戶加入這一個(gè)社區(qū)中,并在社區(qū)中發(fā)布自己的問題與回答。但在新用戶加入的同時(shí),問題也隨之產(chǎn)生。本節(jié)將結(jié)合前文中用戶分類的結(jié)果,分別從用戶角度和社區(qū)角度對社區(qū)提出一些改善方案,以促進(jìn)知識共享。
根據(jù)上文將用戶從用戶知識共享中心度和用戶價(jià)值兩個(gè)維度分成核心用戶、詢問者、回答者、潛水者、活躍者五類的分類結(jié)果,社區(qū)應(yīng)當(dāng)采取不同的應(yīng)對措施來服務(wù)用戶,從而提升知識的傳播效率。對于核心用戶,社區(qū)應(yīng)當(dāng)對其重點(diǎn)維護(hù),為其提供合理的個(gè)性化服務(wù),例如授予核心用戶一些勛章及特權(quán),如“知識大V”等稱號;定期組織一些線下交流會(huì),讓他們面對面地分享自己的知識與人生經(jīng)驗(yàn),增強(qiáng)用戶之間的聯(lián)系,從而可以在一定程度上避免用戶的流失。對于詢問者,社區(qū)可以設(shè)立一定的激勵(lì)措施如積分等促使他們發(fā)表自己的問答與文章等。對于回答者,社區(qū)可以適當(dāng)總結(jié)這些用戶的興趣愛好,結(jié)合推薦系統(tǒng),向這些用戶定期推送一些他們感興趣的優(yōu)秀文章及用戶,增強(qiáng)其互動(dòng)性行為。對于潛水者,社區(qū)可以統(tǒng)計(jì)其相關(guān)的注冊信息,并對一些長期離線的用戶發(fā)送清理通知,減少社區(qū)對其維護(hù)的資源和時(shí)間。同時(shí),社區(qū)也可以發(fā)布一些有價(jià)值的信息,促使這類用戶向活躍者轉(zhuǎn)變。對于活躍者,社區(qū)應(yīng)當(dāng)給予大量的優(yōu)惠政策及獎(jiǎng)勵(lì),如等級制度、板塊冠名等,培養(yǎng)其進(jìn)一步探索社區(qū)的興趣。此外,可以安排一些核心用戶與活躍用戶的見面會(huì),彼此之間可以大膽地交流經(jīng)驗(yàn)與心得,從而營造濃厚的知識交流氛圍,并增強(qiáng)了活躍用戶的幸福感。
伴隨著用戶數(shù)量的增多,社區(qū)首當(dāng)其沖的問題就是如何確保社區(qū)氛圍依然是高質(zhì)量的知識共享。由于用戶的多樣性和隱蔽性,社區(qū)應(yīng)當(dāng)制定一定的規(guī)則來規(guī)范用戶的行為,最好是讓用戶參與制定的過程,并對規(guī)則進(jìn)行進(jìn)一步修正。此外,在用戶中挑選一些執(zhí)法者,結(jié)合當(dāng)今社會(huì)中關(guān)于網(wǎng)絡(luò)言論的法律,對于一些散布不實(shí)言論的用戶進(jìn)行嚴(yán)懲。社區(qū)還應(yīng)當(dāng)對用戶發(fā)布的一些問題以及用戶的一些評論進(jìn)行篩選,確保發(fā)布的內(nèi)容有較高的質(zhì)量且合理合法,避免出現(xiàn)社區(qū)氛圍變差、社區(qū)內(nèi)容質(zhì)量下降等現(xiàn)象。除了過濾掉這些劣質(zhì)用戶的言論,社區(qū)對于一些優(yōu)質(zhì)的文章應(yīng)當(dāng)設(shè)立更高的標(biāo)準(zhǔn)并對其進(jìn)行推送與置頂,這不僅僅增強(qiáng)了用戶的存在感與滿足感,也保證了社區(qū)的學(xué)術(shù)氛圍。
此外,社區(qū)應(yīng)當(dāng)結(jié)合當(dāng)今的大數(shù)據(jù)技術(shù)、文本分析等,對用戶之間共享的知識進(jìn)行整合并建立知識庫,并為用戶提供方便快捷的知識獲取途徑,確保其功能做到簡單易學(xué),減少用戶的學(xué)習(xí)成本,從而及時(shí)解決用戶學(xué)習(xí)中存在的一些問題。為增強(qiáng)用戶對社區(qū)的歸屬感,社區(qū)還可以提供一些人性化的服務(wù),如節(jié)日祝福、用戶晉級祝賀等。
本文結(jié)合社會(huì)化問答社區(qū)的特征,以知乎社區(qū)為實(shí)證對象,從用戶知識共享中心度和用戶價(jià)值兩個(gè)維度出發(fā),結(jié)合社會(huì)網(wǎng)絡(luò)分析和因子分析,將用戶分為核心用戶、詢問者、回答者、潛水者、活躍者五類。
研究結(jié)果表明,網(wǎng)絡(luò)圖的密度為0.01,反映了知乎社區(qū)存在知識共享效率低下的問題。此外,社區(qū)中核心用戶的比例只有1.97%,而潛水者的比例為27.84%。懸殊的數(shù)量表明大部分的用戶并沒有參與到社區(qū)的知識共享建設(shè)中,只有部分核心用戶對其起到促進(jìn)作用,這可能是社區(qū)知識共享效率較低的主要原因。另一方面,活躍者的比例占了44.55%。因此,可以推斷知乎社區(qū)中仍有著巨大的潛在用戶可以挖掘,有助于社區(qū)未來的發(fā)展。本文結(jié)合五類用戶的特征,為社區(qū)提出了一些相應(yīng)的改善方案。例如,給予用戶一些優(yōu)惠來增強(qiáng)用戶對社區(qū)的黏性,并吸引一些新用戶;優(yōu)質(zhì)文章的置頂,使得社區(qū)保持濃厚的知識氛圍,從而實(shí)現(xiàn)知識共享效率的提升。
本研究在用戶知識共享中心度的指標(biāo)下,僅僅考慮了用戶的關(guān)注情況,并沒有考慮用戶之間實(shí)際的發(fā)帖與回帖情況。此外,對于如何促進(jìn)知識共享效率,本文僅提出了一些改善建議。因此,后續(xù)對這一類問題的研究,可以多考慮用戶的互動(dòng)性行為,并對知識共享效率情況進(jìn)行仿真,探究改善的實(shí)際效果。