?
微信用戶活躍度影響因素分析
黃煒1 ,2, 李總苛1, 李岳峰1
(1 湖北工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院, 湖北 武漢 430068; 2 武漢理工大學(xué)管理學(xué)院, 湖北 武漢 430072)
[摘要]通過主成分分析法,應(yīng)用SPSS統(tǒng)計(jì)分析軟件,從 11個(gè)調(diào)查指標(biāo)中,選取了3個(gè)主成分,建立主成分綜合分析模型,進(jìn)而對微信用戶活躍度進(jìn)行分析。經(jīng)過實(shí)際數(shù)據(jù)驗(yàn)證顯示,所選取的3個(gè)主成分可以很好區(qū)分微信用戶的活躍度,進(jìn)而達(dá)到了對微信用戶進(jìn)行甄別的目的。
[關(guān)鍵詞]微信; 主成分分析; 統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案
微信將通信、社交、平臺(tái)化三者融為一體,很大程度上改變著人們的通信和社交方式,也改變著人們的思維和行為方式[1]。微信也成為了獨(dú)特的傳播媒介,被廣泛應(yīng)用于企業(yè)的管理、營銷、宣傳中。微信一經(jīng)出現(xiàn),就迅速占領(lǐng)市場,在近四年里注冊用戶已經(jīng)突破6億,如今仍有倍增趨勢[2]。然而,部分微信用戶對于微信功能的應(yīng)用并不完全了解,所以其微信活躍度不高。本文將微信活躍度界定為用戶微信在線使用的頻率及對微信功能的使用程度,再運(yùn)用SPSS統(tǒng)計(jì)分析軟件,通過主成分分析法,從11個(gè)指標(biāo)中選取3個(gè)主成分,進(jìn)行微信活躍度的分析[3]。
1微信用戶活躍度的分析
統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案(Statistical Product and Service Solutions,SPSS)適用于統(tǒng)計(jì)、經(jīng)濟(jì)、教育、心理、管理、醫(yī)學(xué)、基礎(chǔ)設(shè)施建設(shè)等領(lǐng)域[3]。而主成分分析法是利用降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。將SPSS和主成分分析法進(jìn)行結(jié)合,不僅有助于指標(biāo)的選取,也有助于構(gòu)建出特定的指標(biāo)體系[4-6]。
選用2014年湖北工業(yè)大學(xué)知識(shí)管理與創(chuàng)新研究中心實(shí)驗(yàn)室調(diào)查取得的數(shù)據(jù),應(yīng)用Excel處理11個(gè)用戶個(gè)體的各項(xiàng)指標(biāo):V01為好友數(shù),V02為群總數(shù),V03為關(guān)注的公眾平臺(tái)數(shù),V04為用戶資料完整度,V05為一周內(nèi)用戶發(fā)布朋友圈消息數(shù),V06為一周內(nèi)好友對話數(shù),V07為一周內(nèi)朋友圈好友發(fā)布消息總數(shù),V08為用戶收藏總數(shù),V09為使用的功能數(shù),V10為銀行卡使用頻率,V11為用戶注冊時(shí)間。其中,用戶注冊時(shí)間作為一個(gè)時(shí)間變量,無法直接進(jìn)入建模數(shù)據(jù)集,所以需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換,本文以2011年(微信推出時(shí)間)作為基準(zhǔn)時(shí)間對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,即2011年表示為0,2012年表示為1。
運(yùn)用SPSS17.0簡體中文版軟件的因子分析對影響微信活躍度的指標(biāo)進(jìn)行主成分分析,具體操作步驟如下:
第一步,將Excel中的數(shù)據(jù)導(dǎo)入SPSS,保證各數(shù)據(jù)類型為數(shù)值型;
第二步,選擇“降維”中的“因子分析”,彈出“因子分析”對話框,把V01—V11選入變量框;
第三步,在相關(guān)矩陣對話框中選中“系數(shù)”,然后點(diǎn)擊“繼續(xù)”,返回因子分析對話框;
第四步,點(diǎn)擊“確定”,輸出結(jié)果如表1所示。由于SPSS在調(diào)用因子分析進(jìn)行分析時(shí),SPSS會(huì)自動(dòng)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以計(jì)算得到的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS不會(huì)直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用“描述性”過程進(jìn)行計(jì)算,計(jì)算結(jié)果如表2所示。
表1 輸出結(jié)果
表2 經(jīng)標(biāo)準(zhǔn)化處理后的部分?jǐn)?shù)據(jù)
將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,在處理后的數(shù)據(jù)基礎(chǔ)上計(jì)算的特征值結(jié)果如表3所示。
表3 方差分解主成分提取分析
特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),主成分個(gè)數(shù)提取原則為主成分對應(yīng)的特征值大于1的前幾個(gè)主成分[7]。從表2可以看出,當(dāng)初始特征值的累計(jì)方差大于60%時(shí),只要選取3個(gè)主成分,信息量就足夠了。在計(jì)算完特征值之后,進(jìn)一步通過計(jì)算各變量與有關(guān)主成分的相關(guān)系數(shù),計(jì)算結(jié)果如表4所示。
表4 初始因子載荷
表4中的每一列都顯示了各個(gè)變量與有關(guān)主成分的相關(guān)系數(shù)。以第一列為例,0.877是“好友數(shù)”與第一個(gè)主成分的相關(guān)系數(shù),這是它在第一主成分上的載荷,如在第一主成分上載荷較大,即相關(guān)程度較高。
由初始因子載荷矩陣表可知,好友總數(shù)、群總數(shù)、一周內(nèi)好友對話數(shù)、一周內(nèi)朋友圈好友發(fā)布消息總數(shù)、用戶收藏總數(shù)、使用的功能數(shù)、銀行卡使用頻率在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標(biāo)的信息,用戶關(guān)注公眾平臺(tái)總數(shù)、一周內(nèi)用戶發(fā)布朋友圈消息數(shù)在第二主成分上有較高載荷,說明第二主成分基本反映了這一指標(biāo)的信息,用戶資料完整度、用戶注冊時(shí)間在第三主成分上有較高載荷,說明第三主成分基本反映了這兩個(gè)指標(biāo)的信息。提取3個(gè)主成分可以基本反映全部指標(biāo)的信息,所以決定用3個(gè)新變量來代替原來的11個(gè)變量,代替后的結(jié)果如表5所示。
表5 主成分代表
用表2中的數(shù)據(jù),除以每個(gè)主成分所對應(yīng)的特征值開平方根可以得到3個(gè)主成分中每個(gè)指標(biāo)對應(yīng)的系數(shù)。最后可以得出主成分表達(dá)式:
F1=0.45415427ZX1+0.568561877ZX2+
0.056067827ZX3+0.28686188ZX4-
0.00441457ZX5+1.036524344ZX6+
0.86596324ZX7+0.901473744ZX8+
1.047221549ZX9+1.197220657ZX10-
0.372015001ZX11
F2=-0.045052932ZX1-0.099596356ZX2+
0.603807364ZX3-0.24172627ZX4-
0.767031547ZX5-0.152257813ZX6-
0.314199052ZX7+0.641189072ZX8+
0.412641458ZX9+0.472115301ZX10+
1.309152028ZX11
F3=0.045570782ZX1+0.276046594ZX2-
0.250148765ZX3+0.473422404ZX4-
0.402829517ZX5+0.215503366ZX6-
0.504506607ZX7-0.842750983ZX8-
0.095351413ZX9+0.207172959ZX10+
1.519297907ZX11
以每個(gè)主成分所對應(yīng)的特征值占所提取主成分總的特征值之和的比例為權(quán)重,計(jì)算主成分綜合模型:
(1)
其中,β1=3.729,β2=1.626,β3=1.344,β1+β2+β3=6.699,帶入式(1)即為主成分綜合模型:
(2)
由式(2)可見,F(xiàn)1值對綜合主成分值影響比重較大,其次為F2,F(xiàn)3對綜合主成分值的影響比重較小。
2實(shí)驗(yàn)分析
為了了解影響微信用戶活躍度的因素,同時(shí)驗(yàn)證本文的指標(biāo)體系,仍繼續(xù)沿用實(shí)驗(yàn)室數(shù)據(jù),樣本來源于實(shí)驗(yàn)室通過問卷調(diào)查的方式收集的原始數(shù)據(jù),選取的樣本量為60份,收集了用戶的好友總數(shù)、群總數(shù)、用戶關(guān)注公眾平臺(tái)總數(shù)等共11類數(shù)據(jù)。
首先對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后根據(jù)主成分表達(dá)式、主成分綜合模型,計(jì)算出綜合主成分值,并對其按綜合主成分值(即F值)進(jìn)行降序排列。部分結(jié)果見表6所示。
F值>0,說明該用戶活躍度在該組樣本用戶活躍度平均水平之上;相反,F(xiàn)值<0,說明該用戶活躍度在該組樣本用戶活躍度平均水平之下。根據(jù)統(tǒng)計(jì)結(jié)果,該組樣本中,有28位微信用戶的綜合得分在0以上,有32位微信用戶的綜合得分在0以下,即約2/3的微信用戶活躍度水平偏低。
表6 部分用戶的綜合主成分值排序表
F1為第一主成分,F(xiàn)2為第二主成分,F(xiàn)3為第三主成分,F(xiàn)為綜合主成分
其中,排名第一的用戶“曹”在F1上得分最高,這意味著相對于其他用戶,“曹”微信人脈較廣,且互動(dòng)頻繁。排名第三的用戶“項(xiàng)靜”在F1、F2上的得分均較高,表明“項(xiàng)靜”不僅微信人脈較廣互動(dòng)較多,其關(guān)注的公眾平臺(tái)總數(shù)也比其他用戶較多。由此,可以發(fā)現(xiàn)排名靠前的用戶在三類分值上具有共同特點(diǎn),即F1值偏高,排名靠后的用戶,其F1值偏低,說明F1值對F值的影響較大。從圖1中可以得到驗(yàn)證,當(dāng)用戶的活躍度明顯低于平均水平或明顯高于平均水平時(shí),其F1值與F值同負(fù)或同正。從樣本用戶的整體變動(dòng)趨勢上來看,F(xiàn)1值與F值的變動(dòng)趨勢大體相同,即F1值對F值的影響較大。微信用戶可以從增加好友數(shù)、群總數(shù)、好友對話數(shù)、用戶收藏總數(shù)、使用的功能數(shù),以及銀行卡使用頻率來提高自身的活躍度。
圖 1 微信用戶F1值F值比較分析圖
根據(jù)計(jì)算出來的60個(gè)用戶的綜合主成分值,繪制出用戶分布散點(diǎn)圖(圖2)。
圖 2 用戶分布散點(diǎn)圖
綜合主成分值從高到低,依次劃分為活躍性用戶、普通用戶、缺乏活躍性用戶。從圖2可見,在該組樣本用戶中,大部分用戶為普通用戶,少數(shù)用戶為活躍性用戶和缺乏活躍性用戶。
3結(jié)束語
對于微信用戶活躍性的界定方法并不只有此一種,本文也只是對微信用戶活躍度進(jìn)行探索。隨著微營銷等微信用途的發(fā)展,指標(biāo)體系也會(huì)不斷完善,本文僅是通過這一種方法,對于微信用戶活躍度評價(jià)指標(biāo)體系進(jìn)行探討。
[參考文獻(xiàn)]
[1]孔云,廖寅,資蕓,等.圖書館微信服務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].圖書館論壇2014,34(02):90-95.
[2]新浪科技. 騰訊公布2015年第二季度財(cái)報(bào):凈利同比增32% [EB/OL]. [2015-08-15].http://tech.sina.com.cn/i/2015-08-12/doc-ifxftvni8992173.shtml.
[3]王沙沙,艾萍.基于SPSS的主成分分析法的水利信息化評估[J].信息技術(shù),2014(03):10-11.
[4]許淑婷,關(guān)偉.中國沿海地區(qū)海洋經(jīng)濟(jì)競爭力研究[J].生產(chǎn)力研究,2014(07):26-29.
[5]李占波,白全海,申義彩.基于主成分分析的網(wǎng)絡(luò)入侵檢測算法[J].計(jì)算機(jī)工程,2013,39(05):152-155.
[6]楊仲瑋.主成分分析法在農(nóng)村環(huán)境質(zhì)量評價(jià)中的應(yīng)用[J].甘肅科學(xué)學(xué)報(bào),2015,27(01):72-75.
[7]齊欣,陸佳瑩.國外機(jī)構(gòu)知識(shí)庫研究狀況計(jì)量分析[J].圖書與情報(bào),2014(06):94-101.
[責(zé)任編校: 張眾]
Analysis of Factors Affecting Active Degree of WeChat Users
Based on Principal Component Analysis
HUANG Wei1,2, LI Zongke1, LI Yuefeng1
(1SchoolofEconomicsandManagement,HubeiUniv.ofTech.,Wuhan430068,China;
2SchoolofManagement,WuhanUniv.ofTech.,Wuhan430072,China)
Abstract:The article analyzed the active level of WeChat users based on the principal component analysis. By means of principal component analysis and SPSS statistical analysis software, 3 main components were selected from the 11 survey indicators, and then the main component analysis model was established. The data validation shows that the 3 main components can well distinguish WeChat users, and then to achieve the screening purpose of WeChat users.
Keywords:WeChat; principal component analysis;SPSS
[中圖分類號(hào)]G353
[文獻(xiàn)標(biāo)識(shí)碼]:A
[文章編號(hào)]1003-4684(2015)06-0029-04