引言
社交網(wǎng)絡(luò)自誕生以來,給人們的信息生活帶來了巨大變革,隨著移動(dòng)互聯(lián)網(wǎng)的迅速普及,微博成為人們獲取新聞資訊的主要平臺(tái),特別是在信息時(shí)代,新聞?dòng)嵪a(chǎn)生十分迅速,微博逐漸成為輿情傳播的重要渠道。在不同的應(yīng)用場(chǎng)景中,用戶會(huì)呈現(xiàn)出特點(diǎn)各異的微博使用方式。在社會(huì)信息化進(jìn)程不斷加速的大背景下,網(wǎng)絡(luò)信息的數(shù)量呈現(xiàn)出指數(shù)增長的趨勢(shì)。面對(duì)處理龐大數(shù)據(jù)量的壓力,數(shù)據(jù)挖掘與文本挖掘應(yīng)運(yùn)而生。為了解決對(duì)大量用戶信息數(shù)據(jù)進(jìn)行分析的難題,用戶畫像這一分析工具被廣泛應(yīng)用到各類研究中。同時(shí),用戶畫像能夠提供精確有效的用戶特征分析,能夠迅速了解用戶行為習(xí)慣、消費(fèi)特點(diǎn)、使用方式及興趣偏好等重要特征。
一、相關(guān)概念及研究現(xiàn)狀
在信息時(shí)代,企業(yè)需要對(duì)用戶數(shù)據(jù)進(jìn)行管理和使用,在這種大背景下,用戶畫像應(yīng)運(yùn)而生。劉海鷗等通過文獻(xiàn)研究,總結(jié)了用戶畫像的概念,即基于特定場(chǎng)景,由用戶數(shù)據(jù)提煉出來的描述群體屬性及其相關(guān)行為的標(biāo)簽集合。在社交網(wǎng)絡(luò)的用戶畫像研究中,構(gòu)建視角主要有兩種:第一類視角是研究者從既有理論角度對(duì)特定用戶群體進(jìn)行定性分析[2-3];第二類則是通過大量用戶數(shù)據(jù),從數(shù)據(jù)中提取相關(guān)特征信息,從而構(gòu)建基于實(shí)際數(shù)據(jù)的用戶畫像[4。在群體用戶畫像研究中,當(dāng)前主要聚焦于特定情境中的用戶畫像,通過從群體用戶信息中抽取代表性特征[5],對(duì)具有相似相近特征的用戶進(jìn)行聚類,構(gòu)建不同類型的群體畫像,基于此,能夠進(jìn)一步識(shí)別出群體中用戶的中心程度、活躍程度及社群質(zhì)量高低等[]。
二、研究設(shè)計(jì)
(一)研究方法
本文通過網(wǎng)絡(luò)爬蟲收集數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗,以此進(jìn)行大學(xué)生微博數(shù)據(jù)信息標(biāo)簽化處理,通過K-Means聚類算法構(gòu)建用戶畫像,分析說明不同類型大學(xué)生群體用戶特征。微博用戶畫像的兩個(gè)具體維度,分為用戶相關(guān)和情景相關(guān)。其中用戶相關(guān)維度是用戶的靜態(tài)數(shù)據(jù),主要為個(gè)人信息、使用歷史信息等不隨用戶行為變化而變化的信息;情景相關(guān)維度主要是用戶動(dòng)態(tài)數(shù)據(jù),如博文長度、轉(zhuǎn)發(fā)情況等。本文構(gòu)建的大學(xué)生微博用戶畫像標(biāo)簽包括用戶基本信息及博文信息。
(二)數(shù)據(jù)收集與處理
本研究使用網(wǎng)絡(luò)數(shù)據(jù)采集方法,通過網(wǎng)絡(luò)爬蟲解析Web版微博網(wǎng)頁,對(duì)用戶數(shù)據(jù)進(jìn)行收集,大學(xué)生群體身份識(shí)別方法通過教育信息化進(jìn)行篩選,累計(jì)獲取695位高校大學(xué)生微博用戶信息及發(fā)布的微博博文數(shù)據(jù),去除相關(guān)個(gè)人隱私信息后,數(shù)據(jù)樣例,見表1—2。
剔除極端值后,得到有效樣本用戶數(shù)據(jù)432個(gè)。同時(shí),為了消除不同衡量標(biāo)準(zhǔn)帶來的影響,需要進(jìn)行標(biāo)準(zhǔn)化處理,以數(shù)據(jù)放縮的形式消除不同維度數(shù)據(jù)量綱帶來的差異。在用戶屬性及行為數(shù)據(jù)的基礎(chǔ)上,借鑒郭秋艷等對(duì)微博用戶特征挖掘的研究,增加名氣指數(shù)及互動(dòng)值等標(biāo)簽[7]。
三、結(jié)果與分析
根據(jù)社會(huì)認(rèn)同理論,以及用戶屬性信息,可以將微博用戶劃分為5類[8;在對(duì)大學(xué)生社交媒體使用的研究中,有學(xué)者根據(jù)用戶特征維度,將大學(xué)生群體分為娛樂型、社交型、信息型和全面型4類。根據(jù)新浪微博用戶發(fā)展報(bào)告中對(duì)不同類型用戶的分類和說明,本文結(jié)合用戶屬性及行為標(biāo)簽,將大學(xué)生微博用戶分為4類:互動(dòng)型用戶、分享型用戶、普通型用戶及名氣型用戶,不同用戶占比,見表 3
互動(dòng)型用戶以男性為主體,粉絲數(shù)多,關(guān)注數(shù)少,使用微博頻率低,發(fā)布的微博數(shù)量較少,每次發(fā)布博文長度較短,但此類用戶與粉絲及其他用戶互動(dòng)較多,以此來保持高活躍度。該類用戶占樣本總體較少,而高頻互動(dòng)型用戶以原創(chuàng)能力和互動(dòng)能力為特征,說明在大學(xué)生群體中,頻繁使用微博,并能夠保持原創(chuàng)互動(dòng)能力的微博用戶較少。互動(dòng)型用戶畫像差異屬性特征,見圖1。
分享型用戶以女大學(xué)生為主體,微博數(shù)量多、發(fā)博頻率高、平均博文長度高,但粉絲數(shù)和關(guān)注數(shù)低。說明該類群體多以生活分享為主要內(nèi)容,并不致力于提高粉絲數(shù)量和進(jìn)行個(gè)人營銷,屬于普通用戶群體。同時(shí)微博等級(jí)和會(huì)員等級(jí)高,說明該群體使用微博增值服務(wù)多,如微博會(huì)員服務(wù),該類群體的消費(fèi)能力較高。分享型用戶畫像差異屬性特征,見圖 2
普通型群體聚類中心用戶性別為男性,但實(shí)際上該類群體中男女大學(xué)生數(shù)量均較多。此類群體各項(xiàng)指標(biāo)數(shù)值均較低,使用微博時(shí)間短,微博數(shù)、粉絲數(shù)、關(guān)注數(shù)均較低。普通型用戶占樣本用戶的 57.5% ,這說明較多的大學(xué)生微博用戶在微博網(wǎng)絡(luò)中的影響力較低,與其他用戶的互動(dòng)較少,此類用戶主要通過微博來獲得信息。普通型用戶畫像差異屬性特征,見圖 3
名氣型用戶以女大學(xué)生為主體,互動(dòng)值、粉絲數(shù)均較高,說明其在網(wǎng)絡(luò)中的影響力較大且活躍,與粉絲及其他用戶互動(dòng)次數(shù)較多,微博等級(jí)低但會(huì)員等級(jí)高,說明其消費(fèi)能力較強(qiáng)、消費(fèi)次數(shù)較多,該類群體以低關(guān)注數(shù)、高粉絲數(shù)和名氣指數(shù)為主要特征,同時(shí)與其他用戶互動(dòng)頻繁。名氣型用戶畫像差異屬性特征,見圖 4
結(jié)語
本文以新浪微博數(shù)據(jù)為基礎(chǔ),構(gòu)建了大學(xué)生微博用戶畫像,主要包括用戶基本屬性和用戶行為屬性兩個(gè)維度,通過K-means聚類算法進(jìn)行處理,根據(jù)不同用戶屬性及行為特征分類分析,得到了不同類型用戶的差異屬性特征。用戶畫像作為重要的用戶分析工具,能夠利用大量數(shù)據(jù)來發(fā)現(xiàn)不同類型的用戶特征,為挖掘用戶需求、實(shí)施精準(zhǔn)服務(wù)提供了重要途徑。大學(xué)生群體作為消費(fèi)頻次較高、網(wǎng)絡(luò)活躍度較強(qiáng)的群體,對(duì)其進(jìn)行微博用戶畫像的構(gòu)建和分析,能夠增強(qiáng)對(duì)大學(xué)生用戶群體的精準(zhǔn)描述。
參考文獻(xiàn):
[1]劉海鷗,孫晶晶,蘇妍姬,等.國內(nèi)外用戶畫像研究綜述[J]情報(bào)理論與實(shí)踐,2018,41(11):155-160.
[2]陳志明,胡震云.UGC網(wǎng)站用戶畫像研究[J].計(jì)算機(jī)系統(tǒng)用,2017,26(01):24-30
[3]高廣尚.用戶畫像構(gòu)建方法研究綜述[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2019,3(03):25-35.
[4]魏明珠,張海濤,劉雅姝,等.多維屬性融合的社交媒體高影響力人物畫像研究[J].圖書情報(bào)知識(shí) ,2019,(05):73-79+100 美
[5]林燕霞,謝湘生.基于社會(huì)認(rèn)同理論的微博群體用戶畫像[J].情報(bào)理論與實(shí)踐,2018,41(03):142-148
[6]王志剛,邱長波.基于主題的政務(wù)微博評(píng)論用戶畫像研究[J]情報(bào)雜志,2022,41(03):159-165.
[7]郭秋艷,何躍.新浪微博名人用戶特征挖掘及效應(yīng)研究[J]情報(bào)雜志,2013,32(02):112-116+81.
[8]林燕霞,謝湘生.基于社會(huì)認(rèn)同理論的微博群體用戶畫像[J].情報(bào)理論與實(shí)踐,2018,41(03):142-148.
[9]葉鳳云,邵艷麗.大學(xué)生社交網(wǎng)絡(luò)行為畫像研究[J].大學(xué)圖書情報(bào)學(xué)刊,2021,39(01):50-57.
(責(zé)任編輯:袁麗娜)