王文韜,陳 千,張 肖,張 晨
“互聯(lián)網(wǎng)+”時(shí)代,網(wǎng)絡(luò)成為用戶獲取健康知識(shí)的主要渠道之一,并對(duì)用戶健康決策產(chǎn)生重大影響[1]。我國網(wǎng)絡(luò)視頻用戶規(guī)模達(dá)9.27億[2],網(wǎng)絡(luò)視頻科普方式以視聽結(jié)合的優(yōu)勢(shì)迅速走紅[3],用戶可通過這種方式獲取相關(guān)健康知識(shí)。在大數(shù)據(jù)、健康中國、5G等戰(zhàn)略驅(qū)動(dòng)下,網(wǎng)絡(luò)健康視頻制作產(chǎn)業(yè)迎來新風(fēng)口,各大視頻媒體借助網(wǎng)絡(luò)平臺(tái)發(fā)布健康視頻吸引用戶關(guān)注。而彈幕作為新興互動(dòng)技術(shù),廣受年輕群體喜愛,被頻繁用于網(wǎng)絡(luò)視頻平臺(tái)[4]。用戶可通過滑動(dòng)字幕,對(duì)視頻內(nèi)容進(jìn)行實(shí)時(shí)評(píng)論、發(fā)布即時(shí)情感[5],實(shí)現(xiàn)社交需求。當(dāng)用戶瀏覽、評(píng)論、點(diǎn)贊、分享健康視頻時(shí),可在一定程度上體現(xiàn)其對(duì)視頻的關(guān)注度[6]。同時(shí),各大社交平臺(tái)均設(shè)置熱搜板塊,不同平臺(tái)按照其權(quán)重指標(biāo)呈現(xiàn)用戶每日最為關(guān)注話題,“上熱搜”已成為大眾尤其是年輕用戶判斷話題關(guān)注度的重要指標(biāo)之一[7],可見網(wǎng)絡(luò)健康熱搜視頻在一定程度上體現(xiàn)用戶關(guān)注話題。由于彈幕文本及視頻瀏覽數(shù)據(jù)包含用戶觀看量、點(diǎn)贊量、評(píng)論等能夠披露用戶關(guān)注度的信息,其中熱搜視頻瀏覽數(shù)據(jù)良好,相較于普通視頻傳播范圍更廣且彈幕數(shù)據(jù)較多,故本文通過梳理總結(jié)網(wǎng)絡(luò)健康熱搜彈幕數(shù)據(jù)中包含的評(píng)論、觀看量、彈幕發(fā)送時(shí)間等數(shù)據(jù),獲知影響用戶網(wǎng)絡(luò)健康視頻關(guān)注度的主要因素。此外,由于彈幕數(shù)據(jù)中包含大量用戶信息行為,眾多學(xué)者圍繞彈幕網(wǎng)站展開研究,但當(dāng)前對(duì)其研究主要聚焦彈幕行為、用戶使用驅(qū)動(dòng)因素等方面,較少從分析彈幕用戶關(guān)注度影響因素的角度獲知用戶健康信息需求。因此,本文基于此視角,通過深入分析網(wǎng)絡(luò)健康熱搜視頻彈幕數(shù)據(jù),識(shí)別影響用戶關(guān)注度因素,判斷用戶健康信息偏好類型,據(jù)此得出相關(guān)啟示。
鑒于國內(nèi)視頻網(wǎng)站中,嗶哩嗶哩(bilibili,以下簡稱“B站”)是最早引入彈幕系統(tǒng)的視頻網(wǎng)站之一,彈幕系統(tǒng)較完善,2020年活躍用戶達(dá)2億人,彈幕總量超過22億[8]。因此,本文選取B站作為數(shù)據(jù)來源,利用python爬取B站全日排行榜中健康科普類熱搜視頻彈幕,采用LDA(Latent Dirichlet Allocation)主題模型和情感分析方法,獲取彈幕數(shù)據(jù)中包含的用戶關(guān)注熱點(diǎn)及關(guān)注度與滿意度間的潛在關(guān)聯(lián),分析影響用戶關(guān)注度的主要因素,幫助視頻媒體更具針對(duì)性地提供健康視頻。同時(shí)B站主要受眾群體多為數(shù)字原住民,該群體熱衷新奇事物且接受能力強(qiáng),但對(duì)健康知識(shí)了解不夠全面、深入,應(yīng)以其關(guān)注話題為源,切入健康知識(shí)普及,加強(qiáng)健康教育,提升健康素養(yǎng),助力“健康中國”戰(zhàn)略實(shí)施。
彈幕(Danmaku)一詞源于射擊游戲,因大量評(píng)論在視頻上滾動(dòng)就像游戲中子彈布滿屏幕一樣,故而得名[9]。目前彈幕在各大主流視頻網(wǎng)站中被廣泛使用,相比點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)等方式,彈幕主要從視覺上給予用戶顛覆性體驗(yàn)[10],且“共時(shí)性”這一特點(diǎn)打破時(shí)間、空間的限制[11],滿足用戶即時(shí)互動(dòng)的社交需求,故彈幕被大眾廣泛接受。同時(shí)彈幕主要集中在視頻頁面的上下方,但當(dāng)彈幕數(shù)量較多時(shí),大量彈幕布滿整個(gè)屏幕形成信息瀑布效應(yīng)[12],彈幕“刷屏”現(xiàn)象會(huì)吸引更多用戶參與互動(dòng)??梢哉f,在當(dāng)前網(wǎng)絡(luò)社交環(huán)境下,彈幕已成為用戶所關(guān)注的重點(diǎn)部分[13],是決定視頻對(duì)用戶吸引力的重要部分。
此外,彈幕視頻在發(fā)展中逐漸形成其特有的彈幕文化,如語言縮寫體系、彈幕補(bǔ)充視頻內(nèi)容再創(chuàng)作,用戶通過彈幕分享觀點(diǎn)與關(guān)注點(diǎn),在實(shí)現(xiàn)群體間互動(dòng)交流的同時(shí),無形中也增加對(duì)這類交互方式的依賴性[14]。其獨(dú)特的彈幕文化吸引大量用戶在彈幕中表達(dá)觀點(diǎn)、態(tài)度,彈幕交互行為在增加視頻熱度的同時(shí),也提升了用戶關(guān)注度。而熱搜視頻相較于其他視頻傳播范圍更廣、彈幕量較多、交互行為更為頻繁,因此本文爬取B站健康熱搜視頻彈幕,并分析彈幕中所包含影響用戶關(guān)注度的因素。
彈幕網(wǎng)站受眾者多為年輕用戶,其中B站用戶多為90后[15],他們也被稱為“數(shù)字原住民”(DigitalNatives),即伴隨網(wǎng)絡(luò)技術(shù)成長且具備一定信息能力[16]的年輕群體。數(shù)字原住民敢于嘗試新興事物,樂于利用網(wǎng)絡(luò)社交平臺(tái)實(shí)現(xiàn)自我認(rèn)同[17],B站這類網(wǎng)絡(luò)平臺(tái)則較好地契合了其社交需求與信息需求,即便社交時(shí)間、空間不同,通過彈幕也能跨域即時(shí)互動(dòng)。我國數(shù)字原住民中的一部分目前已成為各個(gè)領(lǐng)域骨干力量,該群體對(duì)網(wǎng)絡(luò)健康視頻采納情況可一定程度上反映廣大用戶對(duì)社會(huì)化媒體現(xiàn)有關(guān)注度[18],可以認(rèn)為數(shù)字原住民對(duì)網(wǎng)絡(luò)健康視頻的瀏覽、發(fā)送彈幕、點(diǎn)贊、投幣等行為能一定程度上反映該類群體的關(guān)注度。通過分析該群體關(guān)注網(wǎng)絡(luò)健康視頻的彈幕行為特征,得出影響其關(guān)注度的主要因素,以此改善視頻內(nèi)容提升用戶滿意度,促使網(wǎng)絡(luò)健康視頻被廣泛接納,加強(qiáng)健康知識(shí)教育,提升全民健康素養(yǎng)。
B站這一網(wǎng)絡(luò)視頻平臺(tái),因其特色彈幕文化吸引大量數(shù)字原住民聚集,用戶可利用彈幕分享觀點(diǎn)并據(jù)此體現(xiàn)其對(duì)該話題的關(guān)注度。目前針對(duì)彈幕視頻平臺(tái)的研究主要集中在彈幕行為(如從眾行為[13]、用戶交互行為[19])、用戶使用動(dòng)機(jī)與意愿[20]、彈幕文化[21]等方面。彈幕視頻平臺(tái)蘊(yùn)含大量用戶行為信息、使用動(dòng)機(jī)及驅(qū)動(dòng)因素等信息,對(duì)彈幕進(jìn)行深入分析可挖掘出其用戶關(guān)注熱點(diǎn)、情感態(tài)度等有價(jià)值的信息。有學(xué)者對(duì)彈幕進(jìn)行情感分析,研判視頻不同時(shí)間段用戶情感走向,據(jù)此總結(jié)其彈幕行為特點(diǎn)[4]。還有學(xué)者對(duì)彈幕及視頻字幕進(jìn)行可視化分析,從情感的強(qiáng)度、種類分布、變化趨勢(shì)這3個(gè)維度出發(fā),判斷用戶情感特征與視頻內(nèi)容間的關(guān)聯(lián)性[22]。
為從彈幕數(shù)據(jù)中獲知影響用戶對(duì)健康視頻關(guān)注度因素,需聚類彈幕主題了解用戶更為關(guān)注的話題,但主題聚類僅分析出主題間相關(guān)性[23]未能全面分析其他影響因素,因此需結(jié)合與研究主題更為適配的方法得出有效結(jié)論。而彈幕源數(shù)據(jù)中包含時(shí)間數(shù)據(jù)及用戶情感,需從這些維度進(jìn)行分析,以便得出更全面及更具說服力的結(jié)論。因此,本文利用LDA模型提取主題熱點(diǎn),并結(jié)合彈幕源數(shù)據(jù)中時(shí)間序列分析主題隨時(shí)間變化的規(guī)律,再借助外部詞典進(jìn)行文本情感分析得出用戶滿意度,分析其關(guān)注度與滿意度間潛在關(guān)系,判斷用戶滿意度與其關(guān)注度間關(guān)聯(lián)性。
B站健康類視頻觀看量、彈幕量等較為直觀的瀏覽數(shù)據(jù)雖可在一定程度上體現(xiàn)用戶關(guān)注度,但難以據(jù)此判斷是否存在其他影響用戶關(guān)注度因素,故需深入挖掘分析彈幕文本。本文爬取代表性更強(qiáng)且彈幕量較多的熱搜視頻彈幕,通過LDA主題模型,在此基礎(chǔ)上進(jìn)行主題演化分析與情感分析,挖掘視頻主題、彈幕發(fā)送時(shí)間、用戶滿意度等非直觀因素對(duì)用戶關(guān)注度的影響,具體流程如圖1所示。
圖1 用戶網(wǎng)絡(luò)健康視頻關(guān)注度分析流程
選取B站網(wǎng)絡(luò)健康熱搜視頻彈幕數(shù)據(jù)作為研究樣本,通過python爬取彈幕數(shù)據(jù),形成初始彈幕數(shù)據(jù)集。為實(shí)現(xiàn)后續(xù)主題聚類與情感分析,首先對(duì)收集到的彈幕數(shù)據(jù)進(jìn)行預(yù)處理[24],去除重復(fù)項(xiàng)、無效符號(hào)、表情和文本符號(hào)。然后,根據(jù)清洗后的彈幕數(shù)據(jù)集和分詞結(jié)果構(gòu)建分詞詞典并結(jié)合哈工大停用詞表及自設(shè)停用詞表,形成較為完善的停用詞表提高分詞準(zhǔn)確率。最后加載用戶詞典,以jieba分詞為基礎(chǔ)[25],同時(shí)自設(shè)停用詞表,去除停用詞。
從B站獲取的彈幕源數(shù)據(jù)中,每條源數(shù)據(jù)包含8個(gè)參數(shù)[4]和其具體彈幕文本。彈幕源數(shù)據(jù)均以XML文本格式進(jìn)行儲(chǔ)存,以表1列舉彈幕源數(shù)據(jù)所示,彈幕<d>內(nèi)所包含8個(gè)參數(shù)與具體彈幕文本,P后以逗號(hào)分隔的八個(gè)參數(shù)每一項(xiàng)都有其特殊含義,包括彈幕格式、發(fā)送日期、發(fā)送者rowID等,以表1第一條彈幕為例解析其參數(shù),具體說明見表2。
表1 視頻《近視手術(shù)會(huì)后悔嗎?》部分彈幕
表2 以彈幕示例說明
B站設(shè)置熱搜板塊,以視頻歸屬不同分區(qū)及全站范圍分別進(jìn)行排行,以便用戶直觀了解每一分區(qū)內(nèi)其他用戶廣泛關(guān)注話題。視頻質(zhì)量(包括標(biāo)題與封面)、賬號(hào)權(quán)重問題(up主粉絲量)、用戶瀏覽數(shù)據(jù)(播放量、點(diǎn)贊量等)等權(quán)重?cái)?shù)據(jù)均對(duì)視頻排名造成一定影響。當(dāng)視頻質(zhì)量及數(shù)據(jù)達(dá)到排行榜權(quán)重指標(biāo)時(shí),視頻播放頁面會(huì)顯示該視頻全站排行榜實(shí)時(shí)最高名次。在排行榜且排名靠前的視頻,當(dāng)用戶檢索相關(guān)話題詞時(shí)會(huì)優(yōu)先推送或基于用戶近期瀏覽內(nèi)容被推送至首頁[26],可見視頻瀏覽數(shù)據(jù)在一定程度上影響用戶關(guān)注度。本文選取網(wǎng)絡(luò)健康視頻時(shí),將其播放量、彈幕量及全站排行榜名次作為主要選擇標(biāo)準(zhǔn),認(rèn)為該類視頻時(shí)效性強(qiáng)、傳播范圍廣且關(guān)注度更高,相較于瀏覽數(shù)據(jù)一般的視頻更具代表性。此外,僅瀏覽彈幕視頻未播放視頻時(shí),視頻下方會(huì)顯示其播放量與彈幕量,以其良好的瀏覽數(shù)據(jù)吸引用戶觀看。當(dāng)播放視頻時(shí)會(huì)顯示全部用戶瀏覽數(shù)據(jù),主要位于其播放窗口上下方如投幣數(shù)、全站排行榜名次、在線觀看人數(shù)及up主(uploader即視頻投稿者)粉絲數(shù)等,以便用戶直觀判斷視頻質(zhì)量及關(guān)注度,具體如圖2。
圖2《近視手術(shù)會(huì)后悔嗎?》視頻播放頁面截圖
利用LDA模型對(duì)清洗后彈幕文本進(jìn)行主題聚類,提取用戶關(guān)注熱點(diǎn)話題從而分析影響用戶關(guān)注度因素。本文通過困惑度與主題相關(guān)性指標(biāo)確定最佳主題數(shù)K,困惑度越小,主題數(shù)越多,話題與模型擬合度更高[27],最小困惑度對(duì)應(yīng)Topic數(shù)即最優(yōu)主題數(shù)。困惑度計(jì)算公式如式(1)(2)。公式(1)中分母表示數(shù)據(jù)集中所有詞之和或數(shù)據(jù)集總長度,其中p(w)指數(shù)據(jù)集中每個(gè)詞出現(xiàn)概率,公式(2)是其具體計(jì)算公式。另外,p(z|d)表示一個(gè)文檔中每個(gè)主題出現(xiàn)的概率,而p(w|z)表示詞典中每一個(gè)詞在某個(gè)主題下出現(xiàn)的概率。困惑度最小時(shí),主題數(shù)與話題內(nèi)容擬合度更高。
主題時(shí)間演化即彈幕主題關(guān)注度隨時(shí)間變化的過程。為分析彈幕隨時(shí)間變化及時(shí)間因素對(duì)用戶關(guān)注度影響度,利用主題詞與彈幕源數(shù)據(jù)中發(fā)送時(shí)間搭建主題時(shí)間演化模型,首先解析彈幕源數(shù)據(jù)中的彈幕發(fā)送時(shí)間Unix格式時(shí)間戳,然后按彈幕發(fā)送時(shí)間將主題詞文檔劃分時(shí)間片,最后根據(jù)時(shí)間軸中主題詞數(shù)分布情況分析其演化過程。
文本情感分析是指對(duì)可體現(xiàn)用戶情感態(tài)度的文本進(jìn)行分析及挖掘的過程,主要利用已有詞典和計(jì)算機(jī)方法分析主觀性文本情感[28]。為獲取彈幕文本中用戶觀點(diǎn)及喜好,本文選取目前通用詞典,在知網(wǎng)Hownet詞典基礎(chǔ)上,結(jié)合大連理工大學(xué)中文情感詞匯本體庫、清華大學(xué)TSING詞典,分析彈幕文本中用戶情感,根據(jù)其情感值得出用戶對(duì)健康熱搜視頻滿意度。
為獲知用戶關(guān)注度與滿意度間的潛在關(guān)聯(lián),將體現(xiàn)用戶關(guān)注度的主題詞、反映用戶滿意度的情感得分相結(jié)合,構(gòu)建用戶彈幕文本“關(guān)注度-滿意度”分析模型。橫軸與縱軸分別為用戶滿意度、關(guān)注度,以此將用戶關(guān)注健康類視頻主題分為4類??偨Y(jié)不同滿意度、關(guān)注度下主題特征,分析用戶滿意度對(duì)關(guān)注度的影響,幫助視頻媒體改進(jìn)視頻內(nèi)容及呈現(xiàn)形式,選取大眾更為關(guān)注的話題制作科普視頻,滿足用戶需求前提下更好地提供健康類知識(shí)。
B站視頻在發(fā)布時(shí)需要選擇投稿分區(qū)與視頻分類標(biāo)簽,因此以“健康”“疾病”“醫(yī)學(xué)小常識(shí)”“醫(yī)學(xué)知識(shí)”等話題詞作為關(guān)鍵詞進(jìn)行檢索,從普適性角度出發(fā),分別選取知識(shí)分區(qū)內(nèi)科學(xué)科普板塊下彈幕數(shù)量及播放量排名前三的熱搜視頻(部分重疊視頻合并處理后共選取10個(gè)健康視頻),通過python爬取視頻彈幕,共計(jì)獲得72,940條彈幕,刪去重復(fù)、無效信息、表情符號(hào)后有效彈幕文本共33,653條。針對(duì)清洗后彈幕文本,設(shè)立較全面的用戶詞典及停用詞表,對(duì)文本進(jìn)行分詞處理及去除停用詞,并將處理后實(shí)驗(yàn)文本詞頻匹配關(guān)注度等級(jí),為后續(xù)關(guān)注度研究所用。
采用LDA主題模型對(duì)清洗后彈幕文本進(jìn)行主題聚類,設(shè)置模型主題數(shù)為100、超參數(shù)為0.0001、最小錯(cuò)誤率為0.01、迭代次數(shù)為50、每個(gè)主題下主題詞為2000。隨著主題詞數(shù)不斷增加,困惑度先下降再上升,如圖3所示,在主題詞數(shù)約為9時(shí)達(dá)到最小值、困惑度最低時(shí),話題與模型擬合度最佳,因此最佳主題詞K為9。
圖3 不同主題數(shù)下困惑度值
結(jié)合最佳主題詞數(shù),篩選對(duì)視頻內(nèi)容描述價(jià)值最高的主題詞作為關(guān)鍵主題詞,再將每個(gè)話題下視頻內(nèi)容及其關(guān)鍵詞(積極詞/消極詞各2個(gè))進(jìn)行匯總,詳見表3。
表3 彈幕文本主題詞/主題詞主要描述內(nèi)容
通過彈幕詞頻與其描述內(nèi)容相結(jié)合的方法對(duì)視頻主題進(jìn)行歸納總結(jié)。以Topic4為例,彈幕文本主要對(duì)近視成因、近視手術(shù)流程及適合手術(shù)人群進(jìn)行介紹,簡單介紹近視成因、每一種近視手術(shù)操作原理及生活中如何保護(hù)眼睛等知識(shí)。8個(gè)Topic所涵蓋視頻內(nèi)容具體如表3所示。9個(gè)主題中僅Topic3、Topic5與時(shí)事話題相關(guān),其他話題均與生活息息相關(guān),且都圍繞用戶自身健康問題出發(fā),以某一話題為切入點(diǎn)科普健康知識(shí)。用戶高度關(guān)注以生活習(xí)慣類為話題的健康科普視頻。由于用戶在健康信息素養(yǎng)與醫(yī)學(xué)專業(yè)人士存在一定差距,而這類貼近生活的健康知識(shí)科普視頻更易于用戶理解,因此受到的關(guān)注度較大。同時(shí),該類健康科普視頻也會(huì)涉及醫(yī)學(xué)專業(yè)知識(shí),部分具備一定專業(yè)素養(yǎng)的視頻制作者通過將自身隱性知識(shí)以口語化表述方式進(jìn)行闡述,使得專業(yè)知識(shí)通俗易懂,特別是涉及較為抽象的概念時(shí),制作者會(huì)利用視頻生動(dòng)直觀的優(yōu)勢(shì)在視頻中插入圖畫、動(dòng)畫等幫助用戶理解。可見,內(nèi)容詳實(shí)度、風(fēng)格趣味度、制作精良度等因素也會(huì)影響用戶對(duì)健康視頻的關(guān)注。相關(guān)視頻媒體不僅要圍繞用戶相對(duì)更為關(guān)注的生活類健康知識(shí)進(jìn)行科普,也應(yīng)圍繞醫(yī)學(xué)專業(yè)知識(shí)如預(yù)防流行疾病、重大疾病自檢自查,參照健康熱搜視頻的方法,將用戶鮮少接觸、了解的專業(yè)知識(shí)融入科普視頻制作,加強(qiáng)用戶健康知識(shí)教育,提升全民健康素養(yǎng)。
根據(jù)梳理總結(jié)后LDA主題歸屬文檔,將彈幕主題進(jìn)行歸類,以主題詞及其文本中彈幕實(shí)時(shí)發(fā)送日期所屬時(shí)間粒度為橫軸,各個(gè)主題詞占比為縱軸,得出各主題彈幕量隨時(shí)間變化情況及各話題詞占比情況,如圖4所示。由圖4可知,各主題詞總彈幕量隨著時(shí)間的變化而逐年增加,近兩年用戶對(duì)健康視頻關(guān)注度大幅提升,由于2021年僅有第一季度數(shù)據(jù),因此較前一年稍有下降,但按此趨勢(shì)可合理推測(cè)各話題詞總體仍會(huì)呈上升趨勢(shì)。2020年突發(fā)新冠肺炎事件,用戶居家隔離上網(wǎng)時(shí)長增加,因此,這一年主題詞數(shù)相較于前兩年陡增。如Topic6(如何去黑頭)圍繞某一針對(duì)性較強(qiáng)的話題展開,最初主動(dòng)關(guān)注該類話題為愛美或注重護(hù)膚的群體,但受疫情影響,用戶信息偶遇幾率增加[29],對(duì)該話題感興趣卻未主動(dòng)關(guān)注以及無意關(guān)注卻因網(wǎng)站推送而觀看的用戶,以此為契機(jī)關(guān)注該類話題,使得這類僅被部分群體關(guān)注的話題得到廣泛關(guān)注,視頻觀看量、點(diǎn)贊量等瀏覽數(shù)據(jù)也隨之增加。當(dāng)視頻質(zhì)量及瀏覽數(shù)據(jù)達(dá)到全站排行榜權(quán)重后,根據(jù)B站推送機(jī)制,用戶瀏覽首頁或檢索相關(guān)話題時(shí),會(huì)優(yōu)先推送該視頻,更多用戶可能會(huì)被其良好瀏覽數(shù)據(jù)或大量彈幕交互吸引并參與互動(dòng)。而Topic5(預(yù)防新冠肺炎)之所以備受關(guān)注,是因?yàn)槠錇楝F(xiàn)下熱議話題,用戶更趨向于主動(dòng)關(guān)注該話題及相關(guān)視頻。Topic4(近視手術(shù))、Topic7(熬夜猝死)、Topic8(無糖飲料)這三類話題彈幕量逐年增加,此三類話題與當(dāng)下年輕人生活及消費(fèi)習(xí)慣密切習(xí)慣,可見健康視頻關(guān)注度也受外界因素影響。如Topic4,隨著近視手術(shù)技術(shù)不斷成熟,大量年輕用戶樂于嘗試近視手術(shù)但又存在一定疑慮,因此主動(dòng)搜尋該類健康知識(shí)以幫助決定是否進(jìn)行近視手術(shù)。當(dāng)前社會(huì)環(huán)境不斷變革,醫(yī)療技術(shù)不斷完善,消費(fèi)產(chǎn)品迭代更新,大眾生活習(xí)慣及消費(fèi)意識(shí)也隨之轉(zhuǎn)變,由于數(shù)字原住民對(duì)新興事物接受能力較強(qiáng),故相較于其他群體更加關(guān)注新興技術(shù)、產(chǎn)品等話題。相關(guān)視頻媒體可針對(duì)當(dāng)下流行或新興事物所涉及的健康知識(shí)進(jìn)行科普,引導(dǎo)用戶樹立理性消費(fèi)觀,避免用戶受誤導(dǎo)盲目從眾,培養(yǎng)用戶健康生活理念。
圖4 主題-時(shí)間演化分析
以知網(wǎng)Hownet詞典為主要詞典,結(jié)合大連理工大學(xué)中文情感詞匯本體庫、清華大學(xué)TSING詞典,構(gòu)建較為全面的情感詞典,對(duì)清洗后彈幕文本進(jìn)行情感分析。彈幕文本涉及大量網(wǎng)絡(luò)用語,但在劃分詞頻匹配關(guān)注度時(shí),發(fā)現(xiàn)這些網(wǎng)絡(luò)用語均不表達(dá)實(shí)質(zhì)意義且其表達(dá)情感對(duì)本研究影響不大,因此本文未針對(duì)網(wǎng)絡(luò)用語建立情感詞表?;谇楦性~典進(jìn)行文本情感分析具體結(jié)果如圖5??梢钥闯?,不同主題的健康視頻,用戶情感并不相同,整體以積極詞居多,但也存在消極詞。隨著時(shí)間推移,用戶對(duì)視頻關(guān)注度逐年遞增,與視頻內(nèi)容及已有彈幕間交互行為也逐漸增加。雖存在一定的消極情感,但并不代表用戶對(duì)視頻內(nèi)容滿意度不高。正因?yàn)橛脩襞c視頻內(nèi)容及已有彈幕交互行為增加,用戶更易與其產(chǎn)生共鳴,針對(duì)視頻所科普及彈幕補(bǔ)充的知識(shí)表達(dá)強(qiáng)烈的個(gè)人情感及觀點(diǎn),如Topic2、Topic7,視頻主要介紹抽煙及熬夜對(duì)身體的危害,用戶知曉這類生活習(xí)慣并不健康,但深入了解其危害后所發(fā)送的彈幕帶有更強(qiáng)烈負(fù)面情感,如“抽煙得肺癌?”“害怕熬夜猝死”。
圖5 彈幕文本情感分析
依據(jù)歸類后主題詞文檔畫出文本積極詞云與消極詞云,見圖6。“抽煙”在積極詞詞云中出現(xiàn)頻率較高,因抽煙這一行為十分常見,大量用戶對(duì)此行為多有不滿,以身邊人或自身遭遇與視頻內(nèi)容、彈幕互動(dòng),贊同抽煙有害身體健康這一觀點(diǎn)的同時(shí),并愿將該視頻分享給身邊煙民。從消極詞詞云中可知,主要消極詞并非負(fù)面情感詞語,但與視頻內(nèi)容高度相關(guān),因視頻科普的健康知識(shí)涵蓋這些行為對(duì)健康的危害,故用戶在深入了解這些行為對(duì)健康造成負(fù)面影響后,結(jié)合視頻內(nèi)容及已有彈幕發(fā)表自身看法,從而流露出“害怕”“恐怖”等消極情感??梢姡糠钟脩艄睬槟芰^強(qiáng),易受視頻及彈幕內(nèi)容影響,視頻媒體可針對(duì)此特性結(jié)合彈幕互動(dòng)方式制作健康知識(shí)科普視頻,吸引用戶關(guān)注,在科普健康知識(shí)的同時(shí),傳達(dá)正確生活理念,加強(qiáng)用戶健康知識(shí)教育,改變用戶生活習(xí)慣,提升健康素養(yǎng)。
圖6 積極詞詞云(左)與消極詞詞云(右)
為搭建用戶“關(guān)注度-滿意度”框架,本文將所有話題詞包含的詞頻進(jìn)行分類,依據(jù)詞頻與視頻內(nèi)容相關(guān)程度,將關(guān)注度分為高中低三類。高度關(guān)注主要包括針對(duì)視頻整體內(nèi)容發(fā)表具體看法、補(bǔ)充視頻內(nèi)容等類型的彈幕;中度關(guān)注包括針對(duì)視頻某一內(nèi)容或彈幕發(fā)表自身相關(guān)經(jīng)歷或感受等類型的彈幕;低關(guān)注度則是沒有具體意義,僅是活躍氣氛或與其他彈幕互動(dòng)的彈幕。將分類后的關(guān)注度與彈幕詞頻進(jìn)行匹配,得出彈幕具體關(guān)注值。以關(guān)注值為縱軸、情感值作為橫軸,搭建“關(guān)注度-滿意度”框架,如圖7所示。
圖7 關(guān)注度—滿意度分析
第一象限即“高關(guān)注度—高滿意度”,包括Topic1(突發(fā)性死亡)、Topic2(抽煙)、Topic5(預(yù)防新冠肺炎)、Topic7(熬夜猝死)。用戶對(duì)于以具體介紹“某一生活習(xí)慣對(duì)于身體的影響”為話題的視頻高度關(guān)注,并對(duì)其內(nèi)容滿意度高。可見,視頻媒體可選擇某一生活習(xí)慣為主題,科普其具體負(fù)面影響,促進(jìn)用戶杜絕或減少該類生活習(xí)慣。
第二象限即“高關(guān)注度—低滿意度”,包括Topic3(美國肺炎)。Topic3主要科普美國曾爆發(fā)的肺炎,該話題為時(shí)事話題用戶十分關(guān)注,其內(nèi)容也易引發(fā)用戶熱議,表達(dá)強(qiáng)烈愛國主義情感。但由于主題特殊性,用戶情感多為消極情感、故滿意度不高。圍繞該類時(shí)事熱點(diǎn)話題所涉及健康知識(shí)制作相關(guān)科普視頻,可加深用戶記憶。
第三象限即“低關(guān)注度—低滿意度”,包括Topic0(打呼嚕)、Topic8(無糖飲料)。該類話題科普的生活習(xí)慣對(duì)人體健康危害性不大,視頻娛樂性較強(qiáng),故關(guān)注度不如其他視頻,滿意度較低。相關(guān)公眾號(hào)及個(gè)人博主等可以制作該類話題吸引用戶關(guān)注,利用其話題性,增加用戶黏性,從而促使用戶關(guān)注其他話題的健康類科普視頻。
第四象限即“低關(guān)注度—高滿意度”,包括Topic6(去黑頭)。該類視頻可能僅特定健康知識(shí)需求群體主動(dòng)關(guān)注,故關(guān)注度不高??梢姡】殿惪破找曨l不僅可以科普身體健康知識(shí),還可以選擇科普皮膚護(hù)理、口腔保健等特定健康知識(shí)。相關(guān)企業(yè)可針對(duì)用戶需求,設(shè)立上述健康知識(shí)專欄或公眾號(hào),吸引用戶關(guān)注。
本文基于B站健康熱搜視頻彈幕數(shù)據(jù),對(duì)網(wǎng)絡(luò)健康視頻關(guān)注度的影響因素進(jìn)行了探討,對(duì)彈幕文本主題進(jìn)行主題聚類與情感分析,得出以下結(jié)論。
(1)用戶關(guān)注話題廣泛且更愿觀看瀏覽數(shù)據(jù)良好的視頻。結(jié)合視頻內(nèi)容、瀏覽數(shù)據(jù)及主題聚類結(jié)果可知,B站用戶關(guān)注話題多樣化且興趣范圍廣泛。與其他群體不同,B站用戶觀看健康視頻并不以尋醫(yī)問診為需求導(dǎo)向,故選擇視頻時(shí)并不局限于了解某一特定疾病知識(shí),更愿選擇內(nèi)容詳實(shí)、表述生動(dòng)幽默易理解的健康視頻,并樂于發(fā)送彈幕進(jìn)行互動(dòng),在了解知識(shí)的同時(shí)實(shí)現(xiàn)其社交需求。由于數(shù)字原住民本就對(duì)新鮮事物感興趣,新穎的話題或視頻中新興的彈幕文化會(huì)吸引其關(guān)注。可見,提供科普健康知識(shí)服務(wù)的專業(yè)軟件或平臺(tái)可考慮借鑒B站交互模式滿足年輕一代用戶群體需求,在科普知識(shí)的同時(shí)實(shí)現(xiàn)其社交需求,順應(yīng)其獵奇心理,更好地為年輕群體提供更為全面的健康知識(shí)。
(2)網(wǎng)絡(luò)健康視頻用戶關(guān)注度逐年增加。通過主題演化分析可知,用戶對(duì)健康類視頻關(guān)注度隨時(shí)間變化逐年遞增。隨著B站不斷發(fā)展轉(zhuǎn)型,不僅是二次元文化愛好者,越來越多的用戶開始利用B站了解知識(shí),其中熱點(diǎn)話題更易引起用戶廣泛關(guān)注,由于互聯(lián)網(wǎng)用戶普遍存在從眾心理[13],針對(duì)熱點(diǎn)問題制作健康視頻傳播效果更為明顯。利用這一特點(diǎn),官方媒體及品牌賬號(hào)等可以結(jié)合時(shí)下熱點(diǎn)話題展開知識(shí)科普或形象推廣。此外,數(shù)字原住民是B站主要用戶群體,部分用戶仍未成年,對(duì)其中信息及情感難以把控,視頻制作者應(yīng)保持客觀立場(chǎng),幫助年輕用戶樹立正確的世界觀、人生觀、價(jià)值觀,傳遞積極生活態(tài)度,培養(yǎng)健康生活習(xí)慣。
(3)用戶關(guān)注度易受視頻內(nèi)容及彈幕文化影響。結(jié)合主題聚類與文本情感分析可知,科普某一生活習(xí)慣負(fù)面影響的視頻,用戶流露出的消極情感與視頻內(nèi)容走向一致,大量彈幕會(huì)重復(fù)視頻某一句話或某一彈幕以表達(dá)其態(tài)度及情感。如Topic7(熬夜)用戶在深入了解相關(guān)健康知識(shí)后決定改變這一習(xí)慣,大量“刷屏”今后不再過度熬夜或做到早睡早起等??梢?,該群體易與媒介文本及他人產(chǎn)生共鳴,其觀點(diǎn)與態(tài)度也易受外界影響而產(chǎn)生轉(zhuǎn)變。全媒體時(shí)代,年輕用戶已成為視頻媒體主要受眾群體[30],各大視頻媒體可針對(duì)年輕群體行為偏好并結(jié)合其關(guān)注熱點(diǎn)話題制作視頻,科普健康知識(shí)如醫(yī)學(xué)常識(shí)、自救知識(shí)、養(yǎng)生知識(shí)等,以其喜愛的彈幕視頻方式呈現(xiàn),加深用戶記憶以實(shí)現(xiàn)教育目的。
(4)用戶關(guān)注度受滿意度影響。通過匹配“關(guān)注度—滿意度”發(fā)現(xiàn),高關(guān)注度用戶更關(guān)注視頻內(nèi)容,中關(guān)注度用戶傾向于表達(dá)個(gè)人觀點(diǎn),而低關(guān)注度用戶可能因偶遇信息多在和彈幕互動(dòng),可見,話題更貼近生活的健康類熱搜視頻用戶對(duì)其關(guān)注度與滿意均較高,因此視頻媒體可選擇該類話題制作健康科普視頻,以常見生活現(xiàn)象科普健康知識(shí)、倡導(dǎo)健康生活理念。而娛樂性為主的視頻如Topic8(無糖飲料),雖用戶關(guān)注度及滿意度相較于其他Topic不高,但其本身為熱搜視頻擁有一定關(guān)注度,且為年輕群體興趣較高話題,故視頻媒體可適當(dāng)制作娛樂為主的健康視頻,吸引用戶關(guān)注,增加用戶粘性,以其樂于關(guān)注的話題切入健康知識(shí),幫助用戶改善生活方式,培養(yǎng)健康生活習(xí)慣。
“健康中國”戰(zhàn)略不斷推進(jìn),5G技術(shù)日趨成熟,網(wǎng)絡(luò)視頻正逐漸成為用戶獲取健康知識(shí)主要途徑。本文通過對(duì)網(wǎng)絡(luò)健康熱搜視頻彈幕文本進(jìn)行主題聚類及情感分析,探究影響用戶對(duì)網(wǎng)絡(luò)健康視頻關(guān)注度因素,為視頻媒體精準(zhǔn)選取用戶關(guān)注的健康類話題提供參考,以期更好地加深用戶對(duì)健康知識(shí)的了解,倡導(dǎo)健康生活理念,助力“健康中國”戰(zhàn)略發(fā)展。在研究時(shí)發(fā)現(xiàn),B站獨(dú)特的彈幕文化格外吸引數(shù)字原住民,該類群體活躍在彈幕視頻平臺(tái)且行為偏好明顯,后續(xù)研究可在細(xì)化其群體特征基礎(chǔ)上進(jìn)行深入探究。