王晉 支茵
摘?要:[目的/意義]生活習(xí)慣和飲食習(xí)慣等因素導(dǎo)致肥胖成為社會(huì)公眾普遍關(guān)注的健康問(wèn)題,減肥信息成為社會(huì)公眾健康信息需求中的重要內(nèi)容。文章對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)用戶的減肥信息需求主題特征展開(kāi)研究,主要關(guān)注不同性別用戶減肥信息需求特征,為減肥信息服務(wù)的社會(huì)支持提供一定的幫助。[方法/過(guò)程]文章利用網(wǎng)絡(luò)爬蟲(chóng)抓取“知乎”減肥話題下的問(wèn)答文本數(shù)據(jù),利用LDA主題模型對(duì)用戶數(shù)據(jù)進(jìn)行自動(dòng)主題識(shí)別,通過(guò)分析主題特征發(fā)現(xiàn)用戶減肥信息需求特征,并從性別差異視角分析不同性別用戶的減肥信息需求差異。[結(jié)果/結(jié)論]用戶減肥信息需求呈現(xiàn)出多樣化、專(zhuān)業(yè)化的特點(diǎn)。網(wǎng)絡(luò)社區(qū)用戶在交流減肥信息的同時(shí)也在尋求情感的社會(huì)支持和獲得情感的釋放。男性用戶的減肥信息需求更加科學(xué)化和專(zhuān)業(yè)化,注重身材的健美和營(yíng)養(yǎng)的均衡;女性用戶則更加關(guān)注能夠快速改變身材外形的信息內(nèi)容。
關(guān)鍵詞:性別差異;網(wǎng)絡(luò)問(wèn)答社區(qū);減肥信息;信息需求
DOI:10.3969/j.issn.1008-0821.2021.02.009
〔中圖分類(lèi)號(hào)〕G252.0?〔文獻(xiàn)標(biāo)識(shí)碼〕A?〔文章編號(hào)〕1008-0821(2021)02-0089-08
Abstract:[Purpose/Significance]Obesity caused by lifestyle and diet has already become a health problem of public concern,and weight loss information plays an important role in needs of information on public fitness.This research focuses on the thematic characteristics of weight loss information needs of users in the online Q&A community,mainly focuses on the gender differences of individual in information needs on weight loss,as support the related social services.[Method/Process]The research implemented a web crawler to extract pieces of original information in the‘Weight Loss Sectionin‘zhihu.com,from which the LDA model was utilized to analysis.With the illustrated pipeline,demands for losing weight were differentiated from the perspective of gender differences by thematic characteristic analysis.[Result/Conclusion]The representations of the information needs on weight loss were diversified and specialized,and people who engaged in discussion and interaction of messages like this,were at the same time,seeking for emotional support and release.In the view of gender gaps,male prefers more scientific and professional information,keeping their body shape and balanced diet.Female was in favor of the content that leads a rapid change on their figure.
Key words:gender differences;Q&A community;weight loss information;information needs
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第46次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2020年6月我國(guó)網(wǎng)民規(guī)模達(dá)9.40億,互聯(lián)網(wǎng)普及率達(dá)67%[1]。龐大的網(wǎng)民規(guī)模和不斷提升的互聯(lián)網(wǎng)普及率反映出互聯(lián)網(wǎng)與群眾生活結(jié)合日趨緊密,互聯(lián)網(wǎng)在人們?nèi)粘P畔@取中發(fā)揮著越來(lái)越重要的作用。隨著人們健康信息需求的不斷增長(zhǎng),互聯(lián)網(wǎng)由于其信息資源豐富、使用便捷等特點(diǎn),正在成為社會(huì)公眾獲取健康信息的重要渠道。網(wǎng)絡(luò)問(wèn)答社區(qū)(Q&A Community)是以問(wèn)題為核心、交互為手段、共享為模式的社交網(wǎng)絡(luò)平臺(tái)[2]。網(wǎng)絡(luò)問(wèn)答社區(qū)具有開(kāi)放性、匿名性、便捷性、交互性等特點(diǎn),已被社會(huì)公眾廣泛認(rèn)可。網(wǎng)絡(luò)問(wèn)答社區(qū)以其特有的信息交互方式激發(fā)用戶知識(shí)創(chuàng)新,用戶的知識(shí)創(chuàng)新不僅有助于解決提問(wèn)者和參與者的現(xiàn)實(shí)生活問(wèn)題,甚至還能實(shí)現(xiàn)網(wǎng)絡(luò)虛擬社區(qū)平臺(tái)創(chuàng)新知識(shí)的輸出[3],例如截至2018年11月底,網(wǎng)絡(luò)問(wèn)答社區(qū)“知乎”用戶數(shù)破2.2億,同比增長(zhǎng)102%[4],輸出《知乎周刊》《知乎「鹽」系列》等高品質(zhì)話題討論的知識(shí)產(chǎn)出[5]??梢?jiàn)網(wǎng)絡(luò)問(wèn)答社區(qū)已成為公眾搜尋與獲取信息、解決日常生活問(wèn)題不可或缺的信息資源平臺(tái)[6]。
生活習(xí)慣和飲食習(xí)慣等因素導(dǎo)致肥胖成為社會(huì)公眾普遍關(guān)注的健康問(wèn)題,因此減肥信息也成為社會(huì)公眾健康信息需求中的重要內(nèi)容。騰訊廣告與騰訊新聞ConTech數(shù)據(jù)實(shí)驗(yàn)室聯(lián)合發(fā)布的《大健康行業(yè)數(shù)據(jù)洞察報(bào)告2019》顯示,僅在2019年上半年,騰訊新聞健康內(nèi)容的點(diǎn)擊/播放量就突破了41億次。用戶最關(guān)注的生活方式關(guān)鍵詞中“減肥”成為關(guān)注度最高的熱詞,閱讀量達(dá)10 003.5萬(wàn)次[7]。越來(lái)越多的社會(huì)公眾利用網(wǎng)絡(luò)問(wèn)答社區(qū)獲取減肥信息、分享減肥知識(shí)與經(jīng)驗(yàn)以及尋求社交和情感支持[8]。用戶在利用網(wǎng)絡(luò)問(wèn)答社區(qū)獲取和分享減肥信息過(guò)程中關(guān)注的熱點(diǎn)內(nèi)容是什么?不同性別人群的減肥信息需求有何差異?圍繞此類(lèi)問(wèn)題,本研究以網(wǎng)絡(luò)問(wèn)答社區(qū)“知乎”為數(shù)據(jù)來(lái)源,利用文本挖掘的方法,針對(duì)不同性別減肥信息需求的主題特征展開(kāi)探索性研究。
1?相關(guān)文獻(xiàn)回顧
互聯(lián)網(wǎng)的匿名性可減少患者的顧慮,能夠更加真實(shí)地表達(dá)出患者的信息需求。公眾利用網(wǎng)絡(luò)問(wèn)答社區(qū)在線咨詢不受時(shí)間、空間的約束,能夠隨時(shí)隨地進(jìn)行提問(wèn),也極大地拓寬了獲取健康信息的方式,對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)的問(wèn)答內(nèi)容進(jìn)行文本挖掘研究,能夠更好地發(fā)現(xiàn)患者真實(shí)的健康需求[9]。目前網(wǎng)絡(luò)問(wèn)答社區(qū)的健康信息需求研究,一般以問(wèn)答內(nèi)容為數(shù)據(jù)來(lái)源,采用內(nèi)容分析、主題編碼和文本挖掘等方式,發(fā)現(xiàn)用戶關(guān)注的焦點(diǎn)內(nèi)容,理解和揭示用戶客觀、真實(shí)的健康信息需求。
研究者關(guān)注的網(wǎng)絡(luò)問(wèn)答社區(qū)類(lèi)型主要包綜合性網(wǎng)絡(luò)問(wèn)答社區(qū)和在線健康社區(qū)(Online Health Community,OHC)兩種類(lèi)型。綜合性問(wèn)答社區(qū)涵蓋與公眾生活、工作和學(xué)習(xí)相關(guān)的各方面話題內(nèi)容,用戶數(shù)量大、內(nèi)容豐富是其典型特點(diǎn),研究其中包含的大量健康類(lèi)相關(guān)問(wèn)答內(nèi)容能發(fā)現(xiàn)公眾的健康信息需求。如An O等以2014年日本“雅虎問(wèn)答”中與乳腺癌相關(guān)的問(wèn)題為數(shù)據(jù)源,通過(guò)編碼方式進(jìn)行分類(lèi),在2 392個(gè)選定的問(wèn)題中,確定了6個(gè)主要類(lèi)別:疑似癥狀、篩查、治療、生活、預(yù)防、其他,反映日本乳腺癌相關(guān)的用戶信息需求[10]。金碧漪等以英文健康社區(qū)“雅虎問(wèn)答”為例,抓取與糖尿病有關(guān)的8 762條提問(wèn)記錄,依據(jù)糖尿病信息的特點(diǎn)及分類(lèi)策略對(duì)這些信息進(jìn)行手工編碼,通過(guò)文本處理獲取表達(dá)用戶信息需求的中心詞,并以聚類(lèi)的方式獲取用戶的最大關(guān)注點(diǎn)[11]。鄧勝利等從“百度知道”平臺(tái)中抽取6 888條有關(guān)高血壓的提問(wèn)和回答,并對(duì)這些文本進(jìn)行研究,發(fā)現(xiàn)用戶對(duì)于高血壓健康信息的關(guān)注重點(diǎn)[12]。在線健康社區(qū)大致可以分為兩類(lèi):一是醫(yī)患互動(dòng)形式的P2D(Patient to Doctor)社區(qū),例如好大夫網(wǎng)站、尋醫(yī)問(wèn)藥網(wǎng)等;二是病友間相互交流的P2P(Patient to Patient)社區(qū),例如甜蜜家園、慢友幫等[13]。在線健康社區(qū)的參與者主要是醫(yī)護(hù)人員、患者和患者家屬等,主要專(zhuān)注于健康知識(shí)的交流和共享,分析在線健康社區(qū)的問(wèn)答內(nèi)容更能更加專(zhuān)業(yè)的獲取用戶健康信息需求。如李為在“尋醫(yī)問(wèn)藥網(wǎng)”糖尿病頻道抓取了共35 000條提問(wèn)數(shù)據(jù),對(duì)健康問(wèn)答社區(qū)進(jìn)行主題識(shí)別,挖掘患者真實(shí)信息需求[9]。石靜等抽取“慢友幫”和“DailyStrength”兩大在線健康社區(qū)中糖尿病主題下的問(wèn)答數(shù)據(jù),識(shí)別國(guó)內(nèi)外健康問(wèn)答社區(qū)用戶信息需求的特征與異同[14]。
目前,網(wǎng)絡(luò)問(wèn)答社區(qū)的健康信息需求研究的常見(jiàn)思路是利用網(wǎng)絡(luò)爬蟲(chóng)抓取獲得問(wèn)答文本數(shù)據(jù),進(jìn)行數(shù)據(jù)清洗之后,采用人工編碼、詞頻統(tǒng)計(jì)或主題識(shí)別的方法發(fā)現(xiàn)用戶關(guān)注的熱點(diǎn)主題,揭示用戶健康信息需求。網(wǎng)絡(luò)問(wèn)答社區(qū)的健康信息需求內(nèi)容研究多以具體疾病為主題開(kāi)展研究,目前主要關(guān)注的疾病種類(lèi)有糖尿病[9,11,14]、高血壓[12]、癌癥[10,15-16]等。各類(lèi)疾病的健康信息需求主要包括:癥狀、確診、治療、預(yù)防等主題。此外網(wǎng)絡(luò)問(wèn)答社區(qū)中的健康保健類(lèi)信息需求正在被部分研究者所關(guān)注,如劉冰等指出在健康網(wǎng)絡(luò)社區(qū)中,處于母親身份轉(zhuǎn)換初期(即備孕期)女性的信息需求呈現(xiàn)多樣化特點(diǎn),社交網(wǎng)絡(luò)平臺(tái)是處于該階段女性的重要信息獲取平臺(tái)[17]。
減肥已成為社會(huì)公眾廣泛關(guān)注的日常健康保健問(wèn)題,公眾利用互聯(lián)網(wǎng)獲取和分享減肥信息的相關(guān)問(wèn)題正在引起信息行為領(lǐng)域研究者的關(guān)注。Schwartz J等研究發(fā)現(xiàn),大多數(shù)肥胖者試圖通過(guò)互聯(lián)網(wǎng)來(lái)獲取減肥信息[18]。Cerri E M等指出,隨著肥胖成為一個(gè)重要的公共健康問(wèn)題,個(gè)人可以從YouTube上清晰、簡(jiǎn)潔的信息中獲得有效、安全和長(zhǎng)期的體重管理指導(dǎo)[19]。Alassiri S A等研究發(fā)現(xiàn)Twitter有助于公眾獲取健康信息,預(yù)防和治療疾病,受訪者中有59.6%的人關(guān)注減肥信息[20]。劉奕瑤研究發(fā)現(xiàn),不同群體的肥胖人群都對(duì)網(wǎng)絡(luò)健康信息有著一定的認(rèn)可度,大部分人會(huì)主動(dòng)搜索網(wǎng)絡(luò)健康信息滿足自己的需求,新媒體滿足了肥胖者對(duì)健康信息的需求,新媒體的便捷性也讓肥胖者尋找健康信息的過(guò)程變得輕松[21]。劉艷笑將減肥信息定義為,所有與保持或減輕肥胖程度,以保持適度體型或防病治病等相關(guān)的信息,包涵健身知識(shí)、醫(yī)藥知識(shí)以及飲食信息等諸多內(nèi)容[22]。目前,已有少數(shù)研究者關(guān)注網(wǎng)絡(luò)問(wèn)答社區(qū)中的減肥信息需求,左賢莉采用關(guān)鍵詞統(tǒng)計(jì)的方法對(duì)“39減肥論壇”中的帖子提取關(guān)鍵詞進(jìn)行主題歸類(lèi),獲得9類(lèi)主題,并發(fā)現(xiàn)在“減肥宣言”“減肥咨詢”和“減肥日記”主題下的帖子數(shù)最多,其次是“減肥成功”“情感表達(dá)”和“減肥運(yùn)動(dòng)”類(lèi)帖子,而“減肥食譜”“健康研究”和“其他”的帖子數(shù)相對(duì)較少[23]。
縱觀國(guó)內(nèi)外現(xiàn)有研究,網(wǎng)絡(luò)問(wèn)答社區(qū)的健康信息需求研究正在被越來(lái)越多的研究者所關(guān)注,研究成果不斷涌現(xiàn),研究?jī)?nèi)容從關(guān)注常見(jiàn)疾病信息需求過(guò)渡到多元化的健康信息需求,健康保健類(lèi)信息需求成為研究者關(guān)注的新熱點(diǎn)。網(wǎng)絡(luò)問(wèn)答社區(qū)的減肥信息需求研究還比較少,對(duì)不同性別人群的減肥信息需求研究則更為少見(jiàn),本研究擬從性別差異視角采用文本挖掘的方法,研究網(wǎng)絡(luò)問(wèn)答社區(qū)中不同性別人群的減肥信息需求主題特征。
2?研究設(shè)計(jì)
綜合性網(wǎng)絡(luò)問(wèn)答社區(qū)的用戶來(lái)源廣泛,內(nèi)容綜合多元,更有利于獲得多角度、全方位的公眾觀點(diǎn)和態(tài)度[24]。減肥是社會(huì)公眾普遍關(guān)注的健康問(wèn)題,全面調(diào)查網(wǎng)絡(luò)問(wèn)答社區(qū)中的用戶減肥信息需求更適合選取綜合性網(wǎng)絡(luò)問(wèn)答社區(qū)為數(shù)據(jù)獲取平臺(tái)。知乎用戶來(lái)源范圍廣、層次多及其低商業(yè)化特點(diǎn),使得從知乎爬取的文本數(shù)據(jù)能夠反映更廣泛、真實(shí)的公眾觀點(diǎn)、態(tài)度和立場(chǎng)等信息[24],故本研究選取綜合性網(wǎng)絡(luò)問(wèn)答社區(qū)“知乎”為數(shù)據(jù)獲取平臺(tái)。本研究采用文本挖掘的方法,以“知乎”社區(qū)中“減肥”話題下的問(wèn)答文本為研究數(shù)據(jù)來(lái)源,對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行深入挖掘與分析,通過(guò)抽取文本主題,進(jìn)而識(shí)別出用戶的減肥信息需求及特征。研究流程如圖1所示,總體分為5個(gè)步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、選取最佳主題個(gè)數(shù)、構(gòu)建LDA模型以及話題挖掘與對(duì)比分析。
2.1?數(shù)據(jù)獲取與預(yù)處理
在遵循相關(guān)爬蟲(chóng)協(xié)議的前提下,通過(guò)自編Python網(wǎng)絡(luò)爬蟲(chóng)程序抓取知乎減肥話題下2011—2019年間具有性別標(biāo)識(shí)的有效數(shù)據(jù)共計(jì)120 549條,其中男性用戶數(shù)據(jù)53 980條,女性用戶數(shù)據(jù)66 569條,以此形成原始文本數(shù)據(jù)集。
為便于后續(xù)進(jìn)行LDA(Latent Dirichlet Allocation)主題建模,首先對(duì)原始文本數(shù)據(jù)集進(jìn)行清洗降噪處理,剔除無(wú)意義的鏈接及空格等,將英文字母大寫(xiě)轉(zhuǎn)換為小寫(xiě),將中文繁體字轉(zhuǎn)換為簡(jiǎn)體字,然后利用Python第三方庫(kù)——Jieba庫(kù)對(duì)文本進(jìn)行分詞,并調(diào)用哈工大停用詞典去除停用詞。
2.2?LDA模型簡(jiǎn)介
學(xué)者Blei D M等在2003年提出了潛在狄利克雷分配(Latent Dirichlet Allocation)模型,簡(jiǎn)稱LDA模型[25]。其核心是三層貝葉斯概率分布,主要思想是假設(shè)每個(gè)文檔由多個(gè)主題構(gòu)成,每個(gè)主題則是多個(gè)詞匯上的概率分布[26]。
LDA模型生成過(guò)程可描述如下:
圖2中,K為主題個(gè)數(shù);M為文檔個(gè)數(shù);Nm為第m個(gè)文檔單詞總數(shù);為每個(gè)文檔下的主題Dirichlet先驗(yàn)參數(shù);為每個(gè)文檔下的主題Dirichlet先驗(yàn)參數(shù);為第m個(gè)文檔下的主題分布;為第k個(gè)主題下的單詞分布;zm,n為第m個(gè)文檔的第n個(gè)詞的主題;wm,n為第m個(gè)文檔的第n個(gè)詞。
2.3?基于LDA模型的主題抽取
LDA模型主題個(gè)數(shù)K值需要預(yù)先給定并且在主題抽取實(shí)踐中對(duì)主題敏感度較高,因此確定主題個(gè)數(shù)尤為重要。Blei D M等在2003年提出可以用計(jì)算困惑值(Perplexity)的方法來(lái)評(píng)價(jià)主題模型的泛化程度,從而選取最優(yōu)主題個(gè)數(shù)。一般而言困惑值隨主題個(gè)數(shù)的增多而遞減,困惑值越小,主題的泛化程度越好[25]。本研究使用Python中的Scikit-learn庫(kù)進(jìn)行數(shù)據(jù)處理與分析。首先調(diào)用lda.perplexity()函數(shù)求取困惑值,遍歷10~40個(gè)主題得到結(jié)果如圖3所示,最終確定最佳主題個(gè)數(shù)為30。
然后調(diào)用LatentDirichletAllocation()函數(shù)進(jìn)行LDA主題建模,其中主題個(gè)數(shù)n_topics=30,最大迭代次數(shù)max_iter=50。同時(shí)獲取LDA模型中文檔主題的概率分布,并根據(jù)不同用戶類(lèi)別,將文檔離散到對(duì)應(yīng)類(lèi)別中,以求取不同用戶對(duì)不同話題關(guān)注的強(qiáng)度。最后調(diào)用pyLDAvis()函數(shù)對(duì)總體主題分布進(jìn)行可視化處理。
3?數(shù)據(jù)分析與討論
3.1?數(shù)據(jù)量總體分析
在獲取的120 549條具有明顯性別標(biāo)識(shí)的數(shù)據(jù)中,男性用戶數(shù)據(jù)53 980條,女性用戶數(shù)據(jù)66 569條。按年度分別統(tǒng)計(jì)男性和女性發(fā)帖量,用戶發(fā)帖量年度趨勢(shì)如圖4所示。從用戶發(fā)帖量趨勢(shì)可以明確看出,從2011年起男性用戶和女性用戶的發(fā)帖量呈現(xiàn)同步波動(dòng)和遞增趨勢(shì),尤其從2017年開(kāi)始,用戶發(fā)帖量顯著增加,表明用戶對(duì)于減肥話題的關(guān)注度越來(lái)越高,減肥信息需求快速增長(zhǎng)。2017年以后女性用戶的發(fā)帖量明顯高于男性用戶的發(fā)帖量,表明女性用戶比男性用戶更加關(guān)注減肥信息。
3.2?用戶信息需求主題特征分析
利用LDA主題模型對(duì)用戶數(shù)據(jù)進(jìn)行自動(dòng)主題識(shí)別,通過(guò)分析主題特征發(fā)現(xiàn)用戶減肥信息需求特征。用戶數(shù)據(jù)的主題識(shí)別能夠揭示用戶信息需求的主要關(guān)注熱點(diǎn)以及關(guān)注熱度,但主題模型無(wú)法自動(dòng)生成每個(gè)Topic的主題名稱,故將抽取出的30個(gè)主題進(jìn)行人工分類(lèi)并命名。用戶信息需求的主題特征分布如表1所示。為了直觀識(shí)別主題比重及分布,本研究采用多維尺度分析(Multidimensional Scaling,MDS)利用主題間的相似性構(gòu)建多維空間到低維空間映射,從而可視化LDA主題的相互關(guān)系,直觀地識(shí)別核心主題,結(jié)果如圖5所示。
如表1所示,綜觀數(shù)據(jù)可以看出用戶的減肥信息需求呈現(xiàn)出多樣化、范圍廣、跨度大等特點(diǎn),重點(diǎn)鮮明且內(nèi)容涵蓋廣泛。用戶重點(diǎn)關(guān)注的減肥信息主要集中在經(jīng)驗(yàn)感悟分享、健身訓(xùn)練、營(yíng)養(yǎng)與飲食、減肥研究和節(jié)食減肥5方面,總占比超過(guò)80%。占比最大的是經(jīng)驗(yàn)感悟分享類(lèi)信息,比重達(dá)到35.7%,這表明知乎用戶在網(wǎng)絡(luò)問(wèn)答社區(qū)歸屬感的驅(qū)動(dòng)下更樂(lè)于交流和分享經(jīng)驗(yàn)感悟。健身訓(xùn)練、營(yíng)養(yǎng)與飲食和減肥研究占比分別為14.9%、13.7%和9.6%,與之形成對(duì)比的是減肥藥與醫(yī)學(xué)美容等主題僅占據(jù)總體比重的2.3%和1.6%,這體現(xiàn)出人們?cè)跍p肥信息的搜尋、獲取和交流過(guò)程中,關(guān)注重心聚焦于更加健康、科學(xué)的信息內(nèi)容上,信息需求趨向?qū)I(yè)化,而不僅僅只關(guān)注體重和外形的變化,逐漸摒棄了以損害身體健康為代價(jià)來(lái)?yè)Q取體重減輕的減肥信息。值得注意的是節(jié)食減肥也占據(jù)了相對(duì)較大的比重,為7.1%,這說(shuō)明在急切求美心理的驅(qū)使下,用戶對(duì)能達(dá)到快速瘦身效果的相關(guān)信息需求也達(dá)到了一定比重。
如圖5所示,主題分析結(jié)果表明與減肥信息主題最相關(guān)的30個(gè)關(guān)鍵詞,排名前2位的關(guān)鍵詞是“運(yùn)動(dòng)”與“健身”,這些詞中大部分都與健身運(yùn)動(dòng)與營(yíng)養(yǎng)飲食相關(guān)。我國(guó)學(xué)者對(duì)減肥的研究從20世紀(jì)90年代末開(kāi)始由藥物轉(zhuǎn)向運(yùn)動(dòng)[27],隨著人們科學(xué)素養(yǎng)的提高以及對(duì)健康的重視,與運(yùn)動(dòng)相關(guān)的信息在減肥信息中的出現(xiàn)頻率攀升到了一個(gè)新的高度。越來(lái)越多的人更加注重科學(xué)的減肥瘦身,因此“健身房”“訓(xùn)練”“體脂率”“蛋白質(zhì)”“脂肪”“熱量”等關(guān)鍵詞迅速成為減肥信息的常見(jiàn)內(nèi)容。
3.3?性別差異下信息需求對(duì)比分析
根據(jù)每篇文檔中的主題構(gòu)成情況來(lái)計(jì)算出不同性別用戶的信息需求差異情況,男、女性用戶的減肥信息需求對(duì)比如表2和圖6所示。
如表2和圖6所示,不同性別用戶對(duì)減肥信息的關(guān)注重點(diǎn)有著顯著的差異,男性用戶對(duì)健身訓(xùn)練、減肥研究和有氧運(yùn)動(dòng)的關(guān)注度明顯高于女性用戶,而女性用戶對(duì)經(jīng)驗(yàn)感悟分享、節(jié)食減肥、局部瘦身和減肥藥的關(guān)注度要遠(yuǎn)高于男性用戶。這表明男性用戶相較于女性在減肥信息交流、獲取與分享行為方面更加科學(xué)化和專(zhuān)業(yè)化,男性用戶對(duì)運(yùn)動(dòng)和減肥研究的高關(guān)注進(jìn)一步表明男性用戶更加偏好用科學(xué)和健康的方法來(lái)實(shí)現(xiàn)形體的健美而不是在短期內(nèi)追求身體的纖細(xì)。
經(jīng)驗(yàn)分享類(lèi)主題的比重在男性用戶和女性用戶的減肥信息需求中都占據(jù)了最大比重,女性用戶的信息需求中經(jīng)驗(yàn)分享類(lèi)主題比重達(dá)到了43.9%,明顯高于男性用戶,表明女性用戶比男性用戶有更多的情感依賴和傾訴欲,孤獨(dú)和壓抑等情緒會(huì)促使其在網(wǎng)絡(luò)空間中進(jìn)行信息交互以尋求情感的社會(huì)支持或獲得情感的釋放[28]。同時(shí)也體現(xiàn)出網(wǎng)絡(luò)問(wèn)答社區(qū)不僅是一個(gè)重要的信息獲取和交流的平臺(tái),也是一個(gè)情感傾訴的平臺(tái)。
女性用戶對(duì)于節(jié)食減肥、局部瘦身和減肥藥等信息的高關(guān)注度表明女性用戶比男性用戶對(duì)身體纖細(xì)的外形有更高的要求。同時(shí)也有研究表明,在通過(guò)運(yùn)動(dòng)來(lái)減肥的對(duì)比實(shí)驗(yàn)中,男性用戶往往比女性用戶減去更多的體重,這與生理和心理的性別差異有著密切的關(guān)系,這也印證了本研究的結(jié)果,從側(cè)面說(shuō)明男性比女性更適合采用運(yùn)動(dòng)的方式來(lái)達(dá)到減肥的目的[29]。
4?研究結(jié)論與討論
本研究利用網(wǎng)絡(luò)爬蟲(chóng)程序獲取“知乎”社區(qū)減肥話題下的文本數(shù)據(jù),借助文本挖掘方法,分析得到不同性別用戶的減肥信息需求,研究得出以下結(jié)論:
1)用戶減肥信息需求呈現(xiàn)出多樣化、專(zhuān)業(yè)化的特點(diǎn)。用戶的減肥信息需求內(nèi)容廣泛、主題多樣,具有科學(xué)化、多樣化的特征。用戶的減肥信息需求不僅僅局限于減肥本身和體重的變化,更加關(guān)注體脂率、飲食營(yíng)養(yǎng)、睡眠、健身訓(xùn)練和有氧運(yùn)動(dòng)等更加專(zhuān)業(yè)的信息內(nèi)容。
2)網(wǎng)絡(luò)社區(qū)用戶在交流減肥信息的同時(shí)也在尋求情感的社會(huì)支持和獲得情感的釋放。經(jīng)驗(yàn)感悟分享在所有主題類(lèi)別中占據(jù)了最高的比重,這表明用戶在網(wǎng)絡(luò)社區(qū)中更容易建立起歸屬感和認(rèn)同感,用戶在分享各種減肥相關(guān)信息的同時(shí)也愿意分享自己與減肥相關(guān)的經(jīng)驗(yàn)感悟和心路歷程等。在我國(guó)嚴(yán)峻的肥胖趨勢(shì)蔓延下[30],“減肥”不僅是一個(gè)與公共健康相關(guān)的話題,與之相關(guān)的社會(huì)心理問(wèn)題也不容忽視。知乎用戶在“減肥”這一話題的討論中對(duì)由肥胖產(chǎn)生的心理問(wèn)題、婚戀問(wèn)題和其他社會(huì)問(wèn)題的討論占到了很大比重。在相關(guān)話題討論中,用戶大都能得到正面的積極的回應(yīng),其情緒也能隨著信息需求的表達(dá)、交流和被滿足而發(fā)生正向的轉(zhuǎn)變,這表明網(wǎng)絡(luò)社區(qū)是用戶情感交流和宣泄的重要渠道,也說(shuō)明網(wǎng)絡(luò)社區(qū)的存在對(duì)提升大眾心理健康水平起到了一定的積極作用。
3)不同性別用戶的減肥信息需求有顯著差異。男性用戶的減肥信息需求更加科學(xué)化和專(zhuān)業(yè)化,注重身材的健美和營(yíng)養(yǎng)的均衡;女性用戶則更加關(guān)注能夠快速改變身材外形的信息內(nèi)容,對(duì)外表的關(guān)注程度要遠(yuǎn)高于男性,且對(duì)產(chǎn)后瘦身等專(zhuān)屬于女性的主題也有較高關(guān)注度。關(guān)于性別差異的社會(huì)學(xué)研究中也提到,社會(huì)對(duì)于男性的肥胖是容忍的態(tài)度,往往會(huì)從健康的角度來(lái)倡導(dǎo)男性減肥,而女性則是追求極致的苗條以外形的優(yōu)勢(shì)在男權(quán)社會(huì)中謀求更多的社會(huì)資源[31]。女性對(duì)于身材外形比男性有著更高的負(fù)面評(píng)價(jià),當(dāng)感受到減肥的壓力時(shí)會(huì)對(duì)身體產(chǎn)生更強(qiáng)烈的消極情緒[32]。本研究的結(jié)果與關(guān)于性別差異的社會(huì)學(xué)研究結(jié)果相互印證,說(shuō)明了在社會(huì)生活中減肥給女性帶來(lái)更大壓力,而男性相較于女性則把減肥更多地與身體健康聯(lián)系在一起。另外女性用戶對(duì)經(jīng)驗(yàn)感悟分享有著極高的關(guān)注,這表明在問(wèn)題的討論與信息的交流中男性往往比女性更加理性,而女性則更加感性,有更強(qiáng)的情感依賴和傾訴欲,更傾向于在網(wǎng)絡(luò)社區(qū)謀求認(rèn)同感和歸屬感。
本研究存在的局限:首先網(wǎng)絡(luò)問(wèn)答社區(qū)的數(shù)據(jù)噪音大,很多網(wǎng)絡(luò)用語(yǔ)、新生詞、錯(cuò)別字和符號(hào)語(yǔ)言等對(duì)主題抽取的準(zhǔn)確性會(huì)造成一定的影響。其次由于知乎社區(qū)的反爬機(jī)制和實(shí)驗(yàn)條件的限制,本研究未能采用知乎減肥話題下全部的文本作為實(shí)驗(yàn)數(shù)據(jù)。最后,未能設(shè)計(jì)線下訪談、問(wèn)卷或焦點(diǎn)小組訪談等形式的研究來(lái)驗(yàn)證建立在機(jī)器學(xué)習(xí)模型基礎(chǔ)上主題抽取結(jié)果的可信度。
參考文獻(xiàn)
[1]中國(guó)互聯(lián)網(wǎng)信息中心.第46次中國(guó)互聯(lián)網(wǎng)發(fā)展報(bào)告[EB/OL].http://www.cnnic.net.cn/gywm/xwzx/rdxw/202009/W020200929 343125745019.pdf,2020-09-29.
[2]Guo J,Xu S,Bao S,et al.Tapping on the Potential of Q&A Community By Recommending Answer Providers[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management.ACM,2008:921-930.
[3]施濤,姜亦珂,陳倩.網(wǎng)絡(luò)問(wèn)答社區(qū)用戶知識(shí)創(chuàng)新行為模式的影響因素:基于扎根理論的研究[J].圖書(shū)情報(bào)知識(shí),2017,(5):120-129.
[4]搜狐網(wǎng).知乎發(fā)展迅猛!用戶已破2.2億,同比增長(zhǎng)102%[EB/OL].https://www.sohu.com/a/281597481_100159019,2020-05-11.
[5]馬克秀.數(shù)字出版的媒介學(xué)思考:以“知乎出版”為例[J].現(xiàn)代出版,2016,(4):13-15.
[6]章小童.國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究現(xiàn)狀、熱點(diǎn)及趨勢(shì)分析——基于文獻(xiàn)計(jì)量與內(nèi)容歸納分析[J].情報(bào)科學(xué),2020,38(1):169-176.
[7]騰訊.大健康行業(yè)數(shù)據(jù)洞察報(bào)告2019[EB/OL].https://mp.weixin.qq.com,2020-05-11.
[8]Stephenson P W B A.Help Me,I'm Fat!Social Support in Online Weight Loss Networks[J].Consumer Behaviors,2011,(10):332-337.
[9]李為.健康問(wèn)答社區(qū)主題識(shí)別和情感分析研究——以糖尿病為例[D].武漢:華中科技大學(xué)碩士論文,2019.
[10]An O,Ahmed S,Afzal A R,et al.Breast Cancer Information Communicated on a Public Online Platform:An Analysis of‘Yahoo!Answer Japan[J].Journal of Primary Health Care,2017,9(2):167-172.