黃仁東 ,韓 靜 ,崔乃雪 *
1.山東大學護理與康復學院,山東 250012;2.杭州醫(yī)學院護理學院
隨著互聯(lián)網(wǎng)共享經(jīng)濟的發(fā)展,我國有些城市出現(xiàn)了“網(wǎng)約護士”,病人可以通過手機APP預約護士到家中進行某些護理操作[1]。2019年1月12日,國家衛(wèi)生健康委辦公廳發(fā)布《關于開展“互聯(lián)網(wǎng)+護理服務”試點工作的通知》,肯定了“網(wǎng)約護士”的服務模式,并確定在6個省市試點“互聯(lián)網(wǎng)+護理服務”?!熬W(wǎng)約護士”在給病人帶來方便、給平臺護理人員增加收入的同時,也存在很多問題和風險,引發(fā)了公眾的廣泛關注和討論。了解公眾對“網(wǎng)約護士”的態(tài)度對試點實施以及政策制定十分重要。隨著社交網(wǎng)絡的不斷普及,在線社交媒體憑借其開放性、交互性和實時性等特點獲得了空前的發(fā)展,人們更愿意在社交網(wǎng)絡上表達自己的思想和情感,與他人交流觀點和看法[2]。與傳統(tǒng)問卷調(diào)查數(shù)據(jù)相比,網(wǎng)絡文本能夠更加真實、廣泛地反映公眾對某一事物的感知[3]。有學者指出網(wǎng)絡文本數(shù)據(jù)因其是有非侵入性特點,基于網(wǎng)絡文本數(shù)據(jù)的研究結(jié)果更加接近“真實世界”。網(wǎng)絡數(shù)據(jù)中90%的信息由非結(jié)構(gòu)化數(shù)據(jù)構(gòu)成,其中文本數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)的主要來源,近年來,通過文本挖掘技術將難以量化的大規(guī)模文本數(shù)據(jù)整合轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),并抽取有價值的情報信息已廣泛應用于商業(yè)、醫(yī)療和金融等領域[4?8],但在護理研究中的應用較少。情感分析和主題分析是目前網(wǎng)絡文本挖掘中常用的方法[9]。情感分析是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,可以獲得用戶對某一主題、事件、觀點的情感傾向[10]。主題模型(topic model)是一種可以通過非監(jiān)督學習的方式對目標文本集的隱含語義結(jié)構(gòu)進行聚類的一種統(tǒng)計模型,可以幫助科研人員從海量文本中快速、直觀地得到文本的主題分布信息[11]?;诖?,本研究采用文本挖掘方法對新浪微博上關于“網(wǎng)約護士”的評論數(shù)據(jù)進行分析,以期了解公眾對“網(wǎng)約護士”的情感態(tài)度和討論焦點,為有關部門完善“網(wǎng)約護士”相關政策規(guī)定提供依據(jù)。
1.1 微博評論數(shù)據(jù)抓取 以“網(wǎng)約護士”“共享護士”“互聯(lián)網(wǎng)+護理服務”為關鍵詞進行微博搜索,搜索日期截至2019年9月17日。使用八爪魚數(shù)據(jù)采集器[12?13]抓取所有微博和微博一級評論文本。共抓取到微博評論3 756條,刪除重復評論后共獲取評論3 736條。由于評論所對應的源微博皆是對來自于政府、傳統(tǒng)媒體的將要實施“網(wǎng)約護士”試點的消息的轉(zhuǎn)發(fā),不能反映公眾的情感和態(tài)度,因此未將原微博內(nèi)容納入研究。
1.2 數(shù)據(jù)預處理 主要工作有數(shù)據(jù)清洗、中文分詞、去除停用詞等[14]。數(shù)據(jù)清洗包括使用正則表達式匹配去除表情、各種符號標簽、數(shù)字等;本研究使用Python中的“結(jié)巴”庫進行中文分詞和去停用詞處理,使用向量空間模型來描述文本的特征[15]。評論數(shù)據(jù)經(jīng)過數(shù)據(jù)清洗、中文分詞、去停用詞處理后,使用Python中sklearn模塊的TfidfTransformer、CountVectorizer方法將特征詞匯轉(zhuǎn)化為向量空間模型進行后續(xù)分析。
1.3 數(shù)據(jù)分析
1.3.1 情感分析 采用Python專為中文文本設計的Snow NLP模塊對評論數(shù)據(jù)進行情感分析[16]。Snow NLP采用機器學習的方法得到情感分,它的訓練文本是評論數(shù)據(jù),在在線評論文本的情感分析中展現(xiàn)了較高的準確率[17],情感分析得到的情感得分為0~1分,當?shù)梅郑?.5分時,情感較為積極,越接近1,情感越正面;當?shù)梅郑?.5分時,情感較為消極,越接近0,情感越負面[18]。
1.3.2 主題分析 采用基于隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)的 主 題 模 型[19]。LDA主題模型通過無監(jiān)督的學習方法挖掘文本中隱含的語義信息,不需要手動對文檔添加標簽,只需要給出期望生成的主題數(shù)(K)即可[11]。為了尋找最優(yōu)的K值,本研究運用Python的Py LDAvis庫將主題模型結(jié)果可視化,結(jié)果以氣泡圖的形式展示所有主題,PyLDAvis通過使用Jensen?Shannon散度來計算主題之間的距離得到主題間距離矩陣,然后在矩陣上運行多維縮放(MDS)算法,將主題按遠近關系排列在二維平面上,每個氣泡代表1個主題,氣泡的大小代表在所有語料庫中該主題的比例。當主題之間距離足夠且沒有重疊時的K值為最優(yōu)[20]。本研究中,經(jīng)過分析,當K值為4時,氣泡沒有重疊且距離可以清楚區(qū)分。該分析方法可以輸出每個氣泡對應的前20個主題詞,研究者根據(jù)主題詞為該主題命名。
2.1 情感分析結(jié)果 針對3 736條關于“網(wǎng)約護士”評論的情感分析顯示,情感得分均分為0.564 4分,網(wǎng)民對于“網(wǎng)約護士”的態(tài)度整體上是趨于積極的。所有評論情感得分分布見圖1,部分原始評論及情感得分見表1。
圖1 所有評論情感得分分布
表1 部分原始評論及情感得分 單位:分
2.2 主題分析結(jié)果 關于“網(wǎng)約護士”微博用戶討論的主題中氣泡最大者包含的主題詞有“人身安全”“危險”“保障”等,因此將該主題命名為“人身安全”,此主題是微博用戶最為關注的。次之的主題氣泡包含“操作”“出事”“負責”“醫(yī)療事故”等詞,因此將之命名為“醫(yī)療事故責任”。第3個主題中代表性的主題詞有“滴滴”“上門服務”“網(wǎng)約”等,是對“網(wǎng)約護士”模式本身的討論,故將此主題命名為“服務模式”。第4個主題代表性的主題詞為“制服”“誘惑”“合法”“瞎搞”等,顯示了微博用戶對“網(wǎng)約護士”模式落實的擔憂和服務內(nèi)容的擔憂,將此主題命名為“服務內(nèi)容”。主題分析可視化結(jié)果見圖2。
圖2 主題分布及相應主題最相關的前20個主題詞
網(wǎng)絡信息源來源廣泛且數(shù)據(jù)量龐大,給人工分析造成了巨大的壓力,但是其信息包含了人類豐富的心理過程,已經(jīng)在社會科學中廣泛應用[2],在護理研究領域也應該得到重視。本研究通過對公眾關于“網(wǎng)約護士”微博評論文本的挖掘發(fā)現(xiàn),公眾對“網(wǎng)約護士”總體情感呈現(xiàn)弱積極性,主題分析將所有微博評論劃分為4個主題。
3.1 公眾對“網(wǎng)約護士”總體情感呈現(xiàn)弱積極性 根據(jù)評論的情感得分分布,可以看出評論的得分在0~0.9分分布大致均勻,0.9~1.0分的評論數(shù)量較多,因而總體上公眾對于“網(wǎng)約護士”的情感態(tài)度呈現(xiàn)弱積極性。這與姜茂敏[21]針對上海地區(qū)開展的關于“網(wǎng)約護士”服務滿意度的問卷調(diào)查結(jié)果一致,提示雖然公眾對于“網(wǎng)約護士”存在著兩級化的情感態(tài)度,但總體上對“網(wǎng)約護士”服務有較為積極的態(tài)度。有學者指出,“網(wǎng)約護士”是在老齡化快速發(fā)展、適應診療制度和醫(yī)聯(lián)體發(fā)展的需求下,在互聯(lián)網(wǎng)技術、產(chǎn)業(yè)、應用及跨界融合已有了堅實基礎上發(fā)展起來的,“網(wǎng)約護士”的發(fā)展客觀上可以滿足老齡化社會對醫(yī)療、護理、康復、生活照料等服務存在的龐大剛性需求,所以,整體來講,公眾對此模式表現(xiàn)出積極情感[22]。3.2“人身安全”為微博用戶關心的首要主題 主題分析形成的4個主題中,主題一“人身安全”最為突出,提示微博用戶普遍表現(xiàn)出對“網(wǎng)約護士”模式實施過程中人身安全問題的擔憂。護士上門提供醫(yī)療護理服務,存在多種人身安全風險,如路途風險[23]、病人真實性不足帶來的風險、家庭封閉環(huán)境中被打罵和性騷擾的風險[24]。因此,2019年2月13日的國家衛(wèi)健委發(fā)布會也指出“如何保障上門服務護士的人身安全”是“互聯(lián)網(wǎng)+護理服務”試點最關鍵的問題之一[25];另有多名學 者[23?24,26?27]指 出,在“網(wǎng) 約 護 士”模 式 的 實 施 中,作 為服務提供者的護理人員的合法權益特別是安全問題應得到更好的制度保障。同時,有學者提出強化病人信息真實性監(jiān)管[28]、給護士配備一鍵報警設備[29]、提供人身意外保險[29]等方法,值得政策制定者參考。
3.3“醫(yī)療事故責任”也是微博用戶的討論焦點 本研究結(jié)果顯示,“醫(yī)療事故責任”為僅次于“人身安全”的第二大公眾關注主題。網(wǎng)約護士的服務環(huán)境有別于一般的醫(yī)院或社區(qū)衛(wèi)生服務中心,具有復雜、多樣、不可預測、缺少其他醫(yī)護人員支持的特點,整體風險較大,較易發(fā)生醫(yī)療事故。同時,網(wǎng)約護士模式下醫(yī)療護理事故的預防、處理也有別于傳統(tǒng)醫(yī)療機構(gòu)。有學者[30]指出,減少醫(yī)療事故的關鍵是制定“網(wǎng)約護士”的行業(yè)標準,明確哪些疾病適用于“網(wǎng)約護士”上門以及上門的服務流程和質(zhì)量控制,同時還應該完善“網(wǎng)約護士”準入機制,明確上門護士的資質(zhì),并加強上門護理人員的培訓工作。比如有學者[30]提出,“網(wǎng)約護士”平臺可與政府合作建立培訓基地,甚至考慮在高校開設上門護理相關課程以培養(yǎng)面向基層的上門護士、提高上門護士執(zhí)業(yè)能力,預防護士上門服務醫(yī)療事故的發(fā)生。醫(yī)療事故處理不當就容易引發(fā)責任糾紛,關于責任劃分,首先要做的還是制定相關制度規(guī)范,但目前還未檢索到專門針對護士上門服務的相關規(guī)范,少數(shù)省市參考互聯(lián)網(wǎng)醫(yī)療的法規(guī)來完善“網(wǎng)約護士”配套制度[31]或者參考家庭醫(yī)生上門服務的制度對“網(wǎng)約護士”進行管理[29]。多名學者[21?22,24,29]指出,應該制定“網(wǎng)約護士”制度規(guī)范,明確事故發(fā)生后的責任主體,并建立服務糾紛快速處置機制;同時,為了更好地劃分責任,病人與網(wǎng)約平臺應當簽訂上門服務協(xié)議書、知情同意書,護士則要做好上門服務記錄,做到每步有資料留存、每項操作有據(jù)可查。在這一方面,寧波的經(jīng)驗是以圖片或者語音上傳服務記錄,上海則采取護理記錄儀視頻記錄,均值得政策制定者參考。
3.4 微博用戶將“網(wǎng)約護士”與其他的“互聯(lián)網(wǎng)+”模式進行類比且擔憂“網(wǎng)約護士”服務內(nèi)容 主題分析中第3個主題中微博用戶主要關注了“互聯(lián)網(wǎng)+護理服務”這種新模式,其中“滴滴”“網(wǎng)約”“軟件”等詞對該主題貢獻較大,公眾傾向于將網(wǎng)約護士與“滴滴出行”進行類比,滴滴出行在“互聯(lián)網(wǎng)+”這個新的經(jīng)濟形態(tài)下成為中國服務用戶最多的互聯(lián)網(wǎng)企業(yè)之一[32],此種類比在一定程度上展示了公眾對“網(wǎng)約護士”發(fā)展的信心。此外,研究還發(fā)現(xiàn)微博用戶普遍擔心“網(wǎng)約護士”是否能“不跑偏”地實地落實。從主題詞看,公眾尤其擔心“網(wǎng)約護士”有可能發(fā)展成為色情產(chǎn)業(yè)或被色情產(chǎn)業(yè)所利用,從而歪曲該模式的初衷,損害醫(yī)療護理服務者的形象。因此,“網(wǎng)約護士”模式的實施需要有關部門加強監(jiān)管,杜絕不良產(chǎn)業(yè)的滲透。以往研究未見對本研究中主題三、主題四相似內(nèi)容的報道,提示在線評論數(shù)據(jù)可以對傳統(tǒng)研究數(shù)據(jù)來源進行良好的補充,值得深入研究。
首先,本研究數(shù)據(jù)僅來源于微博這一個社交媒體平臺,沒有涵蓋其他的社交媒體且微博用戶中年輕用戶較多,缺乏對整體人群的代表性;另外,在方法上,雖然Snow NLP在以往研究中對于線上評論文本展示了較好的準確率,但其訓練文本中還缺乏護理專業(yè)領域的相關標記文本,以后的研究可以納入更多的社交媒體數(shù)據(jù),在情感分析方面可以結(jié)合基于詞典的方法或在訓練文本中加入人工標記的護理領域相關的文本。
在大數(shù)據(jù)背景下,社交媒體數(shù)據(jù)提供了關于“網(wǎng)約護士”評論的良好數(shù)據(jù)來源。本研究利用“網(wǎng)約護士”微博評論文本,發(fā)現(xiàn)公眾對“網(wǎng)約護士”呈現(xiàn)弱積極的情感態(tài)度,同時他們對“網(wǎng)約護士”模式的人身安全、醫(yī)療事故責任和服務內(nèi)容落實方面存在擔憂,提示有關部門應進一步完善關于“網(wǎng)約護士”相關規(guī)章制度,并加強監(jiān)管,以保障該模式的落實和質(zhì)量。