亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的醫(yī)患輿情多維演化仿真分析

        2023-10-10 10:38:24蔣知義
        關(guān)鍵詞:文本情感模型

        譚 旭,吳 璞,蔣知義,鄒 凱,呂 欣

        1.湘潭大學(xué) 公共管理學(xué)院,湖南 湘潭 411105

        2.深圳信息職業(yè)技術(shù)學(xué)院 素質(zhì)賦能中心,廣東 深圳 518172

        3.國(guó)防科技大學(xué) 系統(tǒng)工程學(xué)院,長(zhǎng)沙 410076

        2021年3月11日,十三屆全國(guó)人大四次會(huì)議表決通過(guò)了關(guān)于國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要[1],提出全面推進(jìn)健康中國(guó)建設(shè),統(tǒng)籌發(fā)展和安全,建設(shè)更高水平的平安中國(guó);加快數(shù)字化發(fā)展,建設(shè)數(shù)字中國(guó)。據(jù)《中國(guó)醫(yī)師執(zhí)業(yè)狀況白皮書(2017年)》數(shù)據(jù)顯示,當(dāng)前平安中國(guó)建設(shè)在醫(yī)療服務(wù)方面還不夠系統(tǒng)和完善,不同程度的醫(yī)療糾紛、醫(yī)患沖突等事件頻頻發(fā)生[2]。同時(shí)數(shù)字中國(guó)建設(shè)促進(jìn)了互聯(lián)網(wǎng)應(yīng)用的井噴式增長(zhǎng),但也掀起了網(wǎng)絡(luò)輿論的熱潮。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNⅠC)發(fā)布的第47次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2020年12月,我國(guó)網(wǎng)民規(guī)模達(dá)9.89億,使用手機(jī)上網(wǎng)的比例達(dá)99.7%[3]。緊張的醫(yī)患關(guān)系和快速傳播的網(wǎng)絡(luò)載體助推醫(yī)患輿情的發(fā)酵和蔓延,影響整個(gè)社會(huì)的穩(wěn)定和諧,亟待政府部門妥善解決。

        當(dāng)前許多學(xué)者對(duì)于醫(yī)患關(guān)系的法律制度構(gòu)建[4-5]、管理模式探索[6-7]、傳媒傳播機(jī)理探究[8-10]、評(píng)價(jià)決策分析[11]等方面的研究較為廣泛。圍繞以醫(yī)患關(guān)系為主體的社交媒體網(wǎng)絡(luò)輿情分析的研究較為缺乏。隨著大數(shù)據(jù)、人工智能技術(shù)的爆發(fā)式發(fā)展,網(wǎng)絡(luò)輿情已成為衡量主流民眾表達(dá)情緒的晴雨表,能有效表征醫(yī)患關(guān)系的演化趨勢(shì)及內(nèi)涵特點(diǎn),因此對(duì)社交媒體平臺(tái)的文本進(jìn)行情感分析能夠直觀地反映出網(wǎng)民的真實(shí)情感傾向。目前文本情感分析主要基于傳統(tǒng)機(jī)器學(xué)習(xí)[12-14]和深度學(xué)習(xí)方法[15-17]。由于傳統(tǒng)機(jī)器學(xué)習(xí)在情感分類任務(wù)中不能有效利用上下文文本語(yǔ)義信息,因此影響其分類的準(zhǔn)確性。較之傳統(tǒng)的機(jī)器學(xué)習(xí),BERT(bidirectional encoder representation from transformers)預(yù)訓(xùn)練模型(pre-trained model)擺脫了復(fù)雜特征工程的束縛,通過(guò)注意力機(jī)制[18]使模型充分學(xué)習(xí)上下文語(yǔ)義信息,從而實(shí)現(xiàn)更精準(zhǔn)的情感分類結(jié)果,并通過(guò)微調(diào)在自然語(yǔ)言處理的下游任務(wù)中取得較好結(jié)果,是目前應(yīng)用最廣泛且效果顯著的深度學(xué)習(xí)預(yù)訓(xùn)練模型[19]。

        雖然BERT在情感分類任務(wù)上表現(xiàn)突出,但在主題維度的挖掘和時(shí)間序列數(shù)據(jù)的預(yù)測(cè)方面稍顯不足。為了多維度且更細(xì)粒度地探析情感演化,通過(guò)主題挖掘(topic mining)能夠從海量文本信息中識(shí)別出關(guān)鍵詞與核心主題[20],其中LDA模型[21]能取得良好的主題挖掘效果且具有靈活的可擴(kuò)展性[22-24],適合與其他模型相結(jié)合。ARⅠMA模型是在ARMA模型[25]的基礎(chǔ)上進(jìn)行差分處理建構(gòu)的,其具有結(jié)構(gòu)簡(jiǎn)單、方便操作、預(yù)測(cè)速度快等特點(diǎn),相對(duì)于其他時(shí)間序列預(yù)測(cè)方法更適合實(shí)際應(yīng)用[26]。

        綜上,為了深度理解我國(guó)醫(yī)患關(guān)系的演化趨勢(shì)和公眾的關(guān)注焦點(diǎn),為政府部門健全醫(yī)患輿情風(fēng)險(xiǎn)預(yù)警與應(yīng)對(duì)機(jī)制提供科學(xué)合理的實(shí)證分析結(jié)論。本文擬通過(guò)模型構(gòu)建部分進(jìn)行LDA-BERT 醫(yī)患輿情多維演化分析建模和ARⅠMA 時(shí)間序列預(yù)測(cè)建模。再通過(guò)實(shí)驗(yàn)與分析,驗(yàn)證模型的分類和預(yù)測(cè)效果,并從粗粒度和細(xì)粒度兩個(gè)層面對(duì)全國(guó)醫(yī)患輿情分布和年度醫(yī)患輿情演化進(jìn)行深入剖析,得到醫(yī)患輿情地區(qū)、時(shí)間、主題、未來(lái)趨勢(shì)的多維度刻畫,最后給出實(shí)證分析結(jié)論。本研究契合政府部門對(duì)醫(yī)患輿情的現(xiàn)實(shí)管控需求,對(duì)構(gòu)建和諧醫(yī)患關(guān)系、保持社會(huì)和諧穩(wěn)定具有重要的現(xiàn)實(shí)意義。

        1 模型的構(gòu)建

        為了深入剖析醫(yī)患輿情演化,本文分別從地區(qū)、時(shí)間、主題三個(gè)維度解析醫(yī)患輿情演化過(guò)程,并對(duì)醫(yī)患輿情的正負(fù)向情感及總的情感演化進(jìn)行預(yù)測(cè)。如圖1為本文所構(gòu)建的醫(yī)患輿情多維演化分析及預(yù)測(cè)模型框架。

        圖1 醫(yī)患輿情多維演化分析及預(yù)測(cè)模型框架Fig.1 Framework of doctor-patient public opinion multi-dimensional analysis and prediction

        1.1 LDA-BERT醫(yī)患輿情多維演化分析建模

        為提升BERT 模型的情感分類精度以獲得高質(zhì)量的輿情演化分析效果,增加BERT模型主題維度的語(yǔ)義信息,不僅從粗粒度層面直觀分析醫(yī)患輿情全國(guó)地區(qū)分布情況,而且從結(jié)合了主題的細(xì)粒度層面對(duì)年度醫(yī)患輿情的演化進(jìn)行剖析,實(shí)現(xiàn)了對(duì)醫(yī)患輿情地區(qū)、時(shí)間、主題下的多維度分析。本文將LDA 模型主題抽取技術(shù)與BERT 模型予以融合,以期達(dá)到在不同主題下精確表征情感演化過(guò)程,包括LDA模型主題提取和BERT模型情感傾向識(shí)別兩個(gè)階段,具體流程如圖2所示。

        圖2 LDA-BERT醫(yī)患輿情多維演化分析建模流程Fig.2 LDA-BERT modeling process for doctor-patient public opinion multi-dimensional analysis

        針對(duì)文檔的主題提取,給定文檔集P={p1,p2,…,pN},其中,pi(i=1,2,…,N)為若干詞條組成的文本,假設(shè)主題集為T={T1,T2,…,TL} ,詞語(yǔ)集為W={w1,w2,…,wM}。通過(guò)將文檔集中每篇文檔的主題以概率分布的形式給出,分別得到“文檔-主題”概率分布θp和“主題-詞”概率分布φt。其中,θp和φt分別滿足以α和β的超參數(shù)的Dirichlet分布,如式(1)和式(2)所示:

        其中,Γ(?)為Gamma函數(shù),θp,l表示主題Tl在文檔p中的概率分布,φl(shuí),m表示詞語(yǔ)wm在主題Tl中的概率分布。

        利用Gibbs 采樣,可得到“文檔-主題”概率θp,l和“主題-詞”概率φl(shuí),m,如式(3)和式(4)所表達(dá):

        其中,表示詞語(yǔ)w被分配給主題Tl的頻數(shù),表示文檔p分配給Tl的詞語(yǔ)數(shù)。

        而后為了實(shí)現(xiàn)情感的識(shí)別,本文擬采用如圖3所示的BERT[16]模型,主要包含輸入層、雙向Transformer 編碼層和輸出層。BERT模型輸入時(shí)會(huì)在詞向量表示的文本的句首前添加字符[CLS],句尾后添加字符[SEP],并用[MASK]進(jìn)行句中內(nèi)容的隨機(jī)遮蓋。在初始詞向量的基礎(chǔ)上,通過(guò)Token、Segment 和Position Embeddings 疊加嵌入來(lái)增強(qiáng)表達(dá),充分刻畫每一個(gè)Token與句子的特征?;陔p向Transformer 架構(gòu)的編碼層,能夠充分學(xué)習(xí)文本語(yǔ)義與上下文之間的語(yǔ)義關(guān)系。再引入注意力機(jī)制,對(duì)文本特征進(jìn)行提取,將獲取到的特征信息進(jìn)行如式(5)所示的加權(quán)處理:

        圖3 BERT情感分類模型Fig.3 BERT model for sentiment classification

        其中,Q、K、V為輸入向量矩陣,dk是輸入向量K的維度大小。通過(guò)softmax 函數(shù)進(jìn)行歸一化處理,得到當(dāng)前單詞在每個(gè)句子中每個(gè)單位位置的表示程度,并對(duì)V進(jìn)行加權(quán)。特征信息的權(quán)重越大,表明其在情感分類任務(wù)中越重要。BERT模型在輸出時(shí)的文本語(yǔ)義融合了整個(gè)文本上下文的語(yǔ)義信息。本文在BERT 原有模型的基礎(chǔ)上,在下游任務(wù)中構(gòu)建了情感分類器,用于執(zhí)行情感分類任務(wù)(如表1 所示)。每個(gè)文檔記為:{pi,score:{Ep(pi),En(pi)},label:E′(pi)},其中pi為第i個(gè)文檔,score為情感傾向值,label為該文檔的情感傾向標(biāo)簽。

        表1 情感分類器的標(biāo)簽設(shè)置Table 1 Label setting for sentiment classifier

        由此,改進(jìn)后的LDA-BERT多維演化算法模型步驟如下:

        步驟1數(shù)據(jù)預(yù)處理與語(yǔ)料集詞典構(gòu)建。輸入醫(yī)患輿情文本語(yǔ)料集P,對(duì)語(yǔ)料集P進(jìn)行分詞、去停用詞等預(yù)處理,構(gòu)建語(yǔ)料詞典。

        步驟2LDA主題數(shù)確定及主題抽取。通過(guò)計(jì)算不同主題個(gè)數(shù)并結(jié)合可視化來(lái)進(jìn)行文本主題分類,確定LDA主題最佳個(gè)數(shù)K。通過(guò)主題抽取得到每一個(gè)文檔pi對(duì)應(yīng)的主題Tl的“文檔-主題”概率分布θp,l、每一個(gè)主題Tl對(duì)應(yīng)的詞語(yǔ)wm的“主題-詞”概率分布φl(shuí),m,確定文本語(yǔ)料集中文檔所屬的主題及各主題下的詞語(yǔ)分布。

        步驟3進(jìn)行BERT 的輸入表征和情感分類器構(gòu)建。輸入標(biāo)注語(yǔ)料集L,通過(guò)BERT模型將輸入語(yǔ)料進(jìn)行文本的向量化表示,句首添加字符[CLS]、句尾添加字符[SEP]、字符[MASK]在句中以一定概率隨機(jī)出現(xiàn);然后執(zhí)行MLM(masked language model)、NSP(next sentence prediction)任務(wù);預(yù)訓(xùn)練模型的損失主要在MLM、NSP中,因此兩個(gè)任務(wù)聯(lián)合學(xué)習(xí)的損失函數(shù)如式(6)所示:

        其中,θ是BERT中Encoder部分的參數(shù),θ1、θ2分別是兩個(gè)任務(wù)中的Encoder 參數(shù);基于標(biāo)注數(shù)據(jù)集對(duì)BERTbase預(yù)訓(xùn)練模型下游任務(wù)中加入新的處理類,用于執(zhí)行SC(sentiment classification)任務(wù)。

        步驟4BERT 情感分類深度預(yù)訓(xùn)練和微調(diào)。設(shè)置預(yù)訓(xùn)練和微調(diào)階段參數(shù):學(xué)習(xí)率、epoch訓(xùn)練次數(shù)、batch大小、最大序列長(zhǎng)度、初始化參數(shù)等。為避免訓(xùn)練過(guò)程出現(xiàn)過(guò)擬合現(xiàn)象,采用Adam算法計(jì)算最佳學(xué)習(xí)率。輸出epoch訓(xùn)練結(jié)果并遷移至微調(diào)模型中,輸入語(yǔ)料集P,經(jīng)過(guò)下游SC 任務(wù)計(jì)算出各語(yǔ)料集中每個(gè)文檔pi的情感傾向信息{pi,score:{Ep(pi),En(pi)},label:E′(pi)}。

        步驟5將步驟4 中的每個(gè)文檔pi的情感傾向信息中添加地區(qū)標(biāo)簽得到{pi,score:{Ep(pi),En(pi)},label:E′(pi),location}從粗粒度層面對(duì)全國(guó)醫(yī)患輿情分布進(jìn)行分析;將步驟2中生成的“文檔-主題”分步添加到每個(gè)文檔pi的情感傾向信息并融入各文檔對(duì)應(yīng)的時(shí)間標(biāo)簽得到{pi,score:{Ep(pi),En(pi)},label:E′(pi),theme,time},并從細(xì)粒度層面對(duì)年度醫(yī)患輿情演化進(jìn)行剖析。

        1.2 ARIMA醫(yī)患輿情時(shí)間序列預(yù)測(cè)建模

        根據(jù)1.1節(jié)步驟5中的每個(gè)文檔pi的情感傾向信息,分別構(gòu)建時(shí)間序列總文本集XSUM={time,Num(pi)},正向情感時(shí)間序列,負(fù)向情感時(shí)間序列,時(shí)間是按年份/季度來(lái)計(jì)量的。假設(shè)X={X1,X2,…,Xt},為得到平穩(wěn)時(shí)間序列進(jìn)行差分處理,那么Xt的d階差分Yt=(1-B)dXt,其中B為滯后算子。Yt服從ARMA(p,q)模型,則Xt是符合ARIMA(p,d,q)模型過(guò)程的。自回歸過(guò)程如式(7)所示:

        其中,Yt為時(shí)間序列文本集Xt的差分值;μ1,μ2,…,μp為該方程的自回歸系數(shù);ut為服從均值為0、方差為σ2的正態(tài)分布且在不同時(shí)刻的值互不相關(guān)的白噪聲過(guò)程;滑動(dòng)平均過(guò)程如式(8)所示:

        其中,δ1,δ2,…,δq為該方程的滑動(dòng)平均系數(shù);γt為白噪聲序列。

        由此可得到ARMA模型數(shù)學(xué)表達(dá)式(9):

        ARⅠMA時(shí)間序列建模分析步驟如下:

        步驟1拆分訓(xùn)練集和測(cè)試集。對(duì)構(gòu)建的醫(yī)患輿情時(shí)間序列X(包括時(shí)間序列總文本集XSUM、正向情感時(shí)間序列Xp、負(fù)向情感時(shí)間序列Xn)均拆分為以2016年至2020年的數(shù)據(jù)為訓(xùn)練集,2021年1月至6月的數(shù)據(jù)為測(cè)試集。

        步驟2時(shí)間序列平穩(wěn)性檢驗(yàn)。對(duì)非平穩(wěn)醫(yī)患輿情時(shí)間序列X,經(jīng)過(guò)d次差分得到平穩(wěn)時(shí)間序列Yt。

        步驟3ARⅠMA模型的識(shí)別與定階。根據(jù)自相關(guān)函數(shù)(ACF)與偏自相關(guān)函數(shù)(PACF),初步識(shí)別模型中p與q的可能取值。再基于AⅠC 準(zhǔn)則、BⅠC 準(zhǔn)則和HQⅠC準(zhǔn)則進(jìn)行模型定階,計(jì)算出各自對(duì)應(yīng)的值,選取三者值達(dá)到最小的那一組作為理想階數(shù)ARMA(p,q)。

        步驟4白噪聲與相關(guān)性檢驗(yàn)。對(duì)差分后的平穩(wěn)序列進(jìn)行純隨機(jī)性檢驗(yàn),判斷序列是否為白噪聲序列。并對(duì)ARMA(p,q)模型所產(chǎn)生的殘差做德賓-沃森(D-W)檢驗(yàn),判斷殘差的自相關(guān)性。

        步驟5模型參數(shù)估計(jì)。采用最小二乘法估計(jì)模型的參數(shù)μ和δ,對(duì)t+1 時(shí)刻進(jìn)行預(yù)測(cè),公式如式(10)所示:

        步驟6檢驗(yàn)?zāi)P托阅?。用測(cè)試集對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn),計(jì)算總發(fā)文量、正負(fù)向情感的平均絕對(duì)百分比誤差(MAPE)[27]和對(duì)稱平均絕對(duì)百分比誤差(SMAPE),由此分別計(jì)算三者的平均誤差率。

        2 仿真實(shí)驗(yàn)分析

        2.1 數(shù)據(jù)來(lái)源

        為深度探析近年來(lái)醫(yī)患關(guān)系現(xiàn)實(shí)情況及醫(yī)患輿情演化趨勢(shì),本文以新浪微博社交平臺(tái)為數(shù)據(jù)源,構(gòu)建基于Python 的網(wǎng)絡(luò)爬蟲框架。在遵循網(wǎng)絡(luò)爬蟲規(guī)則的前提下,通過(guò)高級(jí)搜索在“醫(yī)患關(guān)系”“暴力傷醫(yī)”話題下爬取了2016 年1 月1 日至2021 年6 月10 日的發(fā)帖和評(píng)論內(nèi)容,共計(jì)99 841條。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后最終得到數(shù)據(jù)81 203條,即醫(yī)患輿情文本語(yǔ)料集P為81 203條。對(duì)醫(yī)患輿情文本語(yǔ)料集進(jìn)行詞云圖可視化,如圖4 所示,發(fā)現(xiàn)醫(yī)患輿情主要聚焦于暴力傷醫(yī)、醫(yī)患關(guān)系、醫(yī)者仁心、傷醫(yī)事件等方面。預(yù)訓(xùn)練語(yǔ)料集L來(lái)自新浪微博公開(kāi)正負(fù)情感標(biāo)注數(shù)據(jù)集約12萬(wàn)條(正負(fù)向情感標(biāo)注各6萬(wàn)條),按9∶1∶1 的比例將預(yù)訓(xùn)練語(yǔ)料集L拆分為訓(xùn)練集95 991條,測(cè)試集12 000條,驗(yàn)證集12 000條。

        圖4 醫(yī)患輿情主題詞詞云Fig.4 Theme word clouds of doctor-patient public opinion

        2.2 全國(guó)醫(yī)患輿情分布

        為剖析醫(yī)患關(guān)系的本質(zhì),本文從宏觀維度以近6年的醫(yī)患文本數(shù)據(jù)為切入口,呈現(xiàn)我國(guó)醫(yī)患關(guān)系在全國(guó)范圍內(nèi)地區(qū)分布差異性及其正負(fù)向情感偏向程度,利用LDA-BERT 醫(yī)患輿情多維演化分析模型進(jìn)行粗粒度層面的分析。根據(jù)1.1 節(jié)算法中的步驟3 在BERT-base 模型的基礎(chǔ)上構(gòu)建BERT 情感分類器,輸入語(yǔ)料集L,執(zhí)行步驟4 預(yù)訓(xùn)練過(guò)程,設(shè)置初始學(xué)習(xí)率為2E-5,最大序列長(zhǎng)度為128,epoch訓(xùn)練次數(shù)為30次。通過(guò)訓(xùn)練迭代了8 999步得到模型的AUC值為0.979 2,loss值為0.06。為對(duì)比本文算法的情感分類效果,采用文本情感分類經(jīng)典模型TextCNN作為分類基線模型。基于2.1節(jié)語(yǔ)料集L進(jìn)行訓(xùn)練,訓(xùn)練結(jié)果如表2所示。通過(guò)實(shí)驗(yàn)對(duì)比能夠清晰地看出,LDA-BERT情感分類模型效果突出。

        表2 情感分類結(jié)果對(duì)比Table 2 Comparison results of sentiment classification

        由此,將訓(xùn)練好的模型遷移到情感分類微調(diào)模型中,輸入醫(yī)患輿情文本語(yǔ)料集P。通過(guò)模型進(jìn)行情感值計(jì)算和情感極性分類。找到語(yǔ)料集P中各文檔對(duì)應(yīng)的ⅠD 建構(gòu)新的URL 來(lái)獲取對(duì)應(yīng)的地區(qū)標(biāo)簽,并將標(biāo)簽與各語(yǔ)料集中每個(gè)文檔pi的正向情感值Ep(pi)和負(fù)向情感值En(pi)對(duì)應(yīng),可以得到時(shí)空維度下全國(guó)醫(yī)患輿情分布情況,分別如圖5、圖6所示。

        圖5 正向情感全國(guó)地區(qū)分布圖Fig.5 Regional distribution map of positive sentiment

        圖6 負(fù)向情感全國(guó)地區(qū)分布圖Fig.6 Regional distribution map of negative sentiment

        如圖5 和圖6 分別為全國(guó)34 個(gè)省份的醫(yī)患輿情正負(fù)向情感地區(qū)分布情況,其中,圖5 能夠直觀看出貴州省在醫(yī)患輿情上表現(xiàn)最突出的積極情緒,其次是黑龍江省。圖6 能夠清晰看出最具消極情緒的微博用戶多分布在甘肅省,其次為遼寧省和寧夏自治區(qū)。醫(yī)患輿情在地區(qū)分布上具有明顯的差異性,地區(qū)間的差異影響著公眾對(duì)醫(yī)患關(guān)系的認(rèn)知,進(jìn)而影響著醫(yī)患關(guān)系的發(fā)展。因此,對(duì)于醫(yī)患輿情管控方面,針對(duì)地區(qū)差異要有所側(cè)重。對(duì)于地區(qū)間的醫(yī)療資源的不均衡,也應(yīng)有所調(diào)整。

        2.3 年度醫(yī)患輿情演化

        為更細(xì)膩地刻畫近6 年來(lái)國(guó)內(nèi)醫(yī)患關(guān)系的變化細(xì)節(jié),借助本文LDA-BERT混合模型的多維度智能分析和可視化呈現(xiàn),從網(wǎng)絡(luò)輿情的視角探尋總體情感極性的演化情況,如圖7所示。根據(jù)1.1節(jié)算法的步驟1進(jìn)行數(shù)據(jù)預(yù)處理,采用中文停用詞表、哈工大停用詞表、百度停用詞表、四川大學(xué)機(jī)器智能實(shí)驗(yàn)室停用詞表進(jìn)行更為精確的停詞處理。將生成的詞典經(jīng)過(guò)doc2bow 計(jì)算每個(gè)不同單詞出現(xiàn)的次數(shù),將單詞轉(zhuǎn)化成整數(shù)ⅠD,并將結(jié)果作為稀疏向量返回,生成語(yǔ)料。訓(xùn)練TFⅠDF模型[28]并生成TFⅠDF 矩陣,選擇α=‘a(chǎn)uto’,β=0.01 的先驗(yàn)參數(shù),對(duì)LDA模型進(jìn)行訓(xùn)練,經(jīng)過(guò)迭代計(jì)算,K=4 時(shí),困惑度最小,主題數(shù)最優(yōu)。結(jié)合gensim調(diào)用api實(shí)現(xiàn)LDA的可視化交互分析。通過(guò)pyLDAvis 可視化得到圖8 主題分布情況。驗(yàn)證主題數(shù)K=4 時(shí)主題抽取分布較為均勻合理。圖8 中左側(cè)部分表示醫(yī)患輿情語(yǔ)料集的四個(gè)主題分布,圓的大小表示每個(gè)主題出現(xiàn)頻率的大小,圓與圓之間的距離遠(yuǎn)近表示主題間的相似性,可以看到主題4與其余三個(gè)主題之間距離較近,關(guān)系較為密切。圖8右側(cè)部分表示λ=1 時(shí)四個(gè)主題中排名前三十的詞語(yǔ)分布。其中λ越接近1,詞語(yǔ)與主題的相關(guān)性越高。從圖中可以發(fā)現(xiàn),與主題最為密切相關(guān)的詞語(yǔ)主要集中在四個(gè)層面:醫(yī)患主體層面,如“醫(yī)生”“醫(yī)院”“患者”等;法律懲治層面,如“律師”“法律”“嚴(yán)懲”等;醫(yī)療糾紛層面,如“醫(yī)療”“醫(yī)鬧”“看病”等;新聞報(bào)道層面,如“新聞”“衛(wèi)健委”“人民日?qǐng)?bào)”等。抽取各主題下排前10的詞語(yǔ),得到醫(yī)患輿情“主題-詞”分布,見(jiàn)表3所示。

        表3 醫(yī)患輿情的“主題-詞”分布結(jié)果Table 3 “Theme-word”distribution of doctor-patient public opinion

        圖7 不同年度下醫(yī)患輿情總體情感極性演化趨勢(shì)Fig.7 Sentiment evolution trend of doctor-patient public opinion in different years

        圖8 主題分布尋優(yōu)結(jié)果Fig.8 Optimization results of theme distribution

        根據(jù)表3,按照概率大小分布,主題1概率最高的關(guān)鍵詞是“醫(yī)生”,主題2概率最高的關(guān)鍵詞分別為“醫(yī)療”“患者”,主題3、4概率最高分別為“醫(yī)院”“醫(yī)患”。將四個(gè)主題分別命名為“醫(yī)生”“患者”“醫(yī)院”“醫(yī)患關(guān)系”。

        為了時(shí)序地演化醫(yī)患輿情發(fā)展態(tài)勢(shì),分析不同主題下的情感趨勢(shì)分布如圖9 所示。在四個(gè)主題的整體趨勢(shì)上,輿情情感呈波動(dòng)狀態(tài),在2019年第四季度和2020年第一季度正負(fù)情感都處于較高態(tài)勢(shì),在2020 年第二季度之后正向情感開(kāi)始高于負(fù)向情感,與2019 年底爆發(fā)的新冠疫情有關(guān),疫情期間對(duì)于醫(yī)護(hù)人員支援武漢的各種正面報(bào)道,給公眾重新樹(shù)立起醫(yī)護(hù)人員醫(yī)者仁心、無(wú)私奉獻(xiàn)的形象,對(duì)于緩解醫(yī)患關(guān)系具有重要意義,因此在疫情之后醫(yī)患輿情首次出現(xiàn)正向情感高于負(fù)向情感。各主題在2017年第四季度情感差異較為明顯。其中,“醫(yī)生”主題下正負(fù)情感相近,“患者”主題下正負(fù)情感差異最為明顯,“醫(yī)院”主題下和近年的趨勢(shì)較為接近,“醫(yī)患關(guān)系”主題下正向情感態(tài)度最低。這說(shuō)明公眾對(duì)于“患者”與“醫(yī)患關(guān)系”持消極態(tài)度,主要是對(duì)于患者襲醫(yī)傷醫(yī)造成各種醫(yī)鬧事件的不滿。

        圖9 不同主題下醫(yī)患輿情情感演化趨勢(shì)圖Fig.9 Sentiment evolution trend diagram of doctor-patient public opinion under different themes

        為探析各年度主題詞分布,對(duì)2016—2021 各年度進(jìn)行主題詞抽取并進(jìn)行詞云圖可視化分析得到圖10。由圖10中近6年來(lái)主題詞詞云展示,將各年度主題分別歸納為:法治監(jiān)管、醫(yī)鬧傷醫(yī)、病人救治、醫(yī)療糾紛、護(hù)醫(yī)措施、理解醫(yī)生。發(fā)現(xiàn)醫(yī)患關(guān)系中的關(guān)注主體由對(duì)患者主體的關(guān)注轉(zhuǎn)為對(duì)醫(yī)生主體的關(guān)注。結(jié)合年度整體情感演化趨勢(shì)(圖7)不難發(fā)現(xiàn),公眾對(duì)于醫(yī)患關(guān)系的關(guān)注與重視是呈現(xiàn)波動(dòng)上升的,而對(duì)于醫(yī)患關(guān)系的情感糾葛從開(kāi)始的“醫(yī)鬧傷醫(yī)”“醫(yī)療糾紛”到最近的“保護(hù)醫(yī)生”“理解醫(yī)生”是趨于緩和的發(fā)展態(tài)勢(shì)。同時(shí),各年度主題也反映了在醫(yī)患關(guān)系中需要在法律層面和護(hù)醫(yī)措施上作出改進(jìn)。

        圖10 2016—2021年度醫(yī)患輿情主題詞云分析結(jié)果Fig.10 Theme word cloud analysis results of doctor-patient public opinion from 2016 to 2021

        2.4 醫(yī)患輿情情感預(yù)測(cè)分析

        為進(jìn)一步探尋醫(yī)患輿情情感演化態(tài)勢(shì),通過(guò)對(duì)醫(yī)患輿情情感走勢(shì)進(jìn)行科學(xué)合理的前瞻和預(yù)判,幫助政府部門更好地管控社交媒體平臺(tái)的網(wǎng)絡(luò)輿情,從而為制定相應(yīng)輿情防范策略提供合理的理論參考。根據(jù)1.1節(jié)算法中的步驟5,得到時(shí)間維度上的輿情情感分析結(jié)果,代入1.2節(jié)算法中的ARⅠMA模型進(jìn)行預(yù)測(cè),確定不同參數(shù)下預(yù)測(cè)效果,分別計(jì)算平均絕對(duì)百分比誤差(MAPE)和對(duì)稱平均絕對(duì)百分比誤差(SMAPE),如表4所示。由此確定ARⅠMA模型的階數(shù)為(1,1,0)時(shí),誤差最小??偘l(fā)文量預(yù)測(cè)的MAPE值為9.46%、SMAPE值為14.15%,正向情感預(yù)測(cè)的MAPE值為11.15%、SMAPE值為14.82%,負(fù)向情感預(yù)測(cè)的MAPE 值為6.72%、SMAPE 值為11.2%。由此得到醫(yī)患輿情預(yù)測(cè)模型的平均誤差率不超過(guò)11.25%,三者的預(yù)測(cè)趨勢(shì)如圖11所示,可以發(fā)現(xiàn)預(yù)測(cè)結(jié)果與真實(shí)結(jié)果雖然存在一定范圍的滯后性,但是整體的演化趨勢(shì)是一致的,能夠較好地預(yù)判醫(yī)患輿情未來(lái)發(fā)展趨勢(shì)。

        表4 不同參數(shù)下醫(yī)患輿情情感預(yù)測(cè)誤差對(duì)比Table 4 Sentiment prediction error comparison of doctor-patient public opinion under different parameters

        圖11 醫(yī)患輿情情感預(yù)測(cè)對(duì)比分析Fig.11 Comparison analysis of sentiment prediction for doctor-patient public opinion

        根據(jù)圖11 可以看出,總發(fā)文量與正負(fù)情感驟升的區(qū)間為新冠疫情暴發(fā)時(shí)期,其余區(qū)間數(shù)據(jù)總體上在一個(gè)范圍內(nèi)波動(dòng),但2021 年之后預(yù)測(cè)的趨勢(shì)仍然處于緩慢上升態(tài)勢(shì)。對(duì)比圖11(b)與(c)發(fā)現(xiàn),醫(yī)患輿情負(fù)向情感從高于正向情感到逐漸趨于持平,差距逐漸減小,說(shuō)明醫(yī)患關(guān)系有緩和跡象,但醫(yī)患關(guān)系依舊是一個(gè)亟待解決和關(guān)注的問(wèn)題。

        3 結(jié)語(yǔ)

        本文圍繞醫(yī)患關(guān)系這個(gè)國(guó)內(nèi)持續(xù)討論的熱門話題展開(kāi)研究。從網(wǎng)絡(luò)輿情的角度獲取互聯(lián)網(wǎng)復(fù)雜語(yǔ)境下大規(guī)模醫(yī)患輿情文本數(shù)據(jù),通過(guò)構(gòu)建LDA-BERT-ARⅠMA混合深度學(xué)習(xí)模型來(lái)探尋醫(yī)患輿情的多維度演化過(guò)程,并從粗粒度和細(xì)粒度兩個(gè)維度深度剖析了醫(yī)患輿情在不同地區(qū)、主題、時(shí)間層面的情感演化趨勢(shì)并進(jìn)行未來(lái)情感走勢(shì)預(yù)測(cè)。本文能夠較為完整地展現(xiàn)2016 年至2021 年醫(yī)患輿情情感演化和公眾對(duì)于醫(yī)患關(guān)系話題下重點(diǎn)關(guān)注的主題。實(shí)證分析表明:(1)從地區(qū)分布來(lái)看,醫(yī)患輿情地域分布上的情感差異明顯,政府部門可根據(jù)地區(qū)特色進(jìn)行針對(duì)性干預(yù)和監(jiān)管。(2)從主題分布來(lái)看,醫(yī)患輿情關(guān)注焦點(diǎn)在法治監(jiān)管、醫(yī)療糾紛、護(hù)醫(yī)措施等層面,相關(guān)部門在法制監(jiān)管的力度和廣度方面還需加強(qiáng),對(duì)于護(hù)醫(yī)措施方面應(yīng)明確公安機(jī)關(guān)、醫(yī)院、醫(yī)生和患者不同主體的責(zé)任與義務(wù)。(3)從輿情的演化與預(yù)測(cè)來(lái)看,未來(lái)一段時(shí)間負(fù)向情感與正向情感差距適當(dāng)減少,醫(yī)患關(guān)系有緩和跡象,但仍需重視和監(jiān)管負(fù)向情感輿情態(tài)勢(shì)。

        猜你喜歡
        文本情感模型
        一半模型
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        3D打印中的模型分割與打包
        精品少妇一区二区三区免费观| 亚洲在线一区二区三区| 蜜桃成熟时日本一区二区| 制服丝袜一区二区三区| 国产婷婷色综合av蜜臀av| 中文字幕日韩高清| 精品视频一区二区杨幂| 国产毛片av一区二区| 巨茎中出肉欲人妻在线视频| 亚洲白白色无码在线观看| 日本一区二区三区啪啪| 日本九州不卡久久精品一区| 97人伦色伦成人免费视频| 国产成人+亚洲欧洲+综合| 欧洲一级无码AV毛片免费| 久久日韩精品一区二区| 日本特黄特色特爽大片| 俺也去色官网| 大屁股流白浆一区二区| 欧美成人www免费全部网站| 亚洲第一页综合av免费在线观看| 久草视频在线手机免费看| 亚洲欧美综合区自拍另类| 永久国产盗摄一区二区色欲| 日韩熟女精品一区二区三区视频| 国产情侣一区二区| 成在人线av无码免观看麻豆| 国产欧美日本亚洲精品一4区| 一区二区高清视频免费在线观看| 国产av无码专区亚洲avjulia| 亚洲AV日韩AV永久无码电影| 玩弄极品少妇被弄到高潮| 午夜视频在线观看视频在线播放 | 狠色人妻丝袜中文字幕| 熟妇激情内射com| 麻豆久久五月国产综合| 在线久草视频免费播放| 国产欧美va欧美va香蕉在| 18无码粉嫩小泬无套在线观看| 夜夜被公侵犯的美人妻| 亚洲国产综合精品一区最新|