亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于框架語義的在線醫(yī)療評論情感分析

        2020-03-05 09:47:53由麗萍何玲玲
        現(xiàn)代情報 2020年3期
        關(guān)鍵詞:情感分析

        由麗萍 何玲玲

        摘?要:[目的/意義]隨著“互聯(lián)網(wǎng)+”在醫(yī)療服務(wù)行業(yè)的應(yīng)用與發(fā)展,積累了大量的醫(yī)療評價信息,利用情感分析技術(shù)可以對其進行有效地挖掘和利用,從而為醫(yī)療管理提供決策參考。[方法/過程]基于框架語義理論建立醫(yī)療情感語義分類詞典;采用詞典和規(guī)則相結(jié)合的方法進行在線醫(yī)療評論的情感語義分析,標(biāo)注情感類別、情感主題、極性和強度等信息。[結(jié)果/結(jié)論]通過在線醫(yī)療評論數(shù)據(jù)測試,驗證了研究方法的有效性和科學(xué)性,是情感分析向醫(yī)療健康領(lǐng)域縱深發(fā)展的一次有益探索。

        關(guān)鍵詞:框架語義;情感分析;醫(yī)療信息;在線醫(yī)療評論

        DOI:10.3969/j.issn.1008-0821.2020.03.011

        〔中圖分類號〕F713.5;G252?〔文獻標(biāo)識碼〕A?〔文章編號〕1008-0821(2020)03-0111-06

        Abstract:[Purpose/Significance]Since a lot of medical evaluation information is accumulated with the application and development of“Internet+”in the medical service industry,sentiment analysis technology can be used to mine and utilize it effectively,so as to provide reference for medical management.[Method/Process]A medical sentiment semantic classification dictionary was constructed based on the Frame Semantics theory.Based on the dictionary and some rules,the sentiment of online medical reviews was analyzed with annotation of sentiment type,sentiment topic,polarity and strength,etc.[Result/Conclusion]Through the test of online medical review data,a higher accuracy rate and recall rate were obtained,which proved the validity and scientificity of the research method.It is a useful exploration for the further development of emotional analysis in the field of medical health.

        Key words:frame semantics;sentiment analysis;medical Information;medical online comments

        隨著“互聯(lián)網(wǎng)+”在醫(yī)療服務(wù)行業(yè)的應(yīng)用與發(fā)展,積累了大量的醫(yī)療數(shù)據(jù)資源。不同于傳統(tǒng)醫(yī)療服務(wù)中只有院方提供的醫(yī)療信息和問診記錄等,在線醫(yī)療服務(wù)環(huán)境下,還包含了大量由患者(用戶)提供的反饋信息,它們以用戶評價方式出現(xiàn),以文本形式記錄,包含了對醫(yī)生服務(wù)、醫(yī)術(shù)、治療效果等方面的評價以及患者的體驗、康復(fù)進程、感受、心理狀態(tài)等。對這類信息的獲取和處理,有助于全面、準(zhǔn)確地評價醫(yī)療服務(wù)水平或評估患者心理狀態(tài)。

        目前國內(nèi)外醫(yī)療評論挖掘的研究尚處起步階段,處理任務(wù)主要集中在情感極性分類上,但是由于缺乏情感主題、情感對象和情感強度等信息,導(dǎo)致對文本情感語義的理解不完整。尤其是很多評論中既包含了對某些方面的正面評價又包含了對另外某些方面的負(fù)面評價,如評論句“苗醫(yī)生醫(yī)術(shù)挺好的,但是掛他的號太難了”,句中既表達了對醫(yī)生醫(yī)術(shù)的正面評價,又表達了對掛號的負(fù)面評價,這時試圖確定整條評論的極性信息不僅是困難的而且是無價值的。因此,近年開始出現(xiàn)屬性層面的情感分析:Hao H[1]利用中文在線評論數(shù)據(jù),將主題設(shè)置為療效、醫(yī)療技術(shù)、治療過程、臨床態(tài)度、尋醫(yī)過程、并發(fā)癥等,進行了患者情感分析;James T等[2]采用LDA聚類算法進行屬性層的醫(yī)療服務(wù)質(zhì)量評價研究;Cavalcanti D[3]、Salas-Zárate María del Pilar等[4]利用句法特征分別做了用藥反饋和糖尿病患者評論的情感分析。

        然而,目前醫(yī)療領(lǐng)域的情感分析主要基于關(guān)鍵詞或淺層句法分析,雖然可計算性、可操作性強,但由于缺少詞匯資源的有效組織和語義關(guān)聯(lián)的描述,其完備性不足,處理精度不高,所提取信息的應(yīng)用價值也有限。要實現(xiàn)醫(yī)療評論的語義分析,需要構(gòu)建語義分類詞典,對領(lǐng)域中的詞匯進行合理的語義分類和極性標(biāo)注??蚣苷Z義理論是美國語言學(xué)家Fillmore C J[5]提出的一種以框架(Frame)為單位描述詞語意義以及句子語義結(jié)構(gòu)的一種理論方法。框架是語言使用者在其認(rèn)知經(jīng)驗中存儲的關(guān)于詞語和句子語義理解的圖式化情境。目前,英語[6]、阿拉伯語、法語、日語、瑞典語乃至漢語[7]等的框架語義知識工程都已啟動并不斷發(fā)展。該類型語義資源在事件知識提取[8]、文本摘要[9]、機器翻譯[10]等許多任務(wù)中都被證明具有較高的價值。在情感分析領(lǐng)域,Gangemi A等[11]、Chatterji S等[12]利用FrameNet挖掘框架和情感語義角色信息;由麗萍等[13-14]將框架語義分析用于手機商品評論和酒店評論的情感分析。在醫(yī)療情感分析領(lǐng)域,Bringay S等[15]采用框架語義體系,基于法語的在線健康論壇數(shù)據(jù)提取特定的語義角色——情感對象。這些研究顯示了框架語義分析體系在情感分析任務(wù)中的應(yīng)用價值,它既可以提供細(xì)分類的情感語義信息,又有助于準(zhǔn)確識別情感詞和情感主題之間的語義角色關(guān)系。

        因此,本文基于框架語義理論,構(gòu)建醫(yī)療評價領(lǐng)域?qū)S谜Z義分類詞典,采用基于詞典和規(guī)則的方法標(biāo)注評論句的情感類別、情感主題、極性和強度等信息,從而實現(xiàn)在線醫(yī)療評論情感信息的語義理解。

        1?研究設(shè)計

        本研究包含資源建設(shè)和文本分析兩方面任務(wù):資源建設(shè)包括醫(yī)療領(lǐng)域框架語義詞典的構(gòu)建和語義標(biāo)注規(guī)則的描述;文本分析任務(wù)主要包括醫(yī)療評論的采集、詞法、句法處理和框架語義標(biāo)注等過程。研究模型如圖1所示。

        2?醫(yī)療評價領(lǐng)域框架語義詞典的構(gòu)建

        醫(yī)療評價領(lǐng)域框架語義詞典的構(gòu)建任務(wù)將表達相同情感范疇的詞語歸入同一框架類別進行描述,定義框架中的相關(guān)框架元素、框架關(guān)系等。

        2.1?詞匯收集

        參考相關(guān)研究[14],以2018年3月5日為時間節(jié)點,從阿亮醫(yī)生網(wǎng)(http://www.alyisheng.com/)和好大夫在線(https://www.haodf.com/)抓取時間最近的3 000多條用戶評論數(shù)據(jù),對其進行分詞和詞性標(biāo)注,提取其中的形容詞和動詞作為初始集合;由項目組內(nèi)成員人工篩選其中的情感詞匯,對存疑詞匯進行相關(guān)查證和商討后確定最終結(jié)果;參考《現(xiàn)代漢語分類詞典》、《新編同義詞詞林》等詞典擴充同義詞。

        2.2?釋義方法

        框架語義分類詞典定義框架、框架元素、框架—框架關(guān)系、詞元(一個義項下的一個詞)及其情感傾向值,具體的詞匯釋義工作流程和方法參考前期研究成果[16]。相較于簡單的正負(fù)兩極性情感傾向設(shè)置,我們參考相關(guān)研究[17]將詞元情感傾向值的取值范圍細(xì)化到0~1.0之間的浮點數(shù),以綜合體現(xiàn)極性和強度兩方面信息。其中,低于0.5的數(shù)值表示負(fù)面評價,且數(shù)值越低,負(fù)面情感強度越大;0.5表示中性評價;高于0.5表示正面評價,且數(shù)值越高,正面情感的強度越大。采用語料標(biāo)注的一致性檢驗法確定情感傾向值的具體取值:由3名相關(guān)專業(yè)研究生各自標(biāo)注情感傾向值,對標(biāo)注結(jié)果不一致的情況進行商討,進入下一輪標(biāo)注,直到最后取得一致為止。最終,我們構(gòu)建的醫(yī)療情感語義詞典包含129個框架,1 734個詞元。經(jīng)過對醫(yī)療領(lǐng)域情感詞詞頻進行研究,發(fā)現(xiàn)醫(yī)療領(lǐng)域內(nèi)的情感詞匯在頻率分布上較為集中,因此,對高頻情感詞的集中研究,能有效地解決大部分評論文本的情感分析。本文所構(gòu)建的詞典基本覆蓋了醫(yī)療領(lǐng)域情感表達的常用詞匯。選取其中具有代表性且框架元素、框架關(guān)系較豐富的框架[社交態(tài)度]示例如表1。

        框架—框架關(guān)系主要描述框架之間的繼承關(guān)系,為滿足不同粒度的語義分析提供多層次的概念體系。與“社交態(tài)度”框架有關(guān)的繼承關(guān)系如圖2所示。

        3?框架語義標(biāo)注

        3.1?情感語義表示模型

        在線醫(yī)療評論情感分析的任務(wù)包括確定情感詞所屬的框架、識別情感主題以及計算情感傾向值,其形式化定義如下:

        3.2?框架及情感主題標(biāo)注

        情感語義結(jié)構(gòu)(式1)中的Fi(框架)可以通過定位句子中的動詞和形容詞,匹配框架語義詞典而確定。情感語義結(jié)構(gòu)中的Ei(情感主題)在語義角色關(guān)系上是核心框架元素的一類,即被評價者或被評價主題。其句法特征與依存句法結(jié)構(gòu)(Tesniere L[18])有較強的對應(yīng)規(guī)律,因此,采用基于依存句法規(guī)則的方法識別。框架和情感主題的匹配規(guī)則為:

        式(2)中,LU為評論文本中的情感詞,依據(jù)框架語義詞典確定其對應(yīng)的框架(frame)。由于醫(yī)療評論在表達方式上具有句式簡短、主語省略甚至獨詞成句等特點,因此,式中除了情感詞LU是必有成分外,其他主語和修飾語均為可選項,以“[]”表示。根據(jù)依存句法分析結(jié)果,若情感詞支配一個主語成分(SBV),則該成分標(biāo)注為情感主題類框架元素(theme);若情感詞處于偏正結(jié)構(gòu)中定語中心語(ATT-head)的位置,則標(biāo)注為情感主題。符號表示兩種情況是邏輯“異或”關(guān)系,即要么SBV為真,要么ATT-head為真,但不能二者同時為真。若依存句法結(jié)構(gòu)中出現(xiàn)以程度副詞做狀語的成分(ADVd),則標(biāo)注為框架元素“程度”(degree);若出現(xiàn)以否定副詞做狀語的成分(ADVn),標(biāo)注其為“否定修飾”(negative),二者將作為情感傾向值的判定依據(jù)。程度副詞子類和否定副詞子類都依據(jù)《漢語語法信息詞典》[19]而定。

        3.3?情感傾向值的計算

        情感傾向值(vi)以框架語義詞典中詞語的情感傾向值為基礎(chǔ),結(jié)合框架元素標(biāo)注結(jié)果中的“程度”和“否定修飾”信息加以調(diào)節(jié),得到最終的賦值。其中,對于情感值為0.5的情感詞(即中性詞)建立主題詞調(diào)節(jié)量表,根據(jù)主題信息確定情感詞的情感傾向值,如中性詞“高”在評論句“費用高”中為0.4,而在“技術(shù)高”中則為“0.6”。對于情感傾向值不等于0.5的情感詞,如果出現(xiàn)程度副詞,則依據(jù)副詞調(diào)節(jié)量表給予一定的調(diào)整,量表內(nèi)容詳見前期研究[13];如果評論句中出現(xiàn)否定修飾,則將程度值賦值為(1-原值)。賦值邏輯如圖3所示。

        3.4?實例分析

        以兩個醫(yī)療評論句“醫(yī)生態(tài)度很不認(rèn)真”、“負(fù)責(zé)的大夫”為例,其依存關(guān)系分別如圖4和圖5所示。

        首先將形容詞“認(rèn)真”和動詞“負(fù)責(zé)”匹配相應(yīng)的框架,即[慎疏]和[責(zé)任心]。然后根據(jù)框架元素匹配規(guī)則,將主語(SBV)“醫(yī)生態(tài)度”和定中結(jié)構(gòu)的中心語(ATT-HED)“大夫”識別為情感主題;再根據(jù)副詞和否定詞表,將“很”識別為“程度”元素,將“不”識別為“否定修飾”。根據(jù)情感傾向值賦值規(guī)則,情感詞“認(rèn)真”的初始情感值為0.6,句中出現(xiàn)了程度修飾詞“很”,其調(diào)節(jié)量為0.1,因此將情感傾向值+0.1,得0.7,又由于句中出現(xiàn)了否定修飾“不”,再用1減原值,因此輸出的情感傾向值為0.3;情感詞“負(fù)責(zé)”的初始情感值為0.6,無“程度”和“否定修飾”信息,因此輸出的情感傾向值為0.6。最終,將情感語義元素填入式(1),結(jié)果為:

        4?實驗分析

        4.1?數(shù)據(jù)來源

        將詞典和規(guī)則構(gòu)建階段使用的3 000條評論作為封閉測試數(shù)據(jù),另外爬取2 000條評論作為開放測試數(shù)據(jù),見表2。實驗數(shù)據(jù)包含對醫(yī)生工作、醫(yī)療服務(wù)系統(tǒng)、藥品以及患者心理等多方面情感內(nèi)容。

        4.2?分析工具

        實驗中分詞、詞性標(biāo)注和依存句法分析采用哈爾濱工業(yè)大學(xué)語言技術(shù)平臺LTP[20]??蚣苷Z義分析采用自主研發(fā)的軟件“基于框架本體的中文情感語義標(biāo)注與查詢系統(tǒng)”(軟件著作權(quán)登記號:2018SR823004)。本軟件系統(tǒng)采用Python語言開發(fā),可以對中文情感詞語和框架進行編輯和本體存儲;對在線評論語句進行情感語義分析,標(biāo)注框架、框架元素和情感傾向值等信息,支持模糊語義檢索。使用界面如圖6所示。

        4.3?實驗結(jié)果

        采用準(zhǔn)確率(Precision)、召回率(Recall)和F1值評價情感分析的性能。表3為實驗結(jié)果。

        由表3可以看出,封閉測試獲得了較好的準(zhǔn)確率和召回率;進入開放測試后,準(zhǔn)確率影響不大,下降了約2個百分點,但召回率和F1值下降較多。

        由于情感語義分析是在依存句法分析基礎(chǔ)上進行的,依存句法分析又基于分詞和詞性標(biāo)注,因此,這些自然語言處理技術(shù)帶來的誤差對情感語義分析會形成累積效應(yīng)。為考查本研究所建詞典和規(guī)則在語義分析階段的效果,我們對分詞、詞性標(biāo)注和依存句法分析做了人工校對:由3名相關(guān)專業(yè)研究生各自校對自然語言處理結(jié)果,對不一致的情況進行商討,進入下一輪校對,直到最后取得一致為止。在修正了詞法、句法處理結(jié)果后再次進行語義標(biāo)注實驗,結(jié)果如表4所示。

        表4顯示,修正詞法、句法錯誤后,準(zhǔn)確率和召回率均得到了明顯提高,最終開放測試的F1值達到了85%,這對于醫(yī)療評論情感分析是比較理想的??梢娮匀徽Z言詞法和句法處理技術(shù)是制約情感語義分析的關(guān)鍵因素。

        5?結(jié)?語

        本文研究了基于框架語義的在線醫(yī)療評論的情感分析問題,該分析體系將情感信息表示細(xì)化到句子內(nèi)部,提供了有效的情感語義分類體系和語義角色標(biāo)注技術(shù)。其研究貢獻一方面是構(gòu)建了醫(yī)療評論領(lǐng)域的框架語義分類詞典,為醫(yī)療評論的語義分析提供了實際可用的詞匯知識資源;另一方面,采用基于框架語義分類詞典和依存句法規(guī)則相結(jié)合的方法對醫(yī)療評論進行框架語義標(biāo)注,實驗結(jié)果顯示該方法具有較高的準(zhǔn)確率;同時通過對比實驗,顯示出自然語言詞法和句法處理技術(shù)是影響情感語義分析效率的關(guān)鍵。本文的研究是情感分析向醫(yī)療健康領(lǐng)域縱深發(fā)展的一次有益探索。

        參考文獻

        [1]Hao H.The Voice of Chinese Health Consumers:A Text Mining Approach to Web-Based Physician Reviews[J].Journal of Medical Internet Research,2016,18(5):e108.

        [2]Cook,Deborah F,et al.Exploring Patient Perceptions of Healthcare Service Quality Through Analysis of Unstructured Feedback[J].Expert Systems with Applications,2017,(71):479-492.

        [3]Cavalcanti D,Prudêncio R.Aspect-Based Opinion Mining in Drug Reviews[C]//EPIA 2017,Springer,2017:815-827.

        [4]Salas-Zárate María del Pilar,Medina-Moreira José,Katty L O,et al.Sentiment Analysis on Tweets about Diabetes:An Aspect-Level Approach[J].Computational and Mathematical Methods in Medicine,2017:1-9.

        [5]Fillmore C J.Frame Semantics and the Nature of Language[J].Annals of the NY Academy of Sciences,1976,280:20-32.

        [6]University of California,Berkeley.FrameNet[DB/OL].https://framenet.icsi.berkeley.edu/fndrupal/,2018-08-03.

        [7]由麗萍.面向中文信息處理的框架語義分析[M].北京:經(jīng)濟科學(xué)出版社,2013.

        [8]Alam M,Recupero D R,Mongiovi M,et al.Event-Based Knowledge Reconciliation Using Frame Embeddings and Frame Similarity[J].Knowledge-Based Systems,2017,135(NOV):192-203.

        [9]Xu H,Tao L,Zhirui H,et al.Text Summarization Using FrameNet-Based Semantic Graph Model[J].cientific Programming,2016:1-10.

        [10]PeronCorrêa,Simone,Diniz A,Lara M,et al.FrameNet-Based Automatic Suggestion of Translation Equivalents.[C]//International Conference on Computational Processing of the Portuguese Language,2016:347-352.

        [11]Gangemi A,Presutti V,Reforgiato Recupero D.Frame-Based Detection of Opinion Holders and Topics:A Model and a Tool[J].IEEE Computational Intelligence Magazine,2014,9(1):20-30.

        [12]Chatterji S,Varshney N,Rahul R K.Aspect-FrameNet:A FrameNet Extension for Analysis of Sentiments Around Product Aspects[J].Journal of Supercomputing,2016,73(3):1-12.

        [13]由麗萍,王嘉敏.基于情感分析和VIKOR多屬性決策法的電子商務(wù)顧客滿意感測度[J].情報學(xué)報,2015,34(10):1098-1110.

        [14]由麗萍,白旭云.基于在線評論情感語義分析和TOPSIS法的酒店服務(wù)質(zhì)量測量[J]情報科學(xué),2017,35(10):13-17.

        [15]Bringay S,Kergosien E,Pompidor P.Identifying the Targets of the Emotions Expressed in Health Forums[J].Lecture Notes in Computer Science,2014,8404:85-97.

        [16]劉開瑛,由麗萍.現(xiàn)代漢語框架語義網(wǎng)[M].北京:科學(xué)出版社,2015.

        [17]Sánchez-Rada,J Fernando,Iglesias C A.Onyx:A Linked Data Approach to Emotion Representation[J].Information Processing and Management,2016,52(1):99-114.

        [18]Tesniere L.Elements De Syntaxe Structural[M].Paris:Klincksieck,1959.

        [19]俞士汶,朱學(xué)鋒,等.現(xiàn)代漢語語法信息詞典詳解(第2版)[M].北京:清華大學(xué)出版社,2003.

        [20]Che W X,Li Z H,Liu T.LTP:A Chinese Language Technology Platform[C]//Proceedings of the Coling 2010:Demonstrations,2010:13-16.

        (責(zé)任編輯:孫國雷)

        猜你喜歡
        情感分析
        基于大規(guī)模文本數(shù)據(jù)情感挖掘的企業(yè)輿情研究
        面向應(yīng)用比較的用戶評論挖掘工具的設(shè)計與實現(xiàn)
        基于微博文本的情感傾向分析
        軟件工程(2016年12期)2017-04-14 02:05:53
        基于word2vec擴充情感詞典的商品評論傾向分析
        基于語義的互聯(lián)網(wǎng)醫(yī)院評論文本情感分析及應(yīng)用
        基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評價對象抽取研究
        基于SVM的產(chǎn)品評論情感分析系統(tǒng)的設(shè)計與實現(xiàn)
        基于詞典與機器學(xué)習(xí)的中文微博情感分析
        在線評論情感屬性的動態(tài)變化
        預(yù)測(2016年5期)2016-12-26 17:16:57
        歌曲《我的深情為你守候》的情感分析與演唱詮釋
        av天堂手机在线免费| 亚洲av纯肉无码精品动漫| 99精品久久这里只有精品| 国产男女乱婬真视频免费| 日本一区二区三区高清视 | 97激情在线视频五月天视频| 亚洲一区二区三区四区精品在线 | 疯狂做受xxxx高潮欧美日本| 亚洲韩国在线| 亚洲码专区亚洲码专区| 国产成人午夜福利在线观看| 亚洲av成人无码久久精品 | 亚洲综合无码一区二区| 国产盗摄XXXX视频XXXX| 成人国产一区二区三区av| av色综合久久天堂av色综合在| 伊人久久无码中文字幕| 91综合久久婷婷久久| 久久亚洲网站中文字幕| 国产老熟女网站| 人妻夜夜爽天天爽三区麻豆AV网站 | 男男亚洲av无一区二区三区久久 | 色综合久久无码五十路人妻| 国产香蕉97碰碰视频va碰碰看 | 亚洲综合欧美色五月俺也去| 性高朝久久久久久久| 狠狠色丁香婷婷久久综合2021| 日韩中文字幕久久久老色批| 国产乱子伦| 青青操国产在线| 国产精品成人久久a级片| 天天做天天爱夜夜夜爽毛片| av无码久久久久不卡网站下载| 色综合999| 水蜜桃在线精品视频网| 国产盗摄xxxx视频xxxx| 色综合另类小说图片区| 国产午夜福利在线观看中文字幕| 丰满人妻一区二区三区免费视频| 丰满多毛少妇做爰视频| av资源在线播放网站|