亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于框架語義分析的社交網(wǎng)絡(luò)藥品不良事件抽取*

        2023-09-01 12:59:00由麗萍王世鈺李朝翻
        關(guān)鍵詞:語義藥品文本

        由麗萍 王世鈺 李朝翻

        (山西大學(xué)經(jīng)濟(jì)與管理學(xué)院 太原 030006)

        1 引言

        近年來,藥品安全性事件頻發(fā),對公眾健康造成嚴(yán)重威脅,藥品安全問題逐漸引起輿論熱議。據(jù)世界衛(wèi)生組織統(tǒng)計,全球死亡患者中有1/3死于用藥不合理[1]。在我國,藥療事故占醫(yī)療事故的30%,藥品不良事件已成為嚴(yán)重的公共衛(wèi)生問題。隨著信息技術(shù)在醫(yī)療領(lǐng)域的廣泛應(yīng)用,在線醫(yī)療平臺和藥品電商等互聯(lián)網(wǎng)產(chǎn)業(yè)蓬勃興起,積累了大量藥品咨詢記錄和藥效評價信息。抽取此類信息不僅對分析患者用藥后的反饋具有重要意義,而且可以為藥品生產(chǎn)、經(jīng)營、使用及藥政部門管理提供參考,以提高監(jiān)管力度,推動社會衛(wèi)生事業(yè)進(jìn)步。

        目前,事件抽取相關(guān)研究成為國內(nèi)外自然語言處理領(lǐng)域的重要研究方向之一,旨在從非結(jié)構(gòu)化文本中抽取公眾感興趣的事件信息,并以結(jié)構(gòu)化形式呈現(xiàn)出來。已有研究立足于從信息[2]、事件[3]、關(guān)系[4]3個層次展開,將相關(guān)事件提取技術(shù)應(yīng)用于特定領(lǐng)域,如政治外交[5]、法律[6]以及臨床[7]等,以提升特定領(lǐng)域事件抽取精確率。在生物醫(yī)學(xué)領(lǐng)域,陳瑤等[8]基于深度學(xué)習(xí)模型,引入注意力機(jī)制,對字向量與分詞向量進(jìn)行優(yōu)化,研究異常檢出率報告中的“藥品-不良反應(yīng)”關(guān)系抽取。張玉坤等[9]提出一種聯(lián)合神經(jīng)網(wǎng)絡(luò)模型,將實(shí)體識別和關(guān)系抽取聯(lián)合起來,研究中文醫(yī)療關(guān)系抽取。Kilicoglu H[10]和Bui Q C[11]分別提出ConcordU和BioSEM生物醫(yī)學(xué)事件抽取方法。這些基于詞向量的方法可操作性強(qiáng),但缺乏詞匯資源的有效組織和語義關(guān)聯(lián)描述,表示深度及語義理解不足,處理精度不高,應(yīng)用價值受限;而基于語義分析則能滿足對自然語言深層語義理解的需要,準(zhǔn)確識別不良反應(yīng)與感知部位之間的語義關(guān)系。

        本研究基于框架語義理論,結(jié)合《監(jiān)管活動醫(yī)學(xué)詞典》(Medical Dictionary for Regulatory Activities,MedDRA)[12]術(shù)語集構(gòu)建藥品不良事件分類詞表;根據(jù)詞典和句法規(guī)則分析公眾在社交網(wǎng)絡(luò)中對藥品的評論文本,識別藥品不良事件相關(guān)語義信息,填充藥品不良事件框架;基于框架語義分析結(jié)果,完成藥品不良事件抽取。這是情感分析向醫(yī)療健康領(lǐng)域縱深發(fā)展的一次有益探索,兼具社會意義與學(xué)術(shù)價值。

        2 研究方法

        藥品不良事件抽取由文本預(yù)處理、框架語義標(biāo)注和藥品不良事件框架填充3部分構(gòu)成。首先,以微博、知乎等社交網(wǎng)絡(luò)平臺為數(shù)據(jù)來源,通過網(wǎng)絡(luò)爬蟲技術(shù),抓取包含有“副作用”“藥品不良反應(yīng)”等信息的用藥反饋評論文本,并對其進(jìn)行分詞、詞性標(biāo)注等預(yù)處理。其次,基于框架語義標(biāo)注規(guī)則對文本進(jìn)行框架元素標(biāo)注,并通過匹配藥品不良事件分類詞表及程度值計算規(guī)則,將語義識別出的謂詞匹配不良事件觸發(fā)詞,確定藥品不良事件及其整體程度值。最后,根據(jù)框架語義分析結(jié)果填充藥品不良事件框架,從而完成藥品不良事件抽取,見圖1。

        圖1 藥品不良事件抽取流程

        3 框架語義分析

        3.1 框架語義表示模型

        框架語義理論是美國語言學(xué)家Fillmore C J[13]提出的一種以框架為單位描述詞語意義以及句子語義結(jié)構(gòu)的方法體系??蚣苁钦Z言使用者在其認(rèn)知經(jīng)驗(yàn)中存儲的關(guān)于詞語和句子語義理解的圖示化情景,由一系列框架元素組成,表明情景中的動作主體、客體、程度等其他概念角色。以框架語義模型表示藥品不良事件,即將語言表達(dá)中的謂詞和語義角色標(biāo)注為相應(yīng)的事件類別和患者、藥品、感知部位等框架元素,其定義如下:

        Ei(dri,pi,bi,dgri)

        (1)

        其中,Ei為句子中一個短語i的事件類;dri為藥品名稱;pi為患者;bi為感知部位;dgri為程度值。程度值表示藥品不良事件的嚴(yán)重程度,依據(jù)醫(yī)學(xué)程度常用分級,進(jìn)行4級區(qū)分,1~4級依次為輕度、中度、重度、極重度。如評論文本“吃了舍曲林感覺四肢很無力”,其模型為:Ei:乏力(dri:舍曲林,pi:匿名用戶,bi:四肢,dgri:2),見圖2。

        圖2 藥品不良事件框架語義表示模型

        3.2 藥品不良事件分類詞表構(gòu)建

        在藥品不良事件框架中,事件類是由句子中的謂詞(動詞和形容詞)所激活的語義內(nèi)容,其在框架中位于核心支配地位,與框架元素相關(guān)聯(lián)。本文以MedDRA為基礎(chǔ)確立基本事件類別,在爬取的大量社交網(wǎng)絡(luò)文本中提取謂詞與MedDRA進(jìn)行匹配,構(gòu)建藥品不良事件分類詞表。MedDRA具有層級結(jié)構(gòu),從低到高分別為低位語(lowest level term,LLT)、首選語(preferred term,TP)、高位語(high level term,HLT)、高位組語(high level group term,HLGT)和系統(tǒng)器官分類(system organ class,SOC),其中術(shù)語即為低位語,同義術(shù)語或等同術(shù)語歸于首選語,見表1。

        表1 藥品不良事件分類詞表示例

        3.3 標(biāo)注規(guī)則

        用藥反饋文本中句法依存關(guān)系與語義角色之間有較強(qiáng)的對應(yīng)規(guī)律,因此,基于規(guī)則匹配的方式識別句子中的感知部位,即謂詞所支配的語義角色??蚣苷Z義標(biāo)注預(yù)設(shè)規(guī)則為:

        LUframe[SBV⊕ATT-headtheme][ADVddegree][AD-Vnnegative]…

        (2)

        其中,LU代表藥品不良事件評論文本中的謂詞,SBV代表主語成分。由于評論句在表達(dá)方式上具有句式簡單、主語省略甚至獨(dú)詞成句等特點(diǎn),因此,除了謂詞是必要成分外,主語和其他修飾語均為可選項(xiàng),以“[]”表示。根據(jù)依存句法分析結(jié)果,若謂詞支配一個主語成分,則該成分標(biāo)注為該不良事件的框架元素(theme),即感知部位;若謂詞處于偏正結(jié)構(gòu)中定語中心語 (ATT-head)位置,則標(biāo)注為感知部位。符號⊕表示這兩種情況是“異或”的邏輯關(guān)系,即要么SBV成立,要么ATT-head成立,二者不能同時成立。若依存句法結(jié)構(gòu)中出現(xiàn)程度副詞做狀語成分(ADVd),則標(biāo)注為框架元素“程度”(degree);若出現(xiàn)否定副詞做狀語成分(AD-Vn),則標(biāo)注為“否定修飾”(negative),二者將作為程度值計算依據(jù)。

        4 藥品不良事件抽取

        4.1 依存句法分析

        依存句法分析是按照指定語法規(guī)范將特定序列用圖結(jié)構(gòu)呈現(xiàn)的自然語言語句,可以直接展示出句中詞與詞之間的句法關(guān)系。在基于圖結(jié)構(gòu)的表示方法中,每個詞語代表一個實(shí)體,用節(jié)點(diǎn)表示,詞語節(jié)點(diǎn)之間的連線則表示其之間的句法關(guān)系。這種表現(xiàn)形式清晰簡潔、標(biāo)注容易,其句法功能標(biāo)記與語義結(jié)構(gòu)相互對應(yīng)并有較強(qiáng)規(guī)律性,因此可以有效地識別句子中謂詞及其所支配的語義角色,從而為實(shí)現(xiàn)藥品不良事件評論文本的語義標(biāo)注提供規(guī)則依據(jù)。示例1依存句法關(guān)系,見圖3。其中v代表動詞、a代表形容詞,n代表名詞,d代表副詞,u代表助詞,m代表數(shù)詞,p代表介詞,wp代表標(biāo)點(diǎn)符號。

        示例1:剛開始服用舍曲林就惡心,沒食欲,手會輕微抖動,內(nèi)心感覺很麻木。

        4.2 藥品不良事件類別識別

        藥品不良事件識別基于框架語義標(biāo)注結(jié)果,與藥品不良事件分類詞表匹配事件觸發(fā)詞,從而識別出藥品不良事件,然后進(jìn)一步匹配上級類別。若只匹配到單一上級類別,直接輸出藥品不良事件類別;若存在多個上級類別,則存在歸類歧義,通過將上下文中出現(xiàn)的其他詞(主要為表示感知部位的詞)進(jìn)一步限定,從而篩選出合適的上級類別,最終完成藥品不良事件類別的識別。

        針對示例1進(jìn)行藥品不良事件類別的識別。首先,將動詞“沒食欲”、動詞“抖動”和形容詞“麻木”匹配藥品不良事件類詞表,分別對應(yīng)為“食欲減退”“震顫”和“感覺減退”。其中,低位語“食欲減退”和“震顫”,分別對應(yīng)高位語“各種食欲障礙”和“各種顫抖”?!案杏X減退”則對應(yīng)兩個高位語“各種表皮和真皮病癥”“感覺異常和感覺遲鈍”,存在歧義。根據(jù)上下文出現(xiàn)的詞匯“內(nèi)心”可將“感覺減退”進(jìn)一步限定為“感覺異常和感覺遲鈍”。最終,該條評論所識別出的藥品不良事件類別分別為“各種食欲障礙”“各種顫抖”和“感覺異常和感覺遲鈍”。

        4.3 藥品不良事件框架元素識別

        4.3.1 藥品名稱和患者識別 對網(wǎng)絡(luò)文本數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)注,基于實(shí)體命名識別規(guī)則,從經(jīng)過預(yù)處理的評論文本中識別藥品名稱,即對詞性標(biāo)注為專有名詞(nz)的詞語前后兩個詞進(jìn)行掃描后匹配以下模式,若模式相符合則識別字符串中的*為藥品名稱。

        模式1:吃 v 了 u * nz。例如:吃了舍曲林。

        模式2:長期 a 使用 v * nz。例如:長期使用舍曲林。

        模式3:服用 v * nz。例如:服用舍曲林。

        模式4:* nz 的 u 副作用 n。例如:舍曲林的副作用。

        模式5:# m 片/盒/瓶 p * nz (#表示任意數(shù)詞)。例如:兩片舍曲林。

        針對示例1,藥品名稱識別符合模式3,于是將藥品名稱識別為“舍曲林”。根據(jù)各社交平臺中發(fā)布相關(guān)評論的用戶資源標(biāo)識符填充至框架元素“患者”中。

        4.3.2 感知部位識別 即謂詞所支配的框架元素,根據(jù)前文框架語義分析標(biāo)注規(guī)則進(jìn)行識別。在示例2中,可將主謂結(jié)構(gòu)中的主語(SBV)“嘴唇”“頭”和定中結(jié)構(gòu)的中心語(ATT-head)“腸胃”識別為感知部位。

        示例2:最/d開始v/吃/v舍曲林/n[感知部位嘴唇/n]不時/d會/v<震顫顫抖/v>,/wp[感知部位頭/n]也/d很/d<震顫暈/a>,/wp[感知部位腸胃/n]的/u<疼痛和不適不適/a>逐漸/d加重/v。/wp

        針對前文示例1,根據(jù)框架語義標(biāo)注規(guī)則,將與“抖動”“麻木”分別構(gòu)成主謂結(jié)構(gòu)的中心語“手”“內(nèi)心”識別為感知部位。

        4.3.3 計算程度值 (1)計算過程。首先,將用藥反饋文本中觸發(fā)詞與詞表相匹配得到原值1。其次,確定用藥反饋文本中是否含有程度副詞,若有則將第1程度值設(shè)為“原值+增量值”。最后,確定文本中是否含有否定副詞(不、沒有、無等),若有,將程度值賦值為“1-第1程度值”;若無,則第1程度值為最終程度值。其中程度副詞“有些、有點(diǎn)、比較”等詞的增量值為0;“很、實(shí)在、蠻”等詞的增量值為1;“十分、非常、特別”等詞的增量值為2;“極其、超級、超”等詞的增量值為3。(2)示例1程度值計算。將“輕微”和“很”識別為程度副詞;根據(jù)程度值賦值規(guī)則,“抖動”和“暈”的程度原值為1,句中程度副詞“輕微”增量值為0,“很”增量值為1,因此將原值與增量值相加,最終輸出程度值分別為1和2;“沒食欲”的程度原值為1,無程度副詞修飾,因此最終程度值為1。將情感語義元素填入藥品不良事件框架,結(jié)果為:

        Ei:食欲減退(dri:舍曲林,pi:匿名用戶,bi:null,dgri:1)。

        Ei:震顫(dri:舍曲林,pi:匿名用戶,bi:手,dgri:1)。

        Ei:感覺減退(dri:舍曲林,pi:匿名用戶,bi:內(nèi)心,dgri:2)。

        5 實(shí)驗(yàn)分析

        5.1 數(shù)據(jù)來源與分析工具

        5.1.1 數(shù)據(jù)來源 對藥品“鹽酸舍曲林(左洛復(fù))”用藥反饋文本進(jìn)行實(shí)例分析,檢驗(yàn)藥品不良事件抽取的應(yīng)用效果。從網(wǎng)絡(luò)社交平臺微博話題和知乎中爬取該藥品相關(guān)問答及評論文本,剔除無效文本,共得到有效評論數(shù)1 505條(知乎)和706條(微博),見表2。

        5.1.2 分析工具 基于哈爾濱工業(yè)大學(xué)語言技術(shù)平臺對語料進(jìn)行依存句法分析,利用自主研發(fā)的標(biāo)注軟件“基于框架本體的中文情感語義標(biāo)注與查詢系統(tǒng)”(軟件著作權(quán)登記號:2018SR823004),通過添加本文所構(gòu)建的藥品不良事件分類詞表,基于規(guī)則匹配的方式,實(shí)現(xiàn)框架語義信息的自動標(biāo)注,可對中文評價詞和框架進(jìn)行編輯和本體存儲,并支持模糊語義檢索。

        5.2 結(jié)果分析

        經(jīng)過框架語義標(biāo)注可得到該藥品所有不良事件框架信息。評論句中若只識別出1個不良事件,且只對應(yīng)1個感知部位,則建立1個事件框架;若1個事件類型對應(yīng)多個不同感知部位,則需建立多個事件框架,其程度值取平均值;存在多患者時只列舉3個。從藥品不良事件抽取結(jié)果中,剔除發(fā)生的重復(fù)事件和相近事件,共得到 43 種藥品不良事件和32種藥品不良事件類別,其中影響身體感知的不良事件類別有23種,影響精神反應(yīng)的不良事件類別有9種。將影響身體感知的不良事件類別中的“入睡和睡眠障礙”“各種睡眠障礙”合并為“睡眠障礙”,將“腸胃脹氣、氣脹和膨脹”“胃腸道和腹部疼痛”和“各種胃腸道遲緩和動力不足疾病”合并為“胃腸道不適”,見圖4、圖5。

        圖4 影響身體感知的藥品不良事件比例

        由此可知,該藥品最嚴(yán)重的不良反應(yīng)為睡眠障礙,根據(jù)患者個體差異主要分別體現(xiàn)為失眠和嗜睡;身體上還會有虛弱狀態(tài),體現(xiàn)為累、乏力等,并且會惡心、嘔吐;精神上則主要表現(xiàn)為神經(jīng)學(xué)癥狀和體征及各種感受與感覺,主要體現(xiàn)在頭暈、情緒差,并且會存在意識障礙、困倦遲鈍等。

        6 結(jié)語

        本文基于社交網(wǎng)絡(luò)文本框架語義分析研究藥品不良事件抽取?;贛edDRA術(shù)語集構(gòu)建藥品不良事件框架語義分類詞表,為醫(yī)療領(lǐng)域文本分析提供語義資源;通過框架語義理論,識別藥品不良事件以及與其相關(guān)藥品名稱、患者、感知部位,提高事件抽取的完整性和準(zhǔn)確性;以“鹽酸舍曲林”為例,對比抽取結(jié)果與藥品說明書,證實(shí)該方法的有效性。本文研究結(jié)果一方面為醫(yī)療健康領(lǐng)域提供語義知識庫資源;另一方面為社交網(wǎng)絡(luò)文本挖掘向醫(yī)療健康領(lǐng)域縱深發(fā)展提供新方向。

        相比于傳統(tǒng)問卷和量表分析方法,文本挖掘方法可以批量處理患者關(guān)于藥品的評論文本,但目前所構(gòu)建詞表規(guī)模有限,尚未覆蓋不同種類藥品的不良反應(yīng),無法實(shí)現(xiàn)大規(guī)模不良反應(yīng)識別;社交媒體數(shù)據(jù)繁雜、各平臺之間信息互通,評論者可通過多平臺對藥品進(jìn)行同一評述,可能造成數(shù)據(jù)交叉重復(fù),存在一定局限性。在未來工作中,將嘗試采用機(jī)器學(xué)習(xí)和規(guī)則相結(jié)合方式,擴(kuò)充詞典規(guī)模,完善識別規(guī)則,從而提高事件抽取準(zhǔn)確率;并且嘗試對所抽取藥品不良反應(yīng)進(jìn)行本體存儲與構(gòu)建,從而形成知識圖譜以實(shí)現(xiàn)信息的深度關(guān)聯(lián)與展現(xiàn)。

        猜你喜歡
        語義藥品文本
        是不是只有假冒偽劣藥品才會有不良反應(yīng)?
        語言與語義
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        藥品采購 在探索中前行
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        藥品集中帶量采購:誰贏誰輸?
        認(rèn)知范疇模糊與語義模糊
        中國衛(wèi)生(2014年7期)2014-11-10 02:33:02
        国产精品亚洲综合久久系列| av中文字幕不卡无码| 亚洲乱码少妇中文字幕| 经典亚洲一区二区三区| 福利视频一区二区三区| 窝窝午夜看片| 欧洲在线一区| 日本高清不卡一区二区三区| 一区二区黄色在线观看| 色综合久久久久久久久久| 国产精品麻豆综合在线| av在线免费观看你懂的| 久久精品国产亚洲av性瑜伽| а天堂中文最新一区二区三区| 久久无码人妻一区二区三区午夜 | 亚洲一区二区三区影院| 国产精品va在线播放我和闺蜜| 色噜噜狠狠色综合欧洲| 精品人妻少妇丰满久久久免| 成 人 免 费 黄 色| 中文字幕亚洲乱码熟女一区二区 | 国产特级毛片aaaaaa高潮流水| 黑人大荫道bbwbbb高潮潮喷| 久久99热精品免费观看欧美| 国产一区二区三区在线观看黄| 手机在线看片| 精品久久久久久中文字幕| 91精品国产高清久久久久| 日韩麻豆视频在线观看| 色欲av蜜桃一区二区三| 一出一进一爽一粗一大视频免费的| 久久精品一区二区三区不卡牛牛| 国产精品18久久久白浆| 一本一道av无码中文字幕 | 人人妻人人澡人人爽欧美一区| 台湾佬自拍偷区亚洲综合| 日本高清不在线一区二区色| 中国亚洲av第一精品| 妺妺窝人体色www看美女| 久久久久久人妻精品一区百度网盘| 伊人狼人影院在线视频|