亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        心力衰竭知識圖譜的構(gòu)建

        2019-09-11 10:44:40
        關(guān)鍵詞:詞表層級圖譜

        知識圖譜是一種比較通用的語義知識的形式化描述框架,應(yīng)用節(jié)點表示語義符號,用邊表示符號之間的語義關(guān)系[1]。醫(yī)學(xué)是知識圖譜應(yīng)用最廣的垂直領(lǐng)域之一,可提供高效的檢索、查詢和支持知識推理,為患者教育、智能導(dǎo)診、藥物研發(fā)、藥物監(jiān)測、輔助診斷、決策支持提供強大的數(shù)據(jù)支撐[2]。隨著區(qū)域衛(wèi)生信息化和醫(yī)療信息系統(tǒng)的發(fā)展,如何在海量醫(yī)學(xué)數(shù)據(jù)中提煉信息、知識,并進行合理的組織、管理、共享和應(yīng)用是推進醫(yī)學(xué)智能化的關(guān)鍵問題之一。

        目前國內(nèi)外已開展了一些醫(yī)學(xué)領(lǐng)域知識圖譜構(gòu)建及其應(yīng)用的研究,涉及醫(yī)學(xué)大領(lǐng)域的圖譜構(gòu)建[3]、特定臨床科室知識圖譜構(gòu)建[4-5]、單病種知識圖譜構(gòu)建[6]等。構(gòu)建知識圖譜應(yīng)用的數(shù)據(jù)源包括電子病歷(Electronic Health Record,EHR)、臨床指南、專家共識、文獻、書籍以及醫(yī)學(xué)領(lǐng)域詞表,如醫(yī)學(xué)主題詞表(Medical Subject Heading、MeSH)等。通用領(lǐng)域的知識圖譜構(gòu)建的主要環(huán)節(jié)通常包括知識體系構(gòu)建、知識獲取、知識融合、知識存儲、知識推理和知識應(yīng)用等[1]。由于醫(yī)學(xué)數(shù)據(jù)的結(jié)構(gòu)復(fù)雜和專業(yè)性強等特點,現(xiàn)有知識圖譜構(gòu)建技術(shù)在醫(yī)學(xué)領(lǐng)域中普遍存在效率低、限制多、拓展性差[7]等問題。本文以心力衰竭為例構(gòu)建醫(yī)學(xué)領(lǐng)域的知識圖譜,探索利用現(xiàn)有詞表、本體、數(shù)據(jù)庫等資源構(gòu)建專病知識圖譜的可行性,為單病種醫(yī)學(xué)知識圖譜構(gòu)建提供參考和為臨床決策支持提供知識技術(shù)支撐。

        1 研究方法

        1.1 數(shù)據(jù)概況及實驗平臺

        本文以“心力衰竭”為核心,構(gòu)建包含疾病、檢查、手術(shù)、藥物、科室、癥狀、解剖學(xué)7大類語義概念的知識圖譜。通過文獻調(diào)研與網(wǎng)絡(luò)調(diào)研,選取生物醫(yī)學(xué)領(lǐng)域的常用詞表、本體對上述的生物醫(yī)學(xué)大類進行組織,構(gòu)建層級結(jié)構(gòu)。本文的實驗數(shù)據(jù)存儲及知識圖譜的主要構(gòu)建過程依托支持分類表、詞表、應(yīng)用本體等術(shù)語系統(tǒng)的概念復(fù)用、拆分合并及語義關(guān)系創(chuàng)建與關(guān)聯(lián)的多語言領(lǐng)域術(shù)語系統(tǒng)構(gòu)建工具TBench[8]平臺。

        1.2 知識體系構(gòu)建

        知識體系構(gòu)建主要分為人工定義構(gòu)建和自動學(xué)習(xí)構(gòu)建兩種方法,通常包括概念分類、屬性描述、概念間關(guān)系的定義3個主要方面。本文將范圍限定在心力衰竭領(lǐng)域,為了確保準確性與合理性,采用人工定義構(gòu)建的方式對知識體系進行定義。概念分類主要針對心力衰竭相關(guān)的疾病、檢查、手術(shù)、藥物、科室、癥狀、解剖學(xué)。屬性描述分為概念屬性和概念間語義關(guān)系屬性的描述,概念屬性={CID,AID,SID,概念名稱,是否為優(yōu)選詞,來源,語義類型 };語義關(guān)系屬性= {RID,關(guān)系名稱,定義域,值域,定義,反向關(guān)系名稱}。其中,CID為概念的唯一標識符,AID為來源術(shù)語ID,SID為術(shù)語ID,RID為語義關(guān)系的唯一標識符。語義關(guān)系設(shè)定如表1所示,共14類,包括同義詞關(guān)系、層級關(guān)系和12類概念間非層級關(guān)系。其中12類概念間非層級關(guān)系為6對互為相反的關(guān)系,是疾病概念與其他6類概念的關(guān)系。

        表1 知識圖譜中的關(guān)系類型設(shè)定

        1.3 層級關(guān)系構(gòu)建

        本文通過對“心力衰竭”相關(guān)的疾病、檢查、手術(shù)、藥物、科室、癥狀、解剖學(xué)7個大類的相關(guān)知識進行組織,構(gòu)建知識圖譜的層級關(guān)系,主要參考國內(nèi)外現(xiàn)有詞表、本體,綜合這些詞表的特點。表2顯示了具體的參考資源,如疾病的分類和層級結(jié)構(gòu)主要參考“醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語(Systematized Nomenclature of Medicine-Clinical Term, SNOMED-CT)”和“醫(yī)學(xué)主題詞表(Medical Subject Headings,MeSH)”兩個詞表構(gòu)建。

        收集數(shù)據(jù)資源之后,根據(jù)資源的實際情況,將部分目前沒有中文版的資源首先進行機器翻譯。為了保證準確性,在機器翻譯之后進行了人工校對。

        1.4 同義關(guān)系構(gòu)建

        同義關(guān)系的構(gòu)建方法包括繼承、基于規(guī)則和同義詞傳導(dǎo)3類。某些詞表、本體本身會包含一些同義詞的信息,如MeSH詞表,這部分的同義關(guān)系直接繼承到知識圖譜中。

        表2 知識圖譜的語義類型與相關(guān)參考資源

        本文利用網(wǎng)絡(luò)爬蟲工具從來源于網(wǎng)絡(luò)版的臨床知識庫的數(shù)據(jù)中抽取包含“心衰”和“心力衰竭”疾病相關(guān)的所有詞條,再根據(jù)基于規(guī)則的方法抽取相關(guān)同義詞。如該疾病描述中出現(xiàn)了特定詞語“簡稱”“別稱”“別名”“又名”“又稱”等,則在這些詞語后出現(xiàn)的詞語名稱視為該疾病的同義詞,進行人工審核確定無誤后納入為同義詞。對于不同來源的術(shù)語的同義關(guān)系的確定,這部分可以稱為“實體對齊”,通常通過判斷不同知識庫中的兩個實體是否表示同一物理對象從而鏈接異構(gòu)知識庫。這類數(shù)據(jù)主要通過同義關(guān)系傳導(dǎo)的方法進行實體對齊,即如果A的同義詞A’與B或者B的同義詞B’相同,則認為A和B是同一個實體,是同義詞的關(guān)系。對于非繼承得到的同義關(guān)系需要人工審核以確保其準確性。

        1.5 概念間非層級關(guān)系構(gòu)建

        概念間非層級關(guān)系即具體實體間的關(guān)聯(lián)。如“疾病-疾病相關(guān)科室-科室”,主要從網(wǎng)絡(luò)臨床知識庫中利用自然語言處理方法進行關(guān)系的抽取。網(wǎng)絡(luò)版的臨床知識庫中通常包括半結(jié)構(gòu)化的醫(yī)學(xué)知識。如“中國公眾健康網(wǎng)”關(guān)于心力衰竭的描述包括概述、病因、癥狀、并發(fā)癥、診斷及同義詞等,其中每個版塊都會有自然語言的文本對相應(yīng)問題進行描述。概念間的非層級關(guān)系構(gòu)建主要利用IK Analyzer分詞工具,通過基于規(guī)則的詞語共現(xiàn)方法實現(xiàn)。

        首先確定待抽取數(shù)據(jù)源。如抽取“疾病-檢查”關(guān)系,通常會截取特定字段,如疾病相關(guān)描述的“實驗室檢查及輔助檢查”字段,進行進一步抽取工作。其次,匯總所有描述待抽取詞的相關(guān)詞表。同樣以“疾病-檢查”關(guān)系抽取為例,匯總與檢驗檢查相關(guān)的詞表列表,利用其中的概念及其同義詞生成IK Analyzer的自定義詞典,這樣便不會隨意分開某些特定的詞(如“結(jié)腸鏡檢查”不會被分成“結(jié)腸鏡”和“檢查”兩個詞),還可以過濾掉一些常見的停用詞以提升文本處理的速度和精確度。在配置好IK Analyzer工具之后,導(dǎo)入第一步處理得到的半結(jié)構(gòu)化數(shù)據(jù),進行分詞。在該步驟中,同樣需要第二步的詞表列表,得到基于原始半結(jié)構(gòu)化文本中的相關(guān)內(nèi)容,形成關(guān)系對。最后,經(jīng)過人工審核生成知識體系中定義的雙向關(guān)系(圖1),以“疾病-檢查”的非層級關(guān)系構(gòu)建為例說明構(gòu)建的流程,構(gòu)建了上述12類概念間非層級關(guān)系。

        如果不同來源的數(shù)據(jù)存在不一致或者矛盾的問題,優(yōu)先采用可靠性高的數(shù)據(jù),如繼承的詞表中的數(shù)據(jù)。此外,為了控制數(shù)據(jù)的質(zhì)量,利用共現(xiàn)規(guī)則提取的數(shù)據(jù)需要經(jīng)過有臨床背景的醫(yī)學(xué)生、醫(yī)生審閱,以保證數(shù)據(jù)可靠、可用。人工審核的數(shù)據(jù)形式以三元組列表形式,即“概念1-語義關(guān)系-概念2”的形式展示。采用交叉驗證的方法,即兩人同時評估關(guān)系的可靠性,如果都通過則保留關(guān)系,都不通過則刪除關(guān)系,一人通過一人拒絕則邀請第三人審核,選擇第三人的審核結(jié)果,以減小誤差。

        圖1 概念間的非層級關(guān)系構(gòu)建示例

        2 結(jié)果

        本文旨在構(gòu)建醫(yī)學(xué)領(lǐng)域的專病知識圖譜,以“心力衰竭”這一小領(lǐng)域為例重點構(gòu)建了同義關(guān)系、層級關(guān)系和12類概念間非層級關(guān)系。知識圖譜中包括126個心衰疾病概念和398個心力衰竭直接關(guān)聯(lián)的非疾病概念(表3),因此該心力衰竭知識圖譜共包括524個概念。

        表3 心力衰竭知識圖譜概念數(shù)據(jù)量與關(guān)聯(lián)數(shù)據(jù)量與統(tǒng)計

        心力衰竭的相關(guān)關(guān)系包括1 581對“疾病-檢查”關(guān)系,684對“疾病-手術(shù)”關(guān)系,94對“疾病-藥物”關(guān)系,292對“疾病-科室”關(guān)系,1 558對“疾病-癥狀”關(guān)系,151對“疾病-解剖”關(guān)系,共包括4 360對概念間的非層級關(guān)系。該統(tǒng)計是基于未去重的數(shù)據(jù)統(tǒng)計的,如急性左心力衰竭是心力衰竭的下位類,這兩種疾病的癥狀都有呼吸困難、乏力的癥狀,都會被納入統(tǒng)計數(shù)據(jù)。

        由于數(shù)據(jù)量較多,僅對心力衰竭知識圖譜的部分數(shù)據(jù)進行了圖形化展示。在上文中定義的14類關(guān)系,即藥物、解剖學(xué)、檢查、手術(shù)、癥狀、科室和疾病相互關(guān)聯(lián)的關(guān)系、部分同義詞關(guān)系和層級關(guān)系如圖2所示。如急性左心衰的同義詞包括急性左側(cè)心力衰竭、急性左心功能不全、急性左側(cè)心功能降低、急性左心衰竭,該疾病的癥狀有呼吸困難。呼吸困難屬于呼吸道癥狀,如此關(guān)聯(lián)了心力衰竭下位概念急性左心衰與癥狀類數(shù)據(jù),其他數(shù)據(jù)同理。

        3 討論

        本文主要利用現(xiàn)有資源構(gòu)建了心力衰竭領(lǐng)域的知識圖譜,但在數(shù)據(jù)的完整性方面沒有追求涵蓋所有現(xiàn)階段心衰知識。今后在知識圖譜應(yīng)用時可以通過納入更多的資源以擴充數(shù)據(jù)量,尤其是臨床指南、電子病歷等具有高價值但結(jié)構(gòu)化不高的數(shù)據(jù)。此外本文的應(yīng)用場景主要是面向普通大眾或者基層醫(yī)生進行醫(yī)學(xué)科普,在綜合性和易用性方面應(yīng)優(yōu)于教科書和臨床指南,但在嚴謹性和科學(xué)性方面可能會不如教科書和臨床指南,如“疾病-癥狀“關(guān)系可加上可信度或發(fā)生概率,在今后的研究中將探索相關(guān)數(shù)據(jù)的挖掘與集成。

        本文在知識圖譜的構(gòu)建過程中,利用基于規(guī)則的方法較多,優(yōu)點是準確率較高,較為接近人類的思考方式,但需要較多的人工干預(yù),可能較難移植到其他醫(yī)學(xué)領(lǐng)域[1]。在今后的研究中,將繼續(xù)探索機器學(xué)習(xí)方法在實體識別、實體對齊、關(guān)系抽取方面的應(yīng)用。目前還未探索利用一些工具(如XSLT轉(zhuǎn)換工具和XMedlan工具)直接結(jié)構(gòu)化、語義化文獻資源,從而集成不同類型的領(lǐng)域知識,如像黃智生等人通過對“川崎病“相關(guān)的文獻、臨床試驗、藥物知識庫等數(shù)據(jù)語義化集成可查詢的圖譜數(shù)據(jù)[6]。由于考慮到利用工具對本文中的部分中文數(shù)據(jù)資源及部分數(shù)據(jù)資源的數(shù)據(jù)類型進行處理的難度較大,因此主要對抽取的重點信息進行了關(guān)聯(lián)與集成。

        圖2 心力衰竭知識圖譜可視化示例

        此外,現(xiàn)有的研究中對于本體、知識圖譜評價主要集中在專家評價[9],與已有臨床指南等進行對比[10]或通過實際應(yīng)用效果[11]對圖譜的準確性、全面性進行評估。本文后續(xù)會將構(gòu)建的模型投入到實際應(yīng)用中,根據(jù)使用者的反饋與評價不斷完善數(shù)據(jù)結(jié)構(gòu)與內(nèi)容。

        4 結(jié)語

        知識圖譜為海量異構(gòu)數(shù)據(jù)的集成提供了有效的方式,目前已應(yīng)用于智能檢索、問答及醫(yī)學(xué)垂直領(lǐng)域等方面,具有很好的應(yīng)用前景。本文基于目前知識圖譜的構(gòu)建流程和方法,構(gòu)建了包含524個概念和4 360對關(guān)系的心力衰竭知識圖譜,證明了基于現(xiàn)有資源構(gòu)建專病知識圖譜可以為專病領(lǐng)域的知識圖譜構(gòu)建提供參考。醫(yī)學(xué)知識圖譜的構(gòu)建與持續(xù)完善將為基層醫(yī)療、大眾科普等方面提供數(shù)據(jù)支撐,也可以在應(yīng)用中不斷提升其可用性與可靠性。

        猜你喜歡
        詞表層級圖譜
        繪一張成長圖譜
        A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
        英語世界(2021年13期)2021-01-12 05:47:51
        軍工企業(yè)不同層級知識管理研究實踐
        基于軍事力量層級劃分的軍力對比評估
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        敘詞表與其他詞表的互操作標準
        主動對接你思維的知識圖譜
        任務(wù)期內(nèi)多層級不完全修復(fù)件的可用度評估
        雜草圖譜
        國外敘詞表的應(yīng)用與發(fā)展趨勢探討*
        日韩一区av二区三区| 东北妇女xx做爰视频| 久久精品国产亚洲av高清漫画| 艳妇乳肉豪妇荡乳av无码福利 | 少妇被猛烈进入中文字幕| 日本xxxx色视频在线观看| 曝光无码有码视频专区| 国产偷2018在线观看午夜| 久久精品国产亚洲不卡| 2019nv天堂香蕉在线观看| 国产亚洲精品久久久久婷婷瑜伽| 窝窝影院午夜看片| 91极品尤物国产在线播放| 日本精品一级二区三级| 亚洲人交乣女bbw| 国产真人无遮挡作爱免费视频| 亚洲女同同性少妇熟女| 日本精品免费看99久久| 精东天美麻豆果冻传媒mv| 中文字幕第八页| 国产亚洲精品一区二区在线播放| 天天综合天天爱天天做| av无码久久久久不卡网站下载| 国产欧美精品一区二区三区–老狼 | 久久久久国产精品片区无码| 日产国产精品亚洲高清| 国产亚洲一区二区在线观看| 欧美精品videossex少妇| 亚洲中文字幕在线一区二区三区| 亚洲中文字幕乱码在线视频| 强奸乱伦影音先锋| 天天看片视频免费观看| 亚洲精品99久久久久久| 少妇太爽了在线观看免费| 东京热人妻无码一区二区av| 国产中文aⅴ在线| 熟女不卡精品久久av| 成人麻豆日韩在无码视频| 97超级碰碰人妻中文字幕| 国产成人福利在线视频不卡| 在线观看在线观看一区二区三区|