亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于中醫(yī)藥知識圖譜的智能問答與用藥推薦系統(tǒng)

        2019-11-30 00:12:10鄭懿鳴翟潔胡曉龍施軼劼劉浩
        電子技術(shù)與軟件工程 2019年20期
        關(guān)鍵詞:知識庫圖譜實體

        文/鄭懿鳴 翟潔 胡曉龍 施軼劼 劉浩

        1 引言

        在現(xiàn)有的自然語言處理技術(shù)、知識圖譜構(gòu)建相關(guān)研究的基礎(chǔ)上,結(jié)合各種方式的優(yōu)勢,同時利用盡可能豐富的數(shù)據(jù)源,專門針對中醫(yī)藥的查詢提出了較為適合的用于本系統(tǒng)的句式分析規(guī)則;同時,提供了知識圖譜與知識卡片相結(jié)合的方式更清晰地展示一種中藥實體的具體信息。

        將知識圖譜與知識卡片相結(jié)合,用戶既可以閱讀文字以獲取詳細解釋,又可以通過視覺的圖形來感知知識本體之間的相關(guān)性。文字與圖形相輔相成,豐富了系統(tǒng)內(nèi)涵,使得系統(tǒng)為用戶提供的資源不再單調(diào),提高了系統(tǒng)的感知性。

        2 總體設(shè)計

        2.1 設(shè)計重點

        2.1.1 中醫(yī)藥知識庫的構(gòu)建

        本系統(tǒng)采用自頂向下的策略,依次經(jīng)過模式圖定義、知識抽取、知識融合三個步驟完成基礎(chǔ)知識庫的構(gòu)建。模式圖包含知識庫擁有的概念、概念的屬性,以及概念之間的層次關(guān)系。知識抽取主要包括現(xiàn)有醫(yī)學文獻、醫(yī)療健康網(wǎng)站、中醫(yī)藥百科站點的知識抽取中醫(yī)藥相關(guān)的實體、實體類型、同義詞關(guān)系和“屬性-值”關(guān)系。知識庫的模式圖常用中醫(yī)藥知識庫主要包括中藥材、中醫(yī)證候、中醫(yī)疾病等上層概念及概念的屬性,構(gòu)建模式圖?;陔p向LSTM-CRF模型的中醫(yī)藥實體識別方法。常用中醫(yī)藥知識庫構(gòu)建中,需要從專業(yè)中醫(yī)藥文獻文本中識別藥品相關(guān)實體。

        采用基于特征模板的方法,利用大規(guī)模語料學習出標注模型,進而對語句進行標注,特征模板通常是人工定義的一些二值特征函數(shù),挖掘命名實體內(nèi)部以及上下文的構(gòu)成特點。采用基于雙向LSTM-CRF模型的中文實體識別方法來識別專業(yè)醫(yī)學典籍文檔中的中醫(yī)藥等實體。與傳統(tǒng)LSTM不同,雙向LSTM同時考慮了過去的特征和未來的特征,結(jié)果更具準確性。

        2.1.2 基于自然語言處理技術(shù)的中醫(yī)藥智能問答

        自然語言的處理通常采用自然語言技術(shù)(如命名實體識別等)對問題進行深層次的分割、理解。智能問答系統(tǒng)按照對數(shù)據(jù)的處理方式可以分為多種,盡管不同類型的問系統(tǒng)對于系統(tǒng)整體模塊的分工和實現(xiàn)存在一定差異,在一般情況下,依據(jù)Q&A系統(tǒng)的數(shù)據(jù)流程處理過程中,處理問題的框架都包括了問題理解、信息搜索和答案生成三個功能模塊。

        2.1.3 基于KK算法和節(jié)點生成算法的中醫(yī)藥知識圖譜可視化

        知識圖譜是一種以"語義網(wǎng)絡(luò)"為骨架而搭建起來的巨型網(wǎng)絡(luò)知識系統(tǒng)。它能夠能捕獲并展現(xiàn)領(lǐng)域概念之間的語義關(guān)系,使得各種知識資源中零碎、松散的知識本體互相聯(lián)系。將數(shù)據(jù)圖形化是生成知識圖譜的核心之一。作為一個可視化系統(tǒng),界面必須清晰易懂,因此需要過濾部分次要信息,提取主要信息,并對結(jié)果隨機排序。

        KK算法作為力導引圖布局算法,由一個雙層循環(huán)構(gòu)成。外層循環(huán)改變當前正在選擇最佳位置的節(jié)點,內(nèi)層循環(huán)控制此節(jié)點可改變位置的次數(shù)。實則就是在微小移動一個節(jié)點的同時,固定其他所有節(jié)點。KK算法將迭代次數(shù)的限制致力于內(nèi)循環(huán)上??刂扑泄?jié)點的移動次數(shù)上限,保證了即便無法達到最完美布局,但整體效果依然呈現(xiàn)出平衡、穩(wěn)定的效果。

        2.2 設(shè)計難點

        (1)中文語言與其他的語言最大的不同的地方在中文的詞匯之間沒有空格使其分隔開,這加大了語言處理算法對語句分割、語義理解的難度。

        (2)由于本系統(tǒng)是以中醫(yī)藥為核心,必須格外注意源數(shù)據(jù)的權(quán)威性。同時在建立中醫(yī)藥知識庫的構(gòu)建過程中,會存在詞典需求特殊的問題,需要進行特別的詞性標注。

        (3)在帶有歧義詞語的句子中,經(jīng)常會出現(xiàn)非期望的結(jié)果。在對用戶輸入的自然語言進行處理時,需要通過調(diào)用HanLP的相應(yīng)方法來實現(xiàn)對分詞進行整合。但是,在帶有歧義詞語的句子中,仍會不可避免地出現(xiàn)非期望的結(jié)果。

        (4)可視化的知識圖譜布局平衡問題。需要使用相應(yīng)算法來實現(xiàn)知識圖譜布局的美觀和易讀性。否則圖譜節(jié)點連線會出現(xiàn)互相交叉的現(xiàn)象,降低圖譜的閱讀性。

        3 功能實現(xiàn)

        3.1 分詞實現(xiàn)

        基于對用戶自然語言處理接受的需要,必須對用戶輸入的自然語言進行處理。處理的方法采用了CRF++技術(shù)對用戶輸入進行基本分割,并根據(jù)基本名詞短語識別(BaseNP)的4tag模式。通過對已經(jīng)標注好的每個單字,根據(jù)它的BaseNP標記進行整合。這一部分通過調(diào)用HanLP的相應(yīng)方法來實現(xiàn)。經(jīng)過多次實踐發(fā)現(xiàn),CRF對于陌生的詞匯具有較高的識別率,但也不可避免地出現(xiàn)少數(shù)非期望的結(jié)果,特別是在帶有歧義詞語的句子中。此時需要調(diào)用其他的分詞器來進行校正。

        3.2 詞典實現(xiàn)

        通過CRF獲得分詞結(jié)果之后,需要對結(jié)果進行整理,并標注詞性。采用了人民日報2014年詞性標注庫進行詞性標注。針對該系統(tǒng)的特殊需求,新增了中藥、疾病、信號詞、疑問詞等詞性的特殊詞性標注,方便了該系統(tǒng)通過此行來過濾關(guān)鍵詞、信息詞的提取。

        由于用戶時常不能準確定位所需檢索的問題的關(guān)鍵詞信息,所以有必要進行同義詞匹配的處理。本系統(tǒng)所采用的詞典是根據(jù)哈工大信息檢索研究中心的《同義詞詞林(擴展版)》而修訂的同義詞詞典。其為原詞典的簡化版,并且加入了很多專用于中藥特性的詞語,以更好地進行同義詞匹配。

        3.3 用藥推薦

        當用戶輸入的詞語是疾病或者是癥狀類型詞時,系統(tǒng)將對應(yīng)的癥狀與數(shù)據(jù)庫進行匹配,檢索出與之相關(guān)的中醫(yī)藥品類,按照相關(guān)程度給出適合該癥狀或疾病的中醫(yī)藥列表作為用藥的輔助依據(jù)。

        4 小結(jié)

        本系統(tǒng)實現(xiàn)了依照用戶輸入的書面或者口語化語言,進行漢語言標注;根據(jù)信號詞進行句式模板匹配,根據(jù)一定的匹配原則,產(chǎn)生相應(yīng)的查詢語句,在已有的中醫(yī)藥知識庫中檢索需要提供給用戶的信息,并通過知識卡片、可視化圖譜、用藥推薦的方式呈現(xiàn)出來。

        猜你喜歡
        知識庫圖譜實體
        繪一張成長圖譜
        前海自貿(mào)區(qū):金融服務(wù)實體
        中國外匯(2019年18期)2019-11-25 01:41:54
        基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
        實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
        哲學評論(2017年1期)2017-07-31 18:04:00
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        兩會進行時:緊扣實體經(jīng)濟“釘釘子”
        振興實體經(jīng)濟地方如何“釘釘子”
        高速公路信息系統(tǒng)維護知識庫的建立和應(yīng)用
        主動對接你思維的知識圖譜
        基于Drupal發(fā)布學者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        欧美xxxxx在线观看| 99精品免费久久久久久久久日本| 国内大量揄拍人妻在线视频| 色婷婷精品综合久久狠狠| 中文字幕熟女激情50路| 中文字幕人妻久久久中出| 国产国语亲子伦亲子| 国产成人av免费观看| 久久99精品久久久久九色 | 亚洲国产精品夜男人天堂| 一本一道久久综合久久| 国产精品泄火熟女| 久久99国产乱子伦精品免费| 淫妇日韩中文字幕在线| 亚洲国产精品情侣视频| 国产肉体xxxx裸体137大胆| 国产天堂在线观看| 国产91九色视频在线播放| 色呦呦九九七七国产精品| 东北妇女肥胖bbwbbwbbw| 亚洲免费av电影一区二区三区| 一区二区三区手机看片日本韩国| 久久久久久久久无码精品亚洲日韩| 国产黄在线观看免费观看不卡| 无夜精品久久久久久| 亚洲精品中文字幕一二| 人人做人人爽人人爱| 天堂网www在线资源| 国产成人自拍视频在线免费| 亚洲精品一区二区三区52p| 久久精品噜噜噜成人| 99在线视频精品费观看视| 亚洲av成人波多野一区二区 | 中文字日产幕码三区做法| 国产做国产爱免费视频| 精品国产高清a毛片无毒不卡 | 精品国内自产拍在线视频| 国产av精品久久一区二区| 亚洲国产精品久久久久久无码| 婷婷五月综合缴情在线视频| 亚洲免费无毛av一区二区三区|