張雨琪 李宗友 王映輝 李敬華 于琦 朱玲 姜威 于彤
摘要中醫(yī)藥知識記錄分散、隱性知識眾多,又富含關(guān)系知識,因此在關(guān)聯(lián)、表達(dá)、利用知識上具有優(yōu)勢的知識圖譜能夠為領(lǐng)域提供有益輔助。系統(tǒng)梳理中醫(yī)藥領(lǐng)域知識圖譜的構(gòu)建及其應(yīng)用的研究工作,可見基于中醫(yī)藥知識圖譜的應(yīng)用正在不斷發(fā)展,將知識圖譜構(gòu)建技術(shù)運(yùn)用于中醫(yī)藥知識圖譜中時則需慮及領(lǐng)域特點(diǎn)。根據(jù)領(lǐng)域知識特點(diǎn)與實踐需求,一些研究設(shè)計了知識框架,選擇了合適的知識抽取、融合和存儲技術(shù),嘗試了知識補(bǔ)全,構(gòu)建中醫(yī)藥知識圖譜并實現(xiàn)信息理解、搜索、推薦、自動問答以及輔助決策等應(yīng)用。不過,在豐富關(guān)系種類、理論知識與多模態(tài)知識,拓展知識來源,完善質(zhì)量評估與控制,加強(qiáng)子領(lǐng)域知識圖譜的構(gòu)建以及共享與協(xié)作等方面,還需許多努力。
關(guān)鍵詞中醫(yī)藥;知識圖譜;知識表示;知識抽取;知識融合;語義理解;知識服務(wù);質(zhì)量評估
Research Progress on the Construction and Applications of Traditional Chinese Medicine Knowledge Graphs
ZHANG Yuqi,LI Zongyou,WANG Yinghui,LI Jinghua,YU Qi,ZHU Ling,JIANG Wei,YU Tong
(Institute of Information on Traditional Chinese Medicine,China Academy of Chinese Medical Sciences,Beijing 100700,China)
AbstractTraditional Chinese medicine(TCM) knowledge is scattered in records,and has plenty of tacit knowledge.It′s also rich in relationships.So,Knowledge Graphs(KG),which possess the advantage of the linking,representation,and usage of knowledge,can provide beneficial assistant in the field.A systematic review of the research work on the construction and application of knowledge graphs in the field of TCM shows that applications based on knowledge graphs of TCM are constantly developing.When applying knowledge graph construction techniques to the knowledge graphs of TCM,it is necessary to consider the characteristics of the field.According to the characteristics of domain knowledge and practical requirements,some studies have designed a knowledge framework,selected appropriate knowledge extraction,fusion and storage technologies,tried knowledge completion,constructed a knowledge map of TCM and realized information understanding,search,recommendation,automatic question and answer,and assisted decisionmaking and other applications.However,much effort is needed to enrich relationship types,theoretical knowledge and multimodal knowledge,expand knowledge sources,improve quality assessment and control,and strengthen the construction of subdomain knowledge graphs and sharing and collaboration.
KeywordsTraditional Chinese medicine; Knowledge graph; Knowledge representation; Knowledge extraction; Knowledge fusion; Semantic understanding; Knowledge service; Quality evaluation
中圖分類號:R203文獻(xiàn)標(biāo)識碼:Adoi:10.3969/j.issn.1673-7202.2022.04.020
中醫(yī)藥注重的整體觀使中醫(yī)藥知識一方面富含關(guān)系知識,另一方面,面對不同時代、地域、個體時各有特色,以致知識被分散記錄,不易應(yīng)用。眾多隱性知識難以表述,也使中醫(yī)藥領(lǐng)域期望于此探索新的方法。因此,知識圖譜在關(guān)聯(lián)、表達(dá)、利用知識上的優(yōu)勢,使中醫(yī)藥知識圖譜的研究不斷發(fā)展。
1知識圖譜概念及現(xiàn)有中醫(yī)藥知識圖譜
知識圖譜源于知識工程和語義網(wǎng)2個領(lǐng)域[1]。知識工程是人工智能子領(lǐng)域之一,以讓計算機(jī)使用專家知識以及推理能力解決實際問題為主要目標(biāo),一系列知識表示方法由此得到發(fā)展,如描述邏輯、框架、語義網(wǎng)絡(luò)等[2]。語義網(wǎng)則期望為網(wǎng)絡(luò)數(shù)據(jù)提供語義支撐,以提升信息服務(wù)效果,這推動了在大數(shù)據(jù)環(huán)境中表達(dá)數(shù)據(jù)語義方法的研究[3]。2012年,知識圖譜(Knowledge Graph)被提出。它從數(shù)據(jù)中獲取知識,并表示為易于維護(hù)、理解和使用的統(tǒng)一格式[4]。知識圖譜可被視為一張巨大的網(wǎng),其中節(jié)點(diǎn)表示實體,邊表示關(guān)系,是一種用圖模型來描述知識和建模世界萬物之間關(guān)聯(lián)關(guān)系的技術(shù)方法[5]。它被用于支持知識驅(qū)動的各項智能任務(wù)?!爸R圖譜”還對應(yīng)另一個概念“科學(xué)知識圖譜”,為顯示科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形,屬于科學(xué)計量學(xué)[6]?,F(xiàn)有中醫(yī)藥知識圖譜可根據(jù)知識范圍、應(yīng)用目標(biāo)分類。見表1。
從構(gòu)建和應(yīng)用2個方面回顧中醫(yī)藥知識圖譜的研究現(xiàn)狀。首先,以知識圖譜的構(gòu)建過程為主線,闡述構(gòu)建技術(shù)如何根據(jù)領(lǐng)域特點(diǎn)應(yīng)用于中醫(yī)藥知識圖譜中。接著,介紹現(xiàn)有中醫(yī)藥知識圖譜的應(yīng)用進(jìn)展。從這2個角度出發(fā),最后將討論研究中的問題與建議。
2中醫(yī)藥知識圖譜的構(gòu)建方法
知識圖譜構(gòu)建主要包括知識框架設(shè)計、知識獲取、知識融合、知識存儲4個環(huán)節(jié)[7],知識補(bǔ)全等任務(wù)則可提升其質(zhì)量[8]。中醫(yī)藥領(lǐng)域?qū)ψ詣訕?gòu)建技術(shù)進(jìn)行了探索使用,不過由于錯誤代價高昂使得醫(yī)療領(lǐng)域容錯程度低,人工參與仍然具有重要地位。
2.1知識框架設(shè)計復(fù)用和自建知識框架在中醫(yī)藥知識圖譜中均有應(yīng)用,本體是知識框架常見的形式。對于前者,可基于概念、詞表、上下位關(guān)系等方式抽取子本體加以改造[9],例如從中醫(yī)藥學(xué)語言系統(tǒng)抽取子本體的舌象診療系統(tǒng)知識圖譜[10]、中藥知識圖譜[11]、月經(jīng)病知識圖譜[12];也可以整體復(fù)用,例如整體復(fù)用中醫(yī)臨床術(shù)語系統(tǒng)的中醫(yī)臨床知識圖譜[13]。對于后者,則既可嚴(yán)格構(gòu)建本體,例如中醫(yī)基礎(chǔ)理論本體基礎(chǔ)上的中醫(yī)核心知識圖譜[14]、中醫(yī)養(yǎng)生領(lǐng)域本體基礎(chǔ)上的中醫(yī)養(yǎng)生知識圖譜[15];也可以根據(jù)領(lǐng)域知識或已有數(shù)據(jù)制定單層、少量概念的知識框架,例如曙光醫(yī)院知識圖譜[1617]、中醫(yī)健康知識圖譜等[18]。使用這種方法常常是因為預(yù)計涉及的概念、關(guān)系種類有限,故而選擇一種簡便的方式。除癥狀、疾病、證候、方劑、藥物及病癥、證癥、病證、治療、藥物組成等最常見的概念、關(guān)系外,不同知識圖譜涉及的知識各有特色,如養(yǎng)生方法[15]、陰陽五行[14]、共現(xiàn)疾病[18]等,還可包括非領(lǐng)域知識,如人員、決策模型等[19]。其中,“實例”往往是指各中醫(yī)藥知識圖譜中不再有下級知識者,對應(yīng)的具體知識層次在不同研究中并不統(tǒng)一。例如,“銀杏葉”在有的知識圖譜中指實例,在有的知識圖譜中則是概念,后者的“批號為XX的銀杏葉”才是實例[19]。一些研究應(yīng)用了更豐富的方法表達(dá)復(fù)雜的領(lǐng)域知識。例如,使用關(guān)系的權(quán)重屬性表達(dá)主次癥等角色[2021],設(shè)置與名醫(yī)、病、證、方等均關(guān)聯(lián)的“診次”概念以表達(dá)病歷和醫(yī)案[22],通過以關(guān)系命名的實體與一般實體的關(guān)聯(lián)來表達(dá)多元關(guān)系[17]。
2.2知識獲取
知識獲取可分為來源選擇和知識抽取2個部分。已建的中醫(yī)藥知識圖譜主要是文本知識圖譜,各研究根據(jù)中醫(yī)文本的特點(diǎn)對知識抽取的方法進(jìn)行了選擇。
2.2.1來源選擇病歷、醫(yī)案最直接反映了中醫(yī)藥知識運(yùn)用、需求現(xiàn)狀,是重要知識源。為保證其內(nèi)容可被解讀,以及知識的覆蓋面、準(zhǔn)確度,它常與其他來源知識一同用于構(gòu)建知識圖譜,如中醫(yī)骨科病歷與網(wǎng)絡(luò)知識,名老中醫(yī)病歷、醫(yī)案與科研論文等[2223]。中醫(yī)古籍是中醫(yī)藥領(lǐng)域的獨(dú)特數(shù)據(jù)。目前完全使用古籍知識構(gòu)建的知識圖譜體量還比較小[21,24],更大規(guī)模的中醫(yī)方劑知識圖譜[25]、中醫(yī)養(yǎng)生知識圖譜則聯(lián)合了現(xiàn)代數(shù)據(jù)[15]。后者來源眾多,包括非結(jié)構(gòu)化的科研論文、領(lǐng)域書籍、行業(yè)網(wǎng)站數(shù)據(jù)、制藥工程數(shù)據(jù),半結(jié)構(gòu)化的詞典、行業(yè)標(biāo)準(zhǔn)、百科數(shù)據(jù)、藥品說明書,結(jié)構(gòu)化的術(shù)語系統(tǒng)、數(shù)據(jù)庫、西醫(yī)本體等[1213,1516,1820,2528]。
2.2.2知識抽取已經(jīng)積累的中醫(yī)藥領(lǐng)域結(jié)構(gòu)化數(shù)據(jù),可通過與本體間的語義映射轉(zhuǎn)換為知識圖譜[13,15,26],或使用D2RQ從關(guān)系型數(shù)據(jù)庫映射為虛擬的圖數(shù)據(jù)結(jié)構(gòu)[16]。自動抽取方法則在半結(jié)構(gòu)、非結(jié)構(gòu)化數(shù)據(jù)中得到實踐。見表2。
為避免中文分詞不當(dāng)給實體識別帶來不利影響,依照漢字的信息攜帶特性,有研究選擇生成字向量而非詞向量。這在中醫(yī)古籍、醫(yī)案、教材中表現(xiàn)更好[20,3031,44],不過由于增加了類型判別任務(wù),并使得特征粒度減小,特征信息降低,在現(xiàn)代用語更多的病歷中效果不佳[32]。此外,待消歧實體的存在,如自然之“水”與五行之“水”,也會影響實體識別效果[31]。為獲取更豐富的知識,貝葉斯分類算法、TFIDF算法被用于方劑癥狀、證候癥狀等關(guān)系的權(quán)重計算[2021]。還有研究以中西醫(yī)內(nèi)容兼具的病歷為對象,進(jìn)行了時間關(guān)系識別[47]。
2.2知識融合共指消解是中醫(yī)藥知識圖譜中開展較多的知識融合任務(wù),同為實例層融合任務(wù)的實體消歧則尚少研究;由于領(lǐng)域知識圖譜數(shù)量尚少、開放較少、應(yīng)用較淺,故而知識圖譜層次的知識融合也不多見。有研究根據(jù)領(lǐng)域?qū)<业呐袛嗪皖I(lǐng)域詞典,進(jìn)行了方劑、中藥的共指消解[25,28]。中醫(yī)概念表達(dá)用詞豐富,如“手足厥冷”與“四逆”“口渴多飲”與“口渴煩飲”,使得計算編輯距離或指稱向量相似度的效果不盡人意,需輔以大量人工審核[10,18]。因此,實體擴(kuò)展特征如別名、英文名稱、定義,以及方劑的組成、功用、主治,疾病的癥狀描述,中藥的藥性等得到使用[18,23,25]。如前所述,也有研究選擇設(shè)置“相同癥狀”關(guān)系來連接相似度高的癥狀[18],或在屬性值融合時對其根據(jù)出現(xiàn)次數(shù)和數(shù)據(jù)源可信度進(jìn)行排序[16],而不執(zhí)行“消解”。
2.3知識存儲根據(jù)病歷數(shù)據(jù)空值多、謂詞數(shù)量多且不固定等特性,結(jié)合實際搜索中連接操作比較少的特點(diǎn),有研究改進(jìn)了三元組表存儲方案,在表中將知識以其id存儲,id數(shù)據(jù)與類型知識另表存儲[17]。近期多數(shù)工作都采用圖數(shù)據(jù)庫Neo4j存儲知識圖譜數(shù)據(jù),也有輔以關(guān)系型數(shù)據(jù)庫以存儲非結(jié)構(gòu)化數(shù)據(jù)、應(yīng)用中的交互信息等[10,2122,2426]。針對中醫(yī)藥知識與其應(yīng)用的特點(diǎn)的存儲方案的探討還不多。
2.4知識補(bǔ)全知識補(bǔ)全是知識圖譜中的推理任務(wù)之一[48]。根據(jù)同病因疾病可同時出現(xiàn)等人工制定的推理規(guī)則,以及關(guān)系的傳遞性等通用規(guī)則,有研
究使用Jena推理機(jī)進(jìn)行推理,獲取了更多病證對應(yīng)關(guān)系、疾病共現(xiàn)關(guān)系[18]。不過,其推理規(guī)則在正確性上尚有瑕疵,中醫(yī)藥在漫長時間中的不斷演變也使得知識補(bǔ)全的結(jié)果難以評測,因此有待進(jìn)一步研究。在實際的中醫(yī)藥知識圖譜系統(tǒng)中應(yīng)用知識補(bǔ)全技術(shù)仍需十分慎重。
3中醫(yī)藥知識圖譜的應(yīng)用
與知識在人類認(rèn)知活動中的作用相對應(yīng),知識圖譜使得機(jī)器能夠理解新的信息、實現(xiàn)邏輯推理、進(jìn)行問題求解以及做出決策。因此,在中醫(yī)藥領(lǐng)域,知識圖譜將輔助領(lǐng)域信息理解,提升搜索、推薦和問答中知識提供的準(zhǔn)確度,幫助醫(yī)生制定診療方案等。
3.1信息理解中醫(yī)藥文獻(xiàn)涉及眾多領(lǐng)域知識,但后者分布分散、表述多變,即使人工解讀文獻(xiàn),解讀的質(zhì)量也與個人知識儲備十分相關(guān)。有研究構(gòu)建了中醫(yī)藥知識圖譜以獲取實體的向量化表示,使向量得到大量領(lǐng)域知識的“加持”,從而提升計算機(jī)分析癥狀與藥物對應(yīng)關(guān)系的性能[28]。另一方面,將知識圖譜可視化為拓?fù)浣Y(jié)構(gòu)圖,可幫助人類快速掌握知識;知識圖譜便于表達(dá)關(guān)系的特點(diǎn)使實體屬性、相關(guān)實體等知識便于獲取,也能輔助人類對知識的理解、探索和判斷。多項研究采用知識卡片和知識可視化的形式對這些知識進(jìn)行展示[13,15,26,34]。
3.2搜索與推薦知識圖譜可通過對語義的理解提升搜索與推薦服務(wù)的性能,幫助用戶更準(zhǔn)確地獲取所需知識[49]。例如,中藥制藥知識圖譜針對制藥過程參數(shù)辨識、藥物質(zhì)量溯源等多項主題查詢關(guān)聯(lián)數(shù)據(jù),以便進(jìn)行分析并開展中藥制藥過程質(zhì)量控制[19];中醫(yī)養(yǎng)生知識圖譜提出根據(jù)用戶個人資料中的體質(zhì)信息,通過知識圖譜豐富用戶畫像、獲取語義關(guān)聯(lián),為用戶推薦養(yǎng)生方法,并對推薦結(jié)果綜合來源權(quán)威性、專家打分、用戶點(diǎn)擊率等信息進(jìn)行排序[15]?;谥嗅t(yī)藥學(xué)語言系統(tǒng)的問答系統(tǒng)則根據(jù)用戶的提問為用戶推薦中醫(yī)醫(yī)案[12]。為解決構(gòu)建搜索時實體向知識圖譜映射失敗的情況,有研究利用JaroWinkler Distance算法計算編輯距離衡量實體間語義相似度、Apriori算法挖掘關(guān)聯(lián)規(guī)則獲取如“腹脹”與“便溏”等的語義相關(guān)實體以應(yīng)用[26]。
3.3自動問答自動問答通過自然語言對話的形式幫助人們從知識庫中獲取知識[50],尤其便于非領(lǐng)域人士獲取中醫(yī)藥知識,因此已成為中醫(yī)藥知識圖譜一個熱門的應(yīng)用研究方向。多項研究使用模板匹配的方法解析自然語言問題,大多為事實性或選擇性問題的句法規(guī)則形式的模板[16,5152]。其中,例如以“概念、實體、屬性、屬性值”為一條知識,模板一般會空出實體或?qū)傩灾?,如“脈弦是什么證”或“氣滯的癥狀”;詢問概念和屬性的模板如“氣滯是什么”或“肝與氣血的關(guān)系”則比較少。有研究根據(jù)匹配結(jié)果是否能構(gòu)成知識圖譜中的子圖來選擇匹配率最高的模板[16]。將知識圖譜與機(jī)器學(xué)習(xí)相結(jié)合的混合型方法也得到較多應(yīng)用。有研究基于GBDT算法訓(xùn)練了問題的分類模型,其分類空間也即答案類型比較有限,包括知識圖譜涉及的病、證、癥、方、藥、舌、脈7類實體;根據(jù)答案與已知命名實體是否直接關(guān)聯(lián),例如“陰虛證的主方里用了哪些中藥”,中藥與陰虛證即非直接關(guān)聯(lián),每類又分2小類[20]。該研究還在面對辨證等包含多項條件的問題時,通過計算候選答案與多個已知實體關(guān)系權(quán)值的累加,進(jìn)行結(jié)果排序[20]。也有研究使用多輪對話不斷向用戶發(fā)問以獲取更多已知信息,例如癥狀,以此最終確定問題答案[12,26,34]。
3.4輔助決策知識圖譜的推理能力與深層關(guān)系發(fā)現(xiàn)能力使其能支持復(fù)雜問題解答[53],從而輔助臨床決策。有研究開發(fā)了程序,將知識圖譜內(nèi)容自動轉(zhuǎn)換成推理規(guī)則,并將患者數(shù)據(jù)關(guān)聯(lián)到知識圖譜中的知識,利用Drools引擎進(jìn)行推理與關(guān)系發(fā)現(xiàn),提供治療方案以輔助醫(yī)生進(jìn)行開方[16]。另一項研究則設(shè)計了推理流程,包括計算藥物組成的相似度,設(shè)置藥物功效、禁忌即為用藥患者癥狀的推理規(guī)則等,嘗試回答方劑的主方及其加減原因[24]。
4小結(jié)
本研究根據(jù)知識圖譜構(gòu)建與應(yīng)用技術(shù)在中醫(yī)藥領(lǐng)域的應(yīng)用,總結(jié)了中醫(yī)藥知識圖譜研究現(xiàn)狀,分析了仍待發(fā)展之處。
中醫(yī)藥知識參與了知識圖譜構(gòu)建和應(yīng)用的各個環(huán)節(jié),被用于設(shè)計知識框架、選擇合適的技術(shù)、確保知識圖譜的質(zhì)量、指導(dǎo)應(yīng)用的方向等??梢姡嗅t(yī)藥與信息科學(xué)的知識在中醫(yī)藥知識圖譜的構(gòu)建中都必不可少。與許多領(lǐng)域相比,從非結(jié)構(gòu)化的中醫(yī)藥文本中獲取知識并將其充分表達(dá)難度更大;為支持實際應(yīng)用,中醫(yī)藥知識圖譜對知識的質(zhì)量和可解釋性要求也更高。為了兼顧這些特點(diǎn)與構(gòu)建、應(yīng)用中的效率,尚需許多探索。
5討論
5.1建立關(guān)聯(lián)豐富的知識框架,適配多來源數(shù)據(jù)中醫(yī)藥發(fā)展至今,知識體系逐漸穩(wěn)定,但古今許多場景中仍有不注重病證、不擬定治法、進(jìn)行單藥或單穴治療等情況存在,不一定包括辨證論治的完整環(huán)節(jié)。例如,依據(jù)《傷寒論》構(gòu)建的桂枝湯類方知識圖譜涉及的概念只有癥狀、方劑、藥物3者[21]。因此,不拘泥于一般診療邏輯,在多種概念間建立豐富關(guān)聯(lián),有助于知識框架適配各來源數(shù)據(jù)中的體系多變或信息缺失的情況。
5.2豐富中醫(yī)理論知識醫(yī)療風(fēng)險可致嚴(yán)重后果,這使醫(yī)學(xué)知識圖譜格外需要可解釋性,以便用戶判斷、信賴其提供的知識。因此,能為實踐經(jīng)驗提供解釋的中醫(yī)基礎(chǔ)理論、各家學(xué)術(shù)思想等知識需被納入中醫(yī)藥知識圖譜中。并且,中醫(yī)藥的整體觀使理論知識中關(guān)系豐富,增加這些知識也有利于中醫(yī)藥知識圖譜的實際應(yīng)用。例如,情志不暢知識的推薦可能有助于消化不良的治療,因為它們的五行屬性木、土具有直接聯(lián)系。
5.3匯集中醫(yī)古籍知識時獲取其研究文獻(xiàn)作為輔助注釋是中醫(yī)文獻(xiàn)整理研究的主要內(nèi)容之一,一則掃除文字障礙,一則闡明義理[54],注釋對象包括詞語解釋、古代的度量衡、歷史事實、古代的地理以及名物制度等,范圍很廣[55]。此類知識不僅存在于專門的中醫(yī)文獻(xiàn)研究中,現(xiàn)代論文在引用古籍知識時常常也會進(jìn)行原文解讀。在集成古籍知識構(gòu)建知識圖譜時,這些對古籍的注釋研究可作為擴(kuò)展特征,提供更多信息。
5.4完善質(zhì)量評估、控制構(gòu)建時使用大量人力雖使中醫(yī)藥知識圖譜的準(zhǔn)確性相對較高,但由于領(lǐng)域缺乏公認(rèn)標(biāo)準(zhǔn),依據(jù)個人經(jīng)驗難免人為造成偏倚[27],而且構(gòu)建后較少涉及對其一致性、完整性和時效性的審核。目前,中醫(yī)藥領(lǐng)域只有少量研究使用自定義問題集測試了基于知識圖譜的問答系統(tǒng)的性能[20,26],尚未真正開展質(zhì)量評估。這導(dǎo)致已有中醫(yī)藥知識圖譜構(gòu)建技術(shù)的可復(fù)用程度難以衡量。在質(zhì)量控制上,對選擇權(quán)威來源、制定加工規(guī)范、改進(jìn)知識自動獲取或融合技術(shù)等方法仍難避免的錯誤,各研究主要通過人工審核消除,效率還難以應(yīng)對大規(guī)模知識圖譜。因此,中醫(yī)藥知識圖譜領(lǐng)域還須建立具體評估方法和效率更高的質(zhì)量控制手段。
5.5構(gòu)建非文本中醫(yī)藥知識圖譜僅依靠文本數(shù)據(jù)難以覆蓋足夠的中醫(yī)藥領(lǐng)域知識,例如《補(bǔ)遺雷公炮制便覽》《本草綱目》中的豐富插圖等。中醫(yī)藥領(lǐng)域中也有一些知識在結(jié)合多媒體信息時才能更好地理解,例如脈診、舌診,以及取象比類思想指導(dǎo)下的醫(yī)療實踐等。這些信息可集成于視覺知識圖譜、多模態(tài)知識圖譜等非文本知識圖譜中[56],中醫(yī)藥領(lǐng)域須對此進(jìn)行探索。
5.6構(gòu)建、融合各子領(lǐng)域知識圖譜構(gòu)建領(lǐng)域通用的知識圖譜的工作量非常大,耗時長且難以維護(hù)。目前一些子領(lǐng)域劃分不太明確的中醫(yī)藥知識圖譜之間的主要差異在于知識來源,實際上可能有大量重疊的工作。如果各構(gòu)建者根據(jù)自己的應(yīng)用需求構(gòu)建高質(zhì)量的子領(lǐng)域知識圖譜,并允許另一些需求將它們重復(fù)利用或融合使用,則可更為高效。此外,在臨床實際中,中醫(yī)、西醫(yī)、公共衛(wèi)生知識常?;檩o助,因此中醫(yī)藥知識圖譜也需要與其他領(lǐng)域知識圖譜融合使用。
5.7社會化共享與協(xié)作已有研究提出在知識服務(wù)中以類似眾包的形式促進(jìn)中醫(yī)藥知識圖譜的完善[14]。作為鏈接數(shù)據(jù)背景下的產(chǎn)物,中醫(yī)藥知識圖譜應(yīng)能支持社會化共享與協(xié)作。其形式包括知識圖譜本身開放共享、實現(xiàn)基于知識圖譜的服務(wù)2種;這也可以促進(jìn)領(lǐng)域知識圖譜的研究進(jìn)展。
參考文獻(xiàn)
[1]趙軍.人工智能叢書:知識圖譜[M].北京:高等教育出版社,2018:7.
[2]肖仰華.知識圖譜:概念與技術(shù)[M].北京:電子工業(yè)出版社,2019:910.
[3]趙軍.人工智能叢書:知識圖譜[M].北京:高等教育出版社,2018:9.
[4]張雨琪,李宗友,王映輝,等.中醫(yī)藥知識圖譜的構(gòu)建與應(yīng)用研究進(jìn)展[J/OL].世界中醫(yī)藥:110[20210530].http://kns.cnki.net/kcms/detail/11.5529.R.20210524.1348.014.html..
[5]曹麗英,邸玉琦,陳帥.基于知識圖譜的玉米病蟲害研究可視化分析[J/OL].東北農(nóng)業(yè)科學(xué):17[20210530].http://kns.cnki.net/kcms/detail/22.1376.S.20210511.1436.005.html.
[6]陳悅,劉則淵.悄然興起的科學(xué)知識圖譜[J].科學(xué)學(xué)研究,2005,23(2):149154.
[7]趙軍.人工智能叢書:知識圖譜[M].北京:高等教育出版社,2018:20.
[8]王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應(yīng)用[M].北京:電子工業(yè)出版社,2019:15.
[9]于彤,劉靜,李海燕,等.中醫(yī)藥子本體抽取方法研究進(jìn)展[J].中國數(shù)字醫(yī)學(xué),2017,12(1):2628.
[10]張瑩瑩.基于知識圖譜的舌像診療系統(tǒng)研究與構(gòu)建[D].成都:電子科技大學(xué),2019.
[11]賈李蓉,劉靜,于彤,等.中醫(yī)藥知識圖譜構(gòu)建[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(8):5153.
[12]賈李蓉,劉麗紅,劉靜,等.基于中醫(yī)藥學(xué)語言系統(tǒng)的知識問答系統(tǒng)的設(shè)計與構(gòu)建[J].中華醫(yī)學(xué)圖書情報雜志,2019,28(5):1114.
[13]于彤,李敬華,朱玲,等.中醫(yī)臨床知識圖譜的構(gòu)建與應(yīng)用[J].科技新時代,2017,22(4):5154.
[14]張德政,謝永紅,李曼,等.基于本體的中醫(yī)知識圖譜構(gòu)建[J].情報工程,2017,3(1):3542.
[15]于彤,李敬華,于琦,等.中醫(yī)養(yǎng)生知識圖譜的構(gòu)建與應(yīng)用[J].中國數(shù)字醫(yī)學(xué),2017,12(12):6466.
[16]阮彤,孫程琳,王昊奮,等.中醫(yī)藥知識圖譜構(gòu)建與應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志,2016,37(4):813.
[17]夏宇航,高大啟,阮彤,等.基于知識圖譜的醫(yī)療病歷數(shù)據(jù)存儲研究[J].計算機(jī)工程,2019,45(1):916,22.
[18]郝偉學(xué).中醫(yī)健康知識圖譜的構(gòu)建研究[D].北京:北京交通大學(xué),2017.
[19]仲懌,茹晨雷,張伯禮,等.基于知識圖譜的中藥制藥過程質(zhì)量控制方法學(xué)研究[J].中國中藥雜志,2019,44(24):52695276.
[20]羅計根.面向中醫(yī)領(lǐng)域知識圖譜構(gòu)建的關(guān)鍵技術(shù)研究及應(yīng)用[D].南昌:江西中醫(yī)藥大學(xué),2019.
[21]趙凱,王華星,施娜,等.基于Neo4j桂枝湯類方知識圖譜的研究與實現(xiàn)[J].世界中醫(yī)藥,2019,14(10):26362639,2646.
[22]朱丹.名老中醫(yī)治療脂肪性肝病的證治規(guī)律研究及知識圖譜構(gòu)建探索[D].北京:中國中醫(yī)科學(xué)院,2019.
[23]謝先章.面向中醫(yī)骨科問診的疾病知識圖譜構(gòu)建技術(shù)研究[D].昆明:昆明理工大學(xué),2019.
[24]尹丹,周璐,周雨玫,等.中醫(yī)經(jīng)方知識圖譜“圖搜索模式”設(shè)計研究[J].中國中醫(yī)藥信息雜志,2019,26(8):9498.
[25]郭文龍.中醫(yī)方劑知識圖譜構(gòu)建研究與實現(xiàn)[D].蘭州:蘭州大學(xué),2019.
[26]肖猛.面向中醫(yī)證候的健康領(lǐng)域知識圖譜構(gòu)建與應(yīng)用研究[D].長春:吉林大學(xué),2019.
[27]鄧宇,周衛(wèi)強(qiáng),張振銘,等.基于名老中醫(yī)醫(yī)案的知識圖譜構(gòu)建[J].湖南中醫(yī)雜志,2019,35(7):186187.
[28]張穎.中醫(yī)診療數(shù)據(jù)的隱語義分析技術(shù)[D].上海:華東師范大學(xué),2019.
[29]蔣羽.面向中醫(yī)方劑配伍的中藥文本挖掘研究[D].成都:電子科技大學(xué),2019.
[30]張藝品,關(guān)貝,呂蔭潤,等.深度學(xué)習(xí)基礎(chǔ)上的中醫(yī)實體抽取方法研究[J].醫(yī)學(xué)信息學(xué)雜志,2019,40(2):5863.
[31]高甦,金佩,張德政.基于深度學(xué)習(xí)的中醫(yī)典籍命名實體識別研究[J].情報工程,2019,5(1):113123.
[32]原旎,盧克治,袁玉虎,等.基于深度表示的中醫(yī)病歷癥狀表型命名實體抽取研究[J].世界科學(xué)技術(shù)中醫(yī)藥現(xiàn)代化,2018,20(3):355362.
[33]趙立鵬.面向中醫(yī)文本的關(guān)系抽取技術(shù)研究[D].唐山:華北理工大學(xué),2019.
[34]鄭子強(qiáng).面向慢性腎臟病中醫(yī)醫(yī)案的知識圖譜學(xué)習(xí)與推理研究[D].成都:電子科技大學(xué),2020.
[35]李煥.基于深度學(xué)習(xí)與主動學(xué)習(xí)的中醫(yī)術(shù)語識別研究[D].北京:北京工業(yè)大學(xué),2019.
[36]王莉軍,李旭婕,劉志輝,等.基于開放信息源的實體挖掘方法研究[J].情報科學(xué),2019,37(8):139144.
[37]魏尊強(qiáng),舒紅平,王亞強(qiáng).基于序列標(biāo)注的中醫(yī)癥狀名識別技術(shù)研究[J].山東工業(yè)技術(shù),2015,34(8):237238.
[38]袁玉虎,周雪忠,張潤順,等.面向中醫(yī)臨床現(xiàn)病史文本的命名實體抽取方法研究[J].世界科學(xué)技術(shù)中醫(yī)藥現(xiàn)代化,2017,19(1):7077.
[39]葉輝,姬東鴻.基于多特征條件隨機(jī)場的《金匱要略》癥狀藥物信息抽取研究[J].中國中醫(yī)藥圖書情報雜志,2016,40(5):1417.
[40]孟洪宇,謝晴宇,常虹,等.基于條件隨機(jī)場的《傷寒論》中醫(yī)術(shù)語自動識別[J].北京中醫(yī)藥大學(xué)學(xué)報,2015,38(9):587590.
[41]劉凱,周雪忠,于劍,等.基于條件隨機(jī)場的中醫(yī)臨床病歷命名實體抽取[J].計算機(jī)工程,2014,40(9):312316.
[42]王世昆,李紹滋,陳彤生.基于條件隨機(jī)場的中醫(yī)命名實體識別[J].廈門大學(xué)學(xué)報:自然科學(xué)版,2009,48(3):359364.
[43]袁玉虎.面向癥狀表型的命名實體抽取方法研究[D].北京:北京交通大學(xué),2017.
[44]李明浩,劉忠,姚遠(yuǎn)哲.基于LSTMCRF的中醫(yī)醫(yī)案癥狀術(shù)語識別[J].計算機(jī)應(yīng)用,2018,38(S2):4246.
[45]原旎.醫(yī)學(xué)疾病表型實體及其關(guān)系抽取方法研究[D].北京:北京交通大學(xué),2019.
[46]羅計根,杜建強(qiáng),聶斌,等.基于雙向LSTM和GBDT的中醫(yī)文本關(guān)系抽取模型[J].計算機(jī)應(yīng)用研究,2019,36(12):37443747.
[47]孫健,高大啟,阮彤,等.中文電子病歷中的時間關(guān)系識別[J].計算機(jī)應(yīng)用,2018,38(3):626632.
[48]王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應(yīng)用[M].北京:電子工業(yè)出版社,2019:282.
[49]肖仰華.知識圖譜:概念與技術(shù)[M].北京:電子工業(yè)出版社,2019:407.
[50]王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應(yīng)用[M].北京:電子工業(yè)出版社,2019:366.
[51]陳程,翟潔,秦錦玉,等.基于中醫(yī)藥知識圖譜的智能問答技術(shù)研究[J].中國新通信,2018,20(2):204207.
[52]鄭懿鳴,翟潔,胡曉龍,等.基于中醫(yī)藥知識圖譜的智能問答與用藥推薦系統(tǒng)[J].電子技術(shù)與軟件工程,2019,26(20):134135.
[53]肖仰華.知識圖譜:概念與技術(shù)[M].北京:電子工業(yè)出版社,2019:23.
[54]張燦玾.中醫(yī)文獻(xiàn)整理研究簡議[J].高教戰(zhàn)線,1984,5(6):3133.
[55]任海霞,楊越朝.做好中醫(yī)古籍整理出版工作的5個關(guān)鍵點(diǎn)[J].科技與出版,2013,32(2):4142.
[56]朱木易潔,鮑秉坤,徐常勝.知識圖譜發(fā)展與構(gòu)建的研究進(jìn)展[J].南京信息工程大學(xué)學(xué)報:自然科學(xué)版,2017,9(6):575582.
(2020-08-27收稿本文編輯:張雄杰)
基金項目:國家重點(diǎn)研發(fā)計劃“云計算和大數(shù)據(jù)”重點(diǎn)專項(2017YFB1002300)——大數(shù)據(jù)驅(qū)動的中醫(yī)智能輔助診斷服務(wù)系統(tǒng);中國工程科技知識中心項目(CKCEST2020118)——中醫(yī)學(xué)專業(yè)知識服務(wù)系統(tǒng);中國中醫(yī)科學(xué)院中醫(yī)藥“一帶一路”合作專項(GH201708)——國際中醫(yī)藥臨床知識服務(wù)平臺構(gòu)建研究;中國中醫(yī)科學(xué)院基本科研業(yè)務(wù)費(fèi)自主選題項目(ZZ11053)——基于深度學(xué)習(xí)的中成藥知識圖譜構(gòu)建與輔助決策研究
作者簡介:張雨琪(1996.04—),女,碩士研究生在讀,研究方向:中醫(yī)信息學(xué),Email:zhyui@outlook.com
通信作者:于彤(1981.03—),男,博士后,副研究員,研究方向:中醫(yī)藥信息學(xué),Email:yutongoracle@hotmail.com