李 君 李曉東,△ 張 盼 毛樹松 李紫明 周亞娜,3,4 宋幸鈴 宋淑潔 陶軍秀
1.湖北中醫(yī)藥大學 (湖北 武漢, 430065) 2.湖北省中醫(yī)院肝病科、中醫(yī)肝腎研究及應(yīng)用湖北省重點實驗室 3.湖北中醫(yī)藥大學附屬醫(yī)院 4.湖北省中醫(yī)藥研究院
隨著信息技術(shù)的快速發(fā)展,人類社會已經(jīng)進入到大數(shù)據(jù)時代,數(shù)據(jù)技術(shù)不斷成熟,單純的數(shù)據(jù)分析已經(jīng)不能滿足智慧化和智能化的需求,因而一種將“數(shù)據(jù)驅(qū)動”轉(zhuǎn)型為“知識驅(qū)動”的研究新模式應(yīng)運而生。該研究模式要求:從數(shù)據(jù)中提取信息,并將信息作為知識點,將其“概念”(顯性因子)和“內(nèi)涵屬性”(隱性因子)進行整合,實現(xiàn)對該“知識”的完整表達。這個將“數(shù)據(jù)”轉(zhuǎn)化為“知識”的過程即是數(shù)據(jù)知識化。以數(shù)據(jù)驅(qū)動的研究模式是以數(shù)據(jù)作為研究資源,對數(shù)據(jù)庫進行管理,并應(yīng)用數(shù)據(jù)分析挖掘方法開展研究。而知識驅(qū)動模式則是以知識作為研究資源,以知識庫進行管理,并應(yīng)用知識工程技術(shù)方法,對通過數(shù)據(jù)知識化所形成的完整知識,以結(jié)構(gòu)化形式構(gòu)建知識庫、知識模型和繪制知識圖譜等研究。
中醫(yī)藥在我國傳承發(fā)展幾千年,經(jīng)過歷朝歷代的文化沉淀,具有豐富的生命力與知識價值。在信息技術(shù)的支持下,累計了海量的中醫(yī)臨床數(shù)據(jù),如何從這些數(shù)據(jù)中挖掘中醫(yī)臨床的潛在規(guī)律和內(nèi)在價值,高效凝練中醫(yī)藥的精華,是中醫(yī)臨床現(xiàn)代化發(fā)展的重要途徑。為此,我們團隊率先提出開展中醫(yī)臨床肝病大數(shù)據(jù)知識工程研究,與時俱進地將現(xiàn)代高新前沿科學技術(shù)應(yīng)用于中醫(yī)臨床肝病研究,創(chuàng)建真實世界中醫(yī)臨床肝病研究的新模式和新途徑。
本研究是以中醫(yī)學理論和大數(shù)據(jù)認識論為指導(dǎo),遵循中醫(yī)臨床自身發(fā)展規(guī)律,應(yīng)用知識工程技術(shù),探討“以知識關(guān)聯(lián)方法和關(guān)系模型揭示中醫(yī)臨床肝病診療的事實與規(guī)律”和“開展臨床循證研究對其驗證與優(yōu)化”相結(jié)合的中醫(yī)臨床肝病研究新模式[1]。數(shù)據(jù)知識化和知識庫構(gòu)建是它的基礎(chǔ)工程,將中醫(yī)臨床肝病數(shù)據(jù)的知識化和肝病診療知識庫構(gòu)建技術(shù)與方法作為主要研究目標和內(nèi)容,其標準操作流程,包括數(shù)據(jù)規(guī)范化、數(shù)字化、結(jié)構(gòu)化、知識化和知識建庫管理等過程。首先通過對數(shù)據(jù)的規(guī)范化、數(shù)字化和結(jié)構(gòu)化構(gòu)建中醫(yī)臨床肝病病例數(shù)據(jù)庫,進而以中醫(yī)臨床肝病知識屬性分類與代碼與基本知識編碼、臨床指南、臨床路徑、診斷療效等標準為標準依據(jù),來完整表達中醫(yī)臨床肝病知識的內(nèi)涵,實現(xiàn)中醫(yī)臨床肝病病例數(shù)據(jù)的屬性化知識重構(gòu)[2],形成中醫(yī)臨床肝病病例知識庫,最終完成本研究目標任務(wù)要求。
當今,中醫(yī)藥事業(yè)受到國家與社會的高度重視,為中醫(yī)藥的創(chuàng)新發(fā)展提供了新機遇,2019年中共中央、國務(wù)院印發(fā)了《關(guān)于促進中醫(yī)藥傳承創(chuàng)新發(fā)展的意見》,明確提出要加快推進中醫(yī)藥科研和創(chuàng)新,中醫(yī)藥的傳承創(chuàng)新發(fā)展列入國家發(fā)展戰(zhàn)略,“傳承發(fā)展、守正創(chuàng)新”成為中醫(yī)藥發(fā)展的時代主題[3]。2021年習總書記在河南考察仲景祠時提到“我們要發(fā)展中醫(yī)藥,注重用現(xiàn)代科學解讀中醫(yī)藥學原理”,啟示我們要善于將中醫(yī)藥的發(fā)展與現(xiàn)代科學技術(shù)相結(jié)合,應(yīng)用現(xiàn)代的高新技術(shù)與開創(chuàng)思維,為中醫(yī)藥的創(chuàng)新發(fā)展開拓新途徑、新方法。2023年國務(wù)院辦公廳印發(fā)了《中醫(yī)藥振興發(fā)展重大工程實施方案》,重點提出要加大“十四五”期間對中醫(yī)藥發(fā)展的支持和促進力度,著力推動中醫(yī)藥的振興發(fā)展。近年來國家政策對中醫(yī)藥的支持力度不斷加強,中醫(yī)藥順應(yīng)時代發(fā)展變革的需要也逐漸顯現(xiàn),探索中醫(yī)藥發(fā)展的新模式、新思路成為相關(guān)從業(yè)者的迫切需求。
隨著科學技術(shù)與大數(shù)據(jù)的發(fā)展,醫(yī)療領(lǐng)域涵蓋了各種組學數(shù)據(jù)、生物醫(yī)學數(shù)據(jù)、電子健康記錄數(shù)據(jù)等大量異構(gòu)數(shù)據(jù),醫(yī)學研究者利用計算機軟件對數(shù)據(jù)進行挖掘分析,揭示潛在的模式和新知識[6],基于這些研究主要采取了“數(shù)據(jù)驅(qū)動”模式,所得到的“知識”還是停留在概念(顯性因子)層面,因而此類“知識”的內(nèi)涵深度和完整性等問題突出。
2015年吳信東教授團隊提出“大數(shù)據(jù)知識工程的概念,2022年陸汝鈐院士在文章中提到大數(shù)據(jù)知識工程的提出實際上是從大數(shù)據(jù)到大知識的一個轉(zhuǎn)折點”[4],為將大數(shù)據(jù)知識工程的技術(shù)方法運用于真實世界中醫(yī)臨床研究領(lǐng)域,解決“數(shù)據(jù)驅(qū)動”向“知識驅(qū)動”的模式轉(zhuǎn)換提供了理論和技術(shù)方法。在這種背景下,我們組織實施了中醫(yī)臨床肝病大數(shù)據(jù)知識工程研究,提出構(gòu)建標準、方法和技術(shù)等三大體系[1],以實現(xiàn)從中醫(yī)臨床肝病數(shù)據(jù)中抽提信息,進行知識化處理,形成完整表達的中醫(yī)臨床肝病病例知識庫,為真實世界中醫(yī)臨床肝病研究,開展“證、治、效”知識建模和圖譜繪制提供高質(zhì)量病例知識資源,在此過程中臨床肝病數(shù)據(jù)知識化是最為重要的基礎(chǔ)環(huán)節(jié)。其主要理論和方法學依據(jù)是“大數(shù)據(jù)知識工程學”,其主要目的是為“知識驅(qū)動”模式的真實世界中醫(yī)臨床肝病研究提供知識資源保障,以獲得高質(zhì)量模型化的中醫(yī)臨床肝病診療知識,用以提高中醫(yī)臨床肝病醫(yī)療服務(wù)水平。
2.1 科學性 科學性是開展數(shù)據(jù)知識化的前提,要以中醫(yī)基礎(chǔ)理論為依據(jù),遵循中醫(yī)臨床自身的發(fā)展規(guī)律,要以大數(shù)據(jù)世界觀為指導(dǎo),采用知識工程技術(shù)方法開展中醫(yī)臨床數(shù)據(jù)知識化,保證其臨床病例知識的科學性。
2.2 規(guī)范性 規(guī)范性是開展數(shù)據(jù)知識化的質(zhì)量保障,要嚴格遵照執(zhí)行國家相關(guān)標準與規(guī)范。需要制修訂標準時,按照國家頒布的基本原則與方法要求,采用統(tǒng)一的程序和工作規(guī)范組織實施。
2.3 實用性 實用性是數(shù)據(jù)知識化的重要原則,要將知識完整性表達和知識庫構(gòu)建的需求作為數(shù)據(jù)知識化的目標,使所獲得的病例知識能用于知識的深度加工和滿足臨床研究的需要。
2.4 可擴展性 數(shù)據(jù)知識化要符合中醫(yī)臨床實際,要隨著臨床情況的變化和需要,對數(shù)據(jù)進行實時擴展和知識庫的動態(tài)維護。
3.1 標準操作流程圖 中醫(yī)臨床肝病數(shù)據(jù)知識化標準操作流程(SOP),主要包括數(shù)據(jù)治理和數(shù)據(jù)知識化兩個環(huán)節(jié),其具體操作流程,如下圖1所示。
圖1 中醫(yī)臨床肝病數(shù)據(jù)知識化標準操作流程
3.2 數(shù)據(jù)治理 中醫(yī)臨床肝病數(shù)據(jù)治理,主要包括對數(shù)據(jù)的采集、規(guī)范化、數(shù)字化和結(jié)構(gòu)化等,以形成可供分析處理的病例數(shù)據(jù)庫為目標,為數(shù)據(jù)知識化提供重要的數(shù)據(jù)資源。具體說明如下:
3.2.1 采集中醫(yī)臨床肝病病例數(shù)據(jù) 從繁雜的中醫(yī)臨床肝病數(shù)據(jù)中采集病例數(shù)據(jù),其中包括紙質(zhì)病案、電子病歷、臨床記錄、隨訪記錄及臨床研究資料等多種類型的中醫(yī)臨床數(shù)據(jù)。
3.2.2 構(gòu)建中醫(yī)臨床肝病病例數(shù)據(jù)庫 對采集到的中醫(yī)臨床肝病原始病例數(shù)據(jù)進行整理、清洗,保證數(shù)據(jù)的真實性、可用性,由于中醫(yī)理論自身的抽象性以及醫(yī)生承襲的中醫(yī)臨床術(shù)語稱謂不一致,導(dǎo)致中醫(yī)臨床肝病使用的術(shù)語形式多樣且靈活多變,術(shù)語名稱、解釋、辨證意義交錯,常見術(shù)語包含概念關(guān)系混淆不清,異名同義、同名異義等諸多問題,中醫(yī)臨床肝病病例術(shù)語需要有符合肝病科特色的規(guī)范化整理策略,根據(jù)國家名詞委頒布的《中醫(yī)藥學名詞》、《中醫(yī)臨床基本癥狀信息分類與代碼》(TCIATCM 020-2019)、中醫(yī)肝病臨床指南和診斷標準等諸多相關(guān)領(lǐng)域的規(guī)范性文件,規(guī)范病證、癥狀、舌象、脈象、體質(zhì)、體征等診斷數(shù)據(jù)和中藥處方、針灸推拿等干預(yù)數(shù)據(jù),將不規(guī)范的名詞術(shù)語進行規(guī)范化處理,使其符合中醫(yī)臨床肝病術(shù)語的統(tǒng)一要求。在數(shù)據(jù)規(guī)范化的基礎(chǔ)上對數(shù)據(jù)進行數(shù)字化處理,將各種形式的規(guī)范化數(shù)據(jù)進行分類整理,轉(zhuǎn)化為計算機電子文檔。再依據(jù)基本信息表、診斷信息表、干預(yù)信息表及療效信息表等四個信息分類采集表[1]設(shè)計中醫(yī)臨床病例數(shù)據(jù)庫,并將臨床肝病信息錄入建庫,形成中醫(yī)臨床肝病病例數(shù)據(jù)庫,實現(xiàn)其電子文檔的結(jié)構(gòu)化。
3.3 數(shù)據(jù)知識化 中醫(yī)臨床肝病知識是由多個概念集合在一起,并且以它們之間的關(guān)系形成一個有機聯(lián)系的知識體系[7]。組織實施中醫(yī)臨床肝病大數(shù)據(jù)知識工程,首先需要對中醫(yī)臨床肝病病例數(shù)據(jù)中的概念(顯性知識因子)包括:病證、癥狀、舌象、脈象、體質(zhì)、體征、中藥等進行知識化,將它們的隱性知識顯性化,實現(xiàn)其知識的完整表達。該過程的重點是制定《中醫(yī)臨床肝病診療知識屬性分類與代碼》標準和構(gòu)建中醫(yī)臨床肝病病例知識庫,具體說明如下:
3.3.1 制定《中醫(yī)臨床肝病診療知識屬性分類與代碼》 根據(jù)中醫(yī)臨床肝病病例數(shù)據(jù)知識化的需要,制定《中醫(yī)臨床肝病診療知識屬性分類與代碼》,通過知識屬性分類代碼的關(guān)聯(lián),將肝病病例數(shù)據(jù)的隱性知識顯性化,該標準制定步驟:
第一步,獲取中醫(yī)臨床肝病診療術(shù)語,依據(jù)來源主要參照現(xiàn)行標準、權(quán)威專著與臨床術(shù)語,現(xiàn)行標準包括《中醫(yī)病證分類與代碼》(GB/T 15657-2021)、《中醫(yī)舌象診斷信息分類與代碼》(T/CIATCM 010—2019)、《中醫(yī)脈象診斷信息分類與代碼》(TCIATCM 011-2019)、《中醫(yī)臨床基本癥狀信息分類與代碼》(TCIATCM 020-2019)等;權(quán)威專著包括《中醫(yī)診斷學》、《中藥學》、國家名詞委頒布的《中醫(yī)藥學名詞》系列、《中醫(yī)癥狀鑒別診斷學》、《中醫(yī)癥狀學研究》、《中醫(yī)臨床診療術(shù)語》等;臨床數(shù)據(jù)以數(shù)據(jù)治理階段建立的中醫(yī)臨床肝病病例數(shù)據(jù)庫為主。
第二步,征詢專家意見,確保術(shù)語來源的可靠性、權(quán)威性,然后對術(shù)語進行篩重,包括正名篩重、正名與別名篩重、語義篩重,明確含義完全相同的術(shù)語,參照權(quán)威來源確定術(shù)語正名,明確術(shù)語別名,解決術(shù)語異名同義、同名異義等問題。
第三步,梳理術(shù)語的概念關(guān)系,明確術(shù)語的上下位概念,通過對中醫(yī)臨床肝病診療術(shù)語定名、定義、定關(guān)系,歸納其屬性,以概念定義為主要抓手進行分類,將自上而下分類與自下而上聚類的方法相結(jié)合,上位概念自上而下進行劃分,最小的概念逐層聚類在上位概念下,直至兩種路徑的分類匯合,構(gòu)建中醫(yī)臨床肝病診療知識的屬性分類與代碼。
3.3.2 構(gòu)建中醫(yī)臨床肝病病例知識庫 中醫(yī)臨床肝病病例數(shù)據(jù)知識化的核心是通過中醫(yī)臨床肝病診療知識屬性分類與代碼實現(xiàn)中醫(yī)臨床肝病病例數(shù)據(jù)庫的知識屬性化重構(gòu),將中醫(yī)臨床肝病病例數(shù)據(jù)庫進行分類編碼,賦予肝病術(shù)語知識屬性,將中醫(yī)臨床肝病病例數(shù)據(jù)知識化,實現(xiàn)中醫(yī)臨床肝病病例隱性知識顯性化,完成知識的完整表達,形成中醫(yī)臨床肝病病例知識庫,為開展中醫(yī)臨床肝病大數(shù)據(jù)知識工程研究,構(gòu)建中醫(yī)臨床肝病診療知識模型和繪制知識圖譜提供知識資源。
在中醫(yī)臨床診療活動中,癥狀為中醫(yī)臨床診斷的核心要素,蘊含著中醫(yī)辨證論治的科學內(nèi)涵,現(xiàn)有的癥狀術(shù)語標準、癥狀術(shù)語集等不能實現(xiàn)非結(jié)構(gòu)化的中醫(yī)臨床病例中癥狀知識的完整表達,中醫(yī)臨床癥狀包含了臨床肝病在內(nèi)的諸多癥狀,現(xiàn)以中醫(yī)臨床病例中癥狀數(shù)據(jù)知識化為示例。
4.1 中醫(yī)臨床癥狀數(shù)據(jù)治理 在科研隱私保護相關(guān)規(guī)定下收集中醫(yī)臨床病例癥狀術(shù)語,對收集到的原始數(shù)據(jù)進行規(guī)范,參照權(quán)威專著(國家名詞委頒布的《中醫(yī)藥學名詞》、專著《中醫(yī)癥狀鑒別診斷學》、《中醫(yī)癥狀學研究》)、現(xiàn)行標準(《中醫(yī)臨床基本癥狀信息分類與代碼》(TCIATCM 020-2019))進行數(shù)據(jù)規(guī)范化處理,再通過數(shù)字化、結(jié)構(gòu)化形成中醫(yī)臨床病例癥狀術(shù)語庫。
4.2 中醫(yī)臨床癥狀數(shù)據(jù)知識化
4.2.1 制定《中醫(yī)臨床基本癥狀知識屬性分類與代碼》征詢專家意見,確保術(shù)語來源的可靠性、權(quán)威性,將《中醫(yī)藥學名詞》、《中醫(yī)癥狀鑒別診斷學》、《中醫(yī)癥狀學研究》、《中醫(yī)臨床基本癥狀信息分類與代碼》(TCIATCM 020-2019)中的癥狀術(shù)語按照來源與順序進行整理,通過正名篩重、正名與別名篩重、語義篩重三步,獲取不重復(fù)的基本癥狀共計10 685個(詳見表1),例如:正名(癥狀術(shù)語的正式名稱),如《中醫(yī)藥學名詞》中“假神:俗稱‘回光返照’。重危病人突然出現(xiàn)精神、食欲等暫時‘好轉(zhuǎn)’的虛假表現(xiàn)?!?“假神”為正名,“回光返照”為別名。梳理術(shù)語的上下位概念關(guān)系,例如“疼痛”與“隱痛”,“疼痛”為上位概念,“隱痛”為“疼痛”的下位概念。通過以上的數(shù)據(jù)整理方式,形成中醫(yī)臨床病例癥狀術(shù)語庫。
表1 基本癥狀術(shù)語統(tǒng)計表
中醫(yī)臨床癥狀知識是以骨干癥狀作為顯性因子,以其內(nèi)涵屬性作為隱性因子來完整表達,所以本研究依據(jù)中醫(yī)臨床實際需求,以骨干癥狀及其30個基本內(nèi)涵屬性為癥狀知識屬性分類框架,完成《中醫(yī)臨床基本癥狀知識屬性分類與代碼》標準的制定。其知識屬性分類框架,如下圖2所示。
圖2 中醫(yī)臨床癥狀知識屬性分類框架圖
4.2.2 中醫(yī)臨床癥狀知識編碼 依據(jù)《中醫(yī)臨床基本癥狀知識屬性分類與代碼》構(gòu)建中醫(yī)臨床癥狀知識庫,賦予癥狀術(shù)語屬性分類代碼,實現(xiàn)癥狀知識的完整表達,形成中醫(yī)臨床癥狀知識編碼庫,為中醫(yī)臨床診斷模型的構(gòu)建提供規(guī)范的癥狀語料及其編碼。
5.1 變革中醫(yī)臨床肝病研究模式 基于中醫(yī)臨床肝病病例數(shù)據(jù)的規(guī)范化、數(shù)字化、結(jié)構(gòu)化,得到病例數(shù)據(jù)庫,通過中醫(yī)臨床肝病數(shù)據(jù)知識化構(gòu)建病例知識庫,將肝病數(shù)據(jù)加工成知識,重構(gòu)中醫(yī)臨床肝病病例知識體系,基于中醫(yī)臨床肝病病例知識庫的研究,可以深化中醫(yī)臨床肝病知識的表達層次,挖掘中醫(yī)臨床肝病的知識內(nèi)涵,基于知識層面的研究構(gòu)建中醫(yī)肝病的精細化診斷模型、干預(yù)模型、評價模型,實現(xiàn)從數(shù)據(jù)驅(qū)動到知識驅(qū)動的轉(zhuǎn)變。
5.2 促進中醫(yī)臨床肝病診療智慧化 2019年國家衛(wèi)健委提出要推進醫(yī)院智慧化建設(shè),其中電子病例的研究為重要組成部分,可以揭示真實世界中醫(yī)臨床診療數(shù)據(jù)中的“事實與規(guī)律”。中醫(yī)臨床肝病大數(shù)據(jù)知識工程平臺構(gòu)建了從數(shù)據(jù)到知識的中醫(yī)臨床肝病知識庫,為中醫(yī)臨床肝病循證研究、智慧化運用等提供基礎(chǔ)知識資源,中醫(yī)臨床肝病的智慧化平臺建設(shè)要基于中醫(yī)臨床肝病知識庫,在智慧化平臺上開展中醫(yī)臨床肝病診療AI系統(tǒng)等成果開發(fā),助力中醫(yī)臨床肝病診療的高質(zhì)量發(fā)展。
5.3 深化中醫(yī)臨床肝病學科內(nèi)涵 中醫(yī)臨床肝病大數(shù)據(jù)知識工程的建設(shè)可以深化中醫(yī)臨床肝病的學科內(nèi)涵,本學科已有基于數(shù)據(jù)時代的真實世界中醫(yī)肝病臨床研究體系,其內(nèi)涵建設(shè)包括肝病研究型門診、臨床數(shù)據(jù)采集-處理-分析平臺、中醫(yī)臨床肝病數(shù)據(jù)庫等。在此基礎(chǔ)上,通過大數(shù)據(jù)知識工程的技術(shù)方法將現(xiàn)有的研究內(nèi)容與體系深化到知識層面,例如將中醫(yī)臨床肝病數(shù)據(jù)庫中的病例數(shù)據(jù)進行知識化研究,精細化到數(shù)據(jù)的知識屬性,為真實世界中醫(yī)臨床肝病研究開創(chuàng)新方法和新途徑。