楊鳳 鐘相根 周冉冉 侯鑒宸 李芊芊 李冉 李伊然 陶曉華
北京中醫(yī)藥大學(xué)中醫(yī)學(xué)院,北京 100029
東漢張仲景所著的《傷寒雜病論》是我國第一部 理法方藥完備、理論聯(lián)系實(shí)際的中醫(yī)臨床著作,包括《傷寒論》與《金匱要略》兩本書,被歷代醫(yī)家奉為臨證圭臬,也是當(dāng)今中醫(yī)人學(xué)習(xí)與臨床的必備之書。在近兩年,中醫(yī)臨床專家團(tuán)隊研制的抗疫“三藥三方”中的清肺排毒湯,即由來自《傷寒雜病論》的4 個方劑融合而成,臨床療效顯著,彰顯了經(jīng)典的旺盛生命力[1-2]。如今,傷寒、金匱已成為兩個系統(tǒng)的中醫(yī)學(xué)科,大量傷寒金匱類古籍中蘊(yùn)含著海量的、高密度的中醫(yī)藥知識和信息,具有非常重要的學(xué)術(shù)和臨床價值,可借助現(xiàn)代信息技術(shù)更好地開發(fā)利用。
本研究在傳統(tǒng)中醫(yī)古籍整理成果的基礎(chǔ)上,結(jié)合現(xiàn)代知識元理論與標(biāo)引技術(shù),對《傷寒雜病論》進(jìn)行了深度、全面的知識標(biāo)引與知識表示,提取了知識體、知識元、語義、語義關(guān)系的邏輯數(shù)據(jù),形成了規(guī)范化的標(biāo)引方案,并構(gòu)建了《傷寒雜病論》知識圖譜以展現(xiàn)仲景辨“病脈證并治”的臨床診療思維模式。
以錢超塵等整理的《傷寒論》[3]與何任等整理的《金匱要略》[4]為研究對象,進(jìn)行文本校對與電子化。同時,分析兩書的知識結(jié)構(gòu)與知識內(nèi)核,發(fā)現(xiàn)共有40 篇以“辨某某病脈證并治”或“某某病脈證治”命名,結(jié)合書中對六經(jīng)病、內(nèi)傷雜病等內(nèi)容的詳細(xì)論述,可見仲景臨證遵循“辨病→平脈→析證→定治”的診療思維模式[5-6]。
立足于知識元理論,以知識元為單位對《傷寒論》與《金匱要略》的文本進(jìn)行解析標(biāo)引[7]。首先基于兩書的診療思維模式與知識要素,并參考中醫(yī)藥學(xué)語言系統(tǒng)[8]和中醫(yī)古籍語言系統(tǒng)[9],構(gòu)建了“病脈證并治”標(biāo)引模板[10-11],包括31 個知識元及不同類型語義和語義關(guān)系的元數(shù)據(jù)。標(biāo)引員為傷寒金匱專業(yè)的7 位碩博研究生與2 名專家,根據(jù)文獻(xiàn)研究、專家判斷與信息技術(shù)相結(jié)合的方法進(jìn)行人工自由標(biāo)引[12-13],并遵守“一標(biāo)、二查、三復(fù)審、四抽檢”的質(zhì)控流程,具體操作在中醫(yī)古籍“病脈證并治”知識元標(biāo)引系統(tǒng)(http://114.255.40.130:60080/metaservice2/)中進(jìn)行。
正式標(biāo)引時,第一步為選取與命名知識體,將書中表達(dá)“病脈證并治”主題或意思完整的條文作為一個知識體,多數(shù)情況為“1 則條文=1 個知識體”。知識體命名一般選用病證名或主癥,必須出自原文,可稍作提煉。第二步為抽取知識元,標(biāo)引員先要鑒別、明確不同類型知識元的定義與范疇,再抽取相應(yīng)的內(nèi)容。例如,病因知識元為導(dǎo)致病證發(fā)生的原因,如“夏月傷冷水”;病機(jī)知識元為疾病發(fā)生、發(fā)展、變化及其結(jié)局的機(jī)制,如“胃中空虛,客氣動膈”[14]。第三步為提取語義,根據(jù)字詞短語的屬性與語境,先選定合適的語義類型后提取相應(yīng)內(nèi)容,尤應(yīng)注意語義拆分的原則。第四步為創(chuàng)建語義關(guān)聯(lián),先識別不同語義之間匹配的語義關(guān)系類型,再勾選相應(yīng)的語義成分。如,方藥關(guān)系:桂枝湯(方劑)<->桂枝(藥物)-芍藥(藥物)-甘草(藥物)-生姜(藥物)-大棗(藥物);辨治關(guān)系:寒疝(病證)<->腹中痛(證候表現(xiàn))-脅痛(證候表現(xiàn))-里急(證候表現(xiàn))<->當(dāng)歸生姜羊肉湯(方劑)。具體標(biāo)引示例見圖1~2。
圖1 《傷寒論》標(biāo)引示例
《傷寒雜病論》知識圖譜的構(gòu)建過程從標(biāo)引所得的數(shù)據(jù)出發(fā),包括知識抽取、知識融合、知識加工、知識圖譜構(gòu)建4 個主要步驟[15-16]:①從標(biāo)引系統(tǒng)中導(dǎo)出XML 格式的原始數(shù)據(jù);②進(jìn)行實(shí)體提取、關(guān)系抽取,解析得到逐條的JSON 格式數(shù)據(jù);③利用敘詞表共指消解、合并同義實(shí)體,經(jīng)過質(zhì)量評估后提取出三元組數(shù)據(jù);④導(dǎo)入Neo4j 數(shù)據(jù)庫形成知識圖譜。其中,針對多元關(guān)系通過加入附加節(jié)點(diǎn)的方法轉(zhuǎn)化成二元關(guān)系的組合,再進(jìn)行實(shí)體分組連接[17-18]。
圖2 《金匱要略》標(biāo)引示例
本研究基于知識元理論標(biāo)引《傷寒雜病論》,將該書由自然記載的文本形式轉(zhuǎn)化成結(jié)構(gòu)化的邏輯數(shù)據(jù),結(jié)果統(tǒng)計見表1,一共包括923 個知識體、6 204 條知識元、10 607 條語義(涉及28 種類型)、3 690 條語義關(guān)系(涉及22 種類型)。
表1 《傷寒雜病論》標(biāo)引邏輯數(shù)據(jù)結(jié)果統(tǒng)計(高頻)
在知識體層面,大部分完整記敘了六經(jīng)病與各種雜病的“病脈證治”所有要素,涉及四診信息、方藥知識、預(yù)防調(diào)護(hù)及失治誤治情況等。在知識元和語義層面,辨證、病名、方劑、病機(jī)、主脈、藥物等知識元的數(shù)量最多,證候表現(xiàn)、藥物、病因病機(jī)、劑量、病證、脈象等語義的數(shù)量最多。其中,《傷寒論》中排名前十位的病證為太陽病、陽明病、少陰病、少陽病、下利、痞證、結(jié)胸、厥陰病、太陰病、霍亂;《金匱要略》中排名前十位的病證為下利、支飲、虛勞、水氣病、痰飲病、痙病、太陽病、百合病、寒疝、黃疸。在語義關(guān)系層面,藥制量關(guān)系占比最多,其次是辨治關(guān)系與方藥關(guān)系。
本研究構(gòu)建的《傷寒雜病論》“病脈證并治”知識圖譜,以節(jié)點(diǎn)代表語義成分,邊代表語義關(guān)系或語義類型,其中每一個“辨治關(guān)系”都是蘊(yùn)含“辨病→平脈→析證→定治”臨床診療思維模式的多元關(guān)系。如圖3 所示,知識圖譜將仲景運(yùn)用桂枝湯治療外感病與內(nèi)傷病的辨治經(jīng)驗匯總,相同的語義合并為一個節(jié)點(diǎn),不同的語義保留多個節(jié)點(diǎn),“辨治關(guān)系1”所連的病證語義為“太陽中風(fēng)”、證候表現(xiàn)語義為“嗇嗇惡寒”“翕翕發(fā)熱”“淅淅惡風(fēng)”“鼻鳴”等、脈象語義為“陽浮而陰弱”,與原書太陽中風(fēng)桂枝湯證的條文相對應(yīng),其余的“辨治關(guān)系”節(jié)點(diǎn)及所連的語義則是使用桂枝湯的其他太陽病變證與內(nèi)傷雜病的內(nèi)容。
圖3 《傷寒雜病論》“病脈證并治”知識圖譜示例
[通訊作者]過知識圖譜的關(guān)聯(lián),可從病證、證候表現(xiàn)、脈象等推導(dǎo)出相應(yīng)的治法、方劑、藥物、宜忌等語義;反之,從方劑、藥物語義出發(fā)可推導(dǎo)出其治療的“病脈證”內(nèi)容。由圖4 可知,清肺排毒湯主要蘊(yùn)含著《傷寒論》中的麻黃杏仁甘草石膏湯、小柴胡湯、五苓散與《金匱要略》中的射干麻黃湯的理法,涉及太陽病和少陽病的證候表現(xiàn)、脈象特點(diǎn)與病因病機(jī),還隱有麻黃湯、桂枝湯、小建中湯、茯苓甘草湯等方的辨治內(nèi)容。此外,知識圖譜還通過“合病”“并病”“從屬”“鑒別”“傳變”等關(guān)系使不同知識體之間的疾病關(guān)系清晰展現(xiàn)。
圖4 《傷寒雜病論》知識圖譜部分展示
知識元是知識系統(tǒng)中表達(dá)一個完整概念的不可分解的最小知識單元,以知識元為單位進(jìn)行標(biāo)引,不僅能深入文獻(xiàn)內(nèi)部獲取知識,還可呈現(xiàn)古籍的知識組織結(jié)構(gòu),進(jìn)而正確解讀作者的行文邏輯與核心思想[19-20]。正如《傷寒雜病論》的標(biāo)引邏輯數(shù)據(jù)體現(xiàn)了仲景辨“病脈證并治”的診療思維模式及其“病脈證”同參、注重分析病因病機(jī)的特點(diǎn)。通過知識圖譜則實(shí)現(xiàn)了《傷寒論》與《金匱要略》兩書知識的深度融合與關(guān)聯(lián),將仲景收集臨床信息、診斷疾病、辨證論治、遣方用藥等內(nèi)容進(jìn)行可視化,清楚地展現(xiàn)了《傷寒雜病論》的全貌,以解決目前該書被分而為二、內(nèi)容割裂的問題。知識圖譜作為一種知識的圖形式,本質(zhì)上是由實(shí)體和關(guān)系組成的語義網(wǎng)絡(luò),能夠模擬中醫(yī)的診療決策思維過程[21-22],因此也可呈現(xiàn)張仲景的診療思維模式和應(yīng)用經(jīng)方的思路,同時諸多方劑之間的共同藥物與關(guān)聯(lián)癥狀,顯示了從合方角度運(yùn)用經(jīng)方的合理性。可見,從計算機(jī)思維的角度對張仲景診療思維進(jìn)行建模、解模與解釋,將書中蘊(yùn)含的醫(yī)藥知識、診療思維、推理方法等轉(zhuǎn)為數(shù)字化、模型化的表達(dá),亦是一種解析與重構(gòu)仲景之書的方式,有利于新知識與隱性知識的發(fā)現(xiàn),以真正實(shí)現(xiàn)深度挖掘文獻(xiàn)價值、輔助臨床決策的目的。知識表示作為描述世界所作的一組約定,是知識的符號化、形式化或模型化,常用的表示方法有狀態(tài)空間方法、謂詞邏輯、本體、語義網(wǎng)絡(luò)、框架表示法等[23-24]。
中醫(yī)古籍作為一座巨大的知識寶庫,蘊(yùn)含著大量或顯或隱的醫(yī)學(xué)知識,不僅是傳統(tǒng)中醫(yī)藥學(xué)發(fā)展的根基,更是現(xiàn)代中醫(yī)藥創(chuàng)新的源頭,如何將中醫(yī)古籍中的高密度知識進(jìn)行合理表示、組織與充分挖掘,成為當(dāng)下及未來的研究重點(diǎn)之一[25]。本研究選用的“知識元”是該領(lǐng)域目前常用的知識表示方法[26],蘊(yùn)含框架表示法的原理,又可與語義網(wǎng)絡(luò)表示法相結(jié)合,從而分層次、分粒度地提取古籍中的理法方藥內(nèi)容。此外,雖然知識元標(biāo)引技術(shù)用于中醫(yī)古籍的知識獲取已較為成熟,但通過本研究發(fā)現(xiàn)還有許多值得探索和完善的關(guān)鍵之處。首先,設(shè)置與古籍內(nèi)容相匹配的標(biāo)引模板尤其關(guān)鍵,囊括知識元、語義、語義關(guān)系3 個層面的不同類型元數(shù)據(jù)。其次,標(biāo)引員所具備的中醫(yī)古籍閱讀能力和醫(yī)學(xué)專業(yè)知識非常重要,否則提取的數(shù)據(jù)會有許多錯誤。因此,反復(fù)的數(shù)據(jù)核查工作及領(lǐng)域?qū)<以跇?biāo)引過程中把控標(biāo)引質(zhì)量,也是不可或缺的環(huán)節(jié)。
綜上,本研究以《傷寒雜病論》為范例,采用知識元標(biāo)引和知識圖譜技術(shù)將文本內(nèi)容進(jìn)行了數(shù)字化處理和知識表示,以展現(xiàn)書中“病脈證并治”知識組織體系與診療思維過程。后續(xù)本團(tuán)隊將依托于該標(biāo)引方案,利用相關(guān)的計算機(jī)技術(shù)探索傷寒金匱類古籍和其他中醫(yī)古籍的自動標(biāo)引,并用知識圖譜將分散在不同書中的知識進(jìn)行連接與可視化,以期形成大型中醫(yī)古籍知識庫服務(wù)于臨床、教學(xué)與科研各個方面。