羅粵銘,翁 衡,2,黃馨怡,盧家言,劉旭生,2,張 蕾,2**
(1.廣州中醫(yī)藥大學(xué)第二臨床醫(yī)學(xué)院 廣州 510405;2.廣東省中醫(yī)院 廣州 510120)
慢性腎臟?。–hronic Kidney Disease)已成為全球重大的公共衛(wèi)生健康問題之一。在幾千年傳承發(fā)展過程中,中醫(yī)古籍記載了大量有關(guān)慢性腎臟病相關(guān)的臨證經(jīng)驗,為后世學(xué)習(xí)古醫(yī)家經(jīng)驗提供了知識之源。我們前期研究證實古籍條文中記載了大量慢性腎臟病相關(guān)的治療方藥[1]。本研究通過選取腎系水腫進行古籍研究,并用對其中最關(guān)鍵藥物茯苓進行深度關(guān)聯(lián),為茯苓進一步研究及臨床推廣奠定基礎(chǔ)。
在知識圖譜(Knowledge Graph)技術(shù)方面,我們采用廣東省中醫(yī)院大數(shù)據(jù)研究團隊研發(fā)的基于本體知識庫和深度學(xué)習(xí)推理建模技術(shù)而建立的中醫(yī)知識圖譜構(gòu)建框架[2]。該框架結(jié)合中醫(yī)藥學(xué)源遠流長的特點,對中醫(yī)藥理法方藥知識一級分類13 個,二級分類116 個,核心知識元:59000+,擴展知識元50 萬,實例(知識單(病證、本草(中藥)、方劑、醫(yī)案),數(shù)量為:215000+,三元組(Triples)關(guān)系數(shù)量:1000 萬+??梢杂糜谕诰驖撛诘碾[藏知識,還可以用于協(xié)助臨床醫(yī)生進行學(xué)術(shù)研究、臨床決策支持、知識檢索等。從而能夠幫助臨床醫(yī)生進行高效的隱性知識發(fā)現(xiàn)。本文通過??漆t(yī)生人工篩選配合計算機信息抽取分類,建立了腎系水腫中醫(yī)知識圖譜。并通過知識圖譜分析,對腎系水腫中最重要的中藥——茯苓進行了深度挖掘,以期從“核心藥物歸納總結(jié)——藥物知識地圖與網(wǎng)絡(luò)構(gòu)建——藥癥關(guān)聯(lián)聚類分析——隱性知識發(fā)現(xiàn)與實例推薦”幾個方面對茯苓逐層深入分析,并通過全國名老中醫(yī)藥專家驗案庫對結(jié)論進行驗證,從顯性認識和隱性知識可視化兩個角度,整理古今醫(yī)家運用茯苓治療腎系水腫的經(jīng)驗,為茯苓的臨床認識及運用提供新的思路和方法。
來源于廣東省中醫(yī)院大數(shù)據(jù)團隊開發(fā)維護的《中醫(yī)藥古籍文獻知識服務(wù)平臺》,該平臺收錄了從春秋戰(zhàn)國至1949年,超過1 100多部醫(yī)學(xué)古籍,匯集了大量抄本和孤本,古籍來源完善,并提供文獻檢索和條文提取和分類標注等功能。結(jié)合該系統(tǒng)的中醫(yī)藥古籍文獻挖掘規(guī)范操作流程,寫入中華中醫(yī)藥學(xué)會《中醫(yī)藥整體證據(jù)研究的標準化操作規(guī)程》。
以初定的古代病名為檢索詞,以探究腎系水腫的方劑認知。由于水腫為腎系疾病最常見癥狀,在古籍中記載數(shù)量廣泛,故以“水腫or 浮腫”為關(guān)鍵詞,利用文獻檢索工具進行檢索。
構(gòu)建古籍?dāng)?shù)據(jù)庫對初步檢索到的古籍條文,按照分類,由2 名從事中醫(yī)腎病臨床工作3 年以上的中醫(yī)師對腎系水腫的相關(guān)度進行判斷,提取最終確定相關(guān)的古代條文,對條文中有關(guān)腎系水腫描述的條文進行歸納梳理。
由于腎系水腫為近現(xiàn)代醫(yī)學(xué)發(fā)展后的概念,古籍方藥條文均僅以病癥描述,繼施以用藥。而多種可導(dǎo)致水腫的原因往往不容易鑒別,為從病癥描述中判斷篩選腎系水腫的條文進行篩選歸納帶來了一定的難度。故本研究采用雙人兩輪篩選模式,第1輪篩選由2名從事中醫(yī)腎病專業(yè)的中醫(yī)師對古代條文進行判斷,將明顯不屬于腎系水腫的條文進行剔除,并形成文獻篩選標準。第2輪篩選利用文獻篩選標準進一步篩除非腎系水腫條文,并對腎系水腫相關(guān)條文進行標注,整理納入本體數(shù)據(jù)庫中。未能確定,或判斷不一致的古代條文交由中醫(yī)腎病副主任以上醫(yī)師討論進行最終確定,提取最終確定相關(guān)的條文,對有關(guān)水腫的條文進行歸納梳理。同時排除成書年代不詳古籍和重復(fù)條文。
參考現(xiàn)代醫(yī)學(xué)對水腫的定義,根據(jù)古籍內(nèi)容進行了進一步細分篩選,完善篩除標準,排除心源性水腫、局部水腫、營養(yǎng)性水腫、肝源性水腫、內(nèi)分泌性水腫等,其他明顯非腎性水腫又不能歸納為某一類型水腫的條文,則統(tǒng)一歸納為“非腎病性水腫”一并排除。
大數(shù)據(jù)知識顯性化與智能處理系統(tǒng)在融合斯坦福大學(xué)本體知識構(gòu)建7步法基礎(chǔ)上實現(xiàn)了條文檢索與分類——信息分類抽取——用戶定義/擴展知識體系——深度學(xué)習(xí)知識語義空間構(gòu)建的人機協(xié)同知識圖譜構(gòu)建工作流。
(1)腎科醫(yī)生利用系統(tǒng)進行文獻/驗案全文檢索和條文分類,按研究計劃以“水腫or 浮腫”為關(guān)鍵詞檢索條文11893條,經(jīng)篩選后逐一整理,篩除明顯非腎系水腫相關(guān)條文,將描述模糊、不能排除的納入下一步討論篩選。初步整理篩除明顯非腎系水腫5257條,整理納入有效條文6636 條。將納入6636 條有效條文進行篩選,進一步排除“局部性水腫”“肝源性水腫”“營養(yǎng)性水腫”“心源性水腫”等非腎性水腫相關(guān)條文。
(2)信息分類抽取部分是本體知識構(gòu)建中的對現(xiàn)有共享概念體系的重用;知識圖譜模型將對條文進行信息抽取和病、癥、理、法、方藥、針灸等7個大類、20余個子類標準化分類的實體識別,并統(tǒng)一規(guī)范標準化(病癥證理法方藥等)藥物名稱,制法與用法等;
(3)腎科醫(yī)生根據(jù)腎系疾病特點,定義/擴展知識體系按照本體分析一方面通過系統(tǒng)改進的protege 知識樹模塊對術(shù)語概念體系進行進一步增補和擴展新的語義類型和語義關(guān)系,例如形成以疾病為綱的方證關(guān)系、藥癥關(guān)系;另一方面利用系統(tǒng)的進行腎系水腫的領(lǐng)域知識概念內(nèi)涵完善,力求實現(xiàn)精準的本體及其屬性對名醫(yī)驗案和文獻條文的語義標注和關(guān)聯(lián);
(4)基于定義的腎病知識體系和文獻驗案庫,中醫(yī)藥知識圖譜自動化構(gòu)建框架將在原知識圖譜模型基礎(chǔ)上,利用Fine-tune 方法學(xué)習(xí)新的知識元組,量化用戶領(lǐng)域知識語義空間,實現(xiàn)進一步的腎性水腫古籍庫的知識關(guān)聯(lián)分析挖掘。
2.1.1 藥物頻數(shù)分布分析
藥物特征分布地圖中發(fā)現(xiàn)茯苓為使用頻率最高的藥物(圖1),古籍中共提及頻率達3 600 余次(包括方劑組成、藥物加減化裁描述等),詞云圖顯示茯苓按權(quán)重比為最關(guān)鍵的藥物,其他藥物如白術(shù)、甘遂、防己、甘草等也處于權(quán)重較高的關(guān)鍵位置(圖2)。
圖1 藥物特征分布地圖
圖2 藥物-腎系水腫相關(guān)性詞云圖
2.1.2 方藥頻次分析
對方劑及中藥的初步挖掘結(jié)果可得病癥證理法方藥核心及擴展知識元數(shù)為61 360 個,方劑共4 013首方,1 052味藥,三元組關(guān)系數(shù)為872 292個。在中藥頻次統(tǒng)計上(圖3),使用頻次前十位的藥物分別為“茯苓(1 063)、陳皮(809)、澤瀉(728)、白術(shù)(698)、甘草(603)、葶藶子(588)、木香(564)、桑白皮(525)、檳榔(454)、防己(433)”。其中茯苓為唯一一味使用頻次超過一千的中藥。
通過人機結(jié)合的知識圖譜深度學(xué)習(xí)得到知識向量,并融合病證癥理法方藥的信息,進一步推理得出藥物之間的關(guān)系。藥物功效主治、臨證應(yīng)用越相近,其關(guān)系越緊密。我們利用復(fù)雜網(wǎng)絡(luò)篩選出古籍文獻中重要藥物組合,并利用網(wǎng)絡(luò)社群聚類的方法將藥物關(guān)系進一步區(qū)分出若干群組,以便于分析疾病用藥的核心思想。
從腎系水腫總結(jié)的病癥證理法方藥入手,通過機器學(xué)習(xí)藥物關(guān)系并進行網(wǎng)絡(luò)構(gòu)建,以使藥物之間的關(guān)系更直接清晰化。如圖4 所示,由機器學(xué)習(xí)按照不同屬性將藥物共分為10 類。與茯苓相同類并關(guān)聯(lián)的藥物包括:白術(shù)、白芍、當(dāng)歸、川芎、黃芪、人參、獨活等,形成一個藥物聚類圖。
圖3 方藥頻次分析
圖4 藥物知識地圖與網(wǎng)絡(luò)構(gòu)建
同時茯苓又與陳皮類(藍色)、澤瀉類(黃色)中藥具有相關(guān),可為進一步藥物關(guān)聯(lián)組合提供思路。
進一步的我們通過茯苓古籍文獻中出現(xiàn)相關(guān)的中藥和相關(guān)癥狀的語義關(guān)系進行重點分析,這里我們用了熱圖層次化聚類分析。關(guān)系強度的區(qū)間由藍色到黃色過渡,顏色越亮表示關(guān)系強度越強。上方和右方則是根據(jù)關(guān)系強度進行的層次化聚類(圖5)。
圖5 茯苓單味藥與癥狀關(guān)聯(lián)熱圖分析
我們經(jīng)過文獻發(fā)現(xiàn),與茯苓相關(guān)癥狀共有50 類,古籍中對茯苓的記載由于時間和空間跨度巨大,有許多相關(guān)的名稱,為了對茯苓進行全面分析,我們首先對茯苓及其古籍中可能混淆的提法,包括所有相關(guān)別名和類藥,如“茯苓”、“白茯苓”、“茯芩”等進行癥狀關(guān)聯(lián),進行熱圖分析,得到大量熱圖數(shù)據(jù)進行全面認識(圖5)。其次進一步為更好的指導(dǎo)臨床運用,通過聚類,我們根據(jù)藥-癥和癥-藥關(guān)系進行歸納,進一步的對茯苓名稱按臨床使用部位進行統(tǒng)一化分為茯苓(包括茯苓、赤茯苓、白茯苓)、茯神(包括茯神、抱茯神、赤茯神)、茯苓皮(包括茯苓皮、茯芩皮),將茯苓的古籍相關(guān)藥物分為3 大類(皮、神、苓)分別對應(yīng)(1,2,3)3 個癥狀熱區(qū),進行熱圖分析(圖6)。經(jīng)研究發(fā)現(xiàn)與茯苓關(guān)系較密切的五個癥狀包括“腰以下腫”、“喘”、“語謇”、“蹇”、“怔忪”。結(jié)合中藥學(xué)知識發(fā)現(xiàn),“腰以下腫”、“喘”可以歸納與茯苓利水滲濕的功能相關(guān),“怔忪”與茯苓寧心安神的功效相關(guān)。但“語謇”、“蹇”兩個癥狀,為歷來認知較有出入。故進行進一步挖掘。
圖6 茯苓單味藥細化挖掘與癥狀關(guān)聯(lián)熱圖分析
對“茯苓”苓庫驗證國名語謇”謇庫驗蹇”謇為關(guān)鍵詞進行搜索得到215 條相關(guān)條文,共有三種情形中與茯苓的搭配使用相關(guān)。一為“語言謇澀”,如《備急千金要方·續(xù)命煮散》:“……中風(fēng),言語謇澀,四肢痑曳”,《馮氏錦囊秘錄·河間地黃飲子》:“腎之脈出然谷肉內(nèi)踝……其直者,挾舌本,故虛則舌謇不能言”;二為“動作蹇澀”,如《備急千金要方·腎瀝湯》:“腎虛為厲風(fēng)所傷……胻腳偏跛蹇、緩弱不能動”;三為“水道蹇澀”,如《太平惠民和劑局方·導(dǎo)赤丸》:“或服補藥過多,水道蹇澀”等。其中前兩者病因描述中皆與風(fēng)邪相關(guān),風(fēng)邪中人,風(fēng)痰上擾,肝陽上亢,氣虛血瘀,導(dǎo)致多種語言謇澀、動作蹇澀等癥狀。茯苓往往會在方劑中進行搭配使用。提示茯苓在古籍使用中,可作為風(fēng)邪中人的一種輔助治療措施。
對平臺收錄的47 973 例全國名老中醫(yī)驗案庫以以“苓”為關(guān)鍵詞進行搜索,發(fā)現(xiàn)其相關(guān)病癥前五位為“痹證、咳嗽、眩暈、胸痹、水腫”。以語言蹇澀相關(guān)癥狀“語言謇澀、舌強、舌本強、言語不利、失語”進行知識元搜索得到146 條記錄,發(fā)現(xiàn)高頻(次)使用中藥分別為“川芎(44)、當(dāng)歸(41)、天麻(35)、地龍(33)、茯苓(30)”。茯苓為第五位推薦中藥。提示了現(xiàn)代名老中醫(yī)在治療外感風(fēng)、寒、濕等邪氣侵襲時,茯苓亦為處方要藥,這與茯苓健脾利水功效相關(guān),亦側(cè)面印證了茯苓具有搭配它藥以祛風(fēng)的功效。
慢性腎病是一個世界性的健康問題,在發(fā)達國家或發(fā)展中國家的患病率和發(fā)病率都在增加。2017 年Levin A 等對慢性腎臟病進行了全球性的大型研究后發(fā)現(xiàn),全球慢性腎臟病患病率已超過10%,由于其患病率和病死率高,為社會衛(wèi)生資源帶來了沉重的負擔(dān)[3]。中醫(yī)藥是中華民族幾千年的智慧和經(jīng)驗結(jié)晶,經(jīng)過代代相傳,匯集成近千部中醫(yī)古籍。作為中醫(yī)學(xué)知識主要載體的中醫(yī)古籍梳理工作,從古至今一直是中醫(yī)學(xué)者傳承經(jīng)驗的重要途徑。知識傳承與知識積累,為臨床進一步運用提供了重要參考。作為中醫(yī)學(xué)知識主要載體的中醫(yī)古籍梳理工作,從古至今一直是中醫(yī)學(xué)者傳承經(jīng)驗的重要途徑。
最早明確提出水腫概念始于《黃帝內(nèi)經(jīng)》,如《素問·水熱穴論》說“水病下為附腫大腹,上為喘呼不得臥者,標本俱病,故肺為喘呼,腎為水腫”。指出腹部腫大嚴重者,不能平臥,水氣上逆引起呼吸急促而且喘咳。這是肺腎同病,水液儲留的原因?!八[”就此引用開來。自《黃帝內(nèi)經(jīng)》始,即有對水腫的病機認識,如“諸濕腫滿,皆屬于脾”、“其本在腎,其末在肺,皆聚水也”。《靈樞·水脹》:“水始起也,目窠上微腫,如新臥起之狀”;《素問·評熱病論篇》:“諸有水氣者,微腫先見于目下也”。并提出了水腫病的治療原則為“平治于權(quán)衡,去宛陳莝”的調(diào)陰陽,補脾腎,發(fā)汗利小便等。
茯苓,又名茯菟,云苓等,性味甘、淡、平,《唐韻》《集韻》《說文解字卷一·艸部》對其注解為:苓,卷耳也。從艸令聲。郎丁切。是寄生于松樹根下的一種菌類植物?!痘茨献印ふf山訓(xùn)》:千年之松,下有茯苓。具有利水滲濕、健脾寧心等功效,其最早記載于《五十二病方》中用于皮膚類疾病的治療“乾騷(瘙)”[4]。常用于治療水腫尿少,脾虛納差,心悸不安,痰飲驚悸等癥狀[5],《神農(nóng)本草經(jīng)》[6]中記載茯苓具有利小便,順胸脅逆氣,寧心安神解憂,解心下結(jié)痛,煩滿咳逆等功效,將其載為上品。
小劑量茯苓(茯苓<10 g)具有健脾滲濕[7]、化痰止瀉的功效。中劑量茯苓(10-20 g)隨著用量的增加,具有利尿理氣[8]、寧心定悸之功,大劑量茯苓(>20g)擅于利水消腫和平胃止嘔的功能,主治多種原因?qū)е碌乃[及胃反嘔吐等癥[9]。現(xiàn)代藥理學(xué)證實其具有抗氧化[10]、調(diào)節(jié)免疫[11]、抗腫瘤[12]、抗衰老[13]等功能。
但是中醫(yī)幾千年發(fā)展過程中,古籍記載會隨著特定的氣候、政治、文化等方面的影響,有著不同特定的時代烙印。這導(dǎo)致了古今語言表達的差異,古籍中詞匯概念表達的不確定性為古籍發(fā)掘帶來了一定的困難[14]。故中醫(yī)藥術(shù)語概念的規(guī)范化和語義關(guān)聯(lián)、古醫(yī)籍中術(shù)語概念與現(xiàn)代詞匯的對應(yīng)均需要根據(jù)疾病特點進行構(gòu)建。
本文從古籍中建立了自動化中醫(yī)知識圖構(gòu)建的框架。該框架基于本體模型和深度學(xué)習(xí)技術(shù),旨在自動化元知識提取和轉(zhuǎn)換過程,進行語義距離計算和語義推理?;谕评硭惴?gòu)建、知識檢索優(yōu)化和知識導(dǎo)航、初步構(gòu)建知識體系—知識地圖,利用數(shù)據(jù)建模對中醫(yī)理法方藥進行科學(xué)闡釋[15]。
在大數(shù)據(jù)時代,以整體性、混雜性、相關(guān)關(guān)系為特征的數(shù)據(jù)整理方法,為中醫(yī)古籍挖掘提供了更多的選擇?;诒倔w的邏輯表達方法及基于大數(shù)據(jù)處理而提出的復(fù)雜數(shù)據(jù)處理,而產(chǎn)生的新技術(shù),為更好的處理中醫(yī)藥知識密集型數(shù)據(jù)提供了新的思路與技術(shù)支持[16]。在本研究中,我們首先采用了人工篩選結(jié)合知識圖譜分析,按混雜性原則先將與茯苓相關(guān)的所有表述先總體納入,再進一步細化篩選,有效的避免了古籍研究中的選擇偏倚,納入更多有效知識元進行總體分析。并進一步通過挖掘出的結(jié)論與平臺收錄的47973 例全國名老中醫(yī)驗案庫進行比對驗證,完善了單味茯苓的藥物“古籍挖掘-臨床驗證”兩方面的研究,使結(jié)論具有充分的可靠性。
由結(jié)果可知,在腎系水腫疾病中,茯苓為使用頻率最高的藥物,其權(quán)重比也為最關(guān)鍵的藥物。其使用與“腰以下腫”、“喘”、“語謇”、“蹇”、“怔忪”等癥狀關(guān)聯(lián)密切。結(jié)合病因病機和相關(guān)癥狀我們發(fā)現(xiàn),在慢性腎臟病中,古醫(yī)家們通常是運用茯苓健益脾臟,以達到祛水腫的功能??倓t與茯苓的通調(diào)水液功能相關(guān)。另外我們發(fā)現(xiàn),除了常見的相關(guān)癥狀,“語言謇澀”、“動作蹇澀”亦與茯苓的臨床運用具有一定關(guān)聯(lián)性。這可能是隱藏在古籍中的尚未被廣泛認知的知識,為了進一步驗證該結(jié)論的可靠性,我們結(jié)合相關(guān)古籍論述與名老中醫(yī)經(jīng)驗對照,我們發(fā)現(xiàn)該結(jié)論具有一定的臨床運用價值,可能與茯苓健脾扶正,利水消痰,佐其他藥疏風(fēng)以最終祛除風(fēng)邪的功能有關(guān)。但該結(jié)論仍需進一步實驗驗證。
除了深度挖掘茯苓臨床應(yīng)用特色以外,在研究方法上,本研究將深度學(xué)習(xí)與數(shù)據(jù)挖掘方法有機融合,實現(xiàn)了幾個創(chuàng)新,利用知識圖譜深度學(xué)習(xí)得到的知識向量轉(zhuǎn)化為:①知識地圖聚類(將方藥知識點轉(zhuǎn)換為二維坐標和地圖區(qū)塊呈現(xiàn)藥物關(guān)系);②方藥及中醫(yī)病癥證知識關(guān)聯(lián)熱圖層次化聚類分析;③復(fù)雜網(wǎng)絡(luò)社群聚類等三種不同角度的規(guī)律詮釋;④挖掘知識元和關(guān)系可以直接進行知識庫檢索和迭代分析,從而更完整和深層次的挖掘隱性知識。
數(shù)據(jù)挖掘技術(shù)在現(xiàn)代中醫(yī)藥研究有其積極意義,可為探討中醫(yī)藥隱性知識提供基礎(chǔ)。基于語義網(wǎng)絡(luò)的腎系疾病中醫(yī)古籍本體知識庫及輔助挖掘系統(tǒng),對于挖掘發(fā)現(xiàn)隱性知識,拓寬茯苓的臨床再認識,有其獨特的優(yōu)勢。本文通過知識圖譜對古籍中茯苓的使用情況及其與癥狀之間的關(guān)系進行了逐層深入分析,并通過全國名老中醫(yī)驗案庫進行結(jié)論驗證,將古代醫(yī)家辨證使用茯苓的思維與用藥經(jīng)驗進一步顯性知識可視化,拓寬了茯苓的功效認識,有助于古籍資源的充分發(fā)掘和利用。