,,,, ,
芳香類方藥在古代中國疫病防治過程中具有重要作用,以“辟穢”“除惡”為典型[1-2]。元代許國禎所撰《御藥院方》記載芳香類方藥不僅用于中風、脾胃、瘡腫、折傷等疾病,而且在治療婦、兒、五官諸種病癥有顯著療效[3]?,F(xiàn)代臨床中,芳香類方藥的單方、驗方、秘方得到傳承[4],如以芳香開竅藥物為主創(chuàng)立的“芳香類方藥三寶”,即蘇合香丸、至寶丹、紫雪丹,在高熱神昏痙厥急危病人搶救,及溫熱疫病的治療中有著不可磨滅的功績[5]。尤其在2003年,以芳香類方藥為主藥的方劑在SARS肆虐期間起到了西藥無法取代的防治效果。
目前學界對芳香類方藥防治疾病的實驗驗證研究屢見不鮮,不論是傳統(tǒng)醫(yī)學還是現(xiàn)代研究均發(fā)現(xiàn)芳香類方藥在疾病尤其是外治中有顯著效果,但是其防治知識存在于歷代文獻和醫(yī)家的臨床經(jīng)驗記載中,信息分散且疏于整理。
若能在大數(shù)據(jù)集成基礎上與現(xiàn)代數(shù)據(jù)挖掘方法相結(jié)合,圍繞芳香類方藥外治證治規(guī)律,進行結(jié)構化處理予以集中存儲,并對其中特色方藥外治證治規(guī)律及古文獻中內(nèi)涵的學術價值予以分析挖掘,不僅便于學習、傳承和應用,而且通過臨床驗證反過來促使其不斷優(yōu)化,真正做到古為今用,進而促進芳香類方藥外治理論與實踐的發(fā)展,為中醫(yī)外科學、方劑學提供可信的文獻學依據(jù),具有及其重要的意義。
數(shù)據(jù)挖掘又稱“數(shù)據(jù)庫中的知識發(fā)現(xiàn)”,是從海量數(shù)據(jù)中,提取、轉(zhuǎn)換、分析一些潛在的、有價值的信息或知識的過程。近年來數(shù)據(jù)挖掘在中醫(yī)藥領域得到廣泛應用[6-9]。以歷代中醫(yī)典籍中芳香類方藥資源的分析利用和知識發(fā)現(xiàn)為目的,基于南京中醫(yī)藥大學特色數(shù)據(jù)庫——中醫(yī)藥古籍全文數(shù)據(jù)庫,通過應用數(shù)據(jù)倉庫、人工智能、認知模型、數(shù)據(jù)挖掘等方法與思路,利用頻數(shù)分析、因子分析、R型(指標)聚類分析等分析方法,遵循“數(shù)據(jù)挖掘-原生態(tài)信息再現(xiàn)-保護性利用-理論指導實踐”的研究模式,建立相關數(shù)據(jù)平臺,從多維角度分析挖掘中醫(yī)典籍中芳香類方藥外治用藥經(jīng)驗與組方規(guī)律。
主要基于南京中醫(yī)藥大學中醫(yī)藥古籍全文數(shù)據(jù)庫,該庫是目前國內(nèi)較全面的古籍數(shù)據(jù)庫,現(xiàn)收錄有線裝中醫(yī)藥古籍2 300多種,其中珍善本300多種、孤本10余種,還有各家抄、稿本,此外還收錄了綜合性匯編叢書中的中醫(yī)古籍,如《四庫全書》《中醫(yī)古籍孤本大全》《中華善本再造》。《外科正宗》《瘍科心得集》《瘍醫(yī)大全》《太平圣惠方》等古籍文獻資源為構建芳香類方藥學科體系奠定了重要的物質(zhì)基礎。
數(shù)據(jù)庫的構建主要包括數(shù)據(jù)收集與整理建立數(shù)據(jù)采集系統(tǒng);書目元數(shù)據(jù)分配、標引及分類、原文圖像掃描、文本錄入構建數(shù)據(jù)庫管理系統(tǒng);癥、方、藥、法-證關聯(lián)分析建立數(shù)據(jù)挖掘分析系統(tǒng),其構建思路與流程如圖1所示。按照《中醫(yī)古籍書目元數(shù)據(jù)標準》對古籍元數(shù)據(jù)源進行收集,包括朝代、書名、著者、版本、卷號、摘要、醫(yī)案名(按照醫(yī)家、病者及病證特點命名)、出版年等;“以方列病、以方列法”收集方劑名稱、劑型、中藥名、方劑組成、外治方法等;“以病列法、以病列方”對疾病名稱、證候、病機等重新排列組合。對于同一病案中同一疾病相關的多次診療記錄,記為不同方案,予以分別收集。對于同一醫(yī)家醫(yī)案所治疾病相同,且用藥用方相同時,予以采集,但是不予重復統(tǒng)計。
圖1 芳香類方藥數(shù)據(jù)庫構建思路與流程
中醫(yī)典籍記載往往包括模糊化的病史、癥狀、體征、治療情況等,以及發(fā)病季節(jié)、發(fā)病影響因素,體質(zhì)等信息[10]。且由于歷代醫(yī)家典籍醫(yī)案疾病表述,方藥記載名稱有諸多相異之處,以致中醫(yī)藥數(shù)據(jù)結(jié)構化一直顯得非常復雜。在南京中醫(yī)藥大學古籍全文數(shù)據(jù)庫中,除了典籍醫(yī)案本身具有的類型繁多、關系復雜的特點之外,由于不同流派、不同醫(yī)家臨床診斷和治療的思維決策過程的個體化特色非常明顯,這種個性化特色一方面代表了典籍醫(yī)案所折射的證治思想實質(zhì)所在,另一方面,也造成了這種“以人為綱”的典籍醫(yī)案的數(shù)據(jù)分析挖掘與“以病為綱”的基于流行病學癥候調(diào)查基礎上的一般意義上的醫(yī)學數(shù)據(jù)挖掘的巨大差異。
在典籍病案信息的規(guī)范化方面,為了體現(xiàn)方法的客觀性,既要遵照中醫(yī)界現(xiàn)有的規(guī)范或標準對相關信息進行取舍、合并或分解,又要與醫(yī)家流派的特色緊密結(jié)合,以保證規(guī)范后的信息不偏離名醫(yī)醫(yī)案的本質(zhì),只有這樣才能從源頭上保證挖掘結(jié)果不失真。參照《中國中醫(yī)藥主題詞表》《中醫(yī)癥狀鑒別診斷》《方劑學大辭典》《中華本草》等工具書對中藥名、外治方法等進行規(guī)范處理,如古籍中記載的藥物名稱“良姜”規(guī)范為“高良姜”。
在數(shù)據(jù)庫框架構建的基礎上對芳香類方藥古籍文獻信息進行篩選、整理和有序化處理,如文獻的標引、自動分詞,按照《中醫(yī)外科學》[11]中傳統(tǒng)分類方法分別納入,如瘡瘍、乳房疾病、肛門直腸疾病等。同時根據(jù)《中藥學》教材,將常用66種芳香類方藥,按照6種功效,即芳香解表、芳香化濕、芳香溫里助陽、芳香理氣、芳香開竅、芳香活血分別進行歸類分析。對古籍中存在“同書異名”“同名異書”現(xiàn)象,以及處方中方藥描述存在“異藥同名”“同藥異名”現(xiàn)象,采用改進的編輯距離算法,對數(shù)學名稱進行自動化、智能化的規(guī)范處理[12]。對病案中繁體字、異體字、古今字及通假字等參照《漢字簡化字總表》要求進行整理統(tǒng)一。同時對古籍原文中較難理解的內(nèi)容進行注釋、釋義,按照古籍整理通則的要求對文獻進行整理、歸納,將具體數(shù)據(jù)結(jié)構化和規(guī)范化處理,轉(zhuǎn)化為計算機能夠識別處理的語言。
芳香類方藥外治文獻具有一定的特殊性,數(shù)據(jù)收集的質(zhì)量將直接影響數(shù)據(jù)庫的構建,因此必須對文獻收集工作進行質(zhì)量控制,以提高文獻收集整理的準確度與可信度。
名醫(yī)特色體現(xiàn)在“理-法-方-藥”的各個層面。要研究典籍芳香類方藥外治證治特色,就需要從其典籍醫(yī)案信息的不同角度對其中蘊含的相關性和規(guī)律性信息進行全面探討。在中醫(yī)經(jīng)驗繼承中[13],運用單用一種方法試圖實現(xiàn)臨證證治經(jīng)驗的全面繼承是不現(xiàn)實的,多種分析挖掘方法相結(jié)合才有可能在古籍全文數(shù)據(jù)庫數(shù)據(jù)中尋找模式,發(fā)現(xiàn)規(guī)律,歸納隱含的邏輯關系,發(fā)現(xiàn)多個信息單元之間相互關聯(lián)規(guī)則。如證的規(guī)律、治的規(guī)律、防的規(guī)律、方的規(guī)律、藥的規(guī)律,以及病、證、治、防、方、藥相互之間關系的規(guī)律等。并可通過對數(shù)據(jù)的綜合分析進行癥狀序列模式、疾病轉(zhuǎn)歸的異常和趨勢進行預測性研究。本文中,我們將優(yōu)化分析挖掘方法組合中存在的不足予以算法優(yōu)化與重新組合,從癥候、治法、方藥信息入手,通過藥物配伍、藥癥相關、癥-證相應等角度對其診療經(jīng)驗作深入分析,通過“理-法-方-藥”之間多維關系的揭示,分析其用藥特色、組方結(jié)構與配伍規(guī)律,以更好更客觀地反映典籍醫(yī)案中的隱含知識。
用戶登錄芳香類方藥外治數(shù)據(jù)挖掘系統(tǒng),進入數(shù)據(jù)挖掘操作界面(圖2)。首先錄入數(shù)據(jù),將目標數(shù)據(jù)導入數(shù)據(jù)表中進行數(shù)據(jù)挖掘??筛鶕?jù)數(shù)據(jù)挖掘類型分別選擇組方分析(頻次統(tǒng)計、組方規(guī)律、新方分析)、方證分析(網(wǎng)絡展示、關鍵藥物、關鍵癥狀)、癥候分析(癥狀排序、癥狀規(guī)律、癥狀聚類)等選項,實現(xiàn)多維關聯(lián)規(guī)則分析。
圖2 芳香類方藥外治數(shù)據(jù)挖掘系統(tǒng)操作界面
以《醫(yī)宗金鑒》為例,對古籍中40種芳香類方藥進行頻次分析,得出總頻次為837次,其中使用頻次在4次以上的中藥有26味,頻數(shù)為808次,占總頻數(shù)的96.5%,是《醫(yī)宗金鑒》外治用藥的主要芳香類藥物。使用頻數(shù)最多的前10味藥物,按照頻率遞減順序排列分別是麝香、當歸、沒藥、白芷、川芎、藏紅花、蒼術、木香、血竭、細辛(表1)。
表1 藥物頻數(shù)及頻率
對頻數(shù)在4次以上的26味芳香類方藥,按照功效進行分類。在《醫(yī)宗金鑒》外治用藥中芳香類方藥中占主導地位的是芳香活血類藥物,頻數(shù)為392次,占總用藥的48.5%;其次是芳香解表類藥物,頻數(shù)為129次,占總用藥的16.0%;第3位是芳香開竅類藥物,頻數(shù)為125次,占總用藥的15.5%,詳見表2。
表2 藥類頻數(shù)及頻數(shù)
構建26種藥物關聯(lián)網(wǎng)狀圖,清晰、直觀地反映藥物之間的關聯(lián)程度(圖3)。如圖3所示,藍色粗線代表關聯(lián)程度較強,反之,藍色細線代表關聯(lián)程度較弱。其中當歸與白芷,當歸與沒藥,當歸與川芎,當歸與肉桂,沒藥與川芎,沒藥與肉桂,沒藥與血竭,沒藥與藏紅花的關聯(lián)程度最強。
圖3 藥物關聯(lián)分析結(jié)果
對頻次在4次以上的26種藥物進行關聯(lián)規(guī)則分析,設置支持度>20%,置信度>80%,共獲得關聯(lián)規(guī)則12條,結(jié)果見表3。支持度表示箭頭前后藥物(對)同時出現(xiàn)的概率;置信度表示箭頭前藥物出現(xiàn)條件下,箭頭后藥物(對)出現(xiàn)的幾率。結(jié)果顯示當當歸或沒藥二者其中一味出現(xiàn)時,另一味中藥和肉桂出現(xiàn)的概率為100%。
表3 高頻次藥物關聯(lián)規(guī)則分析結(jié)果
芳香類方藥外治文獻整理與利用研究是中醫(yī)外科、方劑學研究的重要組成部分,本文利用現(xiàn)代計算機和網(wǎng)絡技術,針對芳香類方藥外治醫(yī)案,探索性地構建基于關聯(lián)規(guī)則方法分析的數(shù)據(jù)挖掘系統(tǒng),對芳香類方藥予以調(diào)査梳理,根據(jù)獲得的結(jié)果確定數(shù)據(jù)采集、分類與標引的規(guī)范標準,便于對可獲取的病案信息進行結(jié)構化或半結(jié)構化處理,深入挖掘芳香類方藥外治用藥規(guī)律,旨在為中藥學芳香類方藥理論及實踐發(fā)展提供新的嘗試。后期將在繼續(xù)查找相關古籍完善數(shù)據(jù)庫、使芳香類方藥外治數(shù)據(jù)庫信息全面化的同時,補充摘要、主題分類等信息,使數(shù)據(jù)庫更加完善,使標引更加細致化。