王 東,王益民,張伯禮
(天津中醫(yī)藥大學(xué),天津 300193)
近年來,關(guān)聯(lián)規(guī)則、聚類分析、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、復(fù)雜網(wǎng)絡(luò)分析等數(shù)據(jù)挖掘技術(shù)為名老中醫(yī)學(xué)術(shù)思想傳承工作提供了新的方法學(xué)基礎(chǔ)[1-5]。但對許多中醫(yī)背景的傳承人來說,數(shù)據(jù)挖掘作為多學(xué)科交叉的新產(chǎn)物難以熟練運用[6]。
針對這一現(xiàn)狀,為探尋更加實用、高效的數(shù)據(jù)挖掘方法,本研究組基于復(fù)雜網(wǎng)絡(luò)分析和關(guān)聯(lián)規(guī)則分析創(chuàng)建“組方配伍網(wǎng)絡(luò)分析法”,對天津中醫(yī)藥大學(xué)張伯禮教授治療胸痹的處方進行可視化網(wǎng)絡(luò)重建及用藥規(guī)律分析。總結(jié)出的重點藥物、治法及學(xué)術(shù)特點,與相關(guān)文獻[7-13]結(jié)論基本一致,得到了張教授本人認(rèn)可。
相關(guān)研究[14-15]指出,關(guān)聯(lián)規(guī)則分析法在支持度與置信度的參數(shù)設(shè)置上缺乏統(tǒng)一標(biāo)準(zhǔn),不僅影響處方數(shù)據(jù)挖掘效率,甚至?xí)斐赏诰蚪Y(jié)果與中醫(yī)理論相悖。
為體現(xiàn)中醫(yī)思維,在挖掘組方思路時,借助復(fù)雜網(wǎng)絡(luò)分析軟件記錄藥物的錄入順序,模擬傳統(tǒng)師承的“抄方學(xué)習(xí)模式”,以體現(xiàn)專家遣方用藥思路的連續(xù)性、系統(tǒng)性;在挖掘配伍思路時,借助關(guān)聯(lián)規(guī)則分析法,以獲得不同藥物間具體的配伍概率。最終,整合兩類數(shù)據(jù)構(gòu)建“組方配伍網(wǎng)絡(luò)”,既能從縱向體現(xiàn)組方思路,又能從橫向展示配伍關(guān)系。
2.1 數(shù)據(jù)來源 張伯禮教授的處方數(shù)據(jù)調(diào)取自天津中醫(yī)藥大學(xué)附屬??滇t(yī)院門診系統(tǒng)(2016年),具體內(nèi)容包括:數(shù)據(jù)入庫順序、就診時間、處方編號、患者編號、患者姓名、錄入藥物、錄入順序、藥物劑量、用藥周期、ICD診斷名、診斷備注、藥物金額及醫(yī)師姓名。
2.2 處方納入標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn)定為:1)ICD診斷名為“胸痹”。2)無第二診斷。3)無其他診斷備注。
按上述標(biāo)準(zhǔn),共369個胸痹處方被納入。
2.3 處方排除標(biāo)準(zhǔn) 為保證研究結(jié)論能夠體現(xiàn)組方思路的連續(xù)性,排除標(biāo)準(zhǔn)如下:1)處方藥物錄入起始序號不為1。2)處方藥物錄入順序不連續(xù)(缺項)。
最終,13個不合要求的處方被剔除,保留合格處方356個。
2.4 數(shù)據(jù)編輯與處理
2.4.1 建立處方庫 使用Excel 2016(以下簡稱Excel)從原始資料中提取處方編號、錄入藥物、錄入順序進行建庫。
2.4.2 數(shù)據(jù)處理 網(wǎng)絡(luò)的構(gòu)建及分析采用Gephi 0.9.2[16](以下簡稱Gephi)完成,由介數(shù)中心性、K-殼分解法[17-19]發(fā)現(xiàn)網(wǎng)絡(luò)中的重要節(jié)點和篩選核心網(wǎng)絡(luò),社團模塊由Gephi自帶的社區(qū)探測算法(基于Louvain算法)[20-21]進行劃分。頻數(shù)統(tǒng)計與關(guān)聯(lián)分析依靠R軟件(以下簡稱R)的關(guān)聯(lián)規(guī)則分析包實現(xiàn)。
1)組方數(shù)據(jù)挖掘:組方數(shù)據(jù)挖掘借助復(fù)雜網(wǎng)絡(luò)分析軟件完成,并以組方網(wǎng)絡(luò)圖的形式呈現(xiàn)。
將處方庫中的數(shù)據(jù)轉(zhuǎn)制為Gephi可調(diào)用的CSV格式,所有處方的“首尾”加入“開始”和“結(jié)束”標(biāo)記,即“A-B-C-D-E”轉(zhuǎn)為“開始-A-B-C-D-E-結(jié)束”,以避免兩個不同處方“首尾”的藥物節(jié)點生成連接。
數(shù)據(jù)導(dǎo)入Gephi生成組方網(wǎng)絡(luò)后:①使用內(nèi)置工具統(tǒng)計介數(shù)中心性;②使用內(nèi)置模塊化工具完成分類;③以不同顏色區(qū)分不同模塊;④以介數(shù)中心性降序決定節(jié)點大小和節(jié)點名稱漢字大小;⑤以K-殼分解法提取核心群。
2)配伍數(shù)據(jù)挖掘:配伍數(shù)據(jù)挖掘借助R的關(guān)聯(lián)規(guī)則工具箱和復(fù)雜網(wǎng)絡(luò)分析軟件共同完成,以配伍網(wǎng)絡(luò)圖的形式呈現(xiàn)。
為收集所有的“兩兩藥物組合”情況,本次研究將支持度和置信度的值均設(shè)為0,獲得32 400個組合。剔除17 760個頻數(shù)為0的組合及7 230個鏡像關(guān)聯(lián)情況,最終獲得7 230個共現(xiàn)頻次至少為1的“兩兩藥物組合”,用于構(gòu)建配伍網(wǎng)絡(luò)。
將篩選完畢的關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)制為Gephi可調(diào)用的CSV格式,導(dǎo)入Gephi生成配伍網(wǎng)絡(luò)后,網(wǎng)絡(luò)參數(shù)調(diào)節(jié)同“組方網(wǎng)絡(luò)”。
3)建立組方配伍網(wǎng)絡(luò):組方配伍網(wǎng)絡(luò)的數(shù)據(jù)可以由組方、配伍網(wǎng)絡(luò)的CSV文件直接拼接獲得,導(dǎo)入Gephi生成組方配伍網(wǎng)絡(luò)后,網(wǎng)絡(luò)參數(shù)調(diào)節(jié)同“配伍網(wǎng)絡(luò)”。
2.5 比較與驗證
2.5.1 模型比較 參考頻次統(tǒng)計結(jié)果,從網(wǎng)絡(luò)概況、節(jié)點、社團模塊、鏈路4個方面,將組方網(wǎng)絡(luò)、配伍網(wǎng)絡(luò)、組方配伍網(wǎng)絡(luò)及各自核心群進行對比,評價組方配伍網(wǎng)絡(luò)及其核心群能否如實反映處方信息,體現(xiàn)組方思路和配伍關(guān)系。
2.5.2 文獻驗證 以“張伯禮”、“胸痹”、“學(xué)術(shù)思想”為關(guān)鍵字,分別在知網(wǎng)、萬方、維普三大檢索平臺進行期刊文獻檢索,經(jīng)去重和剔除無關(guān)文獻后,保留繼承總結(jié)張伯禮教授學(xué)術(shù)思想的相關(guān)文獻7篇。結(jié)合文獻內(nèi)容,評價組方配伍網(wǎng)絡(luò)及其核心群的鏈路、社團模塊、節(jié)點能否反映張伯禮教授治療胸痹的學(xué)術(shù)思想、治則治法、重點藥物。
2.5.3 專家確認(rèn) 經(jīng)相關(guān)文獻驗證后,將組方配伍網(wǎng)絡(luò)以圖片輸出,并對各社團模塊、節(jié)點、鏈路的內(nèi)容及其意義向張伯禮教授做說明,確認(rèn)分析結(jié)果是否能得到專家本人認(rèn)可。
3.1 頻數(shù)統(tǒng)計 借助R內(nèi)置的關(guān)聯(lián)規(guī)則分析包,統(tǒng)計不同藥物的使用頻次、藥物組合的共現(xiàn)頻次。截取部分頻數(shù)統(tǒng)計結(jié)果制成表1、表2進行展示。
表1 不同藥物使用頻次前20名
表2 藥物組合使用頻次前20名
3.2 網(wǎng)絡(luò)模型對比
3.2.1 概況對比 本次研究共構(gòu)建了6個網(wǎng)絡(luò),分別是組方網(wǎng)絡(luò)、配伍網(wǎng)絡(luò)、組方配伍網(wǎng)絡(luò)及其各自的核心群。具體參數(shù)見表3。
表3 網(wǎng)絡(luò)概況對比
組方網(wǎng)絡(luò)節(jié)點連接相對稀疏,核心群最小,模塊數(shù)最多;配伍網(wǎng)絡(luò)和組方配伍網(wǎng)絡(luò)節(jié)點連接較緊密,核心群較大,模塊數(shù)方面組方配伍網(wǎng)絡(luò)比配伍網(wǎng)絡(luò)多。
3.2.2 節(jié)點對比 介數(shù)中心性能夠反映所評價節(jié)點連接其他節(jié)點的能力,即所評價藥物與其他藥物的配伍關(guān)系是否密切。各網(wǎng)絡(luò)介數(shù)中心性前10的藥物如下:1)組方網(wǎng)絡(luò)及其核心:柴葛根、夏枯草、杜仲、知母、黃芩、茯苓、生龍齒、玉竹、桑寄生、干姜。2)配伍網(wǎng)絡(luò)和組方配伍網(wǎng)絡(luò)為:丹參、郁金、茯苓、黃連、麥門冬、生龍齒、生牡蠣、首烏藤、半夏、延胡索。3)配伍網(wǎng)絡(luò)核心和組方配伍網(wǎng)絡(luò)核心為:郁金、丹參、茯苓、延胡索、柴葛根、降香、黃連、麥門冬、生龍齒、首烏藤。
參考頻次統(tǒng)計情況,組方網(wǎng)絡(luò)(及其核心群)重要節(jié)點與頻次統(tǒng)計結(jié)論的一致性較差,而配伍網(wǎng)絡(luò)、組方配伍網(wǎng)絡(luò)(及其核心群)較好。
3.2.3 模塊對比 社區(qū)探測算法可以依據(jù)節(jié)點連接的疏密情況,將整個網(wǎng)絡(luò)劃分為若干網(wǎng)絡(luò)模塊?;诜絼W(xué)理論,中醫(yī)處方至少應(yīng)包括“君臣佐使”4個基本模塊。結(jié)合表3各網(wǎng)絡(luò)的模塊數(shù)來看,組方網(wǎng)絡(luò)及其核心的模塊數(shù)較多,而配伍網(wǎng)絡(luò)及其核心的模塊數(shù)較少,只有組方配伍網(wǎng)絡(luò)及其核心的模塊數(shù)較為符合預(yù)期。
從連接情況來看:1)組方網(wǎng)絡(luò)的各模塊內(nèi)部連接較緊密,而模塊之間連接較稀疏。2)配伍網(wǎng)絡(luò)中只有1個模塊內(nèi)部連接緊密,其余模塊及模塊間連接較為稀疏。3)組方配伍網(wǎng)絡(luò)各模塊內(nèi)部、模塊間的連接都較為緊密。
3.2.4 鏈路對比 藥物節(jié)點相連構(gòu)成的鏈路反映了不同藥物間存在的配伍關(guān)系。從鏈路的節(jié)點構(gòu)成來看:1)組方網(wǎng)絡(luò)及其核心群的鏈路可體現(xiàn)某一用藥目的,如丹參、郁金、元胡、降香體現(xiàn)了活血化瘀、行氣止痛的用藥目的,但不同鏈路間是否存在聯(lián)系難以確定。2)配伍網(wǎng)絡(luò)及其核心群的鏈路反映使用頻次較高的藥物組合,但各鏈路內(nèi)部藥物重復(fù)率高。3)組方配伍網(wǎng)絡(luò)及其核心群的鏈路節(jié)點重復(fù)較少,不同鏈路間部分節(jié)點相互連接,既可以反映不同藥物組合的用藥目的,又可以觀察到不同藥物組合間的協(xié)同關(guān)系。
3.3 比較與驗證 通過不同網(wǎng)絡(luò)模型之間的比較,經(jīng)文獻驗證和與專家本人確認(rèn),研究認(rèn)為組方配伍網(wǎng)絡(luò)能夠如實反映處方信息,張伯禮教授治療胸痹的學(xué)術(shù)思想、治則治法、常用藥物可從組方配伍網(wǎng)中的鏈路、社團模塊和節(jié)點中得到反映。具體內(nèi)容詳見圖1,圖中藥物節(jié)點的字號大小與使用頻次高低正相關(guān),節(jié)點間連線的粗細與配伍概率大小正相關(guān),不同的模塊以不同顏色區(qū)分。
4.1 結(jié)果分析 在對相關(guān)文獻[7-13]研究中發(fā)現(xiàn),張伯禮院士治療胸痹的特點可概括為:1)理論上以“痰瘀學(xué)說”為基礎(chǔ),主張“痰瘀并治”,重視痰瘀在疾病發(fā)展各階段的變化。2)治法上依患者具體情況,采取活血化瘀(丹參、郁金、延胡索、降香、三七粉、五靈脂)、益氣養(yǎng)陰法(生地、沙參、麥門冬、黨參、黃精)、健脾祛濕(黨參、茯苓、白術(shù))、通經(jīng)活絡(luò)(雞血藤、桑枝)等方法。3)用藥上根據(jù)不同病情條件下的痰瘀特點,選取相應(yīng)的對(隊)藥予以治療(濕邪重用萆薢、蒼術(shù)、蠶砂,濕邪化熱用茵陳蒿、知母、黃連、大黃,痰火盛用黃芩、浙貝母,痰濕蘊肺用細辛、干姜、半夏)。4)兼顧氣、血、陰、陽及諸臟功能的平衡(女貞子、旱蓮草、杜仲、牛膝、當(dāng)歸、何首烏),注重調(diào)養(yǎng)心神(酸棗仁、柏子仁、夜交藤、生龍齒、生牡蠣)。
圖1 2016年度張伯禮教授治療胸痹的組方配伍網(wǎng)絡(luò)圖
參照張伯禮教授治療胸痹的特點[7-13],結(jié)合組方配伍網(wǎng)絡(luò)的節(jié)點、鏈路、社團模塊情況,本研究組認(rèn)為:1)社團模塊及其內(nèi)部介數(shù)中心性高的節(jié)點,能夠反映特定的用藥目的,如:模塊1體現(xiàn)了健脾祛濕法(黨參、茯苓、白術(shù))。模塊2以牛蒡子、射干、橘紅、浙貝母等化痰藥為主,體現(xiàn)了治痰的用藥變化。模塊3體現(xiàn)了活血化瘀法(丹參、郁金、延胡索、降香、三七粉、五靈脂)。模塊4以柴葛根、杜仲、夏枯草、雞血藤等藥物為主,包含藥物最多,是兼顧氣、血、陰、陽及諸臟功能的臨證加減用藥模塊。模塊5以首烏藤、生龍齒、柏子仁、酸棗仁等為主,體現(xiàn)了注重調(diào)養(yǎng)心神。2)不同模塊間重點藥物的連接,能夠反映專家治療某一疾病的學(xué)術(shù)特點,如:本研究中,模塊1與模塊3的重點藥物及其構(gòu)成的鏈路,體現(xiàn)了張伯禮教授治療胸痹的“痰瘀學(xué)說”。
4.2 組方配伍網(wǎng)絡(luò)的優(yōu)勢 基于藥物錄入順序構(gòu)建的組方網(wǎng)絡(luò)及其核心,有利于體現(xiàn)組方思路,但缺乏關(guān)聯(lián)數(shù)據(jù)支撐;基于關(guān)聯(lián)分析構(gòu)建的配伍網(wǎng)絡(luò)及其核心,有利于挖掘核心配伍組合,但會使處方信息碎片化,難以揭示組方思路。
作為組方網(wǎng)絡(luò)和配伍網(wǎng)絡(luò)的有機結(jié)合體,組方配伍網(wǎng)絡(luò)既可以直觀展示組方思路,又可以在關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)上明確具體的藥物配伍關(guān)系。以鏈路、社團模塊反映理論和治法,基于介數(shù)中心性篩選重點藥物,符合“理、法、方、藥”的中醫(yī)臨床思維。
4.3 問題與展望 名老中醫(yī)經(jīng)驗的存在形式既有顯性的,也有隱性的。單純照搬某種方法的分析結(jié)果,很難得到名老中醫(yī)本人的認(rèn)可。因此,需要在中醫(yī)理論指導(dǎo)下綜合運用多種方法,對名老中醫(yī)經(jīng)驗方進行系統(tǒng)、全面地挖掘和總結(jié)[22-23]。
作為一種多分析方法綜合應(yīng)用的嘗試,“組方配伍網(wǎng)絡(luò)”在參考傳統(tǒng)師承“抄方”的基礎(chǔ)上,綜合運用關(guān)聯(lián)分析、復(fù)雜網(wǎng)絡(luò)分析兩種方法,為總結(jié)名老中醫(yī)治療某一病證(疾?。┑摹袄?、法、方、藥”提供了一套較為完備的解決方案。
但完備并不等于完美,它也存在一些問題需要深入探討,例如:如何確定社團模塊劃分的最優(yōu)解析度。析其原因,復(fù)雜網(wǎng)絡(luò)分析法雖已應(yīng)用于中醫(yī)藥數(shù)據(jù)挖掘領(lǐng)域,但具體操作中相關(guān)參數(shù)設(shè)置尚無統(tǒng)一標(biāo)準(zhǔn)可以借鑒。因此,需要在大量數(shù)據(jù)實驗的基礎(chǔ)上,由相關(guān)研究人員共同尋找最優(yōu)參數(shù),制定統(tǒng)一標(biāo)準(zhǔn)。