馬紅麗 徐長(zhǎng)英 楊新鳴
摘要 決策樹(shù)因其形狀像樹(shù)且又能用于決策故被稱(chēng)為決策樹(shù),是通過(guò)機(jī)器學(xué)習(xí),從一系列無(wú)秩序、無(wú)規(guī)則的邏輯關(guān)系中推理出一套分層規(guī)則,將結(jié)局按照概率分布的樹(shù)形圖表達(dá),從而進(jìn)行精確預(yù)測(cè)或正確分類(lèi)?,F(xiàn)系統(tǒng)綜述了決策樹(shù)在中醫(yī)藥領(lǐng)域的應(yīng)用現(xiàn)狀,發(fā)現(xiàn)決策樹(shù)在疾病風(fēng)險(xiǎn)評(píng)估、中醫(yī)病證的診斷、辨證分型、中藥藥性或不良反應(yīng)的預(yù)測(cè)、證候與理化指標(biāo)的關(guān)聯(lián)、預(yù)后評(píng)估和成本-效果分析等方面均有所應(yīng)用,且其分類(lèi)和預(yù)測(cè)結(jié)果較為準(zhǔn)確,值得今后進(jìn)一步研究并推廣應(yīng)用。
關(guān)鍵詞 決策樹(shù);數(shù)據(jù)挖掘;機(jī)器學(xué)習(xí);中醫(yī)藥;預(yù)測(cè)模型;樹(shù)形圖;分類(lèi);風(fēng)險(xiǎn)評(píng)估
Application Status of Decision Tree in Traditional Chinese Medicine
MA Hongli1,XU Changying2,YANG Xinming1
(1 The First Affiliated Hospital of Heilongjiang University of Chinese Medicine,Harbin 150040,China; 2 Heilongjiang University of Chinese Medicine,Harbin 150040,China)
Abstract A decision tree is called this name because it is shaped like a tree and it can be used for decision-making.It is a set of hierarchical rules inferred from a series of disordered and irregular logical relations by machine learning,and the outcomes are expressed according to the tree graph of probability distribution,so as to accurately predict or correctly classify.This paper systematically summarizes the present situation of the application of decision tree in the field of traditional Chinese medicine,and found that the decision tree in used in disease risk assessment,diagnosis of TCM diseases and syndromes,syndrome differentiation of TCM,the prediction of Chinese medicinal properties or adverse reactions,syndrome differentiation associated with physical and chemical indicators,prognostic evaluation and cost effect analysis and so on.The classification and prediction results by decision tree are more accurate,and is worth for further research and application in the future.
Keywords Decision tree; Data mining; Machine learning; Traditional Chinese medicine; Prediction model; Tree diagram; Classification; Risk assessment
中圖分類(lèi)號(hào):R241文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.3969/j.issn.1673-7202.2021.17.025
我國(guó)中醫(yī)藥資源豐富,歷史悠久,但隨著“大數(shù)據(jù)”時(shí)代的到來(lái),多數(shù)中醫(yī)藥數(shù)據(jù)仍在“沉睡”階段,目前傳統(tǒng)數(shù)據(jù)處理模式已無(wú)法適應(yīng)“大數(shù)據(jù)”時(shí)代的要求。如何高效準(zhǔn)確地從這些大規(guī)模數(shù)據(jù)中獲取有價(jià)值的新鮮知識(shí)將為中醫(yī)藥領(lǐng)域帶來(lái)前所未有的機(jī)遇和挑戰(zhàn),借助大數(shù)據(jù)的發(fā)展推動(dòng)并促進(jìn)中醫(yī)藥領(lǐng)域臨床和科研的發(fā)展,可能會(huì)給中醫(yī)藥領(lǐng)域帶來(lái)重要的革命性變化[1]。目前,決策樹(shù)作為一種機(jī)器學(xué)習(xí)方法已經(jīng)開(kāi)始應(yīng)用于商業(yè)、金融、教育等各領(lǐng)域,其分析和預(yù)測(cè)結(jié)果在各領(lǐng)域中都取得了令人矚目的成效。近年來(lái),有學(xué)者將決策樹(shù)應(yīng)用于醫(yī)學(xué)領(lǐng)域,根據(jù)患者的臨床特征和各項(xiàng)指標(biāo)等來(lái)預(yù)測(cè)疾病的發(fā)生、發(fā)展及預(yù)后,或進(jìn)行疾病的診斷及用藥配伍,具有重要指導(dǎo)意義?,F(xiàn)將決策樹(shù)在中醫(yī)藥領(lǐng)域中的應(yīng)用做一綜述,以期為今后決策樹(shù)在中醫(yī)臨床中的應(yīng)用提供更多的思路和方法。
1 決策樹(shù)的研究概況
1.1 決策樹(shù)的概念
決策樹(shù)是用樹(shù)形圖來(lái)表示邏輯處理的一種工具,由一系列節(jié)點(diǎn)和分支組成。一般從根節(jié)點(diǎn)開(kāi)始,通過(guò)一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類(lèi)[2]。自上而下,根據(jù)不同的分類(lèi)規(guī)則將數(shù)據(jù)樣本劃分成不同的子集,每個(gè)樣本子集作為一個(gè)葉節(jié)點(diǎn),每個(gè)葉節(jié)點(diǎn)對(duì)應(yīng)一個(gè)分類(lèi),這種圖形很像一棵樹(shù)的枝干,故稱(chēng)決策樹(shù)[3]。決策樹(shù)在分類(lèi)、預(yù)測(cè)、規(guī)則提取等領(lǐng)域應(yīng)用廣泛。
1.2 決策樹(shù)的常見(jiàn)算法
1.2.1 ID3算法
ID3算法是目前最有影響的決策樹(shù)算法,是由Quinlan于1986年首次提出的。ID3決策樹(shù)算法篩選“信息增益”最大的屬性劃分訓(xùn)練數(shù)據(jù)集,基本原則是:數(shù)據(jù)集被分裂為若干子集后,要使每個(gè)子集中的數(shù)據(jù)盡可能地“純”,即進(jìn)行分枝時(shí)系統(tǒng)的熵值最小,從而很大地提高算法的運(yùn)算速度和精確度[4]。但I(xiàn)D3算法存在2點(diǎn)主要缺陷:一是只能處理離散型數(shù)據(jù),不能對(duì)連續(xù)型數(shù)據(jù)進(jìn)行分類(lèi);“信息增益”作為分支屬性的標(biāo)準(zhǔn)時(shí),往往會(huì)偏向于取值較多的屬性,這類(lèi)屬性在某些情況下并不能提供太多有價(jià)值的信息[5]。
1.2.2 C4.5和C5.0算法
C4.5算法由Quinlan于1993年提出。C4.5算法是ID3算法的改進(jìn),在ID3的基礎(chǔ)上增加了對(duì)連續(xù)型變量和缺失數(shù)據(jù)的處理,采用了信息增益比作為分枝屬性的標(biāo)準(zhǔn),彌補(bǔ)了ID3算法偏向于選擇取值較多的不足。但C4.5算法最主要依據(jù)錯(cuò)誤率評(píng)價(jià)決策樹(shù),不考慮樹(shù)的深度和結(jié)點(diǎn)的個(gè)數(shù),并且進(jìn)行分組時(shí),對(duì)屬性值逐個(gè)試探,效率較低。C5.0算法則是在C4.5的基礎(chǔ)上進(jìn)一步優(yōu)化,在執(zhí)行效率和內(nèi)存使用方面進(jìn)行了改進(jìn),提高了分類(lèi)效率和準(zhǔn)確性[6]。
1.2.3 CART算法
CART即分類(lèi)回歸樹(shù),是由加利福尼亞大學(xué)的Leo Breman和斯坦福大學(xué)的Jerome H.Friedman在1984年共同提出的,它描述給定因變量值X后,自變量Y條件分布的一個(gè)靈活方法,其因變量主要是二值分類(lèi)的變量,也可是多分類(lèi)、有序變量或者連續(xù)型變量,自變量既可以是離散變量,也可是連續(xù)型變量。CART算法是基于統(tǒng)計(jì)理論的非參數(shù)識(shí)別算法,擁有非常強(qiáng)大的統(tǒng)計(jì)解析能力,對(duì)數(shù)據(jù)的要求不高,數(shù)據(jù)可以是不完整或是復(fù)雜的浮點(diǎn)數(shù)運(yùn)算,結(jié)果也清晰明了。但作為大樣本量的統(tǒng)計(jì)分析方法,CART存在穩(wěn)定性較差的問(wèn)題,尤其是樣本量較小時(shí)。
1.2.4 CHAID算法
CHAID即卡方自動(dòng)交互檢測(cè),由Kass在1980年提出。其主要特征是前向修剪,多向分叉,分析過(guò)程能夠顯示出各個(gè)變量之間的相互作用關(guān)系,是一種基于調(diào)整后的顯著性檢驗(yàn)決策樹(shù)模型。CHAID方法非常適宜處理分類(lèi)變量,以因變量為根節(jié)點(diǎn),對(duì)每個(gè)自變量進(jìn)行分類(lèi),分別計(jì)算各分類(lèi)屬性的卡方值,并將產(chǎn)生最大卡方值的屬性作為分裂屬性進(jìn)行劃分,直到劃分至沒(méi)有顯著意義的子節(jié)點(diǎn)為止,因此不需要做后剪枝處理。然而CHAID算法在穩(wěn)定性方面略有不足,不同的父節(jié)點(diǎn)數(shù)、子節(jié)點(diǎn)數(shù)、變量賦值以及樹(shù)的深度都可能會(huì)對(duì)模型產(chǎn)生影響。
1.3 決策樹(shù)的優(yōu)勢(shì)與不足
1.3.1 優(yōu)勢(shì) 1)易于理解和實(shí)現(xiàn)。人們?cè)谶\(yùn)用決策樹(shù)模型過(guò)程中不需要使用者了解很多的背景知識(shí),因?yàn)樗軌蛑苯芋w現(xiàn)數(shù)據(jù)的特點(diǎn),易于理解決策樹(shù)所表達(dá)的意義。2)數(shù)據(jù)準(zhǔn)備簡(jiǎn)單。決策樹(shù)模型能夠同時(shí)處理數(shù)據(jù)型和常規(guī)型2種屬性,在短時(shí)間內(nèi)能夠?qū)Υ罅繑?shù)據(jù)做出可行且效果良好的分析結(jié)果。3)易于評(píng)測(cè)。可以通過(guò)驗(yàn)證來(lái)評(píng)估模型的可信度;根據(jù)形成的決策樹(shù)模型很容易推出相應(yīng)的邏輯表達(dá)式。
1.3.2 不足 1)擬合過(guò)度。如果對(duì)決策樹(shù)模型的生長(zhǎng)沒(méi)有合理限制,任其自由生長(zhǎng)有可能使節(jié)點(diǎn)只包含單純的事件數(shù)據(jù)或非事件數(shù)據(jù),使其雖然可以完美匹配,但是無(wú)法適應(yīng)其他數(shù)據(jù)。2)精確度不夠。決策樹(shù)算法往往偏向取決值較多的屬性,而取值較多的屬性卻并不一定是最優(yōu)的屬性,這就影響它的精確度。3)有局限性。盡管決策樹(shù)對(duì)大數(shù)據(jù)處理具有一定優(yōu)勢(shì),但卻無(wú)法適用于一些不能用數(shù)據(jù)表示的決策。
2 決策樹(shù)在中醫(yī)藥領(lǐng)域的應(yīng)用
2.1 決策樹(shù)在疾病風(fēng)險(xiǎn)評(píng)估中的應(yīng)用
風(fēng)險(xiǎn)預(yù)測(cè)模型是慢病防治的重要手段。中國(guó)的醫(yī)療衛(wèi)生體系正在經(jīng)歷著由以治病為中心向以健康、預(yù)防為中心的轉(zhuǎn)變[7]。通過(guò)風(fēng)險(xiǎn)評(píng)估與預(yù)測(cè)來(lái)篩選高風(fēng)險(xiǎn)患者群,然后采取有針對(duì)性的治療或預(yù)防策略,可以大大降低疾病的發(fā)生率。利用決策樹(shù)構(gòu)建風(fēng)險(xiǎn)評(píng)估模型是早期發(fā)現(xiàn)、預(yù)測(cè)和預(yù)防各種疾病的一種有效方法。目前針對(duì)西醫(yī)危險(xiǎn)因素的研究較多,如采用C5.0決策樹(shù)算法預(yù)測(cè)2型糖尿病患者發(fā)生腦梗死風(fēng)險(xiǎn)[8],或進(jìn)行早期胃癌風(fēng)險(xiǎn)評(píng)估[9]。
針對(duì)中醫(yī)危險(xiǎn)因素構(gòu)建疾病風(fēng)險(xiǎn)預(yù)測(cè)模型的研究相對(duì)較少。呂航等[10]對(duì)2型糖尿病患者伴發(fā)非酒精性脂肪肝風(fēng)險(xiǎn)進(jìn)行了預(yù)測(cè),通過(guò)測(cè)定這些患者中醫(yī)人格及體質(zhì)類(lèi)型并收集其臨床指標(biāo),運(yùn)用決策樹(shù)方法建構(gòu)風(fēng)險(xiǎn)預(yù)測(cè)模型,結(jié)果發(fā)現(xiàn)3條預(yù)測(cè)非酒精性脂肪肝的患病風(fēng)險(xiǎn)規(guī)則,經(jīng)驗(yàn)證預(yù)測(cè)準(zhǔn)確度為87.1%。同時(shí),該課題組還構(gòu)建了2型糖尿病患者伴發(fā)冠心病的風(fēng)險(xiǎn)預(yù)測(cè)模型,結(jié)果發(fā)現(xiàn)少陰人格及陰寒血瘀體質(zhì)類(lèi)型的2型糖尿病患者發(fā)生冠心病的風(fēng)險(xiǎn)較大,其預(yù)測(cè)準(zhǔn)確度高達(dá)93.6%[11]。
決策樹(shù)構(gòu)建的風(fēng)險(xiǎn)預(yù)測(cè)模型準(zhǔn)確度較高,但目前在中醫(yī)藥領(lǐng)域應(yīng)用不足。中醫(yī)“未病先防”的概念早在《黃帝內(nèi)經(jīng)》中就已經(jīng)提出:“上工治未病,不治已病,此之謂也?!彪S著生活水平的提高、醫(yī)療理念的轉(zhuǎn)變,越來(lái)越多的人們意識(shí)到疾病預(yù)防的重要性,中醫(yī)“治未病”的觀念開(kāi)始越來(lái)越受到全社會(huì)的關(guān)注。因此,今后應(yīng)加強(qiáng)并普及機(jī)器學(xué)習(xí)在中醫(yī)疾病風(fēng)險(xiǎn)評(píng)估中的應(yīng)用,不僅可防治未病,還可提升高危人群早期篩查準(zhǔn)確度。
2.2 決策樹(shù)在中醫(yī)病證診斷中的應(yīng)用
疾病診斷的過(guò)程也是分類(lèi)疾病的過(guò)程,是根據(jù)患者的臨床表現(xiàn)特征劃分到某一疾病的過(guò)程。決策樹(shù)對(duì)較多混雜因素和數(shù)據(jù)進(jìn)行分析是通過(guò)一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類(lèi)的過(guò)程,適合應(yīng)用于疾病診斷中進(jìn)行研究。且有實(shí)驗(yàn)數(shù)據(jù)表明,機(jī)器學(xué)習(xí)對(duì)一些現(xiàn)代疾病的診斷準(zhǔn)確率已達(dá)到醫(yī)生水平,或部分診斷率已超過(guò)醫(yī)生。中醫(yī)診斷學(xué)的精髓在于“辨證論治”,辨證準(zhǔn)確,疾病才能得到有效的治療。除了臨床醫(yī)師自身的診療經(jīng)驗(yàn)外,應(yīng)用決策樹(shù)算法建立輔助中醫(yī)診斷或辨證分型系統(tǒng),可能是提高中醫(yī)辨證準(zhǔn)確率的一個(gè)有效途徑。
徐蕾等[12]將決策樹(shù)方法應(yīng)用在慢性胃炎中醫(yī)辨證分型模型構(gòu)建中,將26個(gè)對(duì)中醫(yī)辨證分型有意義的因素按其重要性進(jìn)行排序,發(fā)現(xiàn)當(dāng)決策樹(shù)葉子數(shù)目增長(zhǎng)至126個(gè)時(shí),正確分類(lèi)率達(dá)到了最高點(diǎn)。模型構(gòu)建成功后對(duì)406例慢性胃炎患者的中醫(yī)證型進(jìn)行預(yù)測(cè),發(fā)現(xiàn)該模型區(qū)分各類(lèi)證型的靈敏度和特異度較高,證明模型構(gòu)建成功,適合應(yīng)用于慢性胃炎的中醫(yī)證型診斷。謝雁鳴等[13]利用決策樹(shù)分別建立了原發(fā)性骨質(zhì)疏松癥的陽(yáng)虛診斷模型和陰虛診斷模型,發(fā)現(xiàn)陰虛診斷模型以五心煩熱、盜汗以及便秘3個(gè)變量為主,診斷準(zhǔn)確率達(dá)99.72%;陽(yáng)虛診斷模型以頭暈、氣短、畏寒肢冷、腰膝酸軟及大便稀溏5個(gè)變量為主,診斷正確率達(dá)99.87%。還有學(xué)者用決策樹(shù)模型構(gòu)建高血壓痰濕壅盛證診斷模型[14],慢性阻塞性肺病中醫(yī)診斷模型[15],慢性乙型肝炎肝膽濕熱證和肝郁脾虛證的診斷模型[16]等。這些模型的成功構(gòu)建,說(shuō)明決策樹(shù)模型適合應(yīng)用于中醫(yī)診斷和中醫(yī)辨證分型。
2.3 決策樹(shù)在方藥配伍中的應(yīng)用
吳嘉瑞等[17]建立決策樹(shù)模型探討中藥七情配伍中相使、相惡藥對(duì)的藥性規(guī)律。在成功建立模型后,選取《本草綱目》中有確切藥性記載的部分藥對(duì)進(jìn)行驗(yàn)證,結(jié)果發(fā)現(xiàn),應(yīng)用建立的模型能夠正確判斷配伍方式的藥對(duì)僅有131對(duì),準(zhǔn)確率為45.6%,說(shuō)明建立的模型與實(shí)際差異較大,不適于推廣應(yīng)用。張春生等[18]利用C4.5決策樹(shù)算法研究蒙醫(yī)方劑配伍規(guī)律,將治療“赫依病”的27個(gè)方劑作為主要研究對(duì)象建立決策樹(shù)分類(lèi)模型,發(fā)現(xiàn)紫草茸是治療骨赫依的關(guān)鍵藥物,五靈脂是治療大腸赫依的關(guān)鍵藥物等結(jié)果,對(duì)臨床有一定的指導(dǎo)意義。
在應(yīng)用機(jī)器學(xué)習(xí)方法研究中醫(yī)方劑配伍規(guī)律方面,目前多采用聚類(lèi)分析、關(guān)聯(lián)規(guī)則或神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行研究,應(yīng)用決策樹(shù)算法對(duì)方劑配伍規(guī)律的研究相對(duì)較少。決策樹(shù)模型適用于分類(lèi)與預(yù)測(cè),因此在中藥領(lǐng)域的研究多集中在對(duì)中藥藥性的預(yù)測(cè)[19]、中藥化合物的篩選[20]、中藥不良反應(yīng)的預(yù)測(cè)[21-22]等。
2.4 決策樹(shù)在中醫(yī)證候與理化指標(biāo)相關(guān)性中的應(yīng)用
證候是中醫(yī)特有的概念,是疾病在發(fā)生和演變過(guò)程中某一階段本質(zhì)的體現(xiàn),多通過(guò)中醫(yī)四診信息所獲知,能夠?yàn)楸孀C論治提供依據(jù)。理化指標(biāo)是疾病診斷過(guò)程中的重要參考之一,是評(píng)價(jià)和界定疾病發(fā)生發(fā)展的標(biāo)準(zhǔn)。近年來(lái),有學(xué)者就中醫(yī)證候?qū)W特點(diǎn)與病理生理進(jìn)程密切相關(guān)的理化指標(biāo)的相關(guān)性進(jìn)行研究,以期尋找疾病及其證候與理化指標(biāo)間的關(guān)聯(lián)規(guī)律,實(shí)現(xiàn)證候-理化指標(biāo)之間的信息互通,為中醫(yī)的辨證提供生物學(xué)參考,實(shí)現(xiàn)中西醫(yī)結(jié)合診斷與治療的目的。
張軍鵬等[23]將冠心病心絞痛合并糖尿病患者的臨床基本資料、理化指標(biāo)和中醫(yī)四診信息進(jìn)行綜合分析,篩選出與氣陰兩虛證最相關(guān)的理化指標(biāo)6項(xiàng),形成7條識(shí)別途徑,經(jīng)驗(yàn)證,該模型識(shí)別氣陰兩虛證準(zhǔn)確率高達(dá)77.00%。史琦等[24]基于決策樹(shù)方法將冠心病心絞痛合并糖尿病患者氣虛證與理化指標(biāo)相關(guān)聯(lián),發(fā)現(xiàn)基于核心理化指標(biāo)建立的氣虛證決策樹(shù)模型的檢測(cè)正確率為77.78%。這些研究說(shuō)明臨床理化指標(biāo)對(duì)中醫(yī)證型診斷具有較高的實(shí)用價(jià)值,能夠用現(xiàn)代生物學(xué)信息解釋中醫(yī)證候,從而為中醫(yī)藥臨床研究走向世界提供了依據(jù)。
2.5 決策樹(shù)在預(yù)后評(píng)估中的應(yīng)用
疾病的預(yù)后評(píng)估是對(duì)疾病發(fā)生后各種不同結(jié)局的預(yù)測(cè),在疾病的治療過(guò)程中,由于患者的年齡、基礎(chǔ)狀態(tài)、體質(zhì)、合并疾病等諸多因素的不同,即使接受了同樣的治療,預(yù)后也可能有很大的差別。利用決策樹(shù)模型,針對(duì)疾病預(yù)后因素進(jìn)行分析和疾病結(jié)局進(jìn)行預(yù)測(cè),可以有針對(duì)性地對(duì)不同患者采用不同的治療手段,進(jìn)一步提高患者的治愈率或生存率。
查青林等[25]利用決策樹(shù)模型探索類(lèi)風(fēng)濕性關(guān)節(jié)炎證候信息與療效的關(guān)系時(shí),將397例確診為活動(dòng)期類(lèi)風(fēng)濕性關(guān)節(jié)炎患者隨機(jī)分成中藥觀察組和西藥觀察組,收集患者各項(xiàng)診查指標(biāo)和中醫(yī)四診信息,中藥觀察組共納入變量20個(gè),西藥觀察組納入變量26個(gè)。結(jié)果發(fā)現(xiàn)中藥觀察組中關(guān)節(jié)壓痛程度、晨僵、夜尿多、舌淡紅4項(xiàng)指標(biāo)療效有差異;西藥組中晨僵、白細(xì)胞數(shù)目、C反應(yīng)蛋白和舌苔白這4項(xiàng)觀測(cè)指標(biāo)療效有差異。郜潔等[26]采用決策樹(shù)回顧性分析中西醫(yī)結(jié)合治療輸卵管妊娠影響因子及預(yù)后的風(fēng)險(xiǎn)因素,共篩選出5個(gè)對(duì)預(yù)后有重要影響的變量,可比較準(zhǔn)確地預(yù)測(cè)早期輸卵管妊娠的預(yù)后。
2.6 決策樹(shù)在成本-效果分析中的應(yīng)用
在疾病的治療過(guò)程中,往往會(huì)有多種治療方案,除了療效,成本也是需要考慮的一方面,綜合成本-效果才能確定最合理的治療方案。成本-效果分析是目前藥物經(jīng)濟(jì)學(xué)評(píng)價(jià)中應(yīng)用較多的方法,通過(guò)分析和比較不同治療方案的花費(fèi)和療效,計(jì)算每種治療方案的成本效果比,該比值越小說(shuō)明治療方案越合理。運(yùn)用決策樹(shù)進(jìn)行成本-效果分析可以為臨床合理用藥和疾病防治決策提供科學(xué)依據(jù)。
宣建偉等[27]在玉屏風(fēng)顆粒治療兒童反復(fù)呼吸道感染成本-效果分析中運(yùn)用到了決策樹(shù)模型。將常規(guī)治療、玉屏風(fēng)顆粒聯(lián)合常規(guī)治療、匹多莫德、玉屏風(fēng)顆粒聯(lián)合匹多莫德4種治療方式進(jìn)行比較,發(fā)現(xiàn)玉屏顆粒聯(lián)合常規(guī)治療比常規(guī)治療成本效果比值低;玉屏風(fēng)顆粒聯(lián)合匹多莫德相對(duì)匹多莫德單用治療小兒反復(fù)呼吸道感染,能夠減少反復(fù)呼吸道感染發(fā)生次數(shù),具有絕對(duì)的成本-效果優(yōu)勢(shì),不僅有更好的療效,還能減少總體醫(yī)療花費(fèi)。另一項(xiàng)研究采用決策樹(shù)模型對(duì)脈絡(luò)寧注射液與復(fù)方丹參注射液治療缺血性腦卒中進(jìn)行成本-效果分析,結(jié)果顯示二者的成本-效果比分別為4.18和2.21,而脈絡(luò)寧注射液較復(fù)方丹參注射液的增量成本-效果比為12.4。因此認(rèn)為脈絡(luò)寧注射液治療缺血性腦卒中比復(fù)方丹參注射液的療效更好,經(jīng)濟(jì)學(xué)更佳[28]。
3 小結(jié)與展望
大數(shù)據(jù)時(shí)代的到來(lái),為中醫(yī)藥領(lǐng)域帶來(lái)了巨大的機(jī)遇與挑戰(zhàn)。利用機(jī)器學(xué)習(xí)處理幾千年來(lái)中醫(yī)藥領(lǐng)域累積的大數(shù)據(jù),可促進(jìn)傳統(tǒng)醫(yī)學(xué)大數(shù)據(jù)的有效利用,為我國(guó)中醫(yī)藥學(xué)的發(fā)展帶來(lái)機(jī)會(huì)。決策樹(shù)模型適用于分類(lèi)、預(yù)測(cè)和規(guī)則提取,目前,決策樹(shù)已經(jīng)在中醫(yī)病證診斷、辨證論治及預(yù)后等方面有了較好的應(yīng)用。然而在疾病風(fēng)險(xiǎn)評(píng)估、高危因素預(yù)測(cè)、預(yù)后評(píng)估等方面應(yīng)用不足。隨著中醫(yī)“治未病”觀念的普及和接受,如何利用機(jī)器學(xué)習(xí)方法了解疾病高危因素,及時(shí)進(jìn)行疾病風(fēng)險(xiǎn)評(píng)估以更好發(fā)揮中醫(yī)“治未病”的優(yōu)勢(shì)是我們今后要努力的方向。
參考文獻(xiàn)
[1]解育靜.大數(shù)據(jù)時(shí)代中醫(yī)藥領(lǐng)域面臨的機(jī)遇與挑戰(zhàn)[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2015,24(7):33-35.
[2]Srikanth R,Agrawal R.Mining Sequential Patterns:Generalizations and performance improvement[A].In proceedings of the 5th international conference on extending database technology:advances in database technology[C].Avignon,F(xiàn)rance:EDBT,1996:3-12.
[3]田苗苗.數(shù)據(jù)挖掘之決策樹(shù)方法概述[J].長(zhǎng)春大學(xué)學(xué)報(bào).2004,14(6):48-51.
[4]Kantardzic Mehmed.數(shù)據(jù)挖掘:概念,模型,方法和算法[M].北京:清華大學(xué)出版社,2003:121-123.
[5]劉昆,劉業(yè)政.基于決策樹(shù)的醫(yī)療數(shù)據(jù)分析[J].計(jì)算機(jī)工程,2002,28(2):41-43.
[6]張棪,曹健.面向大數(shù)據(jù)分析的決策樹(shù)算法[J].計(jì)算機(jī)科學(xué),2016,43(S1):374-379,383.
[7]魏戌,謝雁鳴,田峰,等.病證結(jié)合構(gòu)建慢病風(fēng)險(xiǎn)預(yù)測(cè)模型的思路與方法[J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2017,23(6):798-801.
[8]于長(zhǎng)春.決策樹(shù)模型在2型糖尿病患者腦梗死風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(6):683-684.
[9]劉迷迷,劉永佳,溫麗,等.C 5.0決策樹(shù)對(duì)早期胃癌風(fēng)險(xiǎn)篩查研究[J].中華腫瘤防治雜志,2018,25(16):1131-1135.
[10]呂航,王昊,劉媛,等.基于決策樹(shù)的中醫(yī)人格體質(zhì)對(duì)2型糖尿病患者伴發(fā)非酒精性脂肪肝病風(fēng)險(xiǎn)的預(yù)測(cè)研究[J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2017,23(9):1257-1259.
[11]呂航,楊秋莉,杜漸,等.基于決策樹(shù)預(yù)測(cè)糖尿病合并冠心病患病風(fēng)險(xiǎn)的中醫(yī)人格體質(zhì)特征研究[J].南京中醫(yī)藥大學(xué)學(xué)報(bào),2017,33(6):639-642.
[12]徐蕾,賀佳,孟虹,等.基于信息熵的決策樹(shù)在慢性胃炎中醫(yī)辨證中的應(yīng)用[J].第二軍醫(yī)大學(xué)學(xué)報(bào).2004,25(9):1009-1012.
[13]謝雁鳴,朱蕓茵,葛繼榮,等.基于臨床流行病學(xué)調(diào)查的原發(fā)性骨質(zhì)疏松癥中醫(yī)基本證候研究[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2007,9(2):38-44.
[14]田艷鵬,丁學(xué)義,朱羽碩,等.基于決策樹(shù)和神經(jīng)網(wǎng)絡(luò)的高血壓病痰濕壅盛證診斷模型研究[J].中華中醫(yī)藥雜志,2018,33(8):3579-3584.
[15]蘇翀,任曈,王國(guó)品,等.利用決策樹(shù)建立慢性阻塞性肺病中醫(yī)診斷模型[J].計(jì)算機(jī)工程與應(yīng)用.2019,55(3):225-230.
[16]陳瀟雨,馬利莊,胡義揚(yáng).基于決策樹(shù)方法的慢性乙型肝炎中醫(yī)證候分類(lèi)[J].上海中醫(yī)藥大學(xué)學(xué)報(bào),2013,27(1):40-44.
[17]吳嘉瑞,秦丹,張冰,等.基于決策樹(shù)算法的七情配伍相使相惡藥性規(guī)律研究[J].中國(guó)醫(yī)藥指南,2014,12(3):157-158.
[18]張春生,圖雅,李艷.基于決策樹(shù)的蒙醫(yī)方劑藥物與主治的關(guān)系研究[J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2018,24(9):1299-1302.
[19]胡亞楠,王梅,曹佳,等.組分中藥藥性預(yù)測(cè)平臺(tái)構(gòu)建[J].中華中醫(yī)藥雜志,2016,31(3):965-967.
[20]王曦廷,李彧,張瀾,等.基于機(jī)器學(xué)習(xí)的抗纖維化中藥化合物篩選研究[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2019,42(1):30-36.
[21]崔盈盈,吳嘉瑞,張丹,等.基于數(shù)據(jù)挖掘的清熱類(lèi)中藥注射劑不良反應(yīng)流行病學(xué)特點(diǎn)研究[J].藥物流行病學(xué)雜志,2017,26(10):675-682.
[22]吳東苑,楊偉,唐進(jìn)法,等.不平衡數(shù)據(jù)處理方法對(duì)中藥不良反應(yīng)預(yù)測(cè)的應(yīng)用研究[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2017,19(9):1455-1461.
[23]張軍鵬,徐學(xué)功,徐變玲,等.基于數(shù)據(jù)挖掘方法的冠心病心絞痛合并糖尿病患者理化指標(biāo)與氣陰兩虛證診斷模式的建立[J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2018,24(1):65-68,130.
[24]史琦,陳建新,趙慧輝,等.基于決策樹(shù)方法的冠心病心絞痛合并糖尿病患者理化指標(biāo)與氣虛證關(guān)聯(lián)模式的建立[J].中華中醫(yī)藥雜志,2012,27(6):1538-1540.
[25]查青林,何羿婷,喻建平,等.基于決策樹(shù)分析方法探索類(lèi)風(fēng)濕性關(guān)節(jié)炎證病信息與療效的相關(guān)關(guān)系[J].中國(guó)中西醫(yī)結(jié)合雜志,2006,26(10):871-876.
[26]郜潔,黃艷茜,胡昀昀,等.基于決策樹(shù)的中西醫(yī)結(jié)合治療輸卵管妊娠的預(yù)后因子分析[J].廣州中醫(yī)藥大學(xué)學(xué)報(bào),2016,33(4):494-497.
[27]宣建偉,盧永吉,劉寶.玉屏風(fēng)顆粒治療兒童反復(fù)呼吸道感染成本-效果分析[J].中國(guó)藥物經(jīng)濟(jì)學(xué),2017,12(7):5-9.
[28]李慧敏,廖星,胡瑞學(xué),等.中醫(yī)藥治療急性缺血性腦卒中RCT結(jié)局指標(biāo)的現(xiàn)狀分析[J].中國(guó)中藥雜志,2020,45(9):2210-2220.
(2020-08-19收稿 責(zé)任編輯:楊燕)