孟慶全,張念志
(1.安徽中醫(yī)藥大學醫(yī)藥信息工程學院,安徽 合肥 230012;2.安徽中醫(yī)藥大學第一附屬醫(yī)院,安徽 合肥 230031)
分辨矩陣法約簡中醫(yī)辨證要素初探
孟慶全1,張念志2
(1.安徽中醫(yī)藥大學醫(yī)藥信息工程學院,安徽 合肥 230012;2.安徽中醫(yī)藥大學第一附屬醫(yī)院,安徽 合肥 230031)
目的應(yīng)用分辨矩陣法對慢性支氣管炎辨證要素進行約簡。方法對100例慢性支氣管炎患者的口唇、發(fā)熱、呼吸、脈、舌、苔、咳、痰8個決策屬性進行初步數(shù)字化、數(shù)據(jù)預處理和試探性挖掘,以得到最簡規(guī)則。結(jié)果在決策屬性的約簡中,脈、舌、痰共同構(gòu)成知識的核,口唇、呼吸兩個決策屬性被約簡。結(jié)論應(yīng)用分辨矩陣法可得到慢性支氣管炎辨證分型的最小決策規(guī)則,可作為一種中醫(yī)診斷數(shù)字化的新方法。
慢性支氣管炎;辨證要素;分辨矩陣;約簡;決策規(guī)則
中醫(yī)是一個開放的復雜巨系統(tǒng),其復雜性主要來源于系統(tǒng)的開放性和規(guī)模性,系統(tǒng)結(jié)構(gòu)的多層次性,系統(tǒng)組成關(guān)系的多樣性和非線性,系統(tǒng)的有限理性、非理性和不確定性,系統(tǒng)的涌現(xiàn)性以及系統(tǒng)的動態(tài)變化等[1]。其復雜性形成了中醫(yī)證候信息的復雜性,決定了中醫(yī)數(shù)據(jù)的特性:一是癥狀的模糊性,二是證候的多態(tài)性,三是證候與證候間的非線性,四是數(shù)據(jù)挖掘過程的復雜性。應(yīng)用分辨矩陣的方法,可對這個復雜系統(tǒng)信息潛在規(guī)則進行約簡和提取[2],得到有明確意義的決策的系統(tǒng)。
粗糙集理論是數(shù)據(jù)挖掘的一種新方法,由波蘭數(shù)學家Pawlak Z于1982年首先提出,1990年代得到快速發(fā)展,具有無需任何先驗信息的特性。粗糙集理論的經(jīng)典約簡方法是分辨矩陣法,由Skowron A于1991年提出。
定義1 決策表分辨矩陣是一個對稱的n階方陣,其元素定義為:
定義2 決策表分辨函數(shù)定義為:
引例 設(shè)某一致性決策表(表1)共有8個對象,條件屬性集C由屬性{a,b,c,d}組成,決策屬性D由單屬性構(gòu)成。
設(shè)某一致性決策表(表1)共有8個對象,條件屬性集C由屬性{a,b,c,d}組成,決策屬性D由單屬性{e}構(gòu)成,以ex表示對象。
表1 某一致性決策表
根據(jù)定義2對表1約簡,得到該決策表的分辨函數(shù):
ρ*=(a∨c∨d)∧(a∨c∨d)…∧c∧…∧(c∨d)=c∧(b∨d)=(c∧b)∨(c∧d)
其中,c為核屬性,即知識中最重要的屬性,而(c∧b)和(c∧d)構(gòu)成了決策表的兩個約簡。約簡結(jié)果中不包含a屬性,說明a屬性對決策屬性e無貢獻,是可以舍棄的屬性。這一方法應(yīng)用于中醫(yī)證候證型上,條件屬性集C{a,b,c,d}為四診信息,決策屬性D{e}為證型。對一個數(shù)據(jù)量較大的決策表進行約簡,希望得到最簡結(jié)果,最簡結(jié)果即有價值的決策規(guī)則。
2.1 慢性支氣管炎辨證分型標準[5]①風寒襲肺:咳嗽聲重,咳痰稀薄色白,惡寒;或有發(fā)熱,無汗,舌苔薄白,脈浮緊。②風熱犯肺:咳嗽氣粗,咳痰黏,痰白或黃,咽痛或咳聲嘶??;或有發(fā)熱,微惡風寒,口微渴,舌尖紅,苔薄白或黃,脈浮數(shù)。③燥邪傷肺:干咳少痰,咳痰不爽,鼻咽干燥,口干,舌尖紅,苔薄黃少津,脈細數(shù)。④痰熱壅肺:咳嗽氣粗,痰多稠黃,煩熱口干,舌質(zhì)紅,苔黃膩,脈滑數(shù)。⑤肝火犯肺:咳嗆氣逆陣作,咳時胸脅引痛,甚則咳血,舌紅,苔薄黃少津,脈弦數(shù)。⑥痰濕蘊肺:咳聲重濁,痰多色白,晨起為甚,胸悶脘痞,納少,舌苔白膩,脈滑。⑦肺陰虧虛:咳久痰少,咳吐不爽,痰黏或夾血絲,咽干口燥,手足心熱,舌紅,少苔,脈細數(shù)。⑧肺氣虧虛:病久咳聲低微,咳而伴喘,咳痰清稀色白,食少,氣短胸悶,神倦乏力,自汗畏寒,舌淡嫩,苔白,脈弱。
2.2 臨床數(shù)據(jù)來源 臨床數(shù)據(jù)來源于安徽中醫(yī)藥大學第一附屬醫(yī)院呼吸內(nèi)科,共收集住院病歷100份。內(nèi)容主要包括姓名、年齡、入院主癥、體格檢查等,隱去姓名、年齡、入院時間等無關(guān)數(shù)據(jù),選擇口唇、發(fā)熱、呼吸、脈、舌、苔、咳、痰8個屬性為數(shù)據(jù)挖掘的條件屬性,證型為決策屬性。初步規(guī)范后,形成原始病例數(shù)據(jù)表(見表2)。
表2 100例慢性支氣管炎原始病例數(shù)據(jù)表
3.1 臨床數(shù)據(jù)的初步數(shù)字化 根據(jù)數(shù)據(jù)挖掘技術(shù)的基本要求,需將臨床數(shù)據(jù)以代碼(見表3)表示,以簡化求解過程。
對照表3中各種證候所對應(yīng)的代碼,并將口唇、發(fā)熱、呼吸、脈、舌、苔、咳、痰8個決策屬性名分別以字母d、e、f、g、h、i、j、k表示,以證型為決策屬性,形成數(shù)字化決策表(見表4)。
3.2 證型合并 將表2中腎氣虧虛、肺腎氣虛、氣陰兩虛、虛寒、陰虛發(fā)熱統(tǒng)一規(guī)范為虛證,則證型分為風寒襲肺、風熱犯肺、肝火犯肺、痰熱郁肺、痰濕蘊肺、痰瘀互結(jié)、燥邪犯肺、虛證8類。8類證型以數(shù)字表示,形成證型-代碼對照表(見表5),進而得到進一步簡化的原始病例數(shù)據(jù)數(shù)字化簡化決策表(見表6)。
表3 證候-代碼對照表
表4 原始病例數(shù)據(jù)數(shù)字化決策表
表5 證型-代碼對照表
表6 原始病例數(shù)據(jù)數(shù)字化簡化決策表
采用分辨構(gòu)成與約簡同步的方法[3],分別對表6數(shù)據(jù)進行再次挖掘,得到分辨函數(shù):
ρ*=g∧j∧k∧(e∨h∨i)該函數(shù)表明,屬性g(脈)、k(舌)、j(痰)共同構(gòu)成知識的核,而(g∧j∧k∧e)、(g∧j∧k∧h)、(g∧j∧k∧i)構(gòu)成了決策表的3個約簡。約簡結(jié)果中不包含d屬性(口唇)和f屬性(呼吸),說明d、f屬性對決策屬性e無貢獻,是可以舍棄的屬性。
上述研究可見,參與慢性支氣管炎辨證的8個決策屬性(口唇、發(fā)熱、呼吸、脈、舌、苔、咳、痰)中,脈(g)、舌(j)、痰(k)共同構(gòu)成辨證要素的核,與發(fā)熱(f)、苔(h)、咳(i)分別構(gòu)成知識的3個約簡,而口唇、呼吸2個決策屬性被約簡,可以舍棄。在臨床診斷上,應(yīng)重點關(guān)注脈、舌、痰3個四診信息。
本研究的數(shù)據(jù)樣本不夠充足,具有一定的局限性;本研究為回顧性研究,受醫(yī)生的水平、臨床經(jīng)驗等因素影響,特別是在脈象的分類上存在差異。但分辨矩陣方法的應(yīng)用上是嚴謹?shù)?,可在前瞻性研究上加以推廣。
[1]蘇式兵,嚴廣樂.關(guān)于中醫(yī)復雜系統(tǒng)研究的思考[J].上海中醫(yī)藥大學學報,2009,23(1):13-16.
[2]梅燦華,孟慶全.數(shù)字化中醫(yī)胃病診斷方法研究[J].安徽中醫(yī)學院學報,2008,27(3):7-9.
[3]Meng QQ. New method of discernibility matrix formation[J]. Adv Mater Res, 2013(765-767):477-481.
[4]國家中醫(yī)藥管理局.中醫(yī)病證診斷療效標準[M].南京:南京大學出版社,1994:2-7.
PreliminaryStudyonReductionofTraditionalChineseMedicineSyndromeDifferentiationFactorsbyDiscernibilityMatrixMethod
MENGQing-quan1,ZHANGNian-zhi2
(1.InstituteofMedicalInformationEngineering,AnhuiUniversityofChineseMedicine,AnhuiHefei230012,China; 2.TheFirstAffiliatedHospitalofAnhuiUniversityofChineseMedicine,AnhuiHefei230031,China)
ObjectiveTo reduce the syndrome differentiation factors for chronic bronchitis by discernibility matrix method.MethodsOne hundred patients with chronic bronchitis were included in the study. Preliminary digitization, data preprocessing, and exploratory data mining were performed on eight decision attributes, i.e., lip, fever, breath, pulse, tongue, coating on the tongue, cough, and phlegm, to obtain the simplest rule.ResultsAmong the decision attributes, pulse, tongue, and phlegm were core ones, but lip and breath were deleted.ConclusionThe minimal decision rule for syndrome differentiation of chronic bronchitis can be acquired by discernibility matrix method, which can be used as a novel method for the digitization of traditional Chinese medicine diagnosis.
chronic bronchitis;syndrome differentiation factor;discernibility matrix;reduction;decision rule
安徽中醫(yī)學院自然科學研究基金項目(2012zr012)
孟慶全(1964-),男,副教授,碩士研究生導師
TP18;R241
A
10.3969/j.issn.2095-7246.2014.06.008
2013-09-06)