計(jì) 衛(wèi) 胡水蓮 吳國棟 羅 明 葉楊林 毛怡潔
數(shù)據(jù)挖掘(Data mining),又稱為信息勘探、數(shù)據(jù)采掘,是從大量的數(shù)據(jù)中通過多種算法搜索隱藏于其中有用信息的過程,也可稱之為知識發(fā)現(xiàn)(Knowledge Discovery in Database)。醫(yī)學(xué)數(shù)據(jù)挖掘是從大量的臨床數(shù)據(jù)中抽取潛在的、有價(jià)值的知識,它可直接發(fā)現(xiàn)疾病及癥狀間的未知聯(lián)系,探索化驗(yàn)指標(biāo)與疾病間的潛在影響,以及合并癥之間的關(guān)系[1]。
疾病診斷在醫(yī)學(xué)中關(guān)系著患者的用藥及治療方案的制定,是臨床醫(yī)療活動(dòng)關(guān)鍵的一步。由于許多疾病病因復(fù)雜,患者的臨床表現(xiàn)個(gè)體差異比較大,容易誤診[2],以往多依靠臨床有經(jīng)驗(yàn)的醫(yī)生與一些檢測方法來作出正確的診斷,而對經(jīng)驗(yàn)不足的醫(yī)學(xué)生而言診斷結(jié)果誤差比較大。近年來隨著電子技術(shù)與計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)廣泛用于疾病診斷教學(xué)中[3],從而使醫(yī)學(xué)生對患者的診斷準(zhǔn)確率大幅度提高。
本研究以高血壓病、冠心病為教學(xué)模版,利用計(jì)算機(jī)建立高血壓病、冠心病中西醫(yī)診斷數(shù)據(jù)庫,采用數(shù)據(jù)挖掘技術(shù),建立高血壓病、冠心病正確診斷的查詢系統(tǒng),提供醫(yī)學(xué)生對高血壓病、冠心病的診斷查詢,從而大幅度提高了高血壓病、冠心病診斷的臨床教學(xué)質(zhì)量。
1.1 一般資料選擇2017屆中西醫(yī)結(jié)合醫(yī)師班進(jìn)入臨床實(shí)習(xí)階段的學(xué)生100例,按隨機(jī)數(shù)字表法分成接受數(shù)據(jù)挖掘教學(xué)組(觀察組)50例,男28例,女22例;年齡16~18歲。接受常規(guī)教學(xué)組(對照組)50例,男26例,女24例;年齡16~19歲。
1.2 常規(guī)教學(xué)方法采用紙質(zhì)書本,課堂老師講述西醫(yī)高血壓病、冠心病診斷標(biāo)準(zhǔn),檢查方法,中醫(yī)證候要素診斷方法。通過學(xué)生到醫(yī)院實(shí)習(xí),了解高血壓病、冠心病的診斷與實(shí)驗(yàn)室、影像室檢查的項(xiàng)目及其檢查結(jié)果的正常與異常標(biāo)準(zhǔn)值,學(xué)習(xí)高血壓病、冠心病臨床中西醫(yī)診斷的方法與措施。
1.3 數(shù)據(jù)挖掘教學(xué)法
1.3.1 高血壓病(1)高血壓病診斷標(biāo)準(zhǔn)與分級[4]。理想血壓:收縮壓<120 mm Hg(1 mm Hg≈0.133 kPa),舒張壓<80 mm Hg。正常血壓:收縮壓<130 mm Hg,舒張壓<85 mm Hg;正常高值:收縮壓130~ 139 mm Hg,舒張壓85~ 89 mm Hg;1級高血壓(輕度):收縮壓140~ 159 mm Hg,舒張壓90~ 99 mm Hg;亞組:臨界高血壓:收縮壓140~ 149 mm Hg,舒張壓90~ 94 mm Hg;2級高血壓(中度):收縮壓160~179 mm Hg,舒張壓100~109 mm Hg:3級高血壓(重度):收縮壓≥180 mm Hg,舒張壓≥110 mm Hg;單純收縮性高血壓:收縮壓≥ 140 mm Hg,舒張壓<90 mm Hg。(2)高血壓病常見的中醫(yī)證型診斷指標(biāo)[5]。肝氣郁結(jié)證、 肝火上炎證、陰虛陽亢證、痰濕壅盛證、痰瘀互結(jié)證、腎陽虛證、腎陰陽兩虛證、肝腎陰虛證的臨床表現(xiàn)。(3)高血壓病分期[6]。一期:血壓達(dá)確診高血壓水平,臨床無心、腦、腎損害征象。二期:血壓達(dá)確診高血壓水平,并有下列一項(xiàng)者:①體檢、X線、心電圖或超聲心動(dòng)圖示左心室擴(kuò)大。②眼底檢查,眼底動(dòng)脈普遍或局部狹窄。③蛋白尿或血漿肌酐濃度輕度增高。三期:血壓達(dá)確診高血壓水平,并有下列一項(xiàng)者:①腦出血或高血壓腦病。②心力衰竭。③腎功能衰竭。④眼底出血或滲出,伴或不伴有視神經(jīng)乳頭水腫。⑤心絞痛,心肌梗塞,腦血栓形成。(4)高血壓病分型。①原發(fā)性高血壓:病因不明的高血壓。②繼發(fā)性高血壓:腎臟疾病,如慢性腎炎、腎盂腎炎及其他原因引起的腎功能不全;腎上腺疾患,如原發(fā)性醛固酮增多癥、庫興氏綜合癥、嗜鉻細(xì)胞瘤等;腎血管疾患,如各種原因引起的腎動(dòng)脈狹窄。大血管疾患,如先天性主動(dòng)脈縮窄、動(dòng)脈粥樣硬化或多發(fā)性大動(dòng)脈炎引起的主動(dòng)脈狹窄等;心臟疾患,如嚴(yán)重的主動(dòng)脈瓣關(guān)閉不全、完全性房室傳導(dǎo)阻滯等;某些全身性疾患,如甲狀腺機(jī)能亢進(jìn)、腦血管意外等。某些繼發(fā)性高血壓目前可通過介入手段進(jìn)行治療,這些疾患主要是各種原因的腎動(dòng)脈狹窄及先天性主動(dòng)脈縮窄。③小兒高血壓。④妊娠高血壓綜合征(妊娠中毒癥、先兆子癇),多數(shù)發(fā)生在妊娠20周與產(chǎn)后2周,約占所有孕婦的5%。⑤老年收縮期高血壓。60歲以上的老年人收縮壓高于正常水平。
1.3.2 冠心病(1)冠心病患者的一般情況。年齡、性別、身高、體質(zhì)量、吸煙史、飲酒史、冠心病家族史、糖尿病家族史、體質(zhì)量指數(shù)[BMI=體質(zhì)量(kg)/身高(m2)]。(2)冠心病心絞痛中醫(yī)常見證候要素診斷[7,8]。氣虛、血瘀、痰濁胸悶痛、陽虛、氣滯、熱蘊(yùn)、寒凝的臨床表現(xiàn)。(3)冠心病的理化檢查指標(biāo)[9]。白細(xì)胞計(jì)數(shù)、淋巴細(xì)胞百分比、中性粒細(xì)胞計(jì)數(shù)、單核細(xì)胞計(jì)數(shù)、血清磷前白蛋白、餐后2 h血糖、糖化血紅蛋白、三酰甘油、低密度脂蛋白、肌酸激酶同工酶、RV 5、QRS時(shí)限、R+S、射血分?jǐn)?shù)、左室舒張末期內(nèi)徑、左室收縮末期內(nèi)徑、肺動(dòng)脈最大流速;細(xì)胞分布寬度(RDW-CV),血清同型半胱氨酸(HCY),脂蛋白a(LP(a))高水平的RDW-CV,HCY和LP(a)與冠心病的發(fā)生密切相關(guān);RDW-CV和HCY與冠心病及心功能損害的嚴(yán)重程度相關(guān)。(4)冠心病的影像檢查[10]冠心病血管造影、多層螺旋CT血管管徑狹窄<50%為輕度狹窄;血管管徑狹窄50%~74%為中度狹窄;血管管徑狹窄≥75%為重度狹窄;血管管徑狹窄范圍接近100%為完全閉塞。以冠狀動(dòng)脈狹窄≥50%為陽性。(5)冠心病心功能NYHA標(biāo)準(zhǔn)。Ⅰ級;患者在正常的活動(dòng)中不產(chǎn)生心悸、呼吸困難、胸悶等癥狀;Ⅱ級:正常的活動(dòng)中產(chǎn)生心悸、胸悶、呼吸困難,并且感受到體力有所下降;Ⅲ級:正常的活動(dòng)中產(chǎn)生心悸、胸悶、呼吸困難,并且感受到體力有所下降;Ⅳ級:患者稍微的運(yùn)動(dòng)后就開始產(chǎn)生心悸、胸悶、呼吸困難,體力出現(xiàn)明顯下降。(6)心絞痛分級:CCSC加拿大心血管協(xié)會分級法。Ⅰ級:日?;顒?dòng),如步行、爬梯,無心絞痛發(fā)作;Ⅱ級:日?;顒?dòng)因心絞痛而輕度受限;Ⅲ級:日?;顒?dòng)因心絞痛發(fā)作而明顯受限;Ⅳ級:任何體力活動(dòng)均可導(dǎo)致心絞痛發(fā)作。(7)心力衰竭分級。Ⅰ級:一般體力活動(dòng)不受限,活動(dòng)后不引起呼吸困難、乏力等不適癥狀。Ⅱ級:一般體力活動(dòng)輕度受限,但休息后癥狀可有緩解。Ⅲ級:一般體力活動(dòng)明顯受限,活動(dòng)后既有可能出現(xiàn)呼吸困難,乏力。Ⅳ級:患者靜息狀態(tài)下也會出現(xiàn)心衰癥狀,尤其在活動(dòng)后加重。
1.4 建立高血壓病、冠心病診斷要素?cái)?shù)據(jù)庫在三甲醫(yī)院電子病歷檔案室,選擇2014—2016年高血壓病、冠心病確診患者1000例,具有完整檔案記錄的電子檔案,將其中西醫(yī)的檢查指標(biāo)身高、體質(zhì)量及腰圍、血壓、血糖、血脂、血流變、心電圖、心功能、肺功能、肝功能、腎功能,腎臟B超、CT、核磁共振、血管造影、實(shí)驗(yàn)室等有關(guān)高血壓病、冠心病及其并發(fā)癥的各項(xiàng)相關(guān)指標(biāo)選入。中醫(yī)將高血壓病、冠心病的舌診(白厚苔、白薄苔;黃厚苔、黃薄苔),證候要素診斷(脈象、舌苔、體征)等選入,根據(jù)以上中西醫(yī)對高血壓病、冠心病的中西醫(yī)診斷標(biāo)準(zhǔn),建立高血壓病、冠心病診斷要素?cái)?shù)據(jù)庫。
1.5 數(shù)據(jù)的預(yù)處理采用決策樹挖掘技術(shù),進(jìn)行數(shù)據(jù)的理解、屬性選擇、連續(xù)屬性離散化、數(shù)據(jù)中的噪聲及丟失值處理、實(shí)例選擇等。數(shù)據(jù)挖掘過程:(1)將原咨詢系統(tǒng)的各版塊內(nèi)容進(jìn)行知識抽取,作為標(biāo)引詞放到軟件設(shè)計(jì)好的位置;(2)知識術(shù)語標(biāo)準(zhǔn)化,同時(shí)設(shè)計(jì)術(shù)語同義詞的轉(zhuǎn)化;(3)通過 Microsoft SQL serve提供一個(gè)整合環(huán)境,這個(gè)環(huán)境采用數(shù)據(jù)庫挖掘模式操作和工作,從而進(jìn)行數(shù)據(jù)挖掘和空間知識鏈接;(4)挖掘過程:發(fā)現(xiàn)概念、類的描述、關(guān)聯(lián)、分類、預(yù)測、聚類、趨勢分析、類似分析;(5)決策樹,按照數(shù)據(jù)庫的分類,三維結(jié)構(gòu)表達(dá)一組決策,特殊決策包括分類、回歸樹、chi平面自動(dòng)相互作用檢驗(yàn)[11]。
1.6 高血壓病、冠心病診斷查詢系統(tǒng)通過數(shù)據(jù)預(yù)處理,獲得一個(gè)高血壓病、冠心病診斷的決策表,經(jīng)過專家的測試,高血壓病、冠心病的診斷正確率達(dá)到90%以上,生成決策樹、導(dǎo)出決策規(guī)則,形成高血壓病、冠心病診斷查詢系統(tǒng)。
1.7 教學(xué)方法的效果評價(jià)選擇已收集的高血壓病、冠心病患者若干例,每例患者分別由數(shù)據(jù)挖掘組的學(xué)生(通過實(shí)習(xí)的經(jīng)驗(yàn)與利用高血壓病、冠心病診斷查詢系統(tǒng)輔助診斷)、常規(guī)教學(xué)組學(xué)生(通過實(shí)習(xí)的經(jīng)驗(yàn)與患者臨床表現(xiàn)與實(shí)驗(yàn)室、影像室檢查的結(jié)果)作出診斷,然后根據(jù)診斷結(jié)果(高血壓病分級、高血壓病分期、高血壓病合并癥、高血壓病中醫(yī)證型;冠心病的診斷、冠心病心絞痛、心功能、心衰的分級、冠心病中醫(yī)證型等),對照原始病歷的診斷,作出符合(對)與不符合(錯(cuò))的結(jié)論。將所有受試的學(xué)生最后的診斷結(jié)果,利用符合與不符合進(jìn)行列表統(tǒng)計(jì)學(xué)處理,得出數(shù)據(jù)挖掘組、常規(guī)教學(xué)組學(xué)生診斷結(jié)果的差異。
1.8 統(tǒng)計(jì)學(xué)方法采用SPSS 18.0統(tǒng)計(jì)學(xué)軟件包計(jì)算,計(jì)數(shù)資料采用率(%)表示,行χ2檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 高血壓病診斷考評結(jié)果2組學(xué)生對高血壓糖尿病的診斷符合率差異沒有統(tǒng)計(jì)學(xué)意義外,對高血壓病診斷、高血壓病分級、分期、高血壓腦梗死、高血壓腦溢血、高血壓心臟病的診斷符合率差異均有統(tǒng)計(jì)學(xué)意義。見表1。
表1 2組學(xué)生對高血壓病患者診斷結(jié)果比較 (例,%)
2.2 高血壓病中醫(yī)證型診斷考評結(jié)果2組學(xué)生對高血壓病肝氣郁結(jié)證、 肝火上炎證、陰虛陽亢證、痰濕壅盛證、痰瘀互結(jié)證、腎陽虛證、腎陰陽兩虛證、肝腎陰虛證的證型診斷結(jié)果符合率比較,差異有顯著的統(tǒng)計(jì)學(xué)意義。見表2。
表2 2組學(xué)生對高血壓病患者中醫(yī)辨證分型結(jié)果比較 (例,%)
2.3 冠心病診斷考評結(jié)果2組學(xué)生對無癥狀型、心絞痛型、混合型、心肌梗死型、心力衰竭、心律失常型、猝死型冠心病的診斷結(jié)果符合率比較,差異有非常顯著的統(tǒng)計(jì)學(xué)意義。見表3。
表3 2組學(xué)生對冠心病患者診斷結(jié)果比較 (例,%)
2.4 冠心病中醫(yī)證型診斷考評結(jié)果2組學(xué)生對氣虛、血瘀、痰濁胸悶痛、陽虛、氣滯、熱蘊(yùn)、寒凝冠心病的診斷符合率差異均有顯著的統(tǒng)計(jì)學(xué)意義。見表4。
表4 2組學(xué)生對冠心病患者中醫(yī)辨證分型結(jié)果比較 (例,%)
醫(yī)學(xué)數(shù)據(jù)挖掘是從預(yù)先建立的相關(guān)醫(yī)學(xué)專業(yè)數(shù)據(jù)庫中提取出所需的、有用的、有效的專業(yè)數(shù)據(jù),這些數(shù)據(jù)能幫助醫(yī)務(wù)人員提高診療水平的高級處理過程。數(shù)據(jù)挖掘技術(shù)有很多種,常用的技術(shù)有統(tǒng)計(jì)技術(shù)、關(guān)聯(lián)規(guī)則、決策樹、神經(jīng)網(wǎng)絡(luò)、粗糙集、遺傳算法等,本研究采用決策樹數(shù)據(jù)挖掘技術(shù)[12],通過我們收集的高血壓病、冠心病中西醫(yī)診斷數(shù)據(jù)集進(jìn)行計(jì)算后構(gòu)建決策樹模型,提取分類規(guī)則,實(shí)現(xiàn)關(guān)聯(lián)分析、分類、聚類、預(yù)測、時(shí)序模式和偏差檢測等數(shù)據(jù)挖掘的功能,進(jìn)行高血壓病、冠心病離散數(shù)據(jù)的關(guān)聯(lián)分析后,與專家診斷的結(jié)果對比分析,最終形成人們易于理解的診斷結(jié)果,而這些診斷的正確率不低于或高于專家診斷的結(jié)果[13-15]。
診斷在醫(yī)學(xué)臨床中對患者的用藥及治療方法的制定至關(guān)重要,許多疾病比較復(fù)雜,診斷相對繁瑣。數(shù)據(jù)挖掘融入疾病診斷中,使得醫(yī)生對患者的診斷準(zhǔn)確率大幅度提高,尤其是對新手醫(yī)生與醫(yī)學(xué)生而言起到了輔助診斷功能。本研究的目的是通過數(shù)據(jù)挖掘技術(shù)建立高血壓病與冠心病中西醫(yī)診斷查詢系統(tǒng),幫助中西醫(yī)班的醫(yī)學(xué)生在臨床經(jīng)驗(yàn)不足的情況下,盡快掌握高血壓病與冠心病中西醫(yī)診斷技術(shù),特別是中醫(yī)辨證分型診斷,它是根據(jù)不同人的不同體質(zhì)在同種疾病中臨床癥狀卻表現(xiàn)完全不同的特點(diǎn)而形成的中醫(yī)獨(dú)特診斷方法,一般要經(jīng)過醫(yī)生在臨床實(shí)踐中多年積累的豐富經(jīng)驗(yàn)才能做出比較正確的診斷結(jié)論。本研究采用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),將我國高血壓病、冠心病的中醫(yī)辨證分型比較成功的經(jīng)驗(yàn)[16]、西醫(yī)高血壓病、冠心病的實(shí)驗(yàn)室、影像診斷指標(biāo)全部輸入數(shù)據(jù)庫,采用決策樹中的聚類技術(shù),將高血壓、冠心病的相關(guān)數(shù)據(jù)進(jìn)行聚類,然后通過關(guān)聯(lián)分析,與經(jīng)驗(yàn)診斷匹配,建立高血壓病、冠心病中西醫(yī)診斷查詢系統(tǒng)。醫(yī)學(xué)生采集患者的數(shù)據(jù)后,將患者的臨床表現(xiàn)與實(shí)驗(yàn)室、影像檢查結(jié)果輸入查詢系統(tǒng),獲得患者的診斷結(jié)果。
為驗(yàn)證數(shù)據(jù)挖掘教學(xué)法的效果,研究通過2組學(xué)生對高血壓病分級、高血壓病分期、高血壓病合并癥、高血壓病中醫(yī)證型;冠心病的診斷、冠心病心絞痛、心功能、心衰的分級、冠心病中醫(yī)證型診斷符合率的測評結(jié)果,評價(jià)數(shù)據(jù)挖掘教學(xué)法的教學(xué)質(zhì)量是否優(yōu)于常規(guī)教學(xué)法。測評結(jié)果顯示,觀察組的學(xué)生在心肌梗死型冠心病、心力衰竭、心律失常型冠心病以及高血壓病與冠心病的中醫(yī)辨證分型診斷中,符合率遠(yuǎn)遠(yuǎn)高于常規(guī)教學(xué)的對照組。心肌梗死型冠心病、心力衰竭、心律失常型冠心病,光靠臨床癥狀比較難判斷,需要CT、核磁共振、血管造影、實(shí)驗(yàn)室等有關(guān)指標(biāo)綜合起來作出診斷結(jié)論,對沒有臨床經(jīng)驗(yàn)的學(xué)生難度比較大。而高血壓病與冠心病的中醫(yī)辨證分型診斷屬中醫(yī)中的微診斷,臨床表現(xiàn)錯(cuò)綜復(fù)雜,并有交叉出現(xiàn)的情況,如肝氣郁結(jié)證高血壓病=頭脹+胸悶+情志抑郁+精神不振+頭痛+頭暈+腹脹+脅肋脹痛+納呆+大便不利+面色萎黃+舌質(zhì)淡紅+舌苔薄白+脈弦;氣虛型冠心病患者以臨床表現(xiàn)為:胸悶或痛勞則誘發(fā)、神疲、乏力、氣短、自汗、脈弱、舌淡胖或有齒痕、心悸為標(biāo)準(zhǔn)特征[17-19]。但有的患者不是這些癥狀都有,有的患者可能其中有些癥狀不一樣,沒有經(jīng)驗(yàn)的學(xué)生通過把脈,很難診斷,而通過數(shù)據(jù)挖掘技術(shù)建立的診斷查詢系統(tǒng),它可通過輸入患者的癥狀,與肝氣郁結(jié)證高血壓病、氣虛型冠心病的主癥與輔癥比較,再與老中醫(yī)的檢驗(yàn)匹配,經(jīng)過聚類、關(guān)聯(lián)分析,得出比較正確的診斷結(jié)論,因此數(shù)據(jù)挖掘組的學(xué)生高血壓病、冠心病的中醫(yī)辨證分型的符合率遠(yuǎn)遠(yuǎn)高于常規(guī)教學(xué)組的學(xué)生。
高血壓病、冠心病診斷查詢系統(tǒng)通過臨床診療智能決策支持系統(tǒng)將臨床路徑和臨床指南中關(guān)于高血壓病、冠心病的標(biāo)準(zhǔn)、知識、規(guī)則和流程引入中西醫(yī)臨床教學(xué)活動(dòng)中,針對醫(yī)學(xué)生臨床經(jīng)驗(yàn)少、專業(yè)知識運(yùn)用不靈活、較少直接參與臨床診療活動(dòng)的特點(diǎn),該高血壓病、冠心病診斷智能決策支持系統(tǒng)可以通過模擬真實(shí)病例場景,使醫(yī)學(xué)生深化對醫(yī)學(xué)知識的理解,掌握疾病的標(biāo)準(zhǔn)診療流程,迅速提高個(gè)人臨床診療能力。