許玉龍 盛夢(mèng)園 王哲 王曉輝 呂雅麗 修沁
摘要:目的 ?探討不同無監(jiān)督數(shù)據(jù)分析方法分析中醫(yī)證候的效果差異。方法 ?基于臨床采集的肝炎肝硬化患者中醫(yī)癥狀數(shù)據(jù),比較層次聚類、因子分析、復(fù)雜網(wǎng)絡(luò)、K-means方法從癥狀和患者角度分析中醫(yī)癥狀數(shù)據(jù)、挖掘其潛在規(guī)律、根據(jù)醫(yī)學(xué)知識(shí)對(duì)數(shù)據(jù)分類及歸納得到證候的差異。結(jié)果 ?從癥狀角度分析,層次聚類基于癥狀變量之間的距離關(guān)系進(jìn)行聚類,能反映近似的癥狀從而推導(dǎo)出證候;因子分析用降維尋求少數(shù)潛在變量來綜合反映原始指標(biāo)的大部分信息,能反映出證候的主要癥狀。但這2種方法都無法將一癥狀同時(shí)歸納到多個(gè)證候,不適合臨床實(shí)際中某癥狀屬于多種證候的情況。復(fù)雜網(wǎng)絡(luò)通過癥狀及癥狀的關(guān)系構(gòu)建網(wǎng)絡(luò),較適合于對(duì)某種確定證候所涉及的癥狀進(jìn)行分析,但不太適合對(duì)證候的推導(dǎo)與辨證。從患者角度分析,層次聚類和K-means對(duì)患者人群聚類后,可把相似的患者聚為一類,但不能同時(shí)從多個(gè)側(cè)面進(jìn)行聚類,即無法體現(xiàn)一個(gè)患者同時(shí)具有多種證候,不適合實(shí)際臨床中的多種證候兼夾情況;對(duì)比專家組經(jīng)驗(yàn)并分析頻次發(fā)現(xiàn),二者聚類結(jié)果一般。結(jié)論 ?使用常規(guī)數(shù)據(jù)挖掘方法分析中醫(yī)數(shù)據(jù),在挖掘從癥狀到證候的關(guān)系時(shí),單個(gè)方法能完成單一角度分析,但無法同時(shí)滿足癥狀屬于多種證候、患者具有多種證候的兼夾情況等多角度分析,需要改進(jìn)或嘗試采用新的方法研究從癥狀到證候的數(shù)據(jù)挖掘問題。
關(guān)鍵詞:層次聚類;因子分析;復(fù)雜網(wǎng)絡(luò);K-means;中醫(yī)證候
中圖分類號(hào):R241;R2-05 ???文獻(xiàn)標(biāo)識(shí)碼:A ???文章編號(hào):1005-5304(2019)12-0097-06
DOI:10.3969/j.issn.1005-5304.2019.12.020 ?開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Comparative Study on Data Mining Methods for Analysis on TCM Syndromes
XU Yulong1, SHENG Mengyuan1, WANG Zhe1, WANG Xiaohui1, LYU Yali1, XIU Qin2
1. Institute of Information and Technology, Henan University of Chinese Medicine, Zhengzhou 450046, China; 2. Tingzhou Hospital of Fujian Province, Longyan 366300, China
Abstract: Objective To explore the differences in the effects of different unsupervised data analysis methods in the analysis on TCM syndromes. Methods?Based on the collected clinical data?of TCM symptoms of hepatitis cirrhosis?patients, four methods including hierarchical clustering, factor analysis, complex networks and K-means were compared to analyze TCM symptom data, mine potential rules, classify data according to medical knowledge and conclude syndromes from the perspective of symptoms and patients. Results?From the perspective of symptom analysis, hierarchical clustering considered the distance relationship between symptom variables to cluster, which could reflect the approximate symptoms and derive the syndromes; Factor analysis used dimension reduction to find a small number of potential variables to comprehensively reflect most of the information of the original indicators, which could reflect the main symptoms of syndromes. However, neither of these methods could summarize a symptom into multiple syndromes at the same time, and was suitable for the?situation in which a certain symptom belonged to multiple syndromes in clinical practice. Complex networks built networks through the symptoms and their relationship, which were more suitable for analyzing the symptoms involved in some certain syndromes, but were not suitable for the derivation and differentiation of syndromes. From the perspective of patients, hierarchical clustering and K-means clustered patients and grouped similar patients into one category, but could not cluster from multiple aspects at the same time. That meaned, it?could not reflect a patient with multiple syndromes at the same
time, and then was not suitable for a variety of syndromes in the actual clinical situation; By comparing the experience of the expert group and analyzing the frequency, it was found that the results of the two clusters were mediocre. Conclusion?In the case of using conventional data mining methods to analyze TCM data, a single method can finish analysis with a single angle when mining the relationship from symptom to syndrome. However, it is impossible to simultaneously satisfy multi-angle analysis with the conditions of symptoms belonging to multiple syndromes and patients having multiple syndromes. It is necessary to improve or try to use new methods to study the data mining problem from symptom to syndrome.
????Keywords:?hierarchical clustering; factor analysis; complex networks; K-means; TCM syndromes
中醫(yī)辨證施治的過程,即從癥狀到證候的分析與確定是中醫(yī)診病的關(guān)鍵步驟[1]。但中醫(yī)證候的隱匿性、模糊性等特點(diǎn)導(dǎo)致其診斷過程難以形成統(tǒng)一的標(biāo)準(zhǔn)[2]?,F(xiàn)代技術(shù)研究中醫(yī)證候的常用方法有統(tǒng)計(jì)分析、因子分析、聚類算法等[3]。統(tǒng)計(jì)分析僅能統(tǒng)計(jì)出癥狀出現(xiàn)的次數(shù)、均值、方差等。因子分析把癥狀視為實(shí)數(shù)值變量,并假設(shè)其由一組相互獨(dú)立的實(shí)數(shù)值隱變量(代表證候)通過線性關(guān)系來確定。聚類算法是對(duì)癥狀進(jìn)行分析,并基于數(shù)據(jù)的知識(shí)將其聚成不同的類別[3-6]。隱結(jié)構(gòu)分析是特殊聚類算法[7],依據(jù)統(tǒng)計(jì)學(xué)和概率知識(shí)對(duì)癥狀數(shù)據(jù)分析,找出隱變量并建立相應(yīng)隱結(jié)構(gòu)模型,然后依據(jù)模型對(duì)患者進(jìn)行聚類劃分。
筆者基于肝炎肝硬化患者的中醫(yī)臨床癥狀數(shù)據(jù),采用層次聚類、因子分析、復(fù)雜網(wǎng)絡(luò)、K-means方法,分別從癥狀和患者角度挖掘證候,并參考專家組經(jīng)驗(yàn)辨證結(jié)果,將挖掘結(jié)果分析對(duì)比,探討不同方法在中醫(yī)證候挖掘中的合理性,為相關(guān)研究提供參考。
1 ?幾種數(shù)據(jù)挖掘方法簡(jiǎn)介
1.1 ?層次聚類
層次聚類分為分裂法和凝聚法。常用的是凝聚法[8],即由下向上對(duì)小的類別進(jìn)行聚合,其基本過程為:①給定要聚類的N個(gè)對(duì)象及N×N的距離矩陣(或相似性矩陣)。②將每個(gè)對(duì)象歸為一類,共得到N類,每類僅包含1個(gè)對(duì)象,類與類之間的距離就是它們所包含對(duì)象的距離。③找到最接近的2個(gè)類合并為一類,類的總數(shù)減少1個(gè)。④重新計(jì)算新類與所有舊類之間的距離。⑤重復(fù)③④,直到最后合并為1個(gè)類為止(此類包含了N個(gè)對(duì)象),樹的頂層是聚類的根節(jié)點(diǎn),根節(jié)點(diǎn)覆蓋了全部的數(shù)據(jù)點(diǎn)。層次聚類的優(yōu)點(diǎn)是可以一次性得到整個(gè)聚類過程,缺點(diǎn)是計(jì)算量較大,分析大數(shù)據(jù)時(shí),花費(fèi)時(shí)間較長(zhǎng)。
1.2 ?因子分析
因子分析是從分析多個(gè)原始指標(biāo)的相關(guān)關(guān)系入手,找到支配這種關(guān)系有限的不可觀測(cè)的潛在變量,即公因子,并用這些潛在變量來解釋原始指標(biāo)之間相關(guān)性的多元統(tǒng)計(jì)分析方法[9-10]。換言之,因子分析是用降維視角,從多個(gè)原始指標(biāo)的相關(guān)系數(shù)矩陣出發(fā),探索能綜合大部分指標(biāo)信息的獨(dú)立潛在變量,即尋求少數(shù)的幾個(gè)變量來綜合反映所有變量信息。因子分析是多元統(tǒng)計(jì)分析中的一個(gè)重要方法,其特點(diǎn)是消除癥狀的多元共線性,對(duì)癥狀進(jìn)行降維。
1.3 ?復(fù)雜網(wǎng)絡(luò)
復(fù)雜網(wǎng)絡(luò)是對(duì)現(xiàn)實(shí)生活中事務(wù)的抽象表達(dá),是圖的一種重要應(yīng)用[11]。復(fù)雜網(wǎng)絡(luò)中用圖的頂點(diǎn)表示實(shí)體,用邊表示實(shí)體之間的聯(lián)系,隨著數(shù)據(jù)量的增加,實(shí)體之間的聯(lián)系更為錯(cuò)綜復(fù)雜,便形成了高度復(fù)雜的網(wǎng)絡(luò)。復(fù)雜網(wǎng)絡(luò)的優(yōu)點(diǎn)是可以顯示絕大部分的聯(lián)系;缺點(diǎn)是復(fù)雜度高,不宜觀察和分析。復(fù)雜網(wǎng)絡(luò)采用網(wǎng)絡(luò)化建模研究復(fù)雜現(xiàn)象,把每個(gè)癥狀看作節(jié)點(diǎn),癥狀之間的關(guān)系看作邊,癥狀及其之間的關(guān)系便可以用復(fù)雜網(wǎng)絡(luò)來描述[11]。通過分類、篩選等分析方法對(duì)網(wǎng)絡(luò)圖進(jìn)一步分析,可以挖掘中醫(yī)數(shù)據(jù)的潛在信息。
1.4 ?K-means
K-means算法是基于距離的劃分聚類算法,通過不斷地迭代和重新計(jì)算聚類中心,直至收斂進(jìn)行聚類[12-13]。其步驟為[13]:①?gòu)膎個(gè)數(shù)據(jù)對(duì)象任意選擇k個(gè)對(duì)象作為初始聚類中心。②根據(jù)每個(gè)聚類對(duì)象的均值(中心對(duì)象),計(jì)算每個(gè)對(duì)象與這些中心對(duì)象的距離;并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分。③重新計(jì)算每個(gè)(有變化)聚類的均值(中心對(duì)象)。④當(dāng)每個(gè)類不再發(fā)生變化時(shí),結(jié)束,n個(gè)數(shù)據(jù)對(duì)象被劃分為k類;否則,跳轉(zhuǎn)到②。K-means算法的優(yōu)點(diǎn)是快速、簡(jiǎn)單、效率高,缺點(diǎn)是聚類效果受K值的影響,需事先給定K值,當(dāng)它難以預(yù)估時(shí)聚類效果不理想。
2 ?數(shù)據(jù)來源
本研究采用肝炎肝硬化患者的臨床數(shù)據(jù),數(shù)據(jù)來源于2011年11月-2012年9月在解放軍302醫(yī)院、湖北省中醫(yī)院、首都醫(yī)科大學(xué)附屬北京地壇醫(yī)院、首都醫(yī)科大學(xué)附屬北京佑安醫(yī)院、北京中醫(yī)藥大學(xué)東方醫(yī)院、中國(guó)中醫(yī)科學(xué)院西苑醫(yī)院、首都醫(yī)科大學(xué)附屬北京中醫(yī)醫(yī)院及廣西中醫(yī)藥大學(xué)第一附屬醫(yī)院的門診或住院患者。選取100例,每例有97個(gè)癥狀變量,包含舌象變量22個(gè),脈象變量11個(gè)。數(shù)據(jù)原始編號(hào)為采集數(shù)據(jù)時(shí)的患者編號(hào),為方便數(shù)據(jù)分析,將數(shù)據(jù)重新編號(hào)為0、1、2……
課題組參照現(xiàn)行的肝硬化診療共識(shí)、指南及指導(dǎo)原則[14-17],結(jié)合前期文獻(xiàn)回顧和臨床調(diào)查結(jié)果,再經(jīng)多位臨床肝病專家進(jìn)行論證后,形成《肝炎肝硬化常見證候要素辨識(shí)標(biāo)準(zhǔn)》。參照標(biāo)準(zhǔn)對(duì)患者是否存在氣虛證、氣滯證、熱證、濕證、水停證、血瘀證、陽(yáng)虛證、陰虛證共8個(gè)基本證候要素進(jìn)行判定,結(jié)果用0和1表示。數(shù)據(jù)除編號(hào)列外,其他列中1代表有此證候或癥狀,0代表沒有此證候或癥狀。在聚類分析時(shí),專家組辨證結(jié)果不參與計(jì)算,僅作為理論值,驗(yàn)證不同方法的分析效果。專家組由北京中醫(yī)藥大學(xué)、河南中醫(yī)藥大學(xué)中醫(yī)診斷學(xué)的多名教授學(xué)者組成。
3 ?不同方法從癥狀劃分角度挖掘數(shù)據(jù)
3.1 ?層次聚類
從癥狀劃分角度對(duì)數(shù)據(jù)進(jìn)行層次聚類,聚類效果見圖1。層次聚類先自動(dòng)聚成樹狀圖,然后根據(jù)需要對(duì)數(shù)據(jù)進(jìn)行分類,圖連接度采用complete-linkage[8],圖中縱坐標(biāo)0~96代表癥狀,橫坐標(biāo)代表不同類之間的距離。將圖1劃分為8個(gè)類,依據(jù)其對(duì)應(yīng)的癥狀信息和中醫(yī)知識(shí),推導(dǎo)出的證候見表1。聚類結(jié)果把同類近似的癥狀劃分在一起,推導(dǎo)出相關(guān)證候。臨床上某一癥狀往往會(huì)出現(xiàn)在多種證候中,但該方法無法將某個(gè)癥狀同時(shí)劃分到多個(gè)證候。另外,層次聚類沒有對(duì)主要癥狀和次要癥狀進(jìn)行篩選。
3.2 ?因子分析
將收集到患者四診信息進(jìn)行頻率分析,篩選得到出現(xiàn)頻率≥30%的癥狀共40個(gè),用于因子分析。進(jìn)行KMO檢驗(yàn)及Bartlett球形檢驗(yàn)以判斷數(shù)據(jù)是否適合進(jìn)行因子分析。若KMO<0.5,則認(rèn)為各變量間相關(guān)性較差,樣本量小,需要擴(kuò)大樣本量;若KMO>0.5,即可認(rèn)為共同因子多,相關(guān)性好,可以進(jìn)行因子分析。Bartlett球形檢驗(yàn)用于檢驗(yàn)相關(guān)矩陣是否為單位矩陣,一般來說,P<0.05表明原始變量之間可能存在有意義的關(guān)系,適合因子分析,P>0.10則表明數(shù)據(jù)不適宜應(yīng)用因子分析。
采用主成分相關(guān)性矩陣法抽取公因子,因子旋轉(zhuǎn)協(xié)方差法,分別對(duì)本研究數(shù)據(jù)進(jìn)行上述檢驗(yàn),得到KMO=0.624,Bartlett球形檢驗(yàn)P=0.000(方差=1581.289,自由度=780),故認(rèn)為可以進(jìn)行因子分析。
采用主成分分析法,40個(gè)癥狀總方差解釋表的表頭信息包括成分、起始特征值(合計(jì)、方差、累積)、提取平方和載入(合計(jì)、方差、累積)、旋轉(zhuǎn)平方和載入(合計(jì))。相應(yīng)的碎石圖見圖2。
根據(jù)總方差解釋表和碎石圖,選擇特征值>1的成分作為公因子。依據(jù)因子結(jié)構(gòu)矩陣(行名為癥狀,列名為13個(gè)公因子編號(hào),值代表載荷系數(shù)),認(rèn)為載荷系數(shù)>0.4的值有意義,提取到13個(gè)公因子的主要癥狀及證候分析,見表2??梢钥闯?,因子分析在對(duì)癥狀解釋時(shí),每個(gè)因子的大部分癥狀可對(duì)應(yīng)1個(gè)或多個(gè)證候,且涉及的病位較少,可見因子分析在提取證候方面具有一定的優(yōu)勢(shì)。但它與層次聚類類似,無法將某個(gè)癥狀同時(shí)劃分到多個(gè)證候,而臨床實(shí)際中一個(gè)癥狀往往會(huì)出現(xiàn)于多種證候中。
3.3 ?復(fù)雜網(wǎng)絡(luò)
借助中醫(yī)藥挖掘系統(tǒng)及復(fù)雜網(wǎng)絡(luò)分析軟件Uci6進(jìn)行數(shù)據(jù)處理和網(wǎng)絡(luò)構(gòu)建[11]。首先利用中醫(yī)藥挖掘系統(tǒng)將數(shù)據(jù)進(jìn)行整理[11],得到相關(guān)的關(guān)系矩陣,見表3。
計(jì)算各癥狀的點(diǎn)度中心度和中介中心度,并使用Newdraw繪制網(wǎng)絡(luò)圖,見圖3。點(diǎn)度中心度比較靠前的主要有乏力、弦脈、潤(rùn)苔、肝掌、面色晦黯、薄苔、急躁易怒等,中介中心度比較靠前有腰膝酸軟、腹水、神疲、乏力、浮腫、急躁易怒、胸悶等,見表4。運(yùn)用Newdraw→Analysis→SubGroup→Factions進(jìn)行分類,并依據(jù)中心度大小顯示節(jié)點(diǎn)情況的可視化圖,共分為8個(gè)子群,見表5。
根據(jù)點(diǎn)度中心度及出現(xiàn)頻率≥30%篩選癥狀。子群一:腹水、神疲、乏力、懶言、自覺發(fā)熱、抑郁、煩躁、急躁易怒、肝掌、肌膚干燥、面色黑、面色晦黯、目澀、目昏、頭暈、胸悶、太息、脅脹、脅痛、胃脘脹滿、腹脹、腰膝酸軟、納呆、厭油膩、口苦、口黏膩、口咽干燥、失眠、尿色深黃、性欲減退、舌色紫黯、舌下絡(luò)脈異常、黃苔、潤(rùn)苔、細(xì)脈、弦脈。辨證為:虛實(shí)夾雜證。子群二:黃疸、舌色紅絳、白苔、薄苔。辨證為:熱證。
可以看出,復(fù)雜網(wǎng)絡(luò)通過癥狀及癥狀的關(guān)系構(gòu)建網(wǎng)絡(luò),只能得出2個(gè)證候,難以推導(dǎo)出多個(gè)不同的證候。該方法較適于對(duì)某種確定證候所涉及的癥狀進(jìn)行分析,根據(jù)中心度值來確定某證候主要與次要的癥狀,但不太適合對(duì)多種證候的推導(dǎo)與辨證。
4 ?不同方法從患者劃分角度挖掘數(shù)據(jù)
4.1 ?層次聚類結(jié)果
從患者角度進(jìn)行層次聚類,聚類過程和結(jié)果與從癥狀劃分方法類似。從聚類結(jié)果來看,得到的8個(gè)類別中,每個(gè)類包含患者個(gè)數(shù)都不相同,且每個(gè)類中的患者大都有多種證候要素兼夾,但聚類結(jié)果只能把該類別歸為一種證候。
但從全局來看,聚類效果較差,原因是1個(gè)患者可能同時(shí)具有多種證候,而層次聚類只能將1個(gè)患者劃分到1個(gè)證候類。與從癥狀劃分的聚類結(jié)果相比,該聚類組Ⅵ與從癥狀劃分的聚類組Ⅰ有較少部分相似;但有些類缺乏較好對(duì)應(yīng),說明層次聚類的2種角度分析結(jié)果既相似又有區(qū)別。
4.2 ?K-means聚類結(jié)果
設(shè)定K=8,K-means算法運(yùn)行后將聚成8類。
參考專家組辨證經(jīng)驗(yàn),8個(gè)聚類組中,除類Ⅰ、Ⅶ外,特別是類Ⅱ和Ⅳ的患者大都有多種證候要素兼夾,無法推斷出某聚類組屬于哪個(gè)類。類Ⅰ和Ⅶ的效果較好,類Ⅰ把濕證和熱證的證候要素聚在一組,但數(shù)量較少;類Ⅶ把血瘀證候要素聚在一起,可以推測(cè)聚類組為血瘀證類。該聚類的類Ⅱ與層次聚類對(duì)患者的類Ⅳ相同;該類Ⅰ與層次聚類對(duì)患者的類Ⅰ相似,因此K-means聚類和層次聚類在對(duì)患者聚類后得到的結(jié)果相似。
由于患者存在多種混合證候,且K-means的聚類效果受K值的影響很大,故嘗試將K值設(shè)為9、10、11類,結(jié)果變化不大,聚類效果仍不理想。整體而言,K-means聚類效果略優(yōu)于層次聚類,但由于大多數(shù)分組存在證候混合情況,而K-means也僅能將患者劃分到一個(gè)類別,所以整體效果不理想。
5 ?小結(jié)
本研究對(duì)比4種不同的無監(jiān)督方法在挖掘中醫(yī)證候時(shí)的差異。①?gòu)陌Y狀劃分角度來看,層次聚類和因子分析能在一定程度上提取證候,但聚類效果一般。復(fù)雜網(wǎng)絡(luò)聚類效果較差,更適合于確定單一證候后,對(duì)該證候所涉及的所有癥狀進(jìn)行分析,不適于多種癥狀-證候的分析。②從對(duì)患者人群劃分角度來看,層次聚類和K-means效果類似,能將相似的患者劃分到一起,但效果一般。因?yàn)椴荒芡瑫r(shí)從多個(gè)側(cè)面進(jìn)行聚類,即無法體現(xiàn)一個(gè)患者同時(shí)具有多種證候,不適合實(shí)際臨床中的多種證候兼夾情況。對(duì)于層次聚類,上述2種角度分析的結(jié)果既相似又有區(qū)別,相比而言,層次聚類從癥狀角度分析得到的結(jié)果更好
由上述可以認(rèn)為,常規(guī)聚類算法在對(duì)癥狀聚類、對(duì)癥狀數(shù)據(jù)劃分時(shí),一個(gè)癥狀只能屬于或不屬于某一個(gè)證候類。所得到的是癥狀變量的類,不是癥狀事件的類,其含義不是一些患者(證候)同時(shí)具有一些癥狀。在實(shí)際情況中,證候是對(duì)患者人群的劃分,用于揭示樣本某方面的特征和性質(zhì),且一個(gè)患者可能同時(shí)具有多種證候,每個(gè)證候都涉及相應(yīng)的多種癥狀。而常規(guī)聚類在對(duì)患者人群劃分時(shí),不能處理證候兼夾情況,無法分析樣本的特征和性質(zhì),不能揭示證候在樣本中的分布規(guī)律。
綜上所述,目前常用的單一數(shù)據(jù)挖掘方法不能同時(shí)滿足分析癥狀屬于多種證候、患者具有多種證候的兼夾情況。需要改進(jìn)、合并多種算法,或嘗試使用其他方法(如隱結(jié)構(gòu)分析方法[7,18])來研究中醫(yī)癥狀到證候的數(shù)據(jù)挖掘問題。
參考文獻(xiàn):
[1] 寇冠軍,唐健元.中醫(yī)證候研究現(xiàn)狀及證候中藥研究關(guān)鍵[J].中藥藥理與臨床,2017,33(4):213-214.
[2] 王階,李海霞,孫占全,等.基于復(fù)雜算法的中醫(yī)證候研究[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2006,29(9):581-585.
[3] 蔡偉達(dá).證候研究中常用的數(shù)據(jù)分析方法的文獻(xiàn)研究及基于隱類的抑郁癥隱變量分析[D].北京:北京中醫(yī)藥大學(xué),2015.
[4] 張連文,周雪忠,陳弢,等.論證候研究中變量聚類結(jié)果的詮釋[J].中國(guó)中醫(yī)藥信息雜志,2007,14(7):102-103.
[5] 魏華鳳,季光,鄭培永.證候診斷規(guī)范化研究的現(xiàn)狀分析[J].中西醫(yī)結(jié)合學(xué)報(bào),2007,5(2):115-121.
[6] 李仁義.數(shù)據(jù)挖掘中聚類分析算法的研究與應(yīng)用[D].成都:電子科技大學(xué),2012.
[7] 王天芳,張連文,趙燕,等.隱結(jié)構(gòu)模型及其在中醫(yī)證候研究中的應(yīng)用[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2009,32(8):519-527.
[8] JOHNSON S C. Hierarchical clustering schemes[J]. Psychometrika, 1967,32(3):241-254.
[9] 于小林,張艷霞,張曉梅.基于因子分析法的重癥肺炎中醫(yī)證候分布及演變規(guī)律研究[J].環(huán)球中醫(yī)藥,2018,9(11):1337-1342.
[10] 王強(qiáng),張弦,王盛隆,等.基于因子分析的支氣管哮喘急性發(fā)作期患者中醫(yī)證候[J].世界中西醫(yī)結(jié)合雜志,2017,12(12):1637-1641.
[11] 劉佳佳,林樹元,鄭衛(wèi)軍,等.基于復(fù)雜網(wǎng)絡(luò)的太陰中風(fēng)證臨床診斷指征篩選[J].上海中醫(yī)藥雜志,2018,52(12):14-17.
[12] 王千,王成,馮振元,等.K-means聚類算法研究綜述[J].電子設(shè)計(jì)工程,2012,20(7):21-24.
[13] 吳夙慧,成穎,鄭彥寧,等.K-means算法研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2011(5):28-35.
[14] 張育軒.肝硬化臨床診斷、中醫(yī)辨證和療效評(píng)定標(biāo)準(zhǔn)(試行方案)[J].中國(guó)中西醫(yī)結(jié)合雜志,1994,14(4):237-238.
[15] 危北海,張萬岱,陳治水,等.肝硬化中西醫(yī)結(jié)合診治方案(草案)[J].中國(guó)中西醫(yī)結(jié)合雜志,2004,24(10):869-871.
[16] 劉成海,危北海,姚樹坤.肝硬化中西醫(yī)結(jié)合診療共識(shí)[J].中國(guó)中西醫(yī)結(jié)合消化雜志,2011,19(4):277-279.
[17] 李延龍,吳秀艷,王天芳,等.基于因子分析的801例肝炎肝硬化患者的證候研究[J].遼寧中醫(yī)雜志,2018,45(4):673-675.
[18] 許玉龍,吳秀艷,李延龍,等.基于隱結(jié)構(gòu)分析建立中醫(yī)證候分型規(guī)則的三種方法[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2019,21(1):101-108.
(收稿日期:2018-08-19)
(修回日期:2019-04-05;編輯:陳靜)