黃倩 沈艷明 施佳成 黃漓莉 鄒迪莎 江仁美 于萍 劉曉玲 王彩梅 周燕 于健
(廣西壯族自治區(qū)桂林醫(yī)學(xué)院附屬醫(yī)院 1內(nèi)分泌科,廣西 桂林 541001;2檢驗(yàn)科,3呼吸疾病實(shí)驗(yàn)室)
隨著人口增長(zhǎng)、老齡化、城市化及肥胖和缺乏鍛煉,糖尿病(DM)的患病率逐年增加,預(yù)計(jì)全球日益增加的DM患者總數(shù)將從2000年的1.71億增加至2030年的3.66億人口,這將不可避免地增加心血管疾病死亡人數(shù)及其他DM并發(fā)癥的患病率和相關(guān)嚴(yán)重后果的增加〔1〕。作為醫(yī)務(wù)人員,對(duì)于DM流行病學(xué)特征研究的必要性毋庸置疑。目前針對(duì)DM危險(xiǎn)因素的調(diào)查研究,大多數(shù)統(tǒng)計(jì)方法采用Logistic回歸或多因素線性回歸模型,但由于其對(duì)于變量共線性的處理存在不足,所以降低了分析效能;而分類樹統(tǒng)計(jì)方法不受變量間共線性的影響,以樹形圖這種直接的表現(xiàn)形式展示多水平變量間的相互作用關(guān)系,并且可分析出各變量的具體影響人群;自然而然分類樹模型作為一種新興分析方法在醫(yī)學(xué)領(lǐng)域中如疾病的預(yù)測(cè)和診斷方面越來越受到歡迎〔2〕。因此,本研究以廣西壯族自治區(qū)桂林市桂林醫(yī)學(xué)院附屬醫(yī)院部分體檢人群為研究對(duì)象,利用分類樹模型篩查2型糖尿病(T2DM)的相關(guān)影響因素。
1.1研究對(duì)象 采用整群隨機(jī)抽樣方法,抽取2017年7~10月在桂林醫(yī)學(xué)院附屬醫(yī)院體檢部體檢的體檢者,最終10 361例(男6 038例,女4 323例)資料完整的體檢人群納入統(tǒng)計(jì)分析。所有研究對(duì)象簽署知情同意書。排除標(biāo)準(zhǔn):1型DM、急性感染、創(chuàng)傷或其他應(yīng)激情況下出現(xiàn)的暫時(shí)性血糖升高、長(zhǎng)期口服如糖皮質(zhì)激素等影響血糖的藥物及嚴(yán)重肝腎功能受損患者。
1.2資料收集 由經(jīng)過專門培訓(xùn)的專業(yè)人員對(duì)研究對(duì)象進(jìn)行詳細(xì)詢問,使用本研究設(shè)計(jì)的調(diào)查問卷表格。調(diào)查內(nèi)容包括基本信息(性別、年齡、民族、婚姻狀況、膳食、職業(yè)、吸煙及飲酒、疾病史如高血壓、DM等),體格測(cè)量包括身高、體重、收縮壓(SBP)和舒張壓(DBP)等,并計(jì)算體重指數(shù)(BMI),24.0 kg/m2≤BMI<28.0 kg/m2診斷為超重,BMI≥28.0 kg/m2為肥胖〔3〕。實(shí)驗(yàn)室檢測(cè):體檢者隔夜至少禁食8 h,次日清晨抽取靜脈血;三酰甘油(TG)、總膽固醇(TC)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、空腹血糖(FPG)及口服葡萄糖耐量試驗(yàn)(OGTT)2 h血糖(2 hPG),上述指標(biāo)采用羅氏Cobas C501全自動(dòng)生化分析檢測(cè)。由醫(yī)院專業(yè)超聲科醫(yī)生使用邁瑞 DC-6 ExpertⅡ型超聲檢查儀對(duì)受試者進(jìn)行腹部彩超檢查,確定診斷。
1.3診斷標(biāo)準(zhǔn) T2DM診斷標(biāo)準(zhǔn)〔4〕參照《2017年中國糖尿病防治指南》:典型DM癥狀加上隨機(jī)血糖檢測(cè)≥11.1 mmol/L;FPG≥7.0 mmol/L;2 hPG≥11.1 mmol/L。
高血壓診斷標(biāo)準(zhǔn)〔5〕參照2010年修訂版的《中國高血壓防治指南》,在未使用降壓藥的情況下,SBP≥140 mmHg和(或)DBP≥90 mmHg,或既往有高血壓病史,正在服用降壓藥物治治療者,即被診斷為高血壓。
非酒精性脂肪性肝病(NAFLD)診斷標(biāo)準(zhǔn)〔6〕參照中華醫(yī)學(xué)會(huì)肝病分會(huì)脂肪肝及酒精性肝病學(xué)會(huì)組制訂的《2006年版非酒精性脂肪性肝病診療指南》。
血脂異常診斷標(biāo)準(zhǔn)〔7〕參照2016年中國成人血脂異常防治指南的標(biāo)準(zhǔn):TC≥6.2 mmol/L,LDL-C≥4.1 mmol/L,HDL-C<1.0 mmol/L,TG≥2.3 mmol/L,出現(xiàn)任何一項(xiàng)即診斷為血脂異常。
1.4統(tǒng)計(jì)學(xué)處理 運(yùn)用SPSS19.0軟件進(jìn)行χ2檢驗(yàn)、分類與回歸樹、受試者工作特征(ROC)曲線下面積(AUC)分析。
2.1基本情況 共調(diào)查體檢人群10 361人,檢出622例DM患者,以DM患者為病例組,同期體檢正常人群為對(duì)照組。與對(duì)照組相比,病例組BMI、SBP、DBP、FPG、TG、TC、LDL-C水平明顯升高,HDL-C的水平明顯降低,而且患有NAFLD的人群比例明顯升高,差異均有統(tǒng)計(jì)學(xué)意義(P<0.01),見表1。
表1 兩組臨床與代謝特征比較
2.2構(gòu)建分類樹模型 以DM為因變量,患有DM賦值為1,未患DM賦值為0。將BMI、性別(男性為1,女性為0)、年齡、NAFLD(患有NAFLD=1,未患NAFLD=0)、高血壓(患有高血壓=1,未患高血壓=0)、TG、TC、HDL-C、LDL-C指標(biāo)作為自變量代入研究分析,其中性別、NAFLD和高血壓定義為分類變量,其余變量為連續(xù)變量。根據(jù)預(yù)先設(shè)定樹的生長(zhǎng)深度和修剪規(guī)則,本次建立的DM發(fā)病風(fēng)險(xiǎn)分類樹模型結(jié)果顯示:共包含5層,23個(gè)結(jié)點(diǎn),其中終末結(jié)點(diǎn)12個(gè)。最終納入影響DM的4個(gè)解釋變量,分別為:年齡、NAFLD、TG、高血壓。
2.3模型的分析 樹形結(jié)構(gòu)的第一層依據(jù)年齡進(jìn)行拆分,因此年齡是DM最重要的危險(xiǎn)因素,拆分點(diǎn)為50.5歲,年齡>50.5歲的DM患者比例(14.5%,444/3 061)明顯高于年齡≤50.5歲組(2.4%,178/7 300,P<0.05)提示隨著年齡的增長(zhǎng),DM的患病率明顯增加。隨后第二層篩選出的因素是NAFLD,在年齡>50.5歲時(shí),患有NAFLD的人群DM患病率(25.1%,211/840)明顯高于無NAFLD的人群(10.5%,233/2 221),年齡≤50.5歲且患NAFLD的人群DM比例(8.1%,105/1 304)明顯高于無NAFLD的人群(1.2%,73/5 996,P<0.05);在模型第三層中,篩選出的因素為TG和年齡,在年齡≤50.5歲、NAFLD人群中,TG>4.015 mmol/L者(20.1%,31/154)的DM患病率明顯高于TG≤4.015 mmol/L者(6.4%,74/1 150,P<0.05);在年齡>50.5歲、NAFLD人群中,TG>2.205 mmol/L者(31.5%,105/333)的DM患病率明顯高于TG≤2.205 mmol/L者(20.9%,106/507),第四層的分支變量是年齡、高血壓,在年齡>50.5歲、無NAFLD、TG>2.505 mmol/L人群中,有高血壓的DM比例(31.2%,30/96)明顯高于無高血壓者(16.0%,21/131,P<0.05);到第五層的分支變量仍是高血壓,由此可見,高血壓對(duì)DM的重要影響。
2.4模型的評(píng)價(jià) 增益圖:累計(jì)增益圖是從0%開始以100%結(jié)束,且良好模型的增益圖應(yīng)先向100%快速增長(zhǎng),最后趨于平穩(wěn),此DM分類樹模型符合良好模型的標(biāo)準(zhǔn),提示該模型良好,見圖1。
圖1 DM發(fā)病風(fēng)險(xiǎn)分類樹模型收益圖
分類樹重替代估計(jì)量和交叉驗(yàn)證估計(jì)量分別為0.060和0.061,標(biāo)準(zhǔn)誤差均為0.002,表示采用分類樹模型預(yù)測(cè)DM影響因素的正確率為94%,則證明模型擬合效果良好。
ROC曲線:利用此模型得出預(yù)測(cè)概率繪制ROC曲線,AUC為0.835(95%CI:0.827~0.842),標(biāo)準(zhǔn)誤為0.007,靈敏度為0.868(95%CI:0.839~0.894),特異度為0.660(95%CI:0.570~0.651),表明本次模型精確性較高,可以有效地篩選出DM相關(guān)的影響因素。見圖2。
圖2 DM分類樹模型的ROC曲線
DM是由遺傳和環(huán)境等多因素共同參與引起的臨床綜合征。如今,分類樹模型因具有針對(duì)分析多因素間交互作用的獨(dú)特優(yōu)勢(shì),在各行各業(yè)中得到了廣泛應(yīng)用。醫(yī)學(xué)領(lǐng)域中,在分析疾病的多病因危險(xiǎn)因素方面,相應(yīng)的需求也迅速增長(zhǎng),特別是應(yīng)用于樣本量較大的病因研究。
分類樹模型是一種類似樹形結(jié)構(gòu)的預(yù)測(cè)模型,根據(jù)各個(gè)自變量對(duì)因變量的相關(guān)程度逐個(gè)分層,至分層檢驗(yàn)無統(tǒng)計(jì)學(xué)意義為止最終完成分類樹。這樣的樹形圖展現(xiàn)方式不僅直接、方便、簡(jiǎn)單易懂,而且比傳統(tǒng)線性模型更清晰地表達(dá)自變量間的交互作用,能直觀地得出多個(gè)因素對(duì)疾病的影響作用順序。
本研究結(jié)合相關(guān)臨床資料信息,運(yùn)用分類樹建立糖尿病預(yù)測(cè)模型,為疾病的預(yù)防和干預(yù)提供有力的理論依據(jù)。從本研究構(gòu)建的分類樹模型結(jié)果可以看出年齡、NAFID、TG、高血壓對(duì)DM患病率的重要性,與以往相關(guān)研究結(jié)果相符〔8,9〕。
具體分析如下,年齡作為第一個(gè)分類變量對(duì)糖尿病患病風(fēng)險(xiǎn)影響最大,截點(diǎn)為50.5歲,提示針對(duì)中老年人應(yīng)加強(qiáng)健康宣教和早期干預(yù),早發(fā)現(xiàn)早治療從而提高生活質(zhì)量。處于目前世界經(jīng)濟(jì)迅速發(fā)展的時(shí)代,DM(特別是T2DM)患病率逐漸增加,尤其是老年人,因衰老對(duì)代謝的直接影響,使得這一人群DM的潛在病理生理學(xué)進(jìn)展加劇,而且衰老帶來的效應(yīng)與DM相互作用,也會(huì)加速許多DM相關(guān)并發(fā)癥的進(jìn)程。
分類樹的第二層拆分變量均為NAFLD,充分說明,無論老少,患有NAFLD的人群發(fā)生DM的概率都高于健康體檢者,從疾病發(fā)生機(jī)制角度看,肝臟脂肪變性(即肝臟中脂質(zhì)的過度沉積)通常伴有胰島素抵抗〔10〕。雖然迄今為止病毒性肝炎仍是一個(gè)重要的健康問題,但是NAFLD是目前世界上非常常見的肝臟疾病,而且呈上升趨勢(shì),據(jù)估計(jì),其發(fā)病率在東南亞城市地區(qū)高達(dá)60%〔11〕,因此,患有NAFLD人群必須引起高度重視,需要通過改變生活方式和膳食搭配適當(dāng)減輕體重,其次定期復(fù)查肝臟彩超和肝功能指標(biāo)。有文獻(xiàn)報(bào)道〔12〕,逆轉(zhuǎn)NAFLD可改善胰島素抵抗。第三層進(jìn)一步拆分的變量為TG和年齡。高TG是血脂異常的表現(xiàn),提示血脂異常與DM之間的密切關(guān)聯(lián),既往研究顯示,血脂異常是由許多遺傳和非遺傳因素之間相互作用引起,不僅會(huì)導(dǎo)致血糖代謝異常,且是發(fā)生動(dòng)脈粥樣硬化性心血管疾病的高危因素〔13〕,尤其是血漿TG濃度升高。因此,建議對(duì)血脂異?;颊邞?yīng)密切檢查,對(duì)內(nèi)分泌和心血管相關(guān)疾病評(píng)估篩查。
根據(jù)分類樹模型結(jié)果,與DM相關(guān)的第四層拆分變量含有年齡,另一變量是高血壓,緊接著第五層進(jìn)一步拆分的仍為高血壓,說明高血壓的患病與否對(duì)DM影響顯著。已有臨床研究表明〔14〕,高血壓和胰島素抵抗之間存在緊密病理生理學(xué)聯(lián)系,飲食鹽和熱量的過量攝入,與血壓升高相關(guān)性大。那么,對(duì)于有高血壓的高危因素特別是有家族遺傳史的人群,應(yīng)當(dāng)積極改正不健康的生活方式、做好血壓管理和合理規(guī)范的降壓治療。本次研究所建立的DM危險(xiǎn)因素模型具有較滿意的說服力和可信度。
值得關(guān)注的是,分類樹模型同樣也有自身的弱點(diǎn),它需要較大的樣本量才能保證逐層細(xì)分后單元格內(nèi)仍有充分的樣本數(shù),因此針對(duì)小樣本量的數(shù)據(jù)分析具有局限性。其次,對(duì)于線性關(guān)聯(lián)、無交互作用的數(shù)據(jù),其分析效果和模型解釋性均不如普通統(tǒng)計(jì)模型。
綜上所述,本研究結(jié)合相關(guān)臨床資料信息,應(yīng)用分類樹建立的DM預(yù)測(cè)模型,提示年齡、NAFLD、TG及高血壓是T2DM的危險(xiǎn)因素,為疾病的預(yù)防和干預(yù)提供有力的理論依據(jù),在臨床實(shí)踐中應(yīng)針對(duì)不同高危人群采取個(gè)性化的預(yù)防措施,減少DM患病率并延緩并發(fā)癥的發(fā)展,降低醫(yī)療耗費(fèi)成本。