趙碩
(齊齊哈爾大學(xué) 網(wǎng)絡(luò)信息中心,黑龍江 齊齊哈爾 161006)
對骨質(zhì)疏松早預(yù)防、早發(fā)現(xiàn)是一個(gè)重要的研究課題。有些學(xué)者對不同年齡健康人群不同部位骨密度調(diào)查分析[1];有些學(xué)者對肥胖男性體成分與骨密度相關(guān)性進(jìn)行研究[2];有些學(xué)者對河北地區(qū)不同年齡健康男性不同部位骨密度與體成分分析[3];有些學(xué)者研究COPD患者骨密度與其他指標(biāo)的相關(guān)性[4];有的學(xué)者研究Wards三角骨密度與年齡、腰圍、總體脂肪質(zhì)量和總體肌肉質(zhì)量的相關(guān)性[5],但是有病史是否影響骨密度的含量,以及應(yīng)用數(shù)據(jù)挖掘的方法對骨密度與相關(guān)因素關(guān)系的研究未見報(bào)道。本文應(yīng)用數(shù)據(jù)挖掘的方法對齊齊哈爾地區(qū)男性骨密度與相關(guān)因素的關(guān)系進(jìn)行研究。首先對20~89歲男性的骨密度與相關(guān)因素的原始數(shù)據(jù)進(jìn)行采集,然后對原始數(shù)據(jù)按不同種類進(jìn)行分類統(tǒng)計(jì),得到各種統(tǒng)計(jì)表。再應(yīng)用改進(jìn)的決策樹算法找到不同分類標(biāo)準(zhǔn)下骨密度的變化規(guī)律。建立決策樹,用決策樹判斷患者患病的概率。
1.1.1 決策樹算法
決策樹算法是數(shù)據(jù)挖掘的常用方法之一。決策樹是一種常用于預(yù)測模型的算法,它通過一系列規(guī)則將大量數(shù)據(jù)有目的分類,從中找到一些有價(jià)值的、潛在的信息。
1.1.2 骨密度
骨密度又叫做骨骼礦物質(zhì)密度(Bone mineral density),簡稱BMD。是骨質(zhì)量的一個(gè)重要指標(biāo),以克/每平方厘米表示(g/cm2),反映骨質(zhì)疏松的程度,是預(yù)測骨折危險(xiǎn)性的重要指標(biāo)和依據(jù)。
1.1.3 T值
T值是將測得的骨密度值與同性別、同種族的正常人群骨峰值的比較值:
T值=(被測人骨密度-正常人群平均骨密度峰值)/正常人群平均骨密度的標(biāo)準(zhǔn)差
1.1.4 Z值
Z值是將測得的骨密度值與同年齡、同性別、同種族的正常人群比較值:
Z值=(被測人骨密度-同齡人群平均骨密度值)/同齡人群平均骨密度的標(biāo)準(zhǔn)差
1.1.5 脂肪率
脂肪率是指身體成分中,脂肪組織所占的比率。用公式表示為
1.1.6 身高體重指數(shù)
體質(zhì)指數(shù):即身高體重指數(shù)(BMI)。
BMI=體重(kg)/身高2(m2)
專家指出最理想的體重指數(shù)是22,BMI指數(shù)不適用于兒童。
體成分分析相關(guān)指標(biāo):中國成年人身體質(zhì)量指數(shù),輕體重:BMI<18.5;健康體重:18.5≤BMI<24;超重:24≤BMI<28;肥胖:28≤BMI,最理想的體重指數(shù)是22。
一般來說,絕經(jīng)后婦女和50歲以上男性的BMD報(bào)告原則使用T值和WHO骨密度測量的分類標(biāo)準(zhǔn);絕經(jīng)前婦女和50歲以下的男性BMD報(bào)告原則使用Z值,不能使用T值,尤其是兒童。Z值等于或小于-2.0表示:“骨密度低于同齡人”;Z值大于-2.0表示:“骨密度在同齡人范圍內(nèi)?!眴为?dú)依據(jù)BMD不能診斷50歲以下男性患骨質(zhì)疏松癥。WHO診斷標(biāo)準(zhǔn)可能適用于絕經(jīng)婦女。
實(shí)際檢測病人的標(biāo)準(zhǔn)是:當(dāng)T值為-1~+1時(shí),骨量正常;當(dāng)T值為-2.5~-1時(shí),骨量減少;當(dāng)T值小于-2.5時(shí),是骨質(zhì)疏松。
原始數(shù)據(jù)統(tǒng)計(jì)表,主要收集2015年以來,在齊齊哈爾市第一醫(yī)院門診及住院的20~89歲男性患者信息,共560人。其中20~29歲有21人;30~39歲有91人;40~49歲有152人;50~59歲有186人;60~69歲有62人;70~79歲有37人;80~89歲有11人。原始數(shù)據(jù)信息統(tǒng)計(jì)部分?jǐn)?shù)據(jù)如表1所示。
表1 原始數(shù)據(jù)信息統(tǒng)計(jì)部分?jǐn)?shù)據(jù)
50歲以下男性使用Z值進(jìn)行檢測骨密度,50歲及以上男性使用T值檢測骨密度。
1.3.1 按照有無病史進(jìn)行分類
有病史患者共279人。其中,20~29歲有6人;30~39歲有39人;40~49歲有73人;50~59歲有101人;60~69歲有28人;70~79歲有24人;80~89歲有8人??梢郧蟪鲇胁∈坊颊逿值或Z值偏低、正常和偏高的人數(shù),從而可求出有病史患者T值或Z值偏低、正常、偏高的比率表,如表2所示。
表2 有病史患者Z(T)值比率表
通過統(tǒng)計(jì)發(fā)現(xiàn),對于有病史的患者,20~29歲時(shí),正常范圍的比率最高,其次是40~49歲。50~89歲,T值的正常比率與年齡呈負(fù)相關(guān)。T值偏低的比率所有年齡段整體趨勢隨年齡增加而增加。T值偏高的比率,50~89歲隨年齡增加,偏高的比率增加。T值偏高的比率與年齡增長正相關(guān),發(fā)現(xiàn)30~39歲,有病史的患者,比20~29歲和40~49歲有病史的患者骨密度偏低的比率增加。30~39歲,有其他疾病的患者,要注重補(bǔ)充體內(nèi)骨密度的含量,以免使骨密度減少。50~89歲,對于有病史的患者,注意預(yù)防骨量偏低、骨質(zhì)疏松和骨質(zhì)硬化。
無病史患者共281人。其中20~29歲有14人;30~39歲有52人;40~49歲有78人;50~59歲有88人;60~69歲有33人;70~79歲有13人;80~89歲有3人??梢郧蟪鰺o病史患者T值或Z值在偏低,正常和偏高的人數(shù),從而可求出無病史患者T值或Z值在偏低,正常,偏高的比率表,如表3所示。
對于無病史患者,除了50~59歲以外,其他年齡段的患者,隨著年齡的增加,Z值或T值的正常比率下降;Z值或T值偏低的比率上升,50~59歲時(shí)候,T值或Z值比40~49歲、60~69歲偏低或偏高的現(xiàn)象。說明,無病史的男子50~59歲時(shí)候,需要注意身體保健,出現(xiàn)骨密度不正常的比率升高,應(yīng)該注重營養(yǎng),增加骨密度,主要防治骨質(zhì)疏松和骨質(zhì)硬化。
把有病史和無病史的患者對比發(fā)現(xiàn),對于60歲以上的患者,無病史比有病史的患者,骨密度正常值的比率偏高。說明年齡大時(shí),如果有其他病史,對骨密度含量有一定影響。
1.3.2 按脂肪率分類
采樣20~89歲男性共560人。按照30歲以下,偏瘦是脂肪率14%以下;標(biāo)準(zhǔn)是脂肪率14%~20%;微胖是脂肪率21%~25%;肥胖是脂肪率25%以上。30歲以上,偏瘦是脂肪率17%以下;標(biāo)準(zhǔn)是脂肪率17%~23%;微胖是脂肪率24%~25%;肥胖是脂肪率25%以上。偏瘦脂肪率共76人;標(biāo)準(zhǔn)脂肪率共104人;微胖脂肪率為28人;肥胖脂肪率為352人。由各段體重的人數(shù)可以求出脂肪率的比率,如表4所示。
表4 脂肪率Z(T)值比率統(tǒng)計(jì)表
通過脂肪率比率表發(fā)現(xiàn),脂肪率肥胖的患者,Z值或T值偏低的比率最高,說明肥胖的患者,骨密度減少的可能性最大,肥胖患者Z值或T值正常的比率最低;微胖的患者Z值或T值偏高的比率最大。說明為了健康應(yīng)該控制體內(nèi)脂肪的含量,以免患骨質(zhì)疏松或骨質(zhì)硬化病。
1.3.3 按BMI分類
采樣20~89歲男性共560人。按照30歲以下,偏瘦是BMI<20;正常是20≤BMI≤25;超重是25<BMI≤30;肥胖是30<BMI≤35。重度肥胖是BMI>35???cè)藬?shù)共560人。其中偏瘦的有26人;正常的有262人;超重的有236人;肥胖的有34人;重度肥胖的有2人。由各段人數(shù),可以求出各段BMI的比率表,如表5所示。
表5 BMI比率統(tǒng)計(jì)表
通過BMI比率表發(fā)現(xiàn),偏瘦或者重度肥胖的患者,Z值或T值偏低的比率最高,說明偏瘦或重度肥胖的患者,骨密度減少的可能性最大,偏瘦或重度肥胖的患者Z值或T值正常的比率最低;體重正?;颊遉值或T值正常比率最高。說明為了健康應(yīng)該控制體重,爭取保持標(biāo)準(zhǔn)體重,以免患骨質(zhì)疏松。
1.3.4 按血壓分類
統(tǒng)計(jì)了20~89歲的男性高血壓患者127人。其中T值或Z值偏低的有53人;正常的有66人;偏高的有8人。T值或Z值偏低的比率為41.7%,T值或Z值正常的比率為52.0%;T值或Z值偏高的比率為6.3%。說明高血壓患者,患骨質(zhì)疏松或骨量減少的可能性很大。
1.3.5 骨密度相關(guān)因素之間相互作用
通過數(shù)據(jù)分析發(fā)現(xiàn),骨質(zhì)疏松和年齡、有無病史、脂肪率、BMI以及血壓都有關(guān)系。并且這些影響因素之間兩兩相互作用,如果幾個(gè)因素疊加,會加大骨質(zhì)疏松的風(fēng)險(xiǎn)。
改進(jìn)的決策樹算法的基本思想是:首先遞歸地對某一分類數(shù)據(jù)集進(jìn)行劃分,可以多路分割,樹的每個(gè)非葉子節(jié)點(diǎn)可以包含一個(gè)分割點(diǎn)或者包含一個(gè)組合判斷分割點(diǎn),由這個(gè)分割點(diǎn)決定數(shù)據(jù)如何劃分。直至每個(gè)子集的記錄全屬于一類或者某一類占壓倒的多數(shù)。根據(jù)這個(gè)算法思想,再結(jié)合表2~5,建立下面4個(gè)決策樹。
根據(jù)改進(jìn)的決策樹算法分析,對于有病史患者,如圖1所示,如果Z值(T)值正常,年齡在20~29歲、40~49歲時(shí)候,骨量正??赡苄宰畲?;如果Z值(T)值偏低,年齡在30~39歲時(shí)候,骨量減少的可能性很大。當(dāng)年齡在60~69歲、80~89歲時(shí)候,患骨質(zhì)疏松的可能性很大;如果Z值(T)值偏高,年齡是70~79歲的時(shí)候,患者患骨硬化病的可能性比較大。
圖1 有病史患者決策樹
根據(jù)改進(jìn)的決策樹算法分析,對于無病史患者,如圖2所示,如果Z值(T)值正常,年齡在20~29歲、30~39歲時(shí)候,骨量正??赡苄宰畲?;如果Z值(T)值偏低,年齡在40~49歲時(shí)候,骨量減少的可能性很大。當(dāng)年齡在50~59歲、80~89歲時(shí)候,患骨質(zhì)疏松的可能性很大;如果Z值(T)值偏高,年齡是70~79歲的時(shí)候,患者患骨硬化病的可能性比較大。
圖2 無病史患者決策樹
根據(jù)改進(jìn)的決策樹算法分析,根據(jù)脂肪率可以推測,當(dāng)脂肪率屬于偏瘦時(shí)候,骨量正??赡苄院艽?;當(dāng)脂肪率屬于肥胖時(shí)候,骨質(zhì)疏松的可能性很大;當(dāng)脂肪率屬于微胖時(shí)候,患者患骨硬化病的可能性比較大,如圖3所示。
圖3 脂肪率決策樹
根據(jù)改進(jìn)的決策樹算法分析,當(dāng)BMI屬于偏瘦或重度肥胖時(shí)候,患骨質(zhì)疏松的可能性很大;當(dāng)BMI正常時(shí),骨量正??赡苄院艽螅鐖D4所示。
圖4 BMI決策樹
通過4個(gè)決策樹,可以輔助醫(yī)生判斷患者是否易患骨量減少、骨質(zhì)疏松或骨硬化病。如果有此風(fēng)險(xiǎn),應(yīng)該早預(yù)防、早治療。
本文主要研究了齊齊哈爾地區(qū)男性骨密度與相關(guān)因素的關(guān)系。采用的方法是分類和改進(jìn)的決策樹算法。首先對20~89歲男性骨密度和相關(guān)因素進(jìn)行采樣,得到患者骨密度及相關(guān)信息的原始數(shù)據(jù)。然后對原始數(shù)據(jù)按照不同分類方法進(jìn)行統(tǒng)計(jì)。得到各種統(tǒng)計(jì)表。通過對各種表格對比分析發(fā)現(xiàn),對于有病史的患者,20~29歲時(shí),正常范圍的比率最高,其次是40~49歲。50~89歲,T值的正常比率與年齡呈負(fù)相關(guān)。T值偏低的比率所有年齡段整體趨勢隨年齡增加而增加。T值偏高的比率,50歲以后隨年齡增加,偏高的比率增加。T值偏高的比率與年齡增長正相關(guān)。對于無病史患者,除了50~59歲以外,其他年齡段的患者,隨著年齡的增加,Z值或T值的正常比率下降,Z值或T值偏低的比率上升。50~59歲時(shí)候出現(xiàn)T值或Z值比40~49歲、60~69歲偏低或偏高的現(xiàn)象。無病史比有病史的患者,骨密度正常值的比率偏高。說明年齡大時(shí),如果有其他病史,對骨密度含量有一定影響。按照脂肪率的含量進(jìn)行分類發(fā)現(xiàn),脂肪率肥胖的患者,Z值或T值偏低的比率最高,說明肥胖的患者,骨密度減少的可能性最大,肥胖患者Z值或T值正常的比率最低;微胖的患者Z值或T值偏高的比率最大。根據(jù)BMI含量可以推測,當(dāng)BMI屬于偏瘦或重度肥胖時(shí)候,可能骨質(zhì)疏松;當(dāng)BMI正常時(shí),骨量正??赡苄宰畲?。說明為了健康應(yīng)該控制體內(nèi)脂肪的含量或控制體重,以免患骨質(zhì)疏松或骨質(zhì)硬化病。高血壓患者易患骨質(zhì)疏松。然后根據(jù)改進(jìn)的決策樹算法建立了4個(gè)決策樹,通過4個(gè)決策樹,可以輔助醫(yī)生判斷患者患病情況。