亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聚類分析下的高血壓疾病研究

        2013-12-31 00:00:00王倩
        現(xiàn)代商貿(mào)工業(yè) 2013年20期

        摘要:高血壓病是富裕型疾病之一,它嚴(yán)重危害了人類健康,因此防治高血壓的研究越來越引起世界各地學(xué)者的重視。基于上海市東部地區(qū)近萬名成年人的調(diào)查結(jié)果,首先采用相關(guān)分析提取出與高血壓疾病最為相關(guān)的五個變量(年齡、BMI、家族史、吸煙時間、吸煙數(shù)量),然后采取Q型系統(tǒng)聚類分析法來研究這五個主要因素與高血壓患病程度的關(guān)系,最后通過觀察易患高血壓人群的各項指標(biāo)分布情況,從而達到更有效地預(yù)防控制疾病的目的。

        關(guān)鍵詞:相關(guān)分析;聚類分析;高血壓

        中圖分類號:

        F27

        文獻標(biāo)識碼:A

        文章編號:1672-3198(2013)20-0097-03

        1 引言

        肥胖癥、糖尿病、高血壓病、高血脂病和冠心病被一些西方國家統(tǒng)稱為“富裕型疾病”。在我國隨著國民經(jīng)濟的快速發(fā)展,人民的生活水平已有了根本的改善并將繼續(xù)不斷的提高,其膳食結(jié)構(gòu)和營養(yǎng)狀況也發(fā)生了很大的變化,由此而引起的富裕性疾病亦日趨提高。

        本文的數(shù)據(jù)來源于上海市東部地區(qū)從1997年開始實施的一個富裕型疾病調(diào)查。這項調(diào)查有一個重要的特點是它不僅調(diào)查了居民的基本情況和患病情況,而且對于一些可能對富裕型疾病產(chǎn)生重要影響的危險因素或稱為易患因素也進行了調(diào)查,其中包括家族史、吸煙史、飲酒史等。如何利用調(diào)查數(shù)據(jù)來分析這些危險因素對某一人群或某人患富裕性疾病風(fēng)險的影響,無疑十分重要。它對醫(yī)學(xué)或人身保險(特別是醫(yī)療保險)都有很重要的意義。

        本文以富裕病之一高血壓為例,對該數(shù)據(jù)庫進行隨機抽樣地取出一千條記錄,首先利用Kendall(tau-b)方法剔除與高血壓患病相關(guān)性較小的因素,然后以數(shù)學(xué)運算軟件MATLAB 作為計算平臺,利用其自帶的數(shù)據(jù)庫和統(tǒng)計工具包,采取多元統(tǒng)計分析中的Q型系統(tǒng)聚類分析法對樣品進行聚類分析,最后用加權(quán)求和來判別每一類的患病程度,從而確定高血壓的患病因素與患病程度之間的關(guān)系。本文最終結(jié)果將1000條數(shù)據(jù)分為5類,其中高血壓易患人群為第一類、第二類和第五類,這類人群的特點是家庭遺傳都較多,平均家里有2人以上患有高血壓疾病,由此可見家族遺傳是患有高血壓的重要因素;而在正常(第三類)人群中BMI最低,也就是肥胖程度最低,所以控制體重、合理飲食也是可以預(yù)防高血壓的有效手段。

        2 模型介紹及主要結(jié)果

        2.1 相關(guān)性分析

        影響高血壓疾病的因素很多,根據(jù)調(diào)查結(jié)果和醫(yī)學(xué)專家建議本文選取年齡、BMI、家族史、吸煙時間、吸煙數(shù)量、飲酒時間、飲酒頻率、飲酒數(shù)量和戶外活動這9項指標(biāo)與高血壓患病情況作相關(guān)分析,以期望從中篩選出與高血壓患病情況更為相關(guān)的指標(biāo),為下一步聚類分析做準(zhǔn)備。

        考慮到上述九個指標(biāo)中即含有定量變量(年齡、BMI),又含有定性變量(家族史、吸煙時間、吸煙數(shù)量、飲酒時間、飲酒頻率、飲酒數(shù)量和戶外活動),本文引進“關(guān)聯(lián)系數(shù)”這個概念。它的作用與研究定量變量相互關(guān)系的相關(guān)系數(shù)類似,主要有以下兩個特點:(1)它不僅刻畫了變量之間的線性關(guān)系的強弱,而且著重反映其它的非線性關(guān)系的強弱;(2)它主要用于反映定性變量之間的相關(guān)性。用于描述定性變量之間相互關(guān)系的統(tǒng)計量很多,這里主要用到兩個量:p值和Kendall統(tǒng)計值。p值是表明統(tǒng)計檢驗結(jié)果的,由p值可以判斷因素是否與疾病有關(guān),根據(jù)顯著性水平臨界值a的選取,p值越接近于零就越與疾病相關(guān);Kendall統(tǒng)計值是用來度量相關(guān)因素與所研究的疾病的相關(guān)程度的。Kendall統(tǒng)計值為正,意味著因素為風(fēng)險因子,即因素有促使疾病發(fā)生的作用,Kendall統(tǒng)計值為負,意味著因素對疾病有預(yù)防作用。Kendall統(tǒng)計值的絕對值越大,說明因素對疾病的影響程度越強。因此通過p值和Kendall統(tǒng)計值的大小我們就可以確定因素是否與疾病相關(guān)和相關(guān)性的強弱程度。

        (1)相關(guān)性檢驗。

        我們考慮一對隨機變量(X,Y)的相關(guān)問題,從一個二維連續(xù)分布總體取得獨立同分布樣本(X1,Y1),(X2,Y2),...,(Xn,Yn)。一個通常會碰到的實際問題是:X和Y是否獨立,即檢驗假設(shè)H0:X和Y獨立。備擇假設(shè)可以是單邊的(X和Y有正相關(guān),或X和Y有負相關(guān)),也可以是雙邊的(X和Y相關(guān))。此處以雙邊備擇假設(shè)為例進行討論,H1:X和Y相關(guān)。

        對于上述獨立性假設(shè)(H0,H1),一個著名的非參數(shù)檢驗方法為Kendall(tau-a)檢驗。

        由上表結(jié)果可知,年齡、BMI、家族史和戶外活動的Kendall(tau-a)統(tǒng)計值是正的,所以它們是高血壓疾病的危險因子。取顯著性水平的臨界值α為0.001,則根據(jù)p值,保留年齡、BMI、家族史、吸煙時間和吸煙數(shù)量五個因子。而從Kendall(tau-b)統(tǒng)計值的計算結(jié)果來看,各變量的符號與Kendall(tau-a)統(tǒng)計值一樣,即危險因子保持不變。但是,由于p值全部都是0.000,我們則無法按照Kendall(tau-a)的辦法剔除變量。在闡述相關(guān)性的概念時,我們提到p值反映因素是否與疾病相關(guān),而Kendall統(tǒng)計值反映因素與疾病的相關(guān)程度。因此,上表的結(jié)果來看既然各因素與患病都相關(guān),那么我們就根據(jù)Kendall(tau-b)統(tǒng)計值選擇與患病相關(guān)最強的幾個,即保留年齡、BMI、家族史、吸煙時間和吸煙數(shù)量五個因子。

        2.2 聚類分析

        聚類分析按其聚類的方法有系統(tǒng)聚類法、動態(tài)聚類法、最優(yōu)分割法、模糊聚類法和圖論聚類法等,而根據(jù)分類對象的不同又可分為R型和Q型兩大類,R型是對變量(指標(biāo))進行變量處理,Q型是對樣品進行分類處理。本文將家族史、年齡、BMI、吸煙時間和吸煙數(shù)量作為指標(biāo),采取Q型系統(tǒng)聚類分析法對樣品進行聚類分析。

        (1)樣品間的距離。

        聚類分析,又稱集群分析,其分析的基本思想是依照事務(wù)的數(shù)值特征,來觀察各樣品之間的親疏關(guān)系。而樣品之間的親疏關(guān)系則由樣品之間的距離來衡量,對于定量變量,常用的距離有:閔氏距離、蘭氏距離和馬氏距離。閔氏距離和蘭氏距離都是假定變量之間相互獨立,即在正交空間中討論距離,但在實際問題中,變量之間往往存在著一定的相關(guān)性,為克服變量之間相關(guān)性及量綱的影響,因此本文采用馬氏距離計算樣品間的距離。

        (2)類間距離的定義。

        系統(tǒng)聚類法的聚類原則不僅決定于樣品間的距離,還取決于類間距離的定義,類間距離的不同定義就產(chǎn)生了不同的聚類分析方法。常用的類間距離的定義有:最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、離差平方和法等。由于前三種方法在定義類與類之間的距離時,沒有考慮每一類中所包含的樣品個數(shù)。所以本文將采用重心法,它是將兩類間的距離定義為兩類重心間的距離的一種聚類方法。對樣品分類而言,每一類的重心就是屬于該類樣品的均值。

        (3)類個數(shù)的確定。

        系統(tǒng)聚類分析中,類的個數(shù)如何確定的問題是一個非常困難的問題。在實際應(yīng)用中,人們并不完全從類的定義來確定類,具體類個數(shù)的確定方法通常有以下幾種:

        ①由適當(dāng)?shù)拈撝荡_定(譜系聚類圖需要規(guī)定一個臨界相似形尺度來分割聚類圖從而得到樣品的分類)。

        ②根據(jù)數(shù)據(jù)點的散步圖直觀地確定類的個數(shù)(當(dāng)考察的指標(biāo)只有兩個的時候)。

        ③根據(jù)統(tǒng)計量(例R2統(tǒng)計量、半偏R2統(tǒng)計量、偽F統(tǒng)計涼和偽t2統(tǒng)計量)確定分類個數(shù)。

        ④根據(jù)譜系圖確定分類個數(shù)的原則。

        Bemirmen(1972年)提出了應(yīng)該關(guān)于應(yīng)根據(jù)研究的目的來確定適當(dāng)?shù)姆诸惙椒?,并提出了一些根?jù)譜系圖來分析的原則。

        準(zhǔn)則A:各類重心之間的距離必須很大。

        準(zhǔn)則B:確定的類中,各類所包含的元素都不要太多。

        準(zhǔn)則C:類的個數(shù)必須符合實用目的。

        準(zhǔn)則D:若采用幾種不同的聚類方法處理,則在各自的聚類圖中應(yīng)發(fā)現(xiàn)相同的類。

        鑒于第四種方法的簡單方便和可行度高,本文就根據(jù)其提出的四項原則由聚類譜系圖直觀地來來確定分類的個數(shù)。

        (4)結(jié)果。

        由于系統(tǒng)聚類法無法處理一萬八千多條這樣龐大的樣本數(shù)據(jù),所以我們首先采用隨機數(shù)的方法抽取1000條記錄作為待測樣本,然后采用系統(tǒng)聚類方法得到圖1結(jié)果。

        根據(jù)第四個原則,從上面給出的譜系圖中基本可以看出當(dāng)類的個數(shù)為5的時候,各類之間的相對距離相差的相對要大一些,所以將數(shù)據(jù)分成五類比較合適。

        對于聚類后的每一類人群,我們用“無”、“輕”、“中”和“重”四種程度來考察他們關(guān)于高血壓的患病情況,為了便于量化,上述程度分別用“0”、“1”、“2”、和“3”來描述,所以我們可以用(0,1,2,3)作為加權(quán)向量,根據(jù)各種程度對應(yīng)人數(shù)所占的比例,可以推出患病指數(shù)I=∑ixi(其中xi表示每種程度對應(yīng)人數(shù)所占的比例),從而確定每類人群的總體患病程度。以下用餅圖分別對五類人群關(guān)于高血壓的四種程度的人數(shù)分布情況進行橫向比較。

        從圖中可以大致看出,第三類人群患病程度最低,第五類患病程度最高。事實上我們根據(jù)患病指數(shù)可以計算出I1=1.2414,I2=1.2667,I3=0.184,I4=0.4211,I5=2.0,從而得出相同的結(jié)論。因此將各類人群患病程度的高低順序依次排列就是:I5>I2>I1>I4>I3。

        3 結(jié)果分析

        我們對每一類人群的各項指標(biāo)(因素)求平均值,如下所示(注意:各項指標(biāo)的次序依次為BMI、吸煙時間、吸煙數(shù)量、年齡和家庭遺傳):

        A1=(24.241,0.68966,0,52.966,2.069)

        A2=(25.067,3.8,3.2,46.267,1.2667)

        A3=(21.933,1.3508,0.86631,49.949,0.026738)

        A4=(30.474,1.9474,1.2105,52.684,0)

        A5=(22.5,2,4,70,3) 通過對上述這些數(shù)據(jù)的綜合比較,我們可以大致看出高血壓易患(第一類、第二類和第五類)人群里家庭遺傳都較多,從中可以判別遺傳因素是引起高血壓的最危險因素;而在正常(第三類)人群中BMI最低,也就是肥胖程度最低,所以控制體重也是可以預(yù)防高血壓的有效手段。當(dāng)然年齡、吸煙和喝酒對高血壓也有著不可忽視的影響,我們可以通過主成分(因子)分析、判別分析和Logistic回歸做進一步的分析和研究。

        同時,我們把患病指數(shù)與患病程度之間的關(guān)系排列如下,對預(yù)防和控制高血壓提出自己的一些建議,以供參考:

        I≤0.4——正常,無需治療。

        0.4

        I≥1——患有中度高血壓,進行二級預(yù)防。

        其中,一級預(yù)防(以健康生活方式為主)是指已經(jīng)有高血壓的危險因素存在,但尚未發(fā)生高血壓的患者,控制危險因素防止高血壓的發(fā)生,所采取的預(yù)防措施:加強體育運動,防止肥胖,對高血壓易患人群如有遺傳家族史,高度精神緊張的工作者,女性更年期、妊娠、口服避孕藥或激素、糖尿病、高脂血癥、腎病等患者,應(yīng)加強血壓隨訪監(jiān)控,積極防治與高壓病有關(guān)的伴發(fā)病。二級預(yù)防是對已經(jīng)得高血壓的人所采取的措施:早期發(fā)現(xiàn)輕度高血壓,一般主張開始階段為非藥物治療,如減輕體重、限制食鹽、戒煙酒、適量增加體育運動、避免過度精神緊張及疲勞、調(diào)整心理平衡、充足睡眠等。若上述措施嚴(yán)密觀察3個月無效,則應(yīng)根據(jù)個體特點選擇最合適的藥物劑量,階梯進行正規(guī)的系統(tǒng)治療,將血壓降到合理水平。如果伴有心、腦、腎或周圍血管合并癥,在選擇抗高血壓藥物治療時,應(yīng)充分考慮到保護措施和積極治療改善心,腦、腎等器官的功能,并同時進行康復(fù)治療,不斷提高和改善病人的生活質(zhì)量,防止病殘。

        參考文獻

        [1]方顯明等.原發(fā)性高血壓辨證分型的聚類分析研究[J].廣西中醫(yī)藥,2007,(5).

        [2]于秀林,任雪松.多元統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,1999.

        [3]蔣小群等.聚類分析在糖尿病中的應(yīng)用[J].中國現(xiàn)代醫(yī)藥雜志,2008,(2).

        精品一精品国产一级毛片| 日本道色综合久久影院| 日本熟妇色xxxxx日本妇| 亚洲色大网站www永久网站| 精品福利一区| 亚洲免费福利视频网站| 激情内射人妻1区2区3区| 久久亚洲中文字幕精品熟| 在线亚洲高清揄拍自拍一品区| 野花在线无码视频在线播放| 亚洲色图综合免费视频| 伊人五月亚洲综合在线| 色综合久久无码五十路人妻 | 日本大肚子孕妇交xxx| 婷婷综合缴情亚洲| 精品日韩欧美一区二区三区在线播放| 国产在线精品观看一区二区三区| 人妻尝试又大又粗久久| 亚洲在AV极品无码天堂手机版| 亚洲av熟女天堂系列| 国产乱人精品视频av麻豆网站| 亚洲七久久之综合七久久| 免费一级肉体全黄毛片| 亚洲国内精品一区二区在线| 亚洲av无码成人精品国产| 99蜜桃在线观看免费视频网站| 国产精品久久久久久久y| 久久亚洲中文字幕伊人久久大| 人妻少妇偷人精品无码| 制服丝袜天堂国产日韩| 亚洲大胆视频在线观看| 久久国产人妻一区二区| 国产精品免费久久久久影院| 青青草一级视频在线观看| 中文字幕av高清人妻| 国产一女三男3p免费视频| 国产亚洲欧美另类久久久| 亚洲视频免费在线观看| 中文字幕免费不卡二区| 巨臀中文字幕一区二区| 亚洲丰满熟女乱一区二区三区|