蔡俊娟
(廈門海洋職業(yè)技術(shù)學(xué)院基礎(chǔ)部,福建廈門 361000)
廣義線性模型描述一個(gè)響應(yīng)變量的均值與一個(gè)自變量的關(guān)系,這個(gè)關(guān)系可以比線性模型中EYi=α+βx復(fù)雜得多。很多不同的模型可以表示為GLM,有一種非常有用的GLM就是Logistic回歸模型。Logistic回歸分析是一種非常有效的處理數(shù)據(jù)的方法,特別是在醫(yī)學(xué)、社會(huì)調(diào)查等領(lǐng)域被廣泛應(yīng)用。但是在現(xiàn)有的統(tǒng)計(jì)教科書中,一般都只有對(duì)Logistic回歸模型的簡(jiǎn)單介紹,并作為中心內(nèi)容,缺乏有關(guān)該模型的詳盡分析及深入的討論。其中文獻(xiàn)[3]只對(duì)理論部分進(jìn)行分析,未結(jié)合實(shí)際應(yīng)用案例進(jìn)行解釋說明。
假設(shè)響應(yīng)變量Y1,Y2,…,Yn是獨(dú)立的,并且Yi·Bernoulli(πi)。我們知道Bernoulli是指數(shù)分布族,再假設(shè)πi滿足
從而我們建立了πi與x之間的關(guān)系。在(1)式中,左邊是Yi成功勝率的對(duì)數(shù)。這個(gè)模型假定對(duì)數(shù)勝率是預(yù)測(cè)變量x的線性函數(shù)。那么Bernoulli概率密度函數(shù)可以寫成如下的指數(shù)形式:
對(duì)于方程(1)式,我們可以重新寫為:
或者是更一般的形式:
由于
所以,從式(5)中我們可以發(fā)現(xiàn),當(dāng)β是正數(shù)時(shí),π(x)嚴(yán)格遞增函數(shù);當(dāng)β是負(fù)數(shù)時(shí),π(x)嚴(yán)格遞減函數(shù);特別地,β是0時(shí),,則為簡(jiǎn)單的線性回歸模型。
我們可以計(jì)算一下在x和x+1處可以得到:對(duì)于任何x,
則β表示是當(dāng)x增加一個(gè)單位時(shí),成功的對(duì)數(shù)勝率的相應(yīng)變化。在簡(jiǎn)單線性回歸模型中,β是當(dāng)x增加一個(gè)單位時(shí),Y的均值的相能變化。接下來,將式(5)兩邊取指數(shù)可以得到:,也就是說,eβ是指x+1處成功的勝率相對(duì)于x處成功的勝率的優(yōu)比,也可以理解為相應(yīng)于x的單位增量的成功勝率的變化倍數(shù)。
在研究醫(yī)院搶救急性心肌梗死(AMI)病人能否成功的危險(xiǎn)因素調(diào)查中,某醫(yī)院收集了5年里該院所有AMI病人的搶救病史,共190例。其中Y=0表示搶救成功,Y=1表示搶救未能成功而死亡;x1=1表示搶救前已發(fā)生休克,x1=0表示搶救前未發(fā)生過休克;x2=1表示搶救前發(fā)生心力衰竭,x2=0表示搶救前未發(fā)生心力衰竭;x3=1表示病人從開始AMI癥狀到搶救時(shí)已超過12小時(shí)(即未能及時(shí)把病人送往醫(yī)院),x3=0表示病人從有AMI癥狀到搶救時(shí)未超過12小時(shí)。
表1 搶救急性心肌梗死病人能否成功數(shù)據(jù)表
利用SPSS軟件,對(duì)于上述數(shù)據(jù)進(jìn)行分析。
3.2.1 模型系數(shù)的綜合檢驗(yàn)
表2 模型系數(shù)的綜合檢驗(yàn)
從表2中,可以發(fā)現(xiàn):模型χ2=21,354,p=0.000<0.1,按α=0.05水準(zhǔn),認(rèn)為自變量x1(搶救前是否發(fā)生休克),x2(搶救前是否心力衰竭),與因變量P(是否搶救成功)的Logistic回歸方程有統(tǒng)計(jì)學(xué)意義。
2.2.2 分類表從表3可以得到,結(jié)局為“0”,即搶救成功的患者正確率為90.7%,結(jié)局為“1”,即搶救不成功的患者判斷正確率為25%。對(duì)建模數(shù)據(jù)總的回判正確率真為69.8%,這說明模型的預(yù)測(cè)效果是相當(dāng)不錯(cuò)的,說明該模型較為穩(wěn)定,尤其是對(duì)搶救成功的患者的預(yù)測(cè)。
表3 分類表a
2.2.3 方程中的變量
表4 方程中的變量
從表4可以發(fā)現(xiàn):x1、x2、x3的Wald值分別為13.356、2.764、5.180,但是再觀察這3個(gè)變量的P值,x1的P值為0.000(P<0.01),從而可以得到,按水準(zhǔn)α=0.05水準(zhǔn),x1與Y有顯著性關(guān)系;x2的P值為0.096(P>0.05),從而可以得到,按α=0.05水準(zhǔn),x2與Y有無顯著性關(guān)系;x3的P值為0.023(P<0.05),從而可以得到,按α=0.05水準(zhǔn),x3與Y有顯著性關(guān)系。3個(gè)因素所建立的Logistic回歸方程如下:
通過二項(xiàng)Logistic回歸分析可以得到結(jié)論,醫(yī)院搶救急性心肌梗死(AMI)患者能否成功與該患者搶救前是否發(fā)生休克以及該患者在搶救時(shí)是否已超過12小時(shí)是顯著相關(guān)的。從而,在今后的AMI搶救中,要及時(shí)將患者送往醫(yī)院,這是影響搶救效果的重要因素。
[1]George,Casella.統(tǒng)計(jì)推斷[M].2版.北京:機(jī)械工業(yè)出版社,2010:548-553.
[2]李志輝,羅平等.統(tǒng)計(jì)分析教程[M].北京:電子工業(yè)出版社,2010:380-381.
[3]施朝健,張明銘.Logtistic回歸模型分析[J].計(jì)算機(jī)輔助工程,2005,14(3):74-78.