胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在構(gòu)建廣義線性回歸模型的過(guò)程中,常涉及參數(shù)的檢驗(yàn)問(wèn)題,例如:檢驗(yàn)部分或全部回歸系數(shù)是否為0,檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中以及檢驗(yàn)平行線假定是否成立。在統(tǒng)計(jì)學(xué)上,實(shí)現(xiàn)前述檢驗(yàn)的具體方法有評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn)。本文僅介紹評(píng)分檢驗(yàn)及其SAS實(shí)現(xiàn)。
設(shè)資料由觀測(cè)值 x1,x2,…,xN組成,并假定可用依賴于參數(shù)θ的概率模型f(x;θ)來(lái)描述該資料。當(dāng)變量x只有有限個(gè)可能的取值代入函數(shù)f(x;θ),從而指定每一個(gè)輸出的概率;當(dāng)存在無(wú)窮多個(gè)輸出f(x;θ)來(lái)指定概率密度函數(shù)時(shí),對(duì)數(shù)似然函數(shù)可表示如下:
此時(shí),評(píng)分函數(shù)[1]表示如下:
在式(2)中,“'”代表求函數(shù)的導(dǎo)數(shù);若θ?是θ的最可能值,則滿足u(θ?)=0。
設(shè)θ0是θ的真值,則評(píng)分就具有均值為0、方差為i(θ0),則下式定義的檢驗(yàn)統(tǒng)計(jì)量Z服從標(biāo)準(zhǔn)正態(tài)分布:
基于式(3)定義的檢驗(yàn)被稱為評(píng)分檢驗(yàn)[1]。文獻(xiàn)[1]還給出了Wald檢驗(yàn)統(tǒng)計(jì)量,見(jiàn)下式:
在式(4)中,θ?是θ的最大似然估計(jì)值,θ0是θ的真值,j-1是θ的方差。
在評(píng)分檢驗(yàn)統(tǒng)計(jì)量中,參數(shù)θ可以是一維的,也可以是多維的(被稱為參數(shù)向量)。在統(tǒng)計(jì)學(xué)上,經(jīng)常將3種檢驗(yàn)統(tǒng)計(jì)量(即評(píng)分檢驗(yàn)統(tǒng)計(jì)量、似然比檢驗(yàn)統(tǒng)計(jì)量和Wald檢驗(yàn)統(tǒng)計(jì)量)[1-3]同時(shí)呈現(xiàn)出來(lái),其主要用途如下:檢驗(yàn)部分或全部回歸系數(shù)是否為0、檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中、檢驗(yàn)平行線假定是否成立以及檢驗(yàn)線性假設(shè)是否成立等。
設(shè)回歸模型中的回歸系數(shù)向量β具有K個(gè)分量,在SAS/STAT的PHREG過(guò)程中,給出的5個(gè)檢驗(yàn)統(tǒng)計(jì)量(即似然比檢驗(yàn)統(tǒng)計(jì)量、一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、Wald’s檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量和穩(wěn)健Wald’s檢驗(yàn)統(tǒng)計(jì)量)都服從自由度df=K的χ2分布。這5種檢驗(yàn)都可以用于檢驗(yàn)回歸模型中全部回歸系數(shù)是否都等于0,即H0:β=0。其中,一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義有以下兩種表達(dá)形式,見(jiàn)式(5)、式(6)[2-3]:
在SAS/STAT的PHREG過(guò)程中,穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義[2]如下:
式(7)中,L0i是第i個(gè)受試者在β=0處的評(píng)分殘差;也就是說(shuō),L0i=Li(0,∞),得分過(guò)程L(iβ,t)的定義如下:
向量L?i≡Li(β?,∞)是第i個(gè)受試者的得分殘差。
【說(shuō)明】在SAS/STAT的PHREG過(guò)程中,介紹了4種殘差,分別是邊際殘差、偏差殘差、Schoenfeld殘差和得分殘差。上式中涉及其他一些變量或符號(hào),參見(jiàn)文獻(xiàn)[2],此處從略。
2.3.1 檢驗(yàn)部分或全部回歸系數(shù)是否為0
在累積和廣義(或擴(kuò)展)的logistic回歸模型中,假定因變量有K(i=1,2,…,K)個(gè)類別,共同的自變量有S個(gè)。也就是說(shuō),在每一類中擬合logistic回歸模型時(shí),都涉及一個(gè)截距項(xiàng)和S個(gè)自變量(注:指尚未篩選掉某些自變量)。為了檢驗(yàn)部分回歸系數(shù)是否為0,可以采用殘差評(píng)分χ2檢驗(yàn)。
讓g(β)代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的一階偏導(dǎo)數(shù)向量;讓H(β)代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的二階偏導(dǎo)數(shù)矩陣。也就是說(shuō),g(β)是梯度向量,而H(β)是哈森矩陣。讓I(β)代表“-H(β)”的期望。考慮一個(gè)無(wú)效假設(shè)H0,讓?duì)?H0是無(wú)效假設(shè)條件下β的最大似然估計(jì)值(MLE)。在SAS/STAT的LOGISTIC過(guò)程中,殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義如下:
式(9)中的χ2RS漸近服從自由度為df的χ2分布。其中,參數(shù)向量β、無(wú)效假設(shè)H0與H0對(duì)應(yīng)的向量β和自由度df都會(huì)隨著因變量的具體情形不同而有所變化。具體地說(shuō),有以下兩種情形。
情形一:累積反應(yīng)變量模型或稱多值有序因變量模型。
參數(shù)向量β=(α1,α2,…,αK,β1,β2,…,βS)';無(wú)效假設(shè) H0:βt+1=βt+2=…=βS,t
情形二:廣義反應(yīng)變量模型或稱多值名義因變量模型(當(dāng)K=2時(shí)為二值反應(yīng)變量)。
參數(shù)向量 β =(α1,α2,…,αK,β'1,β'2,…,β'S)';其中,β'i=(βi1,βi2,…,βiS);i=1,2,…,K;無(wú)效假設(shè) H0:βi,t+1=βi,t+2=…=βi,S,t
2.3.2 檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中
解決問(wèn)題的基本思路:假定有兩組自變量,A組中有S個(gè)自變量(可構(gòu)建一個(gè)全模型);B組中有S-1個(gè)自變量(可構(gòu)建一個(gè)簡(jiǎn)化模型);B組中的全部自變量都包含在A組中。將A組比B組多出來(lái)的一個(gè)自變量記為xt[t∈(1,2,…,S)],于是,將A組與B組自變量及其資料分別代入式(4)計(jì)算,便可得到兩個(gè)χ2值,它們具有不同的自由度。求出這兩個(gè)χ2值之差,再基于它們的自由度之差,就可依據(jù)χ2分布求出尾端概率。
自由度的確定方法:若是多值有序因變量,全模型與簡(jiǎn)化模型的自由度之差等于1;若是多值名義因變量,全模型與簡(jiǎn)化模型的自由度之差等于K(當(dāng)K=2時(shí)為二值因變量的情形)。當(dāng)檢驗(yàn)結(jié)果為P<0.05,表明不在B組中的自變量xt[t∈(1,2,…,S)]具有統(tǒng)計(jì)學(xué)意義;反之亦然。
2.3.3 檢驗(yàn)平行線假定是否成立
設(shè)因變量Y為多值有序的且水平數(shù)為K+1(即水平數(shù)大于2),讓因變量Y的取值分別為1,2,…,K,K+1。假定有S個(gè)自變量,在沒(méi)有平行線假設(shè)的條件下,一般的累積logistic回歸模型可用下式表達(dá):
在 式(10)中 ,g(·)是 連 接 函 數(shù) ;βi=(αi,βi1,βi2,…,βiS)'是Y=i條件下的一個(gè)未知參數(shù)向量,它的分量分別是一個(gè)截距、S個(gè)斜率。這個(gè)一般累積模型的參數(shù)向量可表示成:β=(β'1,β'2,…,β'K)',它是由K個(gè)分量組成的一個(gè)向量,而每個(gè)分量就是前面所呈現(xiàn)的向量[即βi=(αi,βi1,βi2,…,βiS)']。
給定平行線的無(wú)效假設(shè):H0:β1m=β2m=…=βKm,1≤m≤S?;貧w系數(shù)β有兩個(gè)下標(biāo),第1個(gè)下標(biāo)代表因變量Y的取值或水平代碼,第2個(gè)下標(biāo)代表自變量的順序編號(hào)。若用語(yǔ)言描述上述無(wú)效假設(shè)H0,即在因變量Y的K個(gè)水平條件下的K個(gè)logistic回歸模型中編號(hào)相同的自變量具有相等的回歸系數(shù)。也就是說(shuō),K個(gè)logistic回歸模型僅截距不同,自變量線性組合中只有一組共同的回歸系數(shù)。
用統(tǒng)計(jì)學(xué)語(yǔ)言表述如下:讓 β1,β2,…,βS代表共同斜率系數(shù),讓 α?1,α?2,…,α?K和 β?1,β?2,…,β?S分別代表截距參數(shù)與斜率參數(shù)的最大似然估計(jì)值。那么,在H0成立的條件下,β的最大似然估計(jì)見(jiàn)式(11):
此時(shí),與無(wú)效假設(shè)H0對(duì)應(yīng)的殘差評(píng)分χ2檢驗(yàn)統(tǒng)計(jì)量見(jiàn)式(12):
【說(shuō)明】對(duì)平行線假定的檢驗(yàn)可視為對(duì)參數(shù)有線性約束的檢驗(yàn)(簡(jiǎn)稱約束檢驗(yàn)[6])的特例,后者常被冠以拉格朗日乘數(shù)檢驗(yàn)(參見(jiàn)下文)。
讓?duì)?為在限制條件L'β=0下從廣義估計(jì)方程中求解得到的回歸參數(shù);讓 S(β?)為在 β?時(shí)廣義估計(jì)方程的值。Boos和Rotnitzky與Jewell描述了在廣義估計(jì)方程中將評(píng)分檢驗(yàn)應(yīng)用于檢驗(yàn)L'β=0,其中L'是用戶指定的r×p階比較矩陣。于是,廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量[2]見(jiàn)下式:
在式(13)中,∑m是基于模型的協(xié)方差估計(jì)值,∑m是經(jīng)驗(yàn)協(xié)方差估計(jì)值,T服從自由度df=r的χ2分布。
在SAS/STAT的GENMOD過(guò)程中的定義如下:當(dāng)用戶給回歸模型中的參數(shù)施加某些限制(例如:NOINT,即強(qiáng)制性要求截距為0;又例如:NOSCALE,即強(qiáng)制性要求某些定量隨機(jī)變量的概率分布中的尺度參數(shù)取固定值)時(shí),需要有相應(yīng)的檢驗(yàn)方法來(lái)評(píng)價(jià)這些限制的有效性。這個(gè)檢驗(yàn)方法被稱為拉格朗日乘數(shù)檢驗(yàn)或約束評(píng)分檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量[2]見(jiàn)式(14):
式(14)中,S是在與被限制參數(shù)對(duì)應(yīng)的限制的最大值點(diǎn)上估計(jì)的評(píng)分向量的成分;而V=I11-I12I-122I21,其中矩陣I是信息矩陣,下標(biāo)中的1指被限制的參數(shù),下標(biāo)中的2指未被限制的其他參數(shù)。
【說(shuō)明】因篇幅所限,在SAS/ETS的ENTROPY過(guò)程中的定義、在SAS/ETS的MDC、MODEL和QLIM過(guò)程中的定義以及在SAS/ETS的PANEL過(guò)程中的定義從略。
【例1】一項(xiàng)關(guān)于成年人心理健康問(wèn)題的研究,調(diào)查了某城市40例成年居民的心理健康狀況(1=無(wú)心理問(wèn)題,2=存在輕微癥狀,3=存在中度癥狀,4=存在精神損害),考察的兩個(gè)原因變量分別是社會(huì)經(jīng)濟(jì)地位(0=低,1=高)和生活事件評(píng)分,資料見(jiàn)表1[4]。試分析心理健康狀況與兩個(gè)原因變量的關(guān)系。
表1 成年人心理健康狀況調(diào)查資料
【例2】隨機(jī)納入30例在某醫(yī)院就診的僅有胸悶癥狀的非器質(zhì)性心臟病患者,收集患者在24小時(shí)中的早搏數(shù)(y),試問(wèn)早搏是否與吸煙(x1)、性別(x2)和喝咖啡(x3)有關(guān)。資料見(jiàn)表2[5]。
表2 某醫(yī)院伴有胸悶癥狀的非器質(zhì)性心臟病患者情況
3.2.1 對(duì)例1的分析與解答
【分析與解答】設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
第1個(gè)過(guò)程步的主要輸出結(jié)果:
以上是模型中含有截距項(xiàng)和自變量life時(shí)的比例優(yōu)比假設(shè)的評(píng)分檢驗(yàn)結(jié)果,也被稱為平行線假設(shè)檢驗(yàn)結(jié)果。因χ2RS=0.8865,df=2,P=0.6419,說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。
以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型(含截距項(xiàng)和一個(gè)自變量life)是否成立,由于3種檢驗(yàn)結(jié)果均有P<0.05,說(shuō)明此時(shí)的logistic回歸模型成立。
以上是逐步選擇匯總,從第2列與倒數(shù)第3列可知,選擇自變量進(jìn)入回歸模型時(shí)采用的是評(píng)分χ2檢驗(yàn);而從第3列與倒數(shù)第2列可知,刪除自變量時(shí)采用的是 Wald χ2檢驗(yàn)。
第2個(gè)過(guò)程步的主要輸出結(jié)果:
以上輸出的是平行線假定的檢驗(yàn)結(jié)果,因P=0.6761>0.05,說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。
以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型[含截距項(xiàng)和兩個(gè)自變量(life和society)]是否成立,由于3種檢驗(yàn)結(jié)果均有P<0.05,說(shuō)明此時(shí)的logistic回歸模型成立。
以上輸出的是線性假設(shè)檢驗(yàn)結(jié)果。第1行的結(jié)果說(shuō)明0.5×β1+1×β2=0的假設(shè)成立;第2行的結(jié)果說(shuō)明 β1=β2的假設(shè)不成立。這里采用的是 Wald χ2檢驗(yàn),而不是似然比χ2檢驗(yàn)和拉格朗日χ2檢驗(yàn)。
【說(shuō)明】為節(jié)省篇幅,以上僅呈現(xiàn)了與評(píng)分檢驗(yàn)有關(guān)的輸出結(jié)果,故不適合給出統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論。
3.2.2 對(duì)例2的分析與解答
【分析與解答】設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
第1個(gè)過(guò)程步的主要輸出結(jié)果:
以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果,χ2LM=8.6315,P=0.0017,說(shuō)明資料存在過(guò)度離散現(xiàn)象,不適合直接擬合Poisson分布回歸模型。
第2個(gè)過(guò)程步的主要輸出結(jié)果:
以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果,χ2LM=0.9727,P=0.1620,說(shuō)明此時(shí)的資料(不包括自變量x3)不存在過(guò)度離散現(xiàn)象,可直接擬合Poisson分布回歸模型。
第3個(gè)過(guò)程步的輸出結(jié)果與評(píng)分檢驗(yàn)無(wú)關(guān),為節(jié)省篇幅,此處從略。
【說(shuō)明】為節(jié)省篇幅,以上僅呈現(xiàn)了與評(píng)分檢驗(yàn)有關(guān)的輸出結(jié)果,故不適合給出統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論。
在進(jìn)行廣義線性模型[6]分析,特別是進(jìn)行多重logistic回歸模型[7-10]分析時(shí),在多個(gè)環(huán)節(jié)上需要對(duì)參數(shù)進(jìn)行假設(shè)檢驗(yàn),有時(shí)還需要在參數(shù)處于特定約束條件下對(duì)其進(jìn)行檢驗(yàn)。通常涉及3種檢驗(yàn),即評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn);當(dāng)有約束條件時(shí),其檢驗(yàn)被稱為約束檢驗(yàn)[6]或拉格朗日乘數(shù)檢驗(yàn)[2],但它們也被稱為評(píng)分檢驗(yàn)[2]。當(dāng)在某種場(chǎng)合下同時(shí)應(yīng)用以上提及的多種檢驗(yàn)方法時(shí),檢驗(yàn)結(jié)果可能不盡相同,但通常情況下不會(huì)出現(xiàn)截然相反的結(jié)果。事實(shí)上,在上述提及的幾種檢驗(yàn)統(tǒng)計(jì)量的推導(dǎo)過(guò)程中,一般都基于大樣本條件下給出漸近的結(jié)果,而不是精確計(jì)算的結(jié)果。
本文介紹了與評(píng)分檢驗(yàn)有關(guān)的基本概念,介紹了5種評(píng)分檢驗(yàn)統(tǒng)計(jì)量,即一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量、殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量、廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量和拉格朗日乘數(shù)(或約束評(píng)分)檢驗(yàn)統(tǒng)計(jì)量。在介紹殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí),詳細(xì)呈現(xiàn)了在構(gòu)建廣義線性模型過(guò)程中的3種適用場(chǎng)合;在介紹拉格朗日乘數(shù)(或約束評(píng)分)檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí),詳細(xì)呈現(xiàn)了此種檢驗(yàn)統(tǒng)計(jì)量的多種不同定義形式,該檢驗(yàn)主要用于對(duì)參數(shù)有線性約束的場(chǎng)合。最后,基于兩個(gè)實(shí)例并借助SAS軟件,說(shuō)明了評(píng)分檢驗(yàn)的常用場(chǎng)合和呈現(xiàn)形式。