亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

如何正確運(yùn)用χ2檢驗(yàn)
——評(píng)分檢驗(yàn)與SAS實(shí)現(xiàn)

2022-01-07 12:50:34胡純嚴(yán)胡良平

四川精神衛(wèi)生 2021年6期

胡純嚴(yán) ，胡良平，2*

（1.軍事科學(xué)院研究生院，北京 100850；2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì)，北京 100029*通信作者：胡良平，E-mail：lphu927@163.com）

在構(gòu)建廣義線性回歸模型的過(guò)程中，常涉及參數(shù)的檢驗(yàn)問(wèn)題，例如：檢驗(yàn)部分或全部回歸系數(shù)是否為0，檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中以及檢驗(yàn)平行線假定是否成立。在統(tǒng)計(jì)學(xué)上，實(shí)現(xiàn)前述檢驗(yàn)的具體方法有評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn)。本文僅介紹評(píng)分檢驗(yàn)及其SAS實(shí)現(xiàn)。

1 基本概念

1.1 評(píng)分函數(shù)

設(shè)資料由觀測(cè)值 x1，x2，…，xN組成，并假定可用依賴于參數(shù)θ的概率模型f（x；θ）來(lái)描述該資料。當(dāng)變量x只有有限個(gè)可能的取值代入函數(shù)f（x；θ），從而指定每一個(gè)輸出的概率；當(dāng)存在無(wú)窮多個(gè)輸出f（x；θ）來(lái)指定概率密度函數(shù)時(shí)，對(duì)數(shù)似然函數(shù)可表示如下：

此時(shí)，評(píng)分函數(shù)［1］表示如下：

在式（2）中，“'”代表求函數(shù)的導(dǎo)數(shù)；若θ?是θ的最可能值，則滿足u（θ?）=0。

1.2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義

設(shè)θ0是θ的真值，則評(píng)分就具有均值為0、方差為i（θ0），則下式定義的檢驗(yàn)統(tǒng)計(jì)量Z服從標(biāo)準(zhǔn)正態(tài)分布：

基于式（3）定義的檢驗(yàn)被稱為評(píng)分檢驗(yàn)［1］。文獻(xiàn)［1］還給出了Wald檢驗(yàn)統(tǒng)計(jì)量，見(jiàn)下式：

在式（4）中，θ?是θ的最大似然估計(jì)值，θ0是θ的真值，j-1是θ的方差。

1.3 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的用途

在評(píng)分檢驗(yàn)統(tǒng)計(jì)量中，參數(shù)θ可以是一維的，也可以是多維的（被稱為參數(shù)向量）。在統(tǒng)計(jì)學(xué)上，經(jīng)常將3種檢驗(yàn)統(tǒng)計(jì)量（即評(píng)分檢驗(yàn)統(tǒng)計(jì)量、似然比檢驗(yàn)統(tǒng)計(jì)量和Wald檢驗(yàn)統(tǒng)計(jì)量）［1-3］同時(shí)呈現(xiàn)出來(lái)，其主要用途如下：檢驗(yàn)部分或全部回歸系數(shù)是否為0、檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中、檢驗(yàn)平行線假定是否成立以及檢驗(yàn)線性假設(shè)是否成立等。

2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的種類

2.1 一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量

設(shè)回歸模型中的回歸系數(shù)向量β具有K個(gè)分量，在SAS/STAT的PHREG過(guò)程中，給出的5個(gè)檢驗(yàn)統(tǒng)計(jì)量（即似然比檢驗(yàn)統(tǒng)計(jì)量、一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、Wald’s檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量和穩(wěn)健Wald’s檢驗(yàn)統(tǒng)計(jì)量）都服從自由度df=K的χ2分布。這5種檢驗(yàn)都可以用于檢驗(yàn)回歸模型中全部回歸系數(shù)是否都等于0，即H0：β=0。其中，一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義有以下兩種表達(dá)形式，見(jiàn)式（5）、式（6）［2-3］：

2.2 穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量

在SAS/STAT的PHREG過(guò)程中，穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義［2］如下：

式（7）中，L0i是第i個(gè)受試者在β=0處的評(píng)分殘差；也就是說(shuō)，L0i=Li（0，∞），得分過(guò)程L（iβ，t）的定義如下：

向量L?i≡Li（β?，∞）是第i個(gè)受試者的得分殘差。

【說(shuō)明】在SAS/STAT的PHREG過(guò)程中，介紹了4種殘差，分別是邊際殘差、偏差殘差、Schoenfeld殘差和得分殘差。上式中涉及其他一些變量或符號(hào)，參見(jiàn)文獻(xiàn)［2］，此處從略。

2.3 殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量

2.3.1 檢驗(yàn)部分或全部回歸系數(shù)是否為0

在累積和廣義（或擴(kuò)展）的logistic回歸模型中，假定因變量有K（i=1，2，…，K）個(gè)類別，共同的自變量有S個(gè)。也就是說(shuō)，在每一類中擬合logistic回歸模型時(shí)，都涉及一個(gè)截距項(xiàng)和S個(gè)自變量（注：指尚未篩選掉某些自變量）。為了檢驗(yàn)部分回歸系數(shù)是否為0，可以采用殘差評(píng)分χ2檢驗(yàn)。

讓g（β）代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的一階偏導(dǎo)數(shù)向量；讓H（β）代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的二階偏導(dǎo)數(shù)矩陣。也就是說(shuō)，g（β）是梯度向量，而H（β）是哈森矩陣。讓I（β）代表“-H（β）”的期望。考慮一個(gè)無(wú)效假設(shè)H0，讓?duì)?H0是無(wú)效假設(shè)條件下β的最大似然估計(jì)值（MLE）。在SAS/STAT的LOGISTIC過(guò)程中，殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義如下：

式（9）中的χ2RS漸近服從自由度為df的χ2分布。其中，參數(shù)向量β、無(wú)效假設(shè)H0與H0對(duì)應(yīng)的向量β和自由度df都會(huì)隨著因變量的具體情形不同而有所變化。具體地說(shuō)，有以下兩種情形。

情形一：累積反應(yīng)變量模型或稱多值有序因變量模型。

參數(shù)向量β=（α1，α2，…，αK，β1，β2，…，βS）'；無(wú)效假設(shè) H0：βt+1=βt+2=…=βS，t

情形二：廣義反應(yīng)變量模型或稱多值名義因變量模型（當(dāng)K=2時(shí)為二值反應(yīng)變量）。

參數(shù)向量 β =（α1，α2，…，αK，β'1，β'2，…，β'S）'；其中，β'i=（βi1，βi2，…，βiS）；i=1，2，…，K；無(wú)效假設(shè) H0：βi，t+1=βi，t+2=…=βi，S，t

2.3.2 檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中

解決問(wèn)題的基本思路：假定有兩組自變量，A組中有S個(gè)自變量（可構(gòu)建一個(gè)全模型）；B組中有S-1個(gè)自變量（可構(gòu)建一個(gè)簡(jiǎn)化模型）；B組中的全部自變量都包含在A組中。將A組比B組多出來(lái)的一個(gè)自變量記為xt［t∈（1，2，…，S）］，于是，將A組與B組自變量及其資料分別代入式（4）計(jì)算，便可得到兩個(gè)χ2值，它們具有不同的自由度。求出這兩個(gè)χ2值之差，再基于它們的自由度之差，就可依據(jù)χ2分布求出尾端概率。

自由度的確定方法：若是多值有序因變量，全模型與簡(jiǎn)化模型的自由度之差等于1；若是多值名義因變量，全模型與簡(jiǎn)化模型的自由度之差等于K（當(dāng)K=2時(shí)為二值因變量的情形）。當(dāng)檢驗(yàn)結(jié)果為P<0.05，表明不在B組中的自變量xt［t∈（1，2，…，S）］具有統(tǒng)計(jì)學(xué)意義；反之亦然。

2.3.3 檢驗(yàn)平行線假定是否成立

設(shè)因變量Y為多值有序的且水平數(shù)為K+1（即水平數(shù)大于2），讓因變量Y的取值分別為1，2，…，K，K+1。假定有S個(gè)自變量，在沒(méi)有平行線假設(shè)的條件下，一般的累積logistic回歸模型可用下式表達(dá)：

在式（10）中，g（·）是連接函數(shù) ；βi=（αi，βi1，βi2，…，βiS）'是Y=i條件下的一個(gè)未知參數(shù)向量，它的分量分別是一個(gè)截距、S個(gè)斜率。這個(gè)一般累積模型的參數(shù)向量可表示成：β=（β'1，β'2，…，β'K）'，它是由K個(gè)分量組成的一個(gè)向量，而每個(gè)分量就是前面所呈現(xiàn)的向量［即βi=（αi，βi1，βi2，…，βiS）'］。

給定平行線的無(wú)效假設(shè)：H0：β1m=β2m=…=βKm，1≤m≤S?；貧w系數(shù)β有兩個(gè)下標(biāo)，第1個(gè)下標(biāo)代表因變量Y的取值或水平代碼，第2個(gè)下標(biāo)代表自變量的順序編號(hào)。若用語(yǔ)言描述上述無(wú)效假設(shè)H0，即在因變量Y的K個(gè)水平條件下的K個(gè)logistic回歸模型中編號(hào)相同的自變量具有相等的回歸系數(shù)。也就是說(shuō)，K個(gè)logistic回歸模型僅截距不同，自變量線性組合中只有一組共同的回歸系數(shù)。

用統(tǒng)計(jì)學(xué)語(yǔ)言表述如下：讓 β1，β2，…，βS代表共同斜率系數(shù)，讓 α?1，α?2，…，α?K和 β?1，β?2，…，β?S分別代表截距參數(shù)與斜率參數(shù)的最大似然估計(jì)值。那么，在H0成立的條件下，β的最大似然估計(jì)見(jiàn)式（11）：

此時(shí)，與無(wú)效假設(shè)H0對(duì)應(yīng)的殘差評(píng)分χ2檢驗(yàn)統(tǒng)計(jì)量見(jiàn)式（12）：

【說(shuō)明】對(duì)平行線假定的檢驗(yàn)可視為對(duì)參數(shù)有線性約束的檢驗(yàn)（簡(jiǎn)稱約束檢驗(yàn)［6］）的特例，后者常被冠以拉格朗日乘數(shù)檢驗(yàn)（參見(jiàn)下文）。

2.4 廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量

讓?duì)?為在限制條件L'β=0下從廣義估計(jì)方程中求解得到的回歸參數(shù)；讓 S（β?）為在 β?時(shí)廣義估計(jì)方程的值。Boos和Rotnitzky與Jewell描述了在廣義估計(jì)方程中將評(píng)分檢驗(yàn)應(yīng)用于檢驗(yàn)L'β=0，其中L'是用戶指定的r×p階比較矩陣。于是，廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量［2］見(jiàn)下式：

在式（13）中，∑m是基于模型的協(xié)方差估計(jì)值，∑m是經(jīng)驗(yàn)協(xié)方差估計(jì)值，T服從自由度df=r的χ2分布。

2.5 拉格朗日乘數(shù)（或約束評(píng)分）檢驗(yàn)統(tǒng)計(jì)量

在SAS/STAT的GENMOD過(guò)程中的定義如下：當(dāng)用戶給回歸模型中的參數(shù)施加某些限制（例如：NOINT，即強(qiáng)制性要求截距為0；又例如：NOSCALE，即強(qiáng)制性要求某些定量隨機(jī)變量的概率分布中的尺度參數(shù)取固定值）時(shí)，需要有相應(yīng)的檢驗(yàn)方法來(lái)評(píng)價(jià)這些限制的有效性。這個(gè)檢驗(yàn)方法被稱為拉格朗日乘數(shù)檢驗(yàn)或約束評(píng)分檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量［2］見(jiàn)式（14）：

式（14）中，S是在與被限制參數(shù)對(duì)應(yīng)的限制的最大值點(diǎn)上估計(jì)的評(píng)分向量的成分；而V=I11-I12I-122I21，其中矩陣I是信息矩陣，下標(biāo)中的1指被限制的參數(shù)，下標(biāo)中的2指未被限制的其他參數(shù)。

【說(shuō)明】因篇幅所限，在SAS/ETS的ENTROPY過(guò)程中的定義、在SAS/ETS的MDC、MODEL和QLIM過(guò)程中的定義以及在SAS/ETS的PANEL過(guò)程中的定義從略。

3 實(shí)例與SAS實(shí)現(xiàn)

3.1 問(wèn)題與數(shù)據(jù)

【例1】一項(xiàng)關(guān)于成年人心理健康問(wèn)題的研究，調(diào)查了某城市40例成年居民的心理健康狀況（1=無(wú)心理問(wèn)題，2=存在輕微癥狀，3=存在中度癥狀，4=存在精神損害），考察的兩個(gè)原因變量分別是社會(huì)經(jīng)濟(jì)地位（0=低，1=高）和生活事件評(píng)分，資料見(jiàn)表1［4］。試分析心理健康狀況與兩個(gè)原因變量的關(guān)系。

表1 成年人心理健康狀況調(diào)查資料

【例2】隨機(jī)納入30例在某醫(yī)院就診的僅有胸悶癥狀的非器質(zhì)性心臟病患者，收集患者在24小時(shí)中的早搏數(shù)（y），試問(wèn)早搏是否與吸煙（x1）、性別（x2）和喝咖啡（x3）有關(guān)。資料見(jiàn)表2［5］。

表2 某醫(yī)院伴有胸悶癥狀的非器質(zhì)性心臟病患者情況

3.2 分析與解答

3.2.1 對(duì)例1的分析與解答

【分析與解答】設(shè)所需要的SAS程序如下：

【SAS輸出結(jié)果及解釋】

第1個(gè)過(guò)程步的主要輸出結(jié)果：

以上是模型中含有截距項(xiàng)和自變量life時(shí)的比例優(yōu)比假設(shè)的評(píng)分檢驗(yàn)結(jié)果，也被稱為平行線假設(shè)檢驗(yàn)結(jié)果。因χ2RS=0.8865，df=2，P=0.6419，說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。

以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型（含截距項(xiàng)和一個(gè)自變量life）是否成立，由于3種檢驗(yàn)結(jié)果均有P<0.05，說(shuō)明此時(shí)的logistic回歸模型成立。

以上是逐步選擇匯總，從第2列與倒數(shù)第3列可知，選擇自變量進(jìn)入回歸模型時(shí)采用的是評(píng)分χ2檢驗(yàn)；而從第3列與倒數(shù)第2列可知，刪除自變量時(shí)采用的是 Wald χ2檢驗(yàn)。

第2個(gè)過(guò)程步的主要輸出結(jié)果：

以上輸出的是平行線假定的檢驗(yàn)結(jié)果，因P=0.6761>0.05，說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。

以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型［含截距項(xiàng)和兩個(gè)自變量（life和society）］是否成立，由于3種檢驗(yàn)結(jié)果均有P<0.05，說(shuō)明此時(shí)的logistic回歸模型成立。

以上輸出的是線性假設(shè)檢驗(yàn)結(jié)果。第1行的結(jié)果說(shuō)明0.5×β1+1×β2=0的假設(shè)成立；第2行的結(jié)果說(shuō)明 β1=β2的假設(shè)不成立。這里采用的是 Wald χ2檢驗(yàn)，而不是似然比χ2檢驗(yàn)和拉格朗日χ2檢驗(yàn)。

【說(shuō)明】為節(jié)省篇幅，以上僅呈現(xiàn)了與評(píng)分檢驗(yàn)有關(guān)的輸出結(jié)果，故不適合給出統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論。

3.2.2 對(duì)例2的分析與解答

【分析與解答】設(shè)所需要的SAS程序如下：

【SAS輸出結(jié)果及解釋】

第1個(gè)過(guò)程步的主要輸出結(jié)果：

以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果，χ2LM=8.6315，P=0.0017，說(shuō)明資料存在過(guò)度離散現(xiàn)象，不適合直接擬合Poisson分布回歸模型。

第2個(gè)過(guò)程步的主要輸出結(jié)果：

以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果，χ2LM=0.9727，P=0.1620，說(shuō)明此時(shí)的資料（不包括自變量x3）不存在過(guò)度離散現(xiàn)象，可直接擬合Poisson分布回歸模型。

第3個(gè)過(guò)程步的輸出結(jié)果與評(píng)分檢驗(yàn)無(wú)關(guān)，為節(jié)省篇幅，此處從略。

4 討論與小結(jié)

4.1 討論

在進(jìn)行廣義線性模型［6］分析，特別是進(jìn)行多重logistic回歸模型［7-10］分析時(shí)，在多個(gè)環(huán)節(jié)上需要對(duì)參數(shù)進(jìn)行假設(shè)檢驗(yàn)，有時(shí)還需要在參數(shù)處于特定約束條件下對(duì)其進(jìn)行檢驗(yàn)。通常涉及3種檢驗(yàn)，即評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn)；當(dāng)有約束條件時(shí)，其檢驗(yàn)被稱為約束檢驗(yàn)［6］或拉格朗日乘數(shù)檢驗(yàn)［2］，但它們也被稱為評(píng)分檢驗(yàn)［2］。當(dāng)在某種場(chǎng)合下同時(shí)應(yīng)用以上提及的多種檢驗(yàn)方法時(shí)，檢驗(yàn)結(jié)果可能不盡相同，但通常情況下不會(huì)出現(xiàn)截然相反的結(jié)果。事實(shí)上，在上述提及的幾種檢驗(yàn)統(tǒng)計(jì)量的推導(dǎo)過(guò)程中，一般都基于大樣本條件下給出漸近的結(jié)果，而不是精確計(jì)算的結(jié)果。

4.2 小結(jié)

本文介紹了與評(píng)分檢驗(yàn)有關(guān)的基本概念，介紹了5種評(píng)分檢驗(yàn)統(tǒng)計(jì)量，即一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量、殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量、廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量和拉格朗日乘數(shù)（或約束評(píng)分）檢驗(yàn)統(tǒng)計(jì)量。在介紹殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí)，詳細(xì)呈現(xiàn)了在構(gòu)建廣義線性模型過(guò)程中的3種適用場(chǎng)合；在介紹拉格朗日乘數(shù)（或約束評(píng)分）檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí)，詳細(xì)呈現(xiàn)了此種檢驗(yàn)統(tǒng)計(jì)量的多種不同定義形式，該檢驗(yàn)主要用于對(duì)參數(shù)有線性約束的場(chǎng)合。最后，基于兩個(gè)實(shí)例并借助SAS軟件，說(shuō)明了評(píng)分檢驗(yàn)的常用場(chǎng)合和呈現(xiàn)形式。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

如何正確運(yùn)用χ2檢驗(yàn)——評(píng)分檢驗(yàn)與SAS實(shí)現(xiàn)

1 基本概念

1.1 評(píng)分函數(shù)

1.2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義

1.3 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的用途

2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的種類

2.1 一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量

2.2 穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量

2.3 殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量

2.4 廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量

2.5 拉格朗日乘數(shù)（或約束評(píng)分）檢驗(yàn)統(tǒng)計(jì)量

3 實(shí)例與SAS實(shí)現(xiàn)

3.1 問(wèn)題與數(shù)據(jù)

3.2 分析與解答

4 討論與小結(jié)

4.1 討論

4.2 小結(jié)

如何正確運(yùn)用χ2檢驗(yàn)
——評(píng)分檢驗(yàn)與SAS實(shí)現(xiàn)