亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運(yùn)用χ2檢驗(yàn)
        ——評(píng)分檢驗(yàn)與SAS實(shí)現(xiàn)

        2022-01-07 12:50:34胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2021年6期
        關(guān)鍵詞:拉格朗因變量回歸系數(shù)

        胡純嚴(yán) ,胡良平 ,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在構(gòu)建廣義線性回歸模型的過(guò)程中,常涉及參數(shù)的檢驗(yàn)問(wèn)題,例如:檢驗(yàn)部分或全部回歸系數(shù)是否為0,檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中以及檢驗(yàn)平行線假定是否成立。在統(tǒng)計(jì)學(xué)上,實(shí)現(xiàn)前述檢驗(yàn)的具體方法有評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn)。本文僅介紹評(píng)分檢驗(yàn)及其SAS實(shí)現(xiàn)。

        1 基本概念

        1.1 評(píng)分函數(shù)

        設(shè)資料由觀測(cè)值 x1,x2,…,xN組成,并假定可用依賴于參數(shù)θ的概率模型f(x;θ)來(lái)描述該資料。當(dāng)變量x只有有限個(gè)可能的取值代入函數(shù)f(x;θ),從而指定每一個(gè)輸出的概率;當(dāng)存在無(wú)窮多個(gè)輸出f(x;θ)來(lái)指定概率密度函數(shù)時(shí),對(duì)數(shù)似然函數(shù)可表示如下:

        此時(shí),評(píng)分函數(shù)[1]表示如下:

        在式(2)中,“'”代表求函數(shù)的導(dǎo)數(shù);若θ?是θ的最可能值,則滿足u(θ?)=0。

        1.2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義

        設(shè)θ0是θ的真值,則評(píng)分就具有均值為0、方差為i(θ0),則下式定義的檢驗(yàn)統(tǒng)計(jì)量Z服從標(biāo)準(zhǔn)正態(tài)分布:

        基于式(3)定義的檢驗(yàn)被稱為評(píng)分檢驗(yàn)[1]。文獻(xiàn)[1]還給出了Wald檢驗(yàn)統(tǒng)計(jì)量,見(jiàn)下式:

        在式(4)中,θ?是θ的最大似然估計(jì)值,θ0是θ的真值,j-1是θ的方差。

        1.3 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的用途

        在評(píng)分檢驗(yàn)統(tǒng)計(jì)量中,參數(shù)θ可以是一維的,也可以是多維的(被稱為參數(shù)向量)。在統(tǒng)計(jì)學(xué)上,經(jīng)常將3種檢驗(yàn)統(tǒng)計(jì)量(即評(píng)分檢驗(yàn)統(tǒng)計(jì)量、似然比檢驗(yàn)統(tǒng)計(jì)量和Wald檢驗(yàn)統(tǒng)計(jì)量)[1-3]同時(shí)呈現(xiàn)出來(lái),其主要用途如下:檢驗(yàn)部分或全部回歸系數(shù)是否為0、檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中、檢驗(yàn)平行線假定是否成立以及檢驗(yàn)線性假設(shè)是否成立等。

        2 評(píng)分檢驗(yàn)統(tǒng)計(jì)量的種類

        2.1 一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量

        設(shè)回歸模型中的回歸系數(shù)向量β具有K個(gè)分量,在SAS/STAT的PHREG過(guò)程中,給出的5個(gè)檢驗(yàn)統(tǒng)計(jì)量(即似然比檢驗(yàn)統(tǒng)計(jì)量、一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、Wald’s檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量和穩(wěn)健Wald’s檢驗(yàn)統(tǒng)計(jì)量)都服從自由度df=K的χ2分布。這5種檢驗(yàn)都可以用于檢驗(yàn)回歸模型中全部回歸系數(shù)是否都等于0,即H0:β=0。其中,一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義有以下兩種表達(dá)形式,見(jiàn)式(5)、式(6)[2-3]:

        2.2 穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量

        在SAS/STAT的PHREG過(guò)程中,穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義[2]如下:

        式(7)中,L0i是第i個(gè)受試者在β=0處的評(píng)分殘差;也就是說(shuō),L0i=Li(0,∞),得分過(guò)程L(iβ,t)的定義如下:

        向量L?i≡Li(β?,∞)是第i個(gè)受試者的得分殘差。

        【說(shuō)明】在SAS/STAT的PHREG過(guò)程中,介紹了4種殘差,分別是邊際殘差、偏差殘差、Schoenfeld殘差和得分殘差。上式中涉及其他一些變量或符號(hào),參見(jiàn)文獻(xiàn)[2],此處從略。

        2.3 殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量

        2.3.1 檢驗(yàn)部分或全部回歸系數(shù)是否為0

        在累積和廣義(或擴(kuò)展)的logistic回歸模型中,假定因變量有K(i=1,2,…,K)個(gè)類別,共同的自變量有S個(gè)。也就是說(shuō),在每一類中擬合logistic回歸模型時(shí),都涉及一個(gè)截距項(xiàng)和S個(gè)自變量(注:指尚未篩選掉某些自變量)。為了檢驗(yàn)部分回歸系數(shù)是否為0,可以采用殘差評(píng)分χ2檢驗(yàn)。

        讓g(β)代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的一階偏導(dǎo)數(shù)向量;讓H(β)代表對(duì)數(shù)似然函數(shù)關(guān)于參數(shù)向量β的二階偏導(dǎo)數(shù)矩陣。也就是說(shuō),g(β)是梯度向量,而H(β)是哈森矩陣。讓I(β)代表“-H(β)”的期望。考慮一個(gè)無(wú)效假設(shè)H0,讓?duì)?H0是無(wú)效假設(shè)條件下β的最大似然估計(jì)值(MLE)。在SAS/STAT的LOGISTIC過(guò)程中,殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量的定義如下:

        式(9)中的χ2RS漸近服從自由度為df的χ2分布。其中,參數(shù)向量β、無(wú)效假設(shè)H0與H0對(duì)應(yīng)的向量β和自由度df都會(huì)隨著因變量的具體情形不同而有所變化。具體地說(shuō),有以下兩種情形。

        情形一:累積反應(yīng)變量模型或稱多值有序因變量模型。

        參數(shù)向量β=(α1,α2,…,αK,β1,β2,…,βS)';無(wú)效假設(shè) H0:βt+1=βt+2=…=βS,t

        情形二:廣義反應(yīng)變量模型或稱多值名義因變量模型(當(dāng)K=2時(shí)為二值反應(yīng)變量)。

        參數(shù)向量 β =(α1,α2,…,αK,β'1,β'2,…,β'S)';其中,β'i=(βi1,βi2,…,βiS);i=1,2,…,K;無(wú)效假設(shè) H0:βi,t+1=βi,t+2=…=βi,S,t

        2.3.2 檢驗(yàn)單個(gè)效應(yīng)是否不在回歸模型中

        解決問(wèn)題的基本思路:假定有兩組自變量,A組中有S個(gè)自變量(可構(gòu)建一個(gè)全模型);B組中有S-1個(gè)自變量(可構(gòu)建一個(gè)簡(jiǎn)化模型);B組中的全部自變量都包含在A組中。將A組比B組多出來(lái)的一個(gè)自變量記為xt[t∈(1,2,…,S)],于是,將A組與B組自變量及其資料分別代入式(4)計(jì)算,便可得到兩個(gè)χ2值,它們具有不同的自由度。求出這兩個(gè)χ2值之差,再基于它們的自由度之差,就可依據(jù)χ2分布求出尾端概率。

        自由度的確定方法:若是多值有序因變量,全模型與簡(jiǎn)化模型的自由度之差等于1;若是多值名義因變量,全模型與簡(jiǎn)化模型的自由度之差等于K(當(dāng)K=2時(shí)為二值因變量的情形)。當(dāng)檢驗(yàn)結(jié)果為P<0.05,表明不在B組中的自變量xt[t∈(1,2,…,S)]具有統(tǒng)計(jì)學(xué)意義;反之亦然。

        2.3.3 檢驗(yàn)平行線假定是否成立

        設(shè)因變量Y為多值有序的且水平數(shù)為K+1(即水平數(shù)大于2),讓因變量Y的取值分別為1,2,…,K,K+1。假定有S個(gè)自變量,在沒(méi)有平行線假設(shè)的條件下,一般的累積logistic回歸模型可用下式表達(dá):

        在 式(10)中 ,g(·)是 連 接 函 數(shù) ;βi=(αi,βi1,βi2,…,βiS)'是Y=i條件下的一個(gè)未知參數(shù)向量,它的分量分別是一個(gè)截距、S個(gè)斜率。這個(gè)一般累積模型的參數(shù)向量可表示成:β=(β'1,β'2,…,β'K)',它是由K個(gè)分量組成的一個(gè)向量,而每個(gè)分量就是前面所呈現(xiàn)的向量[即βi=(αi,βi1,βi2,…,βiS)']。

        給定平行線的無(wú)效假設(shè):H0:β1m=β2m=…=βKm,1≤m≤S?;貧w系數(shù)β有兩個(gè)下標(biāo),第1個(gè)下標(biāo)代表因變量Y的取值或水平代碼,第2個(gè)下標(biāo)代表自變量的順序編號(hào)。若用語(yǔ)言描述上述無(wú)效假設(shè)H0,即在因變量Y的K個(gè)水平條件下的K個(gè)logistic回歸模型中編號(hào)相同的自變量具有相等的回歸系數(shù)。也就是說(shuō),K個(gè)logistic回歸模型僅截距不同,自變量線性組合中只有一組共同的回歸系數(shù)。

        用統(tǒng)計(jì)學(xué)語(yǔ)言表述如下:讓 β1,β2,…,βS代表共同斜率系數(shù),讓 α?1,α?2,…,α?K和 β?1,β?2,…,β?S分別代表截距參數(shù)與斜率參數(shù)的最大似然估計(jì)值。那么,在H0成立的條件下,β的最大似然估計(jì)見(jiàn)式(11):

        此時(shí),與無(wú)效假設(shè)H0對(duì)應(yīng)的殘差評(píng)分χ2檢驗(yàn)統(tǒng)計(jì)量見(jiàn)式(12):

        【說(shuō)明】對(duì)平行線假定的檢驗(yàn)可視為對(duì)參數(shù)有線性約束的檢驗(yàn)(簡(jiǎn)稱約束檢驗(yàn)[6])的特例,后者常被冠以拉格朗日乘數(shù)檢驗(yàn)(參見(jiàn)下文)。

        2.4 廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量

        讓?duì)?為在限制條件L'β=0下從廣義估計(jì)方程中求解得到的回歸參數(shù);讓 S(β?)為在 β?時(shí)廣義估計(jì)方程的值。Boos和Rotnitzky與Jewell描述了在廣義估計(jì)方程中將評(píng)分檢驗(yàn)應(yīng)用于檢驗(yàn)L'β=0,其中L'是用戶指定的r×p階比較矩陣。于是,廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量[2]見(jiàn)下式:

        在式(13)中,∑m是基于模型的協(xié)方差估計(jì)值,∑m是經(jīng)驗(yàn)協(xié)方差估計(jì)值,T服從自由度df=r的χ2分布。

        2.5 拉格朗日乘數(shù)(或約束評(píng)分)檢驗(yàn)統(tǒng)計(jì)量

        在SAS/STAT的GENMOD過(guò)程中的定義如下:當(dāng)用戶給回歸模型中的參數(shù)施加某些限制(例如:NOINT,即強(qiáng)制性要求截距為0;又例如:NOSCALE,即強(qiáng)制性要求某些定量隨機(jī)變量的概率分布中的尺度參數(shù)取固定值)時(shí),需要有相應(yīng)的檢驗(yàn)方法來(lái)評(píng)價(jià)這些限制的有效性。這個(gè)檢驗(yàn)方法被稱為拉格朗日乘數(shù)檢驗(yàn)或約束評(píng)分檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量[2]見(jiàn)式(14):

        式(14)中,S是在與被限制參數(shù)對(duì)應(yīng)的限制的最大值點(diǎn)上估計(jì)的評(píng)分向量的成分;而V=I11-I12I-122I21,其中矩陣I是信息矩陣,下標(biāo)中的1指被限制的參數(shù),下標(biāo)中的2指未被限制的其他參數(shù)。

        【說(shuō)明】因篇幅所限,在SAS/ETS的ENTROPY過(guò)程中的定義、在SAS/ETS的MDC、MODEL和QLIM過(guò)程中的定義以及在SAS/ETS的PANEL過(guò)程中的定義從略。

        3 實(shí)例與SAS實(shí)現(xiàn)

        3.1 問(wèn)題與數(shù)據(jù)

        【例1】一項(xiàng)關(guān)于成年人心理健康問(wèn)題的研究,調(diào)查了某城市40例成年居民的心理健康狀況(1=無(wú)心理問(wèn)題,2=存在輕微癥狀,3=存在中度癥狀,4=存在精神損害),考察的兩個(gè)原因變量分別是社會(huì)經(jīng)濟(jì)地位(0=低,1=高)和生活事件評(píng)分,資料見(jiàn)表1[4]。試分析心理健康狀況與兩個(gè)原因變量的關(guān)系。

        表1 成年人心理健康狀況調(diào)查資料

        【例2】隨機(jī)納入30例在某醫(yī)院就診的僅有胸悶癥狀的非器質(zhì)性心臟病患者,收集患者在24小時(shí)中的早搏數(shù)(y),試問(wèn)早搏是否與吸煙(x1)、性別(x2)和喝咖啡(x3)有關(guān)。資料見(jiàn)表2[5]。

        表2 某醫(yī)院伴有胸悶癥狀的非器質(zhì)性心臟病患者情況

        3.2 分析與解答

        3.2.1 對(duì)例1的分析與解答

        【分析與解答】設(shè)所需要的SAS程序如下:

        【SAS輸出結(jié)果及解釋】

        第1個(gè)過(guò)程步的主要輸出結(jié)果:

        以上是模型中含有截距項(xiàng)和自變量life時(shí)的比例優(yōu)比假設(shè)的評(píng)分檢驗(yàn)結(jié)果,也被稱為平行線假設(shè)檢驗(yàn)結(jié)果。因χ2RS=0.8865,df=2,P=0.6419,說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。

        以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型(含截距項(xiàng)和一個(gè)自變量life)是否成立,由于3種檢驗(yàn)結(jié)果均有P<0.05,說(shuō)明此時(shí)的logistic回歸模型成立。

        以上是逐步選擇匯總,從第2列與倒數(shù)第3列可知,選擇自變量進(jìn)入回歸模型時(shí)采用的是評(píng)分χ2檢驗(yàn);而從第3列與倒數(shù)第2列可知,刪除自變量時(shí)采用的是 Wald χ2檢驗(yàn)。

        第2個(gè)過(guò)程步的主要輸出結(jié)果:

        以上輸出的是平行線假定的檢驗(yàn)結(jié)果,因P=0.6761>0.05,說(shuō)明資料滿足構(gòu)建logistic回歸模型的前提條件。

        以上是采用3種檢驗(yàn)方法檢驗(yàn)此時(shí)的logistic回歸模型[含截距項(xiàng)和兩個(gè)自變量(life和society)]是否成立,由于3種檢驗(yàn)結(jié)果均有P<0.05,說(shuō)明此時(shí)的logistic回歸模型成立。

        以上輸出的是線性假設(shè)檢驗(yàn)結(jié)果。第1行的結(jié)果說(shuō)明0.5×β1+1×β2=0的假設(shè)成立;第2行的結(jié)果說(shuō)明 β1=β2的假設(shè)不成立。這里采用的是 Wald χ2檢驗(yàn),而不是似然比χ2檢驗(yàn)和拉格朗日χ2檢驗(yàn)。

        【說(shuō)明】為節(jié)省篇幅,以上僅呈現(xiàn)了與評(píng)分檢驗(yàn)有關(guān)的輸出結(jié)果,故不適合給出統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論。

        3.2.2 對(duì)例2的分析與解答

        【分析與解答】設(shè)所需要的SAS程序如下:

        【SAS輸出結(jié)果及解釋】

        第1個(gè)過(guò)程步的主要輸出結(jié)果:

        以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果,χ2LM=8.6315,P=0.0017,說(shuō)明資料存在過(guò)度離散現(xiàn)象,不適合直接擬合Poisson分布回歸模型。

        第2個(gè)過(guò)程步的主要輸出結(jié)果:

        以上輸出的是拉格朗日乘數(shù)檢驗(yàn)結(jié)果,χ2LM=0.9727,P=0.1620,說(shuō)明此時(shí)的資料(不包括自變量x3)不存在過(guò)度離散現(xiàn)象,可直接擬合Poisson分布回歸模型。

        第3個(gè)過(guò)程步的輸出結(jié)果與評(píng)分檢驗(yàn)無(wú)關(guān),為節(jié)省篇幅,此處從略。

        【說(shuō)明】為節(jié)省篇幅,以上僅呈現(xiàn)了與評(píng)分檢驗(yàn)有關(guān)的輸出結(jié)果,故不適合給出統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論。

        4 討論與小結(jié)

        4.1 討論

        在進(jìn)行廣義線性模型[6]分析,特別是進(jìn)行多重logistic回歸模型[7-10]分析時(shí),在多個(gè)環(huán)節(jié)上需要對(duì)參數(shù)進(jìn)行假設(shè)檢驗(yàn),有時(shí)還需要在參數(shù)處于特定約束條件下對(duì)其進(jìn)行檢驗(yàn)。通常涉及3種檢驗(yàn),即評(píng)分檢驗(yàn)、似然比檢驗(yàn)和Wald檢驗(yàn);當(dāng)有約束條件時(shí),其檢驗(yàn)被稱為約束檢驗(yàn)[6]或拉格朗日乘數(shù)檢驗(yàn)[2],但它們也被稱為評(píng)分檢驗(yàn)[2]。當(dāng)在某種場(chǎng)合下同時(shí)應(yīng)用以上提及的多種檢驗(yàn)方法時(shí),檢驗(yàn)結(jié)果可能不盡相同,但通常情況下不會(huì)出現(xiàn)截然相反的結(jié)果。事實(shí)上,在上述提及的幾種檢驗(yàn)統(tǒng)計(jì)量的推導(dǎo)過(guò)程中,一般都基于大樣本條件下給出漸近的結(jié)果,而不是精確計(jì)算的結(jié)果。

        4.2 小結(jié)

        本文介紹了與評(píng)分檢驗(yàn)有關(guān)的基本概念,介紹了5種評(píng)分檢驗(yàn)統(tǒng)計(jì)量,即一般評(píng)分檢驗(yàn)統(tǒng)計(jì)量、穩(wěn)健評(píng)分檢驗(yàn)統(tǒng)計(jì)量、殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量、廣義評(píng)分檢驗(yàn)統(tǒng)計(jì)量和拉格朗日乘數(shù)(或約束評(píng)分)檢驗(yàn)統(tǒng)計(jì)量。在介紹殘差評(píng)分檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí),詳細(xì)呈現(xiàn)了在構(gòu)建廣義線性模型過(guò)程中的3種適用場(chǎng)合;在介紹拉格朗日乘數(shù)(或約束評(píng)分)檢驗(yàn)統(tǒng)計(jì)量這部分內(nèi)容時(shí),詳細(xì)呈現(xiàn)了此種檢驗(yàn)統(tǒng)計(jì)量的多種不同定義形式,該檢驗(yàn)主要用于對(duì)參數(shù)有線性約束的場(chǎng)合。最后,基于兩個(gè)實(shí)例并借助SAS軟件,說(shuō)明了評(píng)分檢驗(yàn)的常用場(chǎng)合和呈現(xiàn)形式。

        猜你喜歡
        拉格朗因變量回歸系數(shù)
        調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
        適應(yīng)性回歸分析(Ⅳ)
        ——與非適應(yīng)性回歸分析的比較
        Nearly Kaehler流形S3×S3上的切觸拉格朗日子流形
        多元線性回歸的估值漂移及其判定方法
        電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋(píng)果砧木抗寒性的比較
        偏最小二乘回歸方法
        多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
        拉格朗日代數(shù)方程求解中的置換思想
        基于拉格朗日的IGS精密星歷和鐘差插值分析
        拉格朗日點(diǎn)
        太空探索(2014年3期)2014-07-10 14:59:39
        日本一区中文字幕在线播放| 亚洲男人av天堂午夜在| 亚洲精品久久久久久久久av无码| 国产婷婷丁香五月麻豆| 亚洲成片在线看一区二区| 自拍偷拍韩国三级视频| 日本无遮挡真人祼交视频| 国产精品久久国产精品99| 天天躁日日躁狠狠躁av中文| 久久亚洲精品成人av无码网站| 亚洲狠狠婷婷综合久久久久图片| 中文字幕亚洲欧美日韩在线不卡| 精品丝袜国产在线播放| 日日噜噜噜夜夜狠狠久久蜜桃 | 国产午夜福利精品| 国产高清亚洲精品视频| 精品老熟女一区二区三区在线| 77777亚洲午夜久久多喷| 天下第二社区在线视频| 国产日产精品久久久久久| 亚洲国产一区二区三区,| 青青草免费手机直播视频| 亚洲av日韩精品久久久久久a| 少妇性l交大片| 无码一区二区三区网站| 官网A级毛片| 好看的中文字幕中文在线| 日韩欧美中文字幕公布| 日本在线看片免费人成视频1000| 免费国产黄线在线播放| 麻豆视频在线观看免费在线观看| 97精品一区二区三区| 日本大片免费观看视频| 亚洲精品无码久久毛片| 激情文学人妻中文字幕| 亚洲av狠狠爱一区二区三区| 精品午夜福利在线观看| 夜夜高潮夜夜爽夜夜爱爱| 天天中文字幕av天天爽| 亚洲精品美女中文字幕久久| 国产精品久久久久久久久绿色|