亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運(yùn)用χ2檢驗
        ——Wald’s檢驗與SAS實現(xiàn)

        2022-01-07 12:50:36胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2021年6期
        關(guān)鍵詞:頻數(shù)回歸系數(shù)對數(shù)

        胡純嚴(yán) ,胡良平 ,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在構(gòu)建廣義線性回歸模型、Cox比例和非比例風(fēng)險回歸模型的過程中,常涉及參數(shù)的檢驗問題,例如:檢驗部分或全部回歸系數(shù)是否為0;還會涉及前述提及的各種情形下回歸系數(shù)的區(qū)間估計問題;在處理復(fù)雜抽樣設(shè)計定性資料時,可能會涉及一維頻數(shù)分布表資料和二維頻數(shù)分布表資料的獨(dú)立性假設(shè)檢驗問題。本文介紹解決前述提及的三類問題所需要的Wald’s檢驗及其SAS實現(xiàn)。

        1 Wald’s檢驗統(tǒng)計量的種類

        1.1 一般Wald’s檢驗統(tǒng)計量和穩(wěn)健Wald’s檢驗統(tǒng)計量

        設(shè)logistic回歸模型中只有一個自變量,則檢驗回歸系數(shù)β是否為0,可用以下兩個公式[1-3]之一:

        設(shè)logistic回歸模型中的回歸系數(shù)向量β具有K個分量,在SAS/STAT的PHREG過程中,給出的5個檢驗統(tǒng)計量(即似然比檢驗統(tǒng)計量、一般評分檢驗統(tǒng)計量、Wald’s檢驗統(tǒng)計量、穩(wěn)健評分檢驗統(tǒng)計量和穩(wěn)健Wald’s檢驗統(tǒng)計量)都服從自由度df=K的χ2分布。這5種檢驗都可以用于檢驗回歸模型中全部回歸系數(shù)是否都等于0,即H0:β=0。其中,一般Wald’s檢驗統(tǒng)計量和穩(wěn)健Wald’s檢驗統(tǒng)計量的定義[4-5]如下:

        Binder于1992年將權(quán)重整合到分析之中,推導(dǎo)出β?的穩(wěn)健中間方差估計量:

        式(5)中,I(β?)是觀測的信息矩陣,a?2=aa'。

        注意:當(dāng)wi≡1,V?S(β?)=D'D,此處,D是DFBETA殘差矩陣(說明:DFBETA變量與回歸分析資料中每一個觀測有關(guān),它是用來度量每個觀測對回歸系數(shù)影響大小的一個差量 δβ?i= β?- β?(i),其中 β?是全部觀測所對應(yīng)的回歸系數(shù)或回歸系數(shù)向量,而β?(i)是第i個觀測不在回歸模型中所對應(yīng)的回歸系數(shù)或回歸系數(shù)向量)。

        【說明】Wald’s檢驗統(tǒng)計量可用于檢驗單個回歸系數(shù)或全部回歸系數(shù)是否為0;可用于檢驗已進(jìn)入回歸模型中的自變量是否可以被刪除;還可用于估計回歸系數(shù)的置信區(qū)間。

        1.2 約束Wald’s χ2檢驗

        關(guān)于回歸系數(shù)β的線性假設(shè)可以表述如下:

        式(6)中,L是線性假設(shè)的系數(shù)矩陣;c是常數(shù)向量;回歸系數(shù)β的向量包含斜率參數(shù)和截距參數(shù)。與檢驗假設(shè)H0對應(yīng)的約束Wald’s χ2檢驗統(tǒng)計量見式(7):

        【說明】當(dāng)取常數(shù)向量c=0時,此檢驗方法可用于檢驗回歸模型中參數(shù)是否為0。

        1.3 廣義Wald’s檢驗統(tǒng)計量與廣義Wald’s對數(shù)線性檢驗統(tǒng)計量

        1.3.1 概述

        在SAS/STAT的SURVEYFREQ過程中,針對復(fù)雜抽樣設(shè)計(包括整群抽樣和分層抽樣)頻數(shù)資料,有兩種檢驗二維列聯(lián)表資料中行、列兩變量之間獨(dú)立性假設(shè)的新方法,即廣義Wald’s χ2檢驗與廣義Wald’s對數(shù)線性χ2檢驗。其中,廣義Wald’s χ2檢驗法是基于加權(quán)觀察頻數(shù)與加權(quán)期望頻數(shù)之差量構(gòu)造出來的;而廣義Wald’s對數(shù)線性χ2檢驗法是基于對數(shù)優(yōu)勢比構(gòu)造出來的。在構(gòu)造這兩種檢驗方法的過程中,都將復(fù)雜抽樣設(shè)計考慮在內(nèi)。在大樣本條件下,前述提及的兩種檢驗統(tǒng)計量均服從自由度df=(R-1)(C-1)的χ2分布。然而,依據(jù)實際的顯著性水平和檢驗效能來考量,前述提及的兩種檢驗方法已顯示出較差的表現(xiàn),特別是對于具有大的格頻數(shù)或相對較小群數(shù)的二維列聯(lián)表資料更是如此。為此,有多位統(tǒng)計學(xué)家提出了改進(jìn)的建議,即采用F檢驗(用于2×2列聯(lián)表資料)和校正F檢驗(用于非2×2列聯(lián)表資料)。F檢驗和校正F檢驗比前述提及的兩種χ2檢驗更穩(wěn)定[4]。

        1.3.2 廣義Wald’s χ2檢驗統(tǒng)計量

        在二維列聯(lián)表資料中行、列兩變量之間獨(dú)立性假設(shè)成立的條件下,期望格頻數(shù)的計算方法如下:

        式(8)中,N?r.與N?.c分別代表第r行與第c列上估計的頻數(shù),N?代表估計的總頻數(shù)??傮w加權(quán)頻數(shù)等于期望頻數(shù)的無效假設(shè),可以采用下式表達(dá):

        式(9)中,r=1,2,…,(R-1),c=1,2,…,(C-1)。于是,廣義Wald’s檢驗統(tǒng)計量的定義見下式:

        式(10)中,Y?是由(R-1)(C-1)個觀察加權(quán)頻數(shù)與期望加權(quán)頻數(shù)之差量(N?rc-Erc)組成的數(shù)組,HV?(N?)H'是Y?的方差的估計值,V?(N?)是N?rc估計值的協(xié)方差矩陣。在SAS/STAT的SURVEYFREQ過程中,方差估計方法共有6種,即臺勞級數(shù)方差估計量、復(fù)制方差估計量、自助法、平衡重復(fù)復(fù)制(BBR)法、Fay’s BBR法和刀切法[4],因篇幅所限,此處從略。H是一個Q×P階矩陣,其中,Q=(R-1)(C-1),P=R×C。H矩陣的元素為Y?的元素關(guān)于N?的元素的偏導(dǎo)數(shù)。

        1.3.3 廣義Wald’s對數(shù)線性χ2檢驗統(tǒng)計量

        對于R行C列的二維列聯(lián)表資料,廣義Wald’s對數(shù)線性檢驗基于一個(R-1)(C-1)維的數(shù)組導(dǎo)出,其元素Y?rc定義如下:

        式(11)中,N?rc是二維表中第(r,c)格上被估計的總頻數(shù)。行與列變量之間的獨(dú)立性假設(shè)可采用下式來表達(dá):

        式(12)中,r=1,2,…,(R-1),c=1,2,…,(C-1)。于是,廣義Wald’s對數(shù)線性檢驗統(tǒng)計量的定義見下式:

        式(13)中,Y?是 Y?rc的(R-1)(C-1)維的數(shù)組,V?(Y?)是Y?的方差估計值,其計算見下式:

        式(14)中,V?(N?)是估計量 N?rc的協(xié)方差矩陣;D是一個對角矩陣,其對角線上的元素為估計的總數(shù)N?rc;A是一個Q×P階矩陣,其中,Q=(R-1)(C-1),P=RC×RC。

        1.3.4 Wald’s F檢驗統(tǒng)計量與Wald’s校正F檢驗統(tǒng)計量

        基于公式(10)得到Wald’s F檢驗統(tǒng)計量見式(15):

        式(15)中,F(xiàn)W服從分子自由度df1=(R-1)(C-1)、分母自由度為df2的F分布。

        對于大于2×2表的二維列聯(lián)表資料,需要計算校正的F檢驗統(tǒng)計量?;诠剑?0)得到Wald’s校正F檢驗統(tǒng)計量見式(16):

        式(16)中,k=df1=(R-1)(C-1),s=df2。

        上面提及的df2的取值與抽樣設(shè)計和方差估計方法有關(guān)。如果采用臺勞級數(shù)法估計方差,df2=群數(shù)-層數(shù);如果沒有群數(shù),df2=觀測數(shù)-層數(shù);若不是分層設(shè)計,df2=群數(shù)-1。如果采用復(fù)制法估計方差,df2=復(fù)制數(shù)。如果采用BBR法估計方差,df2=層數(shù)。如果采用自助法和刀切法估計方差,df2=群數(shù)-層數(shù);如果沒有群數(shù),df2=觀測數(shù)-層數(shù);若不是分層設(shè)計,df2=群數(shù)-1。

        1.3.5 Wald’s對數(shù)線性F檢驗統(tǒng)計量與校正Wald’s對數(shù)線性F檢驗統(tǒng)計量

        基于公式(13)得到Wald’s對數(shù)線性F檢驗統(tǒng)計量見式(17):

        基于公式(13)得到校正Wald’s對數(shù)線性F檢驗統(tǒng)計量見式(18):

        在式(17)和式(18)中,有關(guān)變量或符號的含義與式(15)和式(16)后面的解釋完全相同,此處從略。

        2 實例與SAS實現(xiàn)

        2.1 問題與數(shù)據(jù)

        【例1】為研究2型糖尿病患病的危險因素,某研究者隨機(jī)選取某市社區(qū)常見慢性非傳染性疾病的篩查中檢出的2型糖尿病患者113例,同時在社區(qū)隨機(jī)選取120名正常人,收集他們的相關(guān)資料,包括年齡(歲),性別(0=男性,1=女性),吸煙情況(0=不吸煙,1=吸煙),飲酒情況(0=不飲酒,1=飲酒),2型糖尿?。∕D)家族史(0=無,1=有),動脈粥樣硬化血栓形成(AT)家族史(0=無,1=有),收縮壓(mmHg)、舒張壓(mmHg)。用1和0分別表示患與未患2型糖尿病。表1列出了部分研究對象的資料[6]。試采用合適的方法分析哪些因素易導(dǎo)致受試對象患2型糖尿病。

        表1 2型糖尿病相關(guān)危險因素的調(diào)查資料

        【例2】文獻(xiàn)[4]提供了一個關(guān)于學(xué)生信息系統(tǒng)(SIS)的顧客滿意度調(diào)查資料。這次抽樣調(diào)查的抽樣設(shè)計是兩階段分層隨機(jī)抽樣設(shè)計。在第1階段的各層中,根據(jù)學(xué)校的規(guī)模,采用按比例和無放回的概率抽樣方式抽取學(xué)校。從每一個被抽取的學(xué)校中,隨機(jī)抽取5名工作人員(包括3名教師以及2名管理者或指導(dǎo)者)完成SIS滿意度問卷調(diào)查。SAS數(shù)據(jù)集SIS_Survey包含抽樣結(jié)果和數(shù)據(jù)分析所需要的抽樣設(shè)計信息。主要變量及含義如下:

        Response(結(jié)果變量,即對SIS的滿意程度):很不滿意、不滿意、中立、滿意、很滿意;State(州):喬治亞州、美國南卡羅來納州、美國北卡羅來納州;Newuser(用戶類型):新用戶、續(xù)用用戶;School(學(xué)校):第1階段的抽樣單位;SamplingWeight(抽樣權(quán)重):基于每個抽樣階段來計算并根據(jù)是否缺失數(shù)據(jù)進(jìn)行調(diào)整;SchoolType(學(xué)校類型):高中、初中;Department(部門):教師、管理者或指導(dǎo)者。其中,State(州)和Newuser(用戶類型)是兩個分層因素,共形成6層;School(學(xué)校)是群,共抽取了370個群??倶颖竞繛?70×5=1850人。

        基于此資料進(jìn)行以下兩種分析:①試分析Response(結(jié)果變量,即對SIS的滿意程度)的頻數(shù)分布;②試分析SchoolType(學(xué)校類型)與Response(結(jié)果變量,即對SIS的滿意程度)兩變量之間是否互相獨(dú)立。

        2.2 SAS實現(xiàn)

        2.2.1 分析例1資料所需的SAS程序

        【分析與解答】設(shè)所需要的SAS程序如下:

        【程序說明】因本例中的數(shù)據(jù)很多,以文本格式存儲在D盤文件夾MXWTTJXS中,數(shù)據(jù)文件名為prg35_3.dat;model語句中的選項“sle=0.5 sls=0.02”是為了演示SAS軟件在逐步回歸分析過程中的具體表現(xiàn),即選變量進(jìn)入回歸方程采用的是評分檢驗;而從回歸模型中刪除自變量采用的是Wald’s檢驗。同時,還可以看到:檢驗回歸模型中全部自變量的回歸系數(shù)同時為0時,采用了3種檢驗方法,包括似然比檢驗、評分檢驗和Wald’s檢驗;估計回歸系數(shù)的置信區(qū)間采用的是Wald’s檢驗。

        【SAS輸出結(jié)果及解釋】

        以上輸出的是采用3種檢驗方法檢驗回歸模型中3個回歸系數(shù)同時為0的檢驗結(jié)果,因P值都小于0.05,說明3個自變量對因變量的影響都具有統(tǒng)計學(xué)意義,應(yīng)該保留在回歸模型中。

        【說明】因篇幅所限,上面僅呈現(xiàn)了部分與Wald’s檢驗有關(guān)的輸出結(jié)果,故不適合給出統(tǒng)計結(jié)論和專業(yè)結(jié)論。

        2.2.2 分析例2資料中第1個問題所需的SAS程序

        【分析與解答】設(shè)所需要的SAS程序如下:

        【程序說明】tables語句中指定結(jié)果變量;strata語句中指定分層變量;cluster語句中指定群變量;weight語句中指定權(quán)重變量。第1個過程步產(chǎn)生單因素(這里實際上是定性的結(jié)果變量Response)頻數(shù)分布表;第2個過程步是采用 Rao-Scott’s χ2檢驗進(jìn)行擬合優(yōu)度檢驗。

        【SAS輸出結(jié)果及解釋】

        以上輸出的是擬合優(yōu)度檢驗的結(jié)果。

        【統(tǒng)計結(jié)論與專業(yè)結(jié)論】擬合優(yōu)度檢驗的結(jié)果為P<0.0001,說明評價結(jié)果(Response)5個檔次中的頻數(shù)不等,“中立”的頻數(shù)最高,“很滿意”的頻數(shù)最低。

        2.2.3 分析例2資料中第2個問題所需的SAS程序

        【分析與解答】設(shè)所需要的SAS程序如下:

        【SAS輸出結(jié)果及解釋】

        以上輸出的是采用 Rao-Scott’s χ2檢驗法對SchoolType(學(xué)校類型)與Response(結(jié)果變量,即對SIS的滿意程度)兩變量之間互相獨(dú)立假設(shè)的檢驗結(jié)果。因P>0.05,說明兩變量之間的獨(dú)立性假設(shè)成立,即兩種學(xué)校類型下評價結(jié)果的頻數(shù)分布基本相同。

        【說明】Rao-Scott’s χ2檢驗法是校正設(shè)計后的Pearson’s χ2檢驗法,因篇幅所限,該方法的計算公式從略,可參閱文獻(xiàn)[4]。

        【統(tǒng)計結(jié)論與專業(yè)結(jié)論】對學(xué)生信息系統(tǒng)(SIS)的評價結(jié)果不會隨著學(xué)校類型的改變而改變,也就是說,各類學(xué)校給出的評價結(jié)果5種檔次的頻數(shù)分布與前面所呈現(xiàn)的“單變量頻數(shù)分布”的結(jié)果(即全部被調(diào)查對象給出的評價結(jié)果)基本一致。

        3 討論與小結(jié)

        3.1 討論

        Wald’s檢驗的應(yīng)用場合比較多,不僅在廣義線性回歸模型的構(gòu)建過程中的多個環(huán)節(jié)(例如:在檢驗全部回歸系數(shù)是否為0、從回歸模型中是否需要剔除某些自變量、求回歸系數(shù)和優(yōu)勢比的置信區(qū)間等)上發(fā)揮了重要作用,而且在分析復(fù)雜抽樣調(diào)查所得到的定性資料[7-10]方面,也起著不可或缺的作用。然而,在以下兩種場合下,Wald’s檢驗不如似然比檢驗的效果好[1]:情形一,樣本含量較??;情形二,回歸系數(shù)的絕對值很大。

        3.2 小結(jié)

        本文介紹了廣泛應(yīng)用于定性資料統(tǒng)計分析的一類假設(shè)檢驗方法,即Wald’s檢驗。在定性資料和生存資料的回歸分析中,常用的Wald’s檢驗有:一般Wald’s檢驗、穩(wěn)健Wald’s檢驗和Wald’s約束χ2檢驗;而在復(fù)雜抽樣調(diào)查定性資料的獨(dú)立性檢驗中,常用的Wald’s檢驗有:廣義Wald’s檢驗、廣義Wald’s對數(shù)線性檢驗、Wald’s F檢驗、Wald’s校正F檢驗、Wald’s對數(shù)線性F檢驗和校正Wald’s對數(shù)線性F檢驗。本文結(jié)合兩個實例并借助SAS軟件,實現(xiàn)了前述提及的大多數(shù)檢驗。

        猜你喜歡
        頻數(shù)回歸系數(shù)對數(shù)
        含有對數(shù)非線性項Kirchhoff方程多解的存在性
        指數(shù)與對數(shù)
        指數(shù)與對數(shù)
        對數(shù)簡史
        多元線性回歸的估值漂移及其判定方法
        電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
        中考頻數(shù)分布直方圖題型展示
        多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
        學(xué)習(xí)制作頻數(shù)分布直方圖三部曲
        頻數(shù)和頻率
        麻豆精产国品| 精品一区中文字幕在线观看| 亚洲中文字幕无码爆乳app| 天天弄天天模| 国产成人无码A区在线观| 日本在线一区二区三区观看| 国产成人大片在线播放| 亚洲人成色7777在线观看不卡| 婷婷五月综合激情| 久久91精品国产91久久麻豆 | 亚洲成年网站在线777| 和少妇人妻邻居做爰完整版| 在线观看中文字幕二区| 白丝兔女郎m开腿sm调教室| 日韩无码无播放器视频| 国产粉嫩美女一区二区三| 99久久国内精品成人免费| 久久久久久久波多野结衣高潮| 久久综合第一页无码| 亚洲视频不卡免费在线| 国产精品主播在线一区二区| 天天天天躁天天爱天天碰2018| 国产精品视频流白浆免费视频| 日本精品久久中文字幕| 黑人老外3p爽粗大免费看视频| 婷婷五月六月综合缴情| 国产免费久久精品99re丫y| 少妇性l交大片免费1一少| 人妻熟妇乱又伦精品hd| 亚洲一本大道无码av天堂| 高潮社区51视频在线观看| 亚洲不卡在线免费视频| 日本熟妇hdsex视频| 国产啪精品视频网站丝袜| 国产精品污一区二区三区在线观看| 久久综网色亚洲美女亚洲av | 蜜桃av无码免费看永久| 偷拍一区二区盗摄视频| 欧美成人精品三级网站| 日韩一区二区超清视频| 美女一区二区三区在线视频|