亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運(yùn)用χ2檢驗(yàn)
        ——對(duì)數(shù)秩檢驗(yàn)與SAS實(shí)現(xiàn)

        2022-01-07 12:50:30胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2021年6期
        關(guān)鍵詞:四格頻數(shù)對(duì)數(shù)

        胡純嚴(yán) ,胡良平 ,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在比較兩組或多組生存資料的生存函數(shù)是否相等時(shí),有多種非參數(shù)檢驗(yàn)方法,而對(duì)數(shù)秩檢驗(yàn)是其中最常用方法之一。與其他非參數(shù)檢驗(yàn)方法相比,通常情況下,對(duì)數(shù)秩檢驗(yàn)的檢驗(yàn)結(jié)果具有更小的P值。本文將匯集文獻(xiàn)中具有不同表達(dá)形式的對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量,闡釋“對(duì)數(shù)秩”的真實(shí)含義;基于具有兩種不同數(shù)據(jù)結(jié)構(gòu)的實(shí)例并借助SAS軟件實(shí)現(xiàn)對(duì)數(shù)秩檢驗(yàn)。

        1 概 述

        1.1 “對(duì)數(shù)秩”的含義

        Peto等[1]于1972年創(chuàng)造了“對(duì)數(shù)秩檢驗(yàn)”。這個(gè)檢驗(yàn)是基于給每個(gè)觀測(cè)值(即原始數(shù)據(jù))均賦予一個(gè)“生存函數(shù)的對(duì)數(shù)值”為其“分值”而構(gòu)造出來的。Altshuler于1970年采用下式作為“對(duì)數(shù)生存函數(shù)”在 t(i)的估計(jì)值。

        在式(1)等號(hào)右側(cè),m(j)和 r(j)分別代表死亡時(shí)間等于 t(j)的個(gè)體數(shù)和風(fēng)險(xiǎn)集 R[t(j)]中的個(gè)體總數(shù)。

        1.2 對(duì)數(shù)秩檢驗(yàn)的種類

        雖然對(duì)數(shù)秩檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量具有多種表現(xiàn)形式,但從檢驗(yàn)統(tǒng)計(jì)量的分布類型來看,主要有兩種:χ2分布和標(biāo)準(zhǔn)正態(tài)分布。事實(shí)上,由于Z2=χ21[說明:Z~N(0,1)],這意味著,從概率分布角度考量,對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量都服從χ2分布。另外,根據(jù)資料中試驗(yàn)因素水平數(shù)目的不同,對(duì)數(shù)秩檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量所具有的自由度是不相同的,通常的自由度df=K-1,此處,K為“試驗(yàn)因素的水平數(shù)”或稱為“組數(shù)”。

        1.3 對(duì)數(shù)秩檢驗(yàn)的應(yīng)用場(chǎng)合

        一般來說,對(duì)數(shù)秩檢驗(yàn)應(yīng)用于生存資料中比較兩個(gè)或多個(gè)生存函數(shù)之間的差別是否具有統(tǒng)計(jì)學(xué)意義[2];也被認(rèn)為可用于比較兩個(gè)暴露組中事件的發(fā)病率,此處的發(fā)病率可伴隨訪時(shí)間(長(zhǎng)度為T)而改變[3]。

        2 對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量

        2.1 未分層對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量

        2.1.1 文獻(xiàn)[2]對(duì)未分層對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量的定義

        在SAS/STAT的LIFETEST過程中,有六種用于比較兩組或多組生存資料的生存函數(shù)是否相等的假設(shè)檢驗(yàn)方法[2],其中,對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量見式(2):

        式(2)中的χ2服從自由度df=矩陣V的秩的χ2分布;v'是v的轉(zhuǎn)置向量;V-是矩陣V的廣義逆矩陣。式(2)中等號(hào)右側(cè)各變量的具體含義如下:

        在式(3)中,各分量的計(jì)算公式見式(5):

        在式(4)中,V是由vk的方差和vk與vh之間的協(xié)方差組成的矩陣,其各元素的定義如下:

        校正的(或稱加權(quán)的)對(duì)數(shù)秩檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量見式(8):

        在式(8)中,χ2服從自由度為K-1的χ2分布,它是對(duì)加權(quán)的K個(gè)樣本的生存函數(shù)進(jìn)行檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。式(8)中等號(hào)右側(cè)各變量的含義如下:

        讓(Ti,δi,Xi,wi),i=1,2,…,n,代表具有右刪失的生存資料的一個(gè)獨(dú)立樣本,Ti是一個(gè)可能的右刪失的時(shí)間;δi是一個(gè)刪失的指示變量(δi=0代表Ti是刪失時(shí)間,δi=1代表Ti不是刪失時(shí)間,即事件發(fā)生的時(shí)間);Xi=1,2,…,K 代表 K個(gè)不同的組;wi是LIFETEST過程的WEIGHT語(yǔ)句中指定變量在各觀測(cè)上的取值;在時(shí)刻Tj(j=1,2,…,D),讓ti

        在式(12)中,A、B和C的內(nèi)容分別如下:

        在式(13)中,A的內(nèi)容與式(14)相同;D、E和F的內(nèi)容分別如下:

        2.1.2 文獻(xiàn)[3]對(duì)未分層對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量的定義

        在文獻(xiàn)[3]中,對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量見式(20):

        在式(20)中,Q服從自由度為1的χ2分布;m為不同生存時(shí)間點(diǎn)的個(gè)數(shù)(即四格表的張數(shù),因?yàn)樵趯?duì)兩組生存資料進(jìn)行比較時(shí),需在每個(gè)時(shí)間點(diǎn)上將全部資料劃分成一個(gè)四格表資料,設(shè)兩行分別代表試驗(yàn)組與對(duì)照組,則兩列分別代表死亡與存活);wi代表第i張四格表的權(quán)重,權(quán)重有多種不同的定義方法,分別對(duì)應(yīng)不同名稱的檢驗(yàn)方法,當(dāng)wi=1時(shí),對(duì)應(yīng)檢驗(yàn)方法的名稱為對(duì)數(shù)秩檢驗(yàn);d1i、e?1i和v?1i分別代表第i張四格表中第1組的觀察死亡數(shù)、基于獨(dú)立性假設(shè)推算出來的理論死亡數(shù)和對(duì)應(yīng)的方差的估計(jì)值;e?1i和v?1i的計(jì)算見式(21)、式(22):

        在上面兩式中,ni和di分別代表第i張四格表中的總頻數(shù)和總死亡數(shù);n1i和n0i分別代表第i張四格表中第1組與第0組的頻數(shù)。

        【說明】式(20)是基于按全部不同時(shí)間點(diǎn)所形成的每張四格表資料的第1組中第1列(即死亡)上的觀察頻數(shù)與期望頻數(shù)構(gòu)造出來的一個(gè)檢驗(yàn)統(tǒng)計(jì)量。因篇幅所限,未分層對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量在文獻(xiàn)[4-8]中的定義從略。

        2.2 未分層廣義對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量

        未分層廣義對(duì)數(shù)秩檢驗(yàn)也被稱為加權(quán)對(duì)數(shù)秩檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量由下式定義:

        在式(23)中,χ2服從自由度df=矩陣V的秩的χ2分布;V-為矩陣V的廣義逆。U和V的計(jì)算見式(24)和式(25):

        在以上兩式中,相關(guān)變量或符號(hào)的含義和涉及內(nèi)容可查閱文獻(xiàn)[2](參見SAS/STAT的ICLIFETEST過程中的“Generalized Log-Rank Statistic”部分),此處從略。

        【說明】關(guān)于“基于對(duì)數(shù)秩檢驗(yàn)的多重比較”“分層對(duì)數(shù)秩檢驗(yàn)”和“趨勢(shì)對(duì)數(shù)秩檢驗(yàn)”的內(nèi)容[2],因篇幅所限,此處不再贅述。

        3 實(shí)例及對(duì)數(shù)秩檢驗(yàn)的SAS實(shí)現(xiàn)

        3.1 問題與數(shù)據(jù)

        【例1】檢驗(yàn)給視網(wǎng)膜炎著色的患者補(bǔ)充不同劑量的維生素A以預(yù)防其視力損傷,收集到的臨床試驗(yàn)數(shù)據(jù)列見表1[4]。試采用對(duì)數(shù)秩檢驗(yàn)比較兩組生存函數(shù)之間差異是否有統(tǒng)計(jì)學(xué)意義。

        表1 接受15 000 IU和75 IU維生素A治療的個(gè)體生存數(shù)據(jù)

        【例2】10名患乳腺癌的婦女被隨機(jī)均分為兩組,一組切除乳房后施行CMF治療(即循環(huán)使用B-518及5-氟味抗癌藥),另一組切除乳房后不進(jìn)行治療。兩年后得到復(fù)發(fā)時(shí)間(或緩解時(shí)間)的數(shù)據(jù)(月)[6]如下。CMF治療組:23,16+,18+,20+,24+;控制組:15,18,19,19,20。試采用對(duì)數(shù)秩檢驗(yàn)比較兩組生存函數(shù)之間差異是否有統(tǒng)計(jì)學(xué)意義。

        3.2 基于SAS軟件分析例1資料

        【分析與解答】設(shè)所需要的SAS程序如下:

        【程序說明】表1中最后兩列數(shù)據(jù)可以不輸入,因?yàn)槌绦驎?huì)自動(dòng)計(jì)算;“失訪(withdraw)”在生存分析中被稱為“刪失(censored)”或“截尾”,對(duì)應(yīng)“cen?sored=1”;“失?。╢ail)”被視為完全數(shù)據(jù),對(duì)應(yīng)“cen?sored=0”。也就是說,變量“censored”用來標(biāo)識(shí)每位受試者的“時(shí)間數(shù)據(jù)”是完全或準(zhǔn)確數(shù)據(jù),還是失訪或刪失數(shù)據(jù);“strata”語(yǔ)句中的變量“group”實(shí)際為“試驗(yàn)因素”,而不是“分層變量”。

        【SAS輸出結(jié)果及解釋】

        以上為A組數(shù)據(jù)的描述性統(tǒng)計(jì)量計(jì)算結(jié)果,因失訪數(shù)據(jù)較多,無法估計(jì)75%和50%分位數(shù)的數(shù)值;算術(shù)平均值及標(biāo)準(zhǔn)誤差分別為5.13574和0.10155。

        以上為B組數(shù)據(jù)的描述性統(tǒng)計(jì)量計(jì)算結(jié)果,因失訪數(shù)據(jù)較多,無法估計(jì)75%分位數(shù)的數(shù)值;算術(shù)平均值及標(biāo)準(zhǔn)誤差分別為4.80523和0.11793。

        以上輸出的是基于三種非參數(shù)檢驗(yàn)方法(即“對(duì)數(shù)秩檢驗(yàn)”“威爾科克森檢驗(yàn)”和“負(fù)2倍對(duì)數(shù)似然比檢驗(yàn)”)比較兩組生存資料生存率之間的差別是否具有統(tǒng)計(jì)學(xué)意義的檢驗(yàn)結(jié)果,P均小于0.05,但對(duì)數(shù)秩檢驗(yàn)的P=0.0206最小,說明該方法的檢驗(yàn)效能更高。

        由于A組的生存曲線位于B組生存曲線的右側(cè)(圖形從略),即整體而言,A組的生存率大于B組的生存率。

        【統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論】?jī)山M生存函數(shù)之間的差別具有統(tǒng)計(jì)學(xué)意義,又由于A組的生存曲線位于B組生存曲線的右側(cè),故可以認(rèn)為:A組的生存率大于B組的生存率。也就是說,每天接受15 000 IU維生素A治療比每天接受75 IU維生素A治療具有更好的效果。

        3.3 基于SAS軟件分析例2資料

        【分析與解答】設(shè)所需要的SAS程序如下:

        【程序說明】“strata”語(yǔ)句中“test=”選項(xiàng)后指定了多種進(jìn)行兩組生存資料比較的方法,其中,“LR”為對(duì)數(shù)似然比檢驗(yàn)法;“fleming(p,q)”中的兩個(gè)參數(shù)“p”與“q”都可以取大于等于零的實(shí)數(shù)。在本例中,取p=1和q=1時(shí),P值相對(duì)較小。

        【SAS輸出結(jié)果及解釋】

        以上是七種差異性分析方法的計(jì)算結(jié)果,其中,對(duì)數(shù)秩檢驗(yàn)結(jié)果給出的P值是最小的。

        由于A組的生存曲線位于B組生存曲線的右側(cè)(圖形從略),即整體而言,A組的生存率大于B組的生存率。

        【統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論】?jī)山M生存函數(shù)之間的差別具有統(tǒng)計(jì)學(xué)意義,又由于A組的生存曲線位于B組生存曲線的右側(cè),故可以認(rèn)為:A組的生存率大于B組的生存率。也就是說,切除乳房后施行CMF治療(即循環(huán)使用B-518及5-氟味抗癌藥)的效果優(yōu)于切除乳房后不進(jìn)行治療的效果。

        4 討論與小結(jié)

        4.1 討論

        在對(duì)數(shù)秩檢驗(yàn)這個(gè)名稱中,有“對(duì)數(shù)”一詞。但在各種不同表達(dá)形式的對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量中,卻沒有取對(duì)數(shù)的痕跡。事實(shí)上,這個(gè)名稱起源于對(duì)數(shù)生存函數(shù)。也就是說,對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量中內(nèi)置了對(duì)數(shù)生存函數(shù),故此得名。

        值得注意的是,若按乘積-極限法估計(jì)各時(shí)間點(diǎn)上的生存函數(shù),則對(duì)數(shù)生存函數(shù)的表達(dá)式如下:

        然而,本文式(1)給出的定義與式(26)卻有著本質(zhì)區(qū)別,式(1)的分子為死亡數(shù),而式(26)的分子為存活數(shù)。由此可知,基于式(1)得到的對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量,只能視為按特定定義推導(dǎo)出來的產(chǎn)物,并非是嚴(yán)格按對(duì)數(shù)生存函數(shù)賦值所推導(dǎo)出來的對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量。

        在計(jì)算對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量的數(shù)值時(shí),涉及理論頻數(shù)的計(jì)算。然而,計(jì)算理論頻數(shù)的方法有別于四格表資料獨(dú)立性檢驗(yàn)時(shí)計(jì)算理論頻數(shù)的方法。因?yàn)樵趯?duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量的計(jì)算中,只需要計(jì)算每張四格表資料中一個(gè)網(wǎng)格[例如:(1,1)網(wǎng)格]上的理論頻數(shù),而不需要計(jì)算4個(gè)網(wǎng)格上的理論頻數(shù)。另外,式(1)中的很容易被錯(cuò)誤地視為,其實(shí),此處的“e”僅代表函數(shù)的符號(hào)。在數(shù)學(xué)上,習(xí)慣用“f”表示函數(shù)的符號(hào),例如,f(x)=1.5+2x+3x2。若希望式(1)不被誤解,則改用式(27)表達(dá)更合適:

        在式(27)等號(hào)右側(cè),m(j)和r(j)分別代表死亡時(shí)間等于 t(j)的個(gè)體數(shù)和風(fēng)險(xiǎn)集 R[t(j)]中的個(gè)體總數(shù)。值得一提的是:式(1)和式(27)中要帶一個(gè)負(fù)號(hào),是因?yàn)楦鲿r(shí)間點(diǎn)上的生存概率的對(duì)數(shù)值為負(fù)值,為使最終的結(jié)果為正值,需要乘以“-1”。

        4.2 小結(jié)

        本文給出了未分層對(duì)數(shù)秩檢驗(yàn)統(tǒng)計(jì)量的多種表達(dá)形式,但它們?cè)诒举|(zhì)上是相同的,都是用每個(gè)生存時(shí)間點(diǎn)上的對(duì)數(shù)生存函數(shù)作為一個(gè)分值,賦予相應(yīng)的個(gè)體,以取代其對(duì)應(yīng)的生存時(shí)間(可能是完全數(shù)據(jù),也可能是刪失數(shù)據(jù))。通過具有不同數(shù)據(jù)結(jié)構(gòu)的兩個(gè)實(shí)例并借助SAS軟件實(shí)現(xiàn)了對(duì)數(shù)秩檢驗(yàn)。

        猜你喜歡
        四格頻數(shù)對(duì)數(shù)
        油爆四格
        含有對(duì)數(shù)非線性項(xiàng)Kirchhoff方程多解的存在性
        指數(shù)與對(duì)數(shù)
        指數(shù)與對(duì)數(shù)
        爆笑四格
        爆笑四格
        爆笑四格
        對(duì)數(shù)簡(jiǎn)史
        中考頻數(shù)分布直方圖題型展示
        學(xué)習(xí)制作頻數(shù)分布直方圖三部曲
        国产av精国产传媒| 不卡视频在线观看网站| 污污污国产免费网站| 免费一级欧美大片久久网| 国产精品国产三级国产an| 性感人妻一区二区三区| 精品女同av一区二区三区| 国产精品午夜福利亚洲综合网 | 国产精品久人妻精品老妇| 欧美人与禽z0zo牲伦交| 久久精品成人无码观看不卡| 中国凸偷窥xxxx自由视频妇科| 亚洲乱码日产精品bd在线观看| 亚洲欧美日韩中文v在线| 亚洲天堂av路线一免费观看| 国产视频激情在线观看| 国产小视频在线看不卡| 无码人妻精品一区二区三区9厂| 波多野吉衣av无码| 亚洲AV伊人久久综合密臀性色| 538亚洲欧美国产日韩在线精品| 国产精品后入内射日本在线观看| 人妻熟妇乱又伦精品视频| 国产成人亚洲精品无码av大片| 色www视频永久免费| 六月丁香久久| 在线观看精品视频一区二区三区| 精品亚洲在线一区二区| 白白在线视频免费观看嘛| 狠狠躁18三区二区一区| 少妇性荡欲视频| 乱子伦av无码中文字幕| 精品国产又大又黄又粗av| 中文字幕免费人成在线网站| 久久精品国产亚洲av久| 久久棈精品久久久久久噜噜| 国产精品亚洲一区二区杨幂| 国产精品亚洲最新地址| 999精品无码a片在线1级| a在线观看免费网站大全| 东京热加勒比日韩精品|