亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何正確運用χ2檢驗
        ——生存資料的似然比檢驗和六種非參數(shù)檢驗與SAS實現(xiàn)

        2021-11-04 08:31:32胡純嚴(yán)胡良平
        四川精神衛(wèi)生 2021年5期
        關(guān)鍵詞:參數(shù)檢驗假設(shè)檢驗分層

        胡純嚴(yán) ,胡良平 ,2*

        (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

        在臨床研究中,生存資料出現(xiàn)的頻率很高[1-7]。生存時間t是生存資料中的結(jié)果變量,它具有兩個明顯的特點:①生存時間一般不服從正態(tài)分布;②生存資料中常包含刪失數(shù)據(jù)或稱為不完全數(shù)據(jù)。因此,對生存資料進(jìn)行統(tǒng)計分析的方法有別于常規(guī)的統(tǒng)計分析方法。本文將結(jié)合實例,介紹單因素和多因素生存資料的差異性檢驗方法,包括似然比檢驗方法和六種非參數(shù)檢驗方法。

        1 生存函數(shù)假設(shè)檢驗的基礎(chǔ)

        1.1 生存函數(shù)的定義

        生存分布函數(shù)(SDF)也叫生存函數(shù),常用符號S(t)表示,它描述感興趣的總體(群體)的壽命時間[8]。在t時刻SDF的估計值是來自總體的試驗單元(或受試對象)的壽命時間超過t的概率,即有下式:

        式(1)中的S(t)為生存函數(shù),T是隨機選擇的一個試驗單元(或受試對象)的壽命時間。

        1.2 基本變量的定義

        讓t1<t2<…<tD代表不同的事件時間。對每一個i(i=1,2,…,D),讓Yi代表ti時刻之前的生存單元數(shù)目(即風(fēng)險集的大?。?,讓di代表ti時刻的失效或死亡的數(shù)目。

        1.3 生存函數(shù)的估計

        1.3.1 生存函數(shù)的Breslow估計

        注意:Breslow估計是累計危險函數(shù)的負(fù)Nelson-Aalen估計的指數(shù)。

        1.3.2 生存函數(shù)的Fleming-Harrington估計

        如果頻數(shù)值不是整數(shù),就不能計算Fleming-Harrington估計。

        1.3.3 生存函數(shù)的Kaplan-Meier估計

        在ti時刻的生存函數(shù)的Kaplan-Meier估計(乘積-極限)是累計乘積:

        注意:式(2)、式(3)、式(4)定義的生存函數(shù)估計量都是右連續(xù)的,也就是說,在ti時刻發(fā)生的事件應(yīng)該被包含在S(ti)的估計之中。

        1.4 生存函數(shù)的標(biāo)準(zhǔn)誤

        由Kalbfleisch和Prentice于1980年提出生存函數(shù)標(biāo)準(zhǔn)誤的格林伍德(Greenwood)估計公式如下:

        1.5 兩個或多個生存函數(shù)相等的檢驗假設(shè)

        讓K代表組數(shù),Sk(t)代表第k組中的生存函數(shù)(k=1,2,…,K)。于是,被檢驗的無效假設(shè)和備擇假設(shè)分別如下。

        H0:S1(t)=S2(t)=…=SK(t),對于所有的t≤τ都成立;

        H1:至少有一個Sk(t)是不同的,對于某些t≤τ成立。

        2 未分層生存函數(shù)相等的假設(shè)檢驗計算公式

        2.1 似然比檢驗

        Lawless于1982年基于各組生存資料服從指數(shù)分布的假定,推導(dǎo)出檢驗前述“檢驗假設(shè)”的似然比統(tǒng)計量[8],見下式:

        在式(6)中,χ2是服從自由度為df=K-1的χ2分布的隨機變量(此處也叫做“檢驗統(tǒng)計量”);Nk為第k組中事件總數(shù)(在生存分析中為“死亡”人數(shù));;Tk為第k組中參與檢驗的全部生存時間之和;。

        2.2 六種非參數(shù)檢驗

        2.2.1 六種非參數(shù)檢驗的名稱

        在SAS/STAT的“LIFETEST”過程中,有六種用于比較兩組或多組生存資料的生存函數(shù)是否相等的假設(shè)檢驗方法[8],分別是對數(shù)秩(Log-rank)檢驗、威爾科克森(Wilcoxcon)檢驗、Tarone-Ware檢驗、Peto-Peto檢驗、修正的Peto-Peto檢驗和Harrington-Fleming(p,q)檢驗。

        2.2.2 基本變量的定義

        讓(Ti,δi,Xi),i=1,2,…,n,代表具有右刪失生存資料的一個獨立樣本,Ti是一個可能的右刪失的時間;δi是一個刪失的指示變量(δi=0代表Ti是刪失時間,δi=1代表Ti不是刪失時間,即事件發(fā)生的時間);Xi=1,2,…,K代表K個不同的組;讓t1<t2<…<tD代表樣本中不同的事件時間。在時刻Tj,讓W(xué)(tj)代表一個正權(quán)重函數(shù)(簡稱“權(quán)函數(shù)”),讓Yjk和djk分別代表第k組中的風(fēng)險集的大小和事件的數(shù)目,其中,。再分別讓。

        2.2.3 六種非參數(shù)檢驗對應(yīng)的權(quán)函數(shù)

        六種非參數(shù)檢驗的檢驗統(tǒng)計量無論是在本質(zhì)上還是在表達(dá)形式上都是一樣的,所不同的僅僅是權(quán)函數(shù),見表1。

        表1 生存資料六種非參數(shù)檢驗對應(yīng)的權(quán)函數(shù)

        2.2.4 六種非參數(shù)檢驗的共同檢驗統(tǒng)計量

        六種非參數(shù)檢驗的共同檢驗統(tǒng)計量見式(7):

        在式(7)中,χ2服從自由度為df=矩陣V的秩的χ2分布;v'是v的轉(zhuǎn)置向量;V-是矩陣V的廣義逆矩陣。式(7)中等號右邊各變量的具體含義如下:

        在式(8)中,各分量的計算公式見式(10):

        在式(10)中,W(tj)為權(quán)函數(shù),其定義參見前面的表1。在式(9)中,V是由vk的方差和vk與vh之間的協(xié)方差組成的矩陣,其各元素的定義如下:

        2.3 校正的對數(shù)秩檢驗

        校正的對數(shù)秩檢驗的檢驗統(tǒng)計量見式(13):

        在式(13)中,χ2服從自由度為K-1的χ2分布,它是對加權(quán)的K個樣本的生存函數(shù)進(jìn)行檢驗的檢驗統(tǒng)計量。式(13)中等號右邊各變量的含義和定義如下:

        讓 (Ti,δi,Xi,wi),i=1,2,…,n,代表具有右刪失的生存資料的一個獨立樣本,Ti是一個可能的右刪失的時間;δi是一個刪失的指示變量(δi=0代表Ti是刪失時間,δi=1代表Ti不是刪失時間,即事件發(fā)生的時間);Xi=1,2,…,K代表K個不同的組;wi是LIFETEST過程的“WEIGHT”語句中指定變量在各觀測上的取值;讓t1<t2<…<tD代表樣本中不同的事件時間,在時刻Tj(j=1,2,…,D),并且,對于每一個1≤k≤K,則有下式:

        在時刻tj合并的樣本中,讓和分別代表風(fēng)險集的大小和事件的數(shù)目,讓分別代表風(fēng)險集中權(quán)重的數(shù)目和事件的權(quán)重數(shù)目。于是,在式(13)中,向量v中的各分量和矩陣V=(Vkh)中的各元素(即方差與協(xié)方差)分別見式(16)、式(17)、式(18):

        在式(17)中,A、B和C的內(nèi)容分別如下:

        在式(18)中,A的內(nèi)容與式(19)相同;D、E和F的內(nèi)容分別如下:

        3 分層生存函數(shù)相等的假設(shè)檢驗的計算公式

        3.1 何為分層生存函數(shù)相等的假設(shè)檢驗問題

        假定在生存資料中,有一個具有M水平的分層因素,在其各水平下均有一個具有K水平的重要試驗因素。于是,就需要考慮將M層生存函數(shù)按那個重要試驗因素分別合并起來,再進(jìn)行合并后的K個生存函數(shù)是否相等的檢驗,這就是分層生存函數(shù)相等的假設(shè)檢驗問題。

        3.2 分層生存函數(shù)相等的檢驗統(tǒng)計量

        進(jìn)行分層生存函數(shù)相等的假設(shè)檢驗,Klein和Moeschberger于1997年提出了如下方法:設(shè)分層因素有M個水平、重要試驗因素有K個水平、第s(s=1,2,…,M)層中的檢驗統(tǒng)計量為vs,于是,對合并后的生存函數(shù)進(jìn)行假設(shè)檢驗的檢驗統(tǒng)計量見下式:

        式(25)中的χ2服從自由度為df=各層中協(xié)方差矩陣V的秩的χ2分布;v'是v的轉(zhuǎn)置向量;V-是協(xié)方差矩陣V的廣義逆矩陣。式(25)中等號右邊各變量的具體含義如下:

        4 實例及SAS實現(xiàn)

        4.1 問題與數(shù)據(jù)

        【例1】(未分層生存資料)將26例白血病患者分為兩組,分別采用化療、化療聯(lián)合中藥兩種方法,治療后患者存活數(shù)(月)如下,其中帶“+”號的為終檢值。試估計兩組患者的生存率,并比較兩種方法治療白血病患者的生存率差異是否有統(tǒng)計學(xué)意義[9]。化療組(A):2+,13,7+,11+,6,1,11,3,17,7;化療聯(lián)合中藥組(B):10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24。

        【例2】(分層生存資料)某醫(yī)院腫瘤科提供的一份關(guān)于肺癌患者的失效時間資料[8],因變量為患者治療后的生存時間t(d),當(dāng)t為刪失數(shù)據(jù)時,在前面加一個負(fù)號表示;考察的協(xié)變量(即危險因素或預(yù)后因素)如下:①癌細(xì)胞的類型,它有4個水平,即腺癌細(xì)胞、鱗癌細(xì)胞、小細(xì)胞肺癌和大細(xì)胞肺癌;②治療類型,它有2個水平,即標(biāo)準(zhǔn)的方法和試驗的方法;③療前處理,它有2個水平,即采取了療前處理和未采取療前處理;④患者年齡(歲);⑤從診斷到治療的等待時間;⑥患者的行動狀態(tài)用Karnofsky率來度量,其取值用KPS表示,0≤KPS≤10表明患者完全靠醫(yī)院護(hù)理,40≤KPS≤60表明患者的行動部分受到限制,70≤KPS≤90表明患者的行動可以自理。前3個變量被當(dāng)作分類變量,后3個變量被當(dāng)作連續(xù)性變量。資料的形式為:各組患者的治療方法、癌細(xì)胞類型、同一組中的樣本含量、生存時間、KPS值、等待時間、年齡、與療前處理對應(yīng)的指示變量PR值(注:PR=0等價于令PRIOR='YES',即表示采取了療前處理;PR=10等價于令PRIOR='NO',即表示未采取療前處理)。(說明:因數(shù)據(jù)量很大,各變量取值從略,可查閱參考文獻(xiàn)[8])

        試按下面兩個要求分析此生存資料:其一,僅按“治療方法”一個因素分層,比較4種癌細(xì)胞類型患者的生存曲線差異是否有統(tǒng)計學(xué)意義;其二,同時按“治療方法”和“有無療前處理”兩個因素分層,比較4種癌細(xì)胞類型患者的生存曲線差異是否有統(tǒng)計學(xué)意義。

        4.2 基于SAS軟件分析例1資料

        【分析與解答】設(shè)所需要的SAS程序如下:

        【程序說明】在“strata”語句中,選項“test=all”代表選擇六種非參數(shù)假設(shè)檢驗方法,其中,fleming(ρ1,ρ2)自動設(shè)置為:fleming(1),即 ρ1=1、ρ2=0;當(dāng)特別指定ρ1、ρ2為非負(fù)數(shù)且不為0時,對應(yīng)的計算結(jié)果會隨著這兩個參數(shù)的具體取值而發(fā)生改變,例如:給定fleming(1,4)與fleming(2,5)時,對應(yīng)的χ2值和P值是不同的;如果要求輸出“似然比檢驗”結(jié)果,必須加上選項“LR”。

        【SAS輸出結(jié)果及解釋】

        以上輸出結(jié)果中,前6行是六種非參數(shù)檢驗結(jié)果,最后一行是似然比檢驗結(jié)果。前6行檢驗結(jié)果都得到“P<0.05”的結(jié)果;而最后一行的結(jié)果為“P>0.05”。當(dāng)生存資料服從“指數(shù)分布”時,應(yīng)選取“似然比檢驗”結(jié)果;當(dāng)生存資料服從“威布爾分布”時,應(yīng)選取“對數(shù)秩檢驗”結(jié)果;否則,可以考慮選取其他非參數(shù)檢驗結(jié)果。通過查看圖1和圖2,可大致判斷出本例生存時間資料服從何種分布。

        圖1 用于判斷生存資料是否服從指數(shù)分布的圖形

        圖2 用于判斷生存資料是否服從威布爾分布的圖形

        在圖1中,兩條折線都不呈直線,說明本例兩組生存資料都不服從指數(shù)分布;而在圖2中,兩條折線都近似呈直線,說明本例兩組生存資料都近似服從威布爾分布。由此可知,本例的假設(shè)檢驗結(jié)果以選擇“對數(shù)秩檢驗”結(jié)果為宜。為了便于直觀判斷哪一種治療方法所對應(yīng)的患者生存時間更長,需要呈現(xiàn)出他們的生存率曲線,見圖3。

        在圖3中,左邊的生存曲線為“A組(化療組)”;右邊的生存曲線為“B組(化療聯(lián)合中藥組)”。

        【統(tǒng)計結(jié)論與專業(yè)結(jié)論】因χ2=6.5792,df=1,P=0.0103<0.05,說明兩條生存曲線之間的差異有統(tǒng)計學(xué)意義;由于B組(化療聯(lián)合中藥組)的生存曲線位于A組(化療組)生存曲線的右邊(見圖3),說明“化療聯(lián)合中藥”治療的效果優(yōu)于“單純化療”的效果。

        4.3 基于SAS軟件分析例2資料

        【分析與解答】設(shè)所需要的SAS程序如下:

        因篇幅所限,第1個過程步的主要輸出結(jié)果此處從略,僅給出概括性結(jié)論。第一層:標(biāo)準(zhǔn)治療組。標(biāo)準(zhǔn)治療的4種癌細(xì)胞類型的生存曲線之間的差別所對應(yīng)的P值均小于0.05,大細(xì)胞肺癌患者的生存曲線最長。第二層:試驗治療組。試驗治療的4種癌細(xì)胞類型的生存曲線之間的差別所對應(yīng)的P值均小于0.05,肺鱗癌細(xì)胞患者的生存曲線最長。

        因篇幅所限,第2個過程步的主要輸出結(jié)果此處從略,僅給出概括性結(jié)論。第一層:標(biāo)準(zhǔn)治療且未接受預(yù)處理,結(jié)果顯示,三種方法對應(yīng)的結(jié)果為P>0.05,有4種方法對應(yīng)的P<0.05。第二層:標(biāo)準(zhǔn)治療但接受預(yù)處理,結(jié)果顯示,七種方法對應(yīng)的結(jié)果均為P>0.05。第三層:試驗治療且未接受預(yù)處理,結(jié)果顯示,七種方法對應(yīng)的結(jié)果均為P<0.05。第四層:試驗治療但接受預(yù)處理,結(jié)果顯示,前六種方法對應(yīng)的結(jié)果均為P>0.05,而最后的似然比檢驗結(jié)果為P<0.05。

        【統(tǒng)計結(jié)論與專業(yè)結(jié)論】本例資料按“治療方法”與“是否接受預(yù)處理”所形成的四層來分別比較4種癌細(xì)胞的患者生存曲線,因分析結(jié)果不盡相同,故統(tǒng)計結(jié)論與專業(yè)結(jié)論都需要在各層的條件下進(jìn)行具體描述,因篇幅所限,此處從略。

        5 討論與小結(jié)

        5.1 討論

        在SAS/STAT的LIFETEST過程中,介紹了比較兩組或多組生存資料的差異性檢驗方法,包括似然比檢驗和六種非參數(shù)檢驗。一般來說,在構(gòu)建似然比檢驗統(tǒng)計量時,需要假定所研究的變量服從某種概率分布;而非參數(shù)檢驗,顧名思義,不假定所研究的資料服從何種概率分布。當(dāng)各種非參數(shù)檢驗用于同一個資料產(chǎn)生出不同的檢驗結(jié)果時,如何選取最終的結(jié)果就成了一個棘手的問題。通常情況下,可以選擇P值最小的非參數(shù)檢驗法給出的計算結(jié)果。例如,在例1的計算結(jié)果中,對數(shù)秩檢驗給出的P=0.0103、χ2=6.5792,而fleming(1,4)的P=0.0052、χ2=7.8139;若進(jìn)一步嘗試,還可得到fleming(3,6)的P=0.0051、χ2=7.8382。在例2的分析中,因篇幅所限,未分析定量變量(即協(xié)變量KPS DIAGTIME AGE)對生存時間的影響。

        有一個易于誤解之處:在SAS輸出差異性檢驗結(jié)果時,呈現(xiàn)的標(biāo)題為“層間等效檢驗”,似乎表明:其下方給出的假設(shè)檢驗結(jié)果是針對“分層因素”各水平計算出來的。其實,標(biāo)題中的“層間”是指“試驗因素各水平間”。在例2中,試驗因素是“4種癌細(xì)胞類型”,第一種情況下的分層因素為“治療方法”,第二種情況下有兩個分層因素,即“治療方法”與“是否接受預(yù)處理”。

        5.2 小結(jié)

        本文分別介紹了未分層與分層條件下,兩組或多組生存資料比較的似然比檢驗和六種非參數(shù)檢驗方法,通過兩個實例并借助SAS軟件,進(jìn)行單因素和多因素生存資料的差異性分析,對SAS輸出結(jié)果作出解釋,給出統(tǒng)計結(jié)論和專業(yè)結(jié)論。

        猜你喜歡
        參數(shù)檢驗假設(shè)檢驗分層
        一種沉降環(huán)可準(zhǔn)確就位的分層沉降儀
        雨林的分層
        有趣的分層
        統(tǒng)計推斷的研究
        時代金融(2017年6期)2017-03-25 12:02:43
        雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗
        Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
        統(tǒng)計學(xué)教學(xué)中關(guān)于假設(shè)檢驗問題探討
        非參數(shù)檢驗的概念
        非參數(shù)檢驗的概念
        非參數(shù)檢驗的概念
        亚洲av成人无码一区二区三区在线观看 | 蜜桃视频在线看一区二区三区| 国产日产综合| 国产精在线| 亚洲av粉色一区二区三区| 六月婷婷亚洲性色av蜜桃| 女人色熟女乱| 国产精品一区二区久久| 人妻av午夜综合福利视频| 亚洲国产精品悠悠久久琪琪| 人妻精品久久无码区| 国产98在线 | 免费| 自拍视频国产在线观看| 亚洲国产一区二区三区精品| 精品丰满人妻无套内射| 久久尤物AV天堂日日综合| 最新国产主播一区二区| 国产青青草在线观看视频| 狠狠色噜噜狠狠狠狠7777米奇| 日本亚洲欧美在线观看| 国产大片在线观看91| 后入内射国产一区二区| 99久久亚洲精品无码毛片| 欧美日韩亚洲综合久久久| 在线国产丝袜自拍观看| 亚洲色图少妇熟女偷拍自拍 | 久久精品不卡一区二区三区| 无码丰满熟妇一区二区| 欧美精品一级| 91人妻人人做人人爽九色| 天天躁夜夜躁狠狠是什么心态| 色婷婷综合中文久久一本| 免费大学生国产在线观看p| 中文字幕一区二区三区日日骚| 亚洲热线99精品视频| 国产污污视频| 亚洲福利视频一区二区三区| 亚洲精品国产成人片| 亚洲人成无码网www| 国产精品丝袜一区二区三区在线| 国产丝袜美腿精品91在线看|