南方醫(yī)科大學公共衛(wèi)生學院生物統(tǒng)計學系(510515)
傅利強 陳思敏 吳海燕 譚旭輝Δ
【提 要】 目的 在大樣本條件下,比較成組序貫設計中基于實際信息量的不同臨界值校正方法之間的差異。方法 基于O′Brien-Fleming(OBF)法和指數(shù)損耗函數(shù)法,通過設定不同的參數(shù)以及匹配條件,比較線性插值校正法、OBF損耗函數(shù)校正法、指數(shù)損耗函數(shù)校正法之間的I類錯誤α和功效Power的差別。結果 當設計方法為OBF法和指數(shù)損耗函數(shù)法(ρ=2)時,與之相匹配的OBF損耗函數(shù)校正法、指數(shù)損耗函數(shù)校正法(ρ=2)以及線性插值校正法均能將I類錯誤控制在0.05,功效Power控制在0.9;當設計方法為指數(shù)損耗函數(shù)法(ρ=1或ρ=3)時,與設計方法不匹配的校正方法仍可將I類錯誤維持在0.05左右,但功效Power明顯偏離0.9。結論 在進行成組序貫期中分析時,線性插值校正法作為通用方法能夠適用于各類設計,損耗函數(shù)校正法只適用于已知損耗函數(shù)形式的設計。
隨著臨床試驗的不斷發(fā)展,研究者對試驗的設計需求不斷提高。成組序貫設計由于具有早期終止試驗,節(jié)約樣本量[1]等優(yōu)點,逐漸被廣泛應用[2-3]。成組序貫設計本質特征是對試驗過程中累積資料分階段進行多次期中分析,直到以一定的顯著性水準拒絕或不拒絕原假設而終止試驗。然而在實際應用時,由于每階段的實際信息量與理論信息量并不相同,從而在進行期中分析時必須對每階段的臨界值進行調整,其中最常用的方法就是通過實際信息量去校正臨界值,即基于實際信息量的臨界值校正方法。其原理是通過實際信息量去調整每階段的臨界值,并使得最終的顯著性水平滿足設定值。但是目前的研究中,尚未有關于各個基于實際信息量的臨界值校正方法之間對比研究的論述,因此本文將會通過模擬比較各種基于實際信息量的臨界值校正方法,為研究者在進行成組序貫期中分析時,對相關臨界值校正方法的選擇提供理論參考。
成組序貫設計(group sequential design)因具有良好的靈活性和經(jīng)濟性等設計特性備受人們關注,而實現(xiàn)這些特性最重要的方法基礎是對α或β?lián)p耗過程的調整。損耗過程設計方法分為固定邊界值法[4]、損耗函數(shù)法[5]以及自定義損耗過程,對應的基于實際信息量的臨界值校正方法有線性插值校正法和損耗函數(shù)校正法,其中最常用的損耗函數(shù)校正法有指數(shù)損耗函數(shù)校正法、O′Brien-Fleming(OBF)損耗函數(shù)校正法,方法原理如下。
1.線性插值校正法
線性插值法由Kittelson等人于1999年提出[4],其提出的初衷就是想解決成組序貫不同設計間如何校正臨界值以確定停止規(guī)則的問題。其原理是基于實際信息量利用兩個相鄰期中分析階段的累計理論損耗錯誤進行插值計算,近似得到實際錯誤損耗的變化趨勢,公式如下:
其中αj為第j階段的設計損耗I類錯誤α或II類錯誤β,e1,e2,…,eK為設定的第1至K階段的累積損耗I類錯誤或II類錯誤,e(I)為校正后的累積損耗錯誤,Ij為第j階段的設計信息量,I為實際信息量。
2.OBF損耗函數(shù)校正法
OBF設計[6]如前文所述,原屬于固定邊界值方法[7],即預先設定邊界值和名義檢驗水準,其靈活性在實際應用中受到限制,故在損耗函數(shù)法中發(fā)展出了其近似的損耗函數(shù)形式,OBF損耗函數(shù)如下所示:
其中t為信息比,a為設計中設定的α或β,Φ是Z統(tǒng)計量的累積分布函數(shù),對于給定的α或β,第k階段的累積錯誤損耗為αE(Πk;α)或βE(Πk;β),式中Πk=Ik/IK為第k階段設計信息量與最大信息量之比。
OBF損耗函數(shù)校正法則是基于實際信息量進行損耗調整[8],從而改變各階段的臨界值,即在計算時,將Πk=Ik/IK中的第k階段理論信息量Ik替換為實際信息量I,公式如下:
公式中IK為設計時理論最大信息量,計算得到的e(I)為校正后的累積錯誤損耗。
3.指數(shù)損耗函數(shù)校正法
OBF法作為經(jīng)典的方法,其特點是較為保守。而指數(shù)損耗函數(shù)法[5]相較于OBF法,雖然可能損失了較多檢驗效能,但是其能夠在試驗早期以較大可能拒絕原假設使得試驗提前結束。例如,二次方損耗函數(shù)在現(xiàn)實應用中就因為其拒絕早而損失的檢驗效能較少而被廣泛推薦應用。指數(shù)損耗函數(shù)[9]公式如下:
本文的模擬研究以成組序貫設計中最常用的兩樣本均數(shù)比較作為設計框架,其原假設和備擇假設為:H0:θ=0,H1:θ>0(δ=2),模擬設定的I類錯誤為0.05,功效為90%,即α=0.05,β=0.1。成組序貫試驗階段數(shù)K為3,試驗組均值Mt=5或7,對照組均值Mc=5。由于指數(shù)損耗函數(shù)法和OBF法是比較常用的期中分析方法,故本文選用OBF法與指數(shù)損耗函數(shù)法作為設計方法。試驗樣本量為每組每階段50例和100例。這里需要指出的是,當試驗設計終止規(guī)則為拒絕型(reject)時(即期中分析只能以拒絕H0而終止試驗),只有I類錯誤α在期中分析過程中損耗;當設計為接受型(accept)時(即期中分析只能以接受H0而終止試驗),只有II類錯誤β在期中分析過程中損耗。為了探討校正方法對α和β的影響,我們將在拒絕型和接受型設計下,分別比較兩種方法相對應的基于實際信息量的臨界值校正方法之間的區(qū)別與聯(lián)系。隨后,進一步對校正方法的錯誤應用情況進行分析,探究校正方法錯誤使用時的影響。模擬程序基于SAS 9.4軟件實現(xiàn),為了確保得到穩(wěn)定的結果,模擬次數(shù)設定為50000次。
1.校正方法正確匹配時的參數(shù)設置
在上文設定的條件下,基于OBF法和指數(shù)損耗函數(shù)法(ρ=2)來研究和比較臨界值校正方法之間的差異,其中OBF法對應的校正方法為線性插值法和OBF損耗函數(shù)法,指數(shù)損耗函數(shù)法對應的校正方法為線性插值法和同形式的損耗函數(shù)法。根據(jù)以上參數(shù)設定分別求其50000次模擬下拒絕型設計的I類錯誤α以及接受型設計的功效Power。第一部分模擬試驗的參數(shù)設置如表1所示。
表1 校正方法正確匹配時參數(shù)設置
2.校正方法錯誤匹配時的參數(shù)設置
為了對損耗形式與校正方法不匹配的情況進行研究,我們以ρ=3和ρ=1的指數(shù)族損耗函數(shù)為設計方法,通過模擬分別計算I類錯誤α以及功效Power,相應的參數(shù)設置如表2所示。
表2 校正方法錯誤匹配時參數(shù)設置
1.校正方法正確匹配時的結果
按照表1中設置的參數(shù),通過模擬我們得到的I類錯誤α和功效Power,如表3所示。由表3中的結果可知,無論是OBF法還是損耗函數(shù)法,其相同形式的損耗函數(shù)方法和線性插值校正法均較好地維持住了I類錯誤α以及功效Power,線性插值法校正后的效果略差,但隨著樣本量的增加,差異可以忽略不計。同時我們也可以看到,在樣本量為50的情況下,指數(shù)損耗函數(shù)法(ρ=2)的I類錯誤α有輕微的膨脹,而在樣本量為100時I類錯誤就能穩(wěn)定在0.05附近。
表3 校正方法正確匹配時的結果
2.校正方法錯誤匹配時的結果
根據(jù)表2的參數(shù)設置,校正方法錯誤匹配時的結果如表4所示。從表4中我們可以看到在校正方法錯誤匹配的情況下,兩種對應方式的I類錯誤雖然有輕微的波動,但還是能大致穩(wěn)定在0.05附近。反觀兩種對應方式的功效Power有明顯的下降或上升情況,偏離試驗設定的預期功效值0.9。
表4 校正方法錯誤匹配時的結果
本文所研究的是成組序貫試驗中采用不同的基于實際信息量的臨界值校正方法對期中分析以及最終結果的影響。為此進行了兩部分的模擬研究,并對模擬結果進行了分析比較。
模擬結果顯示,無論OBF法還是指數(shù)族損耗函數(shù)法,其對應的損耗函數(shù)校正法和線性插值法均可以較好地維持I類錯誤α和功效Power。在樣本量為50的情況下,指數(shù)損耗函數(shù)法(ρ=2)的I類錯誤α有輕微的膨脹,這是由于該設計第一階段的樣本量不夠大[10],同時該方法早期拒絕概率比OBF法更高[11]。因此,當樣本量為100時I類錯誤就能穩(wěn)定在0.05附近。而對于線性插值法的適用性,分析其方法原理可知,線性插值法通過線性插值擬合試驗設計方法設定的α或β?lián)p耗過程,得到一個近似的損耗形式去校正臨界值,較好地保持了試驗設計的I類錯誤α和功效Power,由此適應各種損耗形式情況下的校正需求,這也證明了SAS軟件將該方法設定為默認選項的合理性。另外,OBF雖然是固定邊界值法,依然可以采用相對應的OBF損耗函數(shù)校正法去進行臨界值校正。由此可推知,在進行臨界值校正時,當α或β?lián)p耗形式已知時,其相同損耗形式的校正方法和線性插值法均可以使用,而從設計需求方面考慮,與損耗形式相同的校正方法能更好的保持原設計特性,更符合設計需求,應當成為校正方法的首選。
另一方面,當臨界值校正方法與設計方法不匹配時,由于試驗的設計特性是優(yōu)先保證試驗的α,因此I類錯誤依然可以相對穩(wěn)定控制,但是功效Power則會受到較大影響,這是由于在指數(shù)損耗函數(shù)法(ρ=3)的情況下,指數(shù)損耗函數(shù)法校正法(ρ=1)所需的最大信息量與設定損耗函數(shù)(ρ=3)所需的最大信息量不符(即指數(shù)損耗函數(shù)校正法ρ=1時所需的最大樣本量大于設定損耗函數(shù)ρ=3時所需的最大樣本量),從而使得檢驗功效Power不足。反之,當校正方法所需的最大信息量小于設定損耗函數(shù)方法所需的最大信息量時,檢驗的總體功效Power則會上升。由此可見,當臨界值校正方法選擇錯誤的時候,期中分析的功效會受到嚴重影響。因此,當損耗函數(shù)形式未知或自定義損耗形式時,線性插值校正法是唯一可以適用的方法,該方法通過對損耗過程的近似擬合來進行臨界值校正,不受未知損耗函數(shù)形式的影響。
綜上所述,在進行成組序貫期中分析時,基于實際信息量的臨界值校正方法選擇準則如下:當試驗設計的損耗函數(shù)形式已知時,選擇相同損耗形式的臨界值校正方法;當損耗函數(shù)形式未知或自定義損耗形式時,選擇線性插值校正法;當試驗設計為固定邊界值法時,其相似的損耗函數(shù)形式校正法與線性插值校正法效果相近。