程 昕 藺 杉
(東北師范大學 數(shù)學與統(tǒng)計學院,吉林 長春 130024)
邏輯回歸在二分類反應(yīng)研究中具有廣泛的應(yīng)用。Piegorsch 和West 等[1]、Peng 和Robichaud 等[2]的定量風險和風險評估,以及Carter 和Chinchilli 等[3]、Frank 和Jason 等[4]的藥物劑量反應(yīng)曲線研究的一個關(guān)鍵目標是基于邏輯回歸模型確定藥物劑量水平和藥物作用之間的關(guān)系。
關(guān)于單個有效劑量置信集的構(gòu)造最早可以追溯到Fieller[5]和Cox[6]。Li 和Zhang 等[7]、Li 和Wong[8]分別提出了在貝葉斯框架下以及利用漸近理論和自舉方法構(gòu)建多維單個有效劑量置信帶。
進一步地,研究者開始研究構(gòu)建多個有效劑量的聯(lián)合置信帶。Al-Saidy 和Piegorsch 等[9]、Nitcheva 和Piegorsch 等[10]通過轉(zhuǎn)化Scheffé 型聯(lián)合置信帶建立多個有效劑量的聯(lián)合置信帶。Li 和Nordheim 等[11]考慮用四種方法來計算多維有效劑量的置信區(qū)域。Tompstt 和Biedermann 等[12]在向量角度等權(quán)分配的情況下討論了不同有效劑量個數(shù)和置信水平的組合會對臨界值c 造成什么樣的影響。本文在前人研究的基礎(chǔ)上討論向量角度不等權(quán)分配時是否會對臨界值c 的結(jié)果產(chǎn)生影響,進而觀察向量角度不等權(quán)分配時對有效劑量的定位效果是否優(yōu)于向量角度等權(quán)分配。
將邏輯回歸模型
記為π(x)。其中,xT=(1,x1,…,xq)T=(1,xT),β=(β0,β1,…,βq)T是未知的參數(shù)向量,且p(x)=E(Y)。
記N 個響應(yīng)變量分別為Yi,i=1,…,N,相應(yīng)的協(xié)變量為xi=(xi1,…,xiq)T,利用極大似然估計來估計β,記為。假設(shè)有足夠大的N,那么漸近結(jié)果是:
其中,Nq+1是q+1 維多元正態(tài)分布。0 是q+1 維零向量,漸近協(xié)方差矩陣∑可以用NJ-1估計,J-1是β^的觀測協(xié)方差矩陣。因此,對于足夠大的N,可以用NJ-1代替未知的漸近協(xié)方差矩陣∑。所以有近似分布結(jié)果:
于是,可以構(gòu)建邏輯回歸模型的聯(lián)合置信帶:
其中,c 是臨界值,需要通過漸近分布結(jié)合置信水平1-α 求出。
定義如下的有效劑量為xp:
則有效劑量的雙邊型聯(lián)合置信帶為:
若選擇適當?shù)呐R界值c,則對于給定的k 值,Cpi的聯(lián)合概率至少為1-α 。
對于k≥3,q=1,臨界值c 滿足:
其中,-∞<xpi<+∞,i=1,2,…,k。當k=2 時,可以依賴于兩個Zk的獨立性求解臨界值c。但是在k≥3 時不能利用獨立性進行求解。令P2=J-1,根據(jù)公式(3),可以得到N=P-1- )β ~N(0,I2)。定義N=(n1,n2)T的極坐標為(RN,θN),則有n1=RNcosθN,n2=RNsinθN。且RN≥,θN∈[0,2π)~U[0,2π),RN與θN相互獨立。
公式(7)中的P {xpi∈Cpi,i=1,2,…,k }可以進行如下計算:
其中,V(xp)=表示與方向向量=PxP垂直并且與原點距離小于等于c 的N=(n1,n2)T 的集合。所以V(xpi)是一個2k 邊的多邊形區(qū)域。
設(shè)任意兩個方向向量Pxpi和Pxpj的夾角為θij。如圖1 所示,P(N∈Vk)等于平行四邊形區(qū)域ABCD 的概率減去陰影區(qū)域的概率。即為:
其中l(wèi)3(i)=
如圖1 所示,以k=3 為例,計算P(N∈V3)。
圖1 向量角度等權(quán)分配
具體計算步驟為:
步驟一:令V3旋轉(zhuǎn)直到n2平分θ13,將旋轉(zhuǎn)后的圖形記為V3*,由于V3旋轉(zhuǎn)后,P(N∈V3)的值不發(fā)生改變,所以N 在V3*中概率等于N 在V3中概率。
由圖1 可以看出,四邊形ABCD 是菱形。菱形ABCD 可表示為:
則菱形ABCD 的概率等于
步驟二:計算陰影部分的概率,由于左下角陰影部分與右上角陰影部分全等,所以只需計算右上角陰影部分。
陰影部分記為△PQB。接下來計算△PQB 的概率。直線PQ 的解析式為:
其中,l3(2)=
步驟三:用步驟一得到的菱形ABCD 的概率減去步驟二得到的陰影部分的概率的二倍即為P(N∈V3)。
其中l(wèi)3(2)=
在此基礎(chǔ)上討論向量角度不等權(quán)分配是否會對臨界值c 的結(jié)果有影響。將向量角度不等權(quán)分配分為兩種情況,一種是向量角度漸近等權(quán)分配,另一種是向量角度漸遠等權(quán)分配。將第一種情況記為AS2-1 型聯(lián)合置信帶,將第二種情況記為AS2-2 型聯(lián)合置信帶。將雙邊型聯(lián)合置信帶記為AS2 型聯(lián)合置信帶。圖2-5 畫出了有效劑量個數(shù)時向量角度漸近等權(quán)分配和漸遠等權(quán)分配的示意圖。圖2 和圖3 代表漸近等權(quán)分配情況,分別記為AS2-11 和AS2-12。圖4 和圖5 代表漸遠等權(quán)分配情況,分別記為AS2-21 和AS2-22。其中,虛線表示向量角度等權(quán)分配。
圖2 向量角度漸近等權(quán)分配(a )
圖3 向量角度漸近等權(quán)分配(b )
圖4 向量角度漸遠等權(quán)分配(a )
圖5 向量角度漸遠等權(quán)分配(b )
模擬設(shè)計:由于主要討論向量角度不等權(quán)分配時是否對臨界值的結(jié)果產(chǎn)生影響,因此不考慮其他因素對臨界值的影響。所以,首先假定有效劑量個數(shù)k=3。在漸近等權(quán)分布情況下,考慮θ12從左邊趨近等權(quán)分配和從右邊趨近等權(quán)分配兩種情況,分別記為AS2-11和AS2-12;在漸遠等權(quán)分布情況下,考慮θ12趨于零和趨于θ13兩種情況,分別記為AS2-21 和AS2-22。在每種情況下,分別對三種角度進行模擬。在置信水平1-α =0.99、0.95、0.90 下,分別模擬10000 次。結(jié)果如表1、表2 所示。
表1 AS2 型聯(lián)合置信帶與AS2-1 型聯(lián)合置信帶的臨界值
表2 AS2 型聯(lián)合置信帶與AS2-2 型聯(lián)合置信帶的臨界值
如果置信帶的帶寬越小,說明該置信帶的效果越好,對有效劑量的定位就越精確。而置信帶的帶寬大小判斷可以轉(zhuǎn)化為臨界值c 的大小判斷。也就是說,臨界值越小,該置信帶對有效劑量的定位越精確。利用提升率公式來比較置信帶的優(yōu)劣,以雙邊型聯(lián)合置信帶為基準,將AS2-1 型聯(lián)合置信帶和AS2-2 型聯(lián)合置信帶與之進行比較。在1-α 置信水平下,相對于雙邊型聯(lián)合置信帶的提升率可以設(shè)為:
其中,c'表示向量角度不等權(quán)分配時的臨界值,也就是AS2-1 型和AS2-2 型聯(lián)合置信帶的臨界值;c 表示向量角度等權(quán)分配時的臨界值,也就是AS2 型聯(lián)合置信帶的臨界值。
根據(jù)提升率公式,得到表3、表4。
表3 AS2-1 型聯(lián)合置信帶的臨界值提升率
表4 AS2-2 型聯(lián)合置信帶的臨界值提升率
當有效劑量的個數(shù)k 和置信水平1-α 相同時,向量角度漸近等權(quán)分布時的臨界值c 反而比等權(quán)分布時的臨界值c 更大,說明漸近等權(quán)分布對有效劑量的定位沒能更精確。向量角度漸遠等權(quán)分布時的臨界值c對等權(quán)分布時均有提升,且AS2-22 型提升的效果明顯優(yōu)于AS2-21 型。但是,在AS2-22 型的角度逐漸接近θ13的過程中可以看到,其提升效果是有限的,到達一定限度后,提升率不會再大幅增加。
本文提出了雙邊型聯(lián)合置信帶向量角度不等權(quán)分配時,將向量角度不等權(quán)分配的情況分為兩類,分別是向量角度漸近等權(quán)分配和向量角度漸遠等權(quán)分配。其中,向量角度漸近等權(quán)分配又分為AS2-11 和AS2-12兩種情況,向量角度漸遠等權(quán)分配又分為AS2-21 和AS2-22 兩種情況。通過模擬,對比向量角度等權(quán)分配的情況得出結(jié)論,向量角度漸近等權(quán)分配并不能使其臨界值小于等權(quán)分配的臨界值,但是向量角度漸遠等權(quán)分配時可以獲得相對等權(quán)分配時更小的臨界值,即向量角度漸遠等權(quán)分配時的雙邊型聯(lián)合置信帶對有效劑量的定位比向量角度等權(quán)分配時的雙邊型聯(lián)合置信帶更精確。并且,在漸遠等權(quán)分配的兩種情況下,AS2-22 情況有更明顯地提升,但這種提升是有限度的。