葉婉穎, 朱小淵, 張崇岐
(廣州大學(xué) 經(jīng)濟與統(tǒng)計學(xué)院,廣東 廣州 510006)
混料試驗設(shè)計屬于試驗設(shè)計學(xué)科的一個重要分支, 它被廣泛地應(yīng)用在工農(nóng)業(yè)生產(chǎn)和科學(xué)研究中[1], 且試驗的響應(yīng)值只取決于混料中各成分的比例[2-3]. Scheffé[4]為這類試驗提出了一套規(guī)范的理論. 在q分量混料系統(tǒng)中,令xi表示混料中第i個成分的比例. 在混料試驗中, 試驗域是被限制在q-1維正規(guī)單純形內(nèi)的.
Sq-1={(x1,x2,…,xq):xi≥0,
(1)
而通過變形得到的一種適用于混料試驗的回歸模型被稱為混料規(guī)范多項式模型. 隨后, 為了克服單純形-格子設(shè)計試驗點數(shù)過多以及在預(yù)測精度上的不足, Scheffé提出了模型各項更具有對稱性的單純形-中心設(shè)計. 該設(shè)計將各試驗點安排在單純形整體及所有低維單純形的中心上, 對應(yīng)的q分量中心多項式形式為
(2)
其中,βi,βij,…,β12…q分別表示中心多項式(2)中各項的待估參數(shù).
一個試驗的結(jié)果通常會受到多個不同因子的影響, 這些因子可能是定量的, 也可能是定性的, 各因子之間還可能存在對抗或協(xié)同作用[5]. 通常經(jīng)典的混料試驗只討論定量混料分量, 在實際中, 若混料響應(yīng)值除受混料分量影響外,還受到如外界溫度等定性因子的影響, 則需在經(jīng)典混料試驗?zāi)P偷幕A(chǔ)上將定性因子納入考慮后,再對該類問題進行擬合[6]. 在試驗設(shè)計領(lǐng)域中, 含定性因子的已有研究有對混料分量是定性因子情形的討論[7], 對當(dāng)因子為定性因子且在試驗上有約束的區(qū)組設(shè)計的討論[8-10], 關(guān)于含定性因子的一般模型和多響應(yīng)模型的提出及研究[11-12], 以及對含定性因子的混料模型的D-最優(yōu)和A-最優(yōu)設(shè)計的充要條件和半解析解的研究[5]. 常見的含定性因子混料模型的形式為引入名為“過程變量”的獨立變量, 再通過構(gòu)造考慮所有混料分量和過程變量的混合模型或分離模型, 或是構(gòu)造一種將混料分量獨立變換后的模型來進行之后的數(shù)據(jù)分析[13]. 另一種模型形式是將在中心組合設(shè)計基礎(chǔ)上提出的含定性因子模型引入混料試驗中[11].
在第j水平上, 將一個包含了q個定量因子和一個水平數(shù)為s的定性因子的一般模型表示為
x∈?Rq,j= 1,2,…,s
(3)
其中,y(j,xT)是試驗點x=(x1,x2,…,xq)T∈對應(yīng)第j個水平下的響應(yīng)值.和均為已知的給定函數(shù)向量. {βj,j=1,2,…,s}和γ則分別為函數(shù)向量的未知參數(shù)向量集合和未知參數(shù)向量,為定量因子的試驗域,Rq表示q維實數(shù)域. 在模型(3)中,表示回歸函數(shù)中定量因子與定性因子之間存在交互效應(yīng)的部分, 這部分響應(yīng)函數(shù)隨著定性因子水平的變化而有所不同; 而則是指定量因子與定性因子之間不存在交互效應(yīng)的部分, 該部分是總效應(yīng)中不隨定性因子變化而變化的部分, 即在每個定性水平上都保持不變.
近二十年來在混料試驗中, 最常被研究的是最優(yōu)設(shè)計[14-18]. 最優(yōu)設(shè)計準(zhǔn)則的一個重要理論是等價定理(KWT)[19]. 近年來, 在生成響應(yīng)曲面設(shè)計的標(biāo)準(zhǔn)中, 基于預(yù)測的最優(yōu)準(zhǔn)則被廣泛應(yīng)用. 使用預(yù)測響應(yīng)值的方差函數(shù)作為設(shè)計混料試驗起點的說法,在關(guān)于混料試驗的開創(chuàng)性文章中就已提出[4].I-最優(yōu)準(zhǔn)則是一個常用的基于預(yù)測的最優(yōu)準(zhǔn)則, 它是在給定的試驗域上尋求使得預(yù)測值方差函數(shù)的平均值達到最小的設(shè)計[20]. 由于良好的預(yù)測特性對于優(yōu)化至關(guān)重要, 因此,I-最優(yōu)準(zhǔn)則常被用于優(yōu)化二階模型[21]. 利用平均預(yù)測方差的定義[22], Lambrakis[23-24]正式定義了兩種特殊類型混料設(shè)計的I-最優(yōu)性準(zhǔn)則. 關(guān)于混料試驗設(shè)計的兩本專著則簡要提及了I-最優(yōu)性準(zhǔn)則[16,25]. Lambrakis[24]、Laake[26]、Liu等[27]和Sinha等[18]給出了Scheffé模型的I-最優(yōu)混料設(shè)計結(jié)果.關(guān)于中心多項式[27-29]、可加混料模型[30]和Becker模型[31]等的I-最優(yōu)設(shè)計也已有了相關(guān)研究.
本文的主要工作是研究在含定性因子的情況下混料模型的I-最優(yōu)設(shè)計, 因此,需要給出含定性因子混料模型的矩矩陣的定義, 進一步通過具體模型的近似I-最優(yōu)配置的引例得到相關(guān)定理.
y=βTf(x)+ε
(4)
其中,y表示在點x∈處的響應(yīng)觀測值向量,x=(x1,x2,…,xq)T是試驗域中的一點.f(x)=[f1(x),f2(x),…fm(x)]T是關(guān)于試驗點x的已知函數(shù)向量,β是m維未知參數(shù)向量. 假定隨機誤差ε是各分量獨立同分布于均值為0、方差為σ2的正態(tài)分布的隨機向量.
(5)
假設(shè)響應(yīng)值之間互相獨立, 且方差不變, 考慮模型的混料應(yīng)用情形,在第j水平上, 包含了q個定量因子和一個水平數(shù)為s的定性因子的復(fù)合型混料模型通常有以下形式:
(1)定性因子與定量因子之間存在著線性效應(yīng), 協(xié)同或?qū)剐?yīng)僅存在于不隨定性因子水平不同而變化的部分時:
x∈?Sq-1,j=1,2,…,s
(6a)
(2)定性因子與定量因子之間存在著協(xié)同或?qū)剐?yīng), 不隨定性因子水平不同而變化的固定部分存在著線性效應(yīng)時:
x∈?Sq-1,j=1,2,…,s
(6b)
(3)所有線性效應(yīng)、協(xié)同或?qū)剐?yīng)都存在于定性因子與定量因子之間時, 在這種情況下的模型與不含定性因子的二階響應(yīng)曲面模型并無差異, 僅僅是將一般模型放在定性因子的不同水平上進行了擬合:
x∈?Sq-1,j=1,2,…,s
(6c)
x∈?Sq-1,j=1,2,…,s
(7)
則在第j水平上, 一個包含了q個定量因子和一個水平數(shù)為s的定性因子的廣義復(fù)合型混料試驗?zāi)P托问綖?/p>
γT)T=gT(j,xT)θ,x∈Ω,j= 1,2,…,s
(8)
ξ(j,xT)=ζ(j)×ηj(x)
(9)
其中,ζ(j)及ηj(x)分別是和Sq-1上的邊際設(shè)計和條件設(shè)計.
本文將在以下三種實際中常用的低階混料模型的基礎(chǔ)上, 對它們含定性因子的情況進行研究.
(1)q分量一階規(guī)范多項式模型, 簡稱{q,1}多項式模型:
(10a)
(2)q分量二階規(guī)范多項式模型, 簡稱{q,2}多項式模型:
(10b)
(3)q分量中心多項式模型:
(10c)
D-最優(yōu)準(zhǔn)則所選取的設(shè)計是使信息矩陣的行列式達到極大值, 從而使得模型未知參數(shù)向量β的置信橢球體的體積達到最小的設(shè)計, 即使得D-最優(yōu)準(zhǔn)則關(guān)于信息矩陣的判定函數(shù)ΦD[M(ξ)]滿足
(11)
的設(shè)計[14,32].
I-最優(yōu)設(shè)計是使得平均預(yù)測方差
(12)
引理1[17](I-最優(yōu)等價定理) 設(shè)計ξ*是I-最優(yōu)設(shè)計當(dāng)且僅當(dāng)I-準(zhǔn)則下的判決函數(shù)ΨI(x,ξ*)對任一x∈滿足下列不等式:
ΨI(x,ξ*)=fT(x)M-1(ξ*)BM-1(ξ*)f(x)-
tr(M-1(ξ)B)≤0
(13)
其中, 矩矩陣
(14)
例1 對于三種實際中常用的低階混料試驗?zāi)P?10a)~(10c), 考慮定性因子取兩個水平(s=2)的情況, 將試驗域Ω=Sq-1×上含一個兩水平定性因子z的三分量模型具體形式列舉如下(其他模型形式類似可得):
(1){3,1}多項式模型
模型(6a)和模型(6c)具體為
(15a)
模型(6b)具體為
(15b)
(2){3,2}多項式模型(及其轉(zhuǎn)換為含過程變量的模型形式)
模型(6a)具體為
(β1a+β2az)x1+(β1b+β2bz)x2+
肝臟感染中,細菌性肝膿腫是常見且嚴(yán)重的化膿性疾病。隨著理論研究及醫(yī)療技術(shù)的進步,不僅使肝膿腫病死率降至10% 以下,還使其治愈率及診斷率不斷提高[2]。對細菌性肝膿腫,目前采用較多的是超聲引導(dǎo)下經(jīng)皮肝穿刺細針抽吸術(shù)與經(jīng)皮肝穿刺置管引流術(shù)。一般認為,對于直徑≥5cm的膿腫,采用穿刺置管引流術(shù)[3]。置管引流術(shù)較細針抽吸術(shù)明顯縮短了患者的痊愈時間。
(β1c+β2cz)x3+γ12x1x2+γ13x1x3+γ23x2x3
(15c)
模型(6b)具體為
γ1x1+γ2x2+γ3x3+(β1ab+β2abz)x1x2+
(β1ac+β2acz)x1x3+(β1bc+β2bcz)x2x3
(15d)
模型(6c)具體為
(β1a+β2az)x1+(β1b+β2bz)x2+
(β1c+β2cz)x3+(β1ab+β2abz)x1x2+
(β1ac+β2acz)x1x3+(β1bc+β2bcz)x2x3
(15e)
在含定性因子的復(fù)合型混料模型(8)中, 設(shè)計ξ上的信息矩陣為[17]
(16)
其中,
(17)
(18)
當(dāng)在定性因子的每個水平上考慮相同的條件設(shè)計η時, 模型在設(shè)計ξ上的信息矩陣可簡化為
(19)
而當(dāng)ζ(j)是上的均勻設(shè)計時, 即此時,模型在設(shè)計ξ=ζ(j)×ηj上的信息矩陣可進一步簡化為
(20)
其中,Is表示s階單位陣,1s表示元素全為1的s維列向量. 可以看出, 在實際問題中若是有對邊際設(shè)計ζ(j)取非均勻設(shè)計的需求, 則只需添加上不同權(quán)重系數(shù)ζ(j)即可.
為簡化討論情況, 下文始終僅考慮在定性因子的每個水平上取相等條件設(shè)計η的情況.
引理2[6](混料分類模型的D-最優(yōu)設(shè)計) 當(dāng)ζ(j)是上的均勻設(shè)計時, 模型(8)在D-最優(yōu)準(zhǔn)則下的方差函數(shù)為
(21)
(22)
其中,p1表示模型中函數(shù)向量f1的維數(shù),p2表示模型中函數(shù)向量f2的維數(shù). 當(dāng)且僅當(dāng)x為柱點時等號成立.
在對模型求I-最優(yōu)設(shè)計的過程中, 可對I-最優(yōu)準(zhǔn)則進行簡化. 首先,將試驗域上的平均預(yù)測方差的積分形式改寫為更易于計算的Gamma函數(shù)的形式:
(23)
進一步, 假定試驗域是q-1維單純形全域Sq-1時, 試驗域上的平均預(yù)測值方差可改寫為[24,33-34]
APV=Γ(q)·tr[M-1B]=
(24)
可以看出, 為了得到含定性因子的混料模型的I-最優(yōu)設(shè)計, 求解得到模型的矩矩陣B是重要的一環(huán).
定理1 含定性因子的混料模型(8)的矩矩陣B的形式為
(25)
(26)
證明在含定性因子的混料模型中, 矩矩陣B的形式與一般混料模型的矩矩陣稍有不同, 具體為
當(dāng)ζ(j)是上的均勻設(shè)計時, 含一個二水平定性因子的{3,2}多項式模型的矩矩陣為模型在設(shè)計ξ上的信息矩陣為信息矩陣的逆為其中,從而可得到平均預(yù)測方差為
APV=Γ(q)·tr[M-1(ξ)B]=
由表1可以看出, 解得的tr[M-1(ξ)B]值的數(shù)量級均非常大, 且無論分量數(shù)為多少, 最終得到的近似I-最優(yōu)配置中賦予各頂點處試驗點的測度均幾乎為0, 即在含兩水平定性因子的二階多項式模型的I-最優(yōu)設(shè)計中, 試驗點僅考慮設(shè)置于各棱中點處.
圖1描述了3≤q≤6時,tr[M-1(ξ)B]的變化情況. 由圖1可以看出, 在分量數(shù)達到6之前,tr[M-1(ξ)B]的值遞減, 到q=5時達到最小. 在實際中為了便于安排試驗, 通??紤]的分量數(shù)不會太大, 且二階混料模型最為常用, 故安排分量數(shù)為5的試驗, 采用含定性因子的{q,2}多項式模型進行擬合即可.
圖1 tr[M-1(ξ)B]隨q變化圖Fig.1 The changes in tr[M-1(ξ)B] with q
定理2 當(dāng)ζ(j)是上的均勻設(shè)計時, 含s水平定性因子的復(fù)合型{q,2}多項式模型的近似I-最優(yōu)設(shè)計為ξ(j,xT)=ζ(j)×η(x),其中,表示x的坐標(biāo)點的循環(huán)置換點集,分別表示單純形的頂點和各條棱中點,ω1、ω2分別表示譜點的配置測度, 且有當(dāng)定性因子取二水平,q=3,4,5,6時,ω1、ω2的具體數(shù)值如表1所示. 表1中的ni(i=1,2)表示的試驗點數(shù).
表1 含定性因子的復(fù)合型{q,2}多項式模型的近似I-最優(yōu)設(shè)計Table 1 Approximate I-optimal design of compound scheffe′s quadratic model with a qualitative factor
定理3 含s水平定性因子的復(fù)合型混料模型(8)中, 設(shè)計ξ*為I-最優(yōu)設(shè)計的必要條件是ζ*(j)是上的均勻設(shè)計, 即其中,ξ=ζ*(j)×η(x).且當(dāng)該必要條件成立時有
(27)
(28)
tr[M-1(ξ)B]=tr[N11(ξ)·(Is?B11)]+
(1s?B12)]+tr[N22(ξ)·B22]=
可進一步將tr[M-1(ξ)B]簡寫為
s·B21-s·B12+N22·B22].
定理4 當(dāng)ζ(j)是上的均勻設(shè)計時, 模型(8)在I-準(zhǔn)則下的方差函數(shù)如式(30)所示, 則ξ*是I-最優(yōu)的充要條件為
dI(j,x;ξ)-tr[M-1(ξ)B]≤0
(29)
其中,tr[M-1(ξ)B]如式(27)所示. 當(dāng)且僅當(dāng)x為柱點時, 等號成立.
證明在I-準(zhǔn)則下, 方差函數(shù)可計算為
dI(j,x;ξ)=
gT(j,xT)M-1(ξ)BM-1(ξ)g(j,xT)=
(30)
由式(13)可知, 設(shè)計ξ*是I-最優(yōu)設(shè)計當(dāng)且僅當(dāng)I-準(zhǔn)則下方差函數(shù)dI(j,x;ξ*)對任一x∈Ω滿足不等式dI(j,x;ξ*)-tr[M-1(ξ)B]=gT(j,xT)M-1(ξ)BM-1(ξ)g(j,xT)-tr[M-1(ξ)B]≤0,其中, 矩矩陣B由式(25)可得, 且dI(j,x;ξ*)在柱點處的值等于tr[M-1(ξ)B].
推論1 當(dāng)ζ(j)是上的均勻設(shè)計時, 含定性因子的{q,1}多項式模型的近似I-最優(yōu)設(shè)計為ξ(j,xT)=ζ(j)×η(x),其中,表示單純形的頂點,ω表示譜點的配置測度.當(dāng)定性因子取二水平, 3≤q≤6時, 具體數(shù)值如表2所示. 圖2描述了3≤q≤6時,tr[M-1(ξ)B]的變化情況.
表2 含定性因子的復(fù)合型{q,3}多項式模型的近似I-最優(yōu)設(shè)計Table 2 Approximate I-optimal design of compound{q,3} polynomial with a qualitative factor
圖2 tr[M-1(ξ)B]隨q變化圖Fig.2 The changes in tr[M-1(ξ)B] with q
推論2 當(dāng)ζ(j)是上的均勻設(shè)計時, 含定性因子的q分量中心多項式模型的近似I-最優(yōu)設(shè)計為ξ(j,xT)=ζ(j)×η(x),其中分別表示單純形的頂點和各低維單純形中心點,ω1,ω2,…,ωq分別表示譜點的配置測度. 當(dāng)定性因子取二水平, 3≤q≤5時, 具體數(shù)值如表3所示.
表3 含定性因子的復(fù)合型q分量中心多項式模型的近似I-最優(yōu)設(shè)計Table 3 Approximate I-optimal design of compound q centroid polynomial with a qualitative factor
圖3描述了3≤q≤5時,tr[M-1(ξ)B]的變化情況.
圖3 tr[M-1(ξ)B]隨q變化圖Fig.3 The changes in tr[M-1(ξ)B] with q
由表2和表3可以看出, 在含二水平定性因子的q分量中心多項式模型中解得的tr[M-1(ξ)B]值的數(shù)量級仍然非常大, 且賦予各頂點試驗點處的測度均幾乎為0, 這可能是由于矩陣M-1(ξ)和B的稀疏性. 而圖2和圖3則描述了q取具體分量值時tr[M-1(ξ)B]的變化情況, 可以看出, 在含二水平定性因子的{q,1}多項式模型和q分量中心多項式模型中,q=5時的近似I-最優(yōu)設(shè)計結(jié)果均十分優(yōu)良. 結(jié)合前述可以得出如下結(jié)論: 在實際生產(chǎn)生活中, 若對含定性因子情況下的混料試驗有預(yù)測的需求, 則安排分量數(shù)為5的試驗時往往能得到較為滿意的設(shè)計結(jié)果.
本文研究了q分量一階、二階規(guī)范多項式模型和中心多項式模型這三種實際中常用的低階混料模型含定性因子情況下的I-最優(yōu)設(shè)計問題, 并給出當(dāng)定性因子為二水平情況下時模型的近似I-最優(yōu)配置. 得出如下結(jié)論: 在混料模型含定性因子時, 除了一階情形外, 近似I-最優(yōu)配置中賦予各頂點試驗點處的測度均幾乎為0, 且解得的tr[M-1(ξ)B]值的數(shù)量級均非常大. 當(dāng)q=5時, 在三種模型中的近似I-最優(yōu)設(shè)計結(jié)果均十分優(yōu)良. 另外, 當(dāng)分量數(shù)超過5時, 易產(chǎn)生維數(shù)災(zāi)難問題, 使得近似I-最優(yōu)配置的求解困難呈冪級數(shù)增長, 因此,在q≥6的高維情況下可以考慮降維兼引入算法的方法,搜索得到近似最優(yōu)設(shè)計.