李光輝, 李俊鵬,, 張崇岐
1.凱里學(xué)院 理學(xué)院,貴州 凱里 556011; 2.廣州大學(xué) 經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院,廣州 510006
混料試驗(yàn)設(shè)計(jì)是一類特殊的設(shè)計(jì), 它廣泛應(yīng)用于生物、 醫(yī)學(xué)、工業(yè)以及科研實(shí)踐中[1-4].混料試驗(yàn)的試驗(yàn)域是q-1維正規(guī)單純形
為了使得試驗(yàn)點(diǎn)能均勻分布在試驗(yàn)域內(nèi), 許多統(tǒng)計(jì)學(xué)者嘗試了各種不同的方法.文獻(xiàn) [5]介紹了混料試驗(yàn)設(shè)計(jì)的基本概念及應(yīng)用.關(guān)于混料均勻設(shè)計(jì)方面的研究可參見(jiàn)文獻(xiàn)[6-9].
文獻(xiàn)[10-11]研究了混料試驗(yàn)域上構(gòu)造均勻設(shè)計(jì)的方法; 文獻(xiàn) [12]討論了在具有附加約束的混料試驗(yàn)域內(nèi)構(gòu)造均勻設(shè)計(jì)的方法; 文獻(xiàn)[13]給出了一種單純形內(nèi)的切片設(shè)計(jì). 這些方法所研究的設(shè)計(jì)都是在單純形內(nèi)部分布均勻, 且在某種均勻性準(zhǔn)則下能達(dá)到較好的水準(zhǔn). 由于混料試驗(yàn)通常使用回歸模型來(lái)建模, 所以均勻設(shè)計(jì)具有很好的穩(wěn)健性.
有時(shí)需要在混料試驗(yàn)域內(nèi)采用非參數(shù)回歸模型來(lái)建模, 除了需要大量的試驗(yàn)點(diǎn)外, 還需要滿足“試驗(yàn)點(diǎn)之間的距離盡可能相等”這一條件. 混料格子點(diǎn)集雖然能均勻分布在混料試驗(yàn)域的內(nèi)部及邊界, 但是當(dāng)混料分量數(shù)超過(guò)3以后, 相鄰的格點(diǎn)之間的距離是不相等的, 并且由混料格子點(diǎn)集剖分得到的子單純形也不完全相等. 這使得使用混料格子點(diǎn)集構(gòu)造的設(shè)計(jì)不利于使用非參數(shù)回歸模型來(lái)建模. 參考超立方體內(nèi)的建模方法, 正交格子點(diǎn)集不僅排布均勻, 相鄰的格點(diǎn)之間的距離相等, 并且超立方體內(nèi)的完全析因設(shè)計(jì)有諸多優(yōu)良的性質(zhì).
關(guān)于超立方體上的格點(diǎn)設(shè)計(jì)已有一些研究成果. 文獻(xiàn)[14-15]研究了交錯(cuò)網(wǎng)格的極大極小距離設(shè)計(jì), 以及旋轉(zhuǎn)球填充設(shè)計(jì).這些空間填充設(shè)計(jì)都是基于格子點(diǎn)集來(lái)研究的, 并且在超立方體上有很多好的性質(zhì).
鑒于此, 我們考慮將超立方體內(nèi)的正交格子點(diǎn)集變換到混料試驗(yàn)域內(nèi), 并且保證變換后試驗(yàn)點(diǎn)之間的距離不變. 根據(jù)正交格子點(diǎn)集的性質(zhì), 研究在混料試驗(yàn)域上正交格點(diǎn)設(shè)計(jì)的性質(zhì).首先給出一種線性變換, 能將Rq-1的點(diǎn)集變換到Sq-1中, 并且保證點(diǎn)之間的距離不變; 然后介紹在單純形內(nèi)部, 將試驗(yàn)點(diǎn)以旋轉(zhuǎn)或添加的方式, 使得設(shè)計(jì)在混料試驗(yàn)域內(nèi)更為均勻; 最后給出實(shí)例分析, 說(shuō)明單純形內(nèi)的正交格點(diǎn)設(shè)計(jì)具有很好的均勻性, 并且非參數(shù)建模也具有穩(wěn)健性.
對(duì)于q分量混料系統(tǒng), 若試驗(yàn)還受到其他約束條件的限制, 我們將試驗(yàn)域記作
X={x=(x1,x2,…,xq)T:x∈Sq-1,aj≤φj(x)≤bj,j=1,2,…,k}
其中:φj(x)是關(guān)于x∈Sq-1的已知函數(shù);aj,bj(j=1,2,…,k)為已知常數(shù).通常X是Sq-1內(nèi)部的一個(gè)不規(guī)則凸幾何體.
對(duì)于任意的x=(x1,x2,…,xq)T∈Sq-1?X以及一個(gè)n點(diǎn)設(shè)計(jì)
Pn={x1,x2,…,xn}?X
我們給出點(diǎn)到點(diǎn)集的距離定義為
其中d2(x,xi)=‖x-xi‖2為歐氏距離的平方.
文獻(xiàn)[16]提出了3種度量混料試驗(yàn)域設(shè)計(jì)的均勻性指標(biāo), 即偏差的定義. 為方便討論, 我們主要討論均方誤偏差和最大距離偏差.
1)均方誤偏差
2)最大距離偏差
以上兩種偏差的計(jì)算較為復(fù)雜, 在實(shí)際情形下一般都是采用Monte Carlo方法來(lái)計(jì)算近似值. 首先生成試驗(yàn)域內(nèi)的隨機(jī)混料點(diǎn)集, 或使用高階格子點(diǎn)集
令LX=L{q,m}∩X={t1,t2,…,tN}作為度量均勻性的NT-net, 再令
(1)
使用msed(Pn)和md(Pn)分別作為MSED(Pn)和MD(Pn)的近似值.在實(shí)際計(jì)算中, 一般要求N>1 000.
q-1維空間中的正交格子點(diǎn)集可以表示為
(2)
其中:αj1,αj2,…,αj,q-1∈Z;eq-1(i)為q-1維向量, 其第i個(gè)元素為1, 其余元素為0;c是已知的正數(shù), 它表示正交格點(diǎn)之間的距離. 我們記由(2)式生成的正交格子點(diǎn)集為
對(duì)于任意的y∈H(q-1,c), 定義y0的voronoi單元為
Vor(y0)={z:‖z-y0‖2≤‖z-y‖2,?y∈H(q-1,c)}
這樣, 我們可以考慮將超立方體內(nèi)的試驗(yàn)點(diǎn)集轉(zhuǎn)化到單純形中, 并且保持格點(diǎn)之間的距離不變.
為了實(shí)現(xiàn)將q-1維超立方體內(nèi)的正交格子點(diǎn)集變換到單純形中, 我們構(gòu)造一種線性變換, 將Rq-1中的點(diǎn)變換到Sq-1中, 且點(diǎn)與點(diǎn)之間的距離保持不變.文獻(xiàn)[17]的單純形保距獨(dú)立變換方法如下:
定義一個(gè)q-1階矩陣
(3)
WTW=Iq-1+Jq-1
對(duì)于W的任意兩列wi,wj,i≠j, 有
這種變換可以將單純形Sq-1中的點(diǎn)映射到Rq-1中.
對(duì)于任意的xi=(xi1,xi2,…,xiq)T∈Sq-1, 記x-1,i=(xi2,xi3,…,xiq)T, 即yi=Wx-1,i,i=1,2, 有‖y1-y2‖=‖x1-x2‖恒成立.
這是因?yàn)橛删仃嘩的性質(zhì)可知
由此可見(jiàn), 經(jīng)過(guò)變換后任意兩點(diǎn)在Rq-1中的距離與Sq-1中是一致的.
我們按照以下方式生成Sq-1中的正交格點(diǎn).
首先生成Rq-1中的正交格子點(diǎn)集{y1,y2,…,yN}?H{q-1,c}, 在混料試驗(yàn)域中選擇一點(diǎn)x0=(x01,x02,…,x0q)T∈X作為參照點(diǎn), 令y0=Wx-1,0,其中
x-1,0=(x02,x03,…,x0q)T
其次, 令矩陣
Y=(y1,y2,…,yN)T+1Ny0
(4)
是以y0作為原點(diǎn)而形成的正交格子點(diǎn)集.
最后,進(jìn)行線性變換, 令矩陣
X=(1N-X-11q-1,X-1)=(x1,x2,…,xN)T
(5)
HX=H ′{q-1,c}∩X
(6)
表示最終確定落入試驗(yàn)域內(nèi)的正交格子點(diǎn)集.
(x1,x2,…,x2q)T=((a1,b1)T?12q-1,12?(a2,b2)T?12q-3,…,12q-1?(aq,bq)T)
則有以下定理.
證首先證明對(duì)于任意點(diǎn)x0=(x01,x02,…,x0q)T∈H0, 有
為了使得試驗(yàn)域X內(nèi)的正交格子點(diǎn)集具有良好的均勻性, 即使得設(shè)計(jì)
Pn={x1,x2,…,xn}=H ′{q-1,c}∩X
的均方誤偏差MSED(Pn)與最大距離偏差MD(Pn)盡可能地小, 我們考慮從以下兩個(gè)方面來(lái)實(shí)現(xiàn).
在X中實(shí)施旋轉(zhuǎn)變換, 使得落入X內(nèi)的正交格點(diǎn)盡可能地多. 我們令q-1階方陣為
Rij(θij)=(eq-1(1),…,eq-1(i-1),Ei,eq-1(i+1),…,eq-1(j-1),Ej,eq-1(j+1),…,eq-1(q-1))
其中Ei=eq-1(i)cosθij-eq-1(j)sinθij,Ej=eq-1(j)sinθij+eq-1(j)cosθij.在(4)式的基礎(chǔ)上, 再令
其中Θ=(θ12,θ13,…,θ(q-2)(q-1))為旋轉(zhuǎn)參數(shù)向量. 將Y(Θ)經(jīng)過(guò)(5)式的逆變換后得
(x1,x2,…,xN)=W-1YT(Θ,c)
(7)
令HX={x1,x2,…,xN}∩X表示最終確定落入試驗(yàn)域內(nèi)的正交格子點(diǎn)集. 通過(guò)調(diào)整(7)式中的參數(shù)Θ, 使得HX達(dá)到滿足要求的均勻性.
首先, 在X內(nèi)使用高階混料格子點(diǎn)集
LX=L{q,m}∩X={t1,t2,…,tN1}
作為在X上度量一個(gè)設(shè)計(jì)所使用的NT-net. 令
這里uij(i=1,2,…,N;j=1,2,…,q)相互獨(dú)立, 且都服從均勻分布uij~U(0,1).
使用文獻(xiàn)[19]的擬分量變換方法, 選擇適當(dāng)?shù)臄M分量變換參數(shù)λ>0, 令
msed{Pn,xn+1}→inf
Pn+k={x1,x2,…,xn,…,xn+k}
(8)
考慮在試驗(yàn)域X上使用正交格子點(diǎn)集來(lái)建模, 按(7)式或(8)式生成X上的正交格子點(diǎn)集記為PN={x1,x2,…,xN}.定義高斯核函數(shù)為
其中h為已知的窗寬參數(shù), 若試驗(yàn)在各點(diǎn)處的觀測(cè)值為y1,y2,…,yN, 則基于正交格點(diǎn)的非參數(shù)回歸模型為
如果在試驗(yàn)域內(nèi)有足夠多的格點(diǎn), 選擇適合的窗寬, 能使得非參數(shù)回歸模型具有很好的預(yù)測(cè)效果.
例1在S3-1上構(gòu)造一個(gè)正交格點(diǎn)設(shè)計(jì), 使得各相鄰點(diǎn)之間的距離為0.2, 通過(guò)旋轉(zhuǎn)過(guò)后設(shè)計(jì)點(diǎn)的分布以及試驗(yàn)域內(nèi)各個(gè)點(diǎn)到該設(shè)計(jì)的距離等高線圖如圖1所示.
圖1 S3-1內(nèi)旋轉(zhuǎn)后的正交格點(diǎn)設(shè)計(jì)
以模型
為例, 在S3-1上的曲面圖如圖2(a)所示, 使用正交格點(diǎn)建立非參數(shù)回歸模型, 擬合回歸曲面如圖2(b)所示.
圖2 曲面圖
由圖2可見(jiàn), 使用正交格點(diǎn)設(shè)計(jì)建立的非參數(shù)回歸模型具有很好的穩(wěn)健性, 擬合效果還是不錯(cuò)的.
使用正交格點(diǎn)構(gòu)造的混料試驗(yàn)域內(nèi)的設(shè)計(jì)分布均勻,利于非參數(shù)建模, 使用文獻(xiàn)[20]的方法, 結(jié)合正交格子點(diǎn)集能有效檢驗(yàn)設(shè)計(jì)的最優(yōu)性, 關(guān)于這方面的性質(zhì)有待進(jìn)一步研究.