張宣昊
(上海第二工業(yè)大學(xué)理學(xué)院,上海201209)
常用回歸模型的A-最優(yōu)設(shè)計(jì)
張宣昊
(上海第二工業(yè)大學(xué)理學(xué)院,上海201209)
介紹回歸模型的最優(yōu)試驗(yàn)設(shè)計(jì)方法,給出最優(yōu)設(shè)計(jì)準(zhǔn)則及其統(tǒng)計(jì)意義?;诳紤]參數(shù)估計(jì)精度的A-最優(yōu)設(shè)計(jì)準(zhǔn)則,利用MATLAB數(shù)學(xué)計(jì)算軟件對(duì)常用的3種回歸模型——一元一次、一元二次和指數(shù)模型分別構(gòu)造其相應(yīng)的A-最優(yōu)設(shè)計(jì),從而對(duì)常用回歸模型的應(yīng)用給出試驗(yàn)點(diǎn)選擇的依據(jù)。
常用回歸模型;設(shè)計(jì)準(zhǔn)則;A-最優(yōu)設(shè)計(jì)
回歸分析是確定兩個(gè)或兩個(gè)以上變量間相互依賴定量關(guān)系的一種統(tǒng)計(jì)分析方法,應(yīng)用十分廣泛。建立回歸模型需根據(jù)實(shí)測(cè)數(shù)據(jù)來(lái)求解模型的各個(gè)參數(shù)。不同的試驗(yàn)點(diǎn)對(duì)應(yīng)不同的響應(yīng)值,從而在固定的參數(shù)估計(jì)方法下將得到不同的估計(jì)值[1]。因此,試驗(yàn)者必須事先給出合理的試驗(yàn)點(diǎn)及其比例才能保證優(yōu)良的回歸效果。
針對(duì)線性回歸模型,最優(yōu)設(shè)計(jì)即是為了保證估計(jì)量在精確性方面具有某種優(yōu)良性而提出的設(shè)計(jì)方法。它以某個(gè)試驗(yàn)?zāi)康淖鳛樵囼?yàn)設(shè)計(jì)的出發(fā)點(diǎn),通過建立能恰當(dāng)?shù)胤从吃囼?yàn)?zāi)康牡脑O(shè)計(jì)準(zhǔn)則,來(lái)選取最優(yōu)方案安排試驗(yàn)。
A-最優(yōu)設(shè)計(jì)準(zhǔn)則是最常用的設(shè)計(jì)準(zhǔn)則之一,其統(tǒng)計(jì)意義在于使未知參數(shù)各分量估計(jì)值的方差之和達(dá)到最小,因此A-最優(yōu)設(shè)計(jì)能最大地提高參數(shù)估計(jì)的精度,使回歸模型有很好的擬合效果[2]。本文對(duì)常用的3種回歸模型——一元一次、一元二次和指數(shù)模型分別構(gòu)造試驗(yàn)點(diǎn)最少的A-最優(yōu)設(shè)計(jì)。
1.1 線性回歸模型
設(shè)X是因子區(qū)域(又稱試驗(yàn)點(diǎn)集),且是一個(gè)有界閉集,試驗(yàn)時(shí)在X內(nèi)選取試驗(yàn)點(diǎn)。當(dāng)考慮一個(gè)變量的回歸時(shí),X是一維點(diǎn)集;當(dāng)考慮p個(gè)自變量的回歸時(shí),X是p維點(diǎn)集。設(shè)f1(x),···,fk(x)是X上已知的k個(gè)連續(xù)函數(shù),且線性獨(dú)立,記f(x)=[f1(x)···fk(x)]T。自變量與響應(yīng)變量之間滿足線性模型:y(x)=fT(x)β+ε。其中: ε~N(0,σ2)是隨機(jī)誤差項(xiàng);β=[β1···βk]T是未知參數(shù)向量;y(x)表示在點(diǎn)x∈X處的響應(yīng)觀測(cè)值,且一般不同試驗(yàn)點(diǎn)的觀測(cè)值相互獨(dú)立。模型可表示為回歸方程:Ey=f'(x)β,E為隨機(jī)變量的數(shù)學(xué)期望。
通過在設(shè)計(jì)域X中選取試驗(yàn)點(diǎn)x1,···,xN,獲得響應(yīng)變量的觀測(cè)值y1,···,yN,由此估計(jì)參數(shù)向量β,即可得回歸方程。
1.2 最優(yōu)設(shè)計(jì)準(zhǔn)則
稱ξN=[x1···xN]為一個(gè)精確設(shè)計(jì),在有重復(fù)的情況下,不妨設(shè)不同的試驗(yàn)點(diǎn)為x1,···,xn,重復(fù)次數(shù)分別為v1,···,vn,設(shè)計(jì)ξN即為:ξN=其概率分布形式為對(duì)于一般的概率分布稱為近似設(shè)計(jì),而Ξ={ξ:ξ是X上的概率分布}構(gòu)成了設(shè)計(jì)全體,其信息陣即為
設(shè)Φ是定義在M(ξ)上的一個(gè)準(zhǔn)則函數(shù),若設(shè)計(jì)ξ?∈Ξ滿足則稱設(shè)計(jì)ξ?為Φ最優(yōu)設(shè)計(jì),而設(shè)計(jì)的優(yōu)良性準(zhǔn)則即為信息陣的函數(shù)Φ(M(ξ))。以下是幾類經(jīng)典最優(yōu)設(shè)計(jì)的準(zhǔn)則函數(shù)及其意義。
D-最優(yōu)準(zhǔn)測(cè):Φ(M(ξ))=det(M-1(ξ)),統(tǒng)計(jì)意義為D-最優(yōu)設(shè)計(jì)下,參數(shù)估計(jì)值?β的廣義方差達(dá)到最小[4]。
A-最優(yōu)準(zhǔn)則:Φ(M(ξ))=tr(M-1(ξ)),統(tǒng)計(jì)意義為A-最優(yōu)設(shè)計(jì)下,未知參數(shù)各分量估計(jì)值的方差之和達(dá)到最小[4]。
本文重點(diǎn)研究A-最優(yōu)設(shè)計(jì)。若設(shè)計(jì)ξ∈Ξ的信息矩陣M(ξ)是非退化的,則tr(M-1(ξ))為β的最小二乘估計(jì)各分量的方差之和。tr(M-1(ξ))越小,則估計(jì)量的方差之和(或方差之平均)越小,故認(rèn)為使tr(M-1(ξ))最小的設(shè)計(jì)為最優(yōu)[5]。
2.1 一元一次模型
考慮一元一次回歸模型y=β0+β1x+ε, f(x)=[1 x]T,X=[-1,1]的試驗(yàn)設(shè)計(jì)[6],注意到試驗(yàn)點(diǎn)至少為2個(gè),構(gòu)造其相應(yīng)的A-最優(yōu)設(shè)計(jì)。
由MATLAB軟件[7]計(jì)算得:當(dāng)p=0.5,q=0時(shí),tr(M-1(ξ0))達(dá)到最小值2,即一元一次回歸模型的A-最優(yōu)設(shè)計(jì)為
2.2 一元二次模型
考慮一元二次回歸模型y=β0+β1x+β2x2+ε, f(x)=[1 x x2]T,X=[-1,1]的試驗(yàn)設(shè)計(jì)[6],注意到試驗(yàn)點(diǎn)至少為3個(gè),構(gòu)造其相應(yīng)的A-最優(yōu)設(shè)計(jì)。
由MATLAB軟件[7]計(jì)算得:當(dāng)p=0.17, q=0.5時(shí),tr(M-1(ξ0))達(dá)到最小值13.9441,即一元二次回歸模型的A-最優(yōu)設(shè)計(jì)為ξ0=
2.3 指數(shù)模型
考慮指數(shù)回歸模型y=β0+β1ex+ε,f(x)= [1 ex]T,X=[-1,1]的試驗(yàn)設(shè)計(jì)[6],注意到試驗(yàn)點(diǎn)至少為2個(gè),構(gòu)造其相應(yīng)的A-最優(yōu)設(shè)計(jì)。
由MATLAB軟件[7]計(jì)算得:當(dāng)p=0.73,q=0時(shí),tr(M-1(ξ0))達(dá)到最小值2.841 4,即指數(shù)回歸模型的A-最優(yōu)設(shè)計(jì)為
[1]王萬(wàn)中,茆詩(shī)松.試驗(yàn)的設(shè)計(jì)與分析[M].上海:華東師范大學(xué)出版社,1997.
[2]ATKINSON A C,DONEV A N.Optimum experimental design[M].New York:Clarendon.Oxford,1992.
[3]任露泉.回歸設(shè)計(jì)及其優(yōu)化[M].北京:科學(xué)出版社, 2009.
[4]顧原.多響應(yīng)線性模型的復(fù)合最優(yōu)設(shè)計(jì)[D].上海:上海師范大學(xué),2010.
[5]張宣昊,岳榮先.均勻設(shè)計(jì)在多響應(yīng)線性模型失擬檢驗(yàn)中的最優(yōu)性[J].上海師范大學(xué)學(xué)報(bào),2007,36(2):12-16.
[6]張宣昊.多響應(yīng)模型判別的試驗(yàn)設(shè)計(jì)[J].上海第二工業(yè)大學(xué)學(xué)報(bào),2007,24(2):91-97.
[7]蘇金明,阮沈勇.MATLAB6.1實(shí)用指南[M].北京:電子工業(yè)出版社,2002.
A-Optimal Designs for the Commonly Used Regression Models
ZHANG Xuan-hao
(School of Science,Shanghai Second Polytechnic University,Shanghai 201209,P.R.China)
The optimal experiment design method for regression models is described.The optimal design criteria and the statistical meaning is given.Based on considering parameter estimation precision A-optimal design criteria,three commonly used regression models:linear,quadratic and exponential models are constructed its corresponding A-optimal design by using of mathematical computing software MATLAB.The applications for commonly used regression models are given for the selection of the experiment points.
commonly used regression models;design criterion;A-optimal designs
O212.6
A
1001-4543(2014)03-0220-03
2014-03-12
張宣昊(1981–),男,上海人,講師,碩士,主要研究方向?yàn)楦怕式y(tǒng)計(jì)、最優(yōu)試驗(yàn)設(shè)計(jì)。電子郵箱xhzhang@sspu.edu.cn。
上海第二工業(yè)大學(xué)重點(diǎn)學(xué)科建設(shè)項(xiàng)目(No.XXKZD1304)資助
上海第二工業(yè)大學(xué)學(xué)報(bào)2014年3期