亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        嶺回歸分析中廣義嶺估計(jì)的一種改進(jìn)方法

        2017-08-09 19:49:15趙東波

        趙東波

        【摘要】對(duì)于多重共線性條件下線性回歸模型系數(shù)的有偏估計(jì),統(tǒng)計(jì)學(xué)家提出了嶺回歸估計(jì),Hoerl和Kennard提出了廣義嶺估計(jì)[1].本文主要討論廣義嶺估計(jì)的進(jìn)一步推廣,基于均方誤差和均方殘差的比較,給出一種解決問(wèn)題的新方法.

        【關(guān)鍵詞】線性回歸模型;廣義嶺估計(jì);均方誤差;均方殘差

        一、引言

        為消除或減弱設(shè)計(jì)陣的復(fù)共線性對(duì)參數(shù)估計(jì)的不良影響,國(guó)內(nèi)外學(xué)者提出了各種有偏估計(jì),如,嶺估計(jì)[2]、主成分估計(jì)等等,這些估計(jì)在均方誤差意義下可以優(yōu)于LS估計(jì)[3].但是,在某種情況下還有一定的缺陷.

        定義1[4]我們引進(jìn)線性回歸模型的典則形式:

        Y=Zα+ε,E(ε)=0,Cov(ε)=σ2In,(1)

        這里,Z=XΦ稱(chēng)為典則變量,α=Φ′β稱(chēng)為典則參數(shù),其中Φ=(φ1,φ2,…,φp),且φ1,φ2,…,φp為X′X的對(duì)應(yīng)特征根λ1≥λ2≥…≥λp>0的標(biāo)準(zhǔn)化特征向量.所以Z′Z=Λ=diag(λ1,λ2,…,λp).則α的LS估計(jì)為=(Z′Z)-1Z′Y=Λ-1Z′Y.其狹義嶺估計(jì)為(k)=(Λ+kI)-1Z′Y=(Λ+kI)-1Φ′X′Y.在嶺回歸估計(jì)法的基礎(chǔ)上,有學(xué)者提出了廣義嶺回歸估計(jì)法,定義為β(k)=(X′X+ΦKΦ′)-1X′Y,其中K=diag(k1,k2,…,kp)>0.

        本文主要是在前人提出的廣義嶺估計(jì)的基礎(chǔ)上,對(duì)其中的一部分做了進(jìn)一步的探討與研究,并加以改進(jìn).首先,討論廣義嶺估計(jì)的主要缺陷.

        第一,只有在較小特征根所對(duì)應(yīng)的特征向量的方向上估計(jì)才是不精確的,而在大的特征根所對(duì)應(yīng)的特征向量的方向上估計(jì)是準(zhǔn)確的.因此,我們只需要修正X′X全部對(duì)角元的一部分就可以,也就是只對(duì)X′X的接近于0的特征根進(jìn)行修正.廣義嶺估計(jì)其實(shí)是對(duì)β進(jìn)行了過(guò)分的壓縮.

        第二,廣義嶺估計(jì)的殘差平方和為

        RSS(K)=(Y-Xβ(K))′(Y-Xβ)

        =(Y-Xβ)′(Y-Xβ)+(β(K)-β)′X′X(β(K)-β)

        =RSSmin+ΔRSS.

        這說(shuō)明廣義嶺估計(jì)在降低均方誤差的同時(shí),又使得殘差平方和增大.為了得到良好的擬合效果,我們當(dāng)然要降低均方誤差以使估計(jì)更接近真值,但又不能不顧及殘差平方和的增大.

        定義2[5]對(duì)于線性回顧模型,定義1-k型廣義嶺估計(jì)β1-k(K)=(X′X+ΦK0Φ′)-1X′Y.

        其中,K0=11ki+1kp,k>0,i=t,t+1,…,p.

        設(shè)X′X的較大的特征根有t個(gè),t為正整數(shù),且0≤t≤p,則需要修正的小特征根有(p-t)個(gè).在多重共線性的情況下,X′X的特征根發(fā)生兩極分化的結(jié)果可以人為地確定該對(duì)哪些特征根進(jìn)行修正.由定義可以看出,β1-k(K)是廣義嶺估計(jì)類(lèi)β(K)的一種估計(jì).當(dāng)ki=0,i=1,2,…,p時(shí),β1-k(K)即化為L(zhǎng)S估計(jì).對(duì)于線性回歸方程典則形式(1),定義1-k型廣義嶺估計(jì)α1-k(K)=(Λ+K0)-1Z′Y式中,Z=XΦ,α=Φ′β,其中Φ=(φ1,φ2,…,φp),且φ1,φ2,…,φp為X′X的對(duì)應(yīng)特征根λ1≥λ2≥…≥λp>0的標(biāo)準(zhǔn)化特征向量.所以Z′Z=Λ=diag(λ1,λ2,…,λp).K0定義同上.

        二、對(duì)β1-k(K)與β(K)的均方誤差(MSE)進(jìn)行比較分析

        因?yàn)棣?-k(K)是β(K)的一種特殊情況,先來(lái)看β(K)的MSE.

        MSE(β(K))=σ2∑pi=1λi(λi+ki)2+∑pi=1k2iα2i(λi+ki)2 .

        其中,K=diag(k1,k2,…,kp)>0,對(duì)ki(i=1,2,…,p)求偏導(dǎo)數(shù),并令其偏導(dǎo)數(shù)為0,得MSE(β(K))ki=2α2ikiλi(λi+ki)3-2σ2λi(λi+ki)3=0.解出,當(dāng)ki=σ2α2i(i=1,2,…,p)時(shí),MSE(β(K))達(dá)到最小.

        將上式中正定對(duì)角陣K用本文提出的K0替換,即得

        MSE(β1-k(K0))=E‖β1-k(K0)-β‖2

        =tr[Cov(β1-k(K0))+(Eβ1-k(K0))-β(E(β1-k(K0))-β)′]

        =σ2tr((Λ+K0)-1Λ(Λ+K0)-1Φ′Φ)+tr[Φ((Λ+K0)-1Λ-I)αα′((Λ+K0)-1Λ-I)Φ′]

        =σ2∑ti=1λi(λi+1)2+σ2∑pi=t+1λi(λi+ki)2+∑pi=t+1k2iα2i(λi+ki)2 .

        同理,當(dāng)ki=σ2α2i(i=t+1,t+2,…,p)時(shí),MSE(β1-k(K0))達(dá)到最小.此時(shí),將ki=σ2α2i(i=1,2,…,t)代入,得

        MSE(β(K))-MSE(β1-k(K0))

        =σ2∑ti=1λi(λi+ki)2+∑ti=1k2iα2i(λi+ki)2-σ2∑ti=1λi(λi+1)2

        =∑ti=11+2λi-kiλi(1+λi)2(λi+ki).(2)

        另外,當(dāng)ki→0(i=1,2,…,p)時(shí),MSE(β(K))ki=2α2ikiλi(λi+ki)3-2σ2λi(λi+ki)3<0.MSE(β(K))ki在ki≥0是連續(xù)函數(shù),于是當(dāng)ki充分小,MSE(β(K))

        由此可以得到結(jié)論,改進(jìn)后減小了多重共線性對(duì)參數(shù)估計(jì)的危害.在理論上MSE(β1-k(K))的最小值要大于MSE(β(K))的最小值.雖然前者比后者的對(duì)于LS估計(jì)β的改進(jìn)小,但是這種改進(jìn)還是合理的.后者改進(jìn)偏大,超過(guò)了應(yīng)該壓縮的程度.

        三、對(duì)β1-k(K)與β(K)的均方殘差(MSR)進(jìn)行比較分析

        由上可知

        MSE(β(K))=E(RSS(β(K)))

        =E(Y-Xβ(K))′(Y-Xβ(K))

        =E[(Y-Xβ)′(Y-Xβ)+(β(K)-β)′X′X(β(K)-β)]

        =MSR(β)+ΔMSR(β(K)).

        其中,MSR(β)=(n-p)σ2為參數(shù)β所有估計(jì)的均方殘差的最小值.ΔMSR為廣義嶺估計(jì)對(duì)LS估計(jì)的修正所造成的MSR的增量,下面我們來(lái)考慮ΔMSR項(xiàng).

        ΔMSR(β(K))=E‖Xβ(K)-Xβ‖2

        =E‖Zα(K)-Zα‖2

        =E[Z(Λ+K)-1Λα+Z(Λ+K)-1Z′ε-Zα-ZΛ-1Z′ε]·[Z(Λ+K)-1Λα+Z(Λ+K)-1Z′ε-Zα-ZΛ-1Z′ε]

        =α′((Λ+K)-1Λ-I)Λ((Λ+K)-1Λ-I)α+σ2tr(Λ-1((Λ+K)-1Λ-I)Λ((Λ+K)-1Λ-I))

        =∑pi=1λiα2ik2i(λi+ki)2+σ2∑pi=1k2i(λi+ki)2,

        式中的K陣同上定義.將上式中正定對(duì)角陣用本文提出的K0替換,即得

        ΔMSE(β1-k(K0))=E‖Xβ1-k(K0)-Xβ‖2

        =E‖Zα1-k(K0)-Zα‖2

        =α′((Λ+K0)-1Λ-I)Λ((Λ+K0)-1Λ-I)α+σ2tr(Λ-1((Λ+K0)-1Λ-I)Λ((Λ+K0)-1Λ-I))

        =∑ti=1λiα2i+σ2(1+λi)2+∑pi=t+1(σ2+λiσ2i)k2i(λi+ki)2,

        MSR(β(K))-MSR(β1-k(K0))

        =∑ti=1(σ2+λiα2i)k2i(λi+ki)2-∑ti=1λiα2i+σ2(1+λi)2

        =∑ti=1(σ2+λiα2i)[k2i(1+λi)2-(λi+ki)2](λi+ki)2(1+λi)2

        =∑ti=1(σ2+λiα2i)λ2i(k2i-1)(λi+ki)2(1+λi)2.

        若想得到MSR(β(K))>MSR(β1-k(K0)),則需要k2i>1.

        綜上所述,當(dāng)1

        MSE(β(K0))

        MSR(β)

        當(dāng)ki>1λi+2時(shí),

        MSE(β(K))

        MSR(β)

        四、結(jié)束語(yǔ)

        以上對(duì)廣義嶺估計(jì)參數(shù)的改進(jìn)是有效的,此時(shí)減小了廣義嶺估計(jì)過(guò)度膨脹的殘差平方和.廣義嶺估計(jì)在降低均方誤差的同時(shí)使得殘差平方和增大,對(duì)數(shù)據(jù)的擬合變壞.以上對(duì)廣義嶺估計(jì)的嘗試性改進(jìn)有其合理性,但是其使用范圍還是有限的.

        【參考文獻(xiàn)】

        [1]Hoerl A E,Kennard R W.Ridge Regression,Biased Estimation for Nonorthogonal Problems[J].Technometrics,1970(12):55-67

        [2]何秀麗.多元線性模型與嶺回歸分析[D].武漢:華中科技大學(xué),2005.

        [3]戴儉華,等.嶺估計(jì)優(yōu)于最小二乘估計(jì)的條件[J].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1994(2):53-58.

        [4]何良材.嶺回歸估計(jì)β^(k)的一個(gè)特性及其應(yīng)用[J].重慶大學(xué)學(xué)報(bào),1990(13):127-133.

        [5]李兵.線性回歸模型參數(shù)有偏估計(jì)的進(jìn)一步探討[D].桂林:桂林電子科技大學(xué),2007.

        亚洲精品中文字幕乱码二区 | 亚洲精品大全中文字幕| 亚洲 小说区 图片区 都市| 国产精品毛片一区二区 | 一区二区三区日本大片| 18禁男女爽爽爽午夜网站免费| 亚洲午夜久久久久中文字幕久| 在线观看视频国产一区二区三区 | 精品国产sm最大网站| 99精品欧美一区二区三区| 91香蕉视频网| 亚洲一区二区三区美女av| 久久国产精品精品国产色| 精品无人区无码乱码毛片国产| 中文字幕一区在线观看视频| 夜夜揉揉日日人人| 国产av天堂亚洲国产av麻豆| 成熟的女人毛茸茸色视频| 中国美女a级毛片| 香蕉视频www.5.在线观看| 永久免费的拍拍拍网站| 青青草原综合久久大伊人精品| 女人被爽到高潮视频免费国产| 成人片黄网站色大片免费观看app| 国产日韩AV无码免费一区二区| 少妇人妻无奈的跪趴翘起| 精品亚洲成av人在线观看| 国产成人无码一区二区在线观看| 精品18在线观看免费视频| 久久国产精品免费一区二区三区| 日韩人妻少妇一区二区三区| 欧美日韩精品一区二区三区不卡| 亚洲国产精品综合福利专区| 在线观看一区二区三区在线观看| 夫妇交换性三中文字幕| 毛片免费在线观看网址| 青青草视全福视频在线| 伊人久久综合无码成人网| 中文字幕日本最新乱码视频 | 尤物成av人片在线观看 | 国产玉足榨精视频在线观看|