亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        響應(yīng)變量缺失時偏線性測量誤差模型的變量選擇

        2014-08-06 11:17:42楊凌霞徐修友
        關(guān)鍵詞:先知測量誤差懲罰

        黃 彬,楊凌霞,徐修友

        (北京化工大學(xué)理學(xué)院,北京 100029)

        變量選擇是回歸分析中的一個重要問題.當(dāng)面對高維協(xié)變量集合時,選擇對響應(yīng)變量具有顯著解釋能力的協(xié)變量子集,對于簡化模型,提高模型的解釋能力十分重要.一些基于懲罰的變量選擇方法,如LASSO(least absolute shrinkage and selection operator)[1],SCAD(smoothly clipped absolute deviation)[2],ALASSO(adaptive LASSO)[3]通過將部分回歸系數(shù)收縮至零,有效地選擇出重要變量并很好地估計模型參數(shù),同時基于SCAD和ALASSO的估計具有漸進(jìn)正態(tài)性和先知性(Oracle性質(zhì)[2]).另外,Ueki[4]提出了STEE(smooth-threshold estimating equations)方法進(jìn)行變量選擇,它的優(yōu)點是易于實現(xiàn),不用求解凸優(yōu)化問題.

        偏線性模型是一種十分靈活的半?yún)?shù)模型,對于該模型及其推廣模型的參數(shù)估計和變量選擇已經(jīng)有了廣泛的研究[5-13].然而,在響應(yīng)變量缺失且協(xié)變量包含測量誤差情況下,一個重要的問題是如何選擇模型的重要變量,這個問題在文獻(xiàn)中還沒有被提及.本文主要研究偏線性模型在協(xié)變量包含測量誤差且響應(yīng)變量有缺失時的估計和變量選擇問題.

        我們將利用半?yún)?shù)回歸替代方法[11]來處理缺失的響應(yīng)變量.基于SCAD懲罰最小二乘和STEE,對偏線性模型的參數(shù)部分提出兩種變量選擇方法.通過選擇合適的調(diào)整參數(shù),且在一定的正則條件下,可以證明這兩種變量選擇方法具有漸進(jìn)正態(tài)性和先知性.?dāng)?shù)值模擬研究顯示,SCAD比STEE在估計精度和正確擬合模型方面更優(yōu),而STEE因不用求解凸優(yōu)化問題而易于實現(xiàn).

        1 方 法

        1.1 響應(yīng)變量缺失時偏線性測量誤差模型的估計

        考慮偏線性模型

        Y=XTβ+g(T)+ε,

        (1)

        這里X=(X1,…,Xp)T是p-維協(xié)變量向量,β是未知參數(shù)向量.為避免“維數(shù)災(zāi)難”,T是取值于[0,1]的標(biāo)量協(xié)變量,函數(shù)g(·)是[0,1]上的未知函數(shù),ε為隨機(jī)誤差,且E(ε|X,T)=0.令β0=(β01,…,β0p)T是β的真值.假設(shè)真實模型有一個稀疏形式,即β0的一些分量是0,令A(yù)0={j:β0j≠0}為重要變量下標(biāo)集合.由于X包含測量誤差,我們觀測到W

        W=X+U,

        (2)

        這里U是p-維測量誤差,且均值為0,協(xié)方差陣為ΣUU.令δ是響應(yīng)變量是否缺失的標(biāo)志,即δ=1表示Y被觀測到,δ=0表示Y缺失.假設(shè)選擇概率

        π(x,t)=P(δ=1|X=x,T=t,Y=y)=

        P(δ=1|X=x,T=t).

        (3)

        注意,因為X不能被直接觀測到,所以這種缺失機(jī)制不是MAR(missing at ramdom).進(jìn)一步,假設(shè)U獨立于(X,T,Y,δ),且ΣUU已知.若ΣUU未知,可由部分重復(fù)樣本進(jìn)行估計[5].令{(Wi,Ti,Yi,δi),i=1,…,n}是來自模型(1)~(3)的隨機(jī)樣本,本文的目標(biāo)是識別重要變量下標(biāo)集合A0,并得到對應(yīng)回歸系數(shù)的相合估計.

        為了處理模型中的缺失響應(yīng)變量,Wang等[11]提出了基于插補(bǔ)、半?yún)?shù)回歸替代方法來估計β和g(·).Yang等[13]利用插補(bǔ)方法處理缺失的響應(yīng)變量,同時考慮了協(xié)變量包含測量誤差的情況.為了簡單起見,我們應(yīng)用半?yún)?shù)回歸替代方法來處理缺失的響應(yīng)變量.在本文缺失機(jī)制的假設(shè)下,可以證明所提出的估計與Yang等[13]提出的估計有相同的漸近方差.

        注意δY=δXTβ+δg(T)+δε,定義

        由假設(shè),有

        g(t)=g2,c(t)-g1,c(t)Tβ.

        類似于Yang等[13],可以得到下面的兩步估計.首先,利用完全觀測數(shù)據(jù)得到β的初始估計

        (4)

        (5)

        E[δ{(UUT-ΣUU)β}?2].

        同時假設(shè)模型(1)~(3)滿足如下條件:

        3)K(·)和M(·)為具有有界支撐的二階有界核函數(shù).

        5)T的密度函數(shù)fT(t)存在且直到二階導(dǎo)數(shù)都有界,滿足

        文獻(xiàn)[11,13]中也有類似的條件.

        (6)

        類似于文獻(xiàn)[11]和文獻(xiàn)[13]的證明,可得:

        (7)

        從而定理1得證.

        1.2 基于SCAD懲罰最小二乘的變量選擇

        為同時選擇重要變量并估計未知回歸參數(shù),Fan等[2]提出了一個基于SCAD懲罰似然的變量選擇方法,且證明了當(dāng)選擇合適的調(diào)整參數(shù)時,SCAD懲罰似然估計與先知估計等效.我們應(yīng)用SCAD懲罰對偏線性模型進(jìn)行變量選擇.

        沿襲Fan等[2]方法,懲罰最小二乘定義為

        (8)

        其中pλj(·)是SCAD懲罰函數(shù),λj是調(diào)整參數(shù).注意對所有的j,pλj(·)中的λj不必相同.為了簡單起見,我們假設(shè)β的所有分量的懲罰相同,且將pλj(·)寫為pλ(·).懲罰函數(shù)pλ(·)定義為

        利用BIC準(zhǔn)則[15]選擇調(diào)整參數(shù),通過極小化

        BIC(λ)=logRSSλ+e(λ)log(n)/n,

        證明令αn=n-1/2+an,只需證對任意ε>0,存在一個大的常數(shù)M,使得

        (9)

        定義

        注意pλ(0)=0和pλ(|β|)≥0對任意β成立,因此

        LP(β0+αnu)-LP(β0)≥Dn1+Dn2.

        進(jìn)一步,由泰勒展開,

        類似于定理1的證明,可以得到

        由Slutsky定理

        1.3 基于STEE的變量選擇

        Ueki[4]提出了STEE變量選擇方法,它通過自動將不顯著的參數(shù)設(shè)置為0的方法,將對應(yīng)的變量從模型中刪除,且其估計具有先知性質(zhì).該方法的優(yōu)點是易于實現(xiàn),不需要求解凸優(yōu)化問題即可得到估計.本節(jié),我們應(yīng)用這個方法對偏線性模型進(jìn)行變量選擇.

        沿襲Ueki[4],利用估計方程(10),可以同時實現(xiàn)變量選擇和參數(shù)估計,

        (10)

        其中

        定理4在1)~7)下,對于任意正數(shù)λ和γ,使得當(dāng)n→∞時,若n1/2λ→0和n(1+γ)/2λ→∞,則有

        (i) 變量選擇相合性,即P(A=A0)→1;

        我們使用BIC-型準(zhǔn)則[7]來選擇調(diào)整參數(shù),通過極小化

        表1 數(shù)值模擬結(jié)果

        2 數(shù)值模擬

        本節(jié),我們采用數(shù)值模擬的方法來進(jìn)一步研究所提出的變量選擇方法的有限樣本性質(zhì).考慮模型

        從表1可以看出,本文所提出的方法都顯著地降低了模型復(fù)雜度.同時,SCAD估計在估計的精度和正確擬合模型方面,比STEE估計更好.SCAD估計的MRME非常接近于先知估計的MRME.而STEE估計由于不用求解凸優(yōu)化問題而更易于實現(xiàn).

        [1] Tibshirani R.Regression shrinkage and selection via the lasso[J].Journal of the Royal Statistical Society,Series B:Methodological,1996,58(1):267-288.

        [2] Fan J,Li R.Variable selection via nonconcave penalized likelihood and its oracle property[J].Journal of the American Statistical Association,2001,96:1348-1360.

        [3] Zou H.The adaptive lasso and its oracle properties[J].Journal of the American Statistical Association,2006,101(476):1418-1429.

        [4] Ueki M.A note on automatic variable selection using smooth-threshold estimating equations[J].Biometrika,2009,96(4):1005-1011.

        [5] Liang H,Hardle W,Carroll R J.Estimation in a semiparametric partially linear errors-in-variables model[J].The Annals of Statistics,1999,27:1519-1535.

        [6] You J,Chen G.Estimation of a semiparametric varying-coefficient partially linear errors-in-variables model[J].Journal of Multivariate Analysis,1996,97:324-341.

        [7] Liang H,Li R.Variable selection for partially linear models with measurement errors[J].Journal of the American Statistical Association,2009,104:234-248.

        [8] Zhao P,Xue L.Variable selection for semiparametric varying coefficient partially linear errors-in-variables models[J].Journal of Multivariate Analysis,2010,101:1872-1883.

        [9] Wang H,Zou G,Wan A.Adaptive LASSO for varying-coefficient partially linear measurement error models[J].Journal of Statistical Planning and Inference,2013,143:40-54.

        [10] Wang Q H,Lindon O,Hardel W.Semiparametric regression analysis with missing response at random[J].Journal of the American Statistical Association,2004,99:334-345.

        [11] Wang Q H,Sun Z H.Estimation in partially linear models with missing responses at random[J].Journal of Multivariate Analysis,2007,98:1470-1493.

        [12] Liang H,Wang S,Carroll R.Partially linear models with missing response variables and error-prone covariates[J].Biometrika,2007,94(1):185-198.

        [13] Yang Y,Xue L,Cheng W.Two-step estimators in partial linear models with missing response variables and error-prone covariates[J].Journal of Systems Science and Complexity,2011,24:1165-1182.

        [14] Hunter D,Li R.Variable selection using MM algorithm[J].The Annals of Statistics,2005,33:1617-1642.

        [15] Wang H,Li R,Tsai C.Tuning parameter selectors for the smoothly clipped absolute deviation method[J].Biometrika,2008,94:553-568.

        猜你喜歡
        先知測量誤差懲罰
        密度測量誤差分析
        春江水暖鴨先知
        無人機(jī)(2021年1期)2021-04-05 12:49:24
        縱向數(shù)據(jù)下變系數(shù)測量誤差模型的漸近估計
        神的懲罰
        小讀者(2020年2期)2020-03-12 10:34:06
        Jokes笑話
        懲罰
        趣味(語文)(2018年1期)2018-05-25 03:09:58
        我不是什么先知
        延河(2017年7期)2017-07-19 20:52:04
        春天的小先知(外兩首)
        春江水暖鴨先知
        真正的懲罰等
        国产熟女露脸大叫高潮| 伊人久久大香线蕉av色婷婷| 国产一区二区三区不卡视频| 日本二一三区免费在线| 国产两女互慰高潮视频在线观看 | 华人在线视频精品在线| 女人高潮久久久叫人喷水| 国产特级毛片aaaaaaa高清| 亚洲av日韩aⅴ无码电影| 青青草针对华人超碰在线| av网站不卡的av在线| 欧美xxxxx在线观看| 四虎影视永久地址www成人| 无码精品色午夜| 国产熟女乱综合一区二区三区| 青青草原综合久久大伊人精品 | 国产视频自拍一区在线观看| 中国老熟女重囗味hdxx| 国产熟妇搡bbbb搡bbbb搡| 国产盗摄XXXX视频XXXX| 久久精品av在线视频| www夜片内射视频在观看视频| 99久久精品日本一区二区免费| 亚洲AV秘 无码一区二区三区1| 日韩精品国产一区二区| 亚洲av综合色一区二区| 午夜免费视频| 亚洲欧美精品aaaaaa片| 熟女白浆精品一区二区| 色婷婷精品午夜在线播放| 乱人伦中文视频在线| 人人添人人澡人人澡人人人人| 中国女人a毛片免费全部播放| 中文字幕人妻互换激情 | 国产精品久久久久久人妻精品| 黑人一区二区三区在线| 91九色视频在线国产| 精品偷拍被偷拍在线观看| 久草热8精品视频在线观看| 被驯服人妻中文字幕日本| 国产在线观看视频一区二区三区|