亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        響應(yīng)變量缺失下變系數(shù)部分線性模型的參數(shù)估計(jì)

        2017-11-04 03:45:12歐玉蓮袁永生
        關(guān)鍵詞:參數(shù)估計(jì)線性小麥

        歐玉蓮,袁永生,李 磊

        (河海大學(xué) 理學(xué)院,南京 210098)

        響應(yīng)變量缺失下變系數(shù)部分線性模型的參數(shù)估計(jì)

        歐玉蓮,袁永生,李 磊

        (河海大學(xué) 理學(xué)院,南京 210098)

        基于兩步法思想,對(duì)響應(yīng)變量隨機(jī)缺失下的變系數(shù)部分線性模型中的參數(shù)進(jìn)行了估計(jì),并通過(guò)模擬證明了改進(jìn)后的兩步法對(duì)此類(lèi)問(wèn)題的解決是簡(jiǎn)單有效的。實(shí)例分析了矮抗58小麥乳熟期抗倒伏情況。實(shí)例分析表明:對(duì)于小麥的抗倒伏性研究有一定的指導(dǎo)意義,說(shuō)明了所提方法的合理性與可行性。

        缺失數(shù)據(jù);變系數(shù)部分線性模型;兩步法

        1 背景

        通常情況下,實(shí)驗(yàn)終止、數(shù)據(jù)遺漏等各種人為及偶然因素均會(huì)導(dǎo)致數(shù)據(jù)缺失,這就使得對(duì)于數(shù)據(jù)缺失的處理變得十分關(guān)鍵。因此,對(duì)缺失數(shù)據(jù)的研究已成為統(tǒng)計(jì)學(xué)的一個(gè)熱點(diǎn)問(wèn)題,并取得了一定的研究成果[1-3]。其中,響應(yīng)變量缺失的情況更為常見(jiàn),如楊宜平等[4]考慮響應(yīng)變量存在缺失時(shí)部分線性模型的經(jīng)驗(yàn)似然推斷,給出了參數(shù)部分與函數(shù)部分的置信域和逐點(diǎn)置信區(qū)間。趙培信[5]研究了響應(yīng)變量缺失下變系數(shù)部分線性模型的經(jīng)驗(yàn)似然估計(jì),有效克服了在縱向數(shù)據(jù)中構(gòu)造經(jīng)驗(yàn)似然比函數(shù)面臨的困難。趙麗棉等[6]考慮響應(yīng)變量隨機(jī)缺失下的變系數(shù)部分線性模型,給出了參數(shù)分量的置信域,證明了其漸近服從標(biāo)準(zhǔn)卡方分布。

        縱觀以上研究,關(guān)于響應(yīng)變量隨機(jī)缺失的變系數(shù)部分線性模型的研究大都停留在對(duì)模型中參數(shù)分量的估計(jì)及其性質(zhì)的討論,而且在估計(jì)參數(shù)時(shí)對(duì)于系數(shù)函數(shù)部分要求2階可微,而這在實(shí)際生活中往往很難滿足。本文放寬了2階可微這一條件,在條件期望存在時(shí),使用多變量下的兩步法,考慮變系數(shù)部分線性模型,估計(jì)出模型中的參數(shù)部分與非參數(shù)部分,并通過(guò)模擬證明與實(shí)例分析,進(jìn)一步說(shuō)明了該兩步法在此種情況下使用的合理性,有一定的推廣意義。

        2 估計(jì)方法

        對(duì)于變系數(shù)部分線性模型,其一般形式為

        Y=XTβ+ZTV(T)+ε

        (1)

        其中:Y是響應(yīng)變量;X,Z以及T是協(xié)變量;β=(β1,β2, …,βp)T是p×1維的未知參數(shù)向量;V(·)=(V1(·),V2(·),…Vq(·))T是q×1維未知函數(shù);ε是隨機(jī)誤差項(xiàng),且ε與協(xié)變量間(X,Z,T)不相關(guān),即E(ε|X,Z,T)=0,其中為了避免維數(shù)災(zāi)害問(wèn)題,通常假定T為單變量。

        假設(shè){(Yi,Xi,Zi,Ti),i=1,2,…,n}是來(lái)自模型(1)的一個(gè)不完全隨機(jī)樣本,它們獨(dú)立同分布。

        (2)

        這里的{(Xi,Zi,Ti)}是可以觀測(cè)到的數(shù)據(jù)集,但Yi是存在隨機(jī)缺失的。引入關(guān)于Yi的缺失指示函數(shù)δi,當(dāng)δi=1時(shí),Yi是可以獲取的;δi=0時(shí),Yi是缺失的。在此假定Yi隨機(jī)缺失,固有

        P(δi=1|Yi,Xi,Zi,Ti)=

        P(δi=1|Xi,Zi,Ti)=π(Xi,Zi,Ti)

        (3)

        式(3)暗含在給定Xi,Zi,Ti的情況下,δi與Yi是獨(dú)立的,即缺失的概率只與能完全觀測(cè)的部分有關(guān),而與存在缺失的部分無(wú)關(guān)。該假定是統(tǒng)計(jì)分析中常用的,且在實(shí)際應(yīng)用中也是合理的。下面對(duì)響應(yīng)變量缺失的情況進(jìn)行討論。

        將式(2)左右兩邊同時(shí)乘以示性函數(shù)δi,則有

        i=1,2,…,n

        (4)

        類(lèi)似地,采用兩步估計(jì)法,取關(guān)于Z,T的條件期望,可以得到

        E(δiYi|Z=z,T=t)=

        E(δiXi|Z=z,T=t)Tβ+

        E(δi|Z=z,T=t)ZTV(T),

        i=1,2,…,n

        (5)

        將式(5)左右兩邊同時(shí)除以E(δi|Z=z,T=t),有

        i=1,2,…,n

        (6)

        對(duì)式(6)進(jìn)行簡(jiǎn)化,有

        i=1,2,…,n

        (7)

        從而有

        V(T)=V1(T)-V2(T)β

        (8)

        其中:

        V1(T)=(ZZT)-1·Z·g1(Z,T)

        V2(T)=(ZZT)-1·Z·g2(Z,T)

        (9)

        (10)

        根據(jù)文獻(xiàn)[7]可對(duì)參數(shù)β進(jìn)行估計(jì),有

        (11)

        對(duì)V1(T)和V2(T)進(jìn)行估計(jì)時(shí),需得到g1(z,t)和g2(z,t)的估計(jì),可考慮使用多變量核函數(shù)對(duì)其進(jìn)行估計(jì)。因X,Z相互獨(dú)立,則有Kh1,h2(z,t)=Kh1(z,t)·Kh2(z,t)。

        從而有

        (12)

        (13)

        其中:Khi(·)=K(·/hi)/hi,K(·)為核函數(shù),hi,i=1,2分別對(duì)應(yīng)窗寬。

        3 模擬研究

        本節(jié)通過(guò)數(shù)據(jù)模擬研究所提方法在有限樣本下的表現(xiàn),考慮如下半?yún)?shù)變系數(shù)部分線性模型:

        Y=3X1+2X2+1.5X3+Z·V(T)+ε

        (14)

        數(shù)據(jù)產(chǎn)生如下:

        在表1中給出了在兩步法下參數(shù)β估計(jì)的絕對(duì)偏差的平均值、標(biāo)準(zhǔn)差及均方誤差。

        對(duì)于參數(shù)β的估計(jì),從表1可以得到如下結(jié)論:1)對(duì)給定的缺失概率,隨著樣本量的增加,估計(jì)量的偏差雖有所波動(dòng),但總體趨勢(shì)在減小,且絕對(duì)誤差與均方誤差都極??;2)對(duì)給定樣本,隨著缺失比例的增加,該估計(jì)方法給出的估計(jì)量的絕對(duì)偏差、標(biāo)準(zhǔn)差和均方誤差均有所增加;3)即使是樣本個(gè)數(shù)比較小時(shí),缺失概率有所增加,但參數(shù)估計(jì)的偏差、標(biāo)準(zhǔn)差以及均方誤差都很小,說(shuō)明該法下估計(jì)的參數(shù)結(jié)果精良。

        表1 兩步法下參數(shù)估計(jì)的偏差(Bias)、標(biāo)準(zhǔn)差(SD)和均方誤差(MSE)

        續(xù)表(表1)

        圖1 系數(shù)函數(shù)估計(jì)(a)、函數(shù)值估計(jì)(b)

        對(duì)于非參數(shù)函數(shù)部分的估計(jì),從圖1(a)可以看出:估計(jì)的系數(shù)函數(shù)與真實(shí)函數(shù)雖有一定的誤差,但除去部分異常點(diǎn),估計(jì)的整體效果良好,誤差在±0.2內(nèi)波動(dòng)。此外,由圖1(b)可以看出:即使非參數(shù)部分的估計(jì)存在誤差,但對(duì)函數(shù)預(yù)測(cè)的影響極小,也進(jìn)一步說(shuō)明了該種方法的合理性。

        4 實(shí)例分析

        由文獻(xiàn)[11]可知:小麥的抗倒伏指數(shù)與自身的各指標(biāo)間可建立一個(gè)半?yún)?shù)變系數(shù)模型,對(duì)于完整數(shù)據(jù)集假設(shè)響應(yīng)變量存在隨機(jī)缺失,并利用本文所提的方法做相應(yīng)的參數(shù)估計(jì),結(jié)果表明該方法可有效預(yù)測(cè)小麥的抗倒伏性指數(shù),這對(duì)提高小麥的產(chǎn)量研究有一定幫助。

        本文選取2007 年矮抗58品種小麥的幾個(gè)不同時(shí)期生理指標(biāo)作為研究對(duì)象,包括小麥各節(jié)長(zhǎng)度、粗度,單個(gè)小麥的重心高度、莖稈壁厚、穗重等對(duì)小麥抗倒伏性研究較為重要的指標(biāo)。具體數(shù)據(jù)見(jiàn)2011年數(shù)學(xué)建模中的c題中有關(guān)矮抗58 乳熟期數(shù)據(jù)。因機(jī)械強(qiáng)度是衡量小麥抗倒伏性的重要指標(biāo),故在此規(guī)定機(jī)械強(qiáng)度為響應(yīng)變量,而其他的11個(gè)變量均為影響小麥抗倒伏性的重要因素。因其之間具有很強(qiáng)的相關(guān)性,因此通過(guò)因子分析對(duì)其進(jìn)行降維處理。由spss的輸出結(jié)果可知,前3個(gè)成分的累積貢獻(xiàn)率可達(dá)76.369%,故在此主成分個(gè)數(shù)設(shè)置為3,取這3個(gè)主成分進(jìn)行分析。通過(guò)繪制Y與這3個(gè)主成分之間的散點(diǎn)圖知,小麥機(jī)械強(qiáng)度與第1成分有較為明顯的線性關(guān)系,而與第2、3 成分沒(méi)有具體的函數(shù)形式,故對(duì)影響小麥抗倒伏因素的3個(gè)主成分與小麥的機(jī)械強(qiáng)度之間建立半?yún)?shù)變系數(shù)模型是合理的。

        首先,建立模型為Y=Xβ+Z·V(T)+ε。其中:響應(yīng)變量Y代表小麥機(jī)械強(qiáng)度;X代表第1主成分,即F1、Z、T分別代表第2、3主成分(F2,F3)。樣本數(shù)n=20較小,假定缺失概率為0.1,由模擬中隨機(jī)產(chǎn)生δ;再使用本文所提到的兩步法做參數(shù)估計(jì),并利用估計(jì)的結(jié)果對(duì)Y進(jìn)行預(yù)測(cè)。

        圖2 函數(shù)預(yù)測(cè)值

        由圖2可知:響應(yīng)變量存在缺失數(shù)據(jù)情況下的改進(jìn)兩步法估計(jì)(*)與完全數(shù)據(jù)下估計(jì)(o)的大部分估計(jì)值符合實(shí)際情況。對(duì)于一些突出的點(diǎn),可能與源數(shù)據(jù)存在奇異情況有關(guān),可忽略。以上實(shí)例很好地說(shuō)明了在半?yún)?shù)變系數(shù)部分線性模型的協(xié)變量缺失數(shù)據(jù)的情況下,改進(jìn)的兩步法在保證一定的精確度時(shí)使用起來(lái)更為簡(jiǎn)單。

        5 結(jié)束語(yǔ)

        基于半?yún)?shù)變系數(shù)部分線性模型,考慮了響應(yīng)變量存在數(shù)據(jù)缺失的情況,同時(shí)放寬對(duì)未知函數(shù)部分2階可微的條件限制,使用多變量下的兩步法對(duì)其中的參數(shù)部分及函數(shù)部分進(jìn)行了估計(jì)。在保證參數(shù)估計(jì)精度的前提下,本文算法較以往的方法更為簡(jiǎn)單,且適用面更廣。存在的不足是對(duì)未知函數(shù)的估計(jì)不是很穩(wěn)定,不過(guò)這對(duì)最終函數(shù)值的預(yù)測(cè)影響并不大。最后通過(guò)模擬驗(yàn)證與實(shí)例分析矮抗58小麥乳熟期的機(jī)械強(qiáng)度與其自身影響因素的關(guān)系,對(duì)于今后小麥的抗倒伏性研究有一定的指導(dǎo)意義。采用的實(shí)例較好地說(shuō)明了這種改進(jìn)兩步法的可行性與實(shí)用性。

        [1] 方匡南,謝邦昌.基于聚類(lèi)關(guān)聯(lián)規(guī)則的缺失數(shù)據(jù)處理研究[J].統(tǒng)計(jì)研究,2011(2):87-92.

        [2] 于力超,金勇進(jìn).含非隨機(jī)缺失數(shù)據(jù)的面板數(shù)據(jù)參數(shù)估計(jì)方法[J].統(tǒng)計(jì)研究,2016(1):95-102.

        [3] 龐新生.缺失數(shù)據(jù)處理中相關(guān)問(wèn)題的探討[J].統(tǒng)計(jì)與信息論壇,2004(5):29-32.

        [4] 楊宜平,薛留根,程維虎.響應(yīng)變量存在缺失時(shí)部分線性模型的經(jīng)驗(yàn)似然推斷[J].高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯,2010(1):43-52.

        [5] 趙培信.半?yún)?shù)變系數(shù)部分線性模型的統(tǒng)計(jì)推斷[J].中國(guó)科學(xué):數(shù)學(xué),2013(7):635-646.

        [6] 趙麗棉,趙培信.響應(yīng)變量隨機(jī)缺失下變系數(shù)部分線性模型的借補(bǔ)經(jīng)驗(yàn)似然推斷[J].應(yīng)用數(shù)學(xué),2011(2):2.

        [7] WANG Q H,LINTON O,H?DLE W.Semiparametric regression analysis with missing response at random[J].Journal of the American Statistical Association,2004,466:334-345.

        [8] 劉遠(yuǎn)龍.核密度估計(jì)中的窗寬選擇方法[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2013.

        [9] WANG Q H,SUN Z H.Estimation in partially linear models with missing responses at random[J].J Multiva-riate Anal,2007,98:1470-1493.

        [10] 趙培信,薛留根.響應(yīng)變量隨機(jī)缺失下的變系數(shù)部分線性模型的經(jīng)驗(yàn)似然推斷[J].工程數(shù)學(xué)學(xué)報(bào),2010(5):771-780.

        [11] 劉鋒,王利兵,徐振樞.基于半?yún)?shù)變系數(shù)部分線性模型的小麥抗倒伏性分析 [J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2013,27(4):121-126.

        (責(zé)任編輯楊黎麗)

        ParameterEstimationforVaryingCoefficientPartiallyLinearModelwithMissingData

        OU Yulian, YUAN Yongsheng, LI Lei

        (School of Science, Hohai University, Nanjing 210098, China)

        The modified two-step method is used to estimate the parametric and nonparametric components and the simulation results show that the improved two-step method is used well to the problem of the absence of response variables in partially linear models. In the end, we analyzed the relationship between the mechanical strength and the other effects of Aikang 58 wheat in the milk stage, which has a certain guiding significance to the research on Lodging resistance of wheat, and it also illustrates the rationality and feasibility of the proposed method.

        missing data; semiparametric varying coefficient partially linear model; improved two-step method

        2017-02-26

        國(guó)家自然科學(xué)基金資助項(xiàng)目(11201116)

        歐玉蓮(1993—),女,碩士研究生,主要從事統(tǒng)計(jì)學(xué)研究,E-mail: 790547365@qq.com。

        歐玉蓮,袁永生,李磊.響應(yīng)變量缺失下變系數(shù)部分線性模型的參數(shù)估計(jì)[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2017(10):211-215.

        formatOU Yulian,YUAN Yongsheng,LI Lei.Parameter Estimation for Varying Coefficient Partially Linear Model with Missing Data[J].Journal of Chongqing University of Technology(Natural Science),2017(10):211-215.

        10.3969/j.issn.1674-8425(z).2017.10.034

        O212.7

        A

        1674-8425(2017)10-0211-05

        猜你喜歡
        參數(shù)估計(jì)線性小麥
        主產(chǎn)區(qū)小麥?zhǔn)召?gòu)進(jìn)度過(guò)七成
        漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
        基于新型DFrFT的LFM信號(hào)參數(shù)估計(jì)算法
        孔令讓的“小麥育種夢(mèng)”
        金橋(2021年10期)2021-11-05 07:23:28
        葉面施肥實(shí)現(xiàn)小麥畝增產(chǎn)83.8千克
        線性回歸方程的求解與應(yīng)用
        哭娃小麥
        二階線性微分方程的解法
        Logistic回歸模型的幾乎無(wú)偏兩參數(shù)估計(jì)
        基于向前方程的平穩(wěn)分布參數(shù)估計(jì)
        久久亚洲免费精品视频| 精品国产福利久久久| 香蕉国产人午夜视频在线观看| 国产成人一区二区三区高清| 在线播放中文字幕一区二区三区| 亚洲三区av在线播放| 女同一区二区三区在线观看| 日本精品一区二区高清| 日本另类αv欧美另类aⅴ| 天天天天躁天天爱天天碰2018| 婷婷丁香五月中文字幕| 国产成人精品三级麻豆 | 无遮挡激情视频国产在线观看| 日韩av无码久久一区二区| 乱子伦在线观看| 搡老熟女中国老太| 国产一区二区三区啪| 成人国产在线播放自拍| 国产精品黄色在线观看| 青青草视频在线观看色| 国产精品极品美女自在线观看免费| 老司机亚洲精品影院| 亚洲男人天堂| jk制服黑色丝袜喷水视频国产| 亚洲女同人妻在线播放| 亚洲日本人妻少妇中文字幕| 东北熟妇露脸25分钟| 国产精品天干天干综合网| 欧美另类高清zo欧美| 亚洲а∨天堂久久精品2021| 亚洲视频毛片| 精品日产一区2区三区| 日本女优中文字幕在线播放| 精品国产一区二区三区av麻| 粉嫩小泬无遮挡久久久久久| 天天天天躁天天爱天天碰2018| 荡女精品导航| 久久精品国产亚洲av蜜桃av| 精华国产一区二区三区| 免费无遮挡无码永久视频| 波多野结衣av手机在线观看 |