孫 婷, 凌能祥
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230009)
?
基于平穩(wěn)遍歷函數(shù)型數(shù)據(jù)改良核回歸估計漸近正態(tài)性
孫婷,凌能祥
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥230009)
摘要:文章基于解釋變量X具有函數(shù)特征而響應(yīng)變量Y取值于實(shí)數(shù)空間R的條件下,研究了基于平穩(wěn)遍歷函數(shù)型數(shù)據(jù)改良核回歸估計的漸近性質(zhì)。利用經(jīng)典的N-W核估計的方法構(gòu)造了回歸函數(shù)r(x)的改良核估計,在一定的條件下,應(yīng)用鞅差中心極限定理建立了基于平穩(wěn)遍歷函數(shù)型數(shù)據(jù)改良核回歸估計的漸近正態(tài)性,從而推廣了現(xiàn)有文獻(xiàn)中的相關(guān)結(jié)果。
關(guān)鍵詞:改良核回歸估計;函數(shù)型數(shù)據(jù);遍歷過程;鞅差中心極限定理;漸近正態(tài)性
0引言
眾所周知,回歸函數(shù)的估計及其性質(zhì)的研究是非參數(shù)統(tǒng)計推斷的重要問題之一,它的結(jié)果在通信、統(tǒng)計模式識別及計量經(jīng)濟(jì)學(xué)等領(lǐng)域得到了廣泛的應(yīng)用。非參數(shù)回歸函數(shù)的核估計方法是非參數(shù)回歸估計的核心,在有限維場合下,無論在獨(dú)立或某種相依情形下,很多學(xué)者都對回歸函數(shù)核估計漸近性質(zhì)進(jìn)行了研究,如文獻(xiàn)[1-4]。由于回歸函數(shù)的核估計在通常情況下要求隨機(jī)變量Y具有l(wèi)階矩,其中l(wèi)>1,而非參數(shù)回歸函數(shù)改良核估計有效地降低了對響應(yīng)變量Y矩的要求,因此對回歸函數(shù)改良核估計量的性質(zhì)研究也是很有必要的。文獻(xiàn)[5]構(gòu)造了非參數(shù)回歸函數(shù)改良核估計量,并研究了在i.i.d.下非參數(shù)回歸函數(shù)改良核估計的強(qiáng)相合性及收斂速度。
近年來函數(shù)型數(shù)據(jù)廣泛應(yīng)用于經(jīng)濟(jì)、金融、環(huán)境等領(lǐng)域,因此,函數(shù)型數(shù)據(jù)的統(tǒng)計推斷特別是非參數(shù)回歸函數(shù)統(tǒng)計分析受到很多學(xué)者的關(guān)注。函數(shù)型數(shù)據(jù)最大的特點(diǎn)是數(shù)據(jù)具有函數(shù)性特征,在對函數(shù)型數(shù)據(jù)進(jìn)行分析時,將觀測到的數(shù)據(jù)看作一個整體,而不是一串?dāng)?shù)字。文獻(xiàn)[6]提出了函數(shù)型非參數(shù)回歸算子的N-W核估計,并獲得了非參數(shù)回歸算子估計量的漸近性質(zhì);文獻(xiàn)[7]建立了α-混合函數(shù)型數(shù)據(jù)非參數(shù)回歸函數(shù)的漸近正態(tài)性;文獻(xiàn)[8]研究了基于相依函數(shù)型數(shù)據(jù)的回歸函數(shù)估計,并獲得了估計量的幾乎必然收斂速度;文獻(xiàn)[9]基于α-混合相依函數(shù)型數(shù)據(jù)條件下建立了回歸算子的改良核估計,并獲得了估計量的幾乎完全收斂性和收斂速率。另一方面,實(shí)際上很難驗(yàn)證一個非線性時間序列是否為α-混合[10],而驗(yàn)證時間序列數(shù)據(jù)遍歷性則相對比較簡單,因此,研究平穩(wěn)遍歷函數(shù)型數(shù)據(jù)非參數(shù)回歸函數(shù)估計量的性質(zhì)也很有必要。文獻(xiàn)[11]利用經(jīng)典的N-W核估計方法研究了平穩(wěn)遍歷函數(shù)型數(shù)據(jù)下回歸算子估計量的漸近正態(tài)性;文獻(xiàn)[12]進(jìn)一步研究了平穩(wěn)遍歷函數(shù)型數(shù)據(jù)下回歸算子估計量的強(qiáng)逐點(diǎn)收斂速度及其一致收斂速度;文獻(xiàn)[13]利用鞅的方法,建立了平穩(wěn)遍歷函數(shù)型數(shù)據(jù)下條件分位數(shù)估計的相合性。
本文利用鞅的方法研究了基于平穩(wěn)遍歷函數(shù)型數(shù)據(jù)改良核回歸估計的漸近正態(tài)性。
1模型和假設(shè)
設(shè)(X1,Y1),…,(Xn,Yn)為同分布于(X,Y)的平穩(wěn)遍歷序列,其中(X,Y)為E×R上的一對隨機(jī)變量,且X為定義在具有半度量d(·,·)的抽象的無限維函數(shù)空間E上,Yi、Y取值于實(shí)值空間R。對?x∈E,回歸算子定義為:
r(x)=E(Y|X=x)。
回歸算子r的N-W核估計[8]為:
此時,進(jìn)一步考慮回歸函數(shù)的改良N-W核估計,即
(1)
令
為了證明本文的主要結(jié)論,下面給出4個基本假設(shè)。
(1)Fx(u)=φ(u)f1(x)+o(φ(u)),u→0。
H3E[|Y2||X]≤C<∞。
H4該假設(shè)包含4個方面。
(1) 給定σ-域Gi-1,Yi的條件期望只取決于Xi,即E(Yi|Gi-1)=E(Yi|Xi)=r(Xi),對所有u,v∈E,存在β>0,c1>0,使|r(u)-r(v)|≤c1d(u,v)β。
(2) 給定σ-域Gi-1,Ti的條件期望只取決于Xi,即E(Ti|Gi-1)=E(Ti|Xi)=W1(Xi)。
H1是研究函數(shù)型非參數(shù)回歸函數(shù)估計量的常用假設(shè),參見文獻(xiàn)[8];H2表現(xiàn)了小球概率的性質(zhì),其在遍歷性與函數(shù)型之間起重要作用,如文獻(xiàn)[11-12];H3則在給定解釋變量X下對響應(yīng)變量Y做出條件矩的要求,其條件弱于文獻(xiàn)[7]中相應(yīng)的條件;H4體現(xiàn)了遍歷性特征,對結(jié)論的證明起重要作用,詳見文獻(xiàn)[11]。
2主要結(jié)果
Bn(x)=Cn(x)-r(x)
(2)
令Qn(x)和Rn(x)分別為:
顯然可得到:
(3)
因此有:
(4)
定理1假設(shè)H1~ H4成立,并且當(dāng)n→∞時,滿足以下條件:
(5)
那么對于?x∈E,使得f1(x)>0,則有:
(6)
其中,對j≥1有:
再由(4)式、(5)式,則有:
(7)
3若干引理及定理的證明
引理1假設(shè)H1、H2(1)(2)(3)成立,且對任何實(shí)數(shù)1≤j≤2+δ,1≤k≤2+δ,δ>0,當(dāng)n→∞時有:
其中,
證明參見文獻(xiàn)[11]引理1的證明。
引理2假設(shè)H1、H2成立且滿足(5)式,對?x∈E,則有:
(8)
證明參見文獻(xiàn)[12]引理3的證明。
引理3假設(shè)H1、H2、H3、H4(1)且(5)式成立,對?x∈E,則有:
(9)
(10)
證明根據(jù)Bn(x)的定義,可直接得到:
事實(shí)上,有
其中
E[TiΔi(x)-r(x)Δi(x)|Gi-1]=
E[TiΔi(x)-r(x)Δi(x)|Xi]=
E[YiΔi(x)-r(x)Δi(x)|Xi]-
E[YiI(|Yi|≥bn)Δi(x)|Xi]=
(r(Xi)-r(x))Δi(x)-Δi(x)E[YiI(|Yi|≥
Δi(x)E[YiI(|Yi|≥bn)|Xi]。
另外,可以得到:
E[YiI(|Yi|≥bn)|Xi]≤
(9)式得證,另一方面,由文獻(xiàn)[12]的(3.9)式有:
(11)
因此,結(jié)合(9)式、(11)式,可以證明(10)式成立。
引理4假設(shè)H1~H4成立,且滿足(5)式,那么對于?x∈E,使得f1(x)>0,則有:
(12)
證明令
(13)
且定義vn,i=wn,i-E[wn,i|Hi-1],則可以得到:
(14)
首先證明第1部分,顯然可以得到如下不等式:
(15)
類似于引理3及利用引理1,則有:
|E[(Ti-r(x))Δi(x)|Hi-1]|×
則只需證明(16)式成立,即可證明第1部分。
(16)
要證明(16)式,觀察得到:
根據(jù)條件期望的性質(zhì),很容易得到:
(W1(Xi)-r(x))|Hi-1]=0。
因此可直接得到:
其中
(17)
(18)
利用H4(3)可知:
顯然可以得到:
利用H2(2)(3)及引理1,可以得到:
(19)
對于S2n,由W1(Xi)=E[Ti|Xi],則有:
r(x)-E(YiI(|Yi|≥bn)|Xi))2|Hi-1]|=
E(YiI(|Yi|≥bn)|Xi))2|Hi-1]|。
由引理1可知,|S2n|→0,a.s,因此可得:
則第1部分得證。
由(3)式和引理2、(10)式,結(jié)合引理4,即可證明(6)式,最后再結(jié)合(9)式則可證明(7)式,即定理1得證。
[參考文獻(xiàn)]
[1]Devroye L.On the almost everywhere convergence of nonparametric regression function estimate[J].The Annals of Statistics,1981,9:1310-1319.
[2]Roussas G G,Nonparametric regression estimation under mixing conditions [J].Stochastic Processes and their Applications,1990,36:107-116.
[3]Roussas G G,Tran L T,Ioannides D A.Fixed design regression for time series:asymptotic normality [J].Journal of Multivariate Analysis,1992,40:262-291.
[4]Tran L T.Nonparametric function estimation for time series by local average estimators [J].The Annals of Statistics,1993,21:1040-1057.
[5]成平.回歸函數(shù)改良核估計的強(qiáng)相合性及收斂速度[J].系統(tǒng)科學(xué)與數(shù)學(xué),1983,3(4):304-315.
[6]Ferraty F,Vieu P.The functional nonparametric model and application to spectrometric data [J].Comput Stat,2002,17:545-564.
[7]Masry E.Nonparametric regression estimation for depedent functional data:asymptotic normality [J].Stochastic Processes and their Applications,2005,115:155-177.
[8]Ferraty F,Vieu P.Nonparametric functional data analysia[M].Theory and Practice.Berlin:Springer,2006:159-167.
[9]Ling N X,Wu Y.Consistency of modified kernel regression estimation for functional data [J].Statistics: A Journal of Theoretical and Applied Statistics,2012,2(46):149-158.
[10]范建青,姚琦偉.非線性時間序列:建模、預(yù)報及應(yīng)用[M].陳敏,譯.北京:高等教育出版社,2005:19-45.
[11]Laib N,Louani D.Nonparametric kernel regression estimation for functional stationary ergodic data:asymptotic properties[J]. Journal of Multivariate Analysis,2010, 101 (10):2266-2281.
[12]Laib N,Louani D.Rates of strong consistencies of the regression function estimator for functional stationary ergodic data[J].J Statist Plan Inference,2011,141(1) :359-372.
[13]魏亮瑜,凌能祥,李成好.基于遍歷函數(shù)型數(shù)據(jù)條件分位數(shù)估計的相合性[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2012,35(4):557-562.
(責(zé)任編輯張镅)
Asymptotic normality of modified kernel regression
estimation for functional stationary ergodic data
SUN Ting,LING Neng-xiang
(School of Mathematics, Hefei University of Technology, Hefei 230009, China)
Abstract:In this paper, the asymptotic property of modified kernel regression estimation for functional stationary ergodic data is researched when the explanatory variable X has functional characteristic and the response variable Y is a scalar in real-value space R. Specifically, the modified kernel estimation of the regression function r(x) is constructed by using the classic Nadaraya-Watson estimator. Under certain conditions, the asymptotic normality of modified kernel regression estimation for functional stationary ergodic data is established by applying the martingale difference central limit theorem, which extends the α-mixing data to the functional stationary ergodic data.
Key words:modified kernel regression estimation; functional data; ergodic process; martingale difference central limit theorem; asymptotic normality
中圖分類號:O212.7
文獻(xiàn)標(biāo)識碼:A
文章編號:1003-5060(2015)11-1580-05