丁 潔, 凌能祥
(合肥工業(yè)大學數學學院,安徽合肥 230009)
眾所周知,條件均值函數的非參數估計是回歸分析研究的重要問題,其理論與方法在經濟、醫(yī)學等領域中已有廣泛的應用。條件均值函數的非參數估計中,通常解釋變量X取值于Rd空間,響應變量Y取值于R1空間,(X,Y)的樣本被認為是i.i.d或有某種相依的隨機變量,文獻[1-2]已取得一些有意義的成果。
近年來,隨著計算技術的快速發(fā)展,在醫(yī)學、經濟學、環(huán)境計量學和計量化學等領域人們常常收集到曲線數據或函數型觀察值。于是人們開始關注基于函數型數據的統(tǒng)計推斷特別是非參數統(tǒng)計推斷。關于函數型數據的詳細背景及統(tǒng)計推斷的早期工作參見文獻[3-5]。最近,文獻[6]利用Kolmogorov熵的原理和方法,進一步研究了基于函數型數據響應變量的條件均值函數、條件分布函數、條件密度函數和條件風險率函數的非參數估計,在i.i.d情形下獲得了有關非參數估計量的幾乎完全一致收斂性及其收斂速度。鑒于條件均值函數在金融中的廣泛應用和時間序列問題的相依性,本文進一步利用Kolmogorov熵的原理和方法研究基于α混合相依函數型數據有關條件均值函數估計的幾乎完全一致收斂性及收斂速度,推廣現有文獻中的相關結果。
首先簡要介紹強相合的定義。過程{(Xi,Yi),i≥1}被稱為強混合或α混合,如果
為了方便起見,本文中只假設{(Xi,Yi),i≥1}為算術α混合,且速度a>1。
引進Kolmogorov熵的定義,設SF是半度量空間F的子集,給定ε>0,如果這里B(xi,h)是以xi為中心的小球,半徑h>0,則F中有限個元x1,x2,…,xN稱為SF的ε網點,當Nε(SF)是F中覆蓋SF所需要的半徑為ε的開球的最小個數時,(1)式稱為SF的Kolmogorovε熵[7-9],即
設{(Xi,Yi),i≥1}為同分布于(X,Y)的混合相依序列,其中X取值于有半度量d的抽象無限維空間(F,d),Y取值于R1空間。本文中,C、C′、C1為正常數,并在不同的情形下取不同的值。
根據文獻[5],定義條件均值函數(2)式的核估計如下,即
其中,K為核函數;φ(·)為已知實值Borel可測函數;窗寬
設SF為集合F的緊子集,記
為得出本文主要結論,引入一些基本假設,關于回歸函數r,假設條件如下:
H2 對于小球概率,設?x∈SF,0<Cφ(h)≤P(X∈B(x,h))≤C′φ(h),當h→0時,φ(h)→0。
H3 (nφ(h))=O(logn)2。
H4 關于核函數,假設條件如下:核函數K(·)滿足K(·):R→R+,且∫K=1,支撐集為[0,1]。
H5 對于相依結構Sn,i,i=1,2,3,4,存在θ>C1β+1>2,使得:
H6 假如如下:
其中,δm(·)在SF上連續(xù)。H1~H4為研究非參數函數型數據的漸近性的常用假設,參見文獻[5]。與i.i.d場合相比,假設H5給出了相依結構在收斂速度方面的影響,這有助于給出有關收斂速度的一般性結論,需要特別指出的是,在假設H5中取C1>1/β,并且C1取在假設H3、下面的H7成立的前提下,結論C1logn中的常數C1。最后,對于Kolmogorov熵,下面引用文獻[6]中的假設。
引理1 在假設H2~H5、H7下有:
其中
引理2 在假設H1、H2、H4下有:
其中
引理3 在引理1的條件下,對于某個給定的常數ε0,0<ε0<1,有
引理4 在假設H1~H7下,有
(1)引理1的證明。根據文獻[6]的分解,有
首先,研究F2,對于?η>0,有
由文獻[5]和Kolmogorov熵的定義,對于r=log2n和某一個常數C<∞,得
由(4)式,有
存在某個ε0>0,獲得并且取有
由(12)~(14)式以及假設H7,得
故有:
下面研究F1。根據^r(x)的定義、核函數K的有界性以及上述k(x)的取法,關于F1可以得到下面的不等式:
類似于F2的證明,有
同理,有
由(11)式以及(16)~(18)式,引理1得證。
(2)引理2的證明。類似于文獻[6]中Lemma 10的證明。
(3)引理3的證明。由(7)式,結合文獻[6]中Lemma 9的證明方法,此引理得證。
(4)引理4的證明。根據文獻[6]中的分解方法,有
類似F1和F3的證明,可得:
而對于G2,有
由(6)式以及Markov不等式,有
由(21)式和文獻[5],類似F2的證明,可得:
由(19)式、(20)式和(22)式,引理4得證。
定理1 在假設H1~H7下,有
該結論給出了在相依函數型數據場合下估計量^rφ(x)精確的一致收斂速度。這里收斂速度被分為2部分,第1部分和通常情形類似,只取決于回歸函數的光滑參數算子,相依結構和熵對收斂速度的影響體現在第2部分。
證明 根據文獻[5],有如下分解:
由上述4個引理的結論及文獻[5],定理得證。
[1] Robinson R.Robust nonparametric autoregression[J].Lecture Notes in Statistics,1984,26:247-255.
[2] George G,Roussas R.Nonparametric regression estimation under mixing conditions[J].Stochastic Processes and Their Applications,1990,36(1):107-116.
[3] Ramsay J O,Silverman B W.Functional data analysis[M].New York:Springer,1997:5-50.
[4] Ramasy J,Silverman B.Applied functional data analysis:methods and case studies[M].New York:Springer,2002:10-50.
[5] Ferraty F,Vieu P.Nonparametric funcional data analysis:theory and practice[M].Berlin,Springer,2006:5-20.
[6] Ferraty F,Laksaci A,Tadj A,et al.Rate of uniform consistency for nonparametric estimates with functional variables[J].J of Statist Planning and Inference,2010,140(2):335-352.
[7] Kolmogorov A N,Tikhomirov V M.ε-entropy andε-capacity[J].Uspekgi Mat.Nauk,1959,14:3-86.
[8] Kuelbs J,Li W.Metric entropy and the small ball problem for Gaussian measures[J].J Funct Anal,1993,116:133-157.
[9] Theodoros N,Yannis G Y.Rates of convergence of estimate,Kolmogorov entropy and the dimensionality reduction principle in regression[J].Ann Statist,1997,25(6):2493-2511.