汪 文, 凌能祥
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,合肥230601)
在過去的二十年中,函數(shù)型數(shù)據(jù)分析(FDA)受到了廣泛的研究,并成為統(tǒng)計(jì)研究中最重要的領(lǐng)域之一.文獻(xiàn)[1]首次將函數(shù)型數(shù)據(jù)引入到線性模型中.為了更好的擬合效果,文獻(xiàn)[2]首次引入了半函數(shù)部分線性回歸(SFPLR)模型
其中Xj(j=1,2,…,p)是解釋變量,βT=(β1,β2,…,βp)是一列未知參數(shù),利用核方法構(gòu)造了參數(shù)分量和非參數(shù)的估計(jì)值,并給出了參數(shù)分量的漸近正態(tài)性和非參數(shù)分量的收斂速度.文獻(xiàn)[3]進(jìn)一步考慮了在響應(yīng)變量隨機(jī)缺失時(shí)相關(guān)分量的研究結(jié)果,并給出了實(shí)驗(yàn)?zāi)M和真實(shí)數(shù)據(jù)分析.文獻(xiàn)[4]利用k近鄰方法研究了SFPLR模型.文獻(xiàn)[5-6]提出了在參數(shù)置信域構(gòu)造上優(yōu)于正態(tài)逼近的經(jīng)驗(yàn)似然方法.文獻(xiàn)[7]分別將經(jīng)驗(yàn)似然方法應(yīng)用于響應(yīng)變量缺失下的半函數(shù)線性模型和SFPLR模型.文獻(xiàn)[9]和文獻(xiàn)[10]分別利用k近鄰進(jìn)行時(shí)間序列分析,和研究函數(shù)型數(shù)據(jù).本文利用經(jīng)驗(yàn)似然方法研究了SFPLR模型,通過k近鄰方法構(gòu)造了模型中參數(shù)分量的經(jīng)驗(yàn)似然比統(tǒng)計(jì)量,并得出該統(tǒng)計(jì)量具有漸近χ2分布,并同時(shí)給出了非參數(shù)分量的估計(jì)值及其收斂速度.
(1)
定義權(quán)函數(shù)
令
且
的kNN估計(jì)分別是
顯然E[Zi(β)]=0.利用此信息定義β的經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù)為
利用Lagrange乘子法,可得
其中λ(β)為L(zhǎng)agrange乘子,滿足
定義空間SH上 Kolmogorov’sε-熵為ψSH(ε)=log(Nε(SH)),其中Nε(SH)為在空間H上必須覆蓋SH的開球半徑ε的最小值.并給出以下具體假設(shè):
(A2) 存在函數(shù)φ(·)≥0,f(·)>0,對(duì)α>0,常數(shù)τ>0,有
(ii) ?C>0,η0>0,對(duì)?0<η<η0,φ′(η) (iv) ?C<∞使得?(u,v)∈SF×SF, ?f∈{m,g11,…,g1p}, |f(u)-f(v)|≤Cd(u,v)α; (A3) 核函數(shù)K(·)滿足: (i)K(u)是非增函數(shù)且在支集[0,1)上Lipschitz連續(xù), (ii) 若K(1)=0,則-∞ (A4)SH的 Kolmogorov’sε-熵滿足: (A5)k=kn是正實(shí)數(shù)序列且滿足: 注 文獻(xiàn)[9]中的定理2在證明本文的漸近結(jié)果中起到了重要作用,因此需要假設(shè)條件(A1)-(A5),具體原因見文獻(xiàn)[9],(A6)是研究SFPLR模型的常見條件[2]. 定理1假設(shè)(A1)-(A6)成立,如果n→∞時(shí),有 Iα(β)={β∈Rp|-2R(β)≤Cα}. 定理3在定理1的條件下 有 證具體的證明過程見文獻(xiàn)[3]. 引理2假設(shè)定理1中的條件成立,若β是參數(shù)的真值,那么 (2) 據(jù)文獻(xiàn)[4]的(7.7-7.8)和(7.15-7.16)有 根據(jù)文獻(xiàn)[4]的(7.9)-(7.11),得到 根據(jù)以上對(duì)公式(2)的分解,可以得到 由于ε與(X,χ)相互獨(dú)立,根據(jù)引理1可得 引理4在定理1的條件下,若β是參數(shù)的真值 證具體的證明過程分別見文獻(xiàn)[6]中的引理3和文獻(xiàn)[5]中的定理1. 定理1的證明令 根據(jù)引理4可得 根據(jù)引理2和引理3 其中‖·‖代表歐幾里得范數(shù),由文獻(xiàn)[9]的定理1和定理2可得證明成立. 圖1 曲線i(t),i=1,…,100,t∈[0,1] 核函數(shù) 表1 β的95%置信區(qū)間覆蓋率 分析 經(jīng)驗(yàn)似然方法能取得很不錯(cuò)的實(shí)驗(yàn)結(jié)果,即獲得比較大的置信區(qū)間覆蓋率.隨著樣本量的增加和誤差的減小都會(huì)使置信區(qū)間覆蓋率增大. SFPLR模型綜合了參數(shù)回歸和非參數(shù)回歸模型的特點(diǎn),具有更大的適用性,而經(jīng)驗(yàn)似然方法在構(gòu)造置信域方面有許多突出的優(yōu)點(diǎn).本文創(chuàng)新性的用kNN方法取代了N-W核方法,解決了用經(jīng)驗(yàn)似然方法處理SFPLR模型的問題,分別給出了關(guān)于參數(shù)和非參數(shù)部分的估計(jì)值和漸近正態(tài)性.之后利用所得結(jié)果構(gòu)造參數(shù)的置信域,并通過模擬研究說明了經(jīng)驗(yàn)似然方法在參數(shù)的覆蓋概率大小上表現(xiàn)優(yōu)異. 致謝作者非常感謝相關(guān)文獻(xiàn)對(duì)本文的啟發(fā)以及審稿專家提出的寶貴意見.4 定理證明
5 模擬研究
6 結(jié) 論