亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于局部多項(xiàng)式回歸方法的抽樣估計(jì)

        2011-10-24 06:35:00陳光慧
        統(tǒng)計(jì)與決策 2011年4期
        關(guān)鍵詞:模型

        陳光慧

        (暨南大學(xué) 經(jīng)濟(jì)學(xué)院,廣州 510632)

        基于局部多項(xiàng)式回歸方法的抽樣估計(jì)

        陳光慧

        (暨南大學(xué) 經(jīng)濟(jì)學(xué)院,廣州 510632)

        在輔助信息可利用的情況下,文章研究了有限總體總值的估計(jì)問(wèn)題。首先回顧了Horvitz-Thompson估計(jì)量和廣義回歸估計(jì)量;然后指出當(dāng)輔助變量與研究變量不滿足經(jīng)典線性回歸模型假設(shè)時(shí),可建立非參數(shù)回歸模型,運(yùn)用局部多項(xiàng)式回歸估計(jì)的方法進(jìn)行估計(jì);最后,引入了一個(gè)實(shí)際例子,并對(duì)估計(jì)結(jié)果進(jìn)行了比較。

        輔助信息;抽樣估計(jì);非參數(shù)回歸模型;局部多項(xiàng)式回歸估計(jì)量

        0 引言

        在很多抽樣問(wèn)題中,我們往往希望能得到一些輔助信息,利用這些輔助信息來(lái)提高抽樣估計(jì)的精度。這些輔助信息主要包括普查資料、政府部門的行政記錄和有關(guān)企、事業(yè)單位的生產(chǎn)業(yè)務(wù)記錄以及以前所搜集的調(diào)查資料等等。對(duì)于已經(jīng)得到的輔助信息,我們可以從不同的角度進(jìn)行利用。具體地說(shuō),可以在抽樣設(shè)計(jì)階段利用輔助信息,也可以在抽樣估計(jì)階段利用輔助信息。

        在抽樣設(shè)計(jì)階段利用輔助信息,主要是指不等概率抽樣(包括PPS抽樣和πPS抽樣等等)。比如說(shuō),在πPS抽樣中,研究變量y與已知的輔助變量x呈一定的相關(guān)關(guān)系。我們可以在抽樣設(shè)計(jì)階段利用這種相關(guān)關(guān)系,令第i個(gè)總體單元被包含到樣本中的概率,即入樣概率為

        這樣,如果根據(jù)抽樣設(shè)計(jì)p(·),從總體U中抽出一個(gè)概率樣本s,那么就可以得出未知總體總值ty=∑Uyi的無(wú)偏估計(jì)量,也就是Horvitz-Thompson估計(jì)量

        且Horvitz-Thompson估計(jì)量的方差為

        這里的 πi如式(1)所示,πij即為第 i和 j兩個(gè)總體單元同時(shí)入樣的概率。 觀察式(2) 和式(3)可知,估計(jì)量t贊y及其方差公式中沒(méi)有出現(xiàn)輔助變量。也就是說(shuō),僅僅在抽樣設(shè)計(jì)階段利用了輔助信息,在抽樣估計(jì)階段沒(méi)有利用輔助信息。S覿rndal等人(1992)已經(jīng)證明,在抽樣估計(jì)階段利用輔助信息(即輔助變量進(jìn)入估計(jì)量公式中),往往能得出比Horvitz-Thompson估計(jì)量更有效的估計(jì)量。

        在研究抽樣估計(jì)階段如何利用輔助信息時(shí),首先往往假定一個(gè)超總體線性回歸模型

        來(lái)描述研究變量y與輔助變量向量x=(x1,…,xK)'之間的關(guān)系,而把需要調(diào)查的未知研究總體U(即{yi,xi})看成是這個(gè)超總體線性回歸模型的一次具體實(shí)現(xiàn),其中x1,…,xN是輔助向量x的值。若用研究總體數(shù)據(jù)來(lái)估計(jì)模型參數(shù),可得參數(shù)β的最小二乘估計(jì)量為

        但是由于在實(shí)際調(diào)查中,總體是未知的,所以不能直接用來(lái)估計(jì)模型參數(shù)β,我們只能從總體U中抽出一個(gè)樣本s(即{yi,xi}),利用樣本s的信息以及輔助變量向量x的總體總值tx=∑Uxi=(t1,…,tK)'來(lái)估計(jì)模型參數(shù),進(jìn)而得出總體總值ty=∑Uyi的估計(jì)量。Sarndal等人(1992)基于此模型提出了廣義回歸估計(jì)量(簡(jiǎn)稱GREG估計(jì)量),公式

        此估計(jì)量是ty=∑Uyi的漸進(jìn)無(wú)偏且一致估計(jì)量。一般來(lái)說(shuō),式(5)中的廣義回歸估計(jì)量比式(2)中的 Horvitz-Thomp-son估計(jì)量更優(yōu)。

        在以往關(guān)于回歸估計(jì)的研究中,我們很少考慮建立的回歸模型是否滿足經(jīng)典線性回歸假設(shè)。雖然,S覿rndal等人(1992)提出的廣義回歸估計(jì)量考慮到了異方差的問(wèn)題,但對(duì)于實(shí)際中真實(shí)的數(shù)據(jù)來(lái)說(shuō),僅僅這樣可能還不夠,還有很多模型設(shè)定誤差需要考慮,甚至實(shí)際數(shù)據(jù)是否呈線性關(guān)系還需要研究。如果從這方面考慮,那么基于上述線性回歸模型得出的估計(jì)量的精度可能沒(méi)有想象中的理想。針對(duì)此問(wèn)題,本文擬建立非參數(shù)回歸模型,并提出局部多項(xiàng)式回歸估計(jì)的方法。

        1 局部多項(xiàng)式回歸估計(jì)量的基本思想

        非參數(shù)回歸模型的特點(diǎn)是回歸函數(shù)的形式可以任意,不受任何約束,因而具有較大的適應(yīng)性。近幾年,國(guó)外有些學(xué)者已經(jīng)開(kāi)始把非參數(shù)模型引入到抽樣理論研究中,比如,Breidt和Opsomer(2000)等人提出模型輔助條件下的各種非參數(shù)估計(jì)量。對(duì)于非參數(shù)回歸模型,本文使用局部多項(xiàng)式回歸方法進(jìn)行估計(jì),局部回歸的優(yōu)點(diǎn)是假定變量之間的關(guān)系未知,沒(méi)有隱含任何假設(shè)條件,所以更加符合實(shí)際情況。

        局部回歸的主要思想是,對(duì)于給定的x,認(rèn)為模型回歸函數(shù)m(.)在x附近的局部領(lǐng)域近似于線性,對(duì)x附近的那部分?jǐn)?shù)據(jù)應(yīng)用線性回歸技術(shù),而該局部領(lǐng)域的大小由窗寬(記為h)的大小來(lái)控制。

        2 局部多項(xiàng)式回歸估計(jì)量的構(gòu)建過(guò)程

        為了簡(jiǎn)化問(wèn)題,本文以一個(gè)輔助變量的一元回歸模型為例介紹局部回歸估計(jì),有多個(gè)輔助變量的情形可以類似考慮。

        第一步,建立如下無(wú)限超總體非參數(shù)回歸模型ξ

        其中xi是已知的輔助變量;yi是未知的研究變量;εi是獨(dú)立的隨機(jī)誤差項(xiàng),且其均值為0,方差為v(xi);m(x)是關(guān)于x的一個(gè)光滑函數(shù),其表達(dá)形式未知。在給定xi情況下,模型ξ也可以表達(dá)為如下形式

        與第一節(jié)中的線性回歸模型ζ一樣,我們把需要調(diào)查的未知總體U(即{yi,xi}Ni=1)看成是這個(gè)超總體非參數(shù)回歸模型ξ的一次具體實(shí)現(xiàn)。但是由于總體是未知的,所以不能直接進(jìn)行估計(jì),我們只能從總體U中抽出一個(gè)樣本s(即{yi,xi}ni=1),利用樣本s的信息以及輔助變量x的總體總值tx=∑Uxi來(lái)估計(jì)非參數(shù)回歸模型,進(jìn)而得出研究變量總體總值的估計(jì)量。

        第二步,假定函數(shù)m(x)在x=xi處p+1階導(dǎo)數(shù)存在,則可以對(duì)m(x)在x=xi處進(jìn)行泰勒級(jí)數(shù)展開(kāi),表達(dá)如下

        對(duì)于樣本資料{yk,xk,我們有

        對(duì)上面的多項(xiàng)式運(yùn)用加權(quán)最小二乘法進(jìn)行局部擬合。假定控制局部領(lǐng)域大小的窗寬為h,則對(duì)于xi的領(lǐng)域 (xi-h,xi+h),有

        其中 Kh(·)=K(·|h)/h,K(·)為核函數(shù),h 為窗寬。 為了方便進(jìn)一步討論,把式(11)表達(dá)成矩陣的形式為

        其中

        這里的β為參數(shù)向量,且βv=m(v)(xi)/v!,v=0,1,…,p;ε為模型誤差向量。

        通過(guò)極小化

        β的加權(quán)最小二乘估計(jì)為

        其中 Wsi=diag{Kh(xk-xi)};k=1,…,n。 由于 βv=m(v)(xi)/v! (v=0,1,…,p),可得式(8)中 m(xi)的樣本估計(jì)值為

        這里 e1=[1 0 … 0]'(p+1)×1。 即等于向量β贊中的第一項(xiàng)。

        第三步,采用式(5)中廣義回歸估計(jì)量的形式,可得總體總值ty=∑Uyk的局部多項(xiàng)式回歸估計(jì)量為

        與式(6)中近似方差公式類似,可得局部多項(xiàng)式回歸估計(jì)量的近似方差公式為

        其中mi=e1'(X'UiWUiXUi)-1XUi'WUiYU是用總體數(shù)據(jù)去估計(jì)非參數(shù)回歸模型時(shí)得出的關(guān)于m(xi)的估計(jì)值。推導(dǎo)方法與推導(dǎo)式(16)的樣本估計(jì)值一樣。同理,與式(7)類似,得出近似方差的估計(jì)量為

        其中,m贊(xi)=e1'(Xsi'WsiXsi)-1XsiWsiYs。

        3 數(shù)值分析

        為了更好地說(shuō)明局部多項(xiàng)式回歸方法在抽樣估計(jì)中的應(yīng)用,我們引入一個(gè)實(shí)際例子進(jìn)行分析,即估計(jì)廣東省某年的糧食總產(chǎn)量。按照行政區(qū)劃將廣東省分成89個(gè)縣 (市)、區(qū),即總體單元總數(shù)N=89;研究變量表示第i個(gè)地區(qū)的糧食產(chǎn)量;另外,選用與研究變量高度相關(guān)的常用耕地面積作為輔助變量,因?yàn)楦鱾€(gè)地區(qū)不同年份常用耕地面積很少變化,其數(shù)據(jù)可通過(guò)往年的統(tǒng)計(jì)年鑒得到,且用xi表示第i個(gè)地區(qū)常用耕地面積,其中i=1,…,89。目標(biāo)是估計(jì)總體總值,即廣東省糧食總產(chǎn)量ty=∑Uyi,為此抽出一個(gè)樣本量n=30的樣本進(jìn)行估計(jì)。為了簡(jiǎn)化問(wèn)題,這里使用簡(jiǎn)單隨機(jī)抽樣得出樣本量為30的樣本,樣本數(shù)據(jù)在此略過(guò)。

        從樣本中得到了30個(gè)樣本單元的研究變量值 (即糧食產(chǎn)量yi,i=1,…,30),且還知道總體的輔助變量值(即常用耕地面積xi,i=1,…,89,通過(guò)以往的資料或普查可獲得)。下面的任務(wù)就是利用這些信息來(lái)估計(jì)總體總值 (即廣東省糧食總產(chǎn)量)。

        一般來(lái)說(shuō),這里可以利用輔助變量的信息進(jìn)行回歸估計(jì)。但是通過(guò)觀察圖1和圖2中的兩條回歸趨勢(shì)線,可以發(fā)現(xiàn),由于30個(gè)樣本點(diǎn)呈線性回歸趨勢(shì)并不明顯,若強(qiáng)行進(jìn)行線性回歸估計(jì),其效果可能很差。但是,圖2中的局部多項(xiàng)式回歸擬合圖擬合效果較好。下面分別進(jìn)行線性回歸估計(jì)和局部多項(xiàng)式回歸估計(jì),并對(duì)兩種方法的估計(jì)精度進(jìn)行比較。

        由于使用簡(jiǎn)單隨機(jī)抽樣,那么包含概率相應(yīng)為

        且進(jìn)行局部多項(xiàng)式回歸估計(jì)時(shí),選擇核函數(shù)K(u)=0.75(1-u2)I(|u|≤1),其中 I(·)為示性函數(shù),當(dāng)括號(hào)內(nèi)的不等式成立時(shí),取值為1;否則取值為0。確定窗寬h=0.8。運(yùn)行MATLAB 7可得出結(jié)果如表1。

        表1 兩種估計(jì)方法的結(jié)果

        從表1中可發(fā)現(xiàn),兩種估計(jì)方法中,由局部多項(xiàng)式回歸方法得出的估計(jì)量的近似方差更小,因而估計(jì)得更加精確。

        4 結(jié)束語(yǔ)

        本文研究了在輔助信息可利用的情況下,有限總體總值的估計(jì)問(wèn)題。文章回顧了Horvitz-Thompson估計(jì)量和廣義回歸估計(jì)量及存在的問(wèn)題,當(dāng)輔助變量與研究變量不滿足經(jīng)典線性回歸模型假設(shè)時(shí),考慮建立非參數(shù)回歸模型,并運(yùn)用局部多項(xiàng)式回歸估計(jì)方法進(jìn)行抽樣估計(jì),構(gòu)建局部多項(xiàng)式回歸估計(jì)量。最后,引入了一個(gè)實(shí)際例子進(jìn)行分析,顯示了該估計(jì)量的準(zhǔn)確性。

        [1]馮士雍,倪加勛,鄒國(guó)華.抽樣調(diào)查理論與方法[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998.

        [2]李子奈,葉阿忠.高等計(jì)量經(jīng)濟(jì)學(xué)[M].北京:清華大學(xué)出版社,2000.

        [3]葉阿忠.非參數(shù)計(jì)量經(jīng)濟(jì)學(xué)[M].天津:南開(kāi)大學(xué)出版社,2003.

        [4]W.G.Cochran.抽樣技術(shù)[M].張堯庭,吳輝譯.北京:中國(guó)統(tǒng)計(jì)出版社,1985.

        [5]Breidt,F.J.,Opsomer,J.D.Local Polynomial Regression Estimators in Survey Sampling[J].The Annals of Statistics,2000,(2).

        [6]Sarndal E.C.,Swensson B.,Wretman J.Model Assisted Survey Sampling[M].New York:Springer,1992.

        C811

        A

        1002-6487(2011)04-0003-03

        全國(guó)統(tǒng)計(jì)科學(xué)研究重大項(xiàng)目(2009LD001)

        陳光慧(1980-),男,安徽旌德人,博士,講師,研究方向:統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析。

        (責(zé)任編輯/亦 民)

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        青青草视频在线观看色| 国产 无码 日韩| 真实国产乱啪福利露脸| 日韩精品成人一区二区三区| 免费无码又爽又刺激高潮的视频网站 | 少女韩国电视剧在线观看完整 | 在线天堂中文一区二区三区| 日本国产在线一区二区| 一区二区三区在线观看精品视频| 亚洲av熟女少妇一区二区三区 | 国产伦码精品一区二区| 国产精品国产三级国产专区51区 | 在线观看视频播放| 亚洲AV色无码乱码在线观看| 中文字幕无码专区一VA亚洲V专| 久久久精品国产亚洲av网不卡| 日韩中文字幕有码午夜美女| 亚洲乳大丰满中文字幕| 黄瓜视频在线观看| 国产午夜激无码av毛片| 国产a级精精彩大片免费看| 黑人巨大亚洲一区二区久| 青青草是针对华人绿色超碰| 风韵犹存丰满熟妇大屁股啪啪| 日本真人边吃奶边做爽电影| 国产真实乱对白精彩| 国产精品va在线播放我和闺蜜| 亚洲av日韩aⅴ无码电影 | 亚洲男人av香蕉爽爽爽爽| 日本一区二区三区激情视频| 日韩精品中文字幕免费人妻| 中文日本强暴人妻另类视频| 午夜视频在线观看一区二区小| 97日日碰人人模人人澡| 欧美日韩在线免费看| 日韩精品欧美激情国产一区 | 国产在线无码精品无码| 337p日本欧洲亚洲大胆精品| 精品人妻潮喷久久久又裸又黄| 久久亚洲精品成人综合| 亚洲精品久久区二区三区蜜桃臀 |