亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人口普查漏報估計(jì)研究

        2020-11-04 03:06:30胡桂華廖金盆范署姍葉寶紅
        工程數(shù)學(xué)學(xué)報 2020年5期
        關(guān)鍵詞:質(zhì)量

        胡桂華, 廖金盆, 范署姍, 葉寶紅, 吳 婷

        (重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 經(jīng)濟(jì)社會應(yīng)用統(tǒng)計(jì)重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400067)

        1 引言

        2020 年,中國、美國和其他許多國家將進(jìn)行人口普查及其質(zhì)量評估.普查漏報是評估目標(biāo)之一.為指導(dǎo)各國政府統(tǒng)計(jì)部門開展普查漏報評估工作,聯(lián)合國統(tǒng)計(jì)司組織世界人口普查質(zhì)量評估專家撰寫人口普查質(zhì)量評估工作指南.該指南中的未匹配估計(jì)量只是包括了在質(zhì)量評估調(diào)查中登記而未在普查中登記的漏報人口,從而低估總體普查漏報人口數(shù).

        為解決上述問題,本文在對現(xiàn)行普查漏報估計(jì)方法研究的基礎(chǔ)上,提出普查漏報合成估計(jì)量.該估計(jì)量由兩部分構(gòu)成.第一部分是三個線性漏報估計(jì)量,估計(jì)未登記在普查人口名單但至少登記在質(zhì)量評估調(diào)查人口名單及行政記錄人口名單之一的人數(shù).第二部分是缺失單元漏報估計(jì)量,估計(jì)未登記在任何名單的人數(shù).

        創(chuàng)新體現(xiàn)在兩個方面.第一,相比目前國內(nèi)外采用的估計(jì)普查漏報的逆記錄檢查估計(jì)量、未匹配估計(jì)量和平衡推算估計(jì)量,普查漏報合成估計(jì)量通過引入人口行政記錄,可以找到更多的普查漏報人口.首先,逆記錄檢查,需要在本次全國人口普查微觀數(shù)據(jù)庫搜索漏報人口,這是一項(xiàng)十分艱難的工作,而普查漏報合成估計(jì)量,只需要比對同一樣本普查小區(qū)的普查人口名單、質(zhì)量評估調(diào)查人口名單及行政記錄人口名單,便可以獲得樣本漏報人口,工作難度小許多.其次,未匹配估計(jì)量,未包括同時遺漏于普查人口名單及質(zhì)量評估調(diào)查人口名單的漏報人口,而普查漏報合成估計(jì)量同時包括遺漏于上述三份人口名單的人口.再次,平衡推算估計(jì)量,只能算出普查漏報人口數(shù),而不能解釋形成漏報的原因及其漏報的程度,而普查漏報合成估計(jì)量,在比對三份人口名單后,可查明普查漏報的原因、程度及漏報在總體中的分布情況.探索普查漏報的發(fā)生機(jī)制,是漏報估計(jì)的主要目的.相比中國2010 年采用的未匹配估計(jì)量計(jì)算的樣本普查漏報率,普查漏報合成估計(jì)量,利用抽樣權(quán)數(shù)將樣本擴(kuò)張到總體,估計(jì)總體的普查漏報率,并且采取刀切法近似計(jì)算抽樣方差.第二,在有限總體概率抽樣條件下,普查漏報的總體指標(biāo)需要用樣本來估計(jì).本文給出估計(jì)量的構(gòu)造方法以及估計(jì)量的方差估計(jì)方法.

        2 文獻(xiàn)綜述

        普查覆蓋誤差包括普查凈誤差、普查多報與漏報[1].凈誤差定義為總體實(shí)際人數(shù)與普查登記人數(shù)之差.各國目前通行的做法是,用基于“捕獲-再捕獲”模型的雙系統(tǒng)估計(jì)量[2]構(gòu)造總體實(shí)際人數(shù)估計(jì)量,把這個估計(jì)量與普查登記人口數(shù)之差當(dāng)作人口普查凈誤差.未來可能用基于三次捕獲模型[3,4]的三系統(tǒng)估計(jì)量[5-7]來取代雙系統(tǒng)估計(jì)量[8-10].

        凈誤差估計(jì)的研究成果多于普查漏報與多報.政府統(tǒng)計(jì)部門在其所發(fā)布的人口普查質(zhì)量評估工作報告中只是簡單提及普查漏報的估計(jì)方法或估計(jì)結(jié)果.研究普查漏報估計(jì)的學(xué)術(shù)論文甚少.漏報有兩個特點(diǎn).一是漏報人口未登記在普查表中,從普查表中得不到漏報人口信息,要構(gòu)造漏報估計(jì)量,需要采取間接估計(jì)方法.二是各國人口普查質(zhì)量評估結(jié)果顯示,普查漏報比多報嚴(yán)重.

        逆記錄檢查估計(jì)量、未匹配估計(jì)量和平衡推算估計(jì)量,是估計(jì)總體普查漏報人口的傳統(tǒng)方法[11].采用逆記錄檢查估計(jì)量的國家包括加拿大、丹麥、芬蘭、危地馬拉、洪都拉斯、以色列、意大利、荷蘭、挪威、瑞典和美國.逆記錄檢查抽樣框由上次普查登記人口、上次普查漏報人口、上次到本次普查出生及遷入人口組成.樣本由人構(gòu)成.對每一個樣本個人,在本次全國普查微觀數(shù)據(jù)庫搜索,尋找與其相同的人.如果找到,就稱該樣本個人為匹配人口,否則稱為未匹配人口,即普查漏報人口.逆記錄檢查估計(jì)量為樣本個人與其抽樣權(quán)數(shù)的線性估計(jì)量.其優(yōu)勢是,由于逆記錄檢查與本次普查獨(dú)立,因而避免了因這兩項(xiàng)調(diào)查不獨(dú)立引起的交互作用偏差而低估或高估普查漏報人口數(shù).其劣勢是自上次普查之后,樣本個人可能已經(jīng)離開原來居住的地方,或者死亡、更改了姓名,找到他們有困難,難以判斷這些人是在本次普查中登記,還是漏報,或不屬于應(yīng)該在本次普查中登記的人.這增加了逆記錄檢查實(shí)施的難度和錯誤判斷樣本個人在普查中登記情況的風(fēng)險.

        未匹配估計(jì)量為質(zhì)量評估調(diào)查未匹配人口與其抽樣權(quán)數(shù)的線性估計(jì)量,或者質(zhì)量評估調(diào)查人口數(shù)估計(jì)量與其匹配人口數(shù)估計(jì)量之差.匹配人口指,同時登記在質(zhì)量評估調(diào)查名單與普查名單的人口.未匹配人口指,只登記在質(zhì)量評估調(diào)查名單的人口.聯(lián)合國統(tǒng)計(jì)司建議各國使用未匹配估計(jì)量.中國在2010 年使用該漏報估計(jì)量估計(jì)現(xiàn)有人口、戶籍人口及常住人口的漏報率[12].未匹配估計(jì)量優(yōu)勢在于,容易理解和實(shí)施.其劣勢是未包括同時遺漏于這兩份名單的人口,從而低估總體普查漏報人口數(shù).如果樣本中的未匹配人口過少甚至為零,該漏報估計(jì)量提供的總體漏報人口數(shù)估計(jì)值可能嚴(yán)重偏離真值.

        平衡推算估計(jì)量,依據(jù)公式“估計(jì)的凈誤差+估算的普查登記人口數(shù)=估計(jì)的普查漏報人數(shù)-估計(jì)的普查多報人數(shù)”間接推出總體普查漏報人口數(shù)[13].在人口普查中,有些住戶拒絕填寫普查表,或拒絕普查員上門登記.這類住戶的人口數(shù)一般通過鄰居,或其他熟悉情況的人估算.美國普查局把估算的普查登記人數(shù),計(jì)入普查登記人口總數(shù).美國在2010 年普查漏報估計(jì)中,在獲得凈誤差估計(jì)值(-3.6 萬人)、估算的普查登記人口數(shù)(599.2 萬人),以及估計(jì)的普查多報人口數(shù)(1004.2 萬人)后,得到估計(jì)的普查漏報人口數(shù)為1599.8 萬人(Vincent Thomas Mule, 2012).平衡推算估計(jì)量的優(yōu)勢是,可以很方便地推出普查漏報人口數(shù).其缺陷有4 個:

        ① 不能提供本次普查登記過程中的漏報人口信息,不利于下次普查及其質(zhì)量評估工作方案的改進(jìn);

        ② 凈誤差與普查多報估計(jì)對普查正確登記位置認(rèn)定標(biāo)準(zhǔn)不一致,即前者要求每個人登記在其所屬的樣本小區(qū),或其周圍區(qū)域內(nèi),而后者可以登記在研究區(qū)域的任何地方.這種不一致影響普查漏報估計(jì)精度;

        ③ 內(nèi)含交互作用偏差的雙系統(tǒng)估計(jì)量估計(jì)的凈誤差存在一定程度的偏誤,這種偏誤造成疊加效應(yīng),影響普查漏報估計(jì)精度;

        ④ 估算的普查登記人口數(shù)存在一定程度的估算誤差,降低普查漏報估計(jì)精度.

        從對普查漏報合成估計(jì)量創(chuàng)新情況的論述,以及對現(xiàn)有普查漏報估計(jì)量利弊的分析,不難看出,普查漏報合成估計(jì)量是一種相對較為理想的普查漏報估計(jì)方法,有望應(yīng)用于人口普查漏報估計(jì).中國計(jì)劃在2020 年首次使用普查漏報合成估計(jì)量.

        3 普查漏報合成估計(jì)量理論

        為構(gòu)造普查漏報合成估計(jì)量,在獲得普查人口名單、質(zhì)量評估調(diào)查人口名單及行政記錄人口名單后,要做好五項(xiàng)工作.第一,每份名單只能登記普查目標(biāo)總體的人.如果有的名單重復(fù)登記或登記普查標(biāo)準(zhǔn)時點(diǎn)不存在的人,就予以剔除.行政記錄人口名單要利用多個來源的人口名單建立,并剔除其中的重復(fù)人口.對名單中存在但懷疑可能已經(jīng)死亡的人,在現(xiàn)場核實(shí)的基礎(chǔ)上決定剔除還是保留.第二,分析普查漏報的可能情形,即只登記在質(zhì)量評估調(diào)查或行政記錄的人口(共3 種),未登記在任何名單的人口(1 種).其中,前3 種漏報人口數(shù)使用線性漏報估計(jì)量估計(jì),后1 種漏報人口數(shù)采用缺失單元漏報估計(jì)量估計(jì).普查漏報合成估計(jì)量為三個線性漏報估計(jì)量與一個缺失單元漏報估計(jì)量[14-16]的總和.第三,比對三份人口名單,為構(gòu)造三個線性漏報估計(jì)量及一個缺失單元漏報估計(jì)量提供數(shù)據(jù).假定不存在比對誤差,否則要測算比對誤差對普查漏報合成估計(jì)量的影響.第四,采用加權(quán)優(yōu)比排序法[17],選擇對總體人口等概率分層的變量,例如,性別、年齡、房屋所有權(quán)、居住地點(diǎn)、民族,把登記概率大致相等的人口放在同一層.顯然,變量越多,交叉層的層數(shù)也越多,分配到每一個交叉層的樣本人口就越少,普查漏報估計(jì)值的抽樣誤差就越大[18].為控制交叉層數(shù)目,分層變量的數(shù)目應(yīng)該減少.分層變量的選擇是一項(xiàng)復(fù)雜的工作,超出本文研究范圍.對此問題有興趣的讀者,請見參考文獻(xiàn)[17].把每一個交叉層稱之為等概率人口層.在每個等概率人口層,建立普查漏報合成估計(jì)量及其抽樣方差估計(jì)量.匯總所有等概率人口層的普查漏報合成估計(jì)量,得到總體的普查漏報合成估計(jì)量.匯總所有等概率人口層的普查漏報合成估計(jì)量的抽樣方差及等概率人口層之間的協(xié)方差,得到總體的普查漏報合成估計(jì)量的抽樣方差.等概率人口層之間的協(xié)方差可能為正或?yàn)樨?fù).第五,構(gòu)造三份名單全面登記、抽樣登記、人口移動和無人口移動的缺失單元漏報估計(jì)量、線性漏報估計(jì)量及普查漏報合成估計(jì)量.

        用v 表示任意等概率人口層,V 為總層數(shù).為了敘述方便,在下面的式(1)-(26)省去v.在構(gòu)造總體普查漏報估計(jì)量時,在式(27)-(30)添加v 和V.

        用xcqa表示等概率人口層的人口登記在三份名單的人口數(shù),下標(biāo)c, q, a 分別表示普查、質(zhì)量評估調(diào)查和人口行政記錄,取值1 或0.c=1 表示等概率人口層的人口在普查人口名單,c=0 表示等概率人口層的人口不在普查人口名單.q =1 表示等概率人口層的人口在質(zhì)量評估調(diào)查人口名單,q =0 表示層v 的人口不在質(zhì)量評估調(diào)查人口名單.a=1 表示等概率人口層的人口在行政記錄人口名單,a = 0 表示層v 的人口不在行政記錄人口名單.用這些記號寫出如下有關(guān)的估計(jì)量.

        3.1 等概率人口層的缺失單元漏報估計(jì)量

        我們分三個層次討論問題.第一層次,假定普查人口名單、質(zhì)量評估調(diào)查人口名單及行政記錄人口名單是對總體人口的全面登記,并且三份名單所登記的是各小區(qū)普查時點(diǎn)的同一常住人口總體.第二層次,仍假定三份名單對總體全面登記,并考慮普查日與質(zhì)量評估調(diào)查日之間的人口移動.第三層次,用有限總體概率樣本資料,構(gòu)造上面兩個層次的缺失單元漏報估計(jì)量的構(gòu)成元素的估計(jì)量[19].

        3.1.1 全面登記且無人口移動的缺失單元漏報估計(jì)量

        缺失單元漏報估計(jì)量,依據(jù)普查人口名單、質(zhì)量評估調(diào)查人口名單及行政記錄人口名單的統(tǒng)計(jì)關(guān)系建立.三份名單可能的統(tǒng)計(jì)關(guān)系分為四類.第一類是三份名單條件獨(dú)立.例如,普查與質(zhì)量評估調(diào)查相關(guān),質(zhì)量評估調(diào)查與人口行政記錄相關(guān),普查與行政記錄獨(dú)立.這類關(guān)系共有3 種.第二類是三份名單聯(lián)合獨(dú)立.例如,普查與質(zhì)量評估調(diào)查相關(guān),這兩項(xiàng)調(diào)查與行政記錄獨(dú)立.這類關(guān)系也有3 種.第三類是三份名單兩兩相關(guān),這類關(guān)系有1 種.第四類為三份名單相互獨(dú)立,這類關(guān)系有1 種.

        構(gòu)造缺失單元漏報估計(jì)量有兩個方法.第一個方法是,用三系統(tǒng)估計(jì)量構(gòu)造三份名單的缺失單元漏報估計(jì)量.由于三系統(tǒng)估計(jì)量在三個名單統(tǒng)計(jì)關(guān)系不同的情況下有不同的計(jì)算公式,所以需要先使用對數(shù)線性模型,判斷三份名單屬于何種統(tǒng)計(jì)關(guān)系,然后使用該種統(tǒng)計(jì)關(guān)系下的三系統(tǒng)估計(jì)量計(jì)算公式.第二個方法是,根據(jù)先驗(yàn)信息分析三份名單最可能形成的統(tǒng)計(jì)關(guān)系,并只構(gòu)造這種統(tǒng)計(jì)關(guān)系的缺失單元估計(jì)量.普查與質(zhì)量評估調(diào)查相關(guān),但它們與人口行政記錄獨(dú)立,這種統(tǒng)計(jì)關(guān)系的可能性大.事實(shí)上,這兩項(xiàng)調(diào)查由政府統(tǒng)計(jì)部門組織實(shí)施,而人口行政記錄來源于不同于政府統(tǒng)計(jì)部門的行政部門.另外,這兩項(xiàng)調(diào)查的目的是為了獲得人口數(shù),而人口行政記錄是行政工作的副產(chǎn)品,用于行政管理.例如,我國戶籍資料本身并不是為了提供人口數(shù),而是為了實(shí)現(xiàn)對人的管理,控制人口向大城市流動,合理布局全國人口分布.基于此種分析,只構(gòu)造該種統(tǒng)計(jì)關(guān)系的缺失單元漏報估計(jì)量.為構(gòu)造缺失單元普查漏報估計(jì)量,需要把普查和質(zhì)量評估調(diào)查合并在一起當(dāng)作第一個來源,把人口行政記錄當(dāng)作第二個來源.由于數(shù)據(jù)來源的特點(diǎn),它們合并后獨(dú)立于人口行政記錄.不在第一個來源但在第二個來源的人口數(shù)用x001表示,在第一個來源不在第二個來源的人口數(shù)用(x110+x100+x010)表示,同時在兩個來源的人口數(shù)用(x111+x101+x011)表示,未登記在任何來源的人口數(shù)用x000表示,其估計(jì)量稱為缺失單元漏報估計(jì)量,用^x000表示.把這四項(xiàng)填寫在表1.

        表1 兩來源的等概率人口層數(shù)量

        式(1)中的n=x111+x101+x011+x110+x100+x010+x001.總體中的人至少在兩個來源之一的概率為[1-(1-π1+)(1-π+1)].單元(i,j)人數(shù)的另外一種表達(dá)式為概率函數(shù)的二項(xiàng)分布為

        如果給出π1+, π+1, Nv,那么π1+, π+1的最大似然估計(jì)量分別為

        式(3)中,n+1=n11+n01, n1+=n11+n10.

        由于N =n+x000,所以

        將式(4)及n 代入式(5)得到

        式(6)是三份名單對總體全面登記的缺失單元估計(jì)量.

        3.1.2 全面登記且人口移動的缺失單元漏報估計(jì)量

        在人口普查質(zhì)量評估中,質(zhì)量評估調(diào)查通常滯后于人口普查半個月左右.在這期間,會有人從其他普查小區(qū)移動到本小區(qū),也有人從本小區(qū)移動到其他小區(qū),還有人一直居住在本小區(qū).把這三種情況的人分別稱為向內(nèi)移動人口、向外移動人口和無移動人口.質(zhì)量評估調(diào)查人口名單的人口有兩種構(gòu)成方式.一是無移動人口和向外移動人口,簡稱質(zhì)量評估調(diào)查-A.另外一種方式是無移動人口和向內(nèi)移動人口,簡稱質(zhì)量評估調(diào)查-B.質(zhì)量評估調(diào)查-A 的優(yōu)勢是實(shí)現(xiàn)了人口普查質(zhì)量評估追溯普查標(biāo)準(zhǔn)時點(diǎn)的人口及其人數(shù)的目的,缺點(diǎn)是找到向外移動人口有難度,其有關(guān)信息只能通過鄰居或估算方法獲得,誤差較大.質(zhì)量評估調(diào)查-B 的優(yōu)勢是向內(nèi)移動人口在本小區(qū),獲取其質(zhì)量評估調(diào)查時信息較容易,劣勢是獲得其普查標(biāo)準(zhǔn)時點(diǎn)在其他普查小區(qū)的信息有一定困難.如果采用質(zhì)量評估調(diào)查-A,那么式(6)中的每項(xiàng)人口數(shù)要更改為無移動人口數(shù)與向外移動人口數(shù)的和.如果采用質(zhì)量評估調(diào)查-B,那么式(6)中的每個人口數(shù)要更改為無移動人口數(shù)與向內(nèi)移動人口數(shù)的和.用n, i, o 分別表示無移動人口、向內(nèi)移動人口和向外移動人口.

        如果采取質(zhì)量評估調(diào)查-A,那么式(6)變?yōu)?/p>

        對本小區(qū),向外移動人口在質(zhì)量評估調(diào)查標(biāo)準(zhǔn)時點(diǎn)前已經(jīng)離開了本小區(qū),不可能登記在本小區(qū)的質(zhì)量評估調(diào)查人口名單中,因此式(7)變?yōu)?/p>

        如果采用質(zhì)量評估調(diào)查-B,那么式(6)變?yōu)?/p>

        同樣,對本小區(qū),向內(nèi)移動人口無法登記在本小區(qū)的行政記錄人口名單,因此式(9)變?yōu)?/p>

        3.1.3 抽樣登記且人口移動的缺失單元漏報估計(jì)量

        在質(zhì)量評估調(diào)查為全面調(diào)查情況下,以上各式等號右邊的每一數(shù)據(jù)項(xiàng)都是層v 的總?cè)丝跀?shù)指標(biāo).為了節(jié)約成本、時間,減少非抽樣誤差,各國政府統(tǒng)計(jì)部門的質(zhì)量評估調(diào)查實(shí)際上是從全國或各省或各行政區(qū)的普查小區(qū)總體中抽取樣本普查小區(qū)來進(jìn)行的.在質(zhì)量評估調(diào)查為抽樣調(diào)查及考慮人口移動情況下,式(8)和式(10)的每一數(shù)據(jù)項(xiàng)要用估計(jì)量來表示,用有限總體概率樣本來構(gòu)造,即先將每一樣本小區(qū)的人口數(shù)與其抽樣權(quán)數(shù)相乘,然后相加.如果對樣本小區(qū)人口100%抽樣,而且不存在無答復(fù),那么樣本普查小區(qū)的抽樣權(quán)數(shù)等于其中每人的抽樣權(quán)數(shù).此時式(8)變?yōu)?/p>

        式(10)變?yōu)?/p>

        3.2 等概率人口層的線性漏報估計(jì)量

        3.3 等概率人口層的普查漏報合成估計(jì)量

        式(11)-(16)等號右邊的每一個估計(jì)量,依據(jù)質(zhì)量評估調(diào)查樣本數(shù)據(jù)來計(jì)算.在人口普查質(zhì)量評估抽樣調(diào)查中,樣本的抽取方法有分層整群抽樣、分層多階段抽樣和分層多重抽樣[20-22].中國自1982 年人口普查質(zhì)量評估起,一直采用分層整群抽樣方法抽取普查小區(qū)樣本.本著研究服務(wù)于應(yīng)用的原則,本文采取分層整群抽樣.在該抽樣法下,式(11)-(16)的每一個估計(jì)量統(tǒng)一用式(17)來表示.

        式(17)中,H 表示對總體全部普查小區(qū)所分的層數(shù),例如按照普查小區(qū)規(guī)模將總體中的所有普查小區(qū)分在三層,每一層h 的樣本規(guī)模記為nh, h = 1,2,··· ,H,yhi為小區(qū)hi 在等概率人口層的人數(shù).在分層整群等概率抽樣下,樣本普查小區(qū)hi 的抽樣權(quán)數(shù)whi為

        3.4 等概率人口層的普查漏報合成估計(jì)量的抽樣方差估計(jì)量

        式(11)和(12),以及式(15)和(16)的復(fù)制估計(jì)量分別為

        式(15)和(16)的分層刀切抽樣方差(variance, 縮寫為var)估計(jì)量分別為

        為了正確理解及使用式(25)和式(26),需要注意兩點(diǎn).第一,刀切法僅在樣本內(nèi)操作.切掉一個單位,只不過是這個切掉的單位不在樣本中,并不意味著它不在總體中.如果把這個單位從總體中切掉,調(diào)查對象就改變了,就不再是原來的總體了,與現(xiàn)在的調(diào)查任務(wù)就不一樣,所以從樣本中切掉一個單位,只不過是假定了一個虛擬樣本,即切掉的那個單位沒有進(jìn)入這個虛擬樣本.就未分層整群抽樣來說,假定從單位數(shù)為N 的總體中簡單隨機(jī)抽取單位數(shù)n.現(xiàn)在從該樣本中切掉1 個單位,在計(jì)算其它(n-1)個單位各自的復(fù)制權(quán)數(shù)時,應(yīng)該是從N 個單位中簡單隨機(jī)抽取(n-1)個單位概率的倒數(shù),此時總體單位數(shù)目不改變,只是樣本單位數(shù)目減去1.即這(n-1)個單位此時各自的復(fù)制權(quán)數(shù)是N/(n-1).第二,同計(jì)算復(fù)雜總體參數(shù)估計(jì)量抽樣方差的泰勒線性方差估計(jì)量相比[25,26],刀切法操作便利,容易實(shí)施,在計(jì)算了樣本普查小區(qū)的復(fù)制權(quán)數(shù)及總體參數(shù)估計(jì)量的復(fù)制估計(jì)量后,將樣本數(shù)據(jù)代入其中即可算出結(jié)果.

        3.5 總體普查漏報合成估計(jì)量及其抽樣方差估計(jì)量

        在構(gòu)造了每個等概率人口層(用v 表示)的普查漏報估計(jì)量后,下一步要做的工作是匯總所有等概率人口層(用V 表示總層數(shù))的普查漏報合成估計(jì)量及其抽樣方差估計(jì)量,得到總體的普查漏報合成估計(jì)量及抽樣方差估計(jì)量.

        4 未匹配估計(jì)量

        為了比對普查漏報合成估計(jì)量與傳統(tǒng)普查漏報估計(jì)量在數(shù)據(jù)估計(jì)精度上的優(yōu)勢,以及考慮進(jìn)行這種比對所需數(shù)據(jù)資料的可得性,我們現(xiàn)在討論未匹配估計(jì)量.除美國等少數(shù)幾個國家外,其他國家都是使用這種估計(jì)量.與普查漏報合成估計(jì)量相比,未匹配估計(jì)量不用對總體人口等概率分層,直接在總體人口內(nèi)構(gòu)造及使用.

        未匹配估計(jì)量建立的關(guān)鍵是獲得匹配人口.對樣本普查小區(qū)的普查人口名單及質(zhì)量評估調(diào)查人口名單,如果后者名單中的某人出現(xiàn)在普查人口名單,就稱其為質(zhì)量評估調(diào)查人口名單的匹配人口,如果后者名單中的某人未在普查人口名單中出現(xiàn),就稱為后者的未匹配人口[27].未匹配人口為普查漏報人口.做出上述判斷的一個假定條件是,質(zhì)量評估調(diào)查人口名單中的每一個人屬于普查目標(biāo)總體,應(yīng)該在普查中登記.在人口普查質(zhì)量評估中,各國政府統(tǒng)計(jì)部門默認(rèn)質(zhì)量評估調(diào)查人口名單完美無缺.

        為區(qū)別普查漏報合成估計(jì)量的總體P,這里用U 表示總體的未匹配估計(jì)量.

        4.1 總體未匹配估計(jì)量

        式(31)和(32),PhiA和MhiA分別表示質(zhì)量評估調(diào)查-A 的無移動人口和向外移動人口的數(shù)目之和,以及它們的匹配無移動人口和向外移動人口的數(shù)目之和;PhiB和MhiB有同樣的相應(yīng)解釋.whi依據(jù)式(18)計(jì)算.

        4.2 總體未匹配估計(jì)量的抽樣方差估計(jì)量

        雖然式(31)和式(32)有方差數(shù)學(xué)表達(dá)式計(jì)算其抽樣方差,但為了與普查漏報合成估計(jì)量的抽樣方差進(jìn)行數(shù)據(jù)上的可比性比較,我們使用分層刀切法近似計(jì)算其抽樣方差.文獻(xiàn)[19]指出,線性估計(jì)量的抽樣方差可以用分層刀切法計(jì)算.

        式(34)和(36)中的whi(gt)根據(jù)式(19)計(jì)算.不難看出,未匹配估計(jì)量的抽樣方差計(jì)算,無需在等概率人口層內(nèi)進(jìn)行,可以直接在總體內(nèi)計(jì)算.

        5 實(shí)證分析

        實(shí)證對象為廣西南寧市邕寧區(qū),資料所屬時間是2010 年11 月1 日零時,目標(biāo)是估計(jì)邕寧區(qū)普查漏報.在樣本抽取前,將邕寧區(qū)所有普查小區(qū)劃分在三層:蒲津社區(qū)層;那樓社區(qū)和新江社區(qū)合并層;百濟(jì)社區(qū)和中和社區(qū)合并層.在每層,以普查小區(qū)為抽樣單位,從邕寧區(qū)的1038 個普查小區(qū)中簡單隨機(jī)抽取7 個,并獲得了樣本小區(qū)的普查人口名單、質(zhì)量評估調(diào)查人口名單和行政記錄人口名單.通過比對,獲得同時登記在三份名單、兩份名單及一份名單的人口數(shù).對每個樣本小區(qū)的人口,按照性別分在兩個等概率人口層,即男性層和女性層.在這兩個層計(jì)算普查漏報估計(jì)值.

        5.1 基于普查漏報合成估計(jì)量的估計(jì)結(jié)果及數(shù)據(jù)分析

        5.1.1 樣本資料

        樣本普查小區(qū)及樣本人口數(shù)資料見表2 至表5.

        5.1.2 加權(quán)人數(shù)計(jì)算

        利用表2 至表5 樣本數(shù)據(jù),使用式(17)計(jì)算式(11)和(12),以及式(15)和(16)每項(xiàng)的加權(quán)人數(shù),見表6.

        表2 分層及樣本

        表3 樣本普查小區(qū)人口數(shù)

        表4 樣本普查小區(qū)男性在三份名單登記的人數(shù)(人)

        表5 樣本普查小區(qū)女性在三份名單登記的人數(shù)(人)

        續(xù)表5 樣本普查小區(qū)女性在三份名單登記的人數(shù)(人)

        表6 等概率人口層在三份人口名單每項(xiàng)的加權(quán)人數(shù)(人)

        5.1.3 普查漏報計(jì)算

        使用式(22)-(24),利用表6 數(shù)據(jù),計(jì)算男性層和女性層的普查漏報人數(shù).利用式(27)-(29)計(jì)算總體普查漏報人口數(shù).計(jì)算結(jié)果見表7.

        表7 表明,如果采取質(zhì)量評估調(diào)查-A,男性層和女性層的普查漏報人口數(shù)分別為5107 人和6339 人.如果采取質(zhì)量評估調(diào)查-B,男性層和女性層的普查漏報人口數(shù)分別為4477 人和4707 人.如果采取質(zhì)量評估調(diào)查-A 或-B,總體普查漏報人口數(shù)分別為11446 人或9184 人.因此,無論男性層、女性層,還是總體,質(zhì)量評估調(diào)查-A 的普查漏報人口數(shù)均大于質(zhì)量評估調(diào)查-B.這一現(xiàn)象表明,所選取的樣本普查小區(qū)的向外移動人口多于向內(nèi)移動人口.由于樣本小區(qū)是隨機(jī)選取的,所以邕寧區(qū)的向外移動人口比向內(nèi)移動人口多.“六普”數(shù)據(jù)分析顯示,廣西南寧市邕寧區(qū)的一些中青年去廣東、北京、上海、浙江、深圳打工,而來邕寧區(qū)打工的很少.在普查與質(zhì)量評估調(diào)查之間,邕寧區(qū)人口也是以向外移動為主.可見,本文計(jì)算結(jié)果與“六普”結(jié)果一致.

        表7 普查漏報人數(shù)(人)

        5.1.4 普查漏報估計(jì)值的抽樣方差計(jì)算

        在計(jì)算了男性和女性及總體的普查漏報估計(jì)值之后,還要使用分層刀切法計(jì)算其抽樣方差估計(jì)值.這包括三個步驟.第一步,使用式(19)計(jì)算每刀切掉每一層的每一個樣本普查小區(qū)后,所有樣本普查小區(qū)的復(fù)制權(quán)數(shù),計(jì)算結(jié)果見表8.在分層整群抽樣下,刀切對象是每一層的所有樣本普查小區(qū).如果采取整群二重抽樣,刀切的對象是第一重樣本的所有普查小區(qū),而不是第二重樣本的所有普查小區(qū).第二步,依據(jù)式(20)計(jì)算式(21)-(24)每一個數(shù)據(jù)項(xiàng)的復(fù)制估計(jì)量,例如刀切第一層的第一個樣本普查小區(qū)A1 后的每一個數(shù)據(jù)項(xiàng)的復(fù)制估計(jì)量,計(jì)算結(jié)果見表9.為節(jié)省篇幅,省去依次刀切A2-A7 樣本普查小區(qū)后得到的每個數(shù)據(jù)項(xiàng).利用表9 數(shù)據(jù),使用式(21)-(24)計(jì)算“缺失單元人數(shù)復(fù)制值及漏報復(fù)制值”,計(jì)算結(jié)果見表10.為了計(jì)算普查漏報抽樣方差,寫出依次刀切A1-A7 的普查漏報復(fù)制估計(jì)值及普查漏報估計(jì)值,見表11.第三步,利用表11 數(shù)據(jù),使用式(25)、式(26)、式(28)、式(30)計(jì)算男性層、女性層,以及總體的抽樣方差與協(xié)方差.結(jié)果請見表12.

        表8 樣本普查小區(qū)的復(fù)制權(quán)數(shù)

        從表8 可以看出,無論剔除哪一個樣本普查小區(qū),所有樣本普查小區(qū)的復(fù)制權(quán)數(shù)之和與未剔除任何小區(qū)的所有樣本小區(qū)的抽樣權(quán)數(shù)之和相等.這說明,剔除某個樣本小區(qū)后,總權(quán)數(shù)不變,但有些樣本小區(qū)的權(quán)數(shù)變大,也有的樣本小區(qū)權(quán)數(shù)變小,還有的小區(qū)權(quán)數(shù)不變.利用這些規(guī)律可以驗(yàn)證復(fù)制權(quán)數(shù)的計(jì)算是否正確.復(fù)制權(quán)數(shù)功能有三個.一是計(jì)算式(11)和(12),以及式(15)和(16)每一個估計(jì)量的復(fù)制值.二是計(jì)算普查漏報復(fù)制估計(jì)值.三是計(jì)算普查漏報估計(jì)值的抽樣方差.

        表9 等概率人口層在三份名單的復(fù)制加權(quán)人數(shù)(人)(剔除t=A1)

        表10 普查漏報復(fù)制人數(shù)(人)(剔除t=A1)

        表11 普查漏報及復(fù)制漏報人數(shù)(人)

        表12 抽樣誤差與協(xié)方差

        表12 括號里面的數(shù)據(jù)為抽樣標(biāo)準(zhǔn)誤差.從表12 可以看出,采用質(zhì)量評估調(diào)查-A,男性、女性和總體的抽樣標(biāo)準(zhǔn)誤差分別為352 人、272 人和171 人,即所估計(jì)的男性、女性和總體的普查漏報人數(shù)5107 人、6339 人和11446 人,與實(shí)際的男性、女性和總體的普查漏報人數(shù)平均相差352 人、272 人和171 人.采用質(zhì)量評估調(diào)查-B,除女性外,男性和總體的抽樣標(biāo)準(zhǔn)誤差大一些.這說明,質(zhì)量評估調(diào)查的人口構(gòu)造方法對普查漏報估計(jì)的精度有影響.質(zhì)量評估調(diào)查-A 使男性層和女性層呈負(fù)相關(guān)關(guān)系,協(xié)方差為負(fù)84238,降低普查漏報估計(jì)值的抽樣誤差,而質(zhì)量評估調(diào)查-B 使男性層和女性層呈正相關(guān)關(guān)系,增加總體普查漏報估計(jì)值的抽樣誤差.因此,在普查漏報估計(jì)中,質(zhì)量評估調(diào)查-A 提供精度更高的漏報估計(jì)值.

        5.2 基于未匹配估計(jì)量的估計(jì)結(jié)果及數(shù)據(jù)分析

        未匹配估計(jì)量,需要的樣本資料是普查人口名單、質(zhì)量評估調(diào)查人口名單及其匹配人口名單,以及樣本普查小區(qū)的抽樣權(quán)數(shù).樣本資料見表13 和表14.

        使用表13 和表14 樣本數(shù)據(jù),按照式(31)和(32),以及式(33)-(36),我們得到總體普查漏報估計(jì)值及抽樣方差.其中,質(zhì)量評估調(diào)查-A 下的普查漏報估計(jì)值及抽樣標(biāo)準(zhǔn)誤差分別為9956 人和679 人,而質(zhì)量評估調(diào)查-B 下的普查漏報估計(jì)值及抽樣標(biāo)準(zhǔn)誤差分別為8304 人和822 人.

        表14 質(zhì)量評估調(diào)查-B 樣本普查小區(qū)人口資料(人)

        5.3 普查漏報合成估計(jì)量與未匹配估計(jì)量的抽樣方差數(shù)據(jù)比較

        在對比普查漏報合成估計(jì)量與未匹配估計(jì)量估計(jì)精度之前,首先把它們估計(jì)的結(jié)果列示在表15 中,然后根據(jù)表15 進(jìn)行數(shù)據(jù)對比分析.

        表15 兩種估計(jì)量的估計(jì)值(人)

        在表15 中,從兩種普查漏報估計(jì)量的比對來看:采用質(zhì)量評估調(diào)查-A,普查漏報合成估計(jì)量提供的漏報人數(shù)及抽樣標(biāo)準(zhǔn)誤差的估計(jì)值分別為11446 人和171 人,而未匹配估計(jì)量給出的相應(yīng)估計(jì)值分別為9956 人和679 人;使用質(zhì)量評估調(diào)查-B,普查漏報合成估計(jì)量提供的漏報人數(shù)及其抽樣標(biāo)準(zhǔn)誤差估計(jì)值分別為9184 人和566 人,而依據(jù)未匹配估計(jì)量得到的估計(jì)值分別為8304 人和822 人.這表明,一方面,不論采用質(zhì)量評估調(diào)查-A,還是質(zhì)量評估調(diào)查-B,普查漏報合成估計(jì)量的漏報估計(jì)值都大于未匹配估計(jì)量給出的漏報估計(jì)值.這與后者未包括同時被普查名單和質(zhì)量評估調(diào)查名單遺漏的人口,而前者包括同時被三份名單漏報的人口有直接關(guān)系.這也是提出普查漏報合成估計(jì)量的原因之一;另一方面,在質(zhì)量評估調(diào)查-A 和-B 兩種情況下,未匹配估計(jì)量的抽樣方差大于普查漏報合成估計(jì)量,說明后者的有效性強(qiáng)于前者.從對比質(zhì)量評估調(diào)查-A 或-B 來看:無論是普查漏報合成估計(jì)量,還是未匹配估計(jì)量,采用質(zhì)量評估調(diào)查-A,所得到的抽樣標(biāo)準(zhǔn)誤差估計(jì)值,比質(zhì)量評估調(diào)查-B 的都要小一些.

        6 結(jié)論與建議

        第一,相比普查凈誤差估計(jì)及普查多報估計(jì),普查漏報估計(jì)尚未受到各國政府統(tǒng)計(jì)部門及相關(guān)學(xué)者應(yīng)有的重視.建議政府統(tǒng)計(jì)部門將凈誤差估計(jì)、多報估計(jì)及漏報估計(jì)放在同等重要的位置,加強(qiáng)漏報估計(jì)基礎(chǔ)理論研究,提高普查漏報估計(jì)精度.

        第二,在判斷質(zhì)量評估調(diào)查-A 還是B 哪個更優(yōu)時,要同時考慮三個因素:是否對普查標(biāo)準(zhǔn)時點(diǎn)人口的追溯登記;資料的可得性;抽樣方差大小.質(zhì)量評估調(diào)查-A 是對普查時點(diǎn)的追溯登記,符合人口普查質(zhì)量評估的目標(biāo),抽樣方差較小,但獲取向外移動人口是否在普查時點(diǎn)登記有困難.只有在找到向外移動人口較容易的情況下,質(zhì)量評估調(diào)查-A 才優(yōu)于質(zhì)量評估調(diào)查-B.建議政府統(tǒng)計(jì)部門在構(gòu)造人口移動普查漏報合成估計(jì)量時,謹(jǐn)慎選擇質(zhì)量評估調(diào)查-A 或B.

        第三,現(xiàn)行普查漏報估計(jì)方法存在覆蓋漏報不全等缺陷.普查漏報合成估計(jì)量能夠規(guī)避這些缺陷.該估計(jì)量需要在等概率人口層建立.這需要確定對總體人口分層的變量.在每一層,先構(gòu)造全面登記的普查漏報合成估計(jì)量,再依據(jù)有限總體概率樣本數(shù)據(jù)構(gòu)造抽樣登記的普查漏報合成估計(jì)量.匯總所有等概率人口層的普查漏報合成估計(jì)量,得到省、自治區(qū)、直轄市以及全國的普查漏報合成估計(jì)量.建議政府統(tǒng)計(jì)部門在2020 年前后使用普查漏報合成估計(jì)量;研究三份名單不同統(tǒng)計(jì)關(guān)系的缺失單元漏報估計(jì)量;加強(qiáng)對總體人口分層變量選擇的研究,根據(jù)樣本規(guī)模確定最終分層變量及其數(shù)目和等概率人口層的層數(shù),盡可能減少普查漏報估計(jì)值的抽樣誤差.

        第四,普查漏報估計(jì)量替代現(xiàn)行普查漏報估計(jì)量是必然趨勢.首先,它包括了總體全部普查漏報人口.其次,它不受普查人口名單、質(zhì)量評估調(diào)查人口名單和行政記錄人口名單是否獨(dú)立的限制.再次,它理論前沿.然而這種替代需要時間.建議政府統(tǒng)計(jì)部門與高校學(xué)者合作開展人口普查質(zhì)量評估研究,尤其是前沿理論研究.

        猜你喜歡
        質(zhì)量
        聚焦質(zhì)量守恒定律
        “質(zhì)量”知識鞏固
        “質(zhì)量”知識鞏固
        質(zhì)量守恒定律考什么
        做夢導(dǎo)致睡眠質(zhì)量差嗎
        焊接質(zhì)量的控制
        關(guān)于質(zhì)量的快速Q(mào)&A
        初中『質(zhì)量』點(diǎn)擊
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        你睡得香嗎?
        民生周刊(2014年7期)2014-03-28 01:30:54
        青青草针对华人超碰在线| 午夜内射中出视频| 久久久久99精品国产片| 日韩免费高清视频网站| av人妻在线一区二区三区| 丰满熟妇乱又伦精品| 性xxxx视频播放免费| 日本口爆吞精在线视频| 久久中文字幕av一区二区不卡 | 日批视频免费在线观看| 最新亚洲视频一区二区| 天堂资源中文网| 欧洲极品少妇| 欧美日韩激情在线一区二区| 日本女优免费一区二区三区| 色多多性虎精品无码av| 欧美巨大性爽| 欧美成人a视频免费专区| 亚洲自拍偷拍一区二区三区| 尤物在线精品视频| 91精选视频在线观看| 精品亚亚洲成av人片在线观看| 国产精品成人亚洲一区| 亚洲av综合日韩| 久久亚洲午夜牛牛影视| 激情视频在线观看好大| 亚洲乱码国产乱码精品精| 两个黑人大战嫩白金发美女| 日本亚洲一级中文字幕| 日本人视频国产一区二区三区| 国产乱码一二三区精品| 一本一本久久久久a久久综合激情| 亚洲一区二区三区精彩视频| 日本a片大尺度高潮无码| 国产欧美日韩a片免费软件| 亚洲黄片高清在线观看| 亚洲最新国产av网站| 国产xxxx99真实实拍| 97久久久久国产精品嫩草影院| 国产精品亚洲一区二区三区在线看 | 日日av拍夜夜添久久免费 |