胡桂華,吳 婷,廖金盆,余 魯
(重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
2020年,中國、美國和其他許多國家將進(jìn)行每隔10年1次的全國人口普查。按照慣例,也將組織質(zhì)量評(píng)估抽樣調(diào)查。人口普查質(zhì)量評(píng)估的核心任務(wù)是估計(jì)人口普查覆蓋誤差[1]。覆蓋誤差進(jìn)一步分為普查凈誤差及普查多報(bào)與漏報(bào)[2]。普查凈誤差定義為普查登記人口數(shù)與目標(biāo)人口總體實(shí)際人口數(shù)之差。普查多報(bào)指普查員在普查中登記了不應(yīng)登記的人,使普查登記人口總數(shù)大于實(shí)際人口總數(shù),普查重報(bào)是普查多報(bào)中的一種,指某人在普查中被登記一次以上。普查漏報(bào)指普查員在普查中未登記應(yīng)該登記的人口,使普查人口總數(shù)低于總體實(shí)際人口總數(shù)。關(guān)于凈誤差估計(jì)的研究成果較多,而普查多報(bào)的研究成果較少,尤其是很少見到國內(nèi)外學(xué)者發(fā)表普查多報(bào)的學(xué)術(shù)性論文。本研究將起到一種示范效應(yīng),吸引更多學(xué)者研究普查多報(bào),為政府統(tǒng)計(jì)部門制訂普查多報(bào)方案提供決策建議和理論依據(jù)。
在人口普查質(zhì)量評(píng)估的歷史上,世界各國最早只是估計(jì)凈誤差。這項(xiàng)工作的關(guān)鍵是構(gòu)造目標(biāo)總體實(shí)際人口數(shù)的一個(gè)估計(jì)量[3],用普查登記人口數(shù)與之相減來求得凈誤差。由于凈誤差提供的人口普查登記質(zhì)量信息有限,為了了解人口普查工作更多、更細(xì)致的信息,人口普查多報(bào)與漏報(bào)估計(jì)問題逐漸被重視。美國普查局在2010年的人口普查質(zhì)量評(píng)估工作中,在凈誤差估計(jì)之外,增加了普查多報(bào)與漏報(bào)估計(jì)這兩個(gè)目標(biāo)[4]。聯(lián)合國統(tǒng)計(jì)司也對(duì)各國提出了這樣的建議[5]。
但是,國內(nèi)一些學(xué)者認(rèn)為研究普查多報(bào)或重報(bào)無太大意義,人口普查的多報(bào)與重報(bào)問題并不突出,相反人口普查中的漏報(bào)問題更值得研究[6]。然而事實(shí)并非如此。近10年來,擁有兩套甚至多套住房的中國人越來越多,而在不同地點(diǎn)有住房是重報(bào)的主要原因。另外中國養(yǎng)寵物的也人越來越多,其中有些人視寵物為親人,在普查表中登記寵物,造成普查多報(bào)。美國2010年普查多報(bào)10 042千人,其中重報(bào)8 522千人,其他多報(bào)1 520千人;普查漏報(bào)15 999千人,其中估算的普查人口數(shù)為5 993千人,其他漏報(bào)人口數(shù)為10 006千人[7]。這表明,普查多報(bào)和漏報(bào)都很嚴(yán)重,在剔除估算的普查人口數(shù)外,普查多報(bào)人口數(shù)比漏報(bào)人口數(shù)還要多。所謂估算的普查登記人口數(shù)是指對(duì)拒絕接受普查的家庭根據(jù)其鄰居提供的信息所估計(jì)的這類家庭的人口數(shù)。嚴(yán)格意義上來講,估算的普查人口數(shù)并不能當(dāng)作普查漏報(bào),因?yàn)樗呀?jīng)包括在最終公布的普查登記人口數(shù)中。普查漏報(bào)應(yīng)該是指既未被普查員登記又未被估算的那部分人口。除美國外,中國和其他國家的普查登記人口數(shù)中沒有包括估算的普查登記人數(shù)[8]。
在普查多報(bào)估計(jì)中,有些國家(如烏干達(dá)、南非)只構(gòu)造覆蓋全部多報(bào)的普查多報(bào)估計(jì)量(聯(lián)合國統(tǒng)計(jì)司人口普查質(zhì)量評(píng)估指南并未提及普查重報(bào))[9-10],也有些國家(如中國和加拿大)只構(gòu)造重報(bào)估計(jì)量[11-12]。中國在重報(bào)估計(jì)做法上尚有若干缺陷,例如,把樣本當(dāng)作總體、把樣本重報(bào)率當(dāng)作總體重報(bào)率、在統(tǒng)計(jì)重報(bào)人數(shù)時(shí)計(jì)數(shù)對(duì)象不明確,等等。
為了全面反映普查多報(bào),除了估計(jì)重報(bào)外,還要估計(jì)其他普查多報(bào),即使其他多報(bào)人口數(shù)為零,也要將其納入多報(bào)估計(jì)范圍,在研究報(bào)告中明示其他多報(bào)人口為零。
聯(lián)合國統(tǒng)計(jì)司及所有國家的政府統(tǒng)計(jì)部門把普查多報(bào)認(rèn)定為普查員登記了普查目標(biāo)總體之外的人。實(shí)際上,這樣表述不夠嚴(yán)密。應(yīng)該說,普查多報(bào)包括對(duì)普查目標(biāo)總體之外的人所做的登記,以及對(duì)普查目標(biāo)總體的人所做的重復(fù)登記這兩個(gè)部分。也就是說,不應(yīng)把對(duì)普查目標(biāo)總體的人所做的重復(fù)登記叫做目標(biāo)總體之外的登記。
關(guān)于普查多報(bào)估計(jì),還涉及到一個(gè)位置登記錯(cuò)誤的問題[13]。許多國家在普查多報(bào)估計(jì)中,要求一個(gè)人登記在所屬的普查小區(qū)內(nèi),否則認(rèn)定位置登記不正確,作為普查多報(bào)處理。這種處理辦法會(huì)導(dǎo)致普查多報(bào)數(shù)目虛增。是否把位置登記錯(cuò)誤視作普查多報(bào),要看登記位置是否在研究范圍內(nèi)。如果研究范圍是全國,那么登記在全國任何一個(gè)地方都不應(yīng)記為多報(bào)。如果研究范圍是重慶市,那么應(yīng)該在重慶市登記的某人登記在該市任何區(qū)域都不應(yīng)記為多報(bào),但如果該人登記在四川省,則應(yīng)記為重慶市的漏報(bào);如果研究范圍是重慶市和四川省,這個(gè)人不應(yīng)記為多報(bào)。在2010年普查多報(bào)估計(jì)中,美國規(guī)定,一個(gè)人只要登記在質(zhì)量評(píng)估調(diào)查研究范圍內(nèi),即認(rèn)定為位置登記正確,在沒有其他登記錯(cuò)誤的情況下,認(rèn)定其為普查正確登記。這一規(guī)定避免了登記位置問題導(dǎo)致的多報(bào)估計(jì)錯(cuò)誤。
本文的創(chuàng)新主要有以下三個(gè)方面:第一,給出了普查多報(bào)及其中的普查重報(bào)的明確定義。解決了目前多報(bào)、重報(bào)統(tǒng)計(jì)中由于定義不明、界限不清導(dǎo)致的錯(cuò)誤。第二,明確規(guī)定了普查重報(bào)的兩種估計(jì)對(duì)象。解決了目前重報(bào)統(tǒng)計(jì)結(jié)果含義不明確的問題。第三,采用泰勒擴(kuò)張抽樣方差估計(jì)量,近似計(jì)算多報(bào)或重報(bào)估計(jì)量的抽樣方差,從而規(guī)范了普查多報(bào)及重報(bào)估計(jì)量的抽樣方差計(jì)算。
普查多報(bào)包含兩個(gè)部分:第一部分,屬于普查目標(biāo)人口總體的人員進(jìn)行了兩次或更多次普查登記,將他們進(jìn)行普查登記的次數(shù)減1所得結(jié)果記作重復(fù)性普查多報(bào)(簡稱普查重報(bào));第二部分,不屬于普查目標(biāo)人口總體的個(gè)體(例如,普查標(biāo)準(zhǔn)時(shí)點(diǎn)之前死亡的人口、普查標(biāo)準(zhǔn)時(shí)點(diǎn)之后出生的人口、虛構(gòu)的人口,等等)進(jìn)行了普查登記,將他們進(jìn)行普查登記的次數(shù)記做其他普查多報(bào)。這里特別要注意,如果一個(gè)不屬于普查目標(biāo)總體的個(gè)體進(jìn)行了不止一次普查登記,須將其進(jìn)行普查登記的次數(shù)全部計(jì)為其他普查多報(bào),而不應(yīng)計(jì)為普查重報(bào)。
對(duì)普查重報(bào)估計(jì)問題,有兩種估計(jì)對(duì)象。一是估計(jì)重復(fù)性普查重報(bào)人數(shù)。二是估計(jì)發(fā)生普查重報(bào)人數(shù)。對(duì)前者,將屬于普查目標(biāo)總體的某個(gè)人在普查中登記的總次數(shù)減1,作為其重復(fù)性普查重報(bào)人數(shù)。對(duì)后者,只要某人在普查中登記一次以上,就將其作為發(fā)生普查重報(bào)人口,重報(bào)次數(shù)計(jì)為1,而不考慮其實(shí)際登記的次數(shù)。目前加拿大在普查重報(bào)估計(jì)中采用第一種估計(jì)對(duì)象,其目的是為了修正普查登記總?cè)藬?shù)。
人口普查多報(bào)、重報(bào)估計(jì)理論包括下列四項(xiàng)內(nèi)容:抽樣設(shè)計(jì)、樣本數(shù)據(jù)采集、普查多報(bào)估計(jì)方法、估計(jì)量構(gòu)造及估計(jì)量方差的估計(jì)[14-16]。
在人口普查質(zhì)量評(píng)估抽樣調(diào)查中,各國政府統(tǒng)計(jì)部門采取的抽樣方法通常是分層整群抽樣、分層多階段抽樣、分層多重抽樣。用于分層的標(biāo)志通常是城鄉(xiāng)或抽樣單位的規(guī)模。以中國為代表的發(fā)展中國家主要采用分層整群抽樣,為更好地服務(wù)于中國政府的需要,本文采用分層整群抽樣方法抽取以普查小區(qū)為抽樣單位的樣本。
在抽取樣本普查小區(qū)后,收集每個(gè)樣本小區(qū)的普查人口登記名單,進(jìn)行入戶現(xiàn)場(chǎng)調(diào)查編制質(zhì)量評(píng)估調(diào)查人口登記名單。識(shí)別樣本小區(qū)普查多報(bào)或重報(bào)人口的方法有4種。第一,檢查樣本小區(qū)的普查人口登記名單,看是否存在普查日后出生的人、普查日前死亡的人、狗和其他寵物以及重復(fù)登記的人。第二,在進(jìn)行入戶現(xiàn)場(chǎng)調(diào)查編制質(zhì)量評(píng)估調(diào)查人口登記名單時(shí)查明是否存在同一人同時(shí)在兩個(gè)地點(diǎn)進(jìn)行普查登記的情形。第三,對(duì)本小區(qū)普查人口登記名單中的每一個(gè)人,在全國普查人口登記名單進(jìn)行搜索,看能否找到與其相同的人,即重報(bào)人口。第四,比對(duì)樣本小區(qū)的普查人口登記名單和質(zhì)量評(píng)估調(diào)查人口登記名單,包括在本小區(qū)內(nèi)部及外部比對(duì)這兩份名單。比對(duì)的內(nèi)容是姓名、性別、年齡、文化程度、婚姻狀況等。如果某人在這兩份名單的姓名及這些特征相同或絕大部分相同,就判斷為匹配,即普查正確登記人口。如果比對(duì)結(jié)果是普查人口登記名單的某人為未匹配人口,即未在質(zhì)量評(píng)估調(diào)查人口登記名單中找到與其相同的人,就組織個(gè)人后續(xù)調(diào)查收集新信息再次比對(duì)[17]。如果利用新信息再次比對(duì)的結(jié)果仍然是普查人口登記名單的某人為未匹配人口,并且現(xiàn)場(chǎng)核實(shí)該人實(shí)際上并不存在,就判斷該人為普查多報(bào)。如果在個(gè)人后續(xù)調(diào)查期間,確認(rèn)普查人口登記名單的某人是虛構(gòu)的人,即普查日后出生的人、普查日前死亡的人,就判斷某人為多報(bào)人口。如果普查人口登記名單中的某人在比對(duì)后為未匹配,并且個(gè)人后續(xù)調(diào)查未收集到任何用于再次比對(duì)的信息,就判斷該人為普查多報(bào)人口。為便于對(duì)比對(duì)結(jié)果做出判斷,在人口普查質(zhì)量評(píng)估中,通常假設(shè)質(zhì)量評(píng)估調(diào)查人口登記名單不存在非抽樣誤差。
采用何種方法構(gòu)造普查多報(bào)估計(jì)量要考慮兩個(gè)因素。第一個(gè)因素是樣本普查小區(qū)的普查多報(bào)人口的數(shù)目。第二個(gè)因素是普查登記分類的詳細(xì)程度。發(fā)展中國家和絕大多數(shù)發(fā)達(dá)國家通常將普查登記分為普查正確登記和普查多報(bào)登記。美國普查局將普查登記分為普查正確登記、普查多報(bào)登記、位置錯(cuò)誤的普查登記、不足比對(duì)信息的普查登記及未數(shù)據(jù)定義人口(最多只登記姓名及一個(gè)普查項(xiàng)目)的普查登記?;谏鲜鲆蛩?,選擇構(gòu)造普查多報(bào)估計(jì)量的方法。如果樣本普查小區(qū)多報(bào)人口較多,就直接依據(jù)樣本小區(qū)多報(bào)人口及其抽樣權(quán)數(shù)構(gòu)造總體普查多報(bào)估計(jì)量,即樣本多報(bào)人口的加權(quán)和。中國在2010年人口普查多報(bào)估計(jì)中采用這種方法估計(jì)常住人口多報(bào)率、現(xiàn)有人口多報(bào)率和戶籍人口多報(bào)率。美國和其他一些國家也是采用這種方法估計(jì)普查多報(bào)。如果樣本多報(bào)人口很少甚至為零,此時(shí)雖然可以算出平均每個(gè)樣本小區(qū)的普查多報(bào)人口數(shù),但這個(gè)數(shù)往往是一個(gè)很小的數(shù),用其推斷總體普查多報(bào)人口數(shù)可能嚴(yán)重失真。在這種情況下,如果普查登記分類相對(duì)簡單,就從普查登記人口數(shù)估計(jì)量中剔除普查正確登記人口數(shù)估計(jì)量,得到普查多報(bào)估計(jì)量。本文采用這種方法構(gòu)造普查多報(bào)估計(jì)量。如果普查登記分類詳細(xì),就從普查登記人口數(shù)估計(jì)量中減去普查目標(biāo)總體人口數(shù)估計(jì)量,得到普查多報(bào)估計(jì)量。其中,普查目標(biāo)總體人口數(shù)估計(jì)量為“總體普查信息登記完整人口數(shù)”乘以“普查目標(biāo)總體人口數(shù)線性估計(jì)量或普查信息登記完整人口數(shù)線性估計(jì)量”。普查信息登記完整是指登記了全部普查項(xiàng)目。
1.總體普查多報(bào)率估計(jì)量。構(gòu)造總體(全國、省等)普查多報(bào)比率估計(jì)量的目的是使不同國家或同一國家不同時(shí)期的普查多報(bào)估計(jì)結(jié)果具有可比性。中國和其他國家的政府統(tǒng)計(jì)部門出于保密考慮只對(duì)外發(fā)布普查多報(bào)率(對(duì)內(nèi)提供普查多報(bào)人數(shù)及多報(bào)率),其公式為:
(1)
討論式(1)E名單j人的普查正確登記概率Pce,j在不同情形下的計(jì)算方法。首先,如果有信息證明一個(gè)人在普查中正確登記,那么其正確登記概率為1;其次,如果有證據(jù)顯示一個(gè)人是普查錯(cuò)誤登記,那么其正確登記概率為零;再次,如果沒有收集到證明某人是普查正確登記還是普查錯(cuò)誤登記的信息,那么其正確登記概率需要估計(jì)。如果E名單中的每一個(gè)人都是正確登記,那么估計(jì)的普查正確登記人數(shù)等于估計(jì)的普查登記人數(shù)。
(2)
(3)
(4)
(5)
2.總體普查重報(bào)率估計(jì)量。它為重報(bào)人口數(shù)與普查登記人口數(shù)之比:
(6)
(7)
(8)
4.總體和區(qū)域的普查多報(bào)率及重報(bào)率的抽樣方差估計(jì)量。在構(gòu)造普查多報(bào)率或重報(bào)率估計(jì)量后,還要建立其抽樣方差估計(jì)量。式(1)、式(6)、式(7)和式(8)屬于復(fù)雜估計(jì)量,抽樣方差通常使用分層刀切估計(jì)量或泰勒擴(kuò)張估計(jì)量計(jì)算[18]。分層刀切估計(jì)量優(yōu)勢(shì)是容易理解,在西方國家政府統(tǒng)計(jì)部門組織的人口普查質(zhì)量評(píng)估中應(yīng)用廣泛。中國國家統(tǒng)計(jì)局迄今尚未使用分層刀切估計(jì)量構(gòu)造重報(bào)率的抽樣方差估計(jì)量。然而,分層刀切估計(jì)量也有明顯的缺陷,即樣本普查小區(qū)復(fù)制權(quán)數(shù)及總體參數(shù)估計(jì)量的復(fù)制估計(jì)量的計(jì)算量大。復(fù)制次數(shù)等于第一重樣本小區(qū)數(shù)目。每復(fù)制1次,就要計(jì)算一組第一重樣本普查小區(qū)的復(fù)制權(quán)數(shù),以及據(jù)此計(jì)算一組總體參數(shù)復(fù)制估計(jì)量。在大規(guī)模人口普查質(zhì)量評(píng)估抽樣調(diào)查中,第一重樣本規(guī)模通常很大。泰勒擴(kuò)張方法能夠避免分層刀切估計(jì)量的缺陷,計(jì)算量減少許多,尤其是對(duì)比率估計(jì)量的計(jì)算量減少更加明顯。采用泰勒擴(kuò)張估計(jì)量計(jì)算式(1)、式(6)、式(7)和式(8)的抽樣方差為:
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
/nh。
1.樣本資料。實(shí)證調(diào)查范圍為重慶市南岸區(qū),實(shí)證調(diào)查時(shí)間為2000年11月1日。數(shù)據(jù)來源于美國明尼蘇達(dá)大學(xué)人口中心于1995年建立的IPUMS普查微觀數(shù)據(jù)庫[19]。從1995年到2017年年底,IPUMS數(shù)據(jù)庫收集了中國、美國、白俄羅斯、印度、英國等85個(gè)國家的政府統(tǒng)計(jì)部門的約6.77億人在301次人口普查中的微觀個(gè)人記錄(迄今117個(gè)國家與IPUMS簽訂了合作備忘錄)。該數(shù)據(jù)庫用于科學(xué)研究與教育研究,用戶在簽訂數(shù)據(jù)使用協(xié)議后,可以免費(fèi)使用數(shù)據(jù)。中國國家統(tǒng)計(jì)局在1982年、1990年和2000年向IPUMS提供1%樣本普查微觀數(shù)據(jù)。我們從該數(shù)據(jù)庫獲得了2000年重慶市南岸區(qū)1%街道或鎮(zhèn)(層)小區(qū)的普查個(gè)人資料。樣本采取分層整群抽樣法抽取,抽樣單位為普查小區(qū),樣本小區(qū)單位答復(fù)率為100%。樣本資料如表1和表2。
表1 2000年重慶市南岸區(qū)街道或鎮(zhèn)的普查小區(qū)及其樣本
表2 樣本小區(qū)普查登記結(jié)果
2.總體和區(qū)域的普查多報(bào)率及重報(bào)率計(jì)算。根據(jù)式(1)、式(6)、式(7)和式(8)及表2樣本數(shù)據(jù),得到總體及各個(gè)區(qū)域(在這里指每一層)普查多報(bào)的估計(jì)結(jié)果,具體見表3。
從表3可以看出:第一,估計(jì)的總體普查多報(bào)人數(shù)為9 795人,即估計(jì)的普查登記人口數(shù)589 670人與估計(jì)的普查正確登記579 875之差,估計(jì)的總體普查多報(bào)率為1.66%,即估計(jì)的普查多報(bào)人數(shù)與估計(jì)的普查登記人數(shù)之比,估計(jì)的總體重報(bào)5 990人,即在普查登記中有5 990人被重復(fù)登記過,估計(jì)的總體重報(bào)率1.02%,即估計(jì)的重報(bào)人數(shù)5 990人與估計(jì)的普查登記人口數(shù)589 670人之比;第二,從每一層(區(qū)域)來看,海棠溪街道的普查多報(bào)率最高(2.17%),說明該街道普查多報(bào)問題最為嚴(yán)重,而銅元局街道的重報(bào)率最高(1.48%),表明該街道重報(bào)最為嚴(yán)重。第三,各層的普查多報(bào)率及重報(bào)率差異較大,表明各層的普查登記質(zhì)量不同。
表3 總體及各層普查多報(bào)及重報(bào)估計(jì)值
3.總體普查多報(bào)率及重報(bào)率的抽樣方差計(jì)算。在得到了普查多報(bào)率及重報(bào)率估計(jì)值后,利用式(17)~式(20),以及表1、表2和表3數(shù)據(jù),計(jì)算式(1)、式(6)、式(7)和式(8)的抽樣方差估計(jì)值。計(jì)算結(jié)果為:總體普查多報(bào)率1.66%(即每100人中有1.66個(gè)人不應(yīng)該在普查中登記)的抽樣標(biāo)準(zhǔn)誤差為0.000 813 14(0.000 000 661 20的平方根),而總體重報(bào)率1.02%(即每100人中有1.02人在普查中重復(fù)登記過)的抽樣標(biāo)準(zhǔn)誤差為0.039 2(0.001 536 641的平方根)。需要了解抽樣誤差計(jì)算內(nèi)容的讀者請(qǐng)和作者聯(lián)系。
4.區(qū)域的普查多報(bào)率及重報(bào)率及抽樣方差計(jì)算。使用式(7)和式(8),以及式(19)和式(20)計(jì)算區(qū)域的普查多報(bào)率及重報(bào)率,以及它們的抽樣標(biāo)準(zhǔn)誤差。計(jì)算結(jié)果為:銅元局街道的普查多報(bào)率及普查重復(fù)率的估計(jì)值分別為1.68%和1.48%,其抽樣標(biāo)準(zhǔn)誤差分別為0.001 184 900和0.003 282 970,即估計(jì)的多報(bào)率及重報(bào)率分別與其實(shí)際平均相差0.118%和0.328%。在概率把握程度為95.45%情況下,銅元局街道普查多報(bào)率及重報(bào)率所在置信區(qū)間分別為1.269%~1.916% 和0.824%~2.136%。無論是銅元局街道,還是南岸區(qū)街道總體,普查多報(bào)率的估計(jì)精度均高于普查重報(bào)率。這表明,在不考慮非抽樣誤差的情況下,樣本對(duì)普查多報(bào)率指標(biāo)有更好的代表性。所有國家在人口普查質(zhì)量評(píng)估中所估計(jì)的不同指標(biāo)的估計(jì)精度均存在差異。
應(yīng)該充分重視普查多報(bào)及重報(bào)調(diào)查。認(rèn)為普查多報(bào)或重報(bào)研究意義不大這一觀點(diǎn)不僅與現(xiàn)實(shí)相違背,而且會(huì)阻礙普查多報(bào)估計(jì)理論發(fā)展,對(duì)人口普查質(zhì)量評(píng)估工作造成困擾。
估計(jì)普查多報(bào)率及重報(bào)率需要解決三個(gè)問題。一是普查登記位置與普查多報(bào)人口認(rèn)定的關(guān)系;二是重報(bào)者正確登記概率的估計(jì);三是重報(bào)率的估計(jì)。對(duì)第一個(gè)問題,為了避免普查多報(bào)人口虛增,只要某人在普查中登記在質(zhì)量評(píng)估調(diào)查研究范圍內(nèi),并且未發(fā)現(xiàn)其他登記錯(cuò)誤,就當(dāng)作普查正確登記。對(duì)第二個(gè)問題,如果沒有收集到重報(bào)人口的哪個(gè)記錄是基本記錄(普查正確登記),哪個(gè)記錄是重復(fù)記錄,就采取簡單算術(shù)平均法計(jì)算正確登記概率。如果收集了相關(guān)信息,就根據(jù)信息決定重報(bào)人口的正確登記概率為1或零。對(duì)第三個(gè)問題,用估計(jì)的在普查中重復(fù)登記過的人數(shù)除以普查登記總?cè)丝跀?shù),得到重報(bào)率估計(jì)值。建議中國在2020年普查多報(bào)估計(jì)中將多報(bào)認(rèn)定區(qū)域由目前的普查小區(qū)擴(kuò)大到全國各省份,對(duì)多報(bào)中的重報(bào)人口引入正確登記概率變量。
普查登記中不只會(huì)發(fā)生重報(bào),還會(huì)發(fā)生其他普查多報(bào)。如果普查多報(bào)估計(jì)量只是包括重報(bào),必然低估普查多報(bào),掩蓋本次普查登記中的其他問題。為了全方位、多角度研究普查多報(bào),應(yīng)當(dāng)分別估計(jì)普查多報(bào)率、重報(bào)率、其他多報(bào)率。中國自1982年起只估計(jì)重報(bào)率,建議中國政府在2020年構(gòu)造普查多報(bào)率估計(jì)量、重報(bào)率估計(jì)量和其他多報(bào)率估計(jì)量。
普查多報(bào)估計(jì)的對(duì)象既可以是全國的總?cè)丝诩安煌悇e人口,也可以是省、自治區(qū)、直轄市的總?cè)丝诩邦悇e人口。中國在每次人口普查質(zhì)量評(píng)估工作中只是估計(jì)全國總?cè)丝诘闹貓?bào)率。建議以后將普查多報(bào)估計(jì)對(duì)象擴(kuò)大到全國各省份的城鄉(xiāng)人口、不同文化程度人口、不同民族人口。為提高不同區(qū)域、不同類別人口普查多報(bào)率的估計(jì)精度,要確保各個(gè)區(qū)域、各類人口的樣本規(guī)模。