蔣耀萱
【摘要】對于準(zhǔn)確的人口普查的重要性不能被過分強調(diào)。隨著人口在測量過程中遇到持續(xù)不斷的問題,更多的創(chuàng)新技術(shù)被用于調(diào)整初始人口普查中的不完全統(tǒng)計。本文借助國外學(xué)者相關(guān)文獻,回顧了捕獲-再捕獲方法在人口普查中的歷史發(fā)展,以期對國內(nèi)傳統(tǒng)的人口普查質(zhì)量的提高提供策略。
【關(guān)鍵詞】人口普查;捕獲-再捕獲;質(zhì)量
引言
世界上大多數(shù)國家通過直接登記的人口調(diào)查,行政系統(tǒng)或者結(jié)合上述方法的部分或全部的混合方案,進行定期的人口普查。人口普查的質(zhì)量取決于對人口調(diào)查的覆蓋面。然而歷史的經(jīng)驗表明,實現(xiàn)高覆蓋率是相當(dāng)困難的。當(dāng)調(diào)查和普查存在相對較低的覆蓋水平時,捕獲-再捕獲方法的估計精度面臨著人口漏報的困難。近幾十年來,許多國家在進行傳統(tǒng)的人口普查時遇到了過少登記的問題,這也成為西方國家一直以來面臨的挑戰(zhàn)。
本文希望借助國外學(xué)者相關(guān)文獻,將其對捕獲-再捕獲方法在人口普查中歷史發(fā)展的研究引入到國內(nèi),以期對國內(nèi)傳統(tǒng)的人口普查計數(shù)提供經(jīng)驗,進一步提高人口普查的質(zhì)量。
一、捕獲—再捕獲方法的起源
捕獲-再捕獲估計的模型和方法起源于人口數(shù)量的測量,最早可以追溯至18世紀(jì)拉普拉斯試圖測量1786年法國的人口。但是由于其直觀的吸引力,始終在生態(tài)學(xué)上有著堅實的基礎(chǔ)。捕獲-再捕獲方法主要用于估計生態(tài)種群,Petersen(1896)和Lincoln(1930)的工作集中在用此方法估計生活在自然和野生棲息地的魚類和水禽種群的規(guī)模。1949年,Chandrasekar和Deming利用人口登記和調(diào)查將該方法應(yīng)用于出生率和死亡率的估計中,對于將捕獲-再捕獲方法用于人口測量,后來被證明是一個重大的進步,人們將其方法定名為雙系統(tǒng)估計,應(yīng)用于人口普查估計中,來調(diào)整從人口普查和事后調(diào)查中獲得的總數(shù)。
1950年美國人口普查局在人口普查中已經(jīng)開始使用一項特別的調(diào)查來測量人口普查中的誤差。但是,雙系統(tǒng)估計方法被明確使用是在1980年。通過產(chǎn)生一組事后可以被組合起來的數(shù)據(jù)得到過少登記人數(shù)的估計量,這也是第一次指出人口普查過少登記是非隨機的,并因社會階層和種族不成比例而變化。然而1980年人口普查估計量沒有調(diào)整。因為過少登記變得在政治上很重要并且不可避免,一些對普查結(jié)果存在質(zhì)疑的州政府把美國人口普查局告上法院,最初的判決有利于原告。不管怎樣,必須承認的是盡管人口普查局設(shè)置了詳細的程序,但是在大城市登記人口方面存在一些問題,這既需要統(tǒng)計上可靠,也使其成為“政治上穩(wěn)健”的要求。
二、捕獲—再捕獲方法的發(fā)展
1980年后,學(xué)者們開始意識到實現(xiàn)完全覆蓋幾乎是一項不可能的任務(wù)。他們主張用一個統(tǒng)計上更加可靠的調(diào)整方法,將實現(xiàn)“完全覆蓋”變?yōu)椤敖咏采w”。1990年的評估方案是基于人口估計和事后登記調(diào)查(PES)。PES是按照類似于以前的人口普查方式設(shè)計的,但是更加具體側(cè)重于取樣。根據(jù)1980年人口普查過少登記的分布對國家層面上的區(qū)域種族和年齡以及性別分層后,選取了國家的樣本群。Hogan(1993)認為操作上1990年事后抽樣調(diào)查是成功的且切實可行的,因為它在規(guī)定的時限內(nèi)完成了數(shù)據(jù)處理。但是,各州的同質(zhì)性假設(shè)還存在爭議。例如在加州,州登記人口數(shù)是根據(jù)對國家中不同事后抽樣層的綜合估計,但是相同的事后抽樣層可以適用于一個完全不同的州,如北卡羅萊納州。因此,發(fā)現(xiàn)該綜合調(diào)整具有的一些缺點歸因于PES沒有一個足夠大的樣本以促進對國家總量的直接估計。1990年人口普查后,人口普查進一步改進了普查估計方法。因為評估1990年人口普查時發(fā)現(xiàn)某些人口次級組更容易錯過人口普查,這就是被稱為有偏的或有差異的不完全統(tǒng)計。Hogan(1993)表明測量有差異的不完全統(tǒng)計量的唯一方法是大規(guī)模事后抽樣調(diào)查后再進行雙系統(tǒng)估計。因此,2000年的人口普查涉及一個初始的人口普查登記,緊隨其后的是一個獨立的覆蓋率測量調(diào)查。在考慮了有差異的過少登記同時也產(chǎn)生了小范圍人口估計量是相對無偏的。
據(jù)美國人口普查局在以往經(jīng)驗表明,人口普查過少登記的估計是完全可行的。一個被設(shè)計過的大規(guī)模事后調(diào)查應(yīng)該獨立于初始人口普查,這使得初始人口普查可以根據(jù)過少登記的估計進行調(diào)整,因為調(diào)查的樣本不僅有利于人口普查中漏報的估計,也有利于人口普查錯誤登記的估計。
三、總結(jié)
目前,雙系統(tǒng)估計方法,使用初始的人口統(tǒng)普查和一個事后登記調(diào)查(普查覆蓋調(diào)查)。這個調(diào)查基本上是對一個小樣本地區(qū)的人口的密集重復(fù)登記。調(diào)查的目的是為了評估普查中人口登記的優(yōu)劣,并告知過少登記、過多登記以及響應(yīng)準(zhǔn)確性的程度。雙系統(tǒng)方法的一個基本假設(shè)是,人口普查和調(diào)查過程是獨立的,當(dāng)缺乏獨立性時,將偏差引入到人口估計中。然而,沒有辦法確定偏差的程度,除非通過一些附加信息。此外,通過人為重復(fù)或錯誤發(fā)生的過多登記被認為是微不足道的。因此,一個來自三方資源(一個管理記錄系統(tǒng))的數(shù)據(jù)被提出,作為一種增大這種偏差的方式,這也是的三系統(tǒng)估計的定義,相當(dāng)于在生物種群應(yīng)用的一個三系統(tǒng)捕獲-再捕獲方法。
參考文獻:
[1]Baffour-Awuah B.Estimation of population totals from imperfect census,survey and administrative records[J].University of Southampton.2009
[2]Hogan,H.The 1990 Post-Enumeration Survey:Operations and Results[J].Journal of the American Statistical Association.1993,88:1047-1060endprint