時 濤
(泰山醫(yī)學院統(tǒng)計學教研室,山東 泰安 271016)
美國從1790年開始就每十年普查一次,但是科技日新月異,全國性普查很有可能找到替代品。丹麥沒有普查,法國也準備取消普查。美國社區(qū)調查已經開始,而且繁式調查問卷在2000年之后就已經逐漸取消了[1]。從時間和金錢角度來考慮,抽樣調查來得更快捷和節(jié)約。而抽樣調查的一個關鍵問題就是樣本量的科學確定,即多大的樣本量才能更好的估計總體信息。
樣本量就是樣本中所包含的單位的個數(shù),即抽樣個體數(shù)。樣本量直接影響抽樣誤差、調查的費用、調查所需的時間、調查訪員的數(shù)量以及其他一些重要的現(xiàn)場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。需要多大的樣本量,這是調查管理人員必須明確的問題。
1.1要考慮的因素
影響樣本量的因素首先是估計值要求達到的精度。估計量的抽樣誤差越小,則估計值越精確。因此,隨著抽樣方差的不斷減小,估計值的精度就會逐漸提高,所需的樣本量相應也就越大。總體指標的變異程度、總體大小、樣本設計和所使用的估計量、回答率都會影響精度,從而影響樣本量。在計算樣本量的公式中,具體涉及如下幾個因素。
(1)抽樣推斷的可靠程度。要求推斷的可靠程度越高,概率度的數(shù)值越大,抽樣單位數(shù)也就要求多些;反之,則可少抽一些。
(2)總體標志變異程度。方差大,需要多抽一些;方差小,可少抽一些。
(3)極限誤差的大小。極限誤差大可以少抽些,極限誤差小則應多抽些。
(4)抽樣方法與組織方式。在相同條件下,重復抽樣需要多抽一些,不重復抽樣可少抽一些。
(5)實際調查運作的限制(人力、物力和財力的可能條件)。客戶提供的經費能支持多大的樣本?調查持續(xù)的時間有多長?需要多少訪員?能招聘到的訪員有多少?在確定調查最終所需的樣本量時,還必須考慮樣本量計算公式沒有涉及到的這些限制。
1.2精度及其影響因素
調查估計值的精度與樣本量是緊密相關的:隨著樣本量的增加,調查估計值的精度也會不斷提高,換句話說,對應估計量的抽樣方差就會不斷減少。所以,樣本量取決于調查估計值所要求的精度,而精度又受以下因素影響。
1.2.1總體的變異程度
在調查總體中,我們所研究的變量或指標隨著個人、住戶、企業(yè)或農場等的不同而不同。雖然我們不能控制這種變異性,但它的大小卻影響給定精度水平下對研究指標估計所必需的樣本量。若總體指標變異性很大,或具有所研究特征的單元數(shù)量很少,要求精確估計是很困難的,需要較大的樣本量。因此,為確定調查所需的樣本量,需要得到目標總體的研究指標變異程度的估計值。因為通常情況下變異的真值是未知的,所以需要從過去相關主題的調查或從試調查中得到它的估計。
一旦實施調查,統(tǒng)計調查機構就會認識到,如果所研究指標的實際變異程度大于確定樣本量時估計的變異程度,那么調查估計值的實際精度就會低于期望的精度。相反,如果所研究指標的實際變異程度比所估計的變異程度小,調查所得到的估計值會比預計的更精確。
為確保達到調查要求的精度,在計算樣本量時,一般對某一指標的總體變異程度采用較為保守的估計。即在實際中如果事先不知道調查中要測量指標變異程度的數(shù)據(jù),那么就假定研究指標具有最大的變異程度。例如,對于二元變量(如成數(shù)估計),一般假定總體中該變量的變異程度為最大,即假定P=0.5。
抽樣調查時,調查指標通常不止一個,指標的變異程度一般不相同。對某一指標來說足夠大的樣本,對變異程度更大的另一個指標來說可能就偏小。因此,為確保樣本量對所有的研究指標都足夠大,應該根據(jù)最大變異程度或被認為最重要的指標,來確定樣本量。
1.2.2總體大小
在樣本量確定過程中,總體所起的作用因它的大小而有所差異。對于小規(guī)模總體,它起著重要作用,而大總體對樣本量影響的作用很小。
表1 總體大小與所需樣本量(P=0.5)
表1是要求在置信度為95%下,誤差限為0.05,用簡單隨機抽樣估計P,對應總體大小所需的樣本量(取P=0.5計算)。由表1可知,為達到要求的精度水平,隨著總體大小的增加,樣本量增加的比率逐漸減小到零。對于單位數(shù)為50的調查總體,需要44個有效單位的樣本,而對兩倍于此的調查總體,并不需要將樣本量翻倍。對于N=5000或更多的調查總體,所需的樣本量快速地逼近n=400。因此對于簡單隨機抽樣,在真實總體比例是P=0.5的情況下,400份有效問卷對于大于5000的總體,已足以滿足給定的精度要求。
對于很小規(guī)模的總體,通常必須調查較大比例的樣本,以取得所期望的精度。因此在實際操作中,對小規(guī)模總體經常采用普查。
1.2.3樣本設計和估計量
計算樣本量時,通常假定采用的抽樣為簡單隨機抽樣。對于同樣大小的樣本及同一估計量,當使用復雜的樣本設計時,估計量可能比簡單隨機抽樣精確,也可能沒有簡單隨機抽樣精確。當估計值更精確時,所采用的樣本設計更為有效。如果在確定樣本量時是按簡單隨機抽樣公式計算的,那么應考慮實際使用抽樣設計的效率,需要對它進行調整。
在分層抽樣中,一方面當分層的變量與調查指標相關時,所得的估計通常比相同樣本量的簡單隨機抽樣更精確,或者至少一樣精確。另一方面,因為群內相鄰單元通常比較相似,所以整群抽樣估計的精度通常低于使用同一估計量進行估計時簡單隨機抽樣的估計值的精度。一般來說,當樣本量采用簡單隨機抽樣的計算公式,而實際使用的是更復雜的抽樣方式時,為達到給定精度所需的樣本量,應該在此基礎上乘以一個設計效應因子。設計效應是對于相等的樣本量,給定樣本設計估計量的抽樣方差對簡單隨機抽樣估計量的抽樣方差的比率。對于簡單隨機抽樣設計,設計效應等于1;對于分層抽樣設計,設計效應一般小于1;對于整群抽樣設計,設計效應一般大于1。若過去相同或相似主題的調查所用的抽樣設計與我們計劃實施的抽樣設計相同或相似,就能得到當前調查主要變量設計效應的估計值,也可以從試調查中得到設計效應的估計值。
1.2.4調查的回答率
調查回答率是用回收到的有效問卷數(shù)與計劃樣本量的比來表示的。產生無效調查問卷的原因主要有:樣本單元超出調查范圍;在住戶調查中,住宅是可居住的卻無人居住(是空的);樣本單元沒有回答。為了達到估計要求的精度,調查機構需要根據(jù)預計的回答率調整樣本量的大小,根據(jù)預計的回答率確定一個較大的樣本才可能達到精度要求。預計的回答率是依據(jù)對同一總體的小范圍的試點調查或者過去類似的調查得到的。例如,如果根據(jù)計算,初始樣本量是400,預計回答率為60%,那么樣本量就應該定為:n=400/0.60=667。
調查機構一旦與客戶確定了某一回答率,就必須盡最大努力保證達到這個回答率。如果不能達到所預期的回答率,就會影響調查結果的精度。實際回答率偏低會導致有效樣本單位數(shù)小于精度所需要的樣本單位數(shù)。
為了妥善處理無回答,并不能只簡單地增加樣本量。因為在調查中,如果拒絕回答者與回答者在所研究指標上存在顯著的差異,就會產生估計的偏誤。1936年美國雜志《文學文摘》在進行關于美國總統(tǒng)選舉的調查時,就出現(xiàn)了這方面的問題。
假設回答率是100%,在簡單隨機抽樣下,通常使用誤差限和估計量的標準差來確定所需的樣本量。例如,在調查中常用的不放回簡單隨機抽樣情況下,總體均值估計量的標準差(即抽樣平均誤差)的表達式為:
極限誤差為:
對于簡單隨機抽樣,給定成數(shù)估計p的精度,將方差p(1-p)代入公式即可。若在以往調查中可得總體成數(shù)的一個較好估計p,那么直接將它代入公式就可以得到所需的樣本量;否則可以用p=0.5,因為這時總體的方差最大。
如果抽樣不是簡單隨機的,那么在計算樣本量時,還需要對抽樣設計的設計效應B的估計值,若回答率小于100%,還需要一個回答率的估計值r。
如果調查涉及到許多研究域,并要對每一子總體確定精度要求,則可能會使總樣本量顯著增大,并可能導致樣本量超出客戶的預算和現(xiàn)有資源的承受能力。一般來說,要求估計的域越多,需要的樣本量就越大。因此需要在精度與費用之間進行折衷,以保證估計的誤差在可接受的范圍之內。通過增大每一層估計值的允許誤差,或合并其中某些域,使精度和費用達成平衡。
總之,樣本量的確定基本原則就是:精度一定條件下費用最??;費用一定條件下精度最高。
[1] 戴維S穆爾.統(tǒng)計學的世界[M].北京:中信出版社,2003:96.
[2] 馮士雍.抽樣調查理論與方法[M].北京:中國統(tǒng)計出版社,1999:24.