寧勐??
【中圖分類號】 F626.5 【文獻標識碼】 A 【文章編號】 2236-1879(2018)11-0176-01
雪球抽樣被廣泛地應用于定性的社會學研究中。而就目前來看,國內(nèi)學者利用滾雪球抽樣進行的研究少之又少,而國外學者已經(jīng)對滾雪球抽樣進行了十分細致的研究。國外學者對滾雪球抽樣的研究較為豐富,其研究內(nèi)容大體可以分為以下三類:
一、滾雪球抽樣的理論研究
滾雪球抽樣的概念最早是由coleman[1]在1958年提出的,他認為傳統(tǒng)的調(diào)查方法忽視了個體之間的社會結(jié)構(gòu)和聯(lián)系,即社會成員是獨立的個體,因此提出重視個體間關(guān)系的滾雪球抽樣。隨后,goodman[2]在1961針對隱藏人口提出同伴驅(qū)動的滾雪球抽樣,在文中他詳細地介紹了S階段K推薦滾雪球抽樣的定義,并討論了如何通過抽樣樣本對總體的一些特征做出推斷,他指出,在對隱藏人群進行抽樣時,滾雪球抽樣比簡單隨機抽樣更具效率。
二、結(jié)合具體案例對滾雪球抽樣進行實證性研究
Frank和Snijders提出基于伯努利概率模型使用一波滾雪球抽樣對隱藏人口規(guī)模進行估計的方法,并在此基礎(chǔ)上對格羅寧根的海洛因使用者展開實證研究,通過提供仿真結(jié)果來比較極大似然估計量、基于模型估計量、基于設(shè)計估計量以的優(yōu)缺點。結(jié)果表明,使用一波的滾雪球樣本估計總體規(guī)模是可行的,但前提是假設(shè)初始樣本即種子符合伯努利概率模型。Thompson研究了滾雪球抽樣的一個特例,采用圖形設(shè)置和空間設(shè)置的適應性種群抽樣對隱藏人群進行研究,指出圖形設(shè)置是指通過邊緣(如社交鏈接或地理鄰近度)連接的節(jié)點(例如,人物),選擇節(jié)點或邊緣為初始樣本,然后跟隨邊緣以使其他節(jié)點納入樣本。Chow提出在估計隱藏人口和難以接近的人口規(guī)模時,使用滾雪球抽樣技術(shù)才可以獲得足夠大的樣本,以此進行有效的研究,并提出利用貝葉斯估計方法能夠有效的結(jié)合先驗信息,得到未知參數(shù)的一個后驗分布,可以提高估計的有效性。當可用信息模糊時,可以使用非信息先驗并進行敏感性分析。并用此方法對科羅拉多州的毒品使用者所占的比例進行了實證研究,研究發(fā)現(xiàn)估計量對指定的先驗信息并不敏感。Spreen從一部分人口的現(xiàn)有抽樣框中抽取初始的簡單隨機樣本,然后通過雪球抽樣技術(shù)估計在抽樣框之外的人口規(guī)模。使用這種抽樣技術(shù),可以估計注冊人群之間,注冊人群與非注冊人群之間以及非注冊人群之間的平均接觸率。Christian在研究隱藏人口大小的估計問題時,發(fā)現(xiàn)在小樣本的情況下,基于漸近理論的經(jīng)典模型推導置信度的準確性是存在問題的,研究表明采用貝葉斯的方法能夠提高估計的精確度。他采用滾雪球的抽樣方法,利用貝葉斯估計分別對格羅寧根以及帕克斯塔博的三種毒品使用者的規(guī)模進行估計,結(jié)果表明當先驗分布設(shè)定為截斷的伽馬分布時,貝葉斯的估計結(jié)果具有較小的方差。Vincenty等利用實證研究表明,在低收入、種族化的社區(qū)采用滾雪球抽樣進行大規(guī)模調(diào)查的研究方案是可行的,并表明通過適當?shù)募畲胧?,可以是目標人群達到足夠的參與程度。研究發(fā)現(xiàn)增加參與者與研究人員之間的信任程度,可以提高參與度。Thompson引入了一種新的策略來估計網(wǎng)絡化人口特征。抽樣方法是基于貝葉斯數(shù)據(jù)增強過程的單波滾雪球抽樣設(shè)計,以此方法對隱藏人群進行模擬研究,結(jié)果表明,這種新的推理策略可以有效地估計人口屬性,如人口數(shù)量和與網(wǎng)絡拓撲相關(guān)的人口屬性,并且可以實現(xiàn)群體的大小和分布的有效估計。研究表明初始服從伯努利分布的樣本選擇程序中具有一定程度的穩(wěn)健性,以此降低偏離程度。
三、滾雪球抽樣與其他非概率抽樣的比較
Magnani等在研究如何對隱藏人群抽樣時,詳細介紹了滾雪球抽樣、目標抽樣、時間空間抽樣以及同伴驅(qū)動抽樣等抽樣方法,并分別說明了每個方法的優(yōu)劣。他認為,對于滾雪球抽樣,初始種子的選擇對樣本組成的影響很大,并且所獲得的樣本是有偏的,并指出諸如雪球抽樣之類的非概率抽樣方法在開發(fā)性研究和問題定義中是有用的,但并不適合在較大群體中使用。而對于目標抽樣來說,由于該方法的非隨機性,在抽樣過程中會存在選擇性偏差 ,而這種偏差取決于對種群分層的界定。對于時間空間抽樣,他認為抽樣框是隨著時間而變化的,但更新抽樣框的成本是高昂的,若在調(diào)查時缺少一些抽樣單位,會導致無法具體估計的偏差。同伴驅(qū)動抽樣是對滾雪球抽樣方法進行了修正,同伴驅(qū)動抽樣方法減少初始種子對最終樣本的影響,并且由于其的激勵制度,降低樣本偏差。Heckathorn比較了滾雪球抽樣和同伴推動抽樣的不同點,提出由于個人隱私等原因,滾雪球抽樣常常難以進行下去,而且滾雪球抽樣得到的樣本常常是有偏的,在合理假設(shè)的情況下,同伴驅(qū)動抽樣對總體作出的估計是漸近無偏的。同伴驅(qū)動抽樣由于引入了二次激勵機制在一定程度上可以解決有偏問題。Sadler等以作者個人研究為例,展示如何使用修改的滾雪球抽樣技術(shù)來改善衛(wèi)生教育計劃的推廣工作和評估健康教育干預措施的研究。并且探討了滾雪球抽樣在招募隱藏人群時的優(yōu)缺點,研究表明滾雪球抽樣技術(shù)具有省時、高效、節(jié)省成本等優(yōu)點,但其也存在估計結(jié)果有偏、沒有可靠的統(tǒng)計方法來估計樣本的“飽和度”是否達到等缺點,并提出可以結(jié)合概率抽樣與非概率抽樣的方法,來彌補非概率抽樣的缺點。
滾雪球抽樣雖然應用廣泛,它也存在一些缺點。比如,初始樣本的選擇不是隨機的,隨著抽樣過程的進行,無法得到無偏估計;抽樣過程傾向于一些愿意合作的對象,較為排斥的對象自然參與度較低;一些敏感度較高的問題,也會導致抽樣過程難以進行下去。滾雪球抽樣方法還需要不斷的探索與推廣。
參考文獻
[1] Coleman James S. Relational Analysis:The Study of Social Organizations with Survey Methods [J].Human Organization,1958(17):28-36.
[2] Goodman leo A. Snowball Sampling [J].Annals of Mathematical Statistics,1961, 32(1) : 148-170.