郭 靜 郭 巍 黃曉娟 王秀彬 翁昊藝
網(wǎng)絡(luò)規(guī)模迭加法(network scale-up method)[1-6]是一種在國外已經(jīng)被廣泛應(yīng)用的人群規(guī)模估計(jì)方法,這種方法只需要針對全人群代表性抽樣,數(shù)據(jù)的收集可以嵌入一項(xiàng)針對一般人群的調(diào)查或?qū)θ巳捍硇猿闃舆M(jìn)行調(diào)查。相對于需要針對目標(biāo)人群進(jìn)行抽樣調(diào)查的傳統(tǒng)方法,網(wǎng)絡(luò)規(guī)模迭加法更易于獲得數(shù)據(jù),花費(fèi)低且不易被察覺,近年來在敏感人群的規(guī)模估計(jì)中得到了較好的實(shí)踐應(yīng)用。
本研究旨在對網(wǎng)絡(luò)規(guī)模疊加法進(jìn)行綜合介紹,并以大學(xué)生中發(fā)生過異性性行為的人群為例,對其規(guī)模進(jìn)行估計(jì),并為該方法的進(jìn)一步推廣應(yīng)用提供理論和科學(xué)依據(jù)。
1.資料
采用分層整群隨機(jī)抽樣,從北京市88所高校中隨機(jī)抽取5所高校,在每所高校隨機(jī)抽取2個(gè)系,每個(gè)系二年級及以上隨機(jī)抽取2個(gè)班級(30人為一個(gè)班級),抽中班級中的所有學(xué)生均作為調(diào)查對象,共2005人。剔除沒有完整回答7個(gè)已知人群的記錄,剔除性別缺失的記錄,剔除年級缺失的記錄,剔除沒有完整回答對7種已知人群態(tài)度的記錄,并利用對數(shù)轉(zhuǎn)換和箱式圖對社交網(wǎng)絡(luò)規(guī)模C的異常值進(jìn)行剔除,剩余1761條記錄,即最后分析的數(shù)據(jù)庫。
2.概念界定
(1)敏感人群:一般是指社會上的一些具有某種敏感特征的人群組合,本研究中設(shè)置了兩個(gè)敏感人群,即:“發(fā)生過異性性行為的男生”和“發(fā)生過異性性行為的女生”。
(2)已知人群:已知其規(guī)模大小的人群,本次研究選取了在校大學(xué)生中的少數(shù)民族、來自港澳臺地區(qū)、來自山東省、來自河南省、留學(xué)生、中共黨員和過去1年發(fā)生意外事故(車禍,溺水等)的人數(shù),共7個(gè)已知人群。已知人群規(guī)模數(shù)據(jù)來自北京市教委。
(3)認(rèn)識:本研究中的認(rèn)識界定為北京市的在校大學(xué)生,看到對方或?qū)Ψ降拿只蚓b號時(shí)能認(rèn)出對方,最近兩年內(nèi)與其有過接觸(包括見面、聚會、通過電話網(wǎng)絡(luò)等方式聯(lián)系既往已經(jīng)見過面的人,不包括素未謀面的網(wǎng)友)。
3.分析方法
網(wǎng)絡(luò)規(guī)模迭加法估計(jì)人群規(guī)模步驟可分為兩步:第一步是通過調(diào)查數(shù)據(jù)估計(jì)社交網(wǎng)絡(luò)規(guī)模C值;第二步是通過已得到的C值估算目標(biāo)(未知)人群規(guī)模。
(1)社交網(wǎng)絡(luò)規(guī)模C值的估計(jì)和校正:采用反向預(yù)測法對C進(jìn)行估計(jì),依次從已知人群中剔除一個(gè)已知人群,利用其他已知人群估計(jì)得到C值,反推被剔除的已知人群的規(guī)模。保留反向預(yù)測值與實(shí)際值的比值在0.2~6.0之間的已知人群作為計(jì)算C值的人群;并利用大學(xué)生人口學(xué)特征對C值進(jìn)行校正。
(2)敏感人群規(guī)模校正:調(diào)查對象對敏感問題的接受程度會對其認(rèn)識敏感人群的規(guī)模造成影響,以不同認(rèn)可度水平調(diào)查對象社交網(wǎng)絡(luò)規(guī)模平均值除以中等認(rèn)可度水平社交網(wǎng)絡(luò)規(guī)模平均值所得到的權(quán)重對數(shù)據(jù)進(jìn)行校正。權(quán)重較正系數(shù)的公式如下所示:
(3)本研究利用EpiData建立數(shù)據(jù)庫,采用SAS統(tǒng)計(jì)軟件進(jìn)行分析,不同特征大學(xué)生社交網(wǎng)絡(luò)規(guī)模比較采用秩和檢驗(yàn)。
1.一般情況
最終納入分析的1761名調(diào)查者中(初始納入1776人,經(jīng)過一系列檢驗(yàn)后最終納入1761人進(jìn)行分析,具體過程見后“社交網(wǎng)絡(luò)規(guī)模的估計(jì)和校正”部分),男生有764名,占總體的43.38%,女生有997名,所占比例為56.62%。從年級來看,大二學(xué)生所占比例最大,共有668個(gè)樣本,占總體的37.93%;大三學(xué)生642個(gè),占總體36.46%,大四學(xué)生所占比例最小,共有451個(gè)樣本,占總體的25.61%。從專業(yè)特色來看,醫(yī)學(xué)類院校和理工類院校的樣本量相對較大,分別占總體21.35%和21.24%;藝術(shù)類院校的323個(gè)樣本相對較小,占總體18.34%;其余為文科類院校338個(gè),占19.19%;體育類院校350個(gè),占19.88%。
2.社交網(wǎng)絡(luò)規(guī)模的估計(jì)和校正
本研究選取了在校大學(xué)生中的少數(shù)民族、來自港澳臺地區(qū)、來自山東省、來自河南省、留學(xué)生、中共黨員(包括預(yù)備黨員)和過去1年發(fā)生意外事故(車禍,溺水等)共7個(gè)已知人群,并從北京市教委獲取以上人群的規(guī)模數(shù)據(jù)。
(1)粗估計(jì)值:以7個(gè)已知人群估計(jì)的個(gè)人社交網(wǎng)絡(luò)規(guī)模的均值為98人,中位數(shù)為57人。
(2)C值的校正:利用反向預(yù)測的方法評價(jià)C值估計(jì)結(jié)果的穩(wěn)定性,以反向預(yù)測值和實(shí)際數(shù)據(jù)的比值在0.2~6.0之間作為標(biāo)準(zhǔn),確定用于最終分析的已知人群。各人群反向預(yù)測結(jié)果見表1。
表1 反向預(yù)測的已知人群規(guī)模
第7個(gè)已知人群“過去1年發(fā)生意外事故”的預(yù)測規(guī)模與實(shí)際規(guī)模的比值97.97超出標(biāo)準(zhǔn),故將其剔除。
剩余6個(gè)已知人群,再次利用其他5個(gè)已知人群估計(jì)剩余的第6個(gè)已知人群的規(guī)模。結(jié)果顯示,反向預(yù)測值與實(shí)際數(shù)據(jù)的比值在0.21~5.76之間,說明剩下的6個(gè)已知人群基本符合已知人群的篩選標(biāo)準(zhǔn),該6個(gè)人群作為最終計(jì)算社交網(wǎng)絡(luò)規(guī)模的已知人群。
(3)C值的分布、異常值處理:根據(jù)篩選出的6個(gè)已知人群,重新計(jì)算社交網(wǎng)絡(luò)規(guī)模,結(jié)果顯示C值呈右偏態(tài)分布,對C值進(jìn)行對數(shù)轉(zhuǎn)換并利用箱式圖進(jìn)行異常點(diǎn)診斷,刪除異常值,最終確定納入分析的調(diào)查對象為1761人。利用6個(gè)人群1761名調(diào)查對象計(jì)算大學(xué)生的社交網(wǎng)絡(luò)規(guī)模,并根據(jù)北京市大學(xué)生的人口學(xué)特征(專業(yè)、年級)對其社交網(wǎng)絡(luò)規(guī)模進(jìn)行校正,經(jīng)過逐步校正后的社交網(wǎng)絡(luò)規(guī)模C的均值97人,中位數(shù)55人,標(biāo)準(zhǔn)差109。利用上述方法對C值進(jìn)行逐步調(diào)整的結(jié)果如表2。
表2 社交網(wǎng)絡(luò)規(guī)模C逐步校正結(jié)果
(4)大學(xué)生社交網(wǎng)絡(luò)規(guī)模比較:不同性別大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異無統(tǒng)計(jì)學(xué)意義;不同年級大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義,大三學(xué)生的社交網(wǎng)絡(luò)規(guī)模最大,大四及以上學(xué)生社交網(wǎng)絡(luò)規(guī)模最小。不同專業(yè)大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義,其中藝術(shù)類大學(xué)生社交網(wǎng)絡(luò)規(guī)模最大,醫(yī)學(xué)類大學(xué)生社交網(wǎng)絡(luò)規(guī)模最小,其余三類大學(xué)生社交網(wǎng)絡(luò)規(guī)模居中(見表3)。
3.敏感人群規(guī)模和校正:
(1)人群規(guī)模初步估計(jì):利用6個(gè)已知人群計(jì)算得到大學(xué)生社交網(wǎng)絡(luò)規(guī)模C的均值為97人,并計(jì)算北京市在校大學(xué)生有異性性伴的學(xué)生規(guī)模和比例(見表5)。
(2)人群規(guī)模校正: 調(diào)查對象對待每個(gè)已知人群都有5種態(tài)度:非常愿意、比較愿意、像一般同學(xué)一樣對待、不太愿意、非常不愿意。以態(tài)度作為分組標(biāo)志,采用秩和檢驗(yàn)比較不同態(tài)度學(xué)生的社交網(wǎng)絡(luò)規(guī)模,結(jié)果顯示不同態(tài)度學(xué)生的網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義(P<0.01)。因此在初步估計(jì)北京市在校大學(xué)生性行為發(fā)生規(guī)模和比例后,計(jì)算其校正系數(shù)(見表4),在此系數(shù)基礎(chǔ)上重新估計(jì)北京市在校大學(xué)生性行為發(fā)生規(guī)模和比例(見表5)。
表3 不同特征大學(xué)生社交網(wǎng)絡(luò)規(guī)模及比較
表4 已知人群和未知人群的態(tài)度1校正系數(shù)
表5 校正前后人群規(guī)模比較
結(jié)果顯示,北京市在校大學(xué)生中有異性性伴的大學(xué)生占總體比例為13.74%(2011年北京市在校大學(xué)生共819368人,其中女生409048人,男生410320人),其中男生比例為13.84%,女生比例為13.62%。
本次研究證明,運(yùn)用反向預(yù)測法得到的已知人群規(guī)模與運(yùn)用網(wǎng)絡(luò)規(guī)模迭加法得到的規(guī)模大體一致,并且計(jì)算得到的敏感人群規(guī)模與已有相關(guān)研究結(jié)果相似[7-8],說明了運(yùn)用網(wǎng)絡(luò)規(guī)模迭加法計(jì)算社交網(wǎng)絡(luò)規(guī)模和敏感人群規(guī)模的可信性。
研究結(jié)果顯示北京市在校大學(xué)生的社交網(wǎng)絡(luò)規(guī)模C值呈偏態(tài)分布,與國內(nèi)外研究中C值的分布情況一致[9-11]。關(guān)于社交網(wǎng)絡(luò)規(guī)模的描述是用均數(shù)還是中位數(shù),目前沒有確定性的建議,本研究給出了兩個(gè)參數(shù)的估計(jì)值。不同性別、學(xué)校和年級學(xué)生的社交網(wǎng)絡(luò)規(guī)模存在差異,其分布差異可以從他們的身份特點(diǎn)上得到合理的解釋。本研究樣本理科和醫(yī)學(xué)生比例較高,而其社交網(wǎng)絡(luò)規(guī)模C值較低,為了排除樣本構(gòu)成對結(jié)果的影響,用北京市大學(xué)生的人口學(xué)特征進(jìn)行了校正,結(jié)果更為準(zhǔn)確和可信。
已知人群的選擇將對網(wǎng)絡(luò)規(guī)模迭加法的運(yùn)用產(chǎn)生極大的影響,繼而影響社交網(wǎng)絡(luò)規(guī)模和未知人群規(guī)模的計(jì)算。所以,在網(wǎng)絡(luò)規(guī)模迭加法的運(yùn)用中,要慎重選擇已知人群。一般,至少需要6個(gè)已知人群,同時(shí)不能選擇規(guī)模太大或太小的人群,反向預(yù)測值與官方數(shù)據(jù)的比值在0.2~6.0之間較合適。
(同時(shí)感謝中國疾病預(yù)防控制中心性艾中心對于本次研究的項(xiàng)目資金支持。)
參 考 文 獻(xiàn)
1.Bernard HR,Hallett T,Iovita A,et al.Counting hard-to-count populations: the network scale-up method for public health.Sex Transm Infect,2010,86(supply 2):11-15.
2.Johnsen EC,Bernard HR,Killworth PD,et al.A social network approach to corroborating the number of AIDS/HIV+victims in the U.S.Social Networks,1995,17(3):167-187.
3.Bernard HR,Johnsen EC,Killworth PD,et al.Estimating the size of an average personal network and of an event subpopulation: some empirical results,1991,20(2):109-121.
4.Bernard HR,Killworth PD,Johnsen EC,et al.Mccarty C.Estimating the Ripple Effect of a Disaster.Connections,2001,24(2):18-22.
5.Bernard HR,Mccarty C.Scale-up method theory and history with notes,2009.
6.Killworth PD,Mccarty C,Johnscn EC,et al.Investigating the variation of personal network size under unknown error Conditions.Socio-logical Methods & Research,2006,35(1):84-112.
7.張絲艷,徐震雷.北京市四所高校大學(xué)生性行為現(xiàn)狀及相關(guān)因素調(diào)查.中國性科學(xué),2010,9(2):3-6.
8.彭彧華,沈莉.當(dāng)代大學(xué)生性行為和性態(tài)度,性知識的特點(diǎn)及關(guān)系.人口研究,2009,33(6):85-93.
9.惠珊,王璐,郭巍.網(wǎng)絡(luò)規(guī)模迭加法及其在男男性接觸者人群規(guī)模估計(jì)中的應(yīng)用.國際流行病學(xué)傳染病學(xué)雜志,2010,37(6):405-407.
10.包水蓮,吳國輝,張維,等.利用網(wǎng)絡(luò)規(guī)模迭加法估計(jì)重慶市男男性行為人群規(guī)模的研究.中華流行病學(xué)雜志,2012,33(010):1036-1039.
11.還錫萍,包水蓮,等.利用網(wǎng)絡(luò)規(guī)模迭加法估計(jì)泰州市暗娼和嫖客人群規(guī)模.中華預(yù)防醫(yī)學(xué)雜志,2013,47(3):19-21.