王俊馨
摘要:阿根廷學(xué)者馬德普拉塔與西班牙學(xué)者雷烏斯通過對(duì)虛擬網(wǎng)絡(luò)中“難以接近”的群體的進(jìn)行研究,介紹了利用臉譜網(wǎng)進(jìn)行虛擬滾雪球抽樣的方法。在社會(huì)調(diào)查的范疇中,由于選擇偏差阻礙了科學(xué)研究的進(jìn)行,故在網(wǎng)絡(luò)中應(yīng)用新技術(shù)仍存在質(zhì)疑。為此二位學(xué)者假設(shè)使用社交網(wǎng)站可以更有效的研究“難以接近”群體。這種技術(shù)的主要優(yōu)勢(shì)在于:它可以擴(kuò)大地理范圍,便于對(duì)存在訪問障礙的個(gè)體進(jìn)行識(shí)別。因此,虛擬網(wǎng)絡(luò)中的非概率樣本的使用可以增加樣本容量,提高樣本代表性。
關(guān)鍵詞:臉譜網(wǎng);滾雪球;抽樣調(diào)查
我們不能忽視生活中人與人之間的虛擬關(guān)系。每天在網(wǎng)絡(luò)世界中都有大量的行為發(fā)生,人們?cè)诰W(wǎng)絡(luò)中表達(dá)自己關(guān)于真實(shí)世界中事件的思想、目的和看法。實(shí)際上,在許多類似貿(mào)易、金融、服務(wù)業(yè)、企業(yè)戰(zhàn)略和政治中,網(wǎng)絡(luò)都扮演著重要的角色。此外,許多不同領(lǐng)域都在實(shí)際操作中融入了這些信息技術(shù)的使用,例如學(xué)術(shù)、衛(wèi)生、金融、營(yíng)銷、工業(yè)和政治。然而,互聯(lián)網(wǎng)能否成為一種可行的科學(xué)研究工具仍然存在爭(zhēng)議。爭(zhēng)議的重點(diǎn)在于這種在線方法是不是能夠產(chǎn)生有效、可靠數(shù)據(jù)。樣本中存在的偏差引起了對(duì)其在社會(huì)研究中有用性的質(zhì)疑。
互聯(lián)網(wǎng)開辟了調(diào)查社會(huì)和行為科學(xué)的新途徑,因?yàn)樵S多科學(xué)問題所研究的一些具有代表性的目標(biāo)群體都難以在廣義范圍內(nèi)被找到。許多學(xué)者都意識(shí)到,互聯(lián)網(wǎng)為研究非隨機(jī)調(diào)查數(shù)據(jù)提供了新的機(jī)遇。特別是這些作者還列出了互聯(lián)網(wǎng)捕獲“難以接近”群體的優(yōu)勢(shì)。事實(shí)上,本文提出了分析特別是臉譜網(wǎng)這類的社交網(wǎng)站,可以幫助研究人員接觸到隱藏或難以接近的群體。馬德普拉塔與雷烏斯做出了這樣的探索性假設(shè):社交網(wǎng)站可以很好的補(bǔ)充難以接近、難以涉及群體,因?yàn)樗沟脭U(kuò)大樣本量和范圍成為可能,這正是這類研究的主要局限。因此社交網(wǎng)站成為滾雪球抽樣的適當(dāng)工具,能夠提高結(jié)果的代表性。為了驗(yàn)證這個(gè)假設(shè),他們采用虛擬在線抽樣尋找在西班牙的阿根廷籍企業(yè)家。這一目標(biāo)群體的特征是:他們中近六成都作為歐洲公民居住在西班牙。這些人不會(huì)作為阿根廷人被計(jì)入西班牙官方統(tǒng)計(jì),所以建立樣本框進(jìn)行概率抽樣是不可行的。此外,如果我們不考慮這部分“隱藏人口”,結(jié)果的代表性最終將不準(zhǔn)確。
文章討論了滾雪球抽樣和結(jié)合社交網(wǎng)絡(luò)(臉譜網(wǎng))在探測(cè)難以接近群體時(shí)的效果。臉譜網(wǎng)可以代替昂貴的程序,成為更好的數(shù)據(jù)獲取途徑。社交網(wǎng)絡(luò)抽樣的局限性大多是由于其基于網(wǎng)絡(luò)調(diào)查的形式產(chǎn)生的,但它是研究“難以接近”群體時(shí)的適當(dāng)工具,而對(duì)這個(gè)群體的研究正是傳統(tǒng)調(diào)查方法的難點(diǎn)。盡管抽樣不是隨機(jī)的,但是其地域分布仍與總體分布在統(tǒng)計(jì)上相關(guān)。在對(duì)西班牙移民企業(yè)家的研究中,使用臉譜網(wǎng)作為樣本框的主要優(yōu)勢(shì)是節(jié)約了時(shí)間和金錢,擴(kuò)大了樣本量和研究的地理范圍。事實(shí)上,在這樣對(duì)小樣本深度研究的領(lǐng)域中,虛擬抽樣技術(shù)相比一般方法能獲得更可觀的少數(shù)群體樣本量,提高了民族企業(yè)家的貢獻(xiàn)。因此我們?cè)O(shè)法減少升序方法研究中可觀察到的選擇偏差,擴(kuò)大樣本量,提高樣本代表性。
盡管二位學(xué)者展示了許多使用社交網(wǎng)絡(luò)研究難以接近群體的優(yōu)勢(shì),這種方法仍然存在局限性,尤其是虛擬網(wǎng)絡(luò)樣本。主要局限在于,臉譜網(wǎng)并不是專門為發(fā)送郵件設(shè)計(jì)的,如果同樣的消息被發(fā)送很多次,管理員就可以凍結(jié)賬戶。私人消息可以保證參與個(gè)人的隱私和協(xié)議,但是存在發(fā)送大量電子郵件的技術(shù)障礙。在我們的研究中,我們不得不使用多個(gè)電子郵件賬戶發(fā)送消息。一個(gè)選項(xiàng)是直接給每個(gè)群組的管理員發(fā)送消息,請(qǐng)求他們與群成員溝通。這樣的話會(huì)導(dǎo)致電子郵件被認(rèn)為是垃圾郵件,降低參與水平。
另一個(gè)局限性通過虛擬網(wǎng)絡(luò)接觸到的人在未來可能會(huì)消失。這種情況會(huì)影響樣本量和樣本的代表性。為此我們認(rèn)為虛擬網(wǎng)絡(luò)只能初次接觸。因此有必要的話,需要使用其他方式繼續(xù)接觸受訪者,例如電話,電子郵件或個(gè)人采訪。正如前文所討論的,由于只有一部分群體使用互聯(lián)網(wǎng),特別是使用臉譜網(wǎng),因此樣本會(huì)產(chǎn)生選擇偏差。在這種情況下,我們認(rèn)為在研究難以接近群體時(shí),這種抽樣方法盡管存在局限性但仍然是有效的。
最后,虛擬滾雪球抽樣技術(shù)隱含了半隨機(jī)選擇程序,所以不能對(duì)概括結(jié)果進(jìn)行統(tǒng)計(jì)分析。本文描述了一種擴(kuò)大難以接觸群體樣本量的方法,這種方法也可以提高響應(yīng)率和招募有效性。雖然研究者在使用這種方法進(jìn)行預(yù)測(cè)概括時(shí)必須要小心,但是這種創(chuàng)新在提高某些領(lǐng)域的理論有效性方面提供了可替換的方法。
本文并不是為了給虛擬滾雪球抽樣下最終定義。相反只是為了圍繞這個(gè)經(jīng)常被使用但是鮮少被討論的調(diào)查技術(shù)展開討論。例如招募渠道這樣的社交網(wǎng)絡(luò),有利于研究那些存在訪問障礙的問題。另外,建立與受訪者之間的信任是必不可少的。從道德和實(shí)際的角度來看,受訪者所提供的信息都應(yīng)該是受到保護(hù)的。