李 勇
基于網(wǎng)上調(diào)查的科研成果可信嗎?
李 勇
本文以2016年美國(guó)總統(tǒng)大選網(wǎng)上調(diào)查和專(zhuān)業(yè)調(diào)查機(jī)構(gòu)的調(diào)查結(jié)果大相徑庭為例,說(shuō)明網(wǎng)上調(diào)查可能存在的一些局限性,并初步分析了產(chǎn)生這些局限性的統(tǒng)計(jì)邏輯。進(jìn)而認(rèn)為基于網(wǎng)上調(diào)查取得的信息用于科學(xué)研究需慎之又慎,其運(yùn)用必須滿足統(tǒng)計(jì)的基本原則。
網(wǎng)上調(diào)查 科研成果 統(tǒng)計(jì)原則
網(wǎng)絡(luò)的匿名性與虛擬性導(dǎo)致的信任缺失問(wèn)題及調(diào)查的參與率低等缺陷始終阻礙其普遍應(yīng)用。而很多社交網(wǎng)站(SNS, Social Network Sites)的實(shí)名制特性能夠增強(qiáng)被調(diào)查者的受信水平,使其更用心地作答。朱文龍等(2014)以人人網(wǎng)、騰訊QQ為例,研究了匿名調(diào)查與非匿名調(diào)查獲取科研數(shù)據(jù)的一致性問(wèn)題,得出在非敏感性量表下,兩類(lèi)調(diào)查具備完全一致性,而對(duì)于敏感性量表,兩類(lèi)調(diào)查數(shù)據(jù)不完全一致。類(lèi)似的相關(guān)研究,國(guó)內(nèi)外已有不少文獻(xiàn)。2016年10月16日,《新周刊》總主筆閆肖鋒在2016年美國(guó)總統(tǒng)大選全國(guó)選民投票還未開(kāi)始前,大膽預(yù)測(cè)民主黨候選人希拉里勝券在握。其主要依據(jù)為,專(zhuān)業(yè)調(diào)查機(jī)構(gòu)的調(diào)查比網(wǎng)上調(diào)查的樣本更具總體代表性。這引起了筆者的深思,當(dāng)下,很多科研工作者通過(guò)發(fā)放網(wǎng)絡(luò)問(wèn)卷,網(wǎng)絡(luò)在線問(wèn)答,運(yùn)用網(wǎng)絡(luò)技術(shù)收集網(wǎng)絡(luò)輿情等方法收集相關(guān)信息,然后對(duì)所獲得的信息進(jìn)行分析進(jìn)而得出結(jié)論。那基于這些網(wǎng)絡(luò)調(diào)查的科研成果真的能反映真實(shí)的狀況嗎?筆者的答案很明確,不一定。下面從此次美國(guó)總統(tǒng)大選說(shuō)起。
美國(guó)總統(tǒng)大選的全國(guó)選民投票時(shí)間為選舉年11月第1個(gè)星期一后的第1個(gè)星期二,今年則為11月8日。由于美國(guó)總統(tǒng)選舉實(shí)行選舉人團(tuán)制度, 11月8日選民投票時(shí),不僅要選舉總統(tǒng),還要選出代表50個(gè)州和首都華盛頓哥倫比亞特區(qū)的538名選舉人。美國(guó)除了緬因州和內(nèi)布拉斯加州,其他州和首都實(shí)行“勝者全得”的制度,即獲得選民票數(shù)最多者獲得該州或首都所有選舉人票。贏得270張及以上選舉人票的總統(tǒng)候選人即獲得選舉勝利。在選舉年的12月第2個(gè)星期三之后的第1個(gè)星期一,選舉人按照選民投票結(jié)果選出總統(tǒng),今年為12月19日。新當(dāng)選美國(guó)總統(tǒng)將于次年1月20日宣誓就職。2016年總統(tǒng)大選第一場(chǎng)辯論結(jié)束后,總統(tǒng)候選人希拉里和特朗普均自信滿滿地對(duì)外聲稱自己勝出。CNN發(fā)布的輿論研究公司所作的調(diào)查結(jié)果為,希拉里以約62%比27%,大勝特朗普。而各種網(wǎng)絡(luò)投票結(jié)果恰恰相反,例如Twitter上的網(wǎng)民投票結(jié)果顯示,特朗普將以62%比29%大勝。為什么會(huì)產(chǎn)生如此大的差異?專(zhuān)業(yè)調(diào)查公司對(duì)線下的登記選民作調(diào)查,通常是通過(guò)發(fā)放問(wèn)卷或電話調(diào)查。根據(jù)以往統(tǒng)計(jì),線下調(diào)查的結(jié)果,只有4.5%左右的誤差,且被調(diào)查樣本人數(shù)有時(shí)甚至少至521個(gè)。很多人質(zhì)疑,這樣的調(diào)查結(jié)果之準(zhǔn)確性怎能和網(wǎng)站幾十萬(wàn)的擬投票選民樣本的調(diào)查結(jié)果之準(zhǔn)確性相提并論?
從統(tǒng)計(jì)學(xué)來(lái)說(shuō),樣本不一定需要很大,但一定要保持樣本抽樣的隨機(jī)性,這才能保證樣本能較好地代表總體的特征。而專(zhuān)業(yè)調(diào)查公司有相對(duì)科學(xué)的抽樣調(diào)查和統(tǒng)計(jì)分析方法。例如,蓋洛普民意測(cè)驗(yàn)所(Gallup Poll)是美國(guó)最大的民意測(cè)驗(yàn)機(jī)構(gòu)。它在美國(guó)總統(tǒng)大選民調(diào)中,根據(jù)性別、年齡、受教育程度、職業(yè)、收入、信仰等標(biāo)準(zhǔn),在美國(guó)各州和首都按比例選擇調(diào)查對(duì)象,然后對(duì)調(diào)查結(jié)果加以分析并得出結(jié)論。這樣做的好處可以保證選取的樣本有較好的總體代表性。其實(shí),一個(gè)統(tǒng)計(jì)學(xué)運(yùn)用于實(shí)際民調(diào)的非常有名的案例,為1936年的美國(guó)總統(tǒng)大選。當(dāng)時(shí),競(jìng)選下一任美國(guó)總統(tǒng)的是民主黨候選人在位總統(tǒng)羅斯福和共和黨候選人蘭登。當(dāng)時(shí),美國(guó)權(quán)威雜志《文學(xué)摘要》(The Literary Digest)根據(jù)電話簿和俱樂(lè)部成員名單上記載的地址發(fā)出1000萬(wàn)封調(diào)查信,收到回信200萬(wàn)封,這么大的樣本容量在調(diào)查史上也是罕見(jiàn)的,雜志社因此花費(fèi)了大量的人力、物力。得出的調(diào)查結(jié)果是蘭登將以57%對(duì)43%的比例在總統(tǒng)大選中獲勝。而最終的選舉結(jié)果卻是羅斯福以62%對(duì)38%的顯著優(yōu)勢(shì)連任總統(tǒng)。這使《文學(xué)摘要》名譽(yù)掃地,不久后即??>科湓蚴恰段膶W(xué)摘要》抽取的樣本不是從總體(全體美國(guó)選民)中隨機(jī)抽取的。因?yàn)樵?936年,美國(guó)擁有電話和參加俱樂(lè)部的家庭都是比較富裕的家庭。1929年到1933年的世界經(jīng)濟(jì)危機(jī),使美國(guó)經(jīng)濟(jì)遭受重創(chuàng),“羅斯福新政”動(dòng)用行政手段干預(yù)市場(chǎng)經(jīng)濟(jì),損害了部分富人的利益,但廣大的美國(guó)非富人群體卻從中得到了好處。由于富人群體在全體美國(guó)選民中只占少數(shù),所以,基于調(diào)查樣本幾乎都是富人而得出的民調(diào)結(jié)果實(shí)際上已經(jīng)嚴(yán)重偏離了大多數(shù)美國(guó)人的真實(shí)選舉意愿。
社會(huì)學(xué)中有一個(gè)“二級(jí)傳播理論”,是由美國(guó)著名社會(huì)學(xué)家拉扎斯菲爾德1944年出版的調(diào)查報(bào)告《人民的選擇》中提出的。該理論的核心思想在眼下的語(yǔ)境中可理解為理念總是先從網(wǎng)絡(luò)、報(bào)刊、電視、廣播等媒介傳播到關(guān)鍵意見(jiàn)領(lǐng)袖(Key Opinion Leader,簡(jiǎn)稱KOL),然后再由這些關(guān)鍵意見(jiàn)領(lǐng)袖傳播到那些 “沉默的大多數(shù)”。而關(guān)鍵意見(jiàn)領(lǐng)袖這個(gè)概念源自營(yíng)銷(xiāo)學(xué),通常被定義為:擁有更多、更準(zhǔn)確的產(chǎn)品信息,且為群體所接受或信任,并對(duì)該群體的購(gòu)買(mǎi)行為有較大影響力的人。例如,某人購(gòu)買(mǎi)某款產(chǎn)品,并不決定于其先前看到過(guò)的該產(chǎn)品的媒體廣告,而真正促使其購(gòu)買(mǎi)的,有時(shí)僅僅可能是其周?chē)硞€(gè)關(guān)鍵意見(jiàn)領(lǐng)袖的一句話。所以網(wǎng)民在網(wǎng)上表達(dá)出來(lái)的觀點(diǎn),并不一定是左右大多數(shù)人行為選擇的觀點(diǎn),很多時(shí)候還依賴于關(guān)鍵意見(jiàn)領(lǐng)袖的中介作用。
最后引用肖鋒文章中作家余華說(shuō)過(guò)的話:一上網(wǎng),感覺(jué)中國(guó)人明天就要鬧事;一上街,感覺(jué)中國(guó)人一百年都不會(huì)鬧事。
[1]肖鋒."網(wǎng)紅"特朗普為什么突然不行了[OL].功夫財(cái)經(jīng),2016-10-16.http://news.hexun.com/2016-10-16/186436727.html.
[2]朱文龍,邵培基,方佳明.社交網(wǎng)站調(diào)查的科研數(shù)據(jù)一致性研究[J].科研管理,2014(02).
(作者單位:河南大學(xué)商學(xué)院)