崔 壯,胡良平
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,天津 300070;2.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;3.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
科研方法專題
調(diào)查研究設(shè)計概述
崔 壯1,胡良平2,3*
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,天津 300070;2.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;3.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
本文目的是扼要介紹調(diào)查研究包含的主要內(nèi)容和調(diào)查設(shè)計的關(guān)鍵技術(shù)。不僅對調(diào)查研究中的調(diào)查對象、調(diào)查方法、抽樣方法、調(diào)查前準(zhǔn)備工作、調(diào)查的實施及調(diào)查過程中的注意事項進(jìn)行了宏觀概述,還對調(diào)查設(shè)計方案、實施調(diào)查過程中的關(guān)鍵技術(shù)做了簡要介紹,這些內(nèi)容可為科研工作者開展調(diào)查研究提供參考和借鑒,以期提高調(diào)查研究工作的速度、質(zhì)量和效益。
調(diào)查研究;調(diào)查設(shè)計;調(diào)查問卷;隨機(jī)抽樣;回收率;應(yīng)答率
1.1 何為調(diào)查研究
調(diào)查研究(survey research)又稱觀察性研究(Observational study),是指在未施加任何干預(yù)措施的條件下,客觀地觀察和記錄調(diào)查對象的現(xiàn)狀及其相關(guān)特征,客觀反映或呈現(xiàn)調(diào)查對象的實際情況,如了解疾病的分布、流行特征和發(fā)生、發(fā)展規(guī)律等。
在調(diào)查研究中,構(gòu)成研究總體的最基本單位稱為個體或觀察單位。將這些個體的情況匯總,可以描述由這些個體組成的群體(樣本),還可外推至這一群體所代表的更大的群體(總體)。研究者收集資料時直接詢問的對象叫做調(diào)查對象,觀察單位的屬性或特征稱為研究內(nèi)容或主題。比如,在失獨家庭養(yǎng)老問題的研究中,調(diào)查單位是失獨家庭,研究內(nèi)容是養(yǎng)老問題,調(diào)查對象是戶主。
1.2 調(diào)查對象的種類
根據(jù)調(diào)查對象的屬性或特征,調(diào)查對象大致可分為以下八種類型[1]:
(1)個人:調(diào)查研究中十分注重研究分析個人的社會角色和社會地位,并基于個人特征來描述、解釋和說明由個人行為所構(gòu)成的更大的社會群體,如調(diào)查對象為大學(xué)生[2]、農(nóng)民工等。
(2)初級社會群體:這類群體都是通過長期的、直接接觸的和相互作用而形成的,一般不是因長期的目標(biāo)而組合,如家庭[3]、鄰居、村落、非正式組織等。
(3)社會組織:這類群體是人們?yōu)榱藢崿F(xiàn)特定的目標(biāo),通過直接或間接的聯(lián)系,按照一定的規(guī)則而結(jié)成的社會共同體,如醫(yī)院[4]、工廠、公司等。
(4)社會階層:社會成員按照一定等級標(biāo)準(zhǔn)劃分為彼此地位相互區(qū)別的社會集團(tuán)。同一社會集團(tuán)成員之間的態(tài)度、行為模式和價值觀等方面具有相似性。各階層由于利益、欲望、態(tài)度、價值觀念的差異,對社會進(jìn)程的作用和影響也不盡相同。對社會階層進(jìn)行調(diào)查研究具有重要的現(xiàn)實意義。例如管理者階層、經(jīng)理人員階層、私營企業(yè)主階層、專業(yè)技術(shù)人員階層等。
(5)民族:調(diào)查研究把民族作為特定的對象,探尋其文化、生產(chǎn)和生活方式等特征,如語言、文字、風(fēng)俗習(xí)慣、心理素質(zhì)和行為方式等特點。
(6)社區(qū):是指居住在一定地域內(nèi)的人們所組成的社會共同體,可分為城市社區(qū)、農(nóng)村社區(qū)、小城鎮(zhèn)社區(qū)、城鄉(xiāng)聯(lián)合體等[5]。由社區(qū)研究一般可以進(jìn)一步拓展到對整個社會的研究,以促進(jìn)全社會的協(xié)調(diào)發(fā)展。
(7)社會行為:即人類在社會中的行為,包括各種類型的社會活動、社會關(guān)系、社會制度等。在對社會行為進(jìn)行調(diào)查研究時,具體對象不是作為主體的個人,而是側(cè)重描述各類行為本身的特征。
(8)社會產(chǎn)品:指物化的人類行為的產(chǎn)物。它們既可以作為獨立的個體調(diào)查單位,也可以作為群體調(diào)查研究單位,如學(xué)科、書籍、歌曲等[6]。
1.3 調(diào)查方法的種類
研究者應(yīng)考慮研究目的、目標(biāo)人群的可及性、經(jīng)費預(yù)算等方面,選擇不同的調(diào)查方法。調(diào)查方法可粗分為普查和抽樣調(diào)查。
1.3.1 普查
對于小規(guī)??傮w的調(diào)查,可以采用普查的方式,即對總體中的每一位個體開展調(diào)查。從理論上說,普查不存在抽樣誤差,但對質(zhì)量控制提出了更高的要求,在花費更多的時間、人力和物力的同時,有可能會出現(xiàn)漏查、重復(fù)調(diào)查等非抽樣誤差。
1.3.2 抽樣調(diào)查
一般來說,抽樣調(diào)查在研究中應(yīng)用更為普遍,從總體中抽取有代表性的一部分觀察單位組成樣本,依據(jù)樣本的調(diào)查結(jié)果對目標(biāo)總體做出估計和推斷。與普查相比,抽樣調(diào)查省時省力,能迅速獲取所需的信息,其調(diào)查量更小,調(diào)查工作更容易深入細(xì)致地開展。
1.4 抽樣方法的種類
在實際工作中,抽樣調(diào)查包括概率抽樣和非概率抽樣兩種方法[7]。
1.4.1 概率抽樣
在總體中,每個觀察單位都有被抽中的可能,每一個個體被抽中的概率都是已知或可計算的。概率抽樣具有統(tǒng)計的理論依據(jù),可計算抽樣誤差,客觀評價調(diào)查結(jié)果的精度,在抽樣設(shè)計時可對誤差進(jìn)行控制。概率抽樣包括以下幾種:
(1)簡單隨機(jī)抽樣:將抽樣框(即包含全部抽樣單位的目錄性清單)中的全部觀察單位編號,按等概率原則從總體中抽取部分個體,所有觀察單位有同等概率被抽中這是最基本的抽樣方法,也是其它抽樣方法的基礎(chǔ)。
(2)系統(tǒng)抽樣:將總體中的N個觀察單位編號排序后,確定樣本量n,令k為大于N/n的第一個整數(shù),然后在1到k之間隨機(jī)抽選整數(shù)R,以R作為第一號的觀察單位,再按編號順序等間隔(k)抽取觀察單位,即編號為R,R+k,R+2k,…,R+(n-1)k的個體入選。
(3)整群抽樣:將總體分為若干個“群”,以“群”為抽樣單位形成抽樣框,從中隨機(jī)抽取若干個“群”,將抽到群內(nèi)的所有觀察單位構(gòu)成調(diào)查樣本。群可以是自然的區(qū)劃,也可以是人為的區(qū)劃,如行政村、家庭等。整群抽樣的優(yōu)點是節(jié)省經(jīng)費,便于組織實施和控制調(diào)查質(zhì)量。但與簡單隨機(jī)抽樣相比,同一群中的個體比由整個總體中隨機(jī)選擇的個體更趨于同質(zhì),調(diào)查同一群里的個體,在一定程度上造成信息重復(fù),導(dǎo)致對總體估計的精度下降。
(4)分層抽樣:將總體中的所有觀察單位按照某種特征或標(biāo)志(如地域、職業(yè)、性別等)劃分為若干個“層”,采用簡單隨機(jī)抽樣等方法從每個層中抽取子樣本,最后將子樣本匯總起來形成樣本。
值得注意的是,當(dāng)層間變異大、層內(nèi)變異小時,分層才是最有效的。由于每層的方差通常小于整個總體的方差,分層抽樣可以提高估計的精度。但在提高精度的同時,也增加了調(diào)查的復(fù)雜程度和額外的管理成本,在抽樣前需要完整了解調(diào)查對象資料,如可分多少層、每層有多少觀察單位等。
(5)多階段抽樣:對于大規(guī)模的調(diào)查研究而言,很難通過一次抽樣產(chǎn)生完整的樣本,可以將抽樣過程分成若干階段,各階段可采用相同或不同的抽樣方法。
1.4.2 非概率抽樣
樣本的抽選不是按隨機(jī)原則進(jìn)行,不能根據(jù)樣本計算抽樣誤差,也不能從概率意義上控制誤差以及評價估計的準(zhǔn)確性,但對于特定研究、特殊人群具有一定的應(yīng)用價值,如吸毒者、同性戀人群等。常用的非概率抽樣方法包括偶遇抽樣(便利抽樣)、判斷抽樣、配額抽樣、雪球抽樣、應(yīng)答推動抽樣等[8-11]。
1.5 抽樣調(diào)查前的準(zhǔn)備工作
調(diào)查前的準(zhǔn)備工作可以理解成為實現(xiàn)調(diào)查目標(biāo)而進(jìn)行的路線選擇和工具準(zhǔn)備,也稱為調(diào)查設(shè)計階段。路線選擇是指根據(jù)調(diào)查目的進(jìn)行的調(diào)查設(shè)計工作,包括從研究思路、策略到方式、方法和具體技術(shù)的各個方面。工具準(zhǔn)備則主要是指調(diào)查所依賴的測量工具或信息收集工具的準(zhǔn)備。當(dāng)然,同時還應(yīng)考慮調(diào)查信息的來源、調(diào)查對象的選取工作。準(zhǔn)備階段主要包括三個方面的工作:調(diào)查工作的總體規(guī)劃、抽樣設(shè)計、收集資料的工具與方法[12]。
1.5.1 調(diào)查總體規(guī)劃
調(diào)查的總體規(guī)劃應(yīng)以書面的形式,形成一份調(diào)查計劃書,內(nèi)容主要包括調(diào)查目的、調(diào)查內(nèi)容和范圍、調(diào)查經(jīng)費預(yù)算和進(jìn)度安排的說明。這種計劃書有兩種主要功能:一是作為研究者開展調(diào)查研究的行動指南和整個調(diào)查研究過程的備忘錄;二是向他人說明調(diào)查研究目標(biāo)、內(nèi)容和研究的方法及可行性。為了能更有效地完成下一步的調(diào)查執(zhí)行工作,最好能在調(diào)查準(zhǔn)備階段形成一份比較詳細(xì)的調(diào)查工作流程表,對調(diào)查訪問過程中所需進(jìn)行的工作進(jìn)行分類,盡量完整地列出每一類中的工作項目,并預(yù)設(shè)各工作項目的完成期限。
1.5.2 抽樣設(shè)計
樣本的代表性決定了調(diào)查結(jié)果外推至目標(biāo)總體的可靠性和準(zhǔn)確性。為了保證抽取到一份“優(yōu)良樣本”,需要精心的抽樣設(shè)計。研究者需要認(rèn)真了解調(diào)查的目標(biāo)總體的現(xiàn)狀和結(jié)構(gòu),了解收集調(diào)查總體相關(guān)信息,了解接觸調(diào)查對象時可能存在的困難和局限,同時結(jié)合現(xiàn)實條件(包括經(jīng)費、時間、人力、關(guān)系等),選擇和確定抽取樣本的方案。
(1)選擇合適的抽樣方法。研究者要根據(jù)調(diào)查研究的目標(biāo)要求,結(jié)合自身具備的現(xiàn)實條件,設(shè)計恰當(dāng)?shù)某闃臃椒ê统绦?,獲得有最大代表性的樣本。具體抽樣方法的選擇一定要符合調(diào)查目標(biāo)的內(nèi)在要求。若一項調(diào)查研究是以了解現(xiàn)狀、描述特征為主要目標(biāo),樣本的全面性、覆蓋的范圍等因素往往是需要著重考慮的,多階段抽樣等方法的運用會相對多一些,樣本含量也要盡可能大一些;若以分析關(guān)系、解釋原因為主要目標(biāo),樣本的針對性和典型性往往是最重要的,分層抽樣、整群抽樣的運用往往會多一些,樣本含量也可以相對小一些。
(2)確定樣本含量。影響樣本含量的因素通常包括以下幾個方面:一是用樣本統(tǒng)計量推論總體參數(shù)值時的精確程度,即容許誤差的大小。在其他條件不變的情況下,精確程度越高(容許誤差越小),所要求的樣本含量越大;二是推論的把握性程度(置信度)。若需進(jìn)行差異性分析,還需考慮檢驗效能。在其他條件不變的情況下,所要求的這種把握度/檢驗效能越高,則所需要的樣本含量也越大;三是目標(biāo)總體的特征,如總體的標(biāo)準(zhǔn)差、總體率或總體相關(guān)系數(shù)等。總體標(biāo)準(zhǔn)差越大,總體率越接近0.5,總體相關(guān)系數(shù)越小,所需樣本含量越大;四是研究者擁有的人財物和時間,這些應(yīng)是決定樣本含量的客觀條件。
1.5.3 設(shè)計收集資料的工具與方法
調(diào)查研究中收集資料的一個重要前提是可以通過特殊的工具以及應(yīng)用這種工具的特定方法來實現(xiàn)對調(diào)查對象的特征、行為、態(tài)度、傾向等進(jìn)行系統(tǒng)的、客觀的、準(zhǔn)確的測量。因此,研究目標(biāo)的確定、測量指標(biāo)的選擇、調(diào)查問卷的設(shè)計、資料收集方法的制定等,就構(gòu)成了調(diào)查設(shè)計工作的另一項重要內(nèi)容。
(1)確定基本變量并使之具有可操作性。在調(diào)查設(shè)計階段,研究者一方面要依據(jù)調(diào)查研究的目標(biāo)確立最基本的研究內(nèi)容,包括研究者最關(guān)注的因變量,也包括作為解釋變量的各種自變量;另一方面,研究者既要構(gòu)建起一套需要進(jìn)行測量的指標(biāo)(operational terms)以滿足調(diào)查研究需要,又要將這些指標(biāo)細(xì)化為一系列更為具體的測量指標(biāo)(measurable indicators),以便在調(diào)查中收集相應(yīng)的資料。前一方面的工作與調(diào)查的總目標(biāo)密切關(guān)聯(lián),后一方面的工作則是為問卷設(shè)計提供指引。
(2)設(shè)計調(diào)查問卷。問卷是調(diào)查研究中用來收集數(shù)據(jù)的主要工具。問卷設(shè)計是調(diào)查設(shè)計中一項既相對獨立、同時又與調(diào)查目標(biāo)特別是內(nèi)容具體化密切相關(guān)的一項工作。問卷設(shè)計的實質(zhì)是以書面的形式將研究者希望了解的信息、希望收集的資料和希望詢問的問題編制成詢問表,以便系統(tǒng)地、客觀地、定量地收集被調(diào)查者的情況,為探討和回答研究問題收集實驗材料和數(shù)據(jù)。研究者應(yīng)該依據(jù)研究概念的框架和評價指標(biāo),并遵循和運用問卷設(shè)計的基本原則和技巧,將有關(guān)概念和測量指標(biāo)轉(zhuǎn)化為適合調(diào)查對象回答的各種具體問題。
(3)設(shè)計資料的收集方式。調(diào)查研究中的資料收集方式主要有直接觀察法和采訪法兩種,通常是將二者結(jié)合使用。直接觀察法是由調(diào)查人員到現(xiàn)場對調(diào)查對象進(jìn)行直接觀察、檢查和測量以獲取相關(guān)資料。采訪法是通過被調(diào)查者的回答來收集資料,多采用問卷調(diào)查的方式實現(xiàn),包括自填問卷法(self-administered questionnaires)和結(jié)構(gòu)訪問法(structured interview)。
自填問卷法是指調(diào)查員將問卷發(fā)送或郵寄給被調(diào)查者,然后由被調(diào)查者自行閱讀和填答,再由調(diào)查員收回資料。這種方法是調(diào)查研究中最常用的資料收集方法。
結(jié)構(gòu)訪問法是指調(diào)查員依據(jù)事先設(shè)計好的調(diào)查問卷,采用口頭詢問和交談的方式,向被調(diào)查者了解有關(guān)情況、收集有關(guān)資料的方法。研究者在調(diào)查設(shè)計階段,應(yīng)綜合考慮調(diào)查總體和調(diào)查對象的性質(zhì),調(diào)查樣本的規(guī)模大小、調(diào)查內(nèi)容的敏感程度、調(diào)查的目標(biāo)和重點、調(diào)查課題完成的時間要求、調(diào)查者擁有的人力物力是否充足等,選擇合適的資料收集方法,并做好相應(yīng)的計劃和安排,以達(dá)到最好的調(diào)查效果。
與資料收集方法的選擇有關(guān)的另一個問題是對調(diào)查過程以及調(diào)查的組織實施安排進(jìn)行考慮,包括調(diào)查人員的組織、培訓(xùn)、管理、經(jīng)費的使用、時間的安排等。同時,研究者在設(shè)計階段要對所選擇的資料收集方法在實施過程中可能遇到的各種困難、所面臨的各種障礙做好充分準(zhǔn)備,并提前設(shè)計應(yīng)對措施和處理方法。
1.6 抽樣調(diào)查的實施
調(diào)查實施階段也稱作資料收集階段或調(diào)查方案的執(zhí)行階段,就是具體貫徹調(diào)查設(shè)計中所確定的思路和策略,按照調(diào)查設(shè)計中所確定的方式、方法和技術(shù)進(jìn)行資料的收集工作。在這個階段中,調(diào)查者往往要深入實地接觸被調(diào)查者,調(diào)查工作中所投入的人力也最多。因此,需要很好地組織和管理。另外需要注意的是,由于社會現(xiàn)象的復(fù)雜性,或者由于現(xiàn)實條件的變化,事先所考慮的調(diào)查設(shè)計若在某些方面與現(xiàn)實之間出現(xiàn)偏差,需要根據(jù)實際情況進(jìn)行修正或彌補(bǔ),發(fā)揮研究者的靈活性和主動性。
1.6.1 調(diào)查的組織與實施
(1)調(diào)查員的招募。調(diào)查員往往是調(diào)查研究中資料收集工作的主要承擔(dān)者??梢酝ㄟ^登報、張貼海報或在互聯(lián)網(wǎng)上發(fā)布公告的方式公開招募調(diào)查員。招募海報或公告的內(nèi)容應(yīng)包括:調(diào)查項目的名稱及內(nèi)容簡介、調(diào)查地點和預(yù)定的調(diào)查時間、調(diào)查員的應(yīng)征條件、報名時間和方式、面試時間和地點等。對調(diào)查員的錄取,最好采取面試的方式。通過面試可以了解應(yīng)征者的背景資料,并對他們進(jìn)行初步評估,以判斷其語言表達(dá)能力和調(diào)查意愿。在調(diào)查員的招募環(huán)節(jié),尤其要依據(jù)所研究的主題、社區(qū)的性質(zhì)、被調(diào)查者的特點等因素來挑選調(diào)查員。比如從研究主題來考慮,調(diào)查有關(guān)政治、經(jīng)濟(jì)問題時,應(yīng)選擇男性調(diào)查員為主;而在調(diào)查婚姻、家庭問題時,則選擇女性調(diào)查員更合適。又如從社區(qū)的角度來考慮,所選擇的調(diào)查員最好是當(dāng)?shù)氐?、同民族、同宗教信仰的人,這樣的調(diào)查員熟悉被訪地區(qū)的風(fēng)俗習(xí)慣、文化傳統(tǒng)、語言特點等,往往能夠很順利地開展訪問調(diào)查工作。再如,從被調(diào)查者的特點來考慮,當(dāng)被調(diào)查者為青年時,應(yīng)盡量選擇青年調(diào)查員;而當(dāng)被調(diào)查對象年齡較大、資歷較深、影響力較大時,則應(yīng)選擇年齡較大的調(diào)查員。也就是說,所選的調(diào)查員在年齡、職業(yè)、社會地位等背景條件上與被調(diào)查者越接近越好。
(2)調(diào)查員的培訓(xùn)。首先,研究人員要向調(diào)查員介紹該項調(diào)查的內(nèi)容、意義、方法及其與調(diào)查項目有關(guān)的其他情況,以便調(diào)查員對該項工作有一個整體性的了解。同時,還要就調(diào)查訪問的步驟、要求、時間安排、工作量、報酬等具體問題進(jìn)行說明。其次,介紹和傳授一些基本的調(diào)查訪問技術(shù),比如如何敲門、如何自我介紹、如何取得被調(diào)查者的信任、如何盡快與被調(diào)查者建立良好的合作關(guān)系、如何客觀地提出問題、如何記錄回答等。同時,要組織調(diào)查員集中學(xué)習(xí)調(diào)查員須知、調(diào)查問卷、調(diào)查員手冊等材料,特別是要逐字逐句、逐條逐項地清楚調(diào)查問卷的內(nèi)容、填寫方法和注意事項等。最后要進(jìn)行模擬調(diào)查或訪問實習(xí)。最好是在一個小范圍內(nèi),讓每個調(diào)查員都按正式調(diào)查的要求和步驟,從頭到尾實際操作一遍。然后認(rèn)真總結(jié)模擬調(diào)查或訪問實習(xí)中存在的問題,并通過討論或講解,解決這些問題。
(3)聯(lián)系被調(diào)查者。調(diào)查的實施要求調(diào)查員與樣本中的每一位被調(diào)查者都建立暫時的聯(lián)系。如何順利地使調(diào)查員為調(diào)查對象所接受,是每一項調(diào)查研究都必須面臨和解決的問題。國外的做法是:一方面取得某種正式的或官方的允許;另一方面事先給調(diào)查樣本中的每一位對象寄一封短信,介紹即將進(jìn)行的調(diào)查項目,從而為調(diào)查員實際登門接觸被調(diào)查者打下基礎(chǔ)。結(jié)合我國情況,可以考慮以下途徑:①通過正式機(jī)構(gòu);②通過當(dāng)?shù)赜嘘P(guān)部門;③通過私人關(guān)系;④直接與被調(diào)查者聯(lián)系。
(4)調(diào)查過程的管理與質(zhì)量控制。在調(diào)查實施階段,一項重要的工作是加強(qiáng)對調(diào)查過程的管理和質(zhì)量監(jiān)控。這一工作的重點主要涉及以下幾個方面:①合理組建調(diào)查隊伍;②建立監(jiān)督和管理辦法及規(guī)定;③實地抽樣的管理和監(jiān)控;④實地訪問的管理和監(jiān)控;⑤問卷回收和實地審核的管理和監(jiān)控。
1.6.2 保證調(diào)查的回收率
調(diào)查的回收率(response rates)也稱為調(diào)查的應(yīng)答率和回答率,是調(diào)查研究過程中研究者成功完成調(diào)查詢問的個案數(shù)占計劃完成的樣本總個案數(shù)的百分比。調(diào)查研究中,研究者雖然可以通過科學(xué)的抽樣設(shè)計,達(dá)到從總體中抽取具有代表性樣本的目的,然而,這種抽樣所得到的樣本代表性并不能最終反映調(diào)查結(jié)果的代表性。在進(jìn)行調(diào)查的過程中,會有許多因素導(dǎo)致抽樣樣本中部分個案缺失或失效,使得最終完成調(diào)查樣本只是抽樣樣本的一部分?;厥章逝c調(diào)查內(nèi)容、數(shù)據(jù)收集方法和受訪者相關(guān)特征有關(guān)。因此,最好在設(shè)計時就努力設(shè)法降低無應(yīng)答率,在預(yù)調(diào)查、調(diào)查員培訓(xùn)、調(diào)查問卷設(shè)計、資料收集等環(huán)節(jié)做好準(zhǔn)備。其次,也可通過回訪和二次抽樣的方式提高回收率,并利用該子樣本對其他無應(yīng)答者進(jìn)行推斷。
1.7 實施抽樣調(diào)查過程中的注意事項
1.7.1 樣本代表性的問題
一個完美的樣本應(yīng)該是目標(biāo)總體的“縮微版本”,能反映總體的所有特征。雖然現(xiàn)實研究的復(fù)雜性使得實際幾乎不可能獲得完美樣本,但一個好的樣本應(yīng)該盡可能地再現(xiàn)總體中研究者感興趣的特征,這也是通過樣本客觀、準(zhǔn)確地推論和估計總體的根本保證。在調(diào)查研究中,圍繞著感興趣的目標(biāo)總體,通常先設(shè)定抽樣框,再從中進(jìn)行抽樣研究,這時的樣本更多地代表了抽樣總體。在理想的調(diào)查中,目標(biāo)總體和抽樣總體應(yīng)該是一致的。因此,在總體估計和統(tǒng)計推斷時,應(yīng)充分考慮抽樣框的界定、抽樣方法、選擇性偏差、應(yīng)答率等因素,客觀評價樣本的代表性。
1.7.2 抽樣方法的選擇問題
抽樣不僅僅是用部分覆蓋代替總體覆蓋,也是建立在概率論基礎(chǔ)之上的對有用統(tǒng)計信息的可靠性進(jìn)行控制和測量的科學(xué)。一個精心設(shè)計的有代表性的抽樣研究,要優(yōu)于對整個總體進(jìn)行不可靠的或有偏倚的測量。研究者應(yīng)充分考慮研究目標(biāo)、受訪者、樣本含量、實際的人力財力及時間進(jìn)度等方面,選擇簡單隨機(jī)抽樣,也可以進(jìn)行包括分層抽樣、整群抽樣、不等概率抽樣在內(nèi)的復(fù)雜多階段設(shè)計的抽樣方法,必要時也可選擇非概率抽樣的方法。
1.7.3 警惕和評估偏倚的影響
除了不可避免的抽樣誤差,要警惕選擇性偏倚、信息偏倚等對研究結(jié)果的影響。研究者應(yīng)充分考慮和評估調(diào)查研究中偏倚的影響和效應(yīng),謹(jǐn)慎推論。
如果目標(biāo)總體中具有某些特征的部分未包括在抽樣總體中,就會出現(xiàn)選擇性偏倚,它可能與研究者、調(diào)查員、調(diào)查對象有關(guān)。研究者的目標(biāo)總體設(shè)定錯誤,或者未能把目標(biāo)總體設(shè)定在抽樣框中,或者設(shè)計調(diào)查時遺漏了感興趣變量的某些特征,都會使目標(biāo)總體的估計出現(xiàn)偏差;對于調(diào)查員,若調(diào)查過程中“有傾向性”地選擇便利樣本,或在原指定的總體成員的調(diào)查不易實施時,代之以總體中其他方便得到的成員,也會導(dǎo)致選擇性偏倚;若研究樣本是由志愿者組成,屬于自發(fā)性回應(yīng)樣本,這些特別樂意或自愿接受調(diào)查或測量的受訪者的傾向、態(tài)度、意愿或經(jīng)歷等特征很可能與目標(biāo)人群不同,也會產(chǎn)生選擇性偏倚。
當(dāng)調(diào)查收集的信息在某個或某些方面有偏離真值的趨勢時,就會出現(xiàn)信息偏倚。問卷或量表等測量工具的某些問題的設(shè)置、措辭、排序都有可能影響受訪者的理解、情緒,導(dǎo)致無法獲取正確回答;受訪者也可能因為忘記、曲解問題、故意隱瞞或編造等造成信息偏倚;調(diào)查員的工作能力和工作態(tài)度也會對信息收集產(chǎn)生影響。
1.7.4 應(yīng)答率問題
應(yīng)答率是影響調(diào)查樣本代表性的重要因素。調(diào)查內(nèi)容、調(diào)查時間、調(diào)查員、數(shù)據(jù)收集方法、問卷設(shè)計、應(yīng)答者負(fù)擔(dān)、激勵和強(qiáng)制手段等因素都會導(dǎo)致抽樣樣本中部分個案的缺失或失效。評價應(yīng)答率對研究結(jié)果的影響,主要取決于無應(yīng)答的性質(zhì)。若無應(yīng)答的個案屬于完全隨機(jī)缺失,基本可以忽略無應(yīng)答;若無應(yīng)答者與應(yīng)答者存在某種差別,則僅對應(yīng)答者給出的問卷進(jìn)行分析,所產(chǎn)生的結(jié)果偏差可能會影響調(diào)查結(jié)果的價值。一般來說,應(yīng)在設(shè)計時考慮回訪、二次抽樣等方法以盡可能多地獲取無應(yīng)答者的信息,或者在分析時采用無應(yīng)答加權(quán)調(diào)整、無應(yīng)答的參數(shù)模型或缺失值插補(bǔ)等方法進(jìn)行補(bǔ)救[13]。
1.7.5 復(fù)雜調(diào)查中目標(biāo)總體估計和統(tǒng)計推斷問題
在很多調(diào)查研究中,抽樣過程中除采用一階段單純隨機(jī)抽樣外,還會采取分層抽樣、整群抽樣、不等概率抽樣或多階段抽樣等其他抽樣方法或其組合的抽樣方案,這種抽樣叫做復(fù)雜抽樣,這種調(diào)查屬于復(fù)雜調(diào)查。復(fù)雜抽樣中每個階段的抽樣方法不一定相同,其抽樣誤差的計算隨著抽樣階段及抽樣方法的增多變得極為復(fù)雜。然而,研究者在統(tǒng)計分析時,常忽略之前采取的抽樣設(shè)計方法,將資料均視為來自單純隨機(jī)抽樣設(shè)計下獲得的資料來處理,會錯誤地估計標(biāo)準(zhǔn)誤,最終可能得到錯誤的推斷。目前,在SAS 9.0或更高的版本中可以通過SURVEYMEANS、SURVEYFREQ、SURVEYREG、SURVEYLOGISTIC等過程進(jìn)行此類資料的分析。這部分內(nèi)容在本文中不做詳述。
1.7.6 調(diào)查實施和管理過程中的問題
調(diào)查實施和進(jìn)程管理與調(diào)查質(zhì)量控制相輔相成,調(diào)查的實施和管理事實上是調(diào)查負(fù)責(zé)人(督導(dǎo)員)與調(diào)查員之間的互動過程,調(diào)查負(fù)責(zé)人要合理地安排調(diào)查員的工作量,控制調(diào)查進(jìn)度。
調(diào)查過程中要注意公共關(guān)系和宣傳。根據(jù)調(diào)查主題、經(jīng)費預(yù)算和目標(biāo)總體的不同,大型調(diào)查應(yīng)該采用不同的方法進(jìn)行調(diào)查宣傳活動。規(guī)模較小的調(diào)查可以通過致被調(diào)查者信、一般的機(jī)構(gòu)介紹手冊、電話等形式告知與被調(diào)查者積極合作的重要性,有助于被調(diào)查者配合調(diào)查。
對被調(diào)查者私人信息和隱私保密是調(diào)查研究的基本原則,事先告知保密原則有助于被調(diào)查者如實回答問題。同時,調(diào)查數(shù)據(jù)在傳輸和使用過程中的安全也必須注意,避免數(shù)據(jù)泄露。
2.1 確定調(diào)查目的和調(diào)查方法
調(diào)查設(shè)計方案應(yīng)依據(jù)調(diào)查研究目的進(jìn)行撰寫,調(diào)查目的也是選取調(diào)查指標(biāo)和問卷設(shè)計的根本依據(jù)。研究者還應(yīng)考慮采用何種調(diào)查方法獲得目標(biāo)對象,同時考慮通過何種調(diào)查工具獲取每位調(diào)查對象的相關(guān)資料。
2.2 確定調(diào)查對象和抽樣方法
調(diào)查對象的選定應(yīng)在明確調(diào)查目的和調(diào)查方法的基礎(chǔ)上,確定調(diào)查總體的同質(zhì)范圍,確定調(diào)查中最基本的觀察單位,還需進(jìn)一步細(xì)分對象人群,以期掌握更全面的資料。
2.3 確定調(diào)查指標(biāo)和樣本含量
圍繞調(diào)查目的,確定調(diào)查項目,將其進(jìn)一步細(xì)化為調(diào)查指標(biāo)。調(diào)查指標(biāo)應(yīng)精練、完備、可獲得,定義要準(zhǔn)確,描述要通俗易懂,必要時可附加說明,便于統(tǒng)一標(biāo)準(zhǔn)。
2.4 確定編制調(diào)查表或調(diào)查問卷的原則
在調(diào)查研究的資料收集中,為保證所獲得的資料質(zhì)量,問卷設(shè)計至關(guān)重要,需考慮目的性、適用性和可行性的原則。設(shè)計完成后需要進(jìn)行預(yù)調(diào)查,對問卷的信度、效度和可接受性進(jìn)行評估。
2.5 確定調(diào)查實施細(xì)則與要領(lǐng)
調(diào)查設(shè)計時,應(yīng)當(dāng)明確調(diào)查的時間和進(jìn)度,明確調(diào)查經(jīng)費和調(diào)查工具,明確調(diào)查機(jī)構(gòu)和團(tuán)隊,對于實施過程中可能出現(xiàn)的問題準(zhǔn)備相應(yīng)的應(yīng)急預(yù)案。在調(diào)查的組織實施過程中,調(diào)查核心小組、調(diào)查員和資金按時足額到位,動員受訪者積極參與,保證現(xiàn)場資料的質(zhì)量和調(diào)查進(jìn)度。在質(zhì)量控制中要抓緊原始記錄的檢查、補(bǔ)查和修正,及時總結(jié)經(jīng)驗教訓(xùn),同時做好項目過程管理、評價和校正。
2.6 確定調(diào)查資料整理與分析的要領(lǐng)
現(xiàn)場收集的原始資料只有經(jīng)過整理和分析、去粗取精,才能揭示事物內(nèi)在的規(guī)律。制定資料的整理和分析計劃包括:①調(diào)查問卷的回收和核查;②數(shù)據(jù)編碼和錄入;③設(shè)計數(shù)據(jù)整理表和數(shù)據(jù)分組;④數(shù)據(jù)分類匯總;⑤制定數(shù)據(jù)分析計劃,說明研究指標(biāo)的內(nèi)涵、統(tǒng)計描述、統(tǒng)計分析和統(tǒng)計推斷方法、需要做哪些探索性分析、如何控制混雜因素等。
2.7 呈現(xiàn)必要的附件
包括①調(diào)查表或調(diào)查問卷;②隨機(jī)抽樣方法的具體實現(xiàn)方法;③估算樣本含量的依據(jù)和方法;④調(diào)查資料統(tǒng)計分析計劃;⑤實施抽樣調(diào)查的標(biāo)準(zhǔn)操作規(guī)程;⑥實施全程質(zhì)量控制的策略等。
3.1 調(diào)查問卷的設(shè)計與考評(思想和路徑概述)
(1)圍繞調(diào)查目的和研究假設(shè),明確總體的核心概念(key concept)框架;(2)通過文獻(xiàn)學(xué)習(xí)、專家小組討論等方式,建立調(diào)查項目框;(3)采用專家咨詢評分、小組討論或?qū)㈩A(yù)調(diào)查的資料經(jīng)因子分析等方法篩選調(diào)查項目;(4)將調(diào)查項目轉(zhuǎn)化為問題,結(jié)合研究的理論框架,確定問題類型、答案形式、排列順序等,形成問卷初稿;(5)對與調(diào)查對象特征相似人群開展小范圍的預(yù)調(diào)查,修訂問卷;(6)從信度、效度和可接受性等方面對問卷進(jìn)行考評。
問卷設(shè)計時還需注意[14]:①問題設(shè)計契合研究主題;②廣泛閱讀文獻(xiàn),避免遺漏重要指標(biāo)或影響因素;③封閉式問題設(shè)計時,確保答案的窮盡性和互斥性;④問卷結(jié)構(gòu)簡單明了,問題排列層次清楚;⑤調(diào)查問題的表達(dá)清晰,適用于目標(biāo)總體中的所有研究個體;⑥問題和答案設(shè)計時,應(yīng)避免雙重問題、含糊不清、抽象提問、誘導(dǎo)性問題;⑦設(shè)計敏感問題時要慎重。
3.2 抽樣方法的具體實現(xiàn)(思想和路徑概述)
在SAS軟件中,SURVEYSELECT過程提供了各種各樣的概率隨機(jī)抽樣方法,既可以進(jìn)行簡單隨機(jī)抽樣,也可以進(jìn)行包括分層抽樣、整群抽樣、不等概率抽樣在內(nèi)的復(fù)雜多階段設(shè)計的抽樣。用SURVEYSELECT過程選擇樣品并構(gòu)成樣本,在所輸入的SAS數(shù)據(jù)集中需要包括抽樣框。抽樣單位是個體觀測者或觀測組(群組)。用戶可以指定抽樣方法、所需樣本大小或抽樣比例和其他一些選擇參數(shù)。用SURVEYSELECT過程抽取樣本后,產(chǎn)生包含抽樣單位、抽樣概率以及抽樣權(quán)重的輸出數(shù)據(jù)集。當(dāng)進(jìn)行多階段抽樣時,對每一個抽樣階段都需要調(diào)用這個過程來設(shè)定抽樣框和選擇參數(shù)。在等概率抽樣中,抽樣框或同一層內(nèi)的每一抽樣單位都有相同的概率被抽取。在等比例(PPS)抽樣中,每一抽樣單位被抽取的概率和它所在層的大小成正比[15]。
3.3 樣本含量的具體估算(思想和路徑概述)
在調(diào)查設(shè)計時,必須確定完成調(diào)查所需的最基本觀察單位的數(shù)量,在既定的科研經(jīng)費下保證精確度和可靠性的同時,可以合理利用資源,保證統(tǒng)計推斷的最大效果。不同的設(shè)計方案、研究目的、研究類型、資料類型、研究精度要求等對應(yīng)的影響樣本含量因素也不盡相同,樣本含量的估計公式和方法也不盡相同,計算有簡有繁。SAS從9.1版開始增添了POWER和GLMPOWER過程,用以估算樣本含量。還有一些專門用于計算樣本含量的軟件,如PASS(Power Analysis and Sample Size)、Power and Precision、G*Power等,大大減輕了計算量,提高了科研效率。
[1] 郝大海. 社會調(diào)查研究方法[M]. 北京:中國人民大學(xué)出版社, 2015: 10-14.
[2] 黃曉光,何繼綏,田春輝. 大學(xué)生艾滋病防治知識態(tài)度行為調(diào)查[J]. 中國公共衛(wèi)生,2015,31(2): 249-251.
[3] 彭希哲,胡湛. 當(dāng)代中國家庭變遷與家庭政策重構(gòu)[J]. 中國社會科學(xué),2015(12): 113-132.
[4] 張靜,水黎明,江志琴, 等. 寧波云醫(yī)院的SWOT分析和對策研究[J]. 中華全科醫(yī)學(xué), 2017, 15(2): 338-342.
[5] 丁志偉,張改素,王發(fā)曾. 中原地區(qū)多尺度城鄉(xiāng)收入的時空分異[J]. 地理研究, 2015, 34(1): 131-148.
[6] 孟娟. 走向人文科學(xué)心理學(xué)[D]. 長沙: 湖南師范大學(xué), 2009.
[7] 楊土保. 醫(yī)學(xué)科學(xué)研究與設(shè)計[M].2版. 北京: 人民衛(wèi)生出版社, 2013: 19-71.
[8] Igberase O, Okogbenin E. Beliefs about the cause of schizophrenia among caregivers in midwestern Nigeria[J]. Ment Illn, 2017, 10, 9(1): 6983.
[9] Lui PSC, Dunne MP, Baker P, et al. Sexual difficulties faced by men in the Solomon Islands: a mixed-methods study[J/OL]. Sex Health, https://www.ncbi.nlm.nih.gov/pubmed/?term=Sexual+difficulties+faced+by+men+in+the+Solomon+Islands%3A+a+mixed-methods+study,2017-05-18.
[10] Zhang Y, Chen P, Lu R, et al. Prevalence of HIV among men who have sex with men in Chongqing, China, 2006-2009: cross-sectional biological and behavioural surveys[J]. Sex Transm Infect, 2012, 88(6): 444-450.
[11] Fedina L, Williamson C, Perdue. Risk factors for domestic child sex trafficking in the United States[J/OL]. J Interpers Violence, https://www.ncbi.nlm.nih.gov/pubmed/27470203, 2016-07-27.
[12] 萬崇華, 許傳志.調(diào)查研究方法與分析[M]. 北京:中國統(tǒng)計出版社, 2016: 19-29.
[13] Sharon L. Sampling: Design and Analysis[M]. Boston: Thomson Brooks Cole,2009:291-355.
[14] Thwaites Bee D, Murdoch-Eaton D. Questionnaire design: the good, the bad and the pitfalls[J]. Arch Dis Child Educ Pract Ed, 2016, 101(4): 210-212.
[15] 胡完, 胡良平. 基于SAS軟件實現(xiàn)隨機(jī)抽樣及應(yīng)用[J]. 四川精神衛(wèi)生, 2016, 29(5): 391-395.
Overviewforthedesignofsurveystudy
CuiZhuang1,HuLiangping2,3*
(1.DepartmentofHealthStatistics,SchoolofPublicHealth,TianjinMedicalUniversity,Tianjin300070,China;2.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;3.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
This paper aims at a brief introduction to the main contents in survey study and to the key techniques when designing a survey. In this paper, a macro overview was presented on the research objects, methods of investigation, sampling methods, pre-survey preparation, survey implementation and attentions during the survey. The key techniques in the survey process and design scheme of the survey were also briefly addressed. This paper could provide references for research workers in order to enhance the project schedule, the quality and the efficacy in survey research.
Survey study; Survey design; Questionnaire;Randomized sampling;Recovery rate; Response rate
R195.1
A
10.11886/j.issn.1007-3256.2017.05.001
2017-08-17)
(本文編輯:陳 霞)
科研方法專題策劃人——胡良平教授簡介
胡良平,男,1955年8月出生,教授,博士生導(dǎo)師,曾任軍事醫(yī)學(xué)科學(xué)院研究生部醫(yī)學(xué)統(tǒng)計學(xué)教研室主任和生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心主任、國際一般系統(tǒng)論研究會中國分會概率統(tǒng)計系統(tǒng)專業(yè)理事會常務(wù)理事和北京大學(xué)口腔醫(yī)學(xué)院客座教授;現(xiàn)任世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會會長、中國生物醫(yī)學(xué)統(tǒng)計學(xué)會副會長,《中華醫(yī)學(xué)雜志》等10余種雜志編委和國家食品藥品監(jiān)督管理局評審專家。主編統(tǒng)計學(xué)專著45部,參編統(tǒng)計學(xué)專著10部;發(fā)表第一作者學(xué)術(shù)論文220余篇,發(fā)表合作論文130余篇,獲軍隊科技成果和省部級科技成果多項;參加并完成三項國家標(biāo)準(zhǔn)的撰寫工作;參加三項國家科技重大專項課題研究工作。在從事統(tǒng)計學(xué)工作的30年中,為幾千名研究生、醫(yī)學(xué)科研人員、臨床醫(yī)生和雜志編輯講授生物醫(yī)學(xué)統(tǒng)計學(xué),在全國各地作統(tǒng)計學(xué)學(xué)術(shù)報告100余場,舉辦數(shù)十期全國統(tǒng)計學(xué)培訓(xùn)班,培養(yǎng)多名統(tǒng)計學(xué)專業(yè)碩士和博士研究生。近幾年來,參加國家級新藥和醫(yī)療器械項目評審數(shù)十項、參加100多項全軍重大重點課題的統(tǒng)計學(xué)檢查工作。歸納并提煉出有利于透過現(xiàn)象看本質(zhì)的“八性”和“八思維”的統(tǒng)計學(xué)思想,獨創(chuàng)了逆向統(tǒng)計學(xué)教學(xué)法和三型理論。擅長于科研課題的研究設(shè)計、復(fù)雜科研資料的統(tǒng)計分析與SAS實現(xiàn)、各種層次的統(tǒng)計學(xué)教學(xué)培訓(xùn)和咨詢工作。
國家高技術(shù)研究發(fā)展計劃課題資助(2015AA020102)