謝愛磊 陳嘉怡
(廣州大學粵港澳大灣區(qū)社會發(fā)展與教育政策研究院,廣州 510006)
在質(zhì)性研究設(shè)計中,一個常被提及的重要問題是“樣本量多少才算足夠?”在開展數(shù)據(jù)收集工作時,該類研究往往采用目的性抽樣而非概率抽樣,更重數(shù)據(jù)的多樣性和豐富性,這讓這一看似簡單的問題往往無法得到直接回答(Morse,2000;Malterud et al.,2016;Hennink,2017)。不過,大體而言,質(zhì)性研究者常視飽和為一個可接受的評估樣本量是否充分的標準(Morse,2015a),它常被看作是質(zhì)性研究方法論的必要組成部分。研究者提出,假如在發(fā)展理論的過程中做不到飽和,會影響質(zhì)性研究的質(zhì)量(Fusch & Ness,2015)。飽和是質(zhì)性研究人員最常標榜的嚴謹性保證,業(yè)已成為決定抽樣策略的“黃金法則”,“常規(guī)”與“法則”(Morse et al.,2002;Sparkes et al.,2012;Guest et al.,2017)。
問題是盡管飽和已經(jīng)在質(zhì)性研究中獲得了近乎正統(tǒng)的地位,但其內(nèi)涵在中文文獻當中依然沒有得到系統(tǒng)介紹。這大體和如下四個方面的原因有關(guān)。首先,即便是在常被視作理論資源的英文文獻中,飽和概念也有多重含義—有些研究者常使用數(shù)據(jù)飽和(data saturation)的概念,有些則常使用理論飽和(theoretical saturation)的概念,有些則傾向于使用主題飽和(thematical saturation)的概念,三者之間的區(qū)別又常語焉不詳。其次,在關(guān)于質(zhì)性研究方法論的討論中,是否需要一系列一般性的評價所有質(zhì)性研究質(zhì)量的標準這一問題一直存在爭議(Mays & Pope,2000;Caelli et al.,2003;Tracy,2010)。巴伯爾(Barbour,2001)指出,在質(zhì)性研究中采用一系列標準或可增加研究人員對質(zhì)性研究效度的信任,推動這一研究范式被更多研究人員接受。但其內(nèi)在困境是在質(zhì)性研究內(nèi)部又可細分為不同進路(approach),毫無批判地接受一系列標準可能適得其反—尤其是當這些標準在本體論和認知論上與質(zhì)性研究的基本假設(shè)有內(nèi)在沖突時。再次,在匯報研究發(fā)現(xiàn)時,大部分情況下研究者只簡略提及自身做到了飽和,至于如何做到了飽和(操作)則極少描述,這給后來者加以系統(tǒng)總結(jié)和提煉帶來了一定的挑戰(zhàn)。最后,在當前的中文文獻中,對于如何開展質(zhì)性研究,見解和探索依然非常多樣,研究者常常不在同一個意義上使用質(zhì)性研究概念。例如,為了區(qū)分較早期的實踐和近期探索,研究者常使用“定性研究”“質(zhì)化研究”“質(zhì)性研究”以求相互區(qū)別(馬鳳岐,謝愛磊,2020)。就宏觀范式展開的討論,常常脫離對中觀的規(guī)范和程序以及細節(jié)的技術(shù)和方法的審查,飽和問題自然不在討論之列。
在經(jīng)驗研究(empirical research)中,抽樣依然被視為影響研究項目成功與否的關(guān)鍵。質(zhì)性研究的抽樣顯然不能簡單地照抄量化研究設(shè)計的邏輯,因為前者的重心不在于計算數(shù)量或?qū)δ撤N觀點的認可程度,而在于探求觀點的多樣性以及某一問題的不同表征(Gaskell,2000),前者也并不特別尋求結(jié)論在統(tǒng)計學意義上的可推廣性而重在有充分樣本以發(fā)展理論(Bowen,2008)。樣本是否充分又與飽和的概念緊密相連。正因飽和概念在質(zhì)性研究中的重要地位,本文力圖對其進行較為系統(tǒng)的梳理和評述,介紹其概念源頭、發(fā)展與分類、具體操作(包括在何種情形下如何做到飽和),并討論在使用這一概念時,研究人員中間存在的一些基本爭論。
談及飽和,研究人員一般追溯其源頭至格拉澤和斯特勞斯于1967年出版的經(jīng)典著作《發(fā)現(xiàn)扎根理論:質(zhì)性研究策略》。在這部著作中,他們提出:
“判斷何時停止抽取不同群體樣本的標準要視乎類屬,亦即類屬的理論飽和程度。飽和的意思是社會學家在發(fā)展類屬屬性的過程中,再沒有新的數(shù)據(jù)出現(xiàn)。當他們在一遍又一遍看到相似的情形不斷出現(xiàn)時,研究者即可從經(jīng)驗層面確認類屬的發(fā)展已經(jīng)實現(xiàn)飽和。這時,他還可以尋求其他辦法,收集更加多樣化的數(shù)據(jù),以確定飽和的判斷是基于和類屬有關(guān)的非常廣泛的數(shù)據(jù)的基礎(chǔ)上做出的。”(Glaser & Strauss,1967,p. 61)
格拉澤和斯特勞斯(Glaser & Strauss,1967,pp. 21?44)認為,扎根理論的核心任務(wù)在于生成和發(fā)展理論—就在特定社會環(huán)境中發(fā)生的社會過程中生成和發(fā)展描述和解釋性的理論。在理論層面,這意味著研究者要能夠通過發(fā)展抽象概念和理論把握具有持久和穩(wěn)定特性的社會過程,揭示其階段性特征;在數(shù)據(jù)分析層面,這意味著以充分的數(shù)據(jù)發(fā)展主題(theme)和理論類屬(theoretical category)(清晰地闡釋概念,有力地論證概念間關(guān)系);在數(shù)據(jù)收集層面,則意味著通過理論抽樣(以涌現(xiàn)理論—闡釋概念、論證概念間關(guān)系—所需的必要的相似性和差異性為標準抽取樣本)充分地收集數(shù)據(jù)。格拉澤和斯特勞斯深受實證科學研究范式(positivist paradigm)的影響,指出實現(xiàn)理論飽和意味著理論類屬發(fā)展的“可重復性”和“可驗證性”(Morse et al.,2002),但也顯示了對質(zhì)性研究內(nèi)在特征的深度思考,認為實現(xiàn)理論飽和有助于確保理論類屬的“綜合”(comprehension)和“完整”(completeness)。另外,就理論飽和的概念,格拉澤和斯特勞斯還提出了一個逐步推進的工作方法,亦即當一個理論類屬實現(xiàn)飽和后再去發(fā)展其他理論類屬,通過這樣遞進的方式實現(xiàn)所有理論類屬的飽和—當然,這一提法本身亦有線性思維之虞。在格拉澤和斯特勞斯的原初定義中,飽和與理論抽樣緊密相連,飽和的核心是發(fā)展理論類屬,理論抽樣的目標在于找到最具典型性的樣本以幫助發(fā)展理論類屬。也正是由此,質(zhì)性研究當中的“抽樣”“數(shù)據(jù)收集”“數(shù)據(jù)分析”工作才交織到一起,而非呈現(xiàn)出各自分離、前后相繼的線性特征—這一點也是質(zhì)性研究與量化研究的重要區(qū)別。總體而言,格拉澤和斯特勞斯提出的飽和概念,其重點主要落在數(shù)據(jù)中已找到的理論類屬的發(fā)展程度上,且飽和是決定是否繼續(xù)收集數(shù)據(jù)的基本依據(jù)。
在格拉澤和斯特勞斯之后,飽和概念在扎根理論的持續(xù)影響下進一步發(fā)展。例如,厄克特(Urquhart,2013,p. 194)主張在數(shù)據(jù)分析階段過程中以是否出現(xiàn)新編碼為依據(jù)判斷飽和,即當數(shù)據(jù)中反復出現(xiàn)相同的編碼、再無新編碼出現(xiàn)時就可視為達到飽和狀態(tài)。由于編碼是主題涌現(xiàn)的技術(shù)基礎(chǔ),所以亦有研究者提出,當新增數(shù)據(jù)不能再帶來新的主題時,即可判斷達到飽和狀態(tài)(Birks & Mills,2015,pp.85?107;Olshansky,2015,pp. 19?28;Given,2016,p. 135),這有助于研究者獲得對研究參與者視角和觀點的完整理解。不難發(fā)現(xiàn),上述觀點將新編碼,尤其是將與之相連的新主題是否繼續(xù)涌現(xiàn)作為理論飽和的重要判斷標準,故后來者又將其稱之為主題飽和(thematical saturation),并強調(diào)可以其為標準判斷是否需要繼續(xù)分析數(shù)據(jù)。當然,從編碼到主題的思路體現(xiàn)的往往又是演繹進路的研究設(shè)計邏輯,亦即在研究的初始階段,只有明確的研究問題和基本的概念透鏡(conceptual lens),而概念的細節(jié)和內(nèi)涵依然要通過分析數(shù)據(jù)逐步獲得,所以這類主題飽和又被稱為演繹主題飽和(inductive thematic saturation)。
而在較早時期,斯塔克思和特立尼達(Starks & Trinidad,2007)則指出,相當一部分質(zhì)性研究設(shè)計遵循的實際上是歸納進路的設(shè)計思路,在這種情況下,研究者在開展研究設(shè)計時即已經(jīng)有明確的研究問題和既定的理論框架—清晰的概念和對概念間關(guān)系的假設(shè),這兩者直接指引著后續(xù)數(shù)據(jù)收集、分析和匯報工作的展開。在這種情況下,飽和的核心則在于構(gòu)成理論的所有要件(包括概念和概念間關(guān)系)都能有充分的數(shù)據(jù)予以支撐。與演繹主題飽和不同,這類飽和強調(diào)的是有充分的數(shù)據(jù)能夠說明和支撐理論,它亦關(guān)注數(shù)據(jù)分析工作的充分程度。由于其總體上強調(diào)自上而下、以概念框架指導數(shù)據(jù)分析工作(尤其是編碼工作的特征),故而又被稱為既定主題飽和(a priori thematic saturation)。
不過,總體而言,無論是理論飽和還是主題飽和,它們的焦點都在理論和主題的發(fā)展上,強調(diào)理論和數(shù)據(jù),編碼和概念提煉之間的持續(xù)互動—這亦是質(zhì)性研究區(qū)別于量化研究設(shè)計的重要特點之一。但后來者依據(jù)自身的理解,在扎根理論傳統(tǒng)之外提出了數(shù)據(jù)飽和(data saturation)的概念,其核心是:當研究人員在數(shù)據(jù)收集的過程中發(fā)現(xiàn)新收集的數(shù)據(jù)與已有數(shù)據(jù)有重復且顯得“多余”時,即可算作達到飽和狀態(tài)。在工作層面,它具體表現(xiàn)在研究者在訪談過程中開始一遍遍聽到與之前的對話相同的內(nèi)容。如果這樣,他們就可以停止收集數(shù)據(jù)并開始著手分析工作了(Grady,1998,p. 26)。在這一意義上,數(shù)據(jù)飽和通常與信息冗余這一概念交替使用。不難發(fā)現(xiàn),理論飽和與主題飽和的提法深受扎根理論的影響且一貫強調(diào)數(shù)據(jù)的收集和分析是一個交錯互動的過程。但數(shù)據(jù)飽和的概念淡化了這一認識,認為飽和的重點在數(shù)據(jù)而不在理論,亦即是否飽和的判斷完全可以基于數(shù)據(jù)是否冗余做出,不必等到判斷理論或主題是否發(fā)展充分而做出。
從上述對飽和概念發(fā)展的系統(tǒng)梳理來看,過去的研究人員一般在三種意義上使用這一概念:理論飽和、主題飽和與數(shù)據(jù)飽和(見表1)。其中主題飽和又可再分為演繹主題飽和與既定主題飽和(Saunders et al.,2018)。理論飽和與主題飽和都特別關(guān)注理論的生成以及數(shù)據(jù)收集或分析工作與理論發(fā)展的交互;數(shù)據(jù)飽和則視數(shù)據(jù)的收集和分析為相對獨立的工作,尤為關(guān)注信息冗余的出現(xiàn)—這貌似賦予了數(shù)據(jù)收集工作某種客觀色彩。
表1 飽和的三種模式
在操作層面,關(guān)于飽和常需回答的問題是:不同類型的質(zhì)性研究設(shè)計是否都需飽和或需要什么樣的飽和?可以在何時判斷是否實現(xiàn)飽和?究竟多少樣本能夠保證實現(xiàn)飽和?又有哪些具體的工作方法可以有助于并向讀者證明已經(jīng)實現(xiàn)飽和?
就第一個問題,莫斯(Morse,2015b)指出,所有類型的質(zhì)性研究都需實現(xiàn)飽和。這種一刀切的提法常引致后來者的批判。批判的立論基礎(chǔ)是,飽和概念在本質(zhì)上涉及“主題發(fā)展”,亦即事關(guān)跨個案共同“規(guī)律”(能夠描述一類現(xiàn)象/過程的抽象概念,解釋一類現(xiàn)象/過程的理論)的提煉和總結(jié)。但某些特殊類型的質(zhì)性研究設(shè)計關(guān)注的個體數(shù)量通常極為有限,飽和的概念或許并不適用。例如,在口述史和敘事研究當中,研究人員通常關(guān)注的是數(shù)量有限的個體在陳述自身故事的過程中流露出的線索(strand),而不一定是跨個案的主題(theme)。線索從本質(zhì)上來說是持續(xù)性的、有時間維度的,而主題通常是截面的(Saunders et al.,2018)。在判斷數(shù)據(jù)質(zhì)量時,口述史和敘事研究較為關(guān)注個體敘述的“完整性”—是否和所研究話題相關(guān)的故事都有收集到,這顯然不同于飽和對“理論充分發(fā)展”的追求。另外,在解釋現(xiàn)象學分析(interpretative phenomenological analysis)中,關(guān)于是否需要實現(xiàn)飽和,研究人員之間的分歧也大于共識。例如,不少研究者指出,解釋現(xiàn)象學分析追求的應當是“完整和豐富的個人陳述”,重點不應落在跨個案觀點的共性上。范梅南(van Manen et al.,2016)甚至提出現(xiàn)象學研究和飽和沒有必然聯(lián)系。但也有部分研究者認為,這一研究設(shè)計應當追求飽和,其內(nèi)涵應當為“不同個案表述的觀點中體現(xiàn)出的共識”(Turner et al,2002)。
莫斯關(guān)于所有類型的質(zhì)性研究都需實現(xiàn)飽和的提法深受后來者批判的另一重要原因是,其并未深究不同類型的質(zhì)性研究設(shè)計是否需要不同類型的飽和這一問題。桑德斯等人(Saunders et al.,2018)指出不同類型的研究設(shè)計需要對應不同類型的飽和。他們對研究設(shè)計的分類依據(jù)主要是基于演繹還是歸納邏輯。桑德斯等人指出,在完全或主要依賴先前設(shè)定的編碼、主題或其他分析類屬來分析數(shù)據(jù)的演繹邏輯的研究設(shè)計中,飽和應當主要是指先前設(shè)定的編碼和主題等是否在數(shù)據(jù)中獲得充分展現(xiàn)和支持。因而,演繹主題飽和是對應的指導數(shù)據(jù)分析和判斷數(shù)據(jù)充分程度的依據(jù)。而在歸納邏輯的研究設(shè)計中,飽和的主要判斷標準是指新涌現(xiàn)編碼或主題是否和在數(shù)據(jù)中已找到的既有編碼和主題相同,和/或新數(shù)據(jù)能否有助于生成新的理論洞見。如此,既定主題飽和則是對應的指導抽樣和判斷數(shù)據(jù)充分程度的依據(jù)。
就第二個問題“可以在何時判斷是否實現(xiàn)飽和?”而言,研究者指出其應視研究者采信的具體飽和模式來判斷。例如,倘若接受數(shù)據(jù)飽和的概念,亦即以信息冗余作為判斷標準,那么在研究的早期即可找到飽和點。這一思路將數(shù)據(jù)收集和正式的數(shù)據(jù)分析過程分開。在何時實現(xiàn)飽和的判斷則高度依賴于個體在研究過程中針對自身聽到了什么、觀察到什么做出判斷。聽到的和觀察到的內(nèi)容是否和較早時間聽到和觀察到的有所重復通??梢栽跀?shù)據(jù)分析工作正式開始之前—亦即在編碼和發(fā)展理論類屬之前做出(Saunders et al.,2018)。問題是,由于此時理論發(fā)展可能尚處初始階段,個體判斷極有可能失于膚淺。另外,將理論發(fā)展工作和數(shù)據(jù)收集和分析工作割裂,也不符合質(zhì)性研究范式一貫主張的在理論上堅持螺旋上升、在數(shù)據(jù)收集上保持開放、在理論和數(shù)據(jù)兩者的關(guān)系上強調(diào)交互的特性(Glaser,1978,pp. 124?126)。
倘若接受演繹主題飽和的概念,即以是否出現(xiàn)新編碼和新主題作為判斷是否達到飽和的標準時,對飽和的判斷時間同樣可能比較早。盡管這一思路將數(shù)據(jù)收集和數(shù)據(jù)分析過程視為交織展開的過程,但如果將關(guān)注點放到是否有“新”之上,極易使研究人員忽視質(zhì)性數(shù)據(jù)的其他重要特性,例如“多面”“深度”“入微”等。此外,在質(zhì)性研究中,理論類屬的發(fā)展總是一個螺旋上升的過程,早期既定編碼極有可能隨著研究的不斷推進發(fā)生調(diào)整,此刻判斷“不新”的數(shù)據(jù)極有可能在下一刻“新”起來。因而,太過關(guān)注是否出現(xiàn)新編碼和新主題,是“搞錯了方向”(Hennink et al.,2017)。如果能夠秉持這樣的認識,對飽和的判斷同樣可能較晚—到數(shù)據(jù)收集工作稍晚的階段。倘若接受理論飽和或既定主題飽和的概念,理論類屬的特征是否得到了充分挖掘、理論建構(gòu)是否能得到充分證明(概念的內(nèi)在維度得到充分說明,概念間關(guān)系得到充分闡釋)便是判斷飽和是否實現(xiàn)的重要標準(Strauss & Corbin,1998,pp.143?150)。如此,對是否實現(xiàn)飽和的判斷,在時間上也會比較晚。
在所有就飽和問題展開的論述中,樣本量大小的討論都占據(jù)了重要的位置(Hennink et al.,2019)。與量化研究不同,一般而言,質(zhì)性研究遵從目的性抽樣的邏輯。研究者選擇樣本的目標在于選擇合適的最具生產(chǎn)性的樣本以有效地回答研究問題和發(fā)展理論。例如,在扎根理論研究中,理論抽樣的基本邏輯是,以早期訪談中涌現(xiàn)的理論為指引選擇后續(xù)樣本。早期的訪談是開放式的、旨在初步發(fā)展理論的深度訪談,但隨著研究的推進和理論雛形的涌現(xiàn),后續(xù)的訪談逐步變?yōu)榘虢Y(jié)構(gòu)式的,旨在探索理論類屬,檢驗理論類屬間關(guān)系,尋找否證并解釋這些案例為何“例外”。在這種邏輯下,后續(xù)訪談參與者的選擇都是按需而來的,被選中的個體要能夠提供與理論發(fā)展相關(guān)的充分的信息。這樣,理論發(fā)展和樣本選擇便呈現(xiàn)出回環(huán)往復的特征—這是質(zhì)性研究不同于量化研究另一重要特征。在扎根理論之外,研究樣本的選擇基本依照類似的邏輯—最有生產(chǎn)性、最有利于理論生成。最大化多樣性抽樣(maximum diversity sampling)、配額抽樣(quota sampling)、例外抽樣(deviant sampling)、典型個案抽樣等,無不如此。也正是由于這一邏輯,合適樣本量的判斷即在很大程度上受制于每個“個案所能提供的信息的完整性”“訪談的質(zhì)量”以及“訪談對象的差異和多樣性”等,而非樣本的絕對數(shù)量(Guest et al.,2006)。因此,在研究開始前就難以判斷到底需要多少樣本(Kerr et al.,2010)。
當然,在大部分情況下,當科研人員申請不同類型的科研基金時,一般會被預期提出可能的樣本數(shù)量—這是科研人員必須面對的現(xiàn)實要求。另外,不能預估樣本也可能帶來研究倫理方面的質(zhì)疑—研究樣本過大,極有可能導致公共研究資助以及研究參與者時間和精力的浪費;研究樣本過小,帶來不可靠的結(jié)論,也極有可能導致同樣的問題(Francis et al.,2010)。
基于這一問題本身的復雜性,稍早的研究一般不對可達成飽和的樣本量大小做具體討論,而只提供指導性的抽樣標準(Mason,2010)。但隨著質(zhì)性研究范式的不斷完善,在部分專門的教科書和論文當中,科研人員開始基于長期的實踐建議可能的樣本量范圍(range)。例如,貝爾托(Bertaux,1981,p. 35)在《傳記與社會:社會科學中的生活史研究》一書中就質(zhì)性研究中一般可采納的樣本量大小提出的建議是:15個研究參與者是最小可接受的數(shù)字。在由鄧津和林肯于1994年出版的經(jīng)典著作《質(zhì)性研究手冊》中,莫斯專門撰文指出,人種志或人類學研究的樣本可采納的建議值是30-50個(Morse,1994,pp.220?235)。伯納德(Bernard,2000,pp. 143?187)在2000年出版的《社會研究方法》一書中則建議人類學研究的訪談樣本可以是在30-60個之間。就扎根理論與現(xiàn)象學研究來說,莫斯(Morse,1994,pp.220?235)和克雷斯維爾(Creswell,2013,p. 199)也先后在編著《質(zhì)性研究手冊》以及《質(zhì)性探索和研究設(shè)計:五種傳統(tǒng)》中提出了可參考的樣本量(見表2)。
表2 質(zhì)性研究中的樣本量:建議與實際
為了解研究人員在開展質(zhì)性研究的過程中實際的樣本量選擇情況,梅森(Mason,2010)在2009年對被收錄入《論文索引—大不列顛和愛爾蘭大學高等學位論文綜合目錄》中聲稱使用了質(zhì)性研究設(shè)計的共560篇博士論文進行了分析,并分類匯報了這些論文的樣本量范圍。例如,他發(fā)現(xiàn):在行動研究中,最大樣本是67,最小為3,平均樣本數(shù)為23;在案例研究中,最大樣本是95,最小為1,平均樣本數(shù)為36;在扎根理論研究中,最大樣本為87,最小為4,平均樣本數(shù)為32;在生活史研究中,最大樣本為62,最小為1,平均樣本數(shù)為23;在現(xiàn)象學研究中,最大樣本是89,最小為7,平均樣本數(shù)為25。
由于篇幅有限,梅森論文當中匯報的質(zhì)性研究在聲稱的進路上又太過龐雜未做再分類—共26種,我們選擇其中常見的幾種—人種志,扎根理論,現(xiàn)象學,敘事研究,個案研究,與教科書建議做簡單對比(見表2)。在未聲稱具體研究進路、只表明自身所做的研究為質(zhì)性研究設(shè)計的博士論文中,80%的選擇了15個以上樣本(與貝爾托所建議的數(shù)量基本吻合),50%的選擇的樣本在50個以下??傮w而言,實際抽樣與教科書的建議值較為接近。在聲稱采用了人種志、扎根理論和現(xiàn)象學的研究中,實際選擇的樣本數(shù)也幾乎與教科書的建議值相近。
除上述教科書所建議的標準以及梅森的研究所呈現(xiàn)的實踐之外,還有部分研究人員就可以達成飽和的樣本做了一些不同的判斷,但總體而言,在大部分情況下,建議的樣本范圍都在6至25之間。例如,蓋斯特等人(Guest et al.,2006)提出了“6的倍數(shù)”這一指導原則。他們指出,在參與者較為同質(zhì)化的情況下,94%的高頻編碼會在首次接受訪談的6個個案中出現(xiàn),97%的會在首次接受訪談的12個個案中出現(xiàn),因而,可以在每6個訪談結(jié)束后進行編碼和主題檢查,判斷飽和情況??邓固苟∨热耍–onstantinou et al.,2017)則聲稱所有可能的主題都可以在訪談前7位研究參與者后獲得。安竇等人(Ando et al.,2014)則認為12個訪談足以提供研究者所需的所有主題。哈咖曼和伍提馳(Hagaman &Wutich,2017)依據(jù)自身的研究經(jīng)驗指出,對于相對同質(zhì)、特定環(huán)境中的群體來說,要達成飽和,16個以下個案即足夠,不過針對跨文化群體的研究,往往需要20至40個個案才能達成飽和。韓寧柯等人(Hennink et al.,2017)則認為25個訪談足夠達成飽和。
需要指出的是,不宜對上述教科書和研究就樣本量所做的建議做過度解讀—將其奉為圭臬。在質(zhì)性研究中,對樣本數(shù)量的預估要考慮的因素復雜而多樣。除了要考慮最有生產(chǎn)性、最有利于理論生成與發(fā)展這一原則外,還要考慮的其他因素,包括:“研究的目的”(假如研究的目的是探究經(jīng)驗的本質(zhì),小樣本應該可以有助于達成飽和)(Onwuegbuzie & Leech,2007)、范圍,“研究設(shè)計的類型”(Morse,2004),“研究對象的同質(zhì)性程度”(高度同質(zhì)性的樣本,小樣本同樣可以有助于達成飽和),“選擇樣本的標準”,具體的“數(shù)據(jù)收集方法”,研究人員的“研究技能水平”(Ritchie & Lewis,2003,p. 84)(假如是初學者,未必能夠在較早階段即能通過較小樣本發(fā)展理論,達成飽和)與“精力”(Bernard,2000,pp.143?187),工作強度(Roy et al.,2015),以及“預算和資源”(Mason,2010)。
此外,需要注意的是,在樣本量大小和飽和之間沒有簡單的線性關(guān)系—并非樣本量越大,越有助于實現(xiàn)飽和。威睿等人(Wray et al.,2007)在針對樣本量大小和新主題涌現(xiàn)之間關(guān)系的研究中即發(fā)現(xiàn),在實際訪談和編碼工作中,一直增加接受訪談?wù)邤?shù)量總會帶來新的編碼和主題—即便是人數(shù)增至200以上時依然如此。不過,他們也指出,新主題的出現(xiàn)總體呈現(xiàn)遞減的規(guī)律,亦即隨著訪談人數(shù)的增加,實際增加的新主題數(shù)會越來越少(見圖1,源自Wray et al.,2007)。威睿等人的研究有兩個方面的深層含義。首先,在質(zhì)性研究中,單純以是否出現(xiàn)新編碼和新主題為標準判斷飽和的實現(xiàn)情況不太恰當,這印證了本文上述所提到的內(nèi)容;其次,暫停數(shù)據(jù)收集工作亦有現(xiàn)實考量,在新編碼和主題涌現(xiàn)遞減、每增加一個新編碼和主題所需訪談的人數(shù)過多的情形下,投入過度物力、財力與人力也不太恰當。例如,威睿等人提出,在已有參與者為25人的情形下,新增一主題大約需要增加1位參與者即可,但當已有參與者人數(shù)達到400時,新增一主題大約需要增加108位參與者(見表3,源自Wray et al.,2007)。
表3 新增1主題需新增參與者數(shù)
圖1 參與者與主題數(shù)
談及飽和,研究者尤為關(guān)注的另一個問題是可以通過哪些方法記錄并對其進行判斷。科爾等人(Kerr et al.,2010)指出,在大部分情況下研究人員都不會就自身如何在研究中做到了飽和做出詳細說明。其他研究人員也有類似發(fā)現(xiàn)(Bowen,2008;O’Reilly & Parker,2012)。例如,卡爾森和格朗東(Carlsen & Glenton,2011)曾對220個質(zhì)性研究進行述評,他們發(fā)現(xiàn):這些研究中的83%都聲稱自己在決定抽樣時用到了數(shù)據(jù)飽和作為標準,但卻并未就如何評估達到飽和做出說明。當然,具體說明如何判斷飽和并以其為標準決定實際抽樣的確有其內(nèi)在矛盾—因為飽和只有在數(shù)據(jù)收集的過程中才能操作,但研究計劃卻要求在研究開展前即對樣本量做出預估。因而,正如哈默斯利(Hammersley,2015)所言,這種內(nèi)在矛盾的根源之一在于“研究體制”。但如上文所述,如果將研究計劃中的樣本量預估看作是一個范圍的概念或者約數(shù),那么這種內(nèi)在矛盾或可部分地忽視。
就如何記錄并判斷飽和,過去的研究主要提供了三種方法:結(jié)構(gòu)性編碼本、飽和表以及概念深度量表。其中,結(jié)構(gòu)性編碼本的設(shè)計重在記錄編碼和主題的出現(xiàn)和變化(見表4)。在一個典型的結(jié)構(gòu)性編碼本里,研究人員需要從分析第一個案例時即適時記錄編碼的出現(xiàn)和發(fā)展情況,并對編碼下簡要定義(Kerr et al.,2010;Roberts et al.,2019),就如何在數(shù)據(jù)分析過程當中使用這一定義做明確說明(操作性定義),再具體說明在數(shù)據(jù)分析過程中哪些情形適用或哪些情形不適用(例如,有些案例可能更適合作為此處而非他處的例證),并在最后給出明確的例證(詳見表4案例給出的結(jié)構(gòu))。使用結(jié)構(gòu)性編碼本的優(yōu)勢有:首先,由于能夠適時記錄編碼的出現(xiàn)和發(fā)展情況,結(jié)構(gòu)性編碼本給予了研究人員準確判斷新編碼是否持續(xù)出現(xiàn)的依據(jù)—尤為適合采納演繹主題飽和與數(shù)據(jù)飽和標準的研究;其次,由于其就定義、定義適用或不適用的情形都做了明確界定,這非常有利于小組協(xié)作,特別有利于團隊成員各自獨立工作開展交叉檢驗從而提升數(shù)據(jù)分析的透明度和質(zhì)量;再次,由于能夠全程記錄,編碼的修訂也能夠及時得到體現(xiàn),有助于研究人員掌握主題發(fā)展的情況和脈絡(luò);最后,結(jié)構(gòu)性編碼本的使用可與數(shù)據(jù)分析過程高度結(jié)合,這使得這部分工作可以嵌入數(shù)據(jù)分析過程,與后者同時進行(Guest et al.,2006)。
表4 結(jié)構(gòu)性編碼本舉例(Roberts et al.,2019)
飽和表是研究人員開發(fā)的另一類記錄和判斷飽和情況的工具。較為常見的飽和表有兩類。第一類飽和表被稱為主題飽和表,主要形式為由不同個案和編碼、主題數(shù)記錄等條目組成的交叉表(見表5)。它有助于研究人員從分析第一個個案起即記錄每個個案中呈現(xiàn)的編碼數(shù)、主題數(shù),與之前的個案分析重復的主題數(shù)、新出現(xiàn)的主題數(shù)以及已分析的個案中的主題數(shù)總計,當然,研究人員也可以由前述數(shù)字而計算出每個個案中涌現(xiàn)的主題數(shù)的覆蓋率(亦即其占最終總主題數(shù)的百分比情況)。通過主題飽和表,研究人員可以直觀地判斷出,在分析至多少個案時,新的主題不再出現(xiàn)—亦即達到飽和狀況(可參考表5第5列開始出現(xiàn)數(shù)字0的節(jié)點),也可以有助于他們判斷不同個案所含信息的豐富程度。第二類飽和表可被稱為編碼飽和表,主要形式為由編碼和個案條目組成的交叉表(見表6)。它有助于研究人員從分析第一個個案起即記錄編碼首次在某個具體個案中的出現(xiàn)情況。在編碼和個案條目對應的交叉位置,研究人員既可以以星號記錄編碼的首次出現(xiàn)時間(第幾個個案),也可以以注的形式做其他適當說明(Kerr et al.,2010)。編碼飽和表的主要用意在于,在記錄完所有編碼首次出現(xiàn)的個案節(jié)點后,其后的空白即表示已達飽和狀態(tài)—所有主題都能得到數(shù)據(jù)支持。
表5 主題飽和表舉例(Constantinou et al.,2017)
表6 編碼飽和表舉例(Kerr,Nixon & Wild,2010)
飽和表的制作雖然也與數(shù)據(jù)分析工作同步進行以求準確記錄編碼和主題的發(fā)展情況,但與結(jié)構(gòu)性編碼本不同,它的制作是對數(shù)據(jù)編碼工作的再加工。飽和表較易制作,但其受質(zhì)疑的地方主要在于,質(zhì)性數(shù)據(jù)的分析往往是一個回還往復的過程—在數(shù)據(jù)分析的一開始設(shè)定的編碼和主題可能在后期會得到不斷修正。因而記錄的實際編碼數(shù)和主題數(shù)以及新編碼出現(xiàn)的時間等信息都需要不斷修正,這增加了記錄和判斷飽和工作的復雜程度。不過,也正是基于這一考慮,在采納既定主題飽和模式特別強調(diào)既定主題能夠得到數(shù)據(jù)有效支撐的研究中,使用飽和表要更為合適。
對于結(jié)構(gòu)性編碼本和飽和表,克爾等人(Kerr et al.,2010)頗有微詞。這兩者或能夠把握數(shù)據(jù)的廣度和時間維度,但對于質(zhì)性研究一貫強調(diào)的數(shù)據(jù)的深度卻未能予以展現(xiàn)。在堅持扎根理論路徑、沒有既定概念透鏡或理論框架、采信理論飽和模式的情況下,結(jié)構(gòu)性編碼本和飽和表的使用也稍為困難。尼爾森(Nelson,2017)認為在判斷研究的質(zhì)量和采樣是否充分時,應當放棄飽和概念,回歸扎根理論傳統(tǒng),強調(diào)“概念深度/密度”和“理論類屬的豐富程度”,甚至認為應當以“概念深度”概念替代“飽和”概念。不過,總體而言,他的概念深度是對飽和概念的升級。其所開發(fā)的概念深度量表亦有助于我們判斷一項研究的飽和狀況。尼爾森主張應當圍繞五個方面來判斷一項研究的概念深度:
(1)范圍:數(shù)據(jù)中有一系列證據(jù)能用來闡釋概念。
(2)復雜性:概念是由主題和概念組成的網(wǎng)絡(luò)的一個部分,它們以復雜的形式相連。
(3)微妙性:研究者能夠理解概念的微妙性,能夠?qū)ζ浜x的豐富性做建構(gòu)性解讀。
(4)回應性:概念可以回應所在研究領(lǐng)域的既有文獻。
(5)效度:概念本身可以經(jīng)得起外部效度的檢驗。
在其開發(fā)的概念深度量表中,尼爾森以這五個維度實現(xiàn)程度的“低—中—高”判斷具體研究的概念深度狀況(見表7)。例如,他指出,就“范圍”指標,可以以編碼的出現(xiàn)頻次和多樣性、數(shù)據(jù)來源的多樣性加以判斷,如果少有例證支持核心概念、數(shù)據(jù)類型單一則范圍指標得分低;如果數(shù)據(jù)中有大量例證支持核心概念且數(shù)據(jù)類型多樣,則范圍指標得分高。同理,如果編碼樹、觀點圖和編碼矩陣顯示的編碼皆為描述性、編碼間的聯(lián)系過于簡單、分析性少,則復雜性指標得分低;如果概念網(wǎng)交錯,抽象的理論類屬涵蓋了一系列編碼和概念,則復雜性指標得分高。如果備忘錄或世界觀圖中的概念語言看起來毫無問題且單向,則微妙性指標得分低;但如果概念語言理解起來豐富,甚至略顯模糊和多面,則微妙性指標得分高。如果涌現(xiàn)的理論與既有文獻和理論框架關(guān)聯(lián)低,無法呼應后兩者,則回應性指標得分低;反之,如果涌現(xiàn)的理論與既有文獻有實質(zhì)性對話,與其他理論框架有聯(lián)系,甚至能帶來變體和創(chuàng)新,則回應性指標得分高。如果研究發(fā)現(xiàn)理論化程度低,內(nèi)向,對研究參與者或其他相似背景下的人不適用,則效度指標得分低;如果研究發(fā)現(xiàn)在抽象層面有理論化,外向,對那些在同一或相似社會環(huán)境下的人而言亦適用,則效度指標得分高。通過這五個指標的綜合判斷,研究人員即有可能把握具體研究的飽和狀況。需要指出的是,尼爾森所提供的概念深度量表,相對于結(jié)構(gòu)性編碼本和飽和表更加脫離具體的數(shù)據(jù)分析過程,更加依賴研究者在數(shù)據(jù)分析工作結(jié)束后就飽和狀況依指標做逐項判斷。但較之于后兩者又更加考慮理論的生成和發(fā)展的狀況,尤為適合采信理論飽和模式的研究。
表7 概念深度量表舉例(Nelson,2017)
當前,在質(zhì)性研究人員中間,對飽和依然存在不少爭議。這些爭議既事關(guān)概念,也事關(guān)操作,既事關(guān)應然,也事關(guān)實然。對這些爭議進行初步梳理并加以分析,當有助于研究人員更好地認識飽和概念并思考如何改善其操作。
圍繞飽和的第一個爭議存在于概念層面:在性質(zhì)上,飽和到底可算一次“事件”還是一個“過程”?在大部分情況下,當提及飽和概念時,研究人員普遍會將其與“點”聯(lián)系起來,意思是,飽和在本質(zhì)上是非連續(xù)性質(zhì)的“事件”(Jassim & Whitford,2014)。傳統(tǒng)上,“沒有新主題”“沒有新編碼”等提法和對理論類屬“完整性”“全面性”與“充分”的追求的表述都易使研究人員認為飽和是一次事件—當達到飽和“點”后,新主題和新編碼都不會再出現(xiàn),作為理論生成和發(fā)展基礎(chǔ)的理論類屬也獲得了完整性和全面性。但不斷有研究人員就此認識提出質(zhì)疑,指出飽和在本質(zhì)上應是一個過程—而且是未盡的過程。例如,斯特勞斯和科賓(Strauss & Corbin,1998,pp. 325?326)在論及飽和時提到,最好將《發(fā)現(xiàn)扎根理論:質(zhì)性研究策略》中理論飽和的概念理解為一個“度”的概念。尼爾森(Nelson,2017)曾直接指出,飽和應當是一個連續(xù)體和過程,對“點”或者“完整性”的追求都是對飽和的錯誤的靜態(tài)的理解。我們認為,至少有兩點理由可以使我們相信“度”而非“點”亦即“過程”而非“事件”更能把握飽和的本質(zhì)。首先,正如在前文的梳理中所提到的,主題的涌現(xiàn)不會突然停止,只要一直推進數(shù)據(jù)收集工作,新的信息會持續(xù)出現(xiàn)—只不過邊際效益會一直遞減。新料不可避免,只是進展有度—當新數(shù)據(jù)無法持續(xù)帶來與理論類屬發(fā)展相關(guān)的新料時,我們可以考慮暫停/終止數(shù)據(jù)收集工作(Strauss & Corbin,1998,p.113)。其次,研究者通過生成和發(fā)展理論獲得對社會過程的深度理解。理論分析工作不會突然變得“豐富”“富有洞見”,只會變得“更加豐富”“更有洞見”。這與質(zhì)性研究的認識論基礎(chǔ)有著密切關(guān)聯(lián)—理論的意義不是不證自明的,它依賴研究者不斷地發(fā)掘,理論本身是建構(gòu)性的和情景化的(Low,2019)。就此而言,新意義總可挖掘,理論可以變得更加豐富、更有深度。這也是為什么后來者主張以“理論充分度”或“概念密度”或“概念深度”來取代“飽和”的重要原因(Dey,1999,p. 257;Nelson,2017)。
圍繞飽和的第二個爭議依然存在于概念層面:飽和本質(zhì)上是一個“數(shù)量”概念還是一個“質(zhì)量”概念?長久以來,在論及飽和時,研究人員較為關(guān)心的核心問題還是兩個層面的數(shù)量:首先,數(shù)據(jù)收集時的樣本量—多大的樣本合適?其次,數(shù)據(jù)分析時編碼和主題的新增情況—是否沒有新增編碼和主題出現(xiàn)?也正是因此,不少研究人員指出,飽和本質(zhì)上是個數(shù)量概念,在研究飽和時,他們將重心放在編碼和主題涌現(xiàn)的數(shù)量及其隨樣本量增加而發(fā)生變動的基本規(guī)律這一問題上(Hancock et al.,2016)。但布爾邁斯特和艾特肯(Burmeister & Aitken,2012)則指出,飽和本身跟數(shù)據(jù)的深度有關(guān)。奧萊理和帕克(O’Reilly & Parker,2012)指出飽和首要的關(guān)切應當是信息的充分程度。富士和尼斯(Fusch & Ness,2015)更是強調(diào),數(shù)據(jù)本身的豐富性—多層、錯綜、細節(jié)和入微才是飽和要更為關(guān)切的。我們認為,應當重歸飽和概念的理論源頭:大樣本或者小樣本都不能保證飽和,樣本量多并不等于數(shù)據(jù)充分,也沒有一個適合所有類型質(zhì)性研究的樣本量標準。樣本的選取更應看重數(shù)據(jù)的質(zhì)量而非數(shù)量、要有利于理論的生成和發(fā)展—數(shù)據(jù)的充分、豐富與深度都是針對理論發(fā)展需要而言的。即便是將飽和落在樣本層面,選樣的基本邏輯也應當是所選參與者帶來的信息能夠充分地表征研究問題(Fossey et al.,2002;Morse,2015b)。即便考慮數(shù)量,其基本目的也在于充分地展現(xiàn)各種類型、變體而非讓其大到帶來重復性的信息(Morse,1994,pp. 220?235)。
圍繞飽和展開的第三個爭議存在于實踐層面:飽和到底是“先見之明”還是“事后諸葛”?不少機構(gòu)已經(jīng)關(guān)注到了質(zhì)性研究和量化研究在抽樣時的差異—不僅體現(xiàn)在是否采用概率抽樣、追求數(shù)據(jù)上的可推廣性上,也體現(xiàn)在何時能夠判斷樣本量大小需要(量化研究通常在研究設(shè)計階段就要決定樣本量,而質(zhì)性研究一般則是在數(shù)據(jù)收集過程中形成對合適樣本量的判斷)。但正如哈默斯利所言,“先見之明”既是“研究體制”的要求—資助者通常要求研究人員在撰寫研究申請時就樣本和成本做出預估,也是實證范式影響下研究人員對研究流程的固有認識—對于研究中的樣本量應當有一定的“預見性”,它有助于研究人員知道何地、何時可以停止收集樣本,這有助于降低研究中的“不確定性”。不過,更為常見的情形是,大部分研究者的實踐是“事后諸葛”—意即研究者聲稱在已達理論飽和的情形下,再繼續(xù)多開展數(shù)據(jù)收集工作,有意在達到所謂的飽和之后繼續(xù)抽樣,以證明自身抽樣決定的合理性(Tutton et al.,2012;Naegeli et al.,2013;Jassim & Whiteford,2014;Vandecasteele et al.,2015)。由于對達成飽和的細節(jié)不做交代,這讓飽和看來只是一個研究的合法性修辭。我們認為,飽和本身應當是具體的方法論實踐,在研究的計劃階段,就樣本量的范圍做適當預估是可行的,也是必須的。在《發(fā)現(xiàn)扎根理論:質(zhì)性研究策略》一書中,格拉澤和斯特勞斯也指出,假如沒有能力計劃研究—對樣本量、數(shù)據(jù)收集和分析所需時間做出預估—會是研究計劃和研究倫理中的重要缺陷(Glaser &Strauss,1967,p. 61)。但亦須指出,在質(zhì)性研究中事先預估的樣本量是個范圍概念,也并不代表對何時達至飽和的準確預計,具體樣本量的決定要等到數(shù)據(jù)收集工作開始,對飽和有所判斷時才能做出。
由于契合質(zhì)性研究的本體論和認識論基礎(chǔ)(Constantinou et al.,2017),飽和業(yè)已成為判斷質(zhì)性研究質(zhì)量的重要標準,被當作是質(zhì)性研究中樣本選取的重要依據(jù)(Vasileiou et al.,2018)。美國心理學會公共傳媒委員會工作小組制定的《質(zhì)性研究文章匯報標準》更是建議研究人員就停止收集數(shù)據(jù)的原因和達至飽和的過程做出說明(Levitt et al.,2018)。這樣,在研究過程中清晰記錄和判斷飽和狀態(tài)并對其進行說明逐漸成為英文發(fā)表的標準要求之一。中文質(zhì)性研究也應當重視飽和概念,并對取得飽和的過程進行清晰陳述,這有助于提升其規(guī)范性、透明度、質(zhì)量和認可度。