亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        打開教育政策研究的“黑盒子” *
        ——基于理論的影響評估在隨機干預實驗研究中的應用

        2020-08-28 01:19:12馬成俊
        關(guān)鍵詞:黑盒子養(yǎng)育機制

        湯 蕾 馬 靜 劉 涵 岳 愛 白 鈺 孟 春 馬成俊

        (1. 陜西師范大學教育實驗經(jīng)濟研究所,西安, 710119;2. 國務院發(fā)展研究中心宏觀經(jīng)濟研究部,北京, 100010;3. 青海民族大學法學院,西寧, 810007)

        一、引言

        影響評估旨在了解政策對參與者福利的影響,其關(guān)鍵在于建立兩者之間的因果關(guān)系,了解政策的作用機制。在各類影響評估方法中,隨機干預實驗方法(Randomized Controlled Trials,RCTs)通過將滿足一定樣本要求的參與者隨機分配到實驗組和控制組,構(gòu)建嚴格的“事實”和“反事實”,保證實驗組和控制組在末期評估時目標指標之間的統(tǒng)計學差異為政策或干預的凈影響,因而被稱為影響評估的“黃金準則”(Jones & Podolsky,2015)。一般認為,RCTs 方法在識別因果關(guān)系系數(shù)大小、精確估計政策平均影響(Average Treatment Effect,ATE)方面具有其他任何方法都難以企及的優(yōu)勢(Banerjee & Duflo,2009)。然而,該方法自進入社會政策研究的視野之初便飽受爭議(Heckman & Smith,1995)。爭議的焦點在于:隨機干預實驗相當于一個“黑箱”,使用這種方法的研究只能回答 “什么有效”,無法回答“為什么有效”。這就意味著人們既無法從中進一步了解人類行為的一般規(guī)律,也不確定這種政策能否推廣到其他樣本中(即外部有效性問題①),因而極大地削弱了隨機干預實驗研究的價值。

        最近十余年來,嚴謹?shù)挠绊懺u估領(lǐng)域的研究回應了這一問題。研究者們不僅尋求識別政策是否有效、效果大小,也越來越重視對政策作用機制的探索,了解政策有效或無效的原因。人們普遍認為,基于理論的影響評估(Theory-Based Impact Evaluation,TBIE)有助于回答“為什么有效”這一問題(White,2009)?;诶碚摰挠绊懺u估通過建立從投入到產(chǎn)出再到影響的因果鏈,使用實證數(shù)據(jù)檢驗在因果鏈中可能起作用的理論和潛在假設是否成立,來達到厘清干預項目作用機理的目的。

        本文旨在回顧和總結(jié)基于理論的影響評估的核心概念和原理,并結(jié)合RCTs 方法和具體實例,闡述在開展RCTs 時,如何基于理論探索干預項目的作用機制②。本文的第二部分是概念界定和理論闡述,提出了實施機制分析的四個階段以及其中包含的六個步驟(問題-目標-方法-因果鏈-過程評估-結(jié)果),作為應用基于理論的影響評估的核心工具。第三部分以一個兒童早期發(fā)展項目的分析為例,介紹研究團隊是如何分析其影響機理的。第四部分總結(jié)回顧基于理論的影響評估的要點,并進一步討論該方法目前在學術(shù)界的爭議,以引起研究者的思考。

        二、概念、理論和步驟

        (一)概念界定和理論闡述

        自上世紀八九十年代以來,基于理論的影響評估(TBIE)在影響評估領(lǐng)域受到越來越多的關(guān)注和認可,并逐漸成為指導項目執(zhí)行者和研究者開展項目、進行影響評估的主要準則(Chen,1990;Chen &Rossi,1992;Weiss,1995a;Weiss,1998;Carvalho & White,2004;White,2009)。該方法在不同的文獻中叫法不一,理論驅(qū)動的評估(Theory-Driven Evaluation)、項目理論評估(Program Theory Evaluation)、現(xiàn)實主義評估(Realist/Realistic Evaluation)、邏輯框架(Logical Framework)等都是經(jīng)常被引用的術(shù)語(Coryn et al.,2011)。本文沿用國際影響評估基金(3ie)的用法(White,2009),統(tǒng)一稱該方法為基于理論的影響評估。

        Weiss(1995a)清晰地說明了TBIE 得名的原因和它的核心原則:“社會項目理當基于能夠解釋該項目如何起作用以及為什么會起作用的顯性或隱性的理論,這是基于理論的影響評估的基礎(chǔ)。”他進一步指出,影響評估的基本步驟是盡可能詳細地羅列出所有可能的理論,識別項目起作用所必須的假設,然后收集盡可能多的中間環(huán)節(jié)的數(shù)據(jù),用實證的證據(jù)驗證影響背后的可能的理論機制是否成立以及在多大程度上成立。這個過程需要清晰地展示出該項目不同環(huán)節(jié)所依據(jù)的假設哪些成立、哪些不成立,最終確定項目起作用的詳細機制。該領(lǐng)域內(nèi)的其他研究者也表達了大同小異的觀點。如Pawson 和Tilley(1997) 提出使用背景-機制-結(jié)果(Context Mechanism Outcome,CMO)結(jié)構(gòu)來梳理項目中存在的因果關(guān)系。其中,背景與Weiss 理論中的假設類似,不同背景有可能觸發(fā)不同的作用機制;評估的關(guān)鍵是了解背景與作用機制如何有差異地相互作用以產(chǎn)生最終的結(jié)果。Gertler(2016)認為,基于理論的影響評估(TBIE)的核心是構(gòu)建變化理論(Theory of Change),詳細描述導致結(jié)果的一系列事件,探索背后的條件和假設,在此基礎(chǔ)上明確因果邏輯,再沿著邏輯路徑規(guī)劃干預項目;變化理論要搞清干預措施的投入、產(chǎn)出、受益人預期的行為改變以及所產(chǎn)生的結(jié)果。

        雖然研究者們對于TBIE 方法已基本達成共識,但由于不同項目的背景不同、進行影響評估的目標不同,研究者會根據(jù)項目側(cè)重點選擇性地重視TBIE 方法的不同要素,因而TBIE 方法目前還沒有形成一個放之四海而皆準的框架(Rogers,2008;Coryn et al.,2011)?;诖耍覀儗⒀芯恳暯蔷劢褂谑褂肦CTs 進行的影響評估項目,介紹如何在這些項目中使用TBIE 方法進行作用機制的分析。

        需要特別明確的是,RCTs 通過提出干預方法,實施干預項目,評估項目“是否有效”和“為什么有效”,提出科學的解決社會問題的方法。也就是說,RCTs 本身就包含了“影響評估”這個環(huán)節(jié);在RCTs中使用TBIE 方法只是進一步明確了“為什么有效”。因此,不同于其他一些由中立的第三方進行的影響評估,RCTs 的評估者往往就是項目的設計者或者會深度參與其他機構(gòu)的項目設計;影響評估的工作也不是在項目結(jié)束之后才開始的,而是在干預項目開始之前,項目團隊就需要通盤考慮項目的作用機制和有可能影響項目有效性的因素,通過理順因果邏輯關(guān)系,確定可能有效的干預方案③。從這個意義上說,實踐基于理論的影響評估方法,不僅是打開“黑盒子”的要求,也是幫助干預項目成功的必要保障。因此,本文提出的基于RCTs 的機制分析方法,在某種程度上也是站在實驗設計的角度進行思考,本文也會用相當?shù)钠榻B項目設計中與機制分析相關(guān)的要素。

        基于RCTs 的作用機制分析可以分為四個階段(見表1)。第一個階段需要對文獻和已有研究進行梳理,與利益相關(guān)方討論并初步開展個案訪談,以識別目標對象面臨的真實困難和問題,提出研究的問題,探尋問題的成因,并基于此確定干預的目標和方案。第二個階段需要初步建立變化理論,勾畫項目的因果鏈,明確項目從投入到產(chǎn)生結(jié)果變化會經(jīng)歷哪些環(huán)節(jié),以及各環(huán)節(jié)之間的因果關(guān)聯(lián)(即假設)。第三個階段需要通過定性研究檢測項目是否按照計劃開展,是否符合第二階段的變化理論假設。這一過程通常被稱為過程評估。過程評估的結(jié)果可以幫助我們在進行定量數(shù)據(jù)收集前,進一步完善變化理論。第四個階段是定量數(shù)據(jù)的收集,并基于數(shù)據(jù)進行作用機制的分析。下面,我們將按照這個流程依次介紹影響評估的核心要素。

        表1 項目設計與作用機制分析的不同階段

        (二)四個階段

        1. 提出問題,界定目標,確定干預方法

        提出問題

        我們對項目的思考首先從明確問題(Problems)開始:項目或社會政策的目標通常是為了解決目標對象所面對的實際困難和真實的問題。社會問題的復雜性決定了梳理問題并找到解決問題的切入口,比“項目內(nèi)容是什么”“怎么做這個項目”重要得多。

        一個有清晰定義的問題應該梳理四個方面的內(nèi)容(李志艷,2015;Gertler,2016)。首先是問題的現(xiàn)狀和背景。項目所關(guān)心的是誰的問題?在回答這個問題時,需要將主觀認為的問題與目標對象真實的問題分開;需要具體而不是籠統(tǒng)地描述目標對象,比如,“留守兒童”是一個籠統(tǒng)的對象,因為不同年齡段或父母外出類型不同的留守兒童面臨不同挑戰(zhàn)(高玉娟等,2018;Bai et al.,2019;Yue et al.,2020);需要區(qū)別過程對象與最終目標對象,比如在兒童早期發(fā)展項目中,過程對象可以是父母,而最終目標對象是孩子。除了明確問題的對象,項目還需要明確所關(guān)心的問題是什么?即目標對象究竟存在哪些有待改善的問題。首先要區(qū)分期望和問題。比如,鄉(xiāng)村醫(yī)生的醫(yī)學知識有待提高是一個期望,而不是他們的具體困難。經(jīng)過深入調(diào)研會發(fā)現(xiàn),鄉(xiāng)村醫(yī)生群體培訓機會少,知識更新和積累不夠,從而造成診斷率低(史耀疆等,2016),這才是真正的問題。其次,在描述問題的現(xiàn)狀與背景時,需要回答有多少目標對象正在面對這個問題,項目的經(jīng)濟和政策背景是什么,等等。以上這些都需要調(diào)研和數(shù)據(jù)的支持。

        其次是問題的重要性,即如果我們不解決這個問題會給個人和社會帶來嚴重不良后果,那么這個問題就是 “真問題”。比如研究證明農(nóng)村兒童學業(yè)表現(xiàn)不佳會降低他們最終的受教育水平和人力資本積累,影響未來收入,因此兒童在校的學業(yè)表現(xiàn)不佳是一個重要的需要被解決的問題(張林秀等,2014)。

        再次是問題產(chǎn)生的原因/干預機會。解決問題的前提是清楚了解問題產(chǎn)生的根源/原因。比如同樣是學業(yè)表現(xiàn)不佳,有的學生是因為近視未得到矯正,有的學生是因為營養(yǎng)不良造成了注意力不集中、缺乏能量,有的學生是因為非認知能力發(fā)展不足,因此針對不同群體的實際情況需要解決不同的問題(張林秀等,2009;Ma et al.,2014;白鈺 等,2020)。此外,問題的成因可以歸類為直接原因(特定時間、特定地區(qū)、特定組織以及特定人群層面存在的原因)和根本原因(體制、政策、制度及文化等深層次的原因)。一般而言,項目通常無法解決“根本原因”,只能針對“直接原因”進行干預。比如貧困可能是導致農(nóng)村兒童營養(yǎng)不良問題的根本原因,但貧困問題的解決需要各方力量的積極參與,不是一個項目所能解決的。因此,項目通常以直接原因為切入點,如維生素攝入不足等,設計干預項目,改善兒童的營養(yǎng)健康狀況(Lin et al.,2007;史耀疆等,2013)。

        最后是梳理其他機構(gòu)/組織對該問題的解決辦法以及利益相關(guān)方。很多時候研究不需要從零開始。在研究開始之前,我們需要梳理如下內(nèi)容:是否已經(jīng)有其他機構(gòu)/組織在嘗試解決這個問題?他們是從哪些方面來解決這個問題的?解決方法能夠達成什么樣的目標,是否有效,為什么有效或者無效,成本收益如何等? 哪些利益相關(guān)方會關(guān)心這個問題的解決?這些問題的答案能夠幫助項目設計者確定可能的干預方法。我們需要利益相關(guān)方參與討論問題,以達成共識,這對于問題識別、項目目標確定、項目干預設計和順利實施都是必要的。

        界定目標

        當問題明確后,需要界定項目的目標。項目目標應該是目標對象的某些指標的改善。目標不是想做的事情(即活動),而是期望推動的變化(即影響)。通常一個好的項目要盡可能地聚焦項目期望帶來的改變,而不應有過多的目標,過多的目標意味著項目實施常常會同時進行多種干預,這不僅無法準確評估每種干預方案的效果,在項目無效的情況下也無法準確識別項目可優(yōu)化的環(huán)節(jié)進而改進項目。合理選擇預期的結(jié)果變量是保證項目效果可量化的關(guān)鍵。結(jié)果變量的選擇應滿足“SMART”原則(Gertler,2016)。具體來講,結(jié)果變量需要具體化(Specific),盡可能的測量所需的信息;需要可測量(Measurable),確保信息容易獲得,具有可操作性和可觀測性;需要可歸因(Attributable),確保每一個指標都能夠關(guān)聯(lián)項目因果鏈(在下一個階段中介紹)上的每個環(huán)節(jié),即能夠跟蹤觀察到的任何項目結(jié)果的因果邏輯;需要具有可行性(Realistic),確保以合理的頻率及合理的成本及時獲取數(shù)據(jù);需要有針對性(Targeted),即瞄準目標人群。在選擇指標時,重要的是要順著因果鏈確定所有的指標,以便能夠跟蹤觀察項目結(jié)果的因果邏輯。

        確定干預方法

        當問題和目標清晰之后,項目組需要選擇一種合適的干預方式來推動目標群體產(chǎn)生項目所希望的改變。一般來說,干預方式的選取可以遵循如下幾個原則:首先,了解相關(guān)領(lǐng)域已經(jīng)進行過的干預和影響評估,分析之前干預有效/無效的原因,這將會為我們從多種干預手段中選取最合適的干預手段提供參考。比如,如果已經(jīng)有大量研究證明,基于培訓的信息干預完全無效,則應當盡量排除信息干預或者改進信息干預的手段,如使用手機短信提高干預頻率、將信息干預與有獎問答等激勵手段結(jié)合起來等(Mo et al.,2014a;Zhou et al.,2016;Guan et al.,2018)。其次,依據(jù)問題產(chǎn)生的原因,選擇有理論基礎(chǔ)的干預手段。如果干預手段背后沒有理論支持,那么可以預見項目難以產(chǎn)生期望的效果,不僅無法為解決科學問題作出新貢獻,也是巨大的資源浪費。比如,想要解決兒童貧血問題,最佳的干預手段是補充早已有了大量科學證據(jù)支持的鐵元素,而不是其他宏量元素如碳水化合物和蛋白質(zhì)等(Stanley et al.,2003;Luo et al.,2017a)。再次,針對多個同樣重要的問題、多個可能有效的干預方法,究竟選擇哪個方法需要研究者權(quán)衡取舍。此時可以結(jié)合研究者對學術(shù)問題的把握(如哪個理論是最迫切需要得到驗證的)、自身的立場、學術(shù)團隊的比較優(yōu)勢、政策環(huán)境、預算、成本效益分析等進行綜合考慮。

        2. 初步建立因果鏈

        如果研究者只想知道項目的平均效果(是否有效),那么只需要實施RCTs 項目,并在干預前后收集關(guān)于實驗組和控制組目標對象的結(jié)果變量的信息,就可以準確地獲得對于項目效果的估計(具備內(nèi)部有效性)。

        然而,影響評估不僅要知道項目的平均影響是什么,更需要了解項目為什么有效或無效,即項目干預的作用機制。因此,本文引入變化理論(Theory of Change)的觀點來理解項目的影響。變化理論認為,必須將從投入到產(chǎn)出的過程分解為微小的步驟,并且找出干預項目在各步驟之間傳導所需要滿足的假設,才能理解干預項目的作用機制(Weiss,1995b;Rogers,2014;Gertler,2016)。具體而言,影響評估需要將干預分解成若干個可以用簡單理論所闡釋的環(huán)節(jié),列出每個環(huán)節(jié)成立的假設,找到足夠的可監(jiān)測的中間變量,并用這些變量的具體數(shù)據(jù)對作用機制進行驗證,才能弄清楚整個過程當中的因果關(guān)系。此外,從確保干預有效性的角度來看,雖然干預方法往往可以用一句話來簡單概括(比如“實施計算機輔助學習項目改善學生成績”),但具體的實施過程需要經(jīng)過很多個環(huán)節(jié)(如確保充足的硬件設備、設計合理的輔助學習軟件、與校長老師溝通保證每周一定的項目時長等),這中間任意一個環(huán)節(jié)出現(xiàn)問題都會導致整個干預過程無法順利產(chǎn)生預想的結(jié)果,從而干擾我們對理論機制的正確判斷(如項目沒有效果可能是由于在現(xiàn)有的環(huán)境下教師不愿意讓學生進行計算機輔助學習,而不是計算機輔助學習這種方法本身無效)(Lai et al.,2013;Mo et al.,2014b)。

        變化理論要求在項目正式實施之前構(gòu)建詳細的基于干預方式的從投入到產(chǎn)出的因果鏈。因果鏈通過一系列的方盒子或是表格形式來呈現(xiàn)項目變化的各個環(huán)節(jié)(Khandker et al.,2010;Gertler et al.,2016)。因果鏈分析的第一步是列出項目從投入到產(chǎn)出的一系列環(huán)節(jié)(見圖1),主要包括:

        圖1 因果鏈的基本要素和邏輯關(guān)聯(lián)

        (1)項目投入環(huán)節(jié),通常包含項目預算、資金、人力、物資、政策等的投入;

        (2)項目活動環(huán)節(jié),也就是項目針對問題的成因所設計的項目干預方案的開展階段,即項目供給方做了什么;

        (3)項目產(chǎn)出環(huán)節(jié),通常包含項目活動產(chǎn)生的直接服務或商品(Supply-Side Outputs),例如多少人參與了項目開展的活動,項目的受益人數(shù)是多少,等等;

        (4)項目結(jié)果環(huán)節(jié),通常包含項目的短期、中期和長期結(jié)果的改變,也就是項目的過程對象和最終對象產(chǎn)生的改變(Demand-Side Outcomes)。

        在構(gòu)建因果鏈各環(huán)節(jié)的過程中,第3 步的項目產(chǎn)出和第4 步的項目結(jié)果的劃分經(jīng)常不能涇渭分明。我們一般按照項目供給方和需求方誰有更多影響來區(qū)別。項目產(chǎn)出通常是項目供給方可以直接控制和影響的,例如多少人實際參與了項目開展的活動、項目的受益人數(shù)是多少等。而項目結(jié)果通常是需求方(項目受益方)的變化,主要取決于項目受益人的觀念、知識和行為的改變,通常是項目供給方無法直接控制和影響的。

        在構(gòu)建因果鏈的各個環(huán)節(jié)時,我們還會發(fā)現(xiàn),長期結(jié)果通常比為達成長期結(jié)果的先前環(huán)節(jié)更容易確定。這是因為,一旦我們明確了目標對象所面臨的困難和現(xiàn)狀,長期結(jié)果就是推動目標對象現(xiàn)狀的改變(即項目總目標)。而對于推動這種改變的過程(或先前環(huán)節(jié)),通??梢栽诔醮谓⒁蚬湑r,使用倒推法來確定(李志艷,2015)。倒推法是從長期結(jié)果開始,依據(jù)理論建立從投入到結(jié)果各個環(huán)節(jié)間的邏輯關(guān)系,使用“如果,那么”的句式來進行邏輯推演。比如,如果要改善兒童的早期發(fā)展狀況,那么我們需要先達成什么樣的中期結(jié)果(即前提條件)。

        在構(gòu)建因果鏈的各環(huán)節(jié)后,好的因果鏈還應該幫助我們清晰了解作用機制中隱含的前提假設,可能導致預期結(jié)果無法實現(xiàn)的外部環(huán)境(即因果鏈斷裂的可能原因),以及使項目效果產(chǎn)生異質(zhì)性的背景信息。因此,構(gòu)建因果鏈的第二個重要步驟是建立各個環(huán)節(jié)之間的邏輯關(guān)聯(lián),即明確前一個環(huán)節(jié)能夠保證下一個環(huán)節(jié)實現(xiàn)的假設條件,這包含一切能夠保證項目成功的條件和資源。例如,持續(xù)穩(wěn)定的資金,培訓和項目活動內(nèi)容通俗易懂,社區(qū)資源的可及性,等等。假設同樣與影響項目預期結(jié)果的外部環(huán)境,如當?shù)氐恼Z言、文化、經(jīng)濟和政策環(huán)境等息息相關(guān)。例如,少數(shù)民族地區(qū)兒童的普通話水平較低,同一培訓項目在漢族地區(qū)和民族地區(qū)就會有很大差異。這些外部因素通常不能被一個實驗項目所左右,但是實驗項目應當充分考慮這些因素的影響,并盡可能調(diào)整項目方案,以保證實施方案對外部環(huán)境的適配性。

        假設條件在因果鏈分析中具有十分重要的地位。如果想要確認因果鏈中的每一環(huán)在什么樣的情境下成立,必須清楚明白地說明每一環(huán)的假設是什么(Weiss,1995b)。充分地思考假設條件可以使我們更好地理解異質(zhì)性問題:項目之所以對不同群體產(chǎn)生差異性的影響,可以被分解為不同群體滿足因果鏈上各個假設的程度不同。假設對解決外部有效性的問題也十分關(guān)鍵:在干預項目成功、因果鏈明確的情況下,如果新樣本也滿足這些假設,那么該項目應該也可以對新樣本產(chǎn)生類似的作用。假設條件的檢驗指標也應滿足SMART 原則,以有效用于數(shù)據(jù)分析過程中的檢驗(見四個階段第1 點)。

        3.過程評估

        對個體行為、外部環(huán)境的假設和對前提假設的分析,都要以事實為基礎(chǔ),也要接受事實的檢驗。如果與事實不符,因果鏈從根子上就是錯的。最理想的是我們提前掌握關(guān)于這些假設的數(shù)據(jù),但現(xiàn)實中我們往往需要在項目實施過程中了解這些信息。

        過程評估是在大規(guī)模收集定量數(shù)據(jù)之前,為完善前一階段初步搭建的因果鏈而進行的定性研究。這個階段通??梢栽陧椖吭囘\行階段進行,收集關(guān)于干預實施情況、家庭接受度、可持續(xù)性以及作用機制和背景的數(shù)據(jù)。在傳統(tǒng)的試驗中,過程評估被用來檢查干預的保真度(Fidelity,即執(zhí)行符合干預方案設計的程度),用以確定影響項目有效性的因素是項目方案的設計問題還是項目方案的執(zhí)行問題。然而,在作用機制分析中,過程評估將超越這一步,用來探索干預作用機制以及這些機制如何與環(huán)境相互作用以產(chǎn)生結(jié)果(或未能產(chǎn)生結(jié)果)。定性研究更能深入把握研究參與者自身的能動性,以及這種能動性如何與干預背景的社會結(jié)構(gòu)相聯(lián)系。因此,使用定性研究方法可以提出并驗證一系列關(guān)于我們的干預可能起作用的復雜機制的假設,包括我們在前一階段沒有預料到的問題(例如,參與者的性別、 項目是否是政府的項目等)。這一階段收集數(shù)據(jù)的方法通常包含項目利益相關(guān)方的一對一訪談、焦點小組訪談或觀察、監(jiān)測因果鏈設定的項目執(zhí)行的核心指標、個案研究等。

        4. 數(shù)據(jù)收集和作用機制分析

        數(shù)據(jù)信息的收集應涵蓋從干預實施前到到干預實施結(jié)束的全過程。研究團隊應當依據(jù)因果鏈設定的關(guān)鍵指標,在不同階段收集定量數(shù)據(jù),以便進行作用機制的分析。在這個過程中,重要的是數(shù)據(jù)的收集和分析一定要緊扣因果鏈的環(huán)節(jié)和假設。

        基于過程和結(jié)果變量的定量數(shù)據(jù)的收集,不僅可用于評估項目的平均效果,更重要的是可以建立中間過程理論(Merton,1967;Bonell et al.,2012)。在數(shù)據(jù)收集后,有很多不同的方法來進行機制分析。RCTs 中較為常用的分析方法是調(diào)節(jié)效應分析(Moderator Analysis,環(huán)境和背景的異質(zhì)性分析)和中介效應分析(Mediation Analysis,檢測作用機制)(Shah et al.,2015)。當然,也有研究通過建模和模擬的方法進行機制分析(Attanasio et al.,2018)。使用何種方法進行分析可以作為一個單獨的話題來討論,本文僅對前兩種常用方法進行簡單闡述。

        中介效應分析

        因果中介分析(Causal Mediation Analysis)需要列出干預方案和結(jié)果之間因果路徑中的過程或中介變量(Baron & Kenny,1986;Frazier et al.,2004;Bauer et al.,2006),分析干預方案對于結(jié)果的改變究竟是由哪些過程和中間變化導致的(如圖2)。中介變量(Mediators)是在基線調(diào)研之后測量的,是干預影響最終結(jié)果的途徑(Lee et al.,2019)。例如在教師激勵項目中,中介分析將評估教師激勵方案對學生成績的影響是否可以由以下中間效應來解釋:教師投入的時間、使用材料的難易、教學方法的變化、學校本身的激勵方案可能存在的擠出效應等。在給定的社會背景下,中介分析測量了潛在的變化機制,幫助我們理解哪些機制對結(jié)果的影響是至關(guān)重要的。這些信息可以幫助評估人員明確因果路徑,完善變化理論,從而將重點放在干預措施的有效路徑上,消除無效成分和無關(guān)緊要的機制。

        圖2 中介和調(diào)節(jié)效應分析

        調(diào)節(jié)效應分析

        如果說對中介變量(Mediators)的分析是嘗試建立干預“如何”以及“為什么”能影響結(jié)果變化,那么對調(diào)節(jié)變量(Moderators)進行分析則是關(guān)注干預措施會在“何時”以及對“哪些人群”的結(jié)果有不同的影響(Frazier et al.,2004)(如圖2)。調(diào)節(jié)變量通常是基線調(diào)研時收集的變量,這些變量可能會改變干預對結(jié)果變量的影響方向或大?。‵razier et al.,2004)。因此,該分析可以使研究者跨越總體的平均效果分析,以進一步探索干預對結(jié)果影響的異質(zhì)性,理解干預方案究竟對哪些人、在什么環(huán)境下是最有效果的。

        在RCTs 中,調(diào)節(jié)效應可以通過在多元回歸中添加干預變量與背景變量的交互項來進行分析(Glennerster & Takavarasha,2013)。因為RCTs 的干預組和對照組是隨機分配的,如果我們用于分析的調(diào)節(jié)變量與分配變量不相關(guān),那么交互項的結(jié)果是具有因果推斷性的。

        三、TBIE 方法應用:以“養(yǎng)育未來整縣覆蓋隨機干預實驗項目”在中國的實踐為例

        我們將以秦巴山區(qū)一個國家級貧困縣的0—3 歲兒童早期發(fā)展整縣覆蓋項目④為例,按照表1 中的幾個關(guān)鍵環(huán)節(jié)來呈現(xiàn)TBIE 方法的應用過程。

        1. 提出問題

        為什么關(guān)注中國農(nóng)村貧困地區(qū)0—3 歲嬰幼兒的早期綜合發(fā)展?根據(jù)《柳葉刀》(The Lancet)上發(fā)表的發(fā)展中國家兒童發(fā)展系列報告,個體生命最初的1000 天經(jīng)歷大腦的快速發(fā)育、突觸修剪和髓鞘形成等過程,是大腦可塑性最強的時期,也是多數(shù)能力(聽覺、視覺、語言、認知等)的最佳發(fā)展期(Grantham-McGregor et al.,2007)。已有研究指出,遺傳因素決定著兒童的發(fā)展?jié)撃?,而兒童發(fā)展的家庭及社會環(huán)境則決定兒童自身發(fā)展?jié)撃艿膶崿F(xiàn)程度(Walker et al.,2007;Black et al.,2013)。如果在這個關(guān)鍵期缺乏營養(yǎng)和有效刺激兒童發(fā)展的家庭及社會環(huán)境等要素,將對兒童未來的學業(yè)表現(xiàn)、人力資本的形成和積累以及成年后的收入水平產(chǎn)生很大的負面影響(Campbell et al.,2001;Engle et al.,2007;Horton,2008;Currie & Almond,2011)。

        那么中國農(nóng)村貧困地區(qū)兒童早期發(fā)展狀況如何?如果其發(fā)展存在問題,那么導致這個問題的直接原因又是什么?近年來國內(nèi)研究者開展了一系列關(guān)注兒童早期發(fā)展的研究,并且尤其關(guān)注中國農(nóng)村貧困地區(qū)0—3 歲嬰幼兒的早期發(fā)展。有研究指出我國農(nóng)村貧困地區(qū)兒童存在早期發(fā)展滯后風險的比例較高,且問題形成的直接原因與照養(yǎng)人缺乏科學的養(yǎng)育知識和技能進而缺少有效親子互動密切相關(guān),如不給孩子講故事、不給孩子唱歌、不與孩子玩耍等(Luo et al.,2017a;Luo et al.,2017b;Yue et al.,2017;Yue et al.,2019;李英等,2019;岳愛等,2019)?;诖?,改變兒童發(fā)展問題現(xiàn)狀的一個干預機會是對照養(yǎng)人的養(yǎng)育知識和行為進行干預。

        過去15 年中,中低收入國家開展的大規(guī)模的入戶和中心模式的嬰幼兒早期發(fā)展干預項目已經(jīng)證明,通過指導照養(yǎng)人進行科學養(yǎng)育能夠有效提高兒童早期的認知和語言發(fā)展能力(Reynolds et al.,2010;Walker et al.,2011;Gertler et al.,2011;Attanasio et al.,2014;Britto et al,2016;Sylvia et al.,2018)。政策制定者在早期干預項目的有效性上已不再爭論,但是高質(zhì)量的兒童早期干預項目如何能夠?qū)崿F(xiàn)規(guī)?;茝V和復制,尤其是在國家層面的推廣,仍是一個有待探索的問題。

        對于農(nóng)村貧困家庭而言,一方面因為社會化/市場化的兒童照護服務不足,另一方面由于經(jīng)濟原因,大多數(shù)家庭無法依靠購買優(yōu)質(zhì)的市場化服務來解決兒童照護問題,此時由政府提供普惠性服務是照養(yǎng)人能夠接受科學育兒指導的重要途徑,也是體現(xiàn)社會公平的途徑。然而由政府在貧困地區(qū)提供嬰幼兒早期發(fā)展的公共服務,將面臨服務數(shù)量龐大、提供服務的工作人員數(shù)量不足、組織和管理難度大等挑戰(zhàn)。一些發(fā)展中國家已經(jīng)開展了早期兒童發(fā)展方面的普惠性項目,例如古巴的Educa a tu Hijo 項目(Verch,2017)、巴西于2016 年啟動的面向400 萬兒童的大型全國性項目—快樂兒童項目(英文名稱為Happy Child Programme)(Verch,2017)。這些項目給開展兒童早期發(fā)展的公共政策制定提供了許多有價值的參考,然而這些項目目前還沒有經(jīng)過系統(tǒng)的影響評估,因此在項目效果、項目的作用機制以及其外部有效性方面還沒有形成經(jīng)過驗證的結(jié)論。因此,政府主導和執(zhí)行的普惠性的嬰幼兒干預項目還有待進一步的研究。

        研究團隊針對如何規(guī)?;剡M行嬰幼兒早期干預項目,聯(lián)合政府和公益機構(gòu)實施了“養(yǎng)育未來兒童早期發(fā)展整縣覆蓋項目試點”的探索研究(以下簡稱養(yǎng)育未來整縣項目)。研究團隊選擇了秦巴山區(qū)的一個貧困縣作為試點地區(qū),探索通過政府屬地管理免費為全縣所有6—36 月齡兒童及家庭提供服務的新模式(ISRCTN16736104,https://doi.org/10.1186/ISRCTN16736104)。在項目設計和實施階段,項目組與各利益相關(guān)方(包括政府管理人員、一線工作人員、公益機構(gòu)參與者、嬰幼兒照養(yǎng)人)進行多次探討,以期明確主要問題、確定干預目標、細化干預方法,并理解項目可能的作用機制。

        2. 界定目標并確定測量指標

        在厘清研究問題后,項目組對項目目標及衡量目標的指標進行了梳理。

        首先,項目的最終目標是改變0—3 歲嬰幼兒(最終目標對象)早期能力的發(fā)展水平,從而改變兒童的成長發(fā)展軌跡,阻斷貧困的代際傳遞,并最終提高我國人力資本的質(zhì)量。這是項目希望推動的變化。那么項目的短期目標是什么呢?將已有研究結(jié)論作為理論基礎(chǔ),運用倒推法可初步建立影響兒童發(fā)展的中間途徑。研究表明,在農(nóng)村地區(qū)的現(xiàn)實情況是0—3 歲兒童主要由家庭照養(yǎng)為主⑤,照養(yǎng)人的養(yǎng)育知識和技能以及家庭養(yǎng)育環(huán)境是影響嬰幼兒發(fā)展最直接和最重要的環(huán)節(jié)(Luo et al.,2017a;Luo et al.,2017b;Yue et al.,2017;Yue et al.,2019)。因此,項目的短期目標是改善照養(yǎng)人(過程對象)的養(yǎng)育知識、態(tài)度、行為和家庭的養(yǎng)育環(huán)境,希望通過推動過程對象的改變影響最終目標對象的發(fā)展。

        為衡量項目是否達成目標,目標還需要被轉(zhuǎn)化為可量化的指標。指標的選擇遵循SMART 原則,需要瞄準目標對象,反映項目目標,緊扣因果鏈,可量化且容易采集。項目組通過文獻梳理,確定了項目最終目標(兒童早期發(fā)展水平)的測量指標為嬰幼兒的運動、認知、語言、社會情感和適應性能力的發(fā)展,并選取被廣泛使用的、具有較高信效度的測評工具進行測量。項目組最終使用了多種量表進行嬰幼兒早期發(fā)展能力測評,包含:貝利嬰兒發(fā)展量表(Bayley Scales of Infant Development,BSID),年齡和階段問卷(Age and Stages Questionnaires,ASQ),年齡與階段問卷—社會情感(Age and Stages Questionnaires,ASQ-Social Emotion,ASQ-SE)和照養(yǎng)人報告兒童早期發(fā)展量表(The Caregiver Reported Early Development Instrument,CREDI)(Fernald et al.,2017)。項目選取多種量表對兒童發(fā)展能力進行測評,目標是進行穩(wěn)健性檢驗,并對不同量表的有效性進行對比。

        項目的短期目標為改善照養(yǎng)人的養(yǎng)育知識和技能。項目主要通過四項指標對其進行量化:養(yǎng)育知識、態(tài)度、行為以及家庭養(yǎng)育環(huán)境。基于信效度以及在中國實用性的考慮,項目組最終選取了嬰幼兒發(fā)展量表(Knowledge of Infant Development Inventory-Portuguese,KIDI-P)測量養(yǎng)育知識(Nobre-Lima et al.,2014);選取父母控制源量表(The Parental Locus of Control Scale)測量照養(yǎng)人的養(yǎng)育態(tài)度(Campis et al.,1986),選取家庭照護指標量表(Family Care Indicators,F(xiàn)CI)測量家庭養(yǎng)育環(huán)境和養(yǎng)育行為(Hamadani et al.,2010;Frongillo et al.,2014)。此外,主要照養(yǎng)人的心理健康水平是影響兒童早期發(fā)展水平的關(guān)鍵因素,干預也可能通過影響照養(yǎng)人的心理健康進而影響兒童早期發(fā)展(Cogill et al., 1986; Lovejoy et al., 2000; Yue et al., 2017; Zhang et al., 2018)。因此通常還會使用抑郁-焦慮-壓力量表(Depression Anxiety Stress Scale,DASS)等測量照養(yǎng)人的抑郁、焦慮、壓力傾向(甘雨等,2019)。

        3. 確定干預方案

        針對貧困地區(qū)兒童早期發(fā)展問題,為實現(xiàn)政府主導和實現(xiàn)為全縣所有適齡兒童及其家庭提供普惠性服務的目標,干預方案具體包含兩個方面。

        第一,以政府為主體負責項目的管理和執(zhí)行??h委、縣政府成立兒童早期發(fā)展工作領(lǐng)導小組,并在教育體育和科技局下設項目管理中心,進行社區(qū)動員以及日常管理,為項目實施提供保障,推動項目有序高效運行。

        第二,試點地區(qū)地處秦嶺中段南麓腹地、地廣人稀、高山低谷地貌為主的特點為覆蓋全縣所有適齡兒童及其家庭帶來挑戰(zhàn)。為實現(xiàn)全覆蓋,結(jié)合當?shù)厝宋牡乩韺嶋H情況,研究團隊因地制宜,采取了多種模式為家庭提供服務。首先,基于前期項目經(jīng)驗,招聘本地人提供服務是因果鏈中一個重要的環(huán)節(jié)。其優(yōu)勢在于,一方面為當?shù)亟鉀Q了就業(yè)問題,另一方面,由于他們熟悉當?shù)氐恼Z言、文化和地理環(huán)境,有助于提高溝通交流的效率,以落實全覆蓋的目標。政府和項目組共同在當?shù)爻W∪丝谥羞M行招聘,并對筆面試合格的人員進行培訓,在培訓合格后他們成為一線養(yǎng)育師為家庭提供兒童早期發(fā)展相關(guān)的課程和活動的服務(包含一對一親子課程和集體活動)。其次,由于51%的人口居住在城關(guān)鎮(zhèn),其他人口分散居住于其他鄉(xiāng)鎮(zhèn)和村里,因此需要因地制宜地確定服務提供的模式以實現(xiàn)全覆蓋?;谇捌陧椖康奶剿鹘?jīng)驗以及與當?shù)卣图彝サ奶接懀ㄊ芬龋?020),最終確定采用兩種服務模式。一種是在人口較密集地區(qū)采用養(yǎng)育中心與入戶家訪相結(jié)合的模式為家庭提供服務。以中心模式提供服務能夠提高服務家庭的數(shù)量,同時通過入戶走訪為這些地區(qū)自主參與有困難的家庭提供服務,以解決最后一公里的問題。二是在人口分散地區(qū)采用家訪與家庭小組活動相結(jié)合的方式。由于人口分散,這些地區(qū)的家庭很難聚集到養(yǎng)育中心參與課程和活動,因此養(yǎng)育師通過入戶為家庭提供一對一親子課程和閱讀課程的服務,并定期組織家庭共同開展集體活動,以解決人口分散地區(qū)的服務覆蓋面問題。

        4. 初步構(gòu)建項目干預的變化理論(因果鏈分析,White,2009;Gertler,2016)

        那么,項目的干預方案如何以及為什么能夠影響照養(yǎng)人(過程對象)的養(yǎng)育能力和嬰幼兒(目標對象)的能力發(fā)展?項目通過文獻梳理和前期研究結(jié)果初步搭建了項目干預的變化理論。表2 以表格的形式勾畫了項目因果鏈各環(huán)節(jié)的內(nèi)容、各環(huán)節(jié)因果關(guān)聯(lián)的假設、各環(huán)節(jié)的測量指標、影響項目效果的外部環(huán)境以及可能導致項目效果產(chǎn)生異質(zhì)性的背景信息。

        表2 養(yǎng)育未來整縣項目因果鏈

        典型的因果鏈像一個漏斗,任何一個環(huán)節(jié)的假設部分成立或不成立,都會導致下一個環(huán)節(jié)的斷裂和滲漏。因此項目組在文獻梳理和與相關(guān)利益方訪談的基礎(chǔ)上,對影響各環(huán)節(jié)邏輯關(guān)聯(lián)的假設條件進行了研究。從項目經(jīng)驗來看,活動是最容易發(fā)生滲漏和斷裂的環(huán)節(jié),因為這個環(huán)節(jié)最難以監(jiān)控和度量。養(yǎng)育未來整縣項目的核心活動是由養(yǎng)育師為照養(yǎng)人和兒童提供一對一課程和集體活動的服務。國內(nèi)外研究顯示,兒童早期發(fā)展干預項目的服務質(zhì)量會顯著影響照養(yǎng)人和兒童參與項目活動的頻率,并最終影響兒童的發(fā)展。

        在測量項目質(zhì)量的維度上,干預強度(Dosage)、內(nèi)容(Content)和關(guān)系(Relationship)三者被認為是影響兒童發(fā)展結(jié)果的重要方面(Paulsell et al.,2010)。其中,干預強度(D)表現(xiàn)為項目干預的頻次、時長等;內(nèi)容(C)表現(xiàn)為養(yǎng)育師是否準確無誤、通俗易懂地講解和示范了干預的材料內(nèi)容等;關(guān)系(R)表現(xiàn)為照養(yǎng)人、嬰幼兒與兒童早期發(fā)展服務提供者三者之間的相互關(guān)系。有關(guān)干預強度(D)的研究發(fā)現(xiàn),減少干預強度對兒童發(fā)展結(jié)果存在不利影響。例如,Brown 和 Liao(1999)的研究發(fā)現(xiàn),那些不定期或提前退出(減少干預強度)的家庭受項目的影響較小。Wallander 等人(2014)研究了印度、巴基斯坦和贊比亞的兒童在三歲前接受兩周家訪時照養(yǎng)人在指定活動上花費的時間與兒童發(fā)展結(jié)果之間的關(guān)系,結(jié)果發(fā)現(xiàn)照養(yǎng)人更頻繁地執(zhí)行所分配的活動的那些兒童通常有更好的表現(xiàn)(Riley et al.,2008;Paulsell et al.,2010)。有關(guān)關(guān)系(R)的研究發(fā)現(xiàn),兒童早期發(fā)展干預項目服務提供者與照養(yǎng)人之間穩(wěn)定的、尊重的、溫暖的、誠實的、開放的和回應性的關(guān)系是項目有效的核心,這種關(guān)系能為照養(yǎng)人賦能(Riley et al.,2008;Paulsell et al.,2010),能夠更成功地改變照養(yǎng)人的行為及更積極地影響兒童的發(fā)展(Peterson et al.,2007;Paulsell et al.,2010)。研究還發(fā)現(xiàn),如果在兒童早期發(fā)展干預服務提供期間的關(guān)系質(zhì)量不高,干預強度和內(nèi)容對孩子的結(jié)果影響則并不大(Roggman et al.,2008)。

        因此,項目變化理論將項目服務質(zhì)量(包含干預強度、內(nèi)容以及關(guān)系指標)設定為項目是否成功的重要前提假設。項目服務質(zhì)量低下將直接影響家庭和兒童參與項目活動的情況,從而影響照養(yǎng)人的養(yǎng)育知識和技能,進而影響兒童的發(fā)展。

        在影響嬰幼兒能力發(fā)展的因素中,家庭因素及生物學方面的因素也被廣泛研究。家庭是兒童社會化的初始壞境,是兒童獲得早期生活經(jīng)驗,建立人際關(guān)系,獲得最初的社會規(guī)范并形成行為習慣的主要場所。研究發(fā)現(xiàn)家庭環(huán)境因素在嬰幼兒期的影響力較遺傳因素更為重要(Neiss & Rowe,2000)。生物學因素方面,兒童氣質(zhì)是影響其心理發(fā)展的不容忽視的因素。研究發(fā)現(xiàn),兒童氣質(zhì)對社會性行為及人格的發(fā)展有著至關(guān)重要的作用(Sanson et al.,2002)。Stanhope 和 Parker-Cohen(1987)的研究表明,兒童氣質(zhì)與利他行為顯著相關(guān),愛交際的兒童表現(xiàn)出更多的利他行為。還有研究結(jié)果表明兒童氣質(zhì)與攻擊行為之間存在密切的聯(lián)系(Sanson et al.,2002)。因此,項目將家庭特征和兒童特征(包含兒童基本特征和兒童氣質(zhì)類型)作為影響項目大小的重要調(diào)節(jié)變量。

        基于前期項目經(jīng)驗和訪談,養(yǎng)育師作為項目質(zhì)量的保證,其能力素養(yǎng)也可能改變項目影響的方向和大小。社區(qū)外部環(huán)境也可能影響項目的執(zhí)行效果。因此,項目將養(yǎng)育師特征和社區(qū)特征設定為影響項目效果大小的重要背景信息。

        5. 過程評估(Process Evaluation):完善變化理論

        為驗證初步建立的因果鏈內(nèi)容和因果關(guān)聯(lián)的假設是否符合養(yǎng)育未來整縣項目初步建立的因果鏈,需要對因果鏈中最容易產(chǎn)生滲漏的活動環(huán)節(jié)開展過程評估。項目組通過與利益相關(guān)方(如一線工作人員、項目管理中心工作人員、項目執(zhí)行合作伙伴和政府機構(gòu)相關(guān)人員等)進行一對一和焦點小組訪談,形成質(zhì)性研究結(jié)論。研究結(jié)論細化了項目執(zhí)行過程中項目質(zhì)量模塊包含的內(nèi)容、能夠更好地衡量項目服務質(zhì)量的具體指標以及這些內(nèi)容可能會對項目產(chǎn)生重要影響的原因。衡量項目干預內(nèi)容(Content)是否被準確傳遞的指標包含一線養(yǎng)育師是否按照要求準確講解了活動目標、是否按照流程進行親子課程講授等。衡量項目干預強度(Dosage)的指標包含課程和活動參加頻次和時長、借繪本玩具回家的頻次、課后在家練習的頻次和時長等;衡量關(guān)系(Relationship)的指標包含家長與養(yǎng)育師的關(guān)系、兒童與養(yǎng)育師的關(guān)系、家長與家長之間的關(guān)系等。研究結(jié)論同時也發(fā)現(xiàn),項目干預可能存在溢出效應,即縣城地區(qū)由于人口密集,控制組在干預階段也可能受到了項目的影響。這些結(jié)論幫助項目組進一步細化了定量數(shù)據(jù)收集的內(nèi)容以及初步的分析計劃。

        6. 數(shù)據(jù)收集和作用機制分析

        以養(yǎng)育未來整縣項目為例,項目組在基線調(diào)研、項目執(zhí)行和追蹤調(diào)研階段,基于完善后的因果鏈所確定的不同環(huán)節(jié)的變量指標進行了定量數(shù)據(jù)收集。項目組在基線調(diào)研時通過問卷調(diào)查收集了家庭基本信息,家庭養(yǎng)育知識、觀念、環(huán)境和行為,兒童個人的基本特征和氣質(zhì)類型,社區(qū)特征和養(yǎng)育師特征等信息。在追蹤調(diào)研和項目執(zhí)行過程中,也收集了有關(guān)項目質(zhì)量的數(shù)據(jù),如家庭課程和活動參與時長(Dosage)、養(yǎng)育師服務內(nèi)容的質(zhì)量(Content)以及養(yǎng)育師與家庭的關(guān)系(Relationship)。這些變量是調(diào)節(jié)效應分析(即異質(zhì)性分析)的重要調(diào)節(jié)變量(moderators),能夠幫助我們理解干預措施會在“何時”以及對“哪些人群”的結(jié)果有不同的影響(Frazier et al.,2004)。這些調(diào)節(jié)變量可能會改變干預對結(jié)果變量的影響方向或大小(Frazier et al.,2004)。因此,該分析使研究者跨越總體的平均效果分析,進一步探索干預對結(jié)果影響的異質(zhì)性。

        在養(yǎng)育未來整縣項目中,根據(jù)因果鏈階段梳理的調(diào)節(jié)變量,我們通過在回歸分析中添加交互項進行調(diào)節(jié)效應分析。交互項為干預變量與基線收集的家庭特征(家庭收入水平、照養(yǎng)人的年齡和教育水平、照養(yǎng)人是否為母親等)、兒童特征(性別、氣質(zhì)類型等)、社區(qū)(農(nóng)村或縣城地區(qū))或養(yǎng)育師特征(入職筆試和面試成績、教育水平、是否有過幼兒相關(guān)工作經(jīng)歷等)等變量之間的交互。

        在項目實施和追蹤調(diào)研階段,項目組收集了因果鏈中有關(guān)中介變量的數(shù)據(jù)。項目組通過信息管理系統(tǒng)(包含基于面部識別的簽到設備),在項目實施階段持續(xù)收集了家庭參與項目課程和活動的頻次這一核心指標的數(shù)據(jù)。通過面部識別收集這些數(shù)據(jù)在一定程度上降低了數(shù)據(jù)測量的誤差,保證了數(shù)據(jù)的真實性。在追蹤調(diào)研時,項目組通過問卷調(diào)查收集了有關(guān)家庭和照養(yǎng)人的相關(guān)數(shù)據(jù),如照養(yǎng)人的養(yǎng)育知識(Knowledge)、態(tài)度(Attitude)和行為(Practice),以及家庭養(yǎng)育環(huán)境等核心指標的數(shù)據(jù)。這些變量是中介分析的重要中介變量(mediators),將用于項目的中介分析,幫助我們厘清項目的作用機制,回答以下問題:項目對兒童發(fā)展的影響是否主要通過改變照養(yǎng)人的知識、態(tài)度、行為或者養(yǎng)育環(huán)境的某一單一因素而實現(xiàn)?照養(yǎng)人的知識、態(tài)度、行為以及養(yǎng)育環(huán)境之間是否存在邏輯關(guān)聯(lián)?

        中介效應和調(diào)節(jié)效應分析的結(jié)果將是幫助我們確定項目干預有效和項目干預應該如何在不同人群中適配的關(guān)鍵因素。這些結(jié)論將幫助項目組完善項目實施手冊,為農(nóng)村貧困地區(qū)的嬰幼兒干預項目提供經(jīng)過實證分析驗證的、更加精準的、宜推廣的政策建議。當然,項目僅在一個貧困縣開展了研究,因此項目干預對于不同地區(qū)的影響仍是一個有待研究的問題。

        四、總結(jié)

        本文概述了基于理論的影響評估(TBIE)作為一種方法框架,在隨機干預實驗(RCTs)作用機制分析中的應用。需要明確的是,TBIE 的目標不是為了提供更好的反事實對照組(Counterfactuals)以提高分析的內(nèi)部有效性,也不是為了提高統(tǒng)計分析的功效,TBIE 的目標是理解一個項目或者一個政策的作用機制(Mechanisms),干預方案究竟是如何以及為什么會影響目標對象結(jié)果的變化,干預方案究竟對哪些人群、在何時何地會有不同的影響。其核心是以目標對象面臨的實際問題為導向、以變化理論為基礎(chǔ)來進行作用機制的分析和探討。本文對隨機干預實驗機制分析框架進行了概述,結(jié)果發(fā)現(xiàn),以問題為導向是社會項目和政策的初心,基于問題的成因建立的目標使得項目和政策的方向更加精準,變化理論則引導項目的實施,數(shù)據(jù)的收集和機制分析,最終產(chǎn)出的結(jié)果是對一個項目和政策的作用機制的理解,以便更好為政策和項目提出建議。在這個過程中,我們強調(diào)變化理論的建立需要基于經(jīng)過驗證的理論,而非未經(jīng)檢驗的假設。

        在基于理論的作用機制分析框架中,我們強調(diào)以變化理論為基礎(chǔ)開展數(shù)據(jù)收集和分析。一種對變化理論的質(zhì)疑是,如果我們過多關(guān)注于已經(jīng)建立的變化理論,認為這就是所有應該關(guān)注的內(nèi)容,那么我們可能會忽視一些預期外的影響。有兩種方法可以彌補這一缺陷(White,2009)。首先,變化理論的搭建是不斷修正的過程,關(guān)注項目的執(zhí)行過程,通常能夠發(fā)現(xiàn)預期外的影響,比如環(huán)境方面的影響;其次,前期的實地調(diào)查工作,包括與利益相關(guān)方的訪談和案例分析,是評估設計的重要環(huán)節(jié),它也可以發(fā)現(xiàn)預期外的結(jié)果,進而將其納入到評估框架中。預期外影響的問題也與采用誰的理論相關(guān)。一個好的以理論為基礎(chǔ)的影響評估設計在評價一個項目如何發(fā)揮作用時會考慮各種競爭性的理論。因此,評估自然就要同時考慮官方的變化理論和反對者的理論(Carvalho et al.,2002;Carvalho et al.,2004;Carvalho &White,2004)。

        還有一種質(zhì)疑是變化理論偏于靜態(tài)分析,而項目通常存在變通和發(fā)展的情況(White,2009)。項目文件里描述的系統(tǒng)可能與實際執(zhí)行脫節(jié),可能是因為設計方案重新修改,也可能是因為一線的操作人員隨意解讀項目設計方案。針對前者,因果鏈應當反映新的設計方案,評估要記錄下方案設計的修改過程。針對后者,需要注意的是,計劃實施與實際執(zhí)行之間的差異便是評估的關(guān)鍵問題:為什么會出現(xiàn)這些差異,對項目會產(chǎn)生怎樣的影響?因此,變化理論只是一種“理論”,它有待在實踐中檢驗。即使在某一時刻被驗證可行的變化理論,也會因為社會問題、外部環(huán)境、行業(yè)趨勢以及目標對象都在不斷變化之中,而需要接受定期的回顧和調(diào)整。因此,建立變化理論的最佳時間是在項目實施前或者是對已有的項目進行更改前,并且變化理論也需要不斷被修正。項目設計者應當進行文獻綜述,對類似項目的經(jīng)驗、變化理論背后的假設、項目實施背景和特殊環(huán)境等進行梳理。同時,利益相關(guān)者(項目執(zhí)行者、政策制定者、項目資助者、項目設計者等)可以共同參與討論和論證。這樣的過程對于一個希望最終能改變目標對象的行為的項目尤其重要。這樣的過程不僅能夠優(yōu)化項目設計,還能夠使項目各方形成一致的愿景和目標,并充分理解如何才能達成預期的目標、各環(huán)節(jié)的假設是否符合真實情況等。當利益相關(guān)者在項目實施過程中有一個全局觀和對項目的共同理解時,項目的執(zhí)行才能不偏離目標,各個環(huán)節(jié)才能環(huán)環(huán)相扣,以保證目標的實現(xiàn)。此外,在項目執(zhí)行前建立變化理論,能夠給與研究者更多的時間去驗證和修正變化理論,使最終的作用機制分析建立在更為符合實際的假設和理論之上。

        基于中間變量進行作用機制分析還可能存在統(tǒng)計功效不足的問題。RCTs 在進行統(tǒng)計功效計算時一般是基于對主要結(jié)果的整體干預效果的預測,因此,基于中間變量的中介和調(diào)節(jié)分析可能會有統(tǒng)計功效不足的問題。然而,試驗已經(jīng)普遍包括中介和調(diào)節(jié)分析,我們只是建議這樣的分析應更側(cè)重于測試關(guān)于干預機制如何與環(huán)境相互作用以產(chǎn)生結(jié)果的假設,并建議這樣的假設應更多地通過干預理論和過程評估數(shù)據(jù)的初步分析來進行完善和修正(Jamal et al.,2015)。

        最后值得討論的一點是學術(shù)界對于基于理論的影響評估及其所使用的因果鏈分析方法是否真的可以揭示“因果機制”的質(zhì)疑。質(zhì)疑的焦點在于,構(gòu)成RCTs 干預的因素十分復雜,將因果機制簡化為假設、中介效應和調(diào)節(jié)效應太過簡單化(Marchal et al.,2013;Van Belle et al.,2016)。但是這些研究也并不否認以變化理論為基礎(chǔ)的隨機干預實驗確實也是作用機制分析的一個進步。我們可以基于Mahoney(2001)提出的對于“因果機制”的三個層次的定義來理解。第一個層次的機制是變量層次。這種機制分析注重一個(一組)中間的變量與因變量之間存在相關(guān)性(Correlation),而非因果性的分析。第二個層次為變化理論(即因果鏈)層次,將因果機制視為可以用來解釋一系列(中間或最終)結(jié)果的中層理論或變量。因果機制被定義為一種在某些特定情形下被激發(fā)的重復發(fā)生的規(guī)律(Elster et al.,1989)。但是這種依據(jù)變化理論的分析實質(zhì)上是將因果關(guān)系濃縮于因果鏈上的若干元素,并沒有提出更具體的分析方法以揭示作用機制。前兩種層次的關(guān)注重點是確定前因與結(jié)果的規(guī)律性聯(lián)系,只留意時間上的先后性(Succesionist)。第三個層次是科學現(xiàn)實主義層次(Scientific realism),認為因果機制是“一個未被觀察到的實體,當它被激活時,會產(chǎn)生一個我們所關(guān)注的結(jié)果”。這是一種生成性的觀點(Generative,與Succesionist 相對),認為機制是主體(Agents)和結(jié)構(gòu)(Structure)所固有的性質(zhì),個體的選擇蘊含著個體的理性推斷(Reasoning)過程以及對干預所導致的資源變化的反應(Van Belle et al.,2016)。

        基于上述分析,Van Belle 等人(2016)認為,將機制(以及“背景”)簡化為變量在因果推斷的第一個層次;加入“中介”和“調(diào)節(jié)”作用使基于理論的影響評估發(fā)展到了第二個層次,但仍然沒有滿足科學現(xiàn)實主義(Scientific Realism)所提出的采用復雜因果關(guān)系的配置的要求,因而還無法實現(xiàn)因果推斷的第三個層次。因此,這種批評承認基于理論的影響評估是一種從第一層次到第二層次的進步,但是認為要達到第三個層次,作用機制的解釋應提出一套方案理論(Programme Theory),說明如何使用適當?shù)臄?shù)據(jù)和分析方法,通過干預、行動者、環(huán)境和機制的整套配置來解釋結(jié)果。然而,Van Belle 等人(2016)也沒有提出實現(xiàn)第三個層次的具體方法。總結(jié)相關(guān)文獻,本文認為,目前關(guān)于第三個層次的因果機制的探索仍然停留在理論層面,在實踐層面還沒有好的解決辦法(Pearl & MacKenzie,2018),因此,基于因果鏈的因果機制分析仍然是目前最好的解決方案。

        基于因果鏈的TBIE 框架能夠幫助我們理解干預如何導致政策結(jié)論以增強項目影響的。要做到這一點,變化理論需要以靈活的方式進行闡述,以適應該領(lǐng)域不斷變化的環(huán)境,并考慮相互競爭的理論和意料之外的結(jié)果,也需要使用多種方法進行分析,將事實分析和反事實分析結(jié)合起來。

        猜你喜歡
        黑盒子養(yǎng)育機制
        天下有“完美的養(yǎng)育風格”嗎
        啟蒙(3-7歲)(2019年8期)2019-09-10 03:09:08
        養(yǎng)育寶寶 專家團來幫你
        幸福(2019年21期)2019-08-20 05:39:12
        養(yǎng)育寶寶專家團來幫你
        幸福(2018年33期)2018-12-05 05:22:46
        自制力是一種很好的篩選機制
        文苑(2018年21期)2018-11-09 01:23:06
        養(yǎng)育孩子 只需溫和助推
        中華家教(2018年10期)2018-10-30 01:43:32
        破除舊機制要分步推進
        注重機制的相互配合
        打基礎(chǔ) 抓機制 顯成效
        中國火炬(2014年4期)2014-07-24 14:22:19
        狠狠久久精品中文字幕无码| 国产做国产爱免费视频| 九九久久精品无码专区| 成人爽a毛片一区二区免费| 国产偷闻隔壁人妻内裤av| 国产精品综合一区久久| 少妇人妻综合久久中文字幕| 99精品视频在线观看| 亚洲图片第二页| 日韩精品中文字幕一区二区| 国产国产裸模裸模私拍视频| 亚洲中文字幕无码爆乳av| 亚洲va成无码人在线观看| 手机免费高清在线观看av| 国产亚洲精品久久久闺蜜| 亚洲av永久无码精品秋霞电影影院| 精品无码人妻久久久一区二区三区| 亚洲第一页视频在线观看| 国产精品毛片一区二区三区| 国产目拍亚洲精品一区二区| 亚洲精品无人区一区二区三区| 精品久久综合日本久久综合网| 欧美日韩国产精品自在自线| 国产女在线| 久久精品国产亚洲av调教| 久久精品免费中文字幕| 最近最新中文字幕| 亚洲av不卡电影在线网址最新 | 日韩制服国产精品一区| 中文人妻无码一区二区三区| 国产女主播福利一区二区 | 成年免费视频黄网站zxgk| 无码片久久久天堂中文字幕| 国产麻豆国精精品久久毛片| 成人麻豆日韩在无码视频| 欧美国产成人精品一区二区三区| 久久久诱惑一区二区三区| 亚洲一二三区免费视频| 亚洲欧美aⅴ在线资源| 99精品欧美一区二区三区美图| 国产av剧情精品麻豆|