亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        破解教育生產(chǎn)“黑箱”:教育生產(chǎn)函數(shù)研究的評述與展望 *

        2020-09-17 08:49:46
        關鍵詞:黑箱學業(yè)成績班級

        李 波 黃 斌

        (南京財經(jīng)大學公共管理學院,南京 210023)

        一、研究背景與問題

        近五年來,教育學領域正在掀起一股實證研究浪潮,我國教育實證研究正處于一個由量變到質變的轉折點。以華東師范大學舉辦的“全國教育實證研究論壇”為標志的教育實證大會,經(jīng)過五年的持續(xù)組織和推進,為教育實證研究學者營造了良好的交流平臺,極大地促進了我國教育科學事業(yè)的發(fā)展。當前我國教育領域對實證研究的重要性已基本達成共識,教育研究范式逐步轉型。但諸多問題也相伴而生,如研究方法的誤用、研究設計和步驟不嚴謹、重參數(shù)估計而輕統(tǒng)計檢驗、估計結果報告錯誤、簡單套用和移植已有研究、調換數(shù)據(jù)的重新驗算和重復發(fā)表等問題亟待解決。本文以教育生產(chǎn)函數(shù)實證研究為研究對象,通過對比近五年和以往國內外實證研究,探尋近五年教育生產(chǎn)函數(shù)實證研究取得的進步及存在的問題,并對我國未來教育生產(chǎn)函數(shù)實證研究進行展望。

        教育學將人類教育活動作為主要研究內容,經(jīng)濟學是研究稀缺資源配置的學科。在教育經(jīng)濟學出現(xiàn)以前,經(jīng)濟學和教育學鮮有關聯(lián)和互動。教育生產(chǎn)函數(shù)是將經(jīng)濟學和教育學相融合的完美典范,其依據(jù)微觀經(jīng)濟學的廠商理論,通過建立生產(chǎn)函數(shù)來研究各種投入要素對教育產(chǎn)出的影響。教育生產(chǎn)函數(shù)是教育經(jīng)濟學這一學科研究的重點問題,更是破解教育生產(chǎn)“黑箱”的有力工具。Cohn & Geske(1990)在其撰寫的《教育經(jīng)濟學》教材中指出:“合理地估計和解釋教育生產(chǎn)函數(shù)也許是經(jīng)濟學家為教育所作的最重要貢獻”。最早的教育生產(chǎn)函數(shù)研究可追溯至1966 年科爾曼報告。1966 年科爾曼(Coleman)基于美國4000 所學校64 萬名學生的大規(guī)模調查,向美國國會遞交了《關于教育機會平等性的報告》(又稱科爾曼報告)。報告發(fā)現(xiàn)影響學生成績最關鍵的因素不是學校質量、師資水平、學校設備等學校投入,而是與學生家庭背景相關的家庭投入??茽柭鼒蟾鎸σ酝鶎W術界廣泛認同的,學校對學生學業(yè)成績起決定性作用的認知形成了重大沖擊,引發(fā)了學術界激烈討論。后續(xù)漢納謝克(Hanushek)、克魯格(Krueger)等眾多學者,通過教育生產(chǎn)函數(shù)尋找學生學業(yè)成績的決定因素,并涌現(xiàn)出了大量的研究成果。

        本文根據(jù)中國知網(wǎng)和Web of Science 對近五年來教育生產(chǎn)函數(shù)相關領域研究成果進行可視化分析,所檢索數(shù)據(jù)庫包括中文社會科學引文索引(Chinese Social Sciences Citation Index,CSSCI)、社會科學引文索引(Social Science Citation Index,SSCI)、中文和英文權威期刊①。

        由于教育生產(chǎn)函數(shù)關注各種教育投入對教育產(chǎn)出的影響,僅以“教育生產(chǎn)函數(shù)”為主題進行檢索,會遺漏大量既有研究成果。本文以“教育生產(chǎn)函數(shù)”“家庭投入”“學校投入”“課外補習”“父母參與”“學校資源”“教師工資”“班級規(guī)模”“學業(yè)成績”和“實證研究”等主題進行中英文檢索,結果如圖1 所示。剔除重復和不相關文獻發(fā)現(xiàn)2015—2019 年共有SSCI 論文3321 篇,英文權威論文356 篇;CSSCI論文768 篇,中文權威論文227 篇。近五年,英文論文數(shù)量保持相對平穩(wěn),SSCI 和英文權威論文年均發(fā)文量為664 和71 篇。中文論文數(shù)量呈現(xiàn)小幅上漲趨勢,CSSCI 和中文權威論文由2015 年的139 和37 篇,上升至2019 年172 和57 篇。近五年中文實證論文發(fā)文量的上升,體現(xiàn)了國內教育學領域學者對實證研究的逐漸重視,全國教育實證研究論壇對我國教育研究范式的轉型發(fā)揮了積極的推動作用。

        圖1 2015—2019 年教育生產(chǎn)函數(shù)實證研究趨勢圖

        通過Web of Science 對近五年英文期刊國家的發(fā)文量進行分析,如圖2 所示。近五年在SSCI 和英文權威期刊發(fā)表中,美國在教育生產(chǎn)函數(shù)研究領域處于世界領先地位,在SSCI 和英文權威論文數(shù)量上分別為1756 篇和140 篇,具有絕對優(yōu)勢。德國、澳大利亞、中國和英國屬于第二梯隊,SSCI 論文分別為186、180、168 和165 篇;英文權威論文分別為38、40、25 和33 篇。加拿大、荷蘭、西班牙和意大利屬于第三梯度,發(fā)文數(shù)量相對較少。通過知網(wǎng)對近五年中文期刊的論文資助基金項目分析發(fā)現(xiàn),在CSSCI 和中文權威期刊中,獲得國家社會科學基金項目資助的論文分別為91 篇和31 篇;獲得全國教育科學規(guī)劃課題資助的論文分別為76 篇和18 篇;獲得國家自然科學基金資助的論文分別為68 篇和37 篇??傮w上,我國教育生產(chǎn)函數(shù)實證研究在近五年CSSCI 和中文權威期刊發(fā)文量上呈現(xiàn)穩(wěn)步上升態(tài)勢,國家級基金資助項目比例逐漸提高。

        圖2 2015—2019 年教育生產(chǎn)函數(shù)英文論文主要發(fā)表國家

        二、教育生產(chǎn)函數(shù)的類型

        教育生產(chǎn)函數(shù)與經(jīng)濟學中的生產(chǎn)函數(shù)類似,將教育系統(tǒng)類比成企業(yè),把家庭背景、家庭貨幣投入、家庭時間投入、學校經(jīng)費投入、學校資源、師資水平、班級規(guī)模等看作教育投入,把學生學業(yè)成績、認知能力、非認知能力、升學率、受教育年限等看作教育產(chǎn)出。一般類型的教育生產(chǎn)函數(shù)形式可以表示為:Yi ja=f(Xija(F,S,I),eija)。 其中Yi ja為學生i在j家庭a 年齡段時的教育產(chǎn)出,一般多以學生學業(yè)成績來衡量。eija為函數(shù)殘差項,包括所有不可觀測變量和遺漏變量。Xija(F,S,I)表示學生i在j家庭a 年齡段時的所有家庭、學校和學生個體特征(例如遺傳稟賦)的投入組合。本文結合教育生產(chǎn)函數(shù)的一般類型,并參考Todd &Wolpin(2007)和其他學者相關研究,將已有文獻中所涉及的教育生產(chǎn)函數(shù)大致分為如下三個類型。

        (一)單期投入型教育生產(chǎn)函數(shù)

        單期投入型教育生產(chǎn)函數(shù)(Contemporaneous Education Production Function)如式(1)所示,將教育投入和產(chǎn)出看作一個單期過程,數(shù)據(jù)層面上反映為橫截面數(shù)據(jù)。式中i為學生個體代碼,j為家庭代碼,a 為學生個體所處年齡段。Xi ja為學生i在家庭j年齡為a 時的個體、家庭和學??捎^測投入組合。Yi ja為個體i在j家庭a 年齡段時學業(yè)成績。eija為殘差項,包括所有遺漏變量、可觀測和不可觀測的前期投入、遺傳基因稟賦和測量誤差。為了得到 ?1的一致估計量,單期投入型教育生產(chǎn)函數(shù)必須滿足eija與所有投入要素Xi ja不相關,即滿足相互獨立假設。

        (二)多期投入型教育生產(chǎn)函數(shù)

        多期投入型教育生產(chǎn)函數(shù)(Cumulative Education Production Function)如式(2)所示。其在單期投入型教育生產(chǎn)函數(shù)式(1)基礎上進行擴展,加上投入要素的多期滯后項。多期投入型教育生產(chǎn)函數(shù)假設教育產(chǎn)出的獲得是一個累積過程,由現(xiàn)在和過去教育投入與孩子基因遺傳稟賦(生命孕育時決定)相結合 產(chǎn) 生 的 認 知 結 果。同 樣,為 了 得 到 各 期 ?1、 ?2···?a的 一 致 估 計 量,eija必 須 與 各 期 投 入 要 素Xi ja、Xi ja?1···Xi j1不相關,即滿足相互獨立假設。

        (三)增值型教育生產(chǎn)函數(shù)

        當數(shù)據(jù)包含前期教育產(chǎn)出而不包含前期教育投入時,常使用增值型教育生產(chǎn)函數(shù)(Value?added Education Production Function)估計教育投入對教育產(chǎn)出的影響。增值型教育生產(chǎn)函數(shù)認為學業(yè)成績與當期學校和家庭教育投入有關,同時與前期(基線)學業(yè)成績相關。前期學業(yè)成績會影響當期教育投入,如果方程不控制前期學業(yè)成績,模型將存在遺漏變量偏誤。增值型教育生產(chǎn)函數(shù)基本形式如式(3)所示。

        為了確定增值型模型隱含的假設和限制條件,在式(3)兩端同時減去 γYija?1,整理后得到式(4)。

        在式中,ei ja?γeija?1滿足

        為了得到教育投入對教育產(chǎn)出的一致估計,增值型教育生產(chǎn)函數(shù)需要滿足如下假設。第一,各期教育投入系數(shù)隨著時間推移,對產(chǎn)出的影響呈現(xiàn)下降趨勢,且這種下降率對各類教育投入相同,即對于所有j均存在 ?j=γ?j?1;第二,遺漏的教育投入(當期和前期)與已包含教育投入、基期考試成績無關;第三,先天稟賦的效應系數(shù)下降速率對各類教育投入相等,即 βa=γβa?1; 第四, εija必須序列相關,并且序列相關程度與投入效應的下降率相匹配,才能得到 εija?γεija?1獨立同分布。如果這一條件不能滿足,則基期學業(yè)成績Yi ja?1將與其自身測量誤差相關。

        三、家庭投入型教育生產(chǎn)函數(shù)

        家庭因素對學生教育產(chǎn)出具有重要影響,大量研究均已證實弱勢家庭學生的人力資本具有先天劣勢(Coleman et al.,1966)。盡管世界各國出臺了一系列旨在促進入學機制公平、縮小區(qū)域間學校質量差異、補償貧困家庭學生學費等一系列法律和政策,但學生學業(yè)成績和家庭背景高度正相關的狀況尚未改變(Holmlund et al.,2011)。究竟哪些家庭投入真正對學生教育產(chǎn)出具有顯著影響?本文將現(xiàn)有家庭投入型教育生產(chǎn)函數(shù)實證研究成果歸納為家庭背景、家庭貨幣投入和家庭時間投入三大類,分析各類投入存在的內生性偏估,就國內外相關研究進行綜述,并重點分析五年來我國相關研究存在的問題。

        (一)家庭背景與學生教育產(chǎn)出

        1. 內生性偏估

        家庭背景對學生教育產(chǎn)出的研究,實證研究最關鍵的是如何解決內生性偏估。關于家庭收入對學生教育產(chǎn)出影響的內生性問題。第一,遺漏變量問題。家庭收入可能是家庭其他有利特征(父母學歷、父母職業(yè)、父母社會關系、父母能力等)的外在表現(xiàn),無法觀測的家庭因素可能會引起家庭收入對學生教育產(chǎn)出的過高估計(Upward?biased)(Duncan et al.,1998)。第二,關聯(lián)問題。Dahl & Lochner(2012)認為傳統(tǒng)的家庭收入與學生教育產(chǎn)出的實證研究,不能從其他無法衡量的家庭情況變化中單獨識別出家庭收入變化帶來的影響。例如家庭收入增加可能會因為與之關聯(lián)的其他家庭環(huán)境惡化(例如家庭收入增加可能是父母兼職或外出打工,導致父母陪伴子女的時間減少)而阻礙教育產(chǎn)出獲得。

        關于父母學歷對學生教育產(chǎn)出影響的內生性問題。高學歷父母一般具有更高的能力,通過遺傳使子女同樣具有較高能力,并最終影響子女教育產(chǎn)出。如果不解決模型的內生性問題,普通回歸結果不僅是父母受教育水平對子女教育產(chǎn)出的影響,還包括諸如父母能力對子女教育產(chǎn)出的影響。目前研究中,主要有三種方法來解決上述內生性問題,分別為“雙胞胎數(shù)據(jù)+組內差分”“領養(yǎng)數(shù)據(jù)+OLS”和“普通數(shù)據(jù)+IV”。

        第一,基于“雙胞胎數(shù)據(jù)+組內差分”解決內生性問題。雙胞胎數(shù)據(jù)多來自同卵雙胞胎而非異卵雙胞胎。該方法將雙胞胎相同的不可觀測先天能力和成長環(huán)境剔除,用父母學歷差值對雙胞胎教育產(chǎn)出差值進行回歸。在這一過程中,只有父母學歷不同和子女教育產(chǎn)出不同的雙胞胎才能真正進入回歸,如式(6)所示: ?Yic為i家 庭同卵雙胞胎教育產(chǎn)出差值, ?XiP為i家 庭同卵雙胞胎父母學歷差值, ?μci為i家庭同卵雙胞胎隨機擾動項差值,則 δ1為估計的父母學歷對子女教育產(chǎn)出的影響系數(shù)。

        第二,基于領養(yǎng)數(shù)據(jù)解決內生性問題。將養(yǎng)父母學歷對領養(yǎng)子女教育產(chǎn)出回歸,可以有效將父母能力等先天不可觀測變量剔除。領養(yǎng)數(shù)據(jù)應確保領養(yǎng)過程隨機。如果領養(yǎng)過程非隨機,領養(yǎng)父母和親生父母之間相關信息可能高度相關,回歸結果難以剔除選擇效應,如式(7)所示:Yiac為領養(yǎng)學生i的教育產(chǎn)出,Xiap為領養(yǎng)父母受教育水平, μaic為領養(yǎng)學生隨機擾動項,則 δ1為父母學歷對子女教育產(chǎn)出的影響。

        第三,基于工具變量法解決內生性問題。部分研究采用教育改革作為工具變量來解決模型內生性問題,如式(8)和式(9)的兩階段最小二乘法方程。式(8)為第一階段,REFip j為與父母相關的工具變量,Xip

        j為父母學歷, α1為 工具變量對父母學歷影響。式(9)為第二階段,將第一階段Xip j擬合值代入第二階段,得到父母學歷對學生教育產(chǎn)出的因果估計,系數(shù)為 δ1IV。

        2. 國外實證研究綜述

        當前已有大量實證研究探討了家庭背景與學生教育產(chǎn)出之間的關系(Coleman et al.,1966;Ermisch& Francesconi,2001;Dahl & Lochner,2012)。家庭背景包括家庭收入、父母學歷和父母職業(yè)等。關于家庭收入的研究,Belley & Lochner(2007)發(fā)現(xiàn)家庭收入與高中學業(yè)完成率無因果關系,但對高等教育入學率有顯著正向關系。Humlum(2011)基于2000 年PISA 數(shù)據(jù)中出生在1984 年的4000 名丹麥學生,采用單期教育生產(chǎn)函數(shù)和永久收入假設,發(fā)現(xiàn)永久收入增加一個標準差,閱讀分數(shù)增加0.14 個標準差。早期收入增加一個標準差(后期收入相對減少),閱讀分數(shù)減少0.06 個標準差。Dahl & Lochner(2012)使用美國所得稅抵免政策的收入支持項目作為工具變量,對NLSY 數(shù)據(jù)中4200 名學生及父母的面板數(shù)據(jù)進行實證研究,發(fā)現(xiàn)家庭收入每增加1000 美元可使同期學生數(shù)學和閱讀測試成績提高0.06 個標準差,尤其對男生、弱勢群體和低年級學生的影響更為明顯。

        關于父母學歷對教育產(chǎn)出的影響,Haveman & Wolfe(1995)認為父母學歷是學生教育產(chǎn)出中最重要的解釋變量。第一,基于雙胞胎數(shù)據(jù)的研究。采用美國明尼蘇達州同卵雙胞胎數(shù)據(jù),剔除先天能力和成長環(huán)境等不可觀測變量后,Behrman & Rosenzweig(2002)和Antonovics & Goldberger(2005)均發(fā)現(xiàn)母親學歷對子女受教育水平幾乎無顯著影響,而父親學歷有顯著正向影響?;谒箍暗募{維亞(Scandinavia)登記數(shù)據(jù)中的丹麥同卵雙胞胎樣本,Bingley et al. (2009)發(fā)現(xiàn)母親學歷對9 年級學生平均學分績點(Grade Point Average,GPA)成績無顯著影響。父親學歷對9 年級學生GPA 有顯著負向影響,但對受教育年限有顯著正向影響。Haegeland et al. (2010)采用挪威2002—2007 年初中學生雙胞胎數(shù)據(jù),控制了家庭背景和個體特征后,發(fā)現(xiàn)父親和母親學歷對子女學業(yè)成績均無顯著影響。

        第二,基于領養(yǎng)數(shù)據(jù)的實證研究。Dearden et al. (1997)和Sacerdote(2002)發(fā)現(xiàn)養(yǎng)父母學歷對子女受教育年限具有顯著正向影響。Plug(2004)發(fā)現(xiàn)養(yǎng)父學歷對子女受教育年限具有顯著正向影響,但養(yǎng)母學歷對子女沒有影響。Haegeland et al.(2010)采用挪威2002—2007 年初中學生領養(yǎng)數(shù)據(jù)得到與Plug(2004)完全相反結論??刂萍彝ケ尘昂蛡€體特征后,發(fā)現(xiàn)養(yǎng)母學歷對子女學業(yè)成績影響顯著,但估計系數(shù)很小。養(yǎng)父學歷對子女學業(yè)成績無顯著影響。此外,領養(yǎng)數(shù)據(jù)的使用需要額外注意領養(yǎng)過程是否隨機。如果領養(yǎng)過程隨機,則模型不存在樣本自選擇問題。例如Sacerdote(2007)基于1964—1985 年美籍韓國學生的隨機領養(yǎng)數(shù)據(jù),發(fā)現(xiàn)養(yǎng)母學歷對子女學業(yè)成績有顯著正向影響,對吸煙和飲酒行為有顯著負向影響。如果領養(yǎng)不隨機,需要控制親生父母信息。例如,Bj?rklund et al.(2006)通過在方程中額外控制親生父母相關信息,解決模型因領養(yǎng)過程非隨機性導致的偏誤,發(fā)現(xiàn)養(yǎng)父母學歷對子女教育產(chǎn)出有顯著正向影響,且養(yǎng)母影響小于養(yǎng)父。

        第三,基于工具變量法的實證研究。Black et al.(2008)采用1960—1970 年挪威義務教育法年限延長作為工具變量,發(fā)現(xiàn)父親學歷對子女受教育年限無影響。母親學歷對子女受教育年限有顯著正向影響,但影響系數(shù)很小。Oreopoulos(2006)基于美國義務教育法實施的不同時間順序,采用工具變量法發(fā)現(xiàn)高學歷父母的子女留級概率更低。Oreopoulos et al.(2006)利用二戰(zhàn)退伍軍人數(shù)據(jù),發(fā)現(xiàn)父母受教育年限提高1 年,子女留級概率下降2%—3%。Carneiro et al.(2013)采用家庭到學校的距離作為工具變量,發(fā)現(xiàn)在子女8 歲時,父母學歷對子女數(shù)學成績具有顯著影響。在子女12—14 歲時,父親學歷對子女的閱讀能力有顯著影響,但母親學歷對子女閱讀能力無顯著影響。

        3. 國內實證研究綜述

        田丹(2017)基于2010—2014 南京市中學生發(fā)展狀況調查的711 名中學生數(shù)據(jù),采用OLS 方法發(fā)現(xiàn)高收入父母對高中階段學生成績有顯著正向影響,對大學階段學生無影響。母親的收入和中等收入的父親對高中和大學階段學生均具有顯著影響。王甫勤和時怡雯(2014)采用2010 年上海居民家庭生活狀況調查數(shù)據(jù),對1181 個家庭采用Logistic 回歸發(fā)現(xiàn),接受過高等教育的父母對子女上大學期望較高,能夠更多參與到子女教育過程,為子女創(chuàng)造更多條件支持,進而提高子女上大學概率。李忠路(2016)基于首都大學生成長追蹤調查數(shù)據(jù),采用Logistic 回歸發(fā)現(xiàn),父母學歷和家庭收入對學生就讀高校類型和學業(yè)表現(xiàn)有顯著正向影響。李佳麗等人(2016)以2014 年鄭州區(qū)域教育質量健康體檢與改進提升項目的八年級50461 名學生為對象,采用OLS 方法發(fā)現(xiàn)父母職業(yè)、父母受教育程度和家庭經(jīng)濟水平對語數(shù)外標準化考試成績有顯著正向影響。利用Bootstrap 方法對中介效應進行檢驗,發(fā)現(xiàn)家庭背景通過影響父母教育期望和課外補習決策來影響學生學業(yè)成績。李忠路和邱澤奇(2016)采用CFPS 2010 年數(shù)據(jù)和OLS 回歸分析發(fā)現(xiàn),父母受教育年限和家庭人均收入對兒童基準測試平均分有顯著正向影響,并通過多重中介模型發(fā)現(xiàn)家庭社會經(jīng)濟地位通過家教服務、學校質量、學習行為和家長參與進而影響學生學習成績。

        4. 近五年國內實證研究存在的問題

        近五年相關實證研究,研究者開始逐漸關注家庭背景對學生學業(yè)成績的影響機制(李佳麗等人,2016;李忠路和邱澤奇,2016),關于因果識別的研究相對較少,研究可能還存在如下幾點問題。第一,近五年國內相關研究較多采用OLS 回歸分析,而基于領養(yǎng)數(shù)據(jù)、雙胞胎數(shù)據(jù)或工具變量等因果識別方法的研究尚未發(fā)現(xiàn)。孫志軍(2014)使用了雙胞胎數(shù)據(jù)研究了教育收益率,但研究內容不屬于教育生產(chǎn)函數(shù)領域。主要原因是領養(yǎng)數(shù)據(jù)或雙胞胎數(shù)據(jù)在國內收集較為困難,未來國內研究可以通過高等教育擴張、義務教育法實施等外生沖擊作為工具變量,對父母學歷和子女學業(yè)成績進行因果關系分析。第二,較多研究在OLS 回歸方程中沒有控制學生個體和學校特征變量,亦沒有控制班級或學校固定效應,模型存在較大的遺漏變量偏誤(王甫勤和時怡雯,2014;田丹,2017)。部分研究中,家庭背景僅是控制變量,而非研究的主要內容(王駿等人,2017)。第三,研究較多采用某市或縣內學校調查數(shù)據(jù),研究結論不具有全國代表性。數(shù)據(jù)較多沒有對外公開,研究過程可重復性較差,研究結論真實性有待考驗(王甫勤和時怡雯,2014;田丹,2017)。第四,數(shù)據(jù)使用過于隨意。例如田丹(2017)所使用數(shù)據(jù)中的成績?yōu)閷W生自報在班級中的成績排名,但研究對象來自南京市11 所不同中學,學生成績在學校間不具有可比性,研究所用數(shù)據(jù)無法滿足研究需要。研究應采用區(qū)縣統(tǒng)一標準化命題和統(tǒng)一閱卷的考試成績,才能實現(xiàn)11 所學校不同學生成績之間的可比。

        (二)家庭貨幣投入與學生教育產(chǎn)出

        1. 家庭貨幣投入類型

        家庭貨幣投入包括學校內家庭貨幣投入和學校外家庭貨幣投入,其中學校內家庭貨幣投入主要包括學雜費、教材教輔費、校服、醫(yī)保和體檢費、擇校費和食宿費等;學校外家庭貨幣投入主要包括校外補習費、學習資料和用品等。魏易(2020)基于2017 年中國教育財政家庭數(shù)據(jù)發(fā)現(xiàn),中小學學生每年家庭教育支出超過1 萬元,占家庭總支出的16%,過去一年參加課外補習和興趣班的學生比例為59%。隨著義務教育免費政策的普及和學校均衡化的推進,家庭對子女教育投入的差異逐漸從校內轉為校外(魏易,2020)。鑒于學校內家庭貨幣投入差異較小,相關研究主要探討學校外家庭貨幣投入。學校外家庭貨幣投入主要為購買課外補習服務,早在2001 年土耳其課外補習支出就已經(jīng)占GDP 的1.44%,而公立教育支出僅為2%(Tansel & Bircan,2006)。魏易(2020)研究發(fā)現(xiàn)2017 年我國中小學學生每年平均課外補習支出在3000 元以上。校外補習已然成為市值百億美元的教育產(chǎn)業(yè),下文重點介紹課外補習對學生教育產(chǎn)出影響的實證研究。

        2. 內生性偏估

        實證研究中,模型設定需要特別處理課外補習的內生性問題。大量研究均證實學生的課外補習決策非隨機。第一,課外補習決策與父母學歷相關。父親學歷(Kim & Park,2010;薛海平,2015;李波,2018b)或母親學歷(雷萬鵬,2005; Bray et al.,2014;陳彬莉和白曉曦,2015)越高,子女參與補習的可能性越大。龐曉鵬等人(2017)研究發(fā)現(xiàn)父親學歷能夠顯著提高子女參與補習的概率,但母親的影響不顯著。薛海平等人(2014)甚至發(fā)現(xiàn)母親學歷對子女課外補習有顯著負向影響,因為高學歷母親對子女學業(yè)指導替代了對課外補習的需求。第二,課外補習決策與家庭收入相關。家庭收入水平對學生參與補習的影響顯著為正(Stevenson & Baker,1992; Liu,2012;李佳麗和胡詠梅,2017;李波,2018b)。但薛海平(2015)、薛海平等人(2014)發(fā)現(xiàn)家庭收入對課外補習影響并不顯著。第三,課外補習決策與學校質量相關。薛海平和丁小浩(2009)發(fā)現(xiàn)就讀學校質量越高、學習成績越好的學生,參與補習的可能性越高。雷萬鵬(2005)對北京、江蘇、湖北和陜西高中學生的研究,曾滿超等人(2010)對甘肅、湖南和江蘇高中一年級學生的研究,Bray et al.(2014)對香港學生的研究,以及龐曉鵬等人(2017)對陜西榆林農(nóng)村小學生的研究都表明,就讀于重點學校、學業(yè)表現(xiàn)較好的學生參與課外補習的可能性更低。學校質量和課外補習存在替代效應,學校師資水平提高,課外補習支出顯著降低(Dang,2007),生師比高的學校課外補習支出更多(Kim & Park,2010)。此外,Bray et al.(2014)發(fā)現(xiàn)在香港家庭,子女數(shù)量會對課外補習支出有顯著負向影響,研究滿足了資源稀釋理論。

        3. 國外實證研究綜述

        為解決課外補習的內生性偏估,在無隨機實驗數(shù)據(jù)的情況下,研究較多采用兩種方法識別課外補習與學業(yè)成績的因果關系。第一,控制課外補習的影響因素,例如控制家庭背景、學生學習基礎、學校質量等。但由于調查數(shù)據(jù)無法涉及上述所有變量的全部信息,故該方法不具有現(xiàn)實可行性。大量采用此方法的研究僅控制了作者認為比較重要的幾個變量,無法將所有影響因素都控制。Briggs(2001)基于美國1990—1992 年NELS 高中數(shù)據(jù),基于普通最小二乘法發(fā)現(xiàn)課外補習使得SAT 考試成績提高了14%?15%,其中詞匯成績提高6%?8%,數(shù)學和英語提高0%—0.6%,閱讀下降0.6%—0.7%。Lee et al.(2004)基于韓國數(shù)據(jù)發(fā)現(xiàn)課外補習對學生短期和長期的成績幫助均不大,影響不顯著。Cheo &Quah(2005)發(fā)現(xiàn),課外補習不僅不能提高成績,反而有不利影響。第二,尋找一個外生變量,其和課外補習相關但和學業(yè)成績無關,即采用工具變量法。不同研究中工具變量的選擇也不同,例如學生在兄弟姐妹中的出生順序不同會導致父母的重視程度和教育投入存在投入差異(Powell & Steelman,1995)。Kang(2007)用學生在兄弟姐妹中的出生順序作為工具變量,發(fā)現(xiàn)校外補習投入增加10%,子女學業(yè)成績提高0.56%。Ono(2007)采用1995 年日本學生數(shù)據(jù),將當?shù)卮髮W生質量作為參加大學準備考試補習的工具變量,發(fā)現(xiàn)課外補習效果明顯。Choi(2012)使用同伴補習率、非學業(yè)型課外補習費用和子女出生順序作為工具變量,發(fā)現(xiàn)課外補習可以顯著提高學生的認知能力,且年級越低效果越明顯。

        4. 國內實證研究綜述

        國內關于課外補習對學生學業(yè)成績影響的實證研究最近幾年才逐漸展開,但發(fā)展迅速。本文根據(jù)實證方法的識別效果從低到高進行排序并綜述,包括OLS、HLM、PSM、RPSM、PSM?DID 和IV 等六種實證方法。薛海平等人(2014)基于2013 年全國六省市義務教育階段學生課后活動基線數(shù)據(jù),采用OLS 方法并控制了家庭因素、學校因素和個人因素的幾個主要變量(并沒有控制前期學習成績),發(fā)現(xiàn)課外補習有助于學校質量較高、成績較好的留守兒童縮小其與非留守兒童的成績差異。基于北京市某示范性初中全體學生的追蹤調查數(shù)據(jù),張羽等人(2015)采用多層線性模型(HLM)發(fā)現(xiàn),小學過早、過多參與數(shù)學和英語補習雖然能夠提高學生升入初中時的初始成績,但對初中數(shù)學和英語成績的持續(xù)增長沒有幫助。薛海平(2015)和李波(2018b)使用傾向得分匹配法(PSM)發(fā)現(xiàn),參與補習以及補習支出對義務教育階段學生的數(shù)學成績有顯著正影響,但對語文成績影響不顯著。胡詠梅等人(2015)使用再加權傾向得分匹配法(RPSM)發(fā)現(xiàn),參與數(shù)學補習能夠顯著提高學生數(shù)學成績。但不同學科的補習時間對數(shù)學成績的影響不同,科學補習與數(shù)學補習效果存在“疊加效應”,語言補習與數(shù)學補習效果存在“擠出效應”。龐曉鵬等人(2017)使用差分傾向得分匹配法(PSM?DID)發(fā)現(xiàn),在中國農(nóng)村地區(qū)參與數(shù)學補習降低了數(shù)學成績,但不具有統(tǒng)計顯著性。可能是課外補習方式不當,補習教師牟利性動機等原因導致。Zhang(2013)將學生五個好朋友參與補習的比重、離家最近補習機構與家的距離作為工具變量,基于增值模型,研究發(fā)現(xiàn)課外補習對來自薄弱學?;虺煽冚^差的城市學生產(chǎn)生了顯著的正向影響。

        5. 近五年國內實證研究存在的問題

        近五年課外補習效果的實證研究中,逐漸出現(xiàn)了PSM、RPSM、PSM?DID 和IV 等多種識別方法。實證研究取得了長足進步,模型和方法選擇上更加科學,但可能還存在如下問題。第一,受到數(shù)據(jù)的限制,許多研究沒有使用增值模型(張羽等人,2015;薛海平,2015;胡詠梅等人,2015;李佳麗等人,2016)。由于課外補習投入是流量,學業(yè)成績是存量,不控制學生初始學業(yè)水平,會給估計結果帶來嚴重的遺漏變量偏誤,甚至產(chǎn)生錯誤結論(例如學習差的學生參加課外補習,而不是參加課外補習導致學習差。不采用增值模型會得到課外補習導致學習變差的因果顛倒結論)。第二,為得到課外補習對學生學業(yè)表現(xiàn)影響的一致估計量,一些研究采用PSM 方法(薛海平,2015;李波,2018b),但該方法在本質上只是加權的OLS,僅能解決由樣本選擇偏差帶來的內生性問題,無法糾正由遺漏重要解釋變量帶來的內生性偏誤。第三,盡管劉騰堯和王晴(2018)、張雪和張磊(2017)使用IV 來糾正遺漏重要解釋變量偏誤,但IV 的測量誤差可能比課外補習變量本身更大,潛在的弱工具變量可能帶來更大的估計偏誤。此外,劉騰堯和王晴(2018)雖然解決了個體層面的內生性問題,但并沒有通過加入固定效應項控制班級和學校層面內生性偏誤,僅控制部分班級和學校特征。第四,在衡量學業(yè)表現(xiàn)時,一些研究采用看似更加科學的國際通用認知測試得分(龐曉鵬等人,2017),但以此評估課外補習效果并不全面。因為以應試為目的的課外補習并不旨在提高學生的認知水平,而是提高學生考試成績。還有一些研究使用學業(yè)成績自評等級(薛海平,2015),這種衡量方法主觀性強,測量誤差大。

        (三)家庭時間投入與學生教育產(chǎn)出

        家庭時間投入是區(qū)別于貨幣投入的另一種重要的家庭投入類型。Guryan et al.(2008)基于2003—2006 年美國勞工統(tǒng)計局實施的美國時間使用調查,對21—55 歲的22693 名父母的研究發(fā)現(xiàn),母親每周對孩子時間投入為13.96 小時,父親為6.81 小時。Gracia & Ghysels(2017)發(fā)現(xiàn),在比利時、丹麥、西班牙和英國母親在工作日每天對孩子的平均時間投入分別為82、77、64 和61 分鐘,周末分別為96、93、66 和64 分鐘。關于中國父母對孩子的時間投入,Zhao(2018)基于2004 年、2006 年、2009 年和2011 年中國健康和營養(yǎng)調查數(shù)據(jù)發(fā)現(xiàn),父親和母親平均每周在子女身上的時間投入分別為13.53 和27.15 小時。出生在1965—1972 年、1973—1980 年和1981—1989 年的父親每周在子女身上的時間投入分別為9.41、17.63 和14.84 小時,母親分別為10.13、21.90 和32.84 小時。母親對子女的時間投入更多為孩子的衣食起居,父親更多為輔導學習和玩耍。

        1. 家庭時間投入的內容

        在教育生產(chǎn)函數(shù)實證研究領域,學者更加關注父母在子女教育上的時間投入,且更加關注時間投入的具體事情或內容,并稱之為父母卷入或父母參與(parental involvement)。愛普斯坦(Epstein,1990)將父母在子女教育上的時間投入根據(jù)行為劃分為:交流與溝通,即父母和孩子交流學校生活和煩惱;志愿參與活動,即父母和孩子共同參加校內、校外活動;家庭學習,即父母指導孩子功課、檢查家庭作業(yè)和探討學習方法等;決策制定,即父母以代表的方式對學校教育計劃、資金募集、發(fā)展方向等決策提供建議;社會合作,即父母有效發(fā)揮社區(qū)資源應用于學校教育。Sui?Chu & Willms(1996)將父母在子女教育上的時間投入分為四類,分別包括:家庭討論、家庭督導、學校聯(lián)系和學校參與。李波(2018a)將父母在子女教育上的時間投入按內容和行為劃分為五類,分別包括親子交流、親子活動、親子閱讀、作業(yè)督導和家?;?。作業(yè)督導為父母檢查子女家庭作業(yè),指導其功課;親子閱讀為父母和子女一起讀書或讀書給子女聽;親子交流為父母和子女交流學校發(fā)生的事情、與同學和老師的關系、心事和學習上的煩惱;親子活動為父母帶子女參觀博物館、圖書館、動物園、科技館,觀看演唱會、電影等文化活動;家校聯(lián)系為父母參加學校家長會,或主動聯(lián)系老師交流學生學校表現(xiàn)。

        2. 內生性偏估

        在實證研究中要想精確識別父母在作業(yè)督導、親子閱讀、親子活動、親子交流和家?;拥葧r間上的投入是否能夠提高子女的教育產(chǎn)出,首先要確定父母時間投入是否隨機,其是否會因家庭收入、父母學歷、家庭子女數(shù)量的不同而存在群體差異。拉魯(Lareau,1987)根據(jù)貧困文化理論指出,窮人因為貧困而在居住等方面具有獨特性,在這種環(huán)境熏陶下的父母并不能意識到教育的重要性,且不相信教育是改變階層命運的有效手段和主要途徑。相較于上層家庭,貧困家庭在子女教育上的時間投入相對較少,主要是因為對子女的教育期望不高(Anderson & Minke,2007)。家庭收入較低會直接導致父母情緒低落,間接導致父母對子女教育缺乏耐心和關注,家庭教育過程缺乏自信、方式也不科學(Guryan et al,2008),甚至將生活和婚姻的不滿發(fā)泄到子女身上,出現(xiàn)打罵甚至虐待的現(xiàn)象。Sebastian et al.(2016)發(fā)現(xiàn)擁有大學及以上學歷的母親更了解子女在學校的表現(xiàn),與學校任課教師交流也更為頻繁。Boonk et al.(2018)通過元分析發(fā)現(xiàn),高學歷家長在子女的教育過程中,認為父母和學校是平等的,具有同樣重要的地位。家庭子女數(shù)量能夠直接影響父母對每一個孩子時間投入上的多寡。Zedan(2012)發(fā)現(xiàn)子女數(shù)量和父母在子女教育上的時間投入之間存在顯著的負相關,即孩子數(shù)量越多,每個孩子得到父母的時間投入越少。

        3. 國外實證研究綜述

        關于父母作業(yè)督導對子女成績影響,研究結論莫衷一是。Finn(1998)采用增值模型的多元回歸發(fā)現(xiàn)作業(yè)督導對子女學業(yè)成績有顯著正向影響;Singh et al.(1995)使用相關分析發(fā)現(xiàn)作業(yè)督導對學業(yè)成績有顯著負向影響;Perna & Titus(2005)發(fā)現(xiàn)父母和學生之間的交流行為能夠明顯提高學生考上大學的概率,但父母指導和檢查孩子作業(yè)則無顯著影響。Patall et al.(2008)發(fā)現(xiàn),在小學階段作業(yè)督導能夠明顯提高子女的學業(yè)表現(xiàn),但在中學階段會顯著降低子女的學業(yè)表現(xiàn)。Wilder(2014)指出中學生正處于青春期,更加渴望獨立和自主,內心對父母作業(yè)檢查和指導行為存在排斥心理,導致作業(yè)督導降低子女學習成績。Xu et al.(2010)對五年級學生研究發(fā)現(xiàn),父母給子女布置過多作業(yè),不利于子女自主學習能力發(fā)展。關于親子交流對子女學業(yè)成績的影響,McNeal & Ralph(2012)使用國家教育追蹤數(shù)據(jù)發(fā)現(xiàn),親子交流比其余類型父母時間投入對子女的影響更大。Yan & Lin(2005)發(fā)現(xiàn),學業(yè)成績優(yōu)秀的學生,其父母更了解孩子朋友和小伙伴的情況。關于親子活動對子女學業(yè)成績影響,Heymann & Earle(2000)發(fā)現(xiàn),經(jīng)常帶子女參加博物館、圖書館、音樂會和動物園等活動能提高學生學習成績。關于父母參加家長會或學校活動的研究,大量基于單期投入型教育生產(chǎn)函數(shù)的研究肯定了家長與學校之間具有良好的溝通渠道有助于子女的學業(yè)發(fā)展(Xu et al,2010)。然而追蹤數(shù)據(jù),通過控制前測學業(yè)成績的增值模型發(fā)現(xiàn)父母參加學?;顒雍妥优畬W業(yè)成績之間并無必然因果關系(Park & Holloway,2017)。Morgan &Todd(2009)利用NCES 數(shù)據(jù),發(fā)現(xiàn)父母參加家長會可以通過影響學校決策或教師教學模式,間接影響學校所有學生學習成績,對自己子女的私人收益較小,對校級外部性收益更大。

        4. 國內實證研究綜述

        國內相關實證研究起步較晚,研究較多集中在近十年內。趙延東和洪巖璧(2012)基于2009 年全國青少年科技素養(yǎng)調查數(shù)據(jù),對20 個省市61 個小學班和57 個中學班采用OLS 方法發(fā)現(xiàn),父母的時間投入對學生成績有積極影響。但父母指導子女學習、改正錯題、檢查作業(yè)干擾了子女的正常學習過程,會對子女學業(yè)成績產(chǎn)生消極作用,老師也無法及時從學生的家庭作業(yè)中發(fā)現(xiàn)學生學習上存在的問題。李佳麗(2017)基于CEPS 2012 年數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),父母生活陪伴和與學校老師交流可以顯著提高子女的認知能力。但是親子交流、作業(yè)督導對認知能力無顯著影響,并指出作業(yè)督導對子女學業(yè)成績負向影響可能和父母教育子女的方法不正確有關。雖然有些父母對子女作業(yè)督導的時間投入很多,但沒有正確的教育方法,而是單純增加時間反而會占用本屬于學生的學習時間,產(chǎn)生擠出效應。郭筱琳等人(2017)基于山東聊城384 名小學生調查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),當學生自我效能感和教育期望較高時,父母時間投入對學業(yè)成績有負向影響;當學生學業(yè)自我效能感較高但教育期望較低時,父母時間投入對學業(yè)成績具有正向影響;當學生學業(yè)自我效能感較低時,無論其教育期望高低,父母時間投入對學業(yè)成績無影響。李波(2018a)基于北京市三個區(qū)縣的調查數(shù)據(jù),采用增值模型和PSM 方法發(fā)現(xiàn),親子閱讀、親子活動和親子交流對學生期末考試總成績有顯著正向影響,其中親子交流影響效果最大。但作業(yè)督導和家?;訉Τ煽冇绊懖伙@著。此外,通過中介效應分析發(fā)現(xiàn),親子閱讀、親子活動和親子交流能夠促進諸如學生的自尊、自我控制、學校適應、合作、人際交往和領導力等非認知能力,進而提高學生學業(yè)成績。

        5. 近五年國內實證研究存在的問題

        近五年,關于父母時間投入的研究更注重實證方法和影響機制的探討,但可能還存在如下三個問題。第一,尚未發(fā)現(xiàn)旨在解決模型內生性問題的實證研究(李佳麗,2017;郭筱琳等人,2017;李波,2018a)。父母在子女教育上的時間投入非隨機,不同家庭背景父母之間存在群體差異。由于調查研究無法獲取所有既與父母時間投入相關又和學生學習成績相關的變量信息,僅采用一般的相關分析或OLS 方法無法獲得家庭時間投入對學生教育產(chǎn)出的因果效應。雖然有些研究在模型中控制了部分家庭、學校和個體特征,但可能會存在遺漏變量問題。第二,家庭時間投入并不直接作用于教育生產(chǎn)過程,其究竟是如何影響學業(yè)成績,相關研究探討較少(李佳麗,2017;郭筱琳等人,2017),影響機制和路徑仍是未知的“黑箱”。第三,面板數(shù)據(jù)或增值模型的使用相對較少,這樣會導致逆向選擇問題(郭筱琳等人,2017)。例如以父母作業(yè)督導對子女學業(yè)成績的影響為例,較多研究發(fā)現(xiàn)父母作業(yè)督導對子女學業(yè)成績不僅沒有促進作用,反而降低了子女學業(yè)成績。上述結論可能很大程度上和模型沒有控制前期學習成績而導致的逆向選擇有關(學生學習成績差會導致父母作業(yè)督導,而不是父母作業(yè)督導會導致學生學習成績差),相關實證研究結論混淆了因果。

        四、學校投入型教育生產(chǎn)函數(shù)

        世界各國對學校進行了大量經(jīng)費投入,那么為學?!盎ㄥX有用嗎(Does money matter)”?教育經(jīng)濟學的一個經(jīng)典議題就是探討學校資源和學生學業(yè)成績之間的因果關系,其對教育政策制定和教育經(jīng)費投入發(fā)揮了重要的政策價值。1966 年《科爾曼》報告指出學生學業(yè)成績之間的差異更多來自家庭背景而非學校投入,自此涌現(xiàn)出了大量關于學校對學生學業(yè)成績影響的研究(Glewwe et al.,2011),尤其以漢納謝克(Hanushek)和赫吉斯(Hedges)雙方之間關于學校投入是否有效的長期爭論更是將教育生產(chǎn)函數(shù)研究推向高潮。漢納謝克(Hanushek,1989,1997,2003)的系列研究對四十年的教育生產(chǎn)函數(shù)研究成果進行再分析,并指出學校投入并不能提高學生學業(yè)成績。但赫吉斯等(Hedges et al.,1994)基于漢納謝克的187 項研究資料發(fā)現(xiàn),學校資源可以提高學生的學業(yè)成績。本文基于現(xiàn)有學校投入型教育生產(chǎn)函數(shù)的研究成果,將其劃分為四類,包括:重點學校與學生教育產(chǎn)出、學校經(jīng)費投入與學生教育產(chǎn)出、教師投入與學生教育產(chǎn)出、班級規(guī)模與學生教育產(chǎn)出。

        (一)重點學校與學生教育產(chǎn)出

        世界上眾多國家都設有重點學校,一般被稱為磁石學校(Magnet School)、貴族學校(Elite School)、精英學校(Selective School)、特許學校(Charter School)或文法學校(Grammar School)等,主要通過隨機派位、就近入學、擇?;蚍謹?shù)錄取等方法招生。我國重點校政策由來已久,1962 年教育部《關于有重點地辦好一批全日制中、小學校的通知》,明確規(guī)定要求各地選取一批重點中小學。1978 年教育部《關于辦好一批重點中小學的試行方案》,指出全國重點中小學形成“小金字塔”結構,同時在經(jīng)費投入、辦學條件、師資隊伍、學生來源等方面向重點學校傾斜,并最終形成國家級、省級、地級、縣級的重點學?!皩訉又攸c”的格局。在這個歷史背景下,重點校得到了大力的發(fā)展,但一些弊端也逐步顯現(xiàn),學校之間差距越來越大。在這一背景下,國家2006 年修訂施行的《中華人民共和國義務教育法》第22 條規(guī)定:“縮小學校之間辦學條件的差距,不得將學校分為重點學校和非重點學校,學校不得分設重點班和非重點班”。雖然法律有明確規(guī)定,但地方仍然普遍存在“喬裝打扮,偷梁換柱”的現(xiàn)象,大力舉辦“示范?!薄皩嶒灠唷?,重點學校實際上是“名亡實存”。

        1. 內生性偏估

        要識別重點學校對學生學業(yè)成績影響,較為簡單的方法就是比較重點學校和非重點學校學生在學業(yè)成績上的差異,但可行的前提條件是進入重點學校是隨機的。大量研究已證實進入重點學校的過程非隨機,重點學校學生在家庭背景和個人能力上存在顯著差異(Clark,2010;王駿和孫志軍,2015)。高中教育階段,重點高中錄取分數(shù)線較高,其會根據(jù)學生的中考成績選擇能力較強的學生入學,重點高中和學生能力高度相關。義務教育階段,小學和初中均實行就近入學政策,學生要想進入重點小學和初中必須購買高昂的學區(qū)房,因此重點中小學和學生的家庭背景高度相關。除了上述正規(guī)的通過考試和就近入學的方式,還有很多學生通過擇校的方式進入重點學校,例如以錢擇校、以權擇校、以社會關系擇校等(王善邁,2008)。因此,學生會根據(jù)不可觀測的特征選擇學校,而這些不可觀測特征又會反過來影響學生的學業(yè)成績,這種自選擇帶來的內生性問題會導致OLS 估計結果出現(xiàn)偏差。

        2. 國外實證研究綜述

        國外研究中,本文重點介紹采用因果識別的研究成果,實證方法包括隨機派位、工具變量和斷點回歸法。第一,采用隨機派位的研究。Cullen et al.(2006)基于芝加哥公立學校的隨機派位制度,發(fā)現(xiàn)對于那些贏得派位(Win Lotteries)的學生比那些未被抽中(Lose Lotteries)的學生能獲得更高的學業(yè)成績,并且更加自律,犯罪率也更低。Dobbie & Fryer(2011)基于Harlem Children Zone 重點學校計劃,采用隨機派位和工具變量兩種方法均發(fā)現(xiàn)重點中學對學生學業(yè)成績有顯著正向影響,并可以縮小白人和黑人學生在數(shù)學成績上的差異。Abdulkadiro?lu et al.(2011)利用美國波士頓州的學校供不應求或招生名額已滿的情況下,采用隨機派位或搖號的方式分配學生入學的政策構造準實驗,發(fā)現(xiàn)重點學校對初中和高中學生成績有顯著的正向影響。第二,采用工具變量的研究。Cullen et al.,(2005)以芝加哥公立學校60623 名學生為研究對象,采用OLS 回歸發(fā)現(xiàn)重點學校對學生學業(yè)成績有顯著正向影響。但采用學生家庭距離最近重點學校的距離為工具變量,發(fā)現(xiàn)重點學校對學生學習成績無顯著影響。Clark(2010)基于英國初中學校的數(shù)據(jù),采用學生小學成績預測的學生進入重點學校的概率作為工具變量,發(fā)現(xiàn)重點學校對學生學習成績幾乎沒有影響,但可以提高學生未來大學錄取率。因此,研究指出重點高中對學生短期教育產(chǎn)出沒有影響,但長期具有顯著影響。第三,采用斷點回歸的研究。Pop?Eleches & Urquiola(2013)基于羅馬尼亞初中考試入學錄取線制度,構建了約2000 個斷點,發(fā)現(xiàn)重點學校可以提高學生的學業(yè)成績,但是對學生的非認知能力有顯著的負向影響,學生感覺自己能力有限,且被邊緣化。此外,研究還發(fā)現(xiàn)進入重點學校降低了母親自身對子女教育的投入程度。

        3. 國內實證研究綜述

        在國內研究中,大量實證研究較多采用HLM 或OLS 方法。馬曉強等人(2006)基于保定市的高中數(shù)據(jù),采用迭代廣義最小二乘法(IGLS)發(fā)現(xiàn)學生高考成績的60%—80%差異是由學校間質量差異導致。胡詠梅和杜育紅(2008)基于西部五省農(nóng)村小學數(shù)據(jù),采用HLM 方法發(fā)現(xiàn)學校質量的提高可以促進學生的學業(yè)成績。丁延慶和薛海平(2009)基于2006 年昆明市高中調查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),學校對學生的學業(yè)成績影響較小,學生成績更多由自身能力和前期學習成績決定。唐俊超(2015)采用CGSS 2008 年數(shù)據(jù),利用Logistic 回歸發(fā)現(xiàn)進入重點學校對學生升學概率有顯著正向影響,且影響效果隨著小學升初中、初中升高中和高中升大學而逐漸變大。薛海平(2015)基于CFPS 2012 年數(shù)據(jù),采用PSM 方法發(fā)現(xiàn)重點學校能夠顯著提高學生的數(shù)學和英語成績。王駿等人(2017)基于我國某市高中數(shù)據(jù),采用HLM 方法發(fā)現(xiàn)重點高中能夠顯著提高學生的學業(yè)成績。謝桂華和張陽陽(2018)基于CEPS 數(shù)據(jù)中的認知能力代替學業(yè)成績,控制個人和家庭等各因素采用HLM 方法,發(fā)現(xiàn)學校質量對學生學業(yè)成績具有顯著正向影響。進一步控制學生2013—2014 年前測認知能力,采用增值模型發(fā)現(xiàn)學校質量對學生成績的影響由顯著變?yōu)椴伙@著。國內解決內生性的研究很少,且均采用錄取線制度構造斷點回歸設計。Dee & Lan(2015)基于內蒙古教育局的行政數(shù)據(jù),涉及2006?2008 年12 所高中的14245 名學生,發(fā)現(xiàn)成績高于重點高中錄取分數(shù)線可以提高學生進入重點高中的概率,據(jù)此采用模糊斷點回歸發(fā)現(xiàn)進入重點高中對學生成績無顯著影響。王駿和孫志軍(2015)基于F 縣2009—2010 屆17 所高中(4 所重點高中)7660 名畢業(yè)生數(shù)據(jù),采用斷點回歸設計發(fā)現(xiàn),重點高中可以微弱提高理科生的高考數(shù)學、語文和總成績,但對文科生高考成績無顯著影響。

        4. 近五年國內實證研究存在的問題

        近五年來,相關研究逐漸從OLS、HLM 方法過渡到采用準實驗的研究設計,但可能還存在如下幾點問題。第一,大量研究無法識別學校與學生教育產(chǎn)出之間的因果關系(唐俊超,2015;王駿等人,2017;謝桂華和張陽陽,2018),基于工具變量和斷點回歸的研究設計相對較少。第二,采用多層線性模型和多元線性回歸的研究中,采用控制學校投入變量的研究居多(唐俊超,2015;王駿等人,2017)。但是影響學校質量的因素很多,上述變量并不能控制學校的全部影響因素。有些難以觀測的學校因素可能對教育產(chǎn)出有一定影響,模型可能存在遺漏變量偏誤。第三,謝桂華和張陽陽(2018)采用認知能力代替學業(yè)成績,研究結論可靠性存疑。作者采用2014 年認知能力作為前測成績,研究重點學校對2015 年學生認知增值的影響。但認知能力與學業(yè)成績不同,很難在一年之內發(fā)生改變,認知能力數(shù)據(jù)很難滿足研究需要。第四,薛海平(2015)雖然采用PSM 方法解決樣本自選擇問題,但PSM 方法僅針對可觀測變量的匹配,無法克服不可觀測變量給估計結果帶來的偏誤。學生成績?yōu)榧议L自報的優(yōu)良中差等級,而非考試分數(shù),數(shù)據(jù)過于主觀,研究也沒有使用增值模型。第四,基于斷點回歸設計的研究(王駿和孫志軍,2015;Dee & Lan,2015),只是分析了重點高中是否有效,并沒有進一步探討重點高中的哪些投入有效。研究對象僅為斷點附近的學生,研究結論的外部有效性存疑。

        (二)學校經(jīng)費投入與學生教育產(chǎn)出

        1. 內生性偏估

        關于學校經(jīng)費投入對學生學業(yè)成績的影響,基于不同的數(shù)據(jù)和實證方法會得到不同研究結論,其中很重要的原因是如何處理估計過程中的內生性問題(Goldhaber & Brewer,1997)。教育生產(chǎn)函數(shù)框架試圖控制其他變量,來估計增加教育經(jīng)費投入的平均效應。但由于學校、家庭、地區(qū)經(jīng)濟發(fā)展水平、財政收入等不可觀測因素和學校經(jīng)費投入以及學生教育產(chǎn)出相關,很難通過調查數(shù)據(jù)獲取所有信息。例如,政府可能會將經(jīng)費支出重點放在成績不佳的學?;蛘呷雽W率極低的學校,或者富裕的父母可能會把孩子轉到生均支出較高的學校。學校經(jīng)費投入和家庭教育支出之間可能存在替代或互補的關系,例如段義德(2018)發(fā)現(xiàn)教育財政支出可以通過“擴張效應”和“補償效應”影響家庭教育投入決策;袁誠等人(2013)發(fā)現(xiàn)政府教育支出對于家庭教育總支出、義務教育學雜費和家教費有著明顯的“替代效應”。

        2. 國外實證研究綜述

        國外研究中,Hanushek(2003)對65 篇相關研究進行綜述,發(fā)現(xiàn)僅13 篇顯示生均經(jīng)費支出對學生成績有顯著正向影響,3 篇為負向影響,49 篇無影響。本文根據(jù)研究采用的實證方法進行綜述,包括固定效應、增值型、工具變量法等。第一,固定效應的研究。Ram(2004)基于1997 年的美國教育統(tǒng)計文摘數(shù)據(jù),發(fā)現(xiàn)學校生均經(jīng)費對學生SAT 分數(shù)有顯著正向影響,且對數(shù)學成績影響要大于語言成績。同時為了控制各州的不可觀測因素影響,研究更進一步控制州的固定效應,發(fā)現(xiàn)學校生均經(jīng)費對學生學業(yè)成績的影響減弱但依然顯著。第二,增值型教育生產(chǎn)函數(shù)研究。Holmlund et al.(2010)使用2001—2006年英國國家學生數(shù)據(jù)庫,將學生7 歲時考試總成績(包括英語、數(shù)學和科學)作為前測成績,11 歲時總成績作為當期成績,采用增值模型發(fā)現(xiàn)學校生均經(jīng)費支出增加1000 英鎊,將使英語、數(shù)學和科學的標準化分數(shù)分別提高0.04、0.05 和0.05 個標準差。對處于經(jīng)濟弱勢的學生(看其能否獲得學校的免費午餐),生均經(jīng)費支出增加1000 英鎊,數(shù)學、英語和科學的成績將會提高0.06、0.07 和0.07 個標準差。第三,基于工具變量法的研究。Roy(2011)使用1990—2001 年密歇根教育部數(shù)據(jù)庫數(shù)據(jù),研究學校財政改革(其旨在加大對貧窮區(qū)域學校的援助,同時對富裕地區(qū)學校的支出加以限制)是否能夠減少各區(qū)間學校經(jīng)費支出差距及其對學生學業(yè)成績的影響。作者使用政府規(guī)定的基礎津貼作為工具變量,發(fā)現(xiàn)學校生均經(jīng)費支出每增加1000 美元,低生均經(jīng)費支出地區(qū)的學生閱讀成績增加0.2—0.4 個標準差,數(shù)學成績增加0.4—0.55 個標準差,但是對大學預科考試ACT 的參與率和成績沒有影響。

        3. 國內實證研究綜述

        國內相關研究中,胡詠梅和杜育紅(2008)采用西部地區(qū)5 省區(qū)農(nóng)村初級中學的較大樣本調查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),生均事業(yè)費、生均公用經(jīng)費與學生學習成績呈現(xiàn)負向關系,并指出可能的原因是現(xiàn)行教師工資制度沒有真正反映教師績效,公用經(jīng)費被人員經(jīng)費擠占。丁延慶和薛海平(2009)基于2006 年昆明市公辦學校的調查數(shù)據(jù),以中考成績?yōu)榍捌诳荚嚦煽?,高考成績?yōu)楫斊诳荚嚦煽?,采用增值模型和HLM 方法發(fā)現(xiàn)學校生均公用經(jīng)費對學生高考成績有顯著影響。學校生均公用經(jīng)費每提高100 元,學生高考成績提高大約3 分。李祥云和魏萍(2014)基于2012 年對某市郊縣30 所小學三年級和五年級學生的調查數(shù)據(jù),選取全縣統(tǒng)一考試成績作為教育產(chǎn)出,采用HLM 方法發(fā)現(xiàn)學校生均公用經(jīng)費對學生語文和數(shù)學成績均具有顯著影響,同時較高的學校經(jīng)費支出可以弱化因父母職業(yè)、母親受教育水平和家庭收入不同導致的學生數(shù)學成績差異。因此,對家庭背景普遍較差的學校加大財政投入,可以縮小學生因家庭背景不同導致的學生成績上的差異,促進教育結果公平。李祥云和張建順(2018)基于湖北省70 所小學數(shù)據(jù),采用相關分析法發(fā)現(xiàn)生均公用經(jīng)費與學生期末語文和數(shù)學成績顯著正相關,但是相關系數(shù)小于教師質量與成績之間的關系。陳純槿和郅庭瑾(2017)基于CEPS 2013—2014 年基線數(shù)據(jù),同時采用“縣區(qū)受訪學校初中生人數(shù)對數(shù)”和“外縣區(qū)學生是否也有生均經(jīng)費”作為工具變量,在控制了學生家庭背景和學校特征的情況下發(fā)現(xiàn),生均公用經(jīng)費對學生標準化測試成績的影響呈現(xiàn)倒“U”型結構。生均公用經(jīng)費的正向效應在經(jīng)濟發(fā)展水平較低的農(nóng)村更加顯著,且生均公用經(jīng)費的提高顯著降低了家庭經(jīng)濟收入對學生學業(yè)成績的影響。

        4. 近五年國內實證研究存在的問題

        近五年實證研究方法經(jīng)歷了從單期教育生產(chǎn)函數(shù)和HLM 方法、增值模型和HLM 方法發(fā)展到近兩年的工具變量法,但研究可能還存在如下幾點問題。第一,使用學生成績作為衡量教育經(jīng)費投入的目的及效果還有待商榷,越來越多的證據(jù)表明,關注考試分數(shù)的影響可能會忽略一系列更廣泛長期結果的重要影響(Heckman et al.,2013)。第二,部分研究無法識別學校經(jīng)費投入對學生學業(yè)成績影響的因果效應。例如李祥云和張建順(2018)采用的僅是相關分析法,沒有對其他相關影響變量加以控制,研究結論僅能證明學校生均經(jīng)費投入與學生學業(yè)成績之間存在相關關系。第三,選擇固定效應模型的研究相對較少。例如李祥云和魏萍(2014)關于生均公用經(jīng)費等學校資源對區(qū)縣標準化語文和數(shù)學成績影響的研究中,僅控制了師生比例、高級教師比例、生均固定資產(chǎn)、生均圖書冊數(shù)和學校規(guī)模等。但研究不同學校間生均經(jīng)費等學校資源對學生學業(yè)成績的影響,不應控制學校特征,而應控制區(qū)縣特征,例如區(qū)縣經(jīng)濟發(fā)展水平、財政收入和財政支出等。如果區(qū)縣層面數(shù)據(jù)不易獲取,可以直接控制區(qū)縣固定效應,相較于控制區(qū)縣特征效果更好。

        (三)教師投入與學生教育產(chǎn)出

        1. 內生性偏估

        在實證模型設定之前,最重要的是分析教師投入在班級或學生中是否隨機。大量研究已證實教師投入與家庭、學校和班級相關。第一,教師投入水平與學生家庭背景相關,擁有較高社會經(jīng)濟地位的家庭會更大概率選擇師資力量較強的學校。楊東平(2005)基于北京、蘇州、寧波等10 個城市的調查,發(fā)現(xiàn)強勢家庭(高級和中級管理人員、技術人員)學生近60%在師資雄厚的重點學校讀書,而弱勢家庭則剛好相反,近60%學生就讀于非重點學校。第二,教師投入與學校質量相關。學校和教師之間存在雙向選擇關系,優(yōu)質學校會聘請高質量的老師,同樣優(yōu)秀教師會選擇優(yōu)質學校就職進而獲取更高的工資(Britton & Vignoles,2017)。第三,學校會根據(jù)學生的考試成績或能力,將不同學習水平的學生放在不同的班級,并配上不同質量的教師,優(yōu)秀教師最終被分配到重點班的概率較大(Clotfelter et al.,2007;Rothstein,2010)。

        2. 國外實證研究綜述

        鑒于實證模型的內生性問題,國外較多實證研究采用了增值模型,并控制學生家庭背景和學校固定效應。Clotfelter et al.(2007)基于1995—2004 年3—5 年級學生數(shù)據(jù),發(fā)現(xiàn)教師學歷和教齡對學生學業(yè)成績有顯著正向影響,尤其對數(shù)學成績影響最大。Rivkin et al.(2005)使用教師和學生信息的得克薩斯州大樣本行政數(shù)據(jù),數(shù)據(jù)包括1993—1995 年四年級60 萬名來自近一萬所公立學校的學生,并獲取了學生從三年級到七年級所有考試成績。研究基于多期投入型教育生產(chǎn)函數(shù)和校內固定效應,發(fā)現(xiàn)教師質量對學生閱讀和數(shù)學成績有顯著正向影響。Kane et al.(2008)使用來自紐約公立學校的數(shù)據(jù)基于增值模型發(fā)現(xiàn),認證教師對學生數(shù)學成績的影響比國際教師顯著高0.02 個標準差,對語文成績的影響比教員顯著高0.01 個標準差。Britton & Propper(2016)采用增值模型并控制了學生特征之后,發(fā)現(xiàn)英國過去五年教師工資變化對學業(yè)成績有顯著正向影響,但影響系數(shù)較小。教師工資上漲10%,學生學業(yè)成績提高約2%。

        關于教師績效工資的研究,Lavy(2009)對以色列1999?2001 年高中采用實驗研究設計,發(fā)現(xiàn)教師績效工資可以提高學生數(shù)學和英語成績,并能提高學生考試通過率。鑒于實驗學校非隨機分配,文章又使用斷點回歸和雙重差分進行檢驗,發(fā)現(xiàn)結論穩(wěn)健。Woessmann(2011)使用經(jīng)合組織國家教育系統(tǒng)數(shù)據(jù)和2003 年PISA 數(shù)據(jù),以28 個國家的19000 名學生為對象,在對學生、學校和國家背景進行嚴格控制后,發(fā)現(xiàn)采用績效工資國家學生在PISA 數(shù)學測試中分數(shù)比平均分高出24.8%。Fryer(2013)在紐約市200 多所公立學校進行隨機績效工資實驗,教師績效工資被設計為取決于其所在團體的整體表現(xiàn),研究并未發(fā)現(xiàn)教師激勵能夠提高學生學業(yè)成績。后續(xù)學者對Fryer(2013)的研究提出質疑,Goodman &Turner(2013)認為團體激勵會導致搭便車行為;Neal(2011)指出如果目標太容易或太難,教師可能不會做出最佳反應。Fryer et al.(2012)發(fā)現(xiàn)教師被罰款而不是獎勵效果更明顯。Balch & Springer(2015)基于奧斯汀獨立學院教師績效工資項目(該項目用于招聘、發(fā)展、留住教師),通過比較參與和未參與學校學生成績,發(fā)現(xiàn)教師績效工資對學生成績產(chǎn)生顯著正向影響。

        3. 國內實證研究綜述

        國內研究中,王駿等人(2017)以某市6 個區(qū)縣17373 名高中生為研究對象,以中考成績?yōu)榍皽y成績,高中會考成績?yōu)楫斊诔煽?。通過增值模型和HLM 方法,發(fā)現(xiàn)教師學歷對高中會考理科、文科和總成績均有顯著正向影響,教師職稱僅對文科成績有顯著正向影響。胡詠梅和杜育紅(2008)基于西部地區(qū)5 省區(qū)農(nóng)村初級中學數(shù)據(jù),采用兩水平線性模型發(fā)現(xiàn),少數(shù)民族專任教師比例、專任教師任職資格比例對學生學業(yè)成績有顯著正向影響。胡詠梅和盧珂(2010)基于西部地區(qū)基礎教育發(fā)展數(shù)據(jù),采用影響力評價的倍差法,發(fā)現(xiàn)具有任職資格的教師和骨干教師對學生學業(yè)成績有顯著正向影響。梁文艷和杜育紅(2011)基于西部地區(qū)基礎教育發(fā)展項目監(jiān)測調查數(shù)據(jù),采用增值模型和兩水平線性模型發(fā)現(xiàn),中國西部農(nóng)村地區(qū)的小學教師在學生學業(yè)發(fā)展中發(fā)揮著關鍵作用,教師差異是造成學生學業(yè)發(fā)展不均衡的重要因素。

        國內關于教師工資對學生學業(yè)成績影響的實證研究起步較晚,且多采用的是非實驗數(shù)據(jù)。丁延慶和薛海平(2009)采用增值模型和多層線性模型,發(fā)現(xiàn)高三教師平均月收入對學生高考成績無顯著影響。王駿等人(2017)發(fā)現(xiàn)教師工資對學生高中會考理科和文科成績均無顯著影響。師均培訓費對學生理科成績有顯著正向影響,但對文科成績影響不顯著。薛海平和王蓉(2016)以中國農(nóng)村義務教育狀況調查數(shù)據(jù)的299 所學校為對象,采用多層線性模型發(fā)現(xiàn),教師個人績效獎金和集體績效獎金對學生成績均有顯著影響,但集體績效獎金影響更大。集體績效獎金中,班級績效獎金影響最大。常芳等人(2018)利用西北農(nóng)村地區(qū)350 名數(shù)學老師和10784 名學生數(shù)據(jù),對教師進行了基于學生成績“絕對值”“增加值”和“增加值百分位”的績效激勵隨機干預實驗。發(fā)現(xiàn)對老師進行增加值百分位的激勵方式能夠促進老師改變教學行為,將學生的學業(yè)表現(xiàn)分別提高0.10 和0.15 個標準差,尤其是對成績較差的學生激勵效果更加明顯。

        4. 近五年國內實證研究存在的問題

        近五年國內研究逐漸從教師工資轉變?yōu)榻處熆冃ЧべY的探討,也出現(xiàn)了隨機干預實驗的研究。但實證研究可能還存在如下問題:第一,較多研究無法從教師努力獲取的績效工資中剔除出教師質量(教師學歷和教師職稱)的疊加影響,無法識別因果(薛海平和王蓉,2016;王駿等人,2017)?;陔S機干預實驗設計探討教師績效工資對學生學業(yè)成績影響的研究相對較少,通過中國知網(wǎng)檢索僅發(fā)現(xiàn)一篇,即常芳等人(2018)采用的陜西榆林市和甘肅天水市16 個縣216 所學校的實驗。第二,研究采用的績效工資更多是以學?;蚪萄薪M為單位的“平均主義”,無法完全調動教師積極性(王駿等人,2017)。鑒于績效工資沒有真正做到“多勞多得,優(yōu)績優(yōu)酬”的特點,存在教師搭便車行為,這導致研究過程中無法精確識別績效工資對學生學業(yè)成績的影響。第三,有些研究沒有采用增值模型,且數(shù)據(jù)使用存在一定問題。例如薛海平和王蓉(2016)采用2016 年的績效工資研究2017 年考試成績。一般而言,績效工資具有滯后性,2016 年績效工資更大概率是由于教師在2015 或2016 年的教學工作優(yōu)秀、學生考試成績優(yōu)異而發(fā)的獎金,顯然和2017 年學生考試成績無直接關系。第四,薛海平和王蓉(2016)的研究在沒有證明績效工資與學生前期成績之間不相關的情況下,沒有采用增值模型進行研究。精確的識別策略應是,識別績效工資實施給學生成績帶來的增值而非絕對值。

        (四)班級規(guī)模與學生教育產(chǎn)出

        教育經(jīng)濟學研究的一個重點問題是確定科學合理的班級規(guī)模,使其既能確保教學質量又不過度增加財政負擔(Glass & Smith,1979)。美國二戰(zhàn)以后由于嬰兒潮的發(fā)生,學齡人口急劇增加,使班級規(guī)模隨之增加。其推行了一系列班級規(guī)??s減政策,包括美國田納西州生師比成績項目(STAR)、威斯康辛州學生成績保障項目(SAGE)、加利福尼亞州班級規(guī)??s減項目(GSR)。Hanushek(2003)指出在1955—1985 年間,85%的教育經(jīng)費增長是由于班級規(guī)模縮減政策造成的。在我國,《2017 年全面改善貧困地區(qū)義務教育薄弱學?;巨k學條件工作專項督導報告》顯示,2017 年全國義務教育階段學校有66 人以上的超大班額班級8.6 萬個,占全國總班數(shù)的2.4%。56—66 人的大班額班級36.8 萬個,占全國總班數(shù)的10.1%,且大部分集中在中西部縣鎮(zhèn)?!秶鴦赵宏P于統(tǒng)籌推進縣域內城鄉(xiāng)義務教育一體化改革發(fā)展的若干意見》要求2018 年基本消除66 人以上的超大班額,2020 年消除56 人以上的大班額。

        1. 內生性偏估

        班級規(guī)模對學生學業(yè)成績影響的研究需注意班級規(guī)模的非隨機性,其主要體現(xiàn)在如下四個方面。第一,測量誤差。研究人員可能很難獲取每個學生所在班級的班級規(guī)模,而更多的是學生所在學校的平均班級規(guī)模,其可能會高估班級規(guī)模對學業(yè)成績的影響(Hanushek,1996)。第二,班級規(guī)模可能與學生家庭背景相關。二者可能正相關,例如家庭條件較好的父母可能更愿意將子女送進小班。二者也可能負相關,例如家庭條件好的父母可能將子女送入重點學校,而重點學校受市場青睞,導致學生數(shù)量多,進而可能存在大班。第三,班級規(guī)??赡芘c學生學習基礎相關。二者可能正相關,對于補償式教育的學校可能將成績較差的學生分配到小班。二者也可能負相關,對于精英式教學的學??赡軐⒒A較好的學生分配到小班。第四,班級規(guī)模可能與學校其他投入相關。二者可能正相關,經(jīng)費充足的學校有更多經(jīng)費去支持小班教學,而這些學校在其他資源(如設備、教師工資)上可能也更具優(yōu)勢。二者可能負相關,學??赡軐⒏嗟慕?jīng)費用于小班教學,而降低對學校其他資源的經(jīng)費投入,進而產(chǎn)生擠出效應。

        2. 國外實證研究綜述

        鑒于班級規(guī)模非隨機,單期投入型教育生產(chǎn)函數(shù)無法克服內生性和自選擇問題。Rockoff(2009)對文獻回顧發(fā)現(xiàn),班級規(guī)模對學業(yè)成績的影響不確定。其發(fā)現(xiàn)1950?1970 年的研究主要基于大規(guī)模數(shù)據(jù)和統(tǒng)計分析,之后的研究主要使用隨機控制實驗和準實驗等更加嚴謹?shù)囊蚬茢喾椒?。下文主要綜述基于因果識別的研究,包括四種研究范式。第一,利用班級規(guī)模限制,構建斷點回歸的研究(Angrist &Lavy,1999;Fredriksson et al.,2016)。Angrist & Lavy(1999)使用以色列小學國家測試項目數(shù)據(jù),基于猶太教義形成的班額政策②,采用斷點回歸法發(fā)現(xiàn)縮減班級規(guī)模對五年級學生閱讀和數(shù)學成績有顯著正向影響,對四年級學生閱讀成績有微弱影響,但對三年級學生成績無影響。第二,利用學齡人口變動,構建自然實驗的研究(Hoxby,2000;Woessmann & West,2006;Leuven et al.,2008)。例如,Hoxby(2000)利用美國康涅狄格州649 所小學各年級人口的縱向變化作為外生工具變量,發(fā)現(xiàn)班級規(guī)模和學生成績之間并無因果關系。第三,利用政策實施前后的面板數(shù)據(jù),采用差分法消除不隨時間變化的不可觀測因素。Dearden et al.(2002)使用英國國家兒童發(fā)展追蹤數(shù)據(jù),其追蹤1958 年出生的組群,獲取了從教育階段到進入勞動力市場的豐富數(shù)據(jù)。通過面板數(shù)據(jù)控制了能力和家庭背景后發(fā)現(xiàn),班級規(guī)模對學生成績無顯著影響。第四,隨機控制實驗,使學生的班級規(guī)模隨機。例如,在田納西州STAR 實驗中,個體被隨機分到小班(15—17 人),普通班(22—55 人)或從幼兒園到三年級有助手的普通班。Schanzenbach(2006)發(fā)現(xiàn)減少班級規(guī)模能夠提高成績。Krueger(1998)發(fā)現(xiàn)參加小班提高閱讀和數(shù)學測試分數(shù)0.20—0.28 個標準差,并且對低齡兒童、黑人學生和來自貧困家庭的孩子影響最為明顯。也有研究發(fā)現(xiàn)STAR 影響長期存在,小班化的學生在高中畢業(yè)、降低少女早孕、大學入學等方面表現(xiàn)更好(Chetty et al.,2011;Schanzenbach,2014)。

        3. 國內實證研究綜述

        國內研究中,多基于單期投入型教育生產(chǎn)函數(shù),研究結論也不一致。有的研究發(fā)現(xiàn)班級規(guī)模正向影響學生學業(yè)成績(胡詠梅和杜育紅,2008;唐一鵬,2014;胡詠梅等人,2015;王駿等人,2017;),負向影響(薛海平和閔維方,2008;孫志軍等人,2009;丁延慶和薛海平,2009),無影響(胡詠梅和杜育紅,2009;孫志軍等人,2009;袁玉芝,2016),存在異質性(史耀波和趙欣欣,2016;崔盛和吳秋翔,2019)。第一,基于OLS 的研究。孫志軍等人(2009)采用甘肅省20 個縣小學數(shù)據(jù)發(fā)現(xiàn)班級規(guī)模對小學生數(shù)學成績無影響,但對語文成績有顯著負向影響。崔盛和吳秋翔(2019)基于CEPS 數(shù)據(jù)以初中一年級及其追蹤數(shù)據(jù)為樣本,控制基期學業(yè)能力及相關變量,采用增值模型發(fā)現(xiàn)班級規(guī)模對學業(yè)能力的影響在不同行政區(qū)域、學校布局和家庭選擇間存在異質性。第二,基于HLM 的研究。胡詠梅和杜育紅(2008)采用西部五省農(nóng)村初中數(shù)據(jù),發(fā)現(xiàn)生師比對初中生學業(yè)成績有顯著正向影響。胡詠梅和杜育紅(2009)發(fā)現(xiàn),班級規(guī)模對小學生學業(yè)成績無顯著影響。王駿等人(2017)采用增值模型發(fā)現(xiàn)班級規(guī)模對學生高中會考文科成績和理科成績均有顯著正向影響。鄭琦和楊釙(2018)采用2015 年PISA 數(shù)據(jù),通過泛精確匹配消除不同規(guī)模班級學生在個體和家庭特征上的不平衡,發(fā)現(xiàn)初中的班級規(guī)模和成績存在非線性關系。高中的班級規(guī)模越大,成績越好。

        4. 近五年國內實證研究存在的問題

        近五年來,國內相關研究已有一定研究成果,但還可能存在如下幾點不足。第一,專門研究班級規(guī)模的實證研究僅發(fā)現(xiàn)兩篇(鄭琦和楊釙2018,崔盛和吳秋翔,2019)。在其他相關研究中班級規(guī)模僅是控制變量,并不是文章研究的重點,故沒有考慮班級規(guī)模的內生性問題。第二,崔盛和吳秋翔(2019)采用CEPS 中的認知能力代替學業(yè)能力,控制2013—2014 年認知能力,分析2013—2014 年班級規(guī)模對2014—2015 年學生認知能力的影響。該研究用認知能力代替學業(yè)能力可能欠妥。學業(yè)能力在一年內可能很容易發(fā)生改變,但認知能力很難在一年內發(fā)生改變,尤其是當改變認知能力的因素是班級規(guī)模時就更難以令人信服(CEPS 數(shù)據(jù)使用手冊中已指出,認知能力測試試題不包括學習課程所教授的具體識記性知識,而是測量學生邏輯思維和問題解決能力)。第三,鄭琦和楊釙(2018)用大量篇幅闡述了班級規(guī)??赡芎图彝ケ尘昂蛯W生特征相關,因此采用泛匹配法解決樣本內生性問題。但是該研究遺漏了一個最重要變量,即學生的前期學習成績,沒有采用增值模型導致的偏差要遠大于其采用泛匹配法解決的樣本自選擇帶來的偏差。第四,當前尚未發(fā)現(xiàn)基于實驗、自然實驗或準實驗的研究。雖然鄭琦和楊釙(2018)在文章中稱其通過泛精確匹配構建了準實驗的研究設計。但泛匹配法僅基于可觀測變量的特征進行匹配,該方法無法克服遺漏不可觀測變量導致的估計偏誤,很難稱得上是準實驗設計。

        五、教育生產(chǎn)函數(shù)研究趨勢與展望

        近五年來,教育生產(chǎn)函數(shù)研究得益于統(tǒng)計學、計量軟件和數(shù)據(jù)獲取技術的發(fā)展,實證過程的嚴謹性與結果的準確性得到逐漸提高。本文基于上述國內外文獻綜述,通過對比近五年與以往文獻實證方法和研究內容,總結出近五年教育生產(chǎn)函數(shù)研究的六大發(fā)展趨勢。此外,雖然近五年教育生產(chǎn)函數(shù)模型在誤差控制較早期有了較大改進,但教育生產(chǎn)的復雜性和聯(lián)系性等非可控因素的存在決定了改進模型的難度。在實證研究中,針對具體情境選擇合適的模型將有助于提高估計的準確性。當前教育生產(chǎn)函數(shù)研究還有諸多不足之處,本文在發(fā)展趨勢的基礎上提出相應的建議,并對我國未來教育生產(chǎn)函數(shù)的研究進行展望。

        (一)識別策略:從相關分析到因果識別

        早期教育生產(chǎn)函數(shù)較多探討教育投入與產(chǎn)出的相關關系,但不能識別教育產(chǎn)出是否為我們要考察的教育投入產(chǎn)生的。此外,相關分析在模型設定上也忽略了內生性問題,可能得到有偏的實證結論。近五年來,教育生產(chǎn)函數(shù)實證研究逐漸注重因果關系的識別。因果識別方法主要包括三類:第一,控制變量法。教育生產(chǎn)中環(huán)境的復雜性決定了教育產(chǎn)出結果的多變性,學生教育獲得是家庭和學校共同作用的結果。在探討教育投入對教育產(chǎn)出影響時,要控制既和教育投入相關又和教育產(chǎn)出相關的所有變量。但現(xiàn)實中調查數(shù)據(jù)很難獲取上述全部信息,進而會導致遺漏變量偏誤。第二,自然實驗或準實驗法。近五年我國教育生產(chǎn)函數(shù)領域已有相當?shù)难芯坎捎昧酥T如傾向得分匹配法、雙重差分法、工具變量法和斷點回歸法等計量方法,并依據(jù)外生沖擊或政策實施來構造自然實驗或準實驗,進而解決模型存在遺漏重要解釋變量而導致的內生性問題。第三,隨機控制實驗。相較于控制變量法和準實驗法,隨機控制實驗是識別因果關系最直接有效的方法。隨機控制實驗最早應用于臨床研究和新藥實驗,近幾十年來逐漸受到社會科學研究者的青睞。在我國,鑒于資金投入、倫理道德、協(xié)調成本、項目獲批難度,隨機控制實驗研究相對較少。但近五年來較多學者已充分肯定了隨機控制實驗的巨大優(yōu)勢,其必將在未來教育生產(chǎn)函數(shù)實證研究中發(fā)揮更大作用。

        (二)模型設定:從單層線性到多層交互

        早期教育生產(chǎn)函數(shù)研究多采用單層線性模型,但要想獲得無偏且一致的估計量,方程殘差項需滿足獨立同分布和方差恒定假設。但在教育生產(chǎn)過程中,學生的教育產(chǎn)出受到家庭、學校和班級的共同影響,相同學?;虬嗉墝W生之間的特征差異要小于不同學校和班級學生之間的特征差異。倘若方程未考慮學生嵌套于班級和班級嵌套于學校的現(xiàn)實情況,把學生、班級和學校放置于同一水平上分析,將導致殘差方差與班級或學校層面的變量相關,違背了OLS 回歸關于獨立同分布和方差恒定的前提假設。實證研究中,解決變量嵌套問題較多采用多層線性模型。例如就兩水平線性模型而言,把學生特征變量歸為方程第一水平,把學校層面相關變量歸為方程第二水平,進而收縮估計,剝離不同水平上的影響因素,并基于變量所在層面分別回歸并加權處理。其過程相較于OLS 回歸更接近于變量嵌套的真實情況。因此,未來的教育生產(chǎn)函數(shù)研究應充分重視教育生產(chǎn)過程中存在的嵌套關系,認識到影響教育產(chǎn)出的多維度變量多重交互這一客觀現(xiàn)實。

        (三)數(shù)據(jù)結構:從單期橫截面到多期追蹤

        近五年來,伴隨著計量模型和識別策略的不斷進步,實證研究對數(shù)據(jù)的要求也逐漸苛刻(見表1),高質量的數(shù)據(jù)幾乎成為文章能夠在頂級期刊發(fā)表的必要不充分條件。鑒于教育生產(chǎn)過程的累積性和動態(tài)性這一基本事實,數(shù)據(jù)需要更加注重對教育投入的流量進行精確的追蹤和統(tǒng)計,對教育產(chǎn)出的測量需要更加科學和精準。我國當前行政數(shù)據(jù)獲取較難,教育追蹤數(shù)據(jù)庫資源有限。數(shù)據(jù)的相對匱乏,從某種程度上限制了教育生產(chǎn)函數(shù)研究在我國的推進和發(fā)展。近五年我國教育生產(chǎn)函數(shù)研究更多采用國際教育項目數(shù)據(jù)。部分研究基于研究者自己收集的小規(guī)模調查數(shù)據(jù),數(shù)據(jù)結構多為單期,缺乏長期的追蹤觀測。此外,我國教育生產(chǎn)函數(shù)研究采用的數(shù)據(jù)多針對某地區(qū)或某學校展開,研究結論和政策建議的推廣存在很大局限。未來我國建立高質量的追蹤數(shù)據(jù),營造數(shù)據(jù)共享的良性學術氛圍尤為重要和緊迫。例如可以尋求新興互聯(lián)網(wǎng)調研經(jīng)費眾籌模式,眾籌者在保護期內有數(shù)據(jù)使用的獨享權,避免出現(xiàn)部分學者在數(shù)據(jù)使用上的搭便車行為。

        表1 數(shù)據(jù)結構、模型選擇與一致性

        此外,當面板數(shù)據(jù)獲取存在困難時,建議研究者應盡可能獲取多期的教育產(chǎn)出數(shù)據(jù),并推薦使用增值模型。其理由主要有如下幾點:第一,教育投入是流量,教育產(chǎn)出是存量,增值模型通過控制前期教育產(chǎn)出,來研究當期教育投入對當期教育產(chǎn)出的影響,滿足了教育生產(chǎn)函數(shù)流量投入存量產(chǎn)出的特征。第二,家庭背景和學校特征短期內不易改變,增值模型控制了前期教育產(chǎn)出等于在一定程度上控制了家庭背景和學校特征等不可觀測變量,有效解決了模型遺漏變量偏誤。第三,前期教育產(chǎn)出有可能會影響到當期教育投入,如果不選擇使用增值模型對前期教育產(chǎn)出進行控制,會導致樣本自選擇導致的估計偏誤。第四,控制了前期學業(yè)成績,一定程度上等于控制了不易測量的學生能力(學業(yè)成績和學生能力高度相關),可以有效解決模型存在的內生性問題。因此,未來教育生產(chǎn)函數(shù)研究應充分重視教育生產(chǎn)的累積性,在條件允許情況下優(yōu)先選擇多期投入型教育生產(chǎn)函數(shù)。若多期投入數(shù)據(jù)獲取存在困難,應盡可能選擇增值型教育生產(chǎn)函數(shù)。

        (四)投入類型:從不可操作到可操作

        教育生產(chǎn)函數(shù)研究除了幫助尋找出教育產(chǎn)出的決定因素,更為重要的是能夠指導政府、學校和家庭進行科學合理的教育投入,以最小投入獲取最大程度教育產(chǎn)出。但如果研究關注的教育投入是在短期內不容易改變或不能改變的(如家庭經(jīng)濟地位、父母學歷、政治面貌、居住地特征、戶口類別、種族、學校選擇、同伴構成等),則研究成果的可操作性弱、指導性差,研究結論的政策建議就會大打折扣。近五年來,國內教育生產(chǎn)函數(shù)研究更加關注投入的可操作性,包括作業(yè)督導、親子交流、親子互動、課外補習、學校經(jīng)費、教師績效工資等教育投入的研究。上述研究成果可以引導家庭教育行為,優(yōu)化政府經(jīng)費投入方式和結構,改進學校的管理模式,具有較強的可操作性。建議未來教育生產(chǎn)函數(shù)研究中,學者應多關注可操作教育投入對教育產(chǎn)出的研究,引導教育投入主體通過改變投入方式來獲取最大的教育產(chǎn)出,并最終使研究成果能夠真正地服務社會。

        (五)數(shù)據(jù)測量:從主觀臆斷到客觀準確

        數(shù)據(jù)的準確性是教育生產(chǎn)函數(shù)估計結果準確性的前提條件,建議在條件允許的情況下,優(yōu)先選擇行政數(shù)據(jù)而非調查數(shù)據(jù)。以學業(yè)成績數(shù)據(jù)為例,具體分析數(shù)據(jù)獲取中可能存在的問題,以及由此引發(fā)的控制變量的固定效應選擇。我國教育生產(chǎn)函數(shù)研究中,學業(yè)成績數(shù)據(jù)存在兩方面問題。第一,受限于行政數(shù)據(jù)獲取難度,部分研究的成績數(shù)據(jù)取自問卷中學生或家長自報學生成績在班級中排名,數(shù)據(jù)過于主觀,存在較大的測量誤差。有少量研究通過中小學管理信息系統(tǒng)調取了學生百分制考試成績,但多為區(qū)域性數(shù)據(jù),樣本量較小。第二,當前我國中小學生考試成績多以優(yōu)良中差等級劃分的形式告知學生和家長,而具體的考試分數(shù)根據(jù)教育部門的規(guī)定不允許公布,且不允許對學生成績進行班級或學校排名。但是義務教育階段學生,尤其是小學生的學習成績多屬于優(yōu)秀水平,學生考試成績的變異系數(shù)較小,會導致研究中教育投入對教育產(chǎn)出影響不顯著。因此,未來研究應在條件允許情況下,盡可能獲取確切考試分數(shù)而非等級,且數(shù)據(jù)盡可能來源于系統(tǒng)調取而非學生或家長自報成績,確保數(shù)據(jù)的客觀性。

        數(shù)據(jù)測量方式也會影響模型控制變量選擇,下文同樣以學習成績?yōu)槔?,并分五種情況進行分析(見表2)。第一,考試成績?yōu)閰^(qū)縣統(tǒng)一命題且區(qū)縣統(tǒng)一判卷,則學校和班級層面投入對成績影響應分別控制區(qū)縣和學校固定效應。第二,考試成績?yōu)閰^(qū)縣統(tǒng)一命題但學校自主判卷,鑒于不同學校判卷尺度差異,學校間學生成績不具有可比性。該數(shù)據(jù)不能研究學校層面投入,但可以研究班級層面投入對成績影響,并控制學校固定效應。第三,考試成績?yōu)閷W校統(tǒng)一命題、學校統(tǒng)一判卷,該數(shù)據(jù)不能研究學校層面投入,但可以探討班級層面投入對成績影響,并控制學校固定效應。第四,考試成績?yōu)閷W校統(tǒng)一命題、班級自主判卷。鑒于不同班級老師判卷尺度差異,班級間學生成績不具有可比性。該數(shù)據(jù)不能用于學校和班級層面投入對成績影響的研究。第五,考試成績?yōu)榘嗉壸灾髅}、班級自主判卷。該數(shù)據(jù)不能用于學校和班級層面投入對成績影響,但可以研究家庭層面投入對學業(yè)成績的影響,并應控制班級固定效應。未來教育生產(chǎn)函數(shù)研究參照上文涉及的五種情況,應有選擇地控制區(qū)縣、學?;虬嗉壒潭ㄐ蕴岣邔嵶C結果的準確性。

        表2 命題、判卷形式和固定效應選擇

        (六)影響類型:從評價效果到破解機制

        教育生產(chǎn)函數(shù)研究的是教育投入對教育產(chǎn)出的影響,但隨著中介效應模型和STATA、AMOS 等統(tǒng)計軟件的發(fā)展,近五年研究不僅關注教育投入對教育產(chǎn)出的影響,更關注教育投入如何影響教育產(chǎn)出,即探討投入和產(chǎn)出之間的內部影響機制。中介效應模型最近幾年在教育學、心理學領域的實證分析中得到了大量使用,其通過逐步檢驗回歸系數(shù)、系數(shù)乘積檢驗(Sobel 檢驗、Bootstrap 檢驗)、系數(shù)差異檢驗來分析自變量對因變量的影響路徑。例如以家庭層面教育投入對教育產(chǎn)出的影響為例,近五年來國內的研究中,薛海平(2018)發(fā)現(xiàn),家庭背景通過影響子女的課外補習機會,進而影響子女學業(yè)成績;李波(2018a)發(fā)現(xiàn),家庭背景通過影響諸如作業(yè)督導、親子閱讀、親子活動、親子交流、家校互動等父母時間投入,進而提高子女非認知能力(包括自尊、自我控制、人際交往、學校適應、領導力、合作),并最終影響子女的學習成績;李忠路和邱澤奇(2016)發(fā)現(xiàn)家庭背景通過教育參與和行為支持來影響子女學習行為和態(tài)度,并最終影響子女的學習成績。因此,未來教育生產(chǎn)函數(shù)研究中,學者不僅要識別教育投入對教育產(chǎn)出的影響,更要分析教育投入對教育產(chǎn)出的影響路徑,破解教育投入對教育產(chǎn)出影響機制的“黑箱”。

        猜你喜歡
        黑箱學業(yè)成績班級
        基于回歸分析模型的學生學業(yè)成績差異研究
        班級“四小怪”
        小讀者(2021年4期)2021-11-24 10:49:03
        拒絕黑箱
        失蹤的黑箱
        如何構建和諧班級
        甘肅教育(2020年22期)2020-04-13 08:10:52
        不稱心的新班級
        快樂語文(2016年7期)2016-11-07 09:43:56
        學業(yè)成績與習得性無助:有調節(jié)的中介效應
        大學生上網(wǎng)情況與學業(yè)成績關系的實證研究
        大專護生自我效能感、就業(yè)取向與學業(yè)成績的關系研究
        班級被扣分后
        中國火炬(2013年5期)2013-07-25 09:51:50
        亚洲老妇色熟女老太| 最新日韩精品视频免费在线观看| 精品欧洲av无码一区二区14| 十四以下岁毛片带血a级| 人妻体体内射精一区二区| 黑人巨大跨种族video| 伊伊人成亚洲综合人网香| 欧美性性性性性色大片免费的| 日韩精品网| 免费a级毛片无码a∨免费| 日韩午夜三级在线视频| 99久久婷婷国产精品综合| 友田真希中文字幕亚洲| 国产精品视频一区二区三区不卡 | 又污又黄又无遮挡的网站| 国产精品视频久久久久| 国产精品99久久国产小草| 亚洲国产精品美女久久久| 亚洲av推荐网站在线观看| 中文字幕亚洲乱码熟女1区| 日本大骚b视频在线| 欧美国产日本高清不卡| 国产成社区在线视频观看| 看黄色亚洲看黄色亚洲| 久久综合亚洲鲁鲁五月天| 免费av日韩一区二区| 亚洲国产精品不卡av在线| 亚洲av高清在线观看一区二区| 国产情侣久久久久aⅴ免费| 人妻精品久久中文字幕| 国产精品亚洲av国产| 一区二区中文字幕蜜桃| 久久精品亚州中文字幕| 妇女bbbb插插插视频| 又污又爽又黄的网站| 久久天天躁狠狠躁夜夜中文字幕| 亚洲国产精品成人一区二区三区 | av无码精品一区二区三区| 精品偷拍被偷拍在线观看| 97午夜理论片在线影院| 国产成人自拍视频在线免费|