唐圣權(quán)
(廣州市花都區(qū)教育局,廣東廣州510800)
?
中小學教育質(zhì)量綜合評價的新思路
唐圣權(quán)
(廣州市花都區(qū)教育局,廣東廣州510800)
摘要:要使教育質(zhì)量評價真正取得具有可比性的結(jié)果,并引導教育朝著全面貫徹黨的教育方針、促進學生身心健康和素質(zhì)全面提高的方向發(fā)展就需要全面衡量構(gòu)成教育質(zhì)量的各種因素;構(gòu)建綜合表征教育質(zhì)量的數(shù)學模型;用教育部《指標框架》指導現(xiàn)有考試和評價項目的改良。
關(guān)鍵詞:中學;小學;教育質(zhì)量;評價;思路
“教育質(zhì)量評價具有重要的導向作用,是教育綜合改革的關(guān)鍵環(huán)節(jié)。”[1]2013年,教育部發(fā)布《關(guān)于推進中小學教育質(zhì)量綜合評價改革的意見》,編制《中小學教育質(zhì)量綜合評價指標框架》,并確定上海市等30個地區(qū)為國家中小學教育質(zhì)量綜合評價改革實驗區(qū)。[2]品讀指標框架,靜觀實驗開展(以廣州市觀之),筆者提出以下幾點看法:
在我國傳統(tǒng)的教育實踐中,人們往往把教育質(zhì)量等同于學業(yè)成就,而把學業(yè)成就等同于考試成績。大約20世紀末,開始有所改進,人們運用檔案袋資料法、品德評價法等,開展學生素質(zhì)綜合評價。顯然,這對學業(yè)成就的評價而言,更為全面些;但仍然寓于學業(yè)成就評價之范疇,沒有達到教育質(zhì)量綜合評價之境界。
學業(yè)成就是構(gòu)成教育質(zhì)量的重要因素,二者確有密切關(guān)系。但作為描述事物屬性的概念,它們指向不同的主體;作為教育評價的內(nèi)容,它們處于不同的層次。學業(yè)成就是學生在學校安排各種課程(包括學科課程、環(huán)境課程、活動課程)中所取得的進步,表現(xiàn)為學生身心發(fā)展到更高的水平。它指向于學生這類主體,用于描述學生的特征。學業(yè)成就評價,屬于微觀層次的評價,一般是通過考試得到學科成績、通過鑒定獲得評語、通過評比獲得等級等方式進行的。教育質(zhì)量是指實施教育的主體在教育實踐中的勞動質(zhì)量、服務質(zhì)量和整體水平。它指向于教育者、教育機構(gòu)(如學校)、一定區(qū)域的教育系統(tǒng)這類主體,用于描述教育實施者的特征。
(一)教育質(zhì)量評價指向教育者個人時,是指對教師在教學和其他教育工作中勞動質(zhì)量的評價,屬于微觀評價。
(二)教育質(zhì)量評價指向教育機構(gòu)時,是指對教育機構(gòu)為促進學生發(fā)展所提供服務的質(zhì)量評價,屬于中觀評價。
(三)教育質(zhì)量評價指向一定區(qū)域的教育系統(tǒng)時,是指這一區(qū)域教育實踐的總體水平,屬于宏觀評價。
無論哪個層上的教育評價,都離不開學業(yè)成就評價。因為教育是培養(yǎng)人事業(yè),教育實踐的最終成果體現(xiàn)為學生身心發(fā)展水平的提高。但教育質(zhì)量評價所要考慮的,不唯學業(yè)成就,還必須綜合考慮其他一些因素,方可得出具有可比性的評價結(jié)論。
(一)學生獲得多少發(fā)展
在教育實踐中,判斷學生發(fā)展水平最常見的方式就是考試或者測驗。即使目前國際上流行的PISA(Programme for International Student Assessment,國際學生評價項目)、PIRLS(Progress in International Reading Literacy Study,國際閱讀素養(yǎng)進步研究)、TIMSS (Trends in International Mathematics and Science Study,國際數(shù)學和科學趨勢研究)[3]等教育評價項目,也是通過測驗方式進行的。鑒定性評語、等級評比、檔案袋資料等盡管也用于學生評價,但僅僅只是作為測驗方式的補充。
通過測驗或其他方式獲得的學生評價結(jié)果,即使有較高的信度和效度,也只能表明學生發(fā)展目前達到什么水平,而不能代表學生因?qū)W校教育而獲得的發(fā)展量。因為,目前成績是本階段教育之前的基礎(chǔ)和本階段教育成效相累加而得的結(jié)果。學生獲得多少發(fā)展的問題,必需考慮其發(fā)展史上的起點位置和目前位置。
發(fā)展量=目前位置-起點位置
具有同樣考試成績的不同學生,其目前位置相同,但起點高者發(fā)展量少,起點低者發(fā)展量大。這是非常淺顯的道理。就某一階段的教育而言,如初中階段教育,評價其教育質(zhì)量就必須考慮新生的入學成績和畢業(yè)生的畢業(yè)成績。二者之差(當然不能用分數(shù)直接相減的辦法計算),才能代表學生在這一教育階段實際獲得多少發(fā)展。
還必須指出,目前中小學教育質(zhì)量綜合評價改革實踐中,大家都傾向于根據(jù)教育部的指標框架、或本地區(qū)重新設(shè)計的指標框架,紛紛開發(fā)面向?qū)W生的專門測驗工具、評價工具,組織專門的測驗活動、評價活動。這不僅會耗費大量的人力、物力、財力,而且會使本來就背著沉重學業(yè)負荷的學生猶如雪上加霜。其實,入學摸底考試、畢業(yè)水平考試、升學選拔考試、學期或?qū)W年考試、乃至平時學科測驗等,就有可能為教育質(zhì)量評價提供足夠的數(shù)據(jù)來源。若為教育質(zhì)量綜合評價改革而專門組織測驗活動,就是為評價而評價,難免有畫蛇添足之嫌。
學業(yè)成就評價真正需要改革的,不是額外增加一些測評項目,而是改良現(xiàn)有的評價體系,用教育部《指標框架》指導現(xiàn)有考試和評價項目的改革,使之能夠引導教育朝著全面貫徹黨的教育方針、促進學生身心健康和素質(zhì)全面提高的方向發(fā)展。
(二)學生付出多少代價
借用經(jīng)濟學的說法,教育活動中學生獲得的發(fā)展是收益,而學生為此付出的代價,則是一種成本。教育質(zhì)量本質(zhì)上就是人的勞動質(zhì)量,評價教育質(zhì)量必須考慮“生產(chǎn)成本”,無視成本就不可能科學評價教育的質(zhì)量。教育活動中學生付出的成本,主要包括兩個方面:
1.教育所耗費的時間。人的生命時光是有限的,學生學校教育活動中付出時間越多,意味著用于其它社會實踐的時間越少。若按博士研究生的一般情況估算,一個人專門用于接受學校教育的時間,大約占據(jù)整個生命時光的三分之一。
2.教育所承受的負擔。在教育過程中所付出的代價,除勞動和時間之外,還可能有學生的身心健康、生活樂趣、興趣愛好和發(fā)展可能性。如果教育以犧牲學生身心健康、生活樂趣、興趣愛好和發(fā)展可能性為前提,那么學生就會失去幸福感、生存質(zhì)量就低?!秶抑虚L期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》指出:“過重的課業(yè)負擔嚴重損害兒童少年身心健康?!?/p>
對于這兩種成本的估算,目前尚沒有可操作的具體方案。但廣東省教育科學規(guī)劃“義務教育學業(yè)負荷監(jiān)測及預警研究”課題組開發(fā)的“義務教育學業(yè)負荷監(jiān)測預警系統(tǒng)”(演示網(wǎng)站warn.hdjyky.com),或可作為一種替代工具。監(jiān)測預警系統(tǒng)的監(jiān)測結(jié)果為學業(yè)負荷指數(shù),綜合地代表著學習時間、學習難度、學習體驗三方面的數(shù)量,也大致涵蓋了上述兩方面的成本。
(三)消耗多少社會資源
教育不僅需要學生付出代價,還需要消耗一定數(shù)量的社會資源。這是在學生成本之外,由社會負擔的成本。教育消耗的社會資源,涉及人力、物力、財力等方面,具體包括:①土地和校舍;②儀器、設(shè)備、材料;③師資、教輔、后勤保障;④經(jīng)費投入。任何社會資源,都具有稀缺性。教育領(lǐng)域投入增加,意味著其他領(lǐng)域要做出一定的讓步和犧牲。消耗多少,產(chǎn)出多少,這是教育經(jīng)濟學不可回避的話題。
一項成功的教育質(zhì)量評價,應該有以下特征:取得一個或一系列能表征教育質(zhì)量的數(shù)據(jù);針對同類主體的評價結(jié)果,具有可比性。因此,基于上述對教育質(zhì)量及其評價的理解,不妨構(gòu)建一個綜合表征教育質(zhì)量的數(shù)學模型。
這個模型,綜合考慮了構(gòu)成教育質(zhì)量的四種因素:畢業(yè)生學業(yè)成就、新生學業(yè)基礎(chǔ)、學業(yè)負荷量、社會資源消耗量。其中,畢業(yè)生學業(yè)成就與教育質(zhì)量成正比,其他三種因素均與教育質(zhì)量成反比。
需要注意,上述公式中5個變量均為指數(shù)值,也就是通過特定算法得到的相對值,而不是原始數(shù)據(jù)。例如,畢業(yè)生成就不能直接用考試分數(shù)代入公式計算,而必須先將考試分數(shù)作適當處理,得到畢業(yè)生學業(yè)成就指數(shù),而后才能代入公式計算。
1.教育質(zhì)量指數(shù):是通過綜合評價教育質(zhì)量而得到的最終的、整合性的結(jié)果,代表教育質(zhì)量的整體水平。這是一個相對值,主要用于在同類主體間進行教育質(zhì)量比較。
2.畢業(yè)生學業(yè)成就指數(shù):就是個別或部分畢業(yè)生的學業(yè)成就,與一定區(qū)域內(nèi)全體畢業(yè)生學業(yè)成就平均數(shù)的比值。畢業(yè)生學業(yè)成就常以畢業(yè)考試或升學考試的分數(shù)表示。因而,大致可用個別或部分畢業(yè)生的畢業(yè)成績,除以一定區(qū)域內(nèi)全體畢業(yè)生平均成績,得到畢業(yè)生學業(yè)成就指數(shù)。顯然,相對于作為參照系的本區(qū)域全體畢業(yè)生,這個比值越大,這個或這部分畢業(yè)生目前所達到的發(fā)展程度越高。
3.新生學業(yè)基礎(chǔ)指數(shù):就是個別或部分新生的學業(yè)水平,與一定區(qū)域內(nèi)全體新生學業(yè)水平平均數(shù)的比值。新生的學業(yè)水平可以用升學考試成績、或入學時摸底考試的成績表示。新生學業(yè)基礎(chǔ)指數(shù),也是參照本區(qū)域全體新生情況而獲得相對值。這個比值越大,意味著生源比較優(yōu)質(zhì)。在同等教育條件下,這些學生本來就可達到更高的發(fā)展層次;若與其他學生取得同樣的學業(yè)成就,只能說明他們所接受教育,比一般情況下的教育質(zhì)量更差。
4.學業(yè)負荷指數(shù):目前國內(nèi)唯一可獲得學業(yè)負荷指數(shù)的工具是廣東省教育科學規(guī)劃“義務教育學業(yè)負荷監(jiān)測及預警研究”課題組開發(fā)的“義務教育學業(yè)負荷監(jiān)測預警系統(tǒng)”。其指數(shù)值的計算是比較復雜的,涉及學業(yè)負荷的監(jiān)測指標與數(shù)學模型問題。若將其應用于教育質(zhì)量綜合評價,可以直接引用監(jiān)測結(jié)果,而忽略系統(tǒng)內(nèi)部的復雜計算過程。其局限在于,系統(tǒng)目前只適用于小學階段、初中階段的學業(yè)負荷監(jiān)測,而不能用于高中階段。
5.資源消耗指數(shù):在特定年限的教育周期內(nèi),某學校的生均資源消耗量,除以其所在區(qū)域的生均資源消耗量,即得此學校的資源消耗指數(shù)。關(guān)于生均資源消耗量的計算,目前尚無現(xiàn)成的案例可循。但可以肯定,諸如經(jīng)費消耗、校舍和設(shè)備折舊、土地占用、師資數(shù)量和質(zhì)量等因素,均應置于考慮范圍之內(nèi)。
參考文獻:
[1]教育部.關(guān)于推進中小學教育質(zhì)量綜合評價改革的意見[Z].教基[2013]2號,2013-06-03.
[2]教育部辦公廳.關(guān)于做好中小學教育質(zhì)量綜合評價改革實驗工作的通知[Z].教基二廳函[2013]22號,2013-12-03.
[3]江春蓮.TIMSS系列研究研究簡介[J].數(shù)學通訊,2006(09).
中圖分類號:G46
文獻標識碼:A
文章編號:1673-9884(2016)02-0122-03
收稿日期:2015 - 11 - 26
基金項目:廣東省教育科學“十二五”規(guī)劃課題“義務教育學業(yè)負荷監(jiān)測及預警研究”(課題批準號:2012YQJK064)
作者簡介:唐圣權(quán)(1965-),男,廣東廣州人,廣州市花都區(qū)教育局副教授。