劉云華 段世飛
2019年12月,國際大型學生評估項目(Programme for International Student Assessment,以下簡稱PISA)公布了最新一次的測試結果。德國學生在閱讀、數(shù)學和科學三方面素養(yǎng)分別取得了498分、500分和503分的成績,均高于經(jīng)濟合作與發(fā)展組織 (Organization for Economic Co-operation and Development,以下簡稱OECD)參與國家的平均水平,與第一次參與PISA的結果相比,德國學生取得了明顯的進步。德國學者認為,這與德國所開展的一系列基礎教育質(zhì)量監(jiān)測工作有巨大關聯(lián)。①Maritzen N. Glanz und elend der KMK-strategie zum bildungsmonitoring: Versuch einer bilanz und eines Ausblicks/Splendor and misery of the KMK-strategy of educational monitoring: An attempt of taking stock and looking forward[J]. Die Deutsche Schule. 2014; 106(4): 398-413.德國在2000年 “PISA震驚”之后,反應迅速,逐步建立起了頗為有效的基礎教育質(zhì)量監(jiān)測體系,成功提高了其基礎教育質(zhì)量。當前,國內(nèi)外關于德國基礎教育質(zhì)量監(jiān)測的相關研究主要可以分為以下幾類:第一類是對單個項目或單個監(jiān)測工具的研究,如德國州際比較測試的設計過程、測評基本要素以及測評功能;②龔偉, 應益可.旨在診斷與改進的德國基礎教育質(zhì)量監(jiān)測述評及啟示[J].教育測量與評價, 2020(06): 11-20.德國中小學教育標準的研制及實施;③胡進.德國中小學教育標準與教學質(zhì)量監(jiān)測:聚焦教育質(zhì)量提升[J].基礎教育, 2017, 14(02): 104-112.中小學教育標準的作用及其對中小學教育的效果。④Julia Zuber, Herbert Altrichter, Martin Heinrich.Bildungsstandards zwischen Politik und schulischem Alltag[M]. Springer VS,Wiesbaden.2019: 306.第二類是對德國個別聯(lián)邦州的教育質(zhì)量測評項目實施的研究,如德國學者阿爾布雷希特·瓦克(Albrecht Wacker)和約亨·克拉默 (Jochen Kramer)通過實證研究分析了VERA在巴登符騰堡州(Baden-Württemberg)的實施和效果,指出VERA對教師教學幫助影響不顯著。⑤Wacker, A., Kramer, J.Vergleichsarbeiten in Baden-Württemberg[J]. Z Erziehungswissenschaft, 2012(15): 683-706.第三類是對德國聯(lián)邦層面教育質(zhì)量保障機構的介紹,如德國教育質(zhì)量發(fā)展研究所的成立背景,目標和任務。⑥胡進.德國基礎教育質(zhì)量提升研究及啟示??基于德國教育質(zhì)量發(fā)展研究所的成立背景和研究任務的分析[J].世界教育信息, 2017, 30(18): 48-50.第四類是對德國教育質(zhì)量保障制度的探究,如德國基礎教育和高等教育整體質(zhì)量保障措施⑦王薇.德國教育質(zhì)量保障體系:制度及實施[J].教育導刊, 2018(06): 92-96.以及從教育公平的角度對德國基礎教育質(zhì)量均衡發(fā)展政策的討論。⑧孫進.德國促進基礎教育均衡發(fā)展的政策分析[J].教育發(fā)展研究, 2012, 32(07): 68-73.第五類是對“PISA震驚”后的德國基礎教育改革措施的研究,主要包括制定中小學教育標準、成立教育質(zhì)量發(fā)展研究所、開展全面教育質(zhì)量監(jiān)測、改革中等教育結構⑨任平, 邁納特·邁爾.從PISA危機到能力導向的革命: 世紀之交德國基礎教育改革的困境、舉措與效果[J].比較教育學報, 2020(01): 117-130.以及德國基礎教育課程改革和加強學生融合等措施。⑩李志濤.PISA測試推動下的德國教育政策改革:措施、經(jīng)驗、借鑒[J].外國中小學教育, 2017(06): 1-8.總體而言,當前國內(nèi)外的研究都偏向于對德國個別聯(lián)邦州或者單個監(jiān)測項目和工具的微觀分析,或者強調(diào)德國在2000年PISA測試之后基礎教育的改革措施,缺少從德國作為一個國家整體的基礎教育質(zhì)量監(jiān)測宏觀視角把握,盡管楊濤等人在其著作《國際基礎教育質(zhì)量監(jiān)測實踐與經(jīng)驗》?中對德國相關內(nèi)容有所涉及,但是內(nèi)容仍然較淺,不夠全面。那么,德國基礎教育質(zhì)量監(jiān)測的基本結構是怎樣的?其基礎教育質(zhì)量監(jiān)測是如何實施和發(fā)揮作用的?
教育質(zhì)量監(jiān)測是指為了掌握教育的發(fā)展情況,基于科學的方法持續(xù)地和系統(tǒng)地對學生所掌握的知識和習得的能力對教育目標的實現(xiàn)程度進行監(jiān)察并檢測,是一項綜合的、長期的和系統(tǒng)化的工程。①楊濤, 李曙光, 姜宇.國際基礎教育質(zhì)量監(jiān)測實踐與經(jīng)驗[M].北京: 北京師范大學出版社.2015.(8): 8-14.我國《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010?2020年)》明確提出要提高義務教育質(zhì)量,建立國家義務教育質(zhì)量基本標準和監(jiān)測制度。②中華人民共和國教育部.國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)[EB/OL]. (2010-07-29)[2019-12-12].http://www.moe.gov.cn/srcsite/A01/s7048/201007/t20100729171904.html.本研究通過對德國基礎教育質(zhì)量監(jiān)測進行探究,以期為我國基礎教育質(zhì)量監(jiān)測工作提供一定的參考借鑒。
1. 國家層面:定期參加大型國際學生學業(yè)成就比較測試
為了確定德國學生在國際比較測試中的表現(xiàn)以及與其他國家之間教育質(zhì)量發(fā)展的差異,德國決定定期參加國際大型學生學業(yè)成就監(jiān)測項目,其參加的項目主要包括:(1)國際小學生閱讀能力測試(Internationale Grundschul-Lese-Untersuchung,簡稱PIRLS/IGLU),從2001年開始,每5年舉行一次,測試對象為小學4年級的學生;(2)國際數(shù)學與科學趨勢研究(Trends in Mathematics and Science Study,簡稱TIMSS),主要為了測試小學生在4年級結束時的數(shù)學和科學能力。德國從2007年開始參加此項測試,每4年舉行一次。(3)PISA,主要測試15歲的學生在閱讀、數(shù)學和自然科學領域中的能力。從2000年開始,每3年舉行一次,每次測試側重點不同,根據(jù)參與國家的數(shù)量來看最重要的是PISA測試。所有的國際大型監(jiān)測項目均根據(jù)國際監(jiān)測的統(tǒng)一要求在德國進行實施。
2. 州層面:開展基于國家教育標準的教育趨勢研究
為了檢查各聯(lián)邦州對教育標準的執(zhí)行程度,KMK決定開展教育趨勢研究 (Bildungstrend)來對各州的教育發(fā)展狀況進行監(jiān)測,主要的測試對象是小學四年級和中學九年級的學生,小學每五年測試一次,測試內(nèi)容為德語和數(shù)學;中學每三年測試一次,測試內(nèi)容包括語言(德語、英語和法語)、數(shù)學和自然科學(生物、化學和物理),監(jiān)測報告將會在測試一年后發(fā)布。第一輪的調(diào)查研究包括:2009年(初中德語、英語、法語),2011年(初中德語、數(shù)學),2012年(初中數(shù)學、生物、化學和物理),2018年 (數(shù)學、生物、化學和物理)是開展的第二輪調(diào)查研究。第一輪的調(diào)查(2009?2012)命名為“州比較研究”(Laendervergleich),從2015年第二輪調(diào)查監(jiān)測開始,這項測試改名為教育趨勢研究,因為從第二次測試開始可以比較各州的教育發(fā)展趨勢。①KMK.Bildungsmonitoring. überprüfung und Umsetzung von Bildungsstandards für die Primarstufe, die Sekundarstufe I und die Allgemeine Hochschulreife[EB/OL]. [2019-01-06]. https://www.kmk.org/themen/qualitaetssicherung-in-schulen/bildungsmoni toring/ueberpruefungumsetzung-der-bildungsstandards.html.
3. 學校層面:三年級和八年級的比較性測試
范堅強從辦公桌上抓起一把顏料管,抽幾張餐巾紙一裹,狠狠地塞進一杭嘴里,又舉起匕首。刀刃在一杭臉上緩緩移動,突然,范堅強手腕用下一壓,刀尖再一次刺破皮膚。一杭痛苦地在椅子里扭動著。
三年級和八年級比較測試(Vergleichsarbeiten in Jahrgangsstufe 3 und 8,以下簡稱VERA3和VERA8)是在學校層面開展的眾多測試中最特殊的一項監(jiān)測項目,原則上所有普通教育學校三年級和八年級的學生都需要參加。某些州將VERA命名為“學習狀況測試”或者“能力測試”。②KMK.Bildungsmonitoring. Verfahren zur Qualit?tssicherung auf Schulebene[EB/OL]. [2019-01-06]. https://www.kmk.org/themen/qualitaetssicherung-in-schulen/bildungsmonitoring/verfahren-zur-qualitaetssicherung-auf-schulebene.html.VERA測試的核心作用是為學校和教學發(fā)展提供支持,是以筆試的形式,測試學生在特定年齡階段所達到的能力。VERA的測試內(nèi)容是由各州與德國教育質(zhì)量發(fā)展研究所(Institut zur Qualitaetentwicklung im Bildungswesen,以下簡稱IQB)共同決定的,三年級的測試內(nèi)容必須包括德語和數(shù)學,八年級的VERA測試內(nèi)容至少為一門必修課,如果是德語的主題,那么必須是在德語閱讀領域,其他可備選領域包括聽力、拼寫、語言和語言使用或者寫作。在數(shù)學領域內(nèi)容是測試五種能力(數(shù)字、運算、數(shù)據(jù)、頻率和概率),在第一外語(英語或法語)中,閱讀和聽力是必須測試的內(nèi)容。③Institut zur Qualitaetsentwicklung im Bildungswesen.VERA[EB/OL]. [2018-11-09]. https://www.iqb.hu-berlin.de/vera.參與測試的學校校長和任課教師可以將自己學校班級的測試成績進行相同領域班級之間或者全州范圍內(nèi)的比較,確定學?;虬嗉壍陌l(fā)展水平。學校還可以從班級、專業(yè)、年級和學校等多個層面來分析測試的結果,為學校質(zhì)量和教學的改進提供實證依據(jù)。
2000年PISA測試結果清楚表明了德國之前的教育投入并不能在教育系統(tǒng)中產(chǎn)生預期的結果,教育改革必須加強對教育收益的檢查。此外,PISA經(jīng)驗還表明,通過定期的學業(yè)測試和緊密的學校評估可以促進學生學業(yè)成就提升。而教育質(zhì)量的發(fā)展與保障,內(nèi)部與外部的評估都需要明確的標準,因此KMK特別關注教育標準的制定。
教育標準表明了學生在一定的學習階段期間,在某些特定的專業(yè)里應該達到的能力水平,通過適當?shù)娜蝿栈驕y試進行監(jiān)測,有助于優(yōu)化學校教學過程,實現(xiàn)更高的教育收益。KMK在2003年、2004年和2012年通過了全國教育標準,內(nèi)容目前包括小學4年級德語、數(shù)學學科教育標準,9年級德語、數(shù)學、第一外語(英語、法語)學科教育標準,10年級德語、數(shù)學、第一外語(英語、法語)、生物、化學、物理學科教育標準,普通高等教育入學資格的德語、數(shù)學、英語、法語學科標準,如表1所示,德國各聯(lián)邦州都需要根據(jù)全國教育標準實施教育,這個教育標準也成為了德國教育趨勢研究和VERA監(jiān)測試題研發(fā)的基礎。各州共同商議的標準可以使德國各州所有學校的質(zhì)量發(fā)展與畢業(yè)相關的教育標準保持一致。①Kultusminister Konferenz. Bildungsstandards der Kultusministerkonferenz[EB/OL]. (2012)[2019-05-02]. https://www.kmk.org/themen/qualitaetssicherung-in-schulen/bildungsstandards.html.
表 1 不同學科的教育標準
在具體的教育標準規(guī)定中,著重對學生所需要掌握的能力進行闡述,詳細劃分了多種場景以及學生需要達到的能力要求。例如,在中學十年級德語學科能力教育標準中,主要規(guī)定了德語語言和語言運用,口語和聽力,寫作以及閱讀四個領域,每一個領域內(nèi)都有詳細的能力劃分。以德語學科中口語和聽力領域為例,教育標準中劃分了對人講話,在別人面前講話,與人交流,理解性傾聽以及場景演示五種場景以及學生應學會使用的方法和技術。②KMK. Bildungsstandards im Fach Deutsch für den Mittleren Schulabschluss[EB/OL]. (2003-12-4)[2019-05-02]. https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschluesse/2003/2003_12_04-BS-Deutsch-MS.pdf.總體而言,德國教育標準中的規(guī)定貼近學生生活,突出對學生所需要掌握的能力進行詳細的考察,德國聯(lián)邦政府對各州教育標準達標程度的檢查,主要是通過教育趨勢研究實現(xiàn)的。
德國《基本法》規(guī)定了德國文化教育權由各州自治,也就是說各聯(lián)邦州享有教育立法和教育行政的最高權限。因此,德國教育質(zhì)量監(jiān)測的實施也包括聯(lián)邦層面和州層面組織機構的協(xié)商與合作。
從聯(lián)邦層面來看,由于德國各州文化教育權自治,為了協(xié)調(diào)各聯(lián)邦州的教育政策,使各聯(lián)邦州達到最低限度的統(tǒng)一,德國建立了聯(lián)邦層面的協(xié)調(diào)機構。2004年6月,KMK決定在柏林洪堡大學(Humboldt Universit?t zu Berlin,簡稱HU)成立作為研究機構和咨詢機構的教育質(zhì)量發(fā)展研究所,即IQB。IQB的性質(zhì)比較復雜,可以看作政府、社會和高校三方共同作用下的產(chǎn)物。IQB實際是一個經(jīng)過注冊的協(xié)會,其全稱為“教育質(zhì)量發(fā)展研究所——柏林洪堡大學聯(lián)邦科研機構協(xié)會(Institut zur Qualit?tsentwicklung im Bildungswesen-Wissenschaftliche Einrichtung der L?nder an der Humboldt-Universit?t zu Berlin e.V.)”,其成員來自德國16個聯(lián)邦州。IQB董事會包括科學委員會和商務委員會兩部分,整體組織架構主要包括六個部門:領導機構、行政管理部門、數(shù)據(jù)處理部門、學科組織部門、研究團隊、HU與IQB合作的第三方資助項目研究團隊,①IQB.Ueber das IQB. Organisation[EB/OL]. [2020-09-26]. https://www.iqb.hu-berlin.de/institut/about.每個部門都清楚明確自己的職責和任務。
在州層面,德國各州也有專門負責教育質(zhì)量監(jiān)測活動的研究機構。以柏林和勃蘭登堡州為例,柏林和勃蘭登堡州專門負責教育質(zhì)量研究的機構是柏林與勃蘭登堡州教育質(zhì)量研究所(Institut für Schuqualit?t der L?nder Berlin und Brandenburg,簡稱ISQ),于2006年初成立。ISQ的責任方主要由以下七個成員構成:柏林州政府教育部門,勃蘭登堡州教育部門,柏林自由大學,波茨坦大學以及由柏林州立學校理事會、勃蘭登堡州理事會、柏林和勃蘭登堡州商業(yè)協(xié)會任命的成員??梢钥闯觯琁SQ盡管作為第三方獨立的機構,其組織成員也包括了政府、社會和大學三方面。目前,ISQ共有21位成員,來自多個領域,包括科研員,柏林和勃蘭登堡州各種類型學校的中小學教師,技術人員,客座教授等,成員背景的豐富性從側面反應了監(jiān)測對多方利益的保障。當前,ISQ的工作重點包括以下五個方面:(1)協(xié)助IQB開展VERA測試;(2)支持學校內(nèi)部和外部評價/在線調(diào)查;(3)開展教育監(jiān)測和完成教育報告;(4)協(xié)調(diào)實施國際、國家和地區(qū)的學生學業(yè)成就測試; (5)審查KMK的教育標準的實施程度。②Institut für Schuqualit?t der L?nder Berlin und Brandenburg.Ueber uns.[EB/OL]. [2020-12-10]. https://www.isq-bb.de/wordpress/das_isq/.
受德國文化教育權分權制的影響,在具體的教育監(jiān)測實踐中,聯(lián)邦層面的IQB與各州開展監(jiān)測活動的研究機構之間也體現(xiàn)出了分權、協(xié)商與合作的運行理念。首先,從分權來看,IQB在全國的監(jiān)測工作中扮演著一個統(tǒng)領全局的角色,承擔了制定國家教育標準、研發(fā)監(jiān)測題庫、評估監(jiān)測結果、監(jiān)督各聯(lián)邦州對教育標準的達標程度等重要核心任務,而實際監(jiān)測工作的落地和開展則由各州文化教育部實際承擔,通常會委托相應的第三方監(jiān)測機構實際開展監(jiān)測,由于德國各州教育發(fā)展狀況不一,實際監(jiān)測開展的過程中各州會根據(jù)自身情況相應地微調(diào)試題或測試時間,以保障監(jiān)測工作的順利實施。其次,在協(xié)商與合作方面,一方面,機構組織成員背景的豐富性保證了民主協(xié)商。IQB的組織成員來自德國16個聯(lián)邦州,這保障了IQB聽取多方代表意見開展決策;另一方面,要想順利實施監(jiān)測,德國聯(lián)邦政府和各聯(lián)邦州之間,州政府與第三方監(jiān)測機構之間,各教育監(jiān)測組織機構之間的合作至關重要。例如,德國《國家教育報告》實質(zhì)就是聯(lián)邦政府與各聯(lián)邦州合作的產(chǎn)物,雙方在2004年春季達成了每兩年聯(lián)合提交一份國家教育報告的要求。①KMK.Ueberblick zur Bildungsberichterstattung[EB/OL]. [2020-12-10]. https://www.kmk.org/themen/bildungsberichterstattung.html.
《 國家教育報告》的實質(zhì)性編寫則是委托給德國多個科研機構共同協(xié)作完成,由德國國際教育研究所領導獨立科學小組負責教育報告的編寫工作,小組成員除了來自德國教育研究所外,還包括德國青年研究所、德國高等教育和科學研究中心、萊布尼茨教育過程研究所、哥廷根大學社會學研究所以及聯(lián)邦統(tǒng)計局和國家統(tǒng)計局,擁有強大的科研支持。此外,在聯(lián)邦州層次也深刻地貫徹了合作理念,以柏林ISQ為例,ISQ與多個科研機構、政府部門的協(xié)調(diào)合作,建立了合作伙伴關系,包括柏林自由大學,柏林?勃蘭登堡州教育服務中心,馬克斯普朗克教育研究所,柏林?勃蘭登堡州數(shù)據(jù)局,德國教育服務中心,柏林教育、青少年和家庭評議會,德國國際教育研究所等,②Institut für Schuqualit?t der L?nder Berlin und Brandenburg.Ueber uns.[EB/OL]. [2020-12-10]. https://www.isq-bb.de/wordpress/das_isq/partner/.合作伙伴關系為ISQ教育研究和監(jiān)測工作的開展提供了深厚的資源支持,達到多方互利共贏的局面。
由于國家層面的大型國際學生評估項目(PISA、PIRLS/IGLU)的實施是按照國際統(tǒng)一標準開展的,在此主要聚焦德國國內(nèi)監(jiān)測項目即教育趨勢研究和VERA實施過程。
第一,教育趨勢研究的實施。各州的測試主要負責方是各聯(lián)邦州的文化部,對教育趨勢研究的科學性和對數(shù)據(jù)責任保護負責方是IQB,由佩特拉·斯塔納特(Petra Stanat)教授領導。IQB負責開發(fā)和優(yōu)化所使用的測量工具和問卷,各州文化部委托國際教育成就評估協(xié)會(IEA Hamburg)來實施組織考試,該協(xié)會專門從事大規(guī)模的教育研究測試。為了確保所有測試都得到具有可比性的標準化程序,測試負責人需要嚴格遵循測試手冊中的規(guī)定,并向?qū)W生詳細閱讀說明。負責人使用手冊逐步向?qū)W生解釋如何規(guī)范答題,并通過示例進行演示。在特殊學校中,考試負責人還需要向有需求的學生大聲朗讀學生問卷的題目并提供支持。在結果評估方面,IEA根據(jù)IQB的規(guī)范對學生的答案進行編碼和數(shù)據(jù)處理,對數(shù)據(jù)的評估和確定學生能力的達標程度則由IQB來執(zhí)行。
除此之外,IQB教育趨勢研究還采用了背景調(diào)查問卷來對能力測試進行補充,其中包括有關學校和學生課外學習條件的信息,在分析測試結果時加以考量,有助于揭示學習框架條件與學生能力發(fā)展之間的關系。問卷分別針對學生、家長、學科教師和校長設計。學生和家長需要提供家庭背景、職業(yè)和教育等信息,有關家庭狀況的信息可以幫助確定社會經(jīng)濟背景和移民背景的相關差距。此外,還以書面的形式調(diào)查了所有監(jiān)測涉及學科的教師和參與監(jiān)測學校的校長,收集了學生基本認知能力的指標,通過對背景變量的收集,可以對研究結果進行合理和差異化的分析,為各州教育系統(tǒng)的發(fā)展提供重要線索。需要注意的是,所有的調(diào)查都有官方數(shù)據(jù)的保護,在調(diào)查中獲取的信息通過適當?shù)募夹g對信息進行保密。不過根據(jù)各聯(lián)邦州的法律,并不是所有的州都有義務必須參加背景問卷的調(diào)查。①Insititut zur Qualitaetsentwicklung im Bildungswesen. IQB-Bildungstrend-2018. Bericht.[EB/OL]. [2019-11-25]. https://box.huberlin.de/f/b63eb63a2e9941afa852/?dl=1.
第二,VERA的實施。首先,在VERA的研發(fā)過程中,首先由跨州的教師和專家一起組成試題研發(fā)團隊,每年代表IQB以國家教育標準作為框架基礎研發(fā)出大量的試題。研制出的試題會提前發(fā)放給幾百名學生進行試測,以確定每道題的適用性和難易程度。以巴登符騰堡州(Baden-Württemberg)為例,巴登符騰堡州參與了VERA試測,首先由IQB決定該州所需的試點學校數(shù)量,通過巴登符騰堡州的教育分析研究所進行計算機輔助抽樣選擇試點學校,所選學校必須能夠代表巴登符騰堡州的中學的整體情況。根據(jù)測試結果統(tǒng)計分析的數(shù)據(jù)反饋,IQB編制出最終的試題手冊供各州使用,每本試題手冊都包括了詳細的實施指南,評估指南和教育指導。教育指導不僅包括對個別測試題的解釋,還有針對進一步發(fā)展以能力為導向的學科教學的推動力以及特定學習內(nèi)容的參考。
在VERA實施的過程中,IQB與各州研究機構之間存在著明確的分工。IQB負責制定任務、試題前測、確定任務難度、制作試題卷、開發(fā)隨附的教學材料。各州自己負責打印分發(fā)試卷、執(zhí)行測試、審閱與提交數(shù)據(jù)、統(tǒng)計評估、反饋設計,結果反饋后,通過相應措施支持學校發(fā)展。測試范圍和所包含的測試項目也可以根據(jù)各州的需求與特點有所調(diào)整 (見表2)。②Institut zur Qualitaetsentwicklung im Bildungswesen.VERA.[EB/OL]. [2020-01-09]. https://www.iqb.hu-berlin.de/vera.
表 2 德國基礎教育階段監(jiān)測項目的差異比較
任何一項監(jiān)測都是有目的的,德國基礎教育質(zhì)量監(jiān)測的目的主要包括診斷作用,指導作用和改進作用,詳細的監(jiān)測結果分析報告以及監(jiān)測結果的及時反饋保障了監(jiān)測作用的發(fā)揮,也促進了德國基礎教育階段的一系列改革。
一方面,國家教育報告的頒布可以診斷國家整體教育的發(fā)展情況。2004年春季,德國各聯(lián)邦州和聯(lián)邦政府通過了每兩年聯(lián)合提交一份德國教育報告的要求,重點介紹德國教育體系基本的發(fā)展路線、發(fā)展成就和任務,這也是其監(jiān)測工作的重要組成部分。國家教育報告負責向公眾說明德國整個教育系統(tǒng)或者各州的教育水平。通過長期性連續(xù)的考察方式,可以在早期識別出不良的趨勢并制定出有效的控制措施。①KMK.Ueberblick zur Bildungsberichterstattung[EB/OL]. [2019-12-12]. https://www.kmk.org/themen/bildungsberichterstattung.html.當前,教育報告已經(jīng)成為了德國教育監(jiān)測的核心工具,每份教育報告由多個關鍵主題的章節(jié)構成。教育報告的主要目標是定期生成基于指標的信息,這些信息包括了框架條件、課程特征、教育過程和結果。國家教育報告關注德國整個教育系統(tǒng),旨在盡早地發(fā)現(xiàn)未來潛在的問題。2018年德國第七次發(fā)布了教育報告,該報告重點關注教育效果和教育回報,提供了基于數(shù)據(jù)指標的德國教育系統(tǒng)的概況,顯示了德國教育在當前的發(fā)展情況。
2018年教育報告內(nèi)容一共包括八個部分,第一部分介紹了德國的人口、經(jīng)濟、就業(yè)以及家庭和生活方式的變化,讓讀者對德國現(xiàn)在的社會發(fā)展有整體的把握;第二個章節(jié)介紹了德國教育體系的基本概況,包括教育機構、教育工作者、教育支出以及德國人的教育現(xiàn)狀,這個章節(jié)聚焦于德國教育系統(tǒng)現(xiàn)狀的梳理;從第三到第七章節(jié),報告分別詳細闡述了學前教育、中小學教育、職業(yè)教育、高等教育、繼續(xù)教育和成人教育的發(fā)展情況,以圖表、數(shù)據(jù)和文字結合的形式直觀地展現(xiàn)了德國近兩年各層級各階段各類型學校教育的發(fā)展情況;最后一個章節(jié)則是對整個德國教育成效的總結和討論,以及對未來教育的展望。②Kultusminister Konferenz&Bundesministerium fuer Bildung und Forschung. Bildung in Deutschland 2018[EB/OL]. [2019-12-17]. https://www.bildungsbericht.de/de/bildungsberichte-seit-2006/bildungsbericht-2018/pdf-bildungsbericht-2018/bildungsberic ht-2018.pdf.總體而言,作為國家教育監(jiān)測的重要項目之一,教育報告發(fā)揮了承前啟后的作用。2018年的國家教育報告提出了德國教育未來應該關注的重點,包括加強對移民背景學生的語言能力培訓、促進“全納教育”;加強對教師的培養(yǎng),提高基礎教育階段教師數(shù)量;加強推進全日制學校改革以及繼續(xù)促進教育公平,為德國今后的教育發(fā)展工作指明了方向。
另一方面,國內(nèi)監(jiān)測如教育趨勢研究報告可以診斷各聯(lián)邦州具體的教育質(zhì)量發(fā)展水平。在實施教育趨勢研究一年后,將會發(fā)布教育趨勢研究報告。2018年教育趨勢研究報告包括十四個章節(jié),每個章節(jié)有不同的主題,其中包括2018教育趨勢研究的理念;數(shù)學和科學學科的能力水平模型;研究的基礎、實施和評估;聯(lián)邦州學校系統(tǒng)中初中第一階段的狀況;各州能力水平的對比;各州能力達標均值的對比;性別差異;社會差異;移民差異;數(shù)學和科學學科的動機;數(shù)學課堂的特征;數(shù)學和科學學科教師的培訓與教育;2018教育趨勢研究的技術基礎以及最后的研究總結與發(fā)現(xiàn)。教育趨勢研究報告就像德國各州教育標準達標情況的“診斷器”,可以檢查各州對教育標準的達標程度,同時對各州的達標情況有所對比,發(fā)現(xiàn)各州的教育發(fā)展水平和發(fā)展趨勢的變化情況。針對問題比較明顯的州,政府可以及時提出相應的改進措施,促進教育改革。例如,在2018年的數(shù)學學科測試中,研究報告顯示德國各州的結果差距較大。在巴伐利亞州(Bayern)和薩克森州 (Sachsen),所有九年級的學生和在文理中學中九年級的學生成績始終高于整個德國水平,而梅克倫堡·前波莫瑞州(Mecklenburg Vorpommern)的成績始終顯著低于德國平均水平。柏林、不來梅(Bremen)、薩爾州(Saarland)和石勒蘇益格·荷爾斯泰因州 (Schleswig Holstein)學生的成績很少達到或超過德國平均值,且經(jīng)常低于最低標準。①Kultusminister Konferenz & Bundesministerium fuer Bildung und Forschung. Bildung in Deutschland 2018[EB/OL]. [2019-12-17]. https://www.bildungsbericht.de/de/bildungsberichte-seit-2006/bildungsbericht-2018/pdf-bildungsbericht-2018/bildungsbe richt-2018.pdf.通過報告得出的診斷結果,德國各聯(lián)邦州可以找出自身的優(yōu)勢與局限,結合本州自身的實際條件進行調(diào)整。
在《教育監(jiān)測總體戰(zhàn)略》中,VERA被認為是重要的學校質(zhì)量保障手段之一,為每一所學校個體的質(zhì)量保障和發(fā)展提供實證數(shù)據(jù)的支持。首先,VERA可以支持學校自我評估,促進學校發(fā)展。以VERA 8為例,作為學生在中學第一階段結束時對教育標準達標程度的里程碑,校長可以將自己學校班級的測試成績進行相同領域班級之間或者全州范圍內(nèi)的比較,確定學校或班級的發(fā)展水平,發(fā)現(xiàn)優(yōu)勢和劣勢,明確進一步改進和發(fā)展的目標。VERA 8 使每一所學校都能夠盡早確定自己在德語、數(shù)學以及英語和法語學科能力領域教學的現(xiàn)狀。學校可以從班級、專業(yè)群體、年級和學校等多個層面來分析調(diào)查結果,系統(tǒng)、持續(xù)地組織和記錄數(shù)據(jù)的使用過程,仔細考慮測試結果所反饋出的經(jīng)驗,并為學校和教學的發(fā)展做出貢獻。此外,在各州的VERA教育監(jiān)測報告中,還根據(jù)學生的背景特征(如性別、種族和社會經(jīng)濟背景)對學生的成績進行分析,為后續(xù)開展針對性的改進計劃提供了重要參考信息。②Landesinstitut für Schulentwicklung (LS). Vergleichsarbeiten VERA8. Nutzung der Ergebniss im Rahmen der Qualitaetsicherung in Schulen[EB/OL]. [2019-12-07]. https://www.lsbw.de/site/pbsbwnew/get/documents/KULTUS.Dachmandant/KULTUS/Dienststellen/ls-bw/Lernstandserhebungen/dokumente/vera8docs/v8_Handreichung_Nutzung_Ergebnisse.pdf.
其次,VERA可以為教師的教學提供指導。VERA的主要目的是為學校和教師教學提供數(shù)據(jù)信息的幫助?!癡ERA的核心功能在于促進每所學校的教學和學校的發(fā)展。這意味著教師可以在VERA定期測試結果的基礎上設計課程。VERA為教師提供了機會進行課程計劃和教學實踐進行反思”。③Institut zur Qualitaetsentwicklung im Bildungswesen. VERA.[EB/OL]. [2020-01-09]. https://www.iqb.hu-berlin.de/vera.VERA為教師提供了學生在特定學科的勝任力、學習狀況、對教育標準的達標程度的客觀數(shù)據(jù)。對監(jiān)測結果的反思可以幫助教師識別出學生發(fā)展的優(yōu)勢和劣勢,以更好地為學生提供支持。在進一步發(fā)展VERA的協(xié)商中,KMK于2012年3月確認,VERA比較測試的核心功能是促進教學與學校的發(fā)展,并輔之以促進實施教育標準內(nèi)規(guī)定的專業(yè)教學法理念。在協(xié)商中明確強調(diào),VEAR比較測試并不適合用于劃分等級,也不適用于預測學業(yè)是否成功。此外,VERA比較測試不會以排名的形式將各個學校的測評結果公開,即使是學校督導查看結果也需要遵循明確的規(guī)則才能獲得相關資料。①KMK. Vereinbarung zur Weiterentwicklung der Vergleichsarbeiten (VERA)[EB/OL]. (2018-03-15) [2020-02-13].https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschluesse/2012/2012_03_08_Weiterentwicklung-VERA.pdf.這一舉措有效地保障了學校和學生的權益。
德國基礎教育質(zhì)量監(jiān)測還有一個促進教育改革的重要功能,一系列監(jiān)測的結果推動了德國政府在新世紀開啟的一系列基礎教育改革。第一,推動德國基礎教育階段學制的改革。從國際大型測試PISA和德國國內(nèi)教育監(jiān)測項目實施的結果發(fā)現(xiàn),德國學生的社會家庭經(jīng)濟背景對德國學生的學業(yè)成就影響極其顯著。德國進行了深刻反思,認為三軌制教育體制已經(jīng)不符合社會和經(jīng)濟發(fā)展的需求,也違背了教育公平。各聯(lián)邦州紛紛推出了基礎教育體制改革,于是“雙軌制”改革被提上議程:建立與文理中學等值的新學校類型,兩者應平行存在,共同構成支撐德國中等教育的兩條軌道。②周海霞.德國主體中學消亡現(xiàn)象探析[J].全球教育展望, 2018(8): 82-98.以柏林為例,為了使基礎教育得到更好的發(fā)展,促進不同類型學校中學生的流動性,柏林在2010?2011年進行了影響深遠的教育體制結構綜合改革,最主要的舉措是將主體中學、實科中學和綜合中學合并為一體化中學(Integrierte Sekundarschule),一體化中學成為除文理中學外唯一的學校類型,為學生提供了更多的學習生涯選擇的機會。③劉云華.德國柏林基礎教育質(zhì)量保障體系改革探析[J].比較教育研究, 2019, 41(10): 75-82.
第二,同樣是考慮到家庭背景因素給學生帶來的影響,德國加強了全日制學校的擴張。2000年PISA測試結果引起了德國社會對半日制學校的反思,許多人認為在校學習時間過短是德國學生學業(yè)成績差異大的原因之一。這是因為,學生放學之后會經(jīng)歷特別不一樣的待遇:處于社會特權家庭的學生可以獲得更多個性化資源的支持,而處于社會不利地位的學生則無法擁有相同的學習資源甚至遭受家庭暴力。因此,德國聯(lián)邦政府于從2003年至2007年推出“未來教育和培育投資計劃”(Investitionsprogramm Zukunft Bildung und Betreuung,簡稱ZIBB),撥款資助全日制學校的建立。2015年德國頒布《全日制學校報告》(Ganztagsschulen in Deutschland)強調(diào)了全日制學校的重要性及其教學原則和教師培訓等信息。2020年KMK與德國青少年和家庭部長會議一起通過了《進一步發(fā)展和擴大中學第一階段的全日制教育》的建議,④KMK. Ganztagsschulen in Deutschland[EB/OL]. (2015-12-3)[2020-12-08]. https://www.kmk.org/themen/allgemeinbildendeschulen/bildungswege-und-abschluesse/ganztagsschulen-in-deutschland.html.進一步體現(xiàn)了德國繼續(xù)加強建設全日制學校的決心??偟膩碚f,全日制學校在保障教學質(zhì)量、加強學生群體融合以及幫助有工作的家長照看孩子發(fā)揮了較大的作用,但當前德國全日制學校數(shù)量受到資金和師資欠缺等因素的影響依舊供不應求。
第三,促進全納教育的發(fā)展。多項監(jiān)測結果都顯示,具有移民家庭背景的學生的學業(yè)成就明顯低于沒有移民背景的學生。2016年的數(shù)學教育趨勢研究顯示,父母雙方都具有移民背景的學生的數(shù)學成績明顯低于父母沒有移民背景的學生,差距較大的城市為柏林、不來梅和漢堡,而這幾個城市正是移民背景學生數(shù)量比例最高的城市。①Institut zur Qualitaetentwicklung im Bildungswesen.IQB-Bildungstrend 2016[EB/OL]. (2018)[2020-12-10]. https://www.iqb.huberlin.de/bt/BT2016/Bericht/BT2016_Bericht.pdf.再加上近些年德國具有移民背景的學生數(shù)量持續(xù)增長,如何使具有移民背景的學生成功融入德國成為一個重要問題,因此,當前德國教育政策的一個重要目標就在于最大化地降低移民背景因素對學生能力帶來的不利影響。于是,德國近些年來特別強調(diào)全納教育,為來自弱勢家庭的學生提供額外的資金和情感支持,加強學生德語語言能力的掌握,促進學生順利融入德國學校與社會。
中國有著世界上最大的基礎教育規(guī)模,且基礎教育的發(fā)展已經(jīng)從規(guī)模發(fā)展到了內(nèi)涵發(fā)展階段,加強基礎教育質(zhì)量監(jiān)測是提高我國基礎教育質(zhì)量的重要戰(zhàn)略手段之一。②趙茜, 辛濤, 劉雨甲.我國基礎教育質(zhì)量監(jiān)測與評價的現(xiàn)狀與趨勢??第二屆“中國基礎教育質(zhì)量監(jiān)測與評價”學術年會綜述[J].教育研究, 2017, 38(09): 154-159.我國基礎教育質(zhì)量監(jiān)測工作雖取得了進步,但仍然面臨著眾多挑戰(zhàn),雖然國情不同,但德國基礎教育質(zhì)量監(jiān)測的經(jīng)驗對我國具有一定的借鑒意義。
在我國,各種監(jiān)測考試與評估活動對學校、老師、家長和學生都是“噩夢”。學生認為考試就是為了排名,學校認為學校評估是為了評獎、獲得先進學校的名稱。因此,每一次測試活動都使學校和學生心力交瘁,苦不堪言。實際上,基礎教育質(zhì)量監(jiān)測的目的并不是為了光鮮亮麗的排名,也不是為了封“優(yōu)秀學?!钡拿?,其真正的初衷是為了診斷學生學業(yè)成就,進而為教師教學提供科學的建議,更好地促進學生能力的發(fā)展。德國通過KMK和各州官方網(wǎng)站、教育報告公開發(fā)布等方式,積極向大眾科普教育質(zhì)量監(jiān)測的目的?促進學生能力的提升,促進學校教學質(zhì)量的提升,促進國家教育質(zhì)量的提升。為了破除監(jiān)測“排名”觀念,德國采取了一定的保密措施,例如某些監(jiān)測項目的結果只給學校領導和學科老師查看,而不公開學校排名和學生成績。這樣,一方面可以讓各個學校坦誠面對自己學校的發(fā)展情況,學生也不必為了每一次考試都焦頭爛額,還可以在一定程度上減少家長對“排名”的追捧。
社會第三方中介結構參與監(jiān)測可以化解教育督導評估以政府為主導、缺乏活力、不夠公開透明的劣勢。我國在《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010?2020)》中指出“要逐漸實現(xiàn)以政府為主的評估向以中介機構為主的評估的轉(zhuǎn)變”。①中華人民共和國教育部.國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)[EB/OL]. (2010-07-29)[2019-12-12].http://www.moe.gov.cn/srcsite/A01/s7048/201007/t20100729171904.html.截至2016年底,我國有25個省級單位成立了基礎教育質(zhì)量監(jiān)測機構。從我國區(qū)域監(jiān)測機構設置和隊伍建設的狀況來看,目前我國存在專業(yè)性不強、監(jiān)測的科學性有待提高等問題;從機構設置上來看,多數(shù)監(jiān)測機構并非專門設立、職能定位模糊、邊界不清,比如很多監(jiān)測機構的設置都以原有的機構和人員為主,新增職能,在教科院、評估員等加掛牌子成立;此外,從事監(jiān)測的人員專業(yè)性不足,專業(yè)基礎薄弱,數(shù)量缺乏。②趙茜, 辛濤, 劉雨甲.我國基礎教育質(zhì)量監(jiān)測與評價的現(xiàn)狀與趨勢??第二屆“中國基礎教育質(zhì)量監(jiān)測與評價”學術年會綜述[J].教育研究, 2017, 38(09): 154?159.德國聯(lián)邦層面的基礎教育監(jiān)測機構教育發(fā)展研究所盡管設立在柏林洪堡大學校內(nèi),實際上是一個獨立的第三方教育質(zhì)量研究機構,憑借著知識和科學權威掌握著較強的話語權;其次,德國大多數(shù)聯(lián)邦州也有著獨立的第三方教育研究機構,輔助各州文化教育部開展監(jiān)測工作和教育研究工作,其成員來自各個領域的專家和一線教師,在保障了監(jiān)測科學性的同時豐富了教育評價的主體;再次,在監(jiān)測人員的把控上,每次監(jiān)測之前,都會對測試人員進行專業(yè)培訓,形成監(jiān)測手冊或者指南,提高了監(jiān)測人員的專業(yè)性。社會第三方監(jiān)測強調(diào)了教育監(jiān)測主體的社會化、監(jiān)測方式的多元性,能夠促進社會對教育的監(jiān)督和問責。
開展基礎教育質(zhì)量監(jiān)測是一項龐大的工程,因此明確劃分各級各類監(jiān)測主體的工作內(nèi)容具有重要意義。當前我國各地對監(jiān)測工作的認識不統(tǒng)一也不清晰,各主體對自身的定位和工作內(nèi)容模糊,增加了教育部門和學校、教師的負擔。德國形成了“國家?州?學?!比齻€層次的監(jiān)測。在實施監(jiān)測的過程中,德國國家層面負責教育標準的制定、研發(fā)監(jiān)測評估的工具以及總體部署全國的監(jiān)測工作,掌握全國十六個州教育質(zhì)量發(fā)展水平的變化,了解全國不同家庭文化背景學生群體之間的差異,并且與各州一起合作發(fā)布國家教育報告,向社會公布國家教育發(fā)展狀況,樹立科學的教育質(zhì)量發(fā)展觀。在州層面,首先各州會有專家代表參與全國教育標準和監(jiān)測題庫的制定,各州需要配合開展實施監(jiān)測,包括幫助抽樣、實施前測、收集監(jiān)測數(shù)據(jù)等工作,并且可以結合各州的實際情況按照要求可對監(jiān)測試題進行一定的修改。其次還需要了解各地區(qū)教育和不同類型學校和學生群體的發(fā)展情況。最后,學校層面的監(jiān)測實際上也是由各州負責,學校需要配合監(jiān)測工作的有效開展,同時對校長和任課教師提出了更高的要求,學校結合監(jiān)測數(shù)據(jù)結果開展內(nèi)部評估,教師需要掌握各個學生的發(fā)展情況,幫助后續(xù)的改進與教學。通過明確的分工與合作,劃分清楚各主體的工作要點,才能促進監(jiān)測工作的有效開展。
在教育質(zhì)量監(jiān)測結果的運用上,當前我國對監(jiān)測數(shù)據(jù)開放和使用力度不足,同時以監(jiān)測數(shù)據(jù)為基礎的深度挖掘和研究也不夠。①趙茜, 辛濤, 劉雨甲.我國基礎教育質(zhì)量監(jiān)測與評價的現(xiàn)狀與趨勢??第二屆“中國基礎教育質(zhì)量監(jiān)測與評價”學術年會綜述[J].教育研究, 2017, 38(09): 154?159.2018年7月,我國基礎教育監(jiān)測中心第一次發(fā)布了《中國義務教育質(zhì)量監(jiān)測報告》,不過該報告的內(nèi)容略顯單薄,缺乏對數(shù)據(jù)的使用。德國在對監(jiān)測結果的分析上,最突出的特點就是對數(shù)據(jù)的有效使用,深入挖掘數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù),并結合學生背景問卷調(diào)查解釋和描述監(jiān)測結果,形成了一整套分析解釋體系。例如,在幾百頁的教育趨勢研究的監(jiān)測報告中,對數(shù)據(jù)的分析方式形成了自己的模式,除了詳細地介紹教育趨勢研究的實施情況以外,還著重詳細地以表格、圖形的形式呈現(xiàn)德國各州學生在不同學科測試成績上的對比及趨勢發(fā)展,具體呈現(xiàn)了性別差異、社會背景差異、移民差異、學生不同學科的學習動機、不同學科的課程質(zhì)量、不同學科教師的培訓以及對該年教育趨勢研究測試項目的評估及分析,結合測試數(shù)據(jù),較為完善地呈現(xiàn)了監(jiān)測結果的圖景。監(jiān)測數(shù)據(jù)結果為德國政府在基礎教育領域開展的一系列大刀闊斧的改革提供了依據(jù),多次監(jiān)測結果為德國教育界拉響了“警報”,德國各界也從監(jiān)測結果中不斷地反思和改進。此外,在監(jiān)測數(shù)據(jù)的開放性上,社會公眾可以直接在IQB的官網(wǎng)上下載監(jiān)測結果報告,這既是教育監(jiān)測公開透明的重要舉措,也促進了公眾對教育監(jiān)測工作的監(jiān)督。