王燁暉張 岳楊 濤王立東梁貫成鮑建生
?
義務教育數(shù)學相關因素監(jiān)測工具研發(fā)的探索與思考
王燁暉1,張 岳1,2,楊 濤1,王立東1,梁貫成3,鮑建生4
(1.北京師范大學 中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心,北京 100875;2.首都師范大學 教育學院,北京 100037; 3.香港大學 教育學院,香港 999077;4.華東師范大學 數(shù)學科學學院,上海 200241)
PISA、TIMSS與NAEP測試對相關因素指標的設計與選取為中國開展數(shù)學監(jiān)測提供了參考與借鑒.目前中國已持續(xù)開展了4年全國義務教育數(shù)學質(zhì)量監(jiān)測工作.研發(fā)的監(jiān)測工具具有以下主要特點:(1)數(shù)學學科特色鮮明;(2)測查對象多層面、多主體;(3)整體設計具有全面性與指向性.在未來的工具研發(fā)過程中,仍需思考以下問題:(1)立足中國國情,講好中國故事;(2)立足當下實踐,引領未來發(fā)展;(3)建立指標閾值,發(fā)揮預警功能;(4)打破學科局限,適應學科融合.
質(zhì)量監(jiān)測;數(shù)學;相關因素;工具研發(fā)
黨的十八大以來,中國義務教育實現(xiàn)了從“有學上”向“上好學”的歷史性跨越,人民日益增長的優(yōu)質(zhì)教育需求與教育事業(yè)發(fā)展不平衡不充分之間的矛盾成為當前教育發(fā)展的主要矛盾[1].《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》適時提出了“教育質(zhì)量全面提升”“教育發(fā)展成果更公平地惠及全民”的改革路向,十九大進一步明確了要實現(xiàn)“讓每個孩子都能享有公平而有質(zhì)量的教育”的改革目標.在此背景下,實現(xiàn)有質(zhì)量的公平成為中國教育政策的出發(fā)點和落腳點.
隨著“證據(jù)為本”(evidence-based)在教育政策領域的興起,科學的實證證據(jù)在推動教育政策科學化、高效化中的地位越發(fā)突顯.國際學生評價項目(Programmer for International Student Assessment,PISA)、國際數(shù)學與科學趨勢研究(Trends in International Mathematics and Science Study,TIMSS)、美國“國家教育進步評價”(National Assessment of Educational Progress,NAEP)等教育質(zhì)量監(jiān)測項目的實踐證明,教育質(zhì)量監(jiān)測通過對教育教學質(zhì)量及其相關因素的測查可為教育政策的制定、評估、調(diào)整提供客觀翔實的實證證據(jù),是義務教育階段提質(zhì)量、增效益、促公平的政策杠桿.自2015年《國家義務教育質(zhì)量監(jiān)測方案》實施以來,中國已經(jīng)持續(xù)開展了4年的全國義務教育質(zhì)量監(jiān)測工作.2018年7月,首份《中國義務教育質(zhì)量監(jiān)測報告》發(fā)布.學生個體、學校、家庭和社會多層面的相關因素的涉及,是深入分析義務教育質(zhì)量的關鍵一環(huán),也是監(jiān)測設計的重點與難點.基于此,以國家義務教育質(zhì)量監(jiān)測中數(shù)學監(jiān)測為切入點,統(tǒng)籌國際視野與本土行動,旨在總結、反思中國義務教育數(shù)學相關因素監(jiān)測工具的研發(fā).
大規(guī)模學業(yè)測評作為對學生的發(fā)展變化進行判斷分析的有效方式,憑借其科學的評價技術和嚴謹?shù)臏y評流程等優(yōu)勢,為各國測查教育成效、制定教育政策和推動教育改革提供豐富科學的決策依據(jù).大規(guī)模學業(yè)測評不僅包括國際組織領導的國際性大規(guī)模學業(yè)測評,也包括國家和地區(qū)針對本國(本地區(qū))進行的區(qū)域性學業(yè)測評.數(shù)學作為中小學教育的重點學科,是國際和各國(地區(qū))教育測量與評價的重要科目.選取目前在國際上影響較大,評價技術較成熟,且結果運用較廣泛的3個國際測評項目,即PISA、TIMSS、NAEP,對其數(shù)學相關因素測評的設計理念、模型、質(zhì)量保障措施和工具特點進行比較分析,為中國開展數(shù)學相關因素監(jiān)測工具的研發(fā)提供國際視野與借鑒.
PISA關注政策可改進的因素,其目標是開發(fā)可靠的、與政策相關的學生成就指標,從而實現(xiàn)對各國教育體制的質(zhì)量、公平和效率的評價目標.PISA將教育系統(tǒng)分為4個層次:教育與學習中的個人參與者、教學背景、教育服務的提供者、作為整體的教育系統(tǒng),其問卷測評就是圍繞教育系統(tǒng)的4個層次展開的.PISA測評理念見圖1.
圖1 PISA的測評理念
PISA采用“輸入—過程—輸出”的理論模型展開相關因素問卷的設計(見圖2).其中,輸入包括資源和規(guī)則,輸出包括學生的學業(yè)成就.學校、教師和學生的交互作用過程受到輸入條件的影響,同時又影響輸出結果.根據(jù)測評的理念與理論模型將相關因素的指標進一步細化為國家、學校、班級和學生4個層面.這4個層面從宏觀、中觀、微觀3個方面出發(fā),在輸入和過程環(huán)節(jié)不僅關注國家的經(jīng)濟、人口、學校等因素,也關注學生個人的家庭、移民、興趣、愛好等因素.國家、學校、班級層面的預測指標最終匯總到學生層面,表現(xiàn)為學業(yè)成績、學習態(tài)度等教育輸出結果[2].
圖2 “輸入—過程—輸出”模型
與PISA不同,TIMSS相關因素測評的概念框架在很大程度上受到IEA的第二次國際數(shù)學研究(Second International Mathematics Study,SIMS)的影響,課程是解釋學生成績存在國際間差異的一個重要因素.在SIMS模型中,課程包括3個層面:目標課程(the intended curriculum)、實施課程(the implemented curriculum)、獲得課程(the attained curriculum).其中,目標課程指的是教育系統(tǒng)的課程目標和要實現(xiàn)這些目標而建立的機制;實施課程指的是被設計來實施教育系統(tǒng)目標的學校和課程內(nèi)的實踐、活動和制度安排;獲得課程指的是學校教育的產(chǎn)出,即學生從他們的教育經(jīng)歷中實際獲得了什么.基于有關教育過程的這種認識,TIMSS提出了4個大的研究問題用以指導工具的開發(fā).這4個研究問題為:學生被希望學習什么樣的數(shù)學和科學知識?誰提供教學?教學是怎樣組織起來的?學生學到了什么?
NAEP測評的主要目的在于了解美國基礎教育質(zhì)量現(xiàn)狀、掌握基礎教育發(fā)展趨勢,同時了解各州、各學區(qū)的教育質(zhì)量狀況.因此,NAEP測評強調(diào)權威性和法制性,關注學生、教師以及學校對國家已有標準的達成度.其測評框架及測評目標是國家課程標準的有效轉換,可以稱為“基于標準”的評價.對影響學生學業(yè)成就的相關因素的測量也體現(xiàn)了其標準性,即重點測查與相關的國家政策、法律的實施和執(zhí)行情況.
為了保證測評的科學性與規(guī)范性,以及測評的廣泛適用性.PISA、TIMSS等項目在測評框架的確立、工具研發(fā)和具體實測過程上均制定嚴格的標準化流程.
PISA測評框架主要由國際聯(lián)合處完成.在此過程中,聯(lián)合處擬定的測評框架需要得到各參與國(地區(qū))教育主管部門的支持和指導.此外,PISA工具編制由管理委員會和國際聯(lián)合處共同完成.PISA管理委員會挑選數(shù)學、閱讀和科學等領域的世界級專家組成專家組,負責設計每次PISA調(diào)查的理論框架,組織問卷調(diào)查專家負責并指導問卷的制定.最后,在PISA的具體施測中,各參與國(地區(qū))政府要任命一個國家項目經(jīng)理(PISA National Project Manager)來負責監(jiān)督每個參與國(地區(qū))的評價實施情況[3].
TIMSS關注各國對課程的達成度,但各參與國的課程存在一定的差異.所以,TIMSS會對不同國家的課程進行調(diào)查,包括對課程指導文件、教科書和課程專家的信息收集,以此作為每個國家課程分析的重要來源.為了使TIMSS開發(fā)的工具盡可能地反映參與國的課程,所有的主題都需要經(jīng)過TIMSS學科咨詢委員會的審查,該委員會由來自世界各地的數(shù)學和科學教育工作者組成[4].此外,TIMSS在每個參與國設置國家監(jiān)察員,他們不僅參與測試題的出題工作,還在正式的大規(guī)模測試前,組織有代表性的學生進行小范圍的測試.測試后,所有的問題都由專門的審查委員會重新審查并進行調(diào)整.國家監(jiān)察員還會在加拿大統(tǒng)計局和IEA數(shù)據(jù)處理中心的指導下,對參與調(diào)查的學校和學生進行隨機抽樣,對調(diào)查測試收集數(shù)據(jù)過程和評卷過程進行嚴格監(jiān)測[5].
基于不同的測評目的以及對相關因素問卷的定位,PISA、TIMSS和NAEP在問卷設計與編制上也體現(xiàn)出不同的特點.
PISA項目的問卷會保留相對穩(wěn)定的趨勢分析指標,同時,由于每輪測試領域均有所側重,且持續(xù)關注與學生未來發(fā)展趨勢相關的關鍵能力,可以說PISA調(diào)查問卷在每輪測試中穩(wěn)中有變.具體而言,PISA問卷在每個周期對基本信息的測查是穩(wěn)定的,如輸入變量(年級、性別、社會家庭經(jīng)濟地位、移民狀況等);過程變量(決策機制、評估政策、專業(yè)發(fā)展情況、教師參與、師生關系、父母參與等);輸出變量(曠課、教育期望、動機、學習投入、情感因素、歸屬感等).與此同時,PISA會根據(jù)每輪測試重點,增加對特定學科的趨勢變量,如學習策略、元認知、學科相關的學習信念、自我效能、動機、學習機會等變量[2].
由于各國課程存在一定的穩(wěn)定性,圍繞課程展開的TIMSS相關問卷的測查也相對穩(wěn)定.每輪測試會對個別變量或題目的提問方式、措辭等進行微調(diào).同時,也會在各類問卷中增加一些可綜合分析的指標,如2011年,將有關學生學前教育經(jīng)歷、家庭擁有物等指標從學生問卷移至新增的家長問卷的同時,在學生和校長問卷中均增加了有關家長參與、家校合作等變量.
NAEP對相關因素的測試指標重點關注國家政策達成度以及法律的實施執(zhí)行情況,如教師的學歷、教師資格認證情況等.其在每輪測試中相關因素的指標很穩(wěn)定,僅在測試年級上有所區(qū)別.
1.4.1 項目的比較
首先,3個項目對相關因素問卷的功能定位不同.大規(guī)模學業(yè)測評項目對背景問卷的調(diào)查最基本的作用在于輔助項目對學業(yè)成績的分析.TIMSS評價的理念為課程是學生學業(yè)成就的重要影響因素,通過相關因素的測評探究學校、教師課程實施情況對學生學業(yè)成就的影響,試圖解釋各國學生對數(shù)學和科學課程的掌握情況的不同.因美國法律的要求,NAEP相關因素的測查集中于政策、法律、法規(guī)相關的內(nèi)容.同時,根據(jù)法律與政策修訂、增減、修改其相關因素的指標,保證其對政策和法律追蹤的時效性和適宜性[6].但總體上說,TIMSS和NAEP相關因素的測評主要指向于學校,所收集的學生背景信息側重于反映不同國家(地區(qū))的教師是如何進行教學的,以及這些教學對學生的成績可能產(chǎn)生的影響[6].而PISA項目的主要目的在于了解并比較各國15歲學生為未來生活的準備情況,了解他們是否具備分析、推理和溝通能力,了解他們是否具備終身學習的能力,發(fā)現(xiàn)各國教育的優(yōu)勢和不足,改善教學效果.PISA更具有前瞻性,著眼于年輕人使用他們掌握的知識和技能應對現(xiàn)實生活挑戰(zhàn)的能力,而不是掌握特定的學校課程”[7].
其次,3大項目的背景問卷框架清晰,為設計與開發(fā)問卷提供了依據(jù)與基礎.問卷設計框架是對項目調(diào)查維度、主題、對象及方式的具體闡釋,更是對操作性程度的實踐指導.如前所述,PISA、TIMSS和NAEP測試均有成熟且適切的相關因素問卷框架,在此框架的指導下進行問卷的開發(fā)與編制.
再次,雖然3大項目的問卷種類不盡相同,但是均體現(xiàn)出不同類型問卷、不同調(diào)查主題間結構嚴謹契合的特點.PISA、TIMSS測試在新增某個群體問卷時,都會對測查題目進行相應的調(diào)查,以便更科學、準確地收集信息.
1.4.2 啟示
PISA、TIMSS與NAEP對相關因素指標的設計與選取對中國開展數(shù)學監(jiān)測提供了參考與借鑒.第一,良好的政策導向.根據(jù)政府制定政策的需要進行設計和報告,以提供政策借鑒.第二,長期的趨勢研究.國際測評項目的趨勢研究可以讓各個參與國清楚地了解本國教育在一段時期內(nèi)的變化情況,也可以結合教育環(huán)境的相關信息分析這種變化產(chǎn)生的可能原因.第三,科學的背景信息收集.相關因素問卷主要有兩個作用:一是提供學生的人口學信息,用以對學生成績進行分類比較;二是提供學生生活和學習的背景信息,用以對學生成績的差異作出解釋,供家長、教師和教育決策者參考.
人是環(huán)境的產(chǎn)物,環(huán)境影響人的發(fā)展.環(huán)境決定論(environmental determinism)、生態(tài)系統(tǒng)理論(ecological systems theory)等研究成果表明環(huán)境是個體發(fā)展的重要影響源.生態(tài)系統(tǒng)理論認為環(huán)境是由一系列相互嵌套的結構組成,根據(jù)環(huán)境系統(tǒng)的大小及與個體的關系將環(huán)境分為微觀系統(tǒng)、中間系統(tǒng)、外部系統(tǒng)和宏觀系統(tǒng),這些系統(tǒng)化、結構化的環(huán)境系統(tǒng)之間相互影響,并通過與個體的互動影響個體的發(fā)展[8].從教育教學活動的發(fā)生場所來看,家庭、教室、學校和區(qū)域是正式教育或者非正式教育發(fā)生的主要場所,對相關因素進行分層次、有重點地測查,可操作性強,同時有利于各層面的實施主體依據(jù)監(jiān)測結果進行教育改進.但在教育領域,影響教育質(zhì)量的相關因素復雜多樣,監(jiān)測中對影響因素的取舍通常與監(jiān)測理念和其特定的教育價值取向具有密切關系.
教育質(zhì)量監(jiān)測的價值取向決定監(jiān)測的具體設計.《國家義務教育質(zhì)量監(jiān)測方案》指出中國教育質(zhì)量監(jiān)測的目的主要有兩個.第一,要“客觀反映義務教育階段學生學業(yè)質(zhì)量、身心健康及變化情況”;其次,要“深入分析影響義務教育質(zhì)量的主要原因,為轉變教育管理方式和改進學校教育教學提供參考”[9].中國開展教育質(zhì)量監(jiān)測,一方面要基于學生的學業(yè)發(fā)展與非學業(yè)發(fā)展構建“學業(yè)質(zhì)量綠色譜圖”,另一方面要基于相關因素構建“影響要素作用譜圖”,為全面診斷學業(yè)質(zhì)量及其影響要素提供實證依據(jù).在教育質(zhì)量監(jiān)測價值取向上,中國“以縣為主”的教育管理體制,東西部之間、城鄉(xiāng)之間存在教育不均衡現(xiàn)象,以及人民日益增長的優(yōu)質(zhì)教育需求與教育事業(yè)發(fā)展不平衡不充分之間的矛盾等獨特的教育特征,決定了中國教育質(zhì)量監(jiān)測的價值取向與PISA、TIMSS、NAEP等項目的設計理念有著本質(zhì)的差異.總體而言,中國教育質(zhì)量監(jiān)測的根本任務在于回應“培養(yǎng)什么人、怎樣培養(yǎng)人”的問題,根本目標是實現(xiàn)“讓每個孩子都能享有公平而有質(zhì)量的教育”.因而,中國教育質(zhì)量監(jiān)測相關因素工具研制在自身的政策背景下要對以上問題做出有力回應,相關因素工具研制過程中的研發(fā)原則、質(zhì)量保障以及指標特點都有著自身的特色.在此基礎上,研究主要在兩輪數(shù)學教育質(zhì)量監(jiān)測的探索歷程之上,總結了中國數(shù)學相關因素工具研制的獨特特征.
數(shù)學教育質(zhì)量監(jiān)測堅持全面的教育質(zhì)量觀,一方面以數(shù)學核心素養(yǎng)為導向,不僅關注數(shù)學學業(yè)表現(xiàn),也關注學生數(shù)學學習的情感態(tài)度價值觀,基于學業(yè)發(fā)展與非學業(yè)發(fā)展兩個維度構建“數(shù)學學業(yè)質(zhì)量綠色譜圖”;另一方面堅持多元綜合的系統(tǒng)觀,發(fā)揮教育質(zhì)量監(jiān)測對數(shù)學教育的評價、導向與改進功能.有選擇的監(jiān)測家庭、學校和社會等不同層面相關因素,綜合分析數(shù)學教育質(zhì)量的影響因素,構建“影響要素作用譜圖”,為進一步挖掘“何種因素影響數(shù)學學業(yè)質(zhì)量”“為何以及如何影響數(shù)學質(zhì)量”提供證據(jù)支持.因而,數(shù)學教育質(zhì)量的相關因素對于理解數(shù)學教育質(zhì)量現(xiàn)狀、分析背后的成因、提出改進的意見與措施具有重要幫助.在可操作和可測量的基本前提下,將影響數(shù)學學業(yè)質(zhì)量的相關因素轉化為具體測量指標體系與測查工具.在研發(fā)數(shù)學相關因素工具時,主要遵循以下幾個原則:
(1)導向性原則.在高考指揮棒下,目前數(shù)學教育仍具有明顯的應試傾向,被動接受仍是學生最常見的學習狀態(tài),死記硬背、被動灌輸?shù)葯C械訓練所造成的數(shù)學技能往往是片面的、畸形的[10],不利于數(shù)學核心素養(yǎng)的構建.為打破傳統(tǒng)的應試觀、“唯分數(shù)論”,引導社會樹立科學的數(shù)學教育質(zhì)量觀.在相關因素指標的選取與確立時,格外注重將學生的數(shù)學學習興趣、數(shù)學學習自信心、數(shù)學學習習慣等體現(xiàn)數(shù)學非學業(yè)發(fā)展的指標納入數(shù)學相關因素指標體系中,通過構建“數(shù)學學業(yè)質(zhì)量綠色譜圖”的方式引導數(shù)學核心素養(yǎng)的培養(yǎng).
(2)持續(xù)性原則.不同于“中考”“高考”等學業(yè)水平考試在不同年度間的相互獨立性,數(shù)學教育質(zhì)量監(jiān)測要通過不同年度間相關因素的變化,持續(xù)跟蹤全國數(shù)學教育教學質(zhì)量在不同年度間的變化情況.因此,在構建數(shù)學教育質(zhì)量相關因素指標時,一方面要圍繞影響數(shù)學教育質(zhì)量的根本問題進行選擇,指向影響數(shù)學教育質(zhì)量的核心.另一方面,選取那些相對穩(wěn)定的、具有長期監(jiān)測價值的指標,以便進行長期追蹤分析,回應教育政策以及社會大眾對數(shù)學教育問題的關切,如中國長期以來存在的數(shù)學課外輔導問題、學生的數(shù)學學習興趣問題、數(shù)學教師的專業(yè)成長問題.
(3)發(fā)展性原則.從發(fā)展的視角出發(fā)選取數(shù)學相關因素的指標.首先,從學生發(fā)展的角度出發(fā),所采用的指標應體現(xiàn)發(fā)展學生數(shù)學素養(yǎng)的引導作用,如學生的數(shù)學興趣、數(shù)學自我效能感、數(shù)學問題解決能力等指標,力求通過相關因素的監(jiān)測探明學生數(shù)學學習的薄弱點,啟示各方及時改進,以促進學生數(shù)學核心素養(yǎng)的發(fā)展;其次,從以往的“雙基”到“三維目標”,再到如今的“核心素養(yǎng)”,數(shù)學教育所關注的側重點會有所不同,數(shù)學相關因素問卷所選取的指標體系應體現(xiàn)最新課程理念下的數(shù)學教育特點,通過對指標與工具的及時修訂適合課程發(fā)展需要.
(4)可改進原則.數(shù)學教育質(zhì)量監(jiān)測最終要為提升數(shù)學教育質(zhì)量服務,因此,在構建教育質(zhì)量監(jiān)測指標時,所選取的數(shù)學相關因素是可改進和可干預的,如師生關系、學習機會、數(shù)學教師專業(yè)成長等指標.只有這樣的因素,才能在明晰“怎樣以及如何影響數(shù)學教育質(zhì)量”的基礎上解決“如何改進”的問題,發(fā)揮各方、各級、各類主體的主觀能動性,落實改進方案,實現(xiàn)數(shù)學教育質(zhì)量的不斷提升.
(5)政策關照原則.中國義務教育質(zhì)量監(jiān)測結果作為教育政策制定、調(diào)整和評價的主要依據(jù)來源,應積極回應政策關切的熱點和難點問題.所選取的數(shù)學相關因素應當是各類教育政策的關注點,通過對相關因素的測查,能較好的回應政策,客觀報告政策的執(zhí)行與落實以及具體的實施效果,能夠為政策改進與制定提供有力依據(jù).如數(shù)學教育質(zhì)量監(jiān)測中對學生學業(yè)負擔的測查,為國家出臺減輕小學生課業(yè)負擔相關政策提供了一定的證據(jù)支持.
(1)多領域專家協(xié)同參與相關因素工具的開發(fā).首先,數(shù)學教育質(zhì)量相關因素工具的研制涉及數(shù)學教育、教育心理學、課程與教學論等多個學科,為體現(xiàn)相關因素工具的科學性和專業(yè)性,在研發(fā)過程中邀請來自教育、心理、教育統(tǒng)計、教育測量與評價、數(shù)學教育、課程與教學論等多領域的學科領頭人協(xié)同完成,具有較高的權威性;其次,除了高校和研究機構的專家學者,還有來自全國各地教育教學一線的教研員和優(yōu)秀教師參與相關因素的研發(fā),具有廣泛的代表性.
(2)標準化的研發(fā)流程.為保證數(shù)學相關因素工具的信度和效度,研制過程需要嚴格遵循標準化的工具研發(fā)程序.在研發(fā)流程上,工具經(jīng)過多輪的預試、質(zhì)量分析和審改才能進入正式施測階段.在這些環(huán)節(jié)中既要保證參與的專家能盡最大限度地貢獻其智慧,提升工具研發(fā)質(zhì)量,同時又確保制定過程的推進速度,在各個時間節(jié)點高效完成工具研發(fā)程序.
(3)國際經(jīng)驗的充分借鑒.將“全球視野”與“本土行動”相結合,對國際大型測評項目進行多年的追蹤分析,對其相關因素設計的理念、技術和測評框架進行了深入的比較分析,為中國數(shù)學相關因素工具的研發(fā)提供思路與啟示.同時,通過國際交流與合作,邀請國際專家參與相關因素工具的研發(fā),將國際先進測評理念與技術進行中國化,研發(fā)具有中國特色的數(shù)學相關因素工具.
(4)多年試點監(jiān)測經(jīng)驗的積累.從2007年起,在全國范圍內(nèi)進行了多次數(shù)學義務教育質(zhì)量監(jiān)測的試點工作,為數(shù)學相關因素工具的研發(fā)積累了寶貴的經(jīng)驗,正式施測的大部分指標體系與監(jiān)測工具經(jīng)過多輪試點監(jiān)測以及多次預試的驗證,已經(jīng)比較成熟,具有良好的信效度.
(1)鮮明的數(shù)學學科特色.與其他科目不同,數(shù)學科目具有較強的邏輯嚴密性、抽象表達性,對于義務教育階段學生而言,數(shù)學屬于相對較難的學習科目.因此,圍繞數(shù)學科目自身的特點以及學生的學習方式產(chǎn)生了較多具有數(shù)學學科特色的問題.在相關因素指標體系和工具的編制上緊密圍繞數(shù)學學科的教育教學等內(nèi)容展開,所選擇的因素都旨在回答如何影響數(shù)學教育質(zhì)量這一根本性問題.如數(shù)學學習機會指標,數(shù)學知識自身的嚴密性、邏輯性決定了學生數(shù)學學習機會對學業(yè)成績具有重要的影響,而學校作為教育教學的主要活動場所,通過對學生學習內(nèi)容及學習時間等機會因素的測查,可以間接考查教師的課堂管理、教學策略等因素對學生數(shù)學學習機會的影響,從學校教育過程性因素揭示數(shù)學學業(yè)成績存在差異的原因.
(2)多角度、多主體深入探討相關主題.從數(shù)學教學過程的角度來看,對數(shù)學相關因素的測查涉及“輸入—過程—輸出”等多個環(huán)節(jié)的不同變量,既包含對數(shù)學教育政策、教育資源投入的測查,也包括對學生學習機會、教師課堂教學方式、班級管理等過程性因素的測查,同時包含對學生數(shù)學學習興趣、學習自信心、學習策略等輸出性因素的測查.從測驗對象的角度來看,數(shù)學相關因素的測查對象包括學生、教師和校長,涉及個人、家庭、班級、學校和社會多個層面的內(nèi)容,選擇多主體參與回答,可以從多角度對相同的問題進行探討,深入挖掘,能對影響教育質(zhì)量的相關因素提供更為全面的解讀.
(3)全面性與指向性的均衡設計.全面性體現(xiàn)在數(shù)學相關因素監(jiān)測工具研發(fā)初始階段,通過政策分析、課標分析、專家訪談、文獻分析、問卷調(diào)查等一系列方式全面把握影響數(shù)學學業(yè)成績的相關因素,構建數(shù)學相關因素指標庫.指向性主要體現(xiàn)在最終相關因素監(jiān)測工具指標的選擇.首先,根據(jù)《國家義務教育質(zhì)量監(jiān)測方案》的基本要求,主要圍繞影響數(shù)學課程標準的實施情況,選擇相關指標,如課程開設、教師教學能力、學生學習機會等相關指標.其次,指向當下教育政策和數(shù)學教育熱點問題,如數(shù)學課外輔導班問題、數(shù)學教師育人方式問題,既能有效測查影響數(shù)學學業(yè)質(zhì)量的相關因素,又及時回應當下政策需求.
經(jīng)過兩輪的正式實施,根據(jù)中國數(shù)學教育的現(xiàn)狀,中國義務教育數(shù)學相關因素監(jiān)測工具研制積累了大量的實踐經(jīng)驗,在指標研發(fā)原則、工具研發(fā)的質(zhì)量保證以及工具的主要特點都形成了一套較為成熟、科學的體系.在未來的工具研發(fā)過程中,仍需要思考以下問題:
(1)立足中國國情,講好中國故事.目前中國數(shù)學教育面臨著學習興趣與自信的培養(yǎng)、學業(yè)負擔、學習機會、數(shù)學教師專業(yè)化、教學資源配置與利用等一系列問題,如何更好地立足中國數(shù)學教育國情,通過相關因素的測查講好中國數(shù)學教育故事是數(shù)學相關因素監(jiān)測工具研發(fā)中需持續(xù)深入思考的問題.而PISA測試發(fā)現(xiàn)學生數(shù)學文本閱讀理解的能力較低、數(shù)學應用和推廣意識不夠、數(shù)學教學以教師主導策略為主等,如何將國際教育質(zhì)量監(jiān)測的發(fā)現(xiàn)有選擇地納入中國義務教育質(zhì)量監(jiān)測體系中做進一步發(fā)掘,是未來數(shù)學相關因素監(jiān)測工具研發(fā)的又一個關注點.
(2)立足當下實踐,引領未來發(fā)展.監(jiān)測工作既堅持以中國學科課程標準為基本依據(jù),緊扣中國教育法律法規(guī)和方針政策,又注重以中國義務教育改革和發(fā)展中存在的熱點難點與重點問題為根本導向[11].數(shù)學相關因素監(jiān)測工具研制在回應政府需求,解決數(shù)學教育面臨的難點與熱點問題的同時,應具備一定的前瞻性.步入21世紀以來,隨著信息科技的迅猛發(fā)展,教育模式、形態(tài)、內(nèi)容和學習方式正在發(fā)生深刻變革[12],未來學校的教學程式和學習方式必然發(fā)生革命性的變革.數(shù)學相關因素背景問卷在立足當下現(xiàn)實問題的同時,應對目前學校數(shù)學教育中信息化利用情況、個性化培養(yǎng)等相關問題進行測查,為推動未來教育變革背景下的數(shù)學教育發(fā)展做出一定的證據(jù)支持.
(3)建立指標閾值,發(fā)揮預警功能.數(shù)學相關因素監(jiān)測工具研制的主要目的在于探查來自學生個體、家庭、學校、社會等不同層面要素對學生數(shù)學學業(yè)成績的影響狀況.但目前相關因素指標的利用尚且存在一定的模糊性,并未像學業(yè)成績劃分出明確的等級.因此,建立數(shù)學相關因素各變量的閾值及預警機制將是未來數(shù)學相關因素監(jiān)測工具研發(fā)需要思考的問題.首先要構建指標的絕對衡量標準,通過設定上限與下限的閾值空間,明確不同閾值區(qū)間所表征的合格、良好、優(yōu)秀等評價等級,以此來刻畫不同指標的“健康”狀況.其次,構建相對比較的閾值差值,通過區(qū)域間、學校間的變異比較,直觀刻畫各種相關因素之間的差距,以此來比較地區(qū)間、學校間的教育公平問題.發(fā)揮教育質(zhì)量監(jiān)測的評價、引導和改進的功能.
(4)打破學科局限,適應學科融合.《教育部關于全面深化課程改革落實立德樹人根本任務的意見》中指出,在“發(fā)揮各學科獨特育人功能的基礎上”,要“開展跨學科主題教育教學活動,將相關學科的教育內(nèi)容有機整合,提高學生綜合分析問題、解決問題能力”[13].在學科融合的大背景下,數(shù)學教育將會融入科學、語文等其他學科的相關知識,影響數(shù)學學業(yè)成績的因素變得更加復雜多樣.數(shù)學相關因素監(jiān)測工具如何在保持數(shù)學教育獨特性的基礎上融入跨學科的一般性是未來數(shù)學相關因素監(jiān)測工具研制應思考的問題.
[1] 顧明遠.讓每個孩子都享有公平而有質(zhì)量的教育[J].教育研究,2017,38(11):4-7.
[2] OECD. PISA 2012 Assessment and analytical framework: mathematics, reading, science, problem solving and financial literacy [R]. Paris: OECD Publishing, 2013: 173-187.
[3] OECD. PISA 2012 results: what students know and can do-student performance in mathematics, reading and science, PISA [R]. Paris: OECD Publishing, 2014: 279.
[4] MARTIN M O, KELLY D L. Third international mathematics and science study technical report, volume II: implementation and analysis-primary and middle school years, center for the study of testing, evaluation, and educational policy [R]. Boston: Boston College, 1997: 6-8.
[5] 辛濤,李峰,李凌艷.基礎教育質(zhì)量監(jiān)測的國際比較[J].北京師范大學學報(社會科學版),2007,43(6):5-10.
[6] 李凌艷,郭思文.國際大型教育評價項目中學校因素測量——學校有效性研究的一個視角[J].中國教育學刊,2011(11):27-30.
[7] 魯毓婷.全球背景下的學生學業(yè)成就比例研究——TIMSS和PISA[J].考試研究,2007,3(3):76-92.
[8] BRONFENBRENNER U. Ecological systems theory[M]. Berlin: Springer US, 2011: 187-249.
[9] 國家義務教育質(zhì)量監(jiān)測方案[EB/OL].(2015-04-15)[2018-05-08].http://www.ec.js.edu.cn/art/2015/4/23/art_10347 _170979.html.
[10] 孔凡哲,史寧中.中國學生發(fā)展的數(shù)學核心素養(yǎng)概念界定及養(yǎng)成途徑[J].教育科學研究,2017(6):5-11.
[11] 教育部基礎教育質(zhì)量監(jiān)測中心.中國義務教育質(zhì)量監(jiān)測報告[R].北京:教育部基礎教育質(zhì)量監(jiān)測中心,2015:2-3.
[12] 中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要[EB/OL].(2015-11-03)[2018-05-08].https://baike. so.com/doc/10958512-11495833.html.
[13] 教育部關于全面深化課程改革落實立德樹人根本任務的意見[EB/OL].(2014-03-30)[2018-05-08].https://baike. so.com/doc/7863893-8137988.html.
Introduction of the Questionnaire Development in National Assessment of Education Quality-Math
WANG Ye-hui1, ZHANG Yue1, 2, YANG Tao1, WANG Li-dong1, LEUNG Frederick3, BAO Jian-sheng4
(1. Collaborative Innovation Center of Assessment toward Basic Education Quality, Beijing Normal University, Beijing 100875,China;2. College of Education, Capital Normal University, Beijing 100037, China;3. Faculty of Education, The University of Hong Kong, Hong Kong 999077, China;4. Department of Mathematics, East China Normal University, Shanghai 200241, China)
The design of index and the questionnaire in PISA, TIMSS and NAEP provided rich experience for China. China has carried out National Assessment of Education Quality-Mathematics (NAEQ-MA) for four years since 2015. The features of mathematical questionnaires were as follows: (1) distinctive features in mathematics domain; (2) multiple survey respondents;(3) comprehensive and targeted design. However, we should consider following questions in the future: (1) based on China characteristics, expressing in our way; (2) based on practice, looking forward the future development; (3) establishing the threshold, exerting early warning function; (4) breaking the limitation of subject and adapting to the subject integration.
National Assessment of Education Quality; mathematics; questionnaire development
G420
A
1004–9894(2018)05–0008–05
王燁暉,張岳,楊濤,等.義務教育數(shù)學相關因素監(jiān)測工具研發(fā)的探索與思考[J].數(shù)學教育學報,2018,27(5):8-12.
2018–09–01
王燁暉(1982—),女,浙江杭州人,講師,博士,主要從事教育測量與評價研究.
[責任編校:陳雋、張楠]