如果評價與考試沒有相應的改進,所編制的測驗題目不能有效考察學生的科學精神,自然也就無法發(fā)揮其導向、診斷與發(fā)展性功能。只有教育者高度重視科學精神的評價研究,以評促教,才能切實推動教師教學方式的變革,強化科學精神的培養(yǎng)。
科學精神是人類通過自身科學技術獲得而產生的對客觀世界的觀點和看法,是一種理性思維的世界觀和方法論。有研究者將科學精神概括為客觀的依據(jù)、理性的懷疑、多元的思考、平權的爭論、實踐的檢驗與寬容的激勵等。[1]近些年來,隨著第9次中國公民科學素養(yǎng)調查與PISA2015科學素養(yǎng)測試結果的公布[2],以及中國學生發(fā)展核心素養(yǎng)框架的頒布,科學精神培養(yǎng)逐漸成為基礎教育領域的熱點問題。國家要提升青少年學生的科學精神,必須統(tǒng)籌課標、教材、教學、評價、考試等多個環(huán)節(jié)。如果評價與考試沒有相應的改進,所編制的測驗題目不能有效考察學生的科學精神,自然也就無法發(fā)揮其導向、診斷與發(fā)展性功能。只有教育者高度重視科學精神的評價研究,以評促教,才能切實推動教師教學方式的變革,強化科學精神的培養(yǎng)。
通過中考生物題探討科學評價的重要性
義務教育生物課程標準(2011年版)指出,“生物科學不僅是眾多事實和理論的匯總,也是一個不斷探究的過程??茖W探究既是科學家工作的基本方式,也是科學課程中重要的學習內容和有效的教學方式?!盵3]3所以,生物課程高度重視科學精神培養(yǎng),在教學中倡導探究式學習,提高學生探究能力。具體來說,探究活動包括提出問題、作出假設、制訂計劃、實施計劃、得出結論、表達與交流等多個環(huán)節(jié)。(見表1)[3] 9
表1較為清晰地界定了探究能力的成分與基本要求,也在一定程度上表明了探究能力培養(yǎng)的預期成果,為教師教學指出了明確的方向。為評價學生生物探究能力,某市在中考生物試卷中設計了這樣一道題:
菊花一般在秋天開花。影響菊花開花的生態(tài)因素是什么?科學興趣小組對“菊花是否開花與日照長短的關系”進行了探究。
(1)作出假設:———;———。
(2)進行實驗:取十盆大小、長勢都差不多且未開花的菊花,放在其他環(huán)境條件都適宜且相同的地方,其中五盆放在日照時間短的地方,另五盆放在日照時間長的地方,經過一段時間后,觀察開花情況。該實驗的主要變量是———;———。
(3)如果他們的假設成立,觀察到的現(xiàn)象應該是————————。
不難看出,這道題目意在考察學生提出假設與制訂實驗計劃的能力,但實際上它的效度不甚理想。效度是高質量評價的首要條件。一道測試題,或者一套測評方案,只有其效度良好,才能創(chuàng)造好的評價。如果測試題目效度不良,即使其信度、難度、區(qū)分度等其他指標都合乎測量學要求,也沒有什么實質意義,也不是好的評價。[4]效度分析的一種常用方法是“出聲思考”,具體做法是讓學生在解題過程中將自己的思考和解題過程“出聲”說出來,分析者可以從中發(fā)現(xiàn)學生解題時應用了哪些知識、技能、經驗或能力,在這些成分中,哪些是解題的關鍵、哪些屬于意欲測量的內容、哪些已經超出了評價范圍,從而判定結構效度的好壞。對本題采用“出聲思考”方法進行分析發(fā)現(xiàn),這里沒有理性的懷疑,也沒有多元的思考,學生根本不需要對影響菊花開花生態(tài)因素進行猜想和假設,只需要將題干中“菊花是否開花與日照長短的關系”轉述成“菊花開花與日照長短有/沒有關系”即可,所以評價者不能考察到學生做出假設的能力。同時,在第(2)小題中學生要從題干給定的實驗設計中辨別出主要變量,盡管它涉及實驗的理解,但也并不能有效考察學生制訂實驗計劃的能力,學生不需要考慮“客觀的依據(jù)”和“實踐的檢驗”。
效度不良的評價題目不僅不能有效判斷學生的能力發(fā)展,而且無法發(fā)揮積極的導向作用。評價是指揮棒。評價評什么,教師就教什么,學生就學什么;評價怎么評,教師就怎么教,學生就怎么學。如果生物、物理及化學等學科的中考命題都不能有效考察學生的科學精神,只是考察科學知識(包括事實性知識與程序性知識)的理解和記憶,那么要指望教師在日常教學中落實科學培養(yǎng)就會十分困難。
從這一意義上來說,教育者必須高度重視評價研究,使評價成為助推學校科學教育變革的一個突破口。
借鑒PISA項目經驗改進科學評價
PISA項目是由世界經濟合作組織統(tǒng)籌實施的一項跨國學生學業(yè)成就評價研究,旨在評價參與國家/經濟體15歲青少年是否掌握參與社會所需的知識與技能。PISA測試每三年實施一次,測試內容涉及科學、數(shù)學和閱讀,但每次測評都有不同的側重點。PISA2015測試重點是科學素養(yǎng)。PISA2015將科學素養(yǎng)界定為一個具有反思能力的公民運用科學知識參與科學相關事務的能力。具體地說,科學能力被區(qū)分為“科學地解釋現(xiàn)象”“評價和設計科學探究”“科學解讀數(shù)據(jù)和證據(jù)”等三種能力[5],這些都是科學精神的核心要素。
為確保每一道評價題目的效度,命題者在題目開發(fā)過程中通常采用以下程序 [6]:(1)最初準備:根據(jù)細目表編制題目;(2)試題審查:從學生及編碼者的視角對題目進行審查;(3)認知性訪談:讓學生回答問題,在回答過程中“出聲思考”,在答題結束后輔以個人訪談和小組訪談;(4)試點測試:在考試情境中試測,進一步分析題目結構效度。這種通過多個環(huán)節(jié)、多個視角、多種方法收集效度證據(jù)的方式,雖然成本較高,但能確保題目的結構效度,在大規(guī)模、高利害評價項目中十分必要。
正是因為有了這些嚴格的分析與審查程序,PISA科學測試題目的效度都比較好。以下是一道PISA科學測試樣題。[7]本題目最初由我國臺灣地區(qū)臺南大學研究人員翻譯,這里根據(jù)大陸語言習慣有所修改。
閱讀下列短文,并回答下列問題。
滅蠅
有個農民在農場擔任奶牛的管理工作。牛圈里蒼蠅很多,影響了動物健康。所以,農民用含有“殺蟲劑A”的溶液噴灑牛圈和奶牛。這種殺蟲劑幾乎殺死所有的蒼蠅。然而,過了一段時間,又出現(xiàn)很多蒼蠅。于是,農夫再度噴灑一次這種殺蟲劑。這次的噴灑效果,與第一次噴灑的效果相似,雖沒有殺死全部蒼蠅,但讓大多數(shù)蒼蠅死亡。再過一段時間,蒼蠅又來了。于是,農民又再一次噴灑殺蟲劑。這樣的事情一再發(fā)生,總共噴灑了五次殺蟲劑。結果很明顯,殺蟲劑A殺死蒼蠅的效果越來越差。農民注意到了他的噴藥過程,他先配好一大瓶殺蟲劑溶液,這五次噴藥都用這一瓶溶液。因此,殺死蒼蠅效果越來越差的可能原因,農民提出的解釋是:殺蟲劑因存放時間過久而分解。endprint
問題1:農民提出的解釋是:殺蟲劑A因存放時間過久而分解。如何驗證這個解釋?請簡要說明之。
問題2:為什么“殺蟲劑A殺死蒼蠅的效果越來越差”,農民的解釋是:殺蟲劑因存放時間過久而分解。除了農民的解釋之外,請你提出兩個不同的解釋。
這道PISA樣題與前文提及的中考題同樣是生物題,同樣是在考察學生提出假設與制訂實驗計劃的能力,但效度明顯優(yōu)于中考題者。在問題1中,學生需要采用控制變量法設計實驗以驗證農民提出的假設。如果學生在控制蒼蠅品種及其暴露經驗的條件下,考察新配置殺蟲劑與配制后存放一段時間后的殺蟲劑的滅蠅效果,就可以得到滿分。如果學生僅控制一個無關變量,或者沒有設置對照組,就只能部分得分。這里考察了學生提出實驗計劃的能力,是科學精神、探究能力的核心。在問題2中,學生需要提出新的假設,比如“蒼蠅對殺蟲劑A產生耐藥性”,或者“殺蟲劑溶液存放過程中化學物質上升到溶液的上層,而下層主要是稀釋用的水”。這里考察了學生依據(jù)生物和化學所學知識進行大膽假設的能力。
只有題目的效度有保證,能有效考察到欲考察的特質,才能對學生的素養(yǎng)或表現(xiàn)做出準確的判斷,才能強有力地引導教師的教與學生的學。如果中高考在相關學科命題中僅僅考察學生實驗操作、實驗理解、儀器整理、數(shù)據(jù)記錄等低水平技能,那么教師在日常教學中就可能只是實驗演示和實驗操作;而如果中高考命題聚焦科學精神,考察學生“科學地解釋現(xiàn)象”“評價和設計科學探究”,以及“科學解讀數(shù)據(jù)和證據(jù)”等復雜能力,那么教師會更加重視探究式教學,培養(yǎng)學生的質疑意識、探究精神以及批判性分析能力,學生的科學精神將有明顯提升。
近些年來,我國部分省市已在中高考命題中有意識地借鑒PISA項目經驗,加強表現(xiàn)性評價的應用,考察學生在真實生產生活情境中探究、分析和解決問題的能力,取得了一些積極的進展。[8]但必須承認的是,由于我國測驗與評價研究相對滯后,教師、教研員及命題者都缺乏相關培訓,不少命題考察的仍然是孤立的知識與技能,沒能有效考察到學生的探究能力與科學精神。評價與考試研究亟待進一步加強。
如何通過評價改革推動科學精神培養(yǎng)
評價已成為制約我國科學教育的“瓶頸”。加強命題與考試研究,加大評價改革力度,勢在必行。只有評價任務能引發(fā)學生的科學精神表現(xiàn),使科學精神中的重要成分成為解題的關鍵,確保評價效度,才能充分發(fā)揮其導向、診斷及發(fā)展性功能,推動實踐中科學精神的培養(yǎng)。
以前文提及的中考生物題為例,將這道生物題稍加改進,就可以提高其效度和對實踐的影響力。題目可以這樣改進。
菊花一般在秋天開花。觀察發(fā)現(xiàn),校園里擺放的盆栽菊花開花有早有晚,影響盆栽菊花開花早晚的生態(tài)因素是什么?請?zhí)岢鰞蓚€假設。如果你想到的不只兩個,可以多寫。
(1)假設1:—————;(2)假設2:—————;(3)假設3:—————。
這道改進后的題目聚焦于“提出假設”,重點考察了學生提出假設的能力。學生基于“菊花一般在秋天開花”這一季節(jié)性特點,除了提出“菊花開花早晚受日照時間長短影響”的假設,還可以提出菊花開花早晚受空氣濕度、氣溫等因素影響的假設。而如果學生提出菊花開花早晚受土壤肥力等非季節(jié)性因素的影響,則不能得分,因為即使夏天控制土壤肥力,菊花通常還是不會開花。學生在答題中不能脫離季節(jié)提假設,反映了生物課程學習的效果,具有積極的診斷意義。
繼續(xù)對這道中考生物題進行分析與改進,如果意欲考察學生制訂研究計劃的能力,我們還可以將原來的中考生物題改成如下這樣。
就哪些生態(tài)因素會影響菊花開花時間早晚,有人提出假設“日照時間是影響菊花開花早晚的一個因素”,于是他設計如下實驗:取十盆大小、長勢都差不多且未開花的菊花,放在其他環(huán)境條件都適宜且相同的地方,其中五盆放在日照時間短的地方,另五盆放在日照時間長的地方,經過一段時間后,觀察開花情況。
(1)在這個實驗中,實驗變量是——;(2)兩組菊花“放在其他環(huán)境條件都適宜且相同的地方”,這里所說的其他環(huán)境條件主要指什么?請列舉兩個以上。(3)這個實驗設計好不好?請說明理由。
這道改進后的題目聚焦于實驗設計能力,重點考察學生理解與評價實驗計劃的能力。特別需要指出的是,在本題中,我們沒有要求學生制訂實驗計劃,而是要求學生評價一個實驗計劃,這種命題不僅減少了閱卷的工作量,克服了評分的主觀性,而且較好地評價了學生實驗設計的能力。深度分析發(fā)現(xiàn),本題中的實驗設計還存在多個亟待改善的問題,主要有:(1)無關變量控制得不好。本實驗控制了菊花的大小與長勢,以及除日照長短之外的“其他環(huán)境條件”,但沒有控制菊花的品種,如果實驗組菊花是A品種,而對照組菊花是B品種,這一實驗無法驗證前面所提的假設,實驗的內在效度不好;(2)樣本量不夠。在本實驗中,實驗組和對照組的菊花只有5盆,樣本量太小,結果出現(xiàn)偏差的可能性增大。正如要比較某兩個地市教師的普通話水平,如果僅從兩個地區(qū)分別隨機抽取5名教師進行測評,其結果的可信程度不會很高。(3)對照組數(shù)量偏少。要有效考察日照時間對菊花開花早晚的影響,僅有實驗組和對照組各1個可能難以驗證假設。比如,實驗組日照時間為每日180分鐘,對照組日照時間為每日170分鐘,可能兩組菊花的開花時間沒有顯著差異。如果在實驗中設計多個組別,日照時間有多種不同的安排,這要比原有實驗能更好地驗證假設是否成立。
可以想象,如果第一次采用上述改進后的題目考初三學生,其表現(xiàn)可能不會很理想,但如果第二年再采用類似考題,學生們的科學精神一定會有明顯提升,因為在兩次考試之間教師的教以及學生的學會因新興考試方式而改變。
評價改革應成為未來我國青少年科學精神培養(yǎng)的突破口。為此,我們建議加強中高考命題改革。中高考是一種高利害評價,對基礎教育具有強有力的導向作用。有關部門和機構亟需借鑒國際經驗,特別是PISA項目、國際數(shù)學與科學教育成就趨勢調查等大規(guī)模教育測評項目的經驗,加強命題研究,加大考試改革力度,通過改進評價“倒推”教學實踐的變革,引領科學精神的培育。同時,地方教研機構與中小學也要在日常教研活動中深化評價研究。評價是教學的有機組成部分。在以往教研活動中,教師通常將研討重點放在“如何教”上,對“如何評”的研究明顯不足。在未來,教研員要指導教師將教研重點轉向“如何評”。具體到物理、化學或生物等學科的教研活動中,教師要針對如何操作化定義科學精神、如何確保任務情境的真實性、如何提高評價效度等相關問題,結合具體教學內容開展深入研究,提高教師的評價技能,以評促教,推動教師教學方式的變革,切實提高青少年的科學精神。
參考文獻:
[1]胡業(yè)生.科學精神到底是什么[EB/OL].(2009-09-14)[2017-08-03].http://blog.sciencenet.cn/blog-40486-255593.html.
[2]趙德成,郭亞歌,焦麗亞.中國四?。ㄊ校?5歲在校生科學素養(yǎng)表現(xiàn)及其影響因素:基于PISA2015數(shù)據(jù)的分析[J].教育研究,2017,(6):80-86.
[3]中華人民共和國教育部.義務教育生物課程標準(2011年版)[S].北京:北京師范大學出版社,2011.
[4]趙德成.促進教學的測驗與評價[M].上海:華東師范大學出版社,2016.73.
[5]OECD.PISA 2015 Results:Excellence and Equity in Education(volume I)[EB/OL].(2016-12-30)[2017-08-03].http://www.oecd-ilibrary.org/docserver/download/9816061e.pdf?expires=1483280245&id=id&accname=guest&checksum=D39C0E18E2F8868D25A19515684F3A68.
[6]張雨強,張志紅.PISA2006 科學試題的設計和開發(fā)及其啟示[J].外國教育研究,2011,(2):59-65.
[7]臺灣PISA研究中心.科學樣本試題(中文版)[EB/OL].(2015-07)[2017-08-03].http://pisa.nutn.edu.tw/sample_tw.htm.
[8]楊帆,吳成軍.四十年來生物高考的歷程、特點與展望[J].課程教材教法,2017,37(1):82-88.
【趙德成,北京師范大學教育學部,副教授,博士生導師】
責任編輯︱黃蜀紅endprint