陳紅君 曹 雷 費金有
(1.長春師范大學物理學院,吉林 長春 130031;2.長春師范大學紀檢科,吉林 長春 130031)
教育評價是教育的重要組成部分,通過評估可以使我們發(fā)現(xiàn)教育中的不足處,為教育的決策提供高質量的信息資源.教育評價進行得如何在一定程度上直接影響著教育的質量,影響著國家對人才的培養(yǎng),值得我們予以重視.美國國家進步評價(NAEP)以其高質量的測試工具、管理形式和評分方式形成了一套較為高效的評價體系,被認為是教育成績調查的黃金標準.
教育測試框架是對評價的目的、測量的具體內容和方法的表述和界定.類似于我國的命題雙向細目表.雙向細目表更關注的是學生對知識的掌握程度,而NAEP的科學測試框架更關注學生的認知程度和科學探究水平.[1]
在20世紀70年代,人們對于教育的改革已經(jīng)失去了興趣.1981年,時任美國總統(tǒng)的里根希望解散美國教育部,并且希望聯(lián)邦政府不要把NAEP用于各州和地方學區(qū)進行改革.另一方面,一系列的報告揭示了美國教育狀況的衰退.人們又開始關注教育的改革,把注意力再一次集中到了學生的學業(yè)成績方面.
1984年,在NAEP評估委員會的幫助下,各州和各地區(qū)把他們自己的學生評估和全國性評估進行了比較,一致認為跨州比較的計劃更合理.1986年位于南部的3個州開始對他們的學生進行為期3年的測試,主要針對學生的閱讀和寫作成績評估,1988年,修改后的NAEP實行方案出臺,并且批準NAEP進行試行性的州評估,此舉措得到了各州和地區(qū)的廣泛支持.最終,也促成了NAEP的政策制定機構——美國國家評估管理委員會(National Assessment Governing Board,簡稱NAGB)產生.
直到20世紀90年代末,美國社會對于NAEP的評估效用還存在懷疑的態(tài)度.1990年,NAEP對4年級學生的數(shù)學和閱讀及8年級學生的數(shù)學進行了以州為單位的評估,接著在1993年和1994年決定把對數(shù)學和閱讀的州評估擴展到4年級、8年級和12年級.1996年8月,NAGB發(fā)表聲明指出了NAEP評估政策的不足,如評估的科目太少,評估時間間隔太長等等.還提出了進一步的改革方案,并要求各州和地區(qū)把他們的評估和NAEP緊密聯(lián)系起來.該聲明的發(fā)表對NAEP的最終確立起到了奠定的作用.2001年出臺的“美國中小學教育法案”(《不讓一個孩子落伍》)使得NAEP完全確立.
NAEP科學評價是按照《美國國家科學課程標準》中的理念以及當前的課程目標和重點進行構建,抽取其中核心和關鍵的能力來考察,以此來了解不同年級學生對不同學科的深入理解情況,為新課程的修訂提供有意義的指導.NAEP全國評價和州評價至少每隔兩年對4、8年級的閱讀和數(shù)學進行測試,并且于同一年進行,NAEP全國評價必須(州評價也可以)定期對12年級的閱讀和數(shù)學進行評估.在條件允許的情況下還可以定期的對4、8、12年級的寫作、科學、歷史、地理、公民學、經(jīng)濟學、外語、藝術進行長期趨勢評價.
NAEP成立的目標是在宏觀層面上對學業(yè)成就進行監(jiān)測,而不是單純的指導教師如何進行教學.NAEP向公眾、政策制定者和教育者提供學生在各個學科方面能力的描述性信息,向美國公眾報告學生的教育狀況,反映出美國公民教育中存在的問題,并對問題進行分析和解決.
NAEP主要評估的是學校課程和思考的技能.其評估領域涵蓋閱讀、數(shù)學、科學、寫作、美國歷史、公民以及地理,最主要評估的是閱讀、數(shù)學和科學.測評對象是來自全美的4、8、12年級的學生.
NAEP全國評估:該評估主要由兩部分組成,第1部分是特定的學科的測試問題,其主要題型有問答、多項選擇和自由回答.每次評估只要求學生回答一個科目的問題.其結果以兩種方式進行報告,一種是等級分數(shù),閱讀、數(shù)學、歷史、地理為0-500,科學、寫作、公民學為0-300.另一種是成績水平,分基本、熟練和高級3類.第2部分是背景問題,涉及學生的性別、年齡、種族、社會經(jīng)濟狀況、父母受教育狀況等,不涉及學生的家庭信仰和價值取向問題.此外,對教師和學校管理者的問卷調查、學校記錄卡以及其他一些可靠的資料也是背景資料的重要來源.評估完成后,最終的結果以學生的性別、種族、學校類型、所在地區(qū)、背景信息變量等類別進行報告.
NAEP州評估:NAEP州評估提供所在州的學生的學業(yè)成績狀況信息.根據(jù)人口統(tǒng)計學和地理組成,從參加評估的州內選取100所學校的4年級、8年級和12年級的學生作為評估樣本,再從這些樣本中選出25-30名學生參加每個科目的評估.在最終測試結果報告方面,NAEP州評估與NAEP全國評估相同,不報告參與評估的個別學生或個別學校的信息,而是以人口群體(如4年級、8年級學生)和子群體(如男生、女生、亞裔學生、非裔學生等)來報告學生的學業(yè)成績、教育體驗、學校環(huán)境等方面的信息.
NAEP試驗性地區(qū)評估:2001年美國頒布了《不讓一個孩子落伍》的法案,美國聯(lián)邦政府也開始對城市地區(qū)教育進行驗收性的評估.其中使用的測試手段、測試方法、測試時間等方面與NAEP全國評估、州評估相同.2002年,亞特蘭大市、芝加哥299學區(qū)、休斯敦獨立學區(qū)、洛杉礬、紐約市公立學校以及哥倫比亞特區(qū)對閱讀和寫作進行了第1次評估.2003年,亞特蘭大、休斯敦、波士頓、夏洛特、芝加哥、克利夫蘭、洛杉礬、紐約市、圣地亞哥和哥倫比亞特區(qū)等10個地區(qū)將開展閱讀和數(shù)學方面的試驗性NAEP評估.
科學考試的特點:首先低利害性,監(jiān)測的基本性質是改變考試的高利害性,又稱為高風險性.認為NAEP具有低利害性主要的依據(jù)是其評價的結果是以整體為單位的形式向全民報告國家的教育狀況,這樣能夠使學校和學生的信息受到保護,也會消除學校、教師和學生對評價結果的暗示,避免不必要的惡性事件發(fā)生.其次開放性,NAEP公開的報告制度可以讓不同利益的相關者從不同的側面獲取數(shù)據(jù).NAEP還會將歷年考試的試題和評價框架中的1/4-1/3公開,其余一些未公開的試題主要是用于今后的NAEP測試.用這樣的方式來判斷學生的學業(yè)成就是否進步.NAEP力求在保密性與公開性之間取得平衡.最后公平性,公平性問題一直是評價最敏感的領域.NAEP報告制度在區(qū)分學生和學校間不同社會情景(如社區(qū)的規(guī)模,家庭社會的地位,公私立學校等)的前提下,通過同年各州或地區(qū)的橫向比較,反映不同地區(qū)學生學業(yè)成績的水平.通過跨年度的縱向比較,可以分析出教育質量是否發(fā)生變化.
NAEP不僅是公布成績,更是考察學生在不同領域中的學業(yè)成就.通過公平性的比較,不僅能夠證明各個群體學生成績得到了提高,而且處境不利的學生與其他學生之間的成績差距也縮小了.
NAEP科學考試的影響:NAEP是一項長期對中小學生學業(yè)成績測量的體系.NAEP針對4年級和8年級學生的成績進行測量,填補了對此發(fā)展階段的兒童的學習狀況在測量上的空白.NAEP因其完善、準確的測量數(shù)據(jù)及評估結果,還經(jīng)常被用于相關的研究,如有關家庭的變化、社區(qū)和學校對學生成績影響的研究,有關資源的差異、系統(tǒng)化的改革措施、不同的學習機會及教育政策對學生成績的影響研究等,對美國的教育產生了深刻的影響.
中考是我國對于學生學業(yè)教育評價最主要的依據(jù)之一,也是我國教育中的一種比較典型的評價模式.現(xiàn)在就NAEP和我國中考在物理測試方面做出如下比較,希望為我國今后的教育評價的改革提供線索.
測試目標:中考的物理測試題是以《義務教育物理課程標準》為基礎指導.中考物理一方面是對初中所學知識的一個檢驗,對義務教育階段新課程的改革起到了引領和導向的作用,尤其是在課堂教學方面.另一方面是高中階段學校的錄取選拔的主要依據(jù).NAEP中物理測試是科學課程測試中的一個分支,其測試目標則是考察學生們在識別科學原理、應用科學原理、實施科學實驗和進行科學實驗4個方面能力.并且向廣大的美國公民匯報學生的最近學習情況.針對測評的結果中出現(xiàn)的問題提出合理的解決方案.
測試大綱:(本文以NAEP2009年測試為例)一方面NAEP2009年課程的評價內容是基于兩個重要文獻《國家科學教育標準》和《科學素養(yǎng)標準》,由開發(fā)該評估體系的籌劃指導委員會跟蹤監(jiān)督.文獻中的內容得到優(yōu)先選擇權.另一方面NAEP試題的編制基于對學生的“表現(xiàn)期望”并且以此為中心進行的.根據(jù)開發(fā)出的學生表現(xiàn)編制測評試題,由測試題引發(fā)學生相應的反應,根據(jù)學生的反應判斷學生知道什么和能做什么,具體流程如圖1所示.
中考物理試題編寫是以《義務教育物理課程標準》為編寫的主要依據(jù),落實基礎,貼近生活,注重探究,考查全面是基本準則.不同的省份再根據(jù)各省中考物理考試大綱編寫試卷.
測試結構和測試內容:由于國內中考在嚴格遵循義務教育課程標準要求的前提下,各個省市可以自主命題,因此不同省市每年的中考物理考試大綱和中考物理試卷都是不相同的.通過近幾年的中考試卷與NAEP試題的對比分析可以看出,NAEP測試卷的題型和我國中考的題型差距還是比較大的.NAEP和中考由于測試目標的不同,所以NAEP測試中書面評估的主要題型是多項選擇題、簡答題、問答題及其他非文字回答,中考的題型主要是單項選擇、簡答、填空、開放性的題目和計算題.NAEP開放性試題的比重大,而我國中考能體現(xiàn)學生基礎題型的比重大.
圖1
選擇題型主要根據(jù)是要求學生掌握的知識及評估實施時的設計情況,多項選擇題相對于單項選擇難度較大,需要較高層次的推理.我國采用單項選擇的題型也正是為了考察學生的基礎,采取填空和計算的出題方式則是為了適當?shù)脑黾涌碱}難度,為高中的選拔提供依據(jù),而NAEP的測試中主要開放性試題則是為了考查學生的思考問題的方式和技能.總之,合理設計題型是保障評估質量的重要因素之一.
從試卷所涉及的內容中可以看出,我國和NAEP對于物理測試題的分類是不同的.我國中考所考的物理知識是力、熱、聲、光、電5個方面,試題編寫完全遵循了我國的物理考試大綱和學生所學的內容,其中力學部分和電學部分所占的比例最多,這樣的試題編制為學生學習高中物理奠定了基礎.NAEP2009的考試內容則是從物質及其轉化、能量及其轉化、運動3個方面來測試,測試更多關注的是學生對于知識的應用和思維方式.
總體來說NAEP科學考試相對來說已經(jīng)是比較全面和明確的,既能更全面地評價學生的科學素養(yǎng),又能適應現(xiàn)代社會的發(fā)展趨勢.通過以上的比較,NAEP科學考試評價框架對于我國教育體制的改革提供了很多借鑒之處,但是由于兩國文化背景的不同,所以在進行改革時,不應該照搬照抄,應注意以下幾個方面.
(1)重視學生對于學習的認知發(fā)展,構建清晰的評價內容體系.
NAEP評價框架在構建的過程中,特別注重學生的認知發(fā)展水平.它清楚地了解了某一個年級的學生所學的是什么,根據(jù)所學的內容,制定合理的評價體系,從評價體系中檢測出學生的思維方式和思維過程.雖然我國中考也有類似的體系,比如《義務教育物理課程標準》,但是所出的測試卷靈活性差,學生已經(jīng)形成了定式思維,不能很好地反映出學生思維的靈活度.
(2)重視學生的學業(yè)能力,構建學業(yè)成就評價的原理與模式.
目前,我國教育評價的弊端主要反映在強調甄別和選拔的功能上,忽視了改進和激勵的功能,過分注重學生的學習成績,忽視了學生的全面發(fā)展.只關注了結果,往往忽視了學生努力的過程.為了轉變因考試造成的惡性循環(huán),應該充分研究和開發(fā)學生的能力,促進學生的學業(yè)提高.
(3)重視學生的不同價值,構建衡量學生不同價值的標準體系.
在我國人口眾多、分布又廣,導致了學生的學習環(huán)境、水平及能力差異明顯,教育條件差距大,所以我們不能用“同一把尺子”去衡量所有的學生.我們應該用不同的方法去評價,減少“一把尺子”帶來的負面影響,多一種價值的判斷就會多一批有用的人才.
總之,NAEP科學教育評價的發(fā)展趨勢,不僅對我國的教育評價有所啟示,更啟示我們要縮減教育中“理想課程”和“實際課程”的差距.
1 梁潤嬋.TIMSS、PISA、NAEP科學測試框架與測試題目的比較研究[D].桂林:廣西師范大學,2009.
2 WestEd.Council of Chief State School Officers.&National Assessment Governing Board.Science Framework for the 2009 National Assessment of Educational Progress(Prepublication Edition).9,11,12.
3 陳晨.美國全國教育進展評價體系(NAEP)的運行機制研究[D].徐州:徐州師范大學,2011.
4 雷新勇.大規(guī)模教育考試:命題與評價[M].上海:華東師范大學出版社,2006:13-16.
5 Linn R L.教學中的測驗與評價[M].北京:中國輕工業(yè)出版社,2003:25.
6 周紅.美國國家教育進展評估NAEP體系的產生和與展望[J].外國教育研究,2005(2).
7 李景梅.TIMSS、PISA、NAEP測評中物理試題設計的研究[D].重慶:重慶師范大學,2012.
8 黃慧娟,王晞,許明.關于3項著名國際學生評價項目的比較[J].福建師范大學學報,2004(4).