鄭 剛
2003年秋季,作為國家級課改實驗區(qū)的天津市大港區(qū)在六年級(本區(qū)初中的起始年級)正式啟動了新課程改革的實驗,拉開了天津市初中新課程改革的序幕。2005年秋季,全市進入初中課程改革。2008年,天津市組織了首屆初中畢業(yè)生的學(xué)業(yè)考試與考查,較前幾年相比,呈現(xiàn)出考試內(nèi)容多元、考試形式多樣等特點。為了進一步推進新課程改革,實施素質(zhì)教育,充分發(fā)揮學(xué)業(yè)考試的正面導(dǎo)向作用,筆者認為有必要對命題工作進行梳理和反思。
一、學(xué)業(yè)考試的基本情況
學(xué)業(yè)考試是義務(wù)教育階段的終結(jié)性考試,學(xué)業(yè)考試成績既是衡量學(xué)生是否達到畢業(yè)標準的主要依據(jù),也是高中階段學(xué)校招生的重要依據(jù)之一。按照天津市教委每年印發(fā)的關(guān)于天津市初中畢業(yè)生學(xué)業(yè)考試說明以及考試方案的要求,近兩年天津市的學(xué)業(yè)考試呈現(xiàn)了以下特點。
1.考試內(nèi)容多元。學(xué)業(yè)考試科目為語文(含作文)、數(shù)學(xué)、外語(含聽力)、物理、化學(xué)五科,考查科目為思想品德、歷史、地理、生物,以及理化生實驗,區(qū)縣級考查為綜合實踐活動(信息技術(shù)、研究性學(xué)習(xí)、勞動與技術(shù)教育)、音樂、美術(shù)。其中,體育與健康學(xué)科在2008年為區(qū)縣級考查科目,2009年為市級考試科目。
2.考試形式多樣。一是既有紙筆測試,又有實驗考查。二是在紙筆測驗中,思想品德、歷史學(xué)科實行開卷考試。允許學(xué)生自帶一些參考資料進入考場,以考查學(xué)生收集、選擇、運用資料的能力。三是各學(xué)科考試題目中都有數(shù)量不等的開放性題目,鼓勵學(xué)生自由想象,培養(yǎng)學(xué)生的創(chuàng)新精神。
3.考試結(jié)果多樣。近兩年學(xué)業(yè)考試中考試科目的成績以原始分數(shù)呈現(xiàn),考查科目的結(jié)果以等級形式呈現(xiàn)。事實上,等級制與百分制或與其他形式的分數(shù)并沒有本質(zhì)的區(qū)別。但是,在實現(xiàn)新課程改革目標方面,等級制能發(fā)揮較好的導(dǎo)向作用。學(xué)業(yè)考試采用等級制,可使高利害點明顯減少(高利害點只是那些被用來劃分不同等級的有限的幾個分值)。而且,等級制有意模糊同一等級內(nèi)部的差異,這為高中校在錄取時參考其他測評指標、綜合考查學(xué)生的能力和水平提供了空間,為高中招生的多樣化創(chuàng)造了條件。
二、依據(jù)課標,科學(xué)命題,實現(xiàn)了三維考核目標的統(tǒng)一
1.緊扣學(xué)科課程標準。在命題過程中,注重“三維目標”的和諧統(tǒng)一。在知識與技能方面,重點考查學(xué)科知識結(jié)構(gòu)中的核心內(nèi)容和基本技能;在過程與方法方面,重點考查學(xué)生運用所學(xué)知識與技能分析和解決實際問題的能力,以及探究新知識的能力;在情感態(tài)度與價值觀方面,雖未采用直接設(shè)題賦分的方式進行考查,但將有關(guān)內(nèi)容滲透在前兩個方面的考查中,并從試題材料的選取和評分標準的角度加以考查。
2.加強與社會實際的聯(lián)系。在命題過程中,凸顯科學(xué)精神和人文精神。主要表現(xiàn)在選材的時代性,材料選擇或題目選項緊貼社會的焦點及熱點問題。題目設(shè)置新穎,形式多樣,開放性較強。
例1:(化學(xué))我國水資源位居世界第六位,但人均水量為世界第八十幾位,而天津市在我國人均水量位居三十多位,屬于極度缺水地區(qū)。所以,我們要節(jié)約用水。
(1)“中水”是指生活污水經(jīng)處理達到規(guī)定水質(zhì)標準的,可在一定范圍內(nèi)再次使用的非飲用水?,F(xiàn)要將一種含有碎菜葉、泥沙等不溶物和有臭味的生活污水凈化處理成“中水”,根據(jù)你了解的知識,請回答:
①欲除去此污水中的碎菜葉、泥沙等不溶物,可采取_______方法;
②要除去此污水的臭味,下列物質(zhì)中可使用的是________;
A.活性炭B.小卵石
C.棉花
(2)為保護有限的水資源,你對節(jié)約用水有何建議?(提一條建議即可)
3. 加強與學(xué)生生活實際的聯(lián)系。讓學(xué)生深切地感受到學(xué)習(xí)與生活是密切相關(guān)的,只有學(xué)好知識,才能學(xué)以致用。
例2:(物理)以下是某同學(xué)估測的一些數(shù)據(jù),其中符合實際的是
A.夏天大港地區(qū)的最高氣溫可能超過30 ℃
B.一名中學(xué)生的質(zhì)量可能是50 kg
C.教室內(nèi)天花板離地面的高度約為10 dm
D.人的正常步行速度約為80km/h
4.注重考查學(xué)生的應(yīng)用能力。考查學(xué)生在具體情景中綜合運用所學(xué)知識分析和解決實際問題的能力。
例3:(數(shù)學(xué))如圖,小明想知道池塘兩端A、B間的距離,但無法直接測量。學(xué)習(xí)數(shù)學(xué)有關(guān)知識后,他想出一個主意:在地上選取一個可以直接到達A、B兩點的點O,然后連接OA、OB,且在OA、OB上分別取它們的中點C、D,再連接CD,并測得CD = 20 m,由此可得到A、B間的距離是
(A) 10 m(B) 20 m
(C) 40 m(D) 60 m
5.試題形式多樣,圖文并茂。通過一些小圖片的形式,讓試卷的呈現(xiàn)更加生動、活潑,并輔助和加強學(xué)生對題目的理解。
例4:(地理)下列物品中具有天津地方文化特色的是
三、科學(xué)評價,積極反饋,發(fā)揮學(xué)業(yè)考試的服務(wù)功能
試卷的質(zhì)量由各指標來綜合評價,決定試卷質(zhì)量的指標較多,且諸指標間相關(guān)程度很高,一般衡量試卷質(zhì)量的指標主要有難度、信度、區(qū)分度和效度,需要在命題中牢牢把握。
1.難度適中,題量適宜。
難度是指試卷或試題的難易程度,它是試卷題目對學(xué)生知識和能力水平的適合程度的指標。一份難度適中、題量適宜的學(xué)業(yè)考試試卷,是衡量學(xué)生是否達到畢業(yè)標準的主要依據(jù)。
問卷調(diào)查顯示各學(xué)科的題量比較合適。若題量再增加的話,會給考生造成一定的心理壓力,不利于考查學(xué)生運用知識分析問題、解決問題的能力,尤其是創(chuàng)造性思維能力。因此,隨著試卷結(jié)構(gòu)和題型的調(diào)整,應(yīng)盡量使試卷題量適度。
2.具有一定的區(qū)分度。
所謂區(qū)分度是指測驗題目對學(xué)業(yè)水平不同的考生的區(qū)分程度或鑒別能力。如果一道題,學(xué)業(yè)水平、實際能力都較高的考生都答對,學(xué)業(yè)水平、實際能力都較低的考生都答錯,則可認為該題目有好的區(qū)分度。只有很好地把握區(qū)分度,才能充分發(fā)揮學(xué)業(yè)考試在高中學(xué)校招生中的選拔功能,成為高中階段學(xué)校招生的重要依據(jù)之一。
3.試卷信度可靠。
信度是指考試的可靠性,即考試結(jié)果的可信程度。信度高的試題很少受到外部因素的影響,對任何學(xué)生的多次測定都會產(chǎn)生比較穩(wěn)定的、前后一致的結(jié)果。一般而言,檢驗試卷信度的指標有:重測信度、復(fù)本信度、分半信度以及評分者信度等。
在編制學(xué)業(yè)考試試卷時,需關(guān)注評分者信度問題,以提高評分的可靠性、穩(wěn)定性和一致性。一是確定答題要點。主觀題答案的標準化,可以使評分者依據(jù)所提供的標準進行評分,減少評分者主觀因素以及外界不穩(wěn)定因素的影響。二是多個評分者評分。多個評分者評分可以平衡彼此之間的主觀因素的影響。
4.效度較高。
效度,是指測量的有效性,即測試結(jié)果與測試目標的符合程度。試卷效度通常從內(nèi)容效度和結(jié)構(gòu)效度兩方面進行分析。
為提高試卷的效度,應(yīng)采取三方面的措施:一是根據(jù)課程標準進行命題,且各單元試題分數(shù)分配與學(xué)時數(shù)分配基本保持一致,成正比關(guān)系,這是保證考試效度的基礎(chǔ);二是在命題的同時,制訂試題參考答案與評分標準;三是在閱卷過程中,采取集體閱卷且實行流水作業(yè)。此外,由于學(xué)業(yè)考試兼有評價學(xué)生學(xué)業(yè)成績和選拔的雙重功能,所以,對學(xué)業(yè)考試試卷還可以進行效標關(guān)聯(lián)效度檢驗。所謂效標關(guān)聯(lián)效度,就是指學(xué)業(yè)考試成績與學(xué)生在高中的學(xué)習(xí)成績的相關(guān)程度。如果學(xué)業(yè)考試成績好的考生,在高中的學(xué)習(xí)成效也很高,就說明學(xué)業(yè)考試試卷是一份好的試卷。
四、對學(xué)業(yè)考試命題的思考
為進一步深入研究和實施初中畢業(yè)生學(xué)業(yè)考試命題工作,筆者認為有必要在理論上正確認識,在實踐上妥善處理以下幾個重要關(guān)系。
1.課程目標、教學(xué)活動與考試評價的關(guān)系。要實施課程整合評價,因為考試評價具有很強的導(dǎo)向性功能,如果避開考試評價來進行課程、教學(xué)設(shè)計,就有可能導(dǎo)致教學(xué)與考試評價關(guān)系異化,課程內(nèi)容窄化,以及考試評價的教育功能弱化。
2.定量評價與定性評價的關(guān)系。定量評價往往忽略難以量化的品質(zhì)與行為,忽視個性發(fā)展與多元標準。定性評價更能體現(xiàn)現(xiàn)代人本思想和發(fā)展性評價理念。應(yīng)在傳統(tǒng)定量評價的基礎(chǔ)上逐步增加定性評價,從表征性的分數(shù)機制向?qū)嵸|(zhì)性的內(nèi)容機制轉(zhuǎn)變。
3.靜態(tài)評價與動態(tài)評價的關(guān)系。動態(tài)評價有兩層含義,一是跨越每個時間觀察、評價學(xué)生,從而了解學(xué)生的動態(tài)認知歷程與認知能力變化的特點和潛能;二是評價者與被評價者的互動,強調(diào)評價與教學(xué)相結(jié)合,實施個體化的診斷、評價與教學(xué)補救。
4.結(jié)果評價與過程評價的關(guān)系。過程評價是針對課程實施過程或?qū)W生學(xué)習(xí)過程所進行的評價,經(jīng)常采用形成性測驗評價和診斷性測驗評價方法。
5.客觀測驗評價與主觀測驗評價的關(guān)系??陀^測驗往往局限于對學(xué)科簡單知識和原理的考查,面對表達能力、組織能力、創(chuàng)造能力等高級心智技能及心理過程則難以考查。而這些不足正是主觀測驗的優(yōu)點。
6.紙筆測驗評價與表現(xiàn)性測驗評價的關(guān)系。紙筆測驗多局限于認知領(lǐng)域的教學(xué)目標,不能關(guān)注情感、態(tài)度、動作技能、心理素質(zhì)與學(xué)生的實際動手能力和創(chuàng)新能力,而表現(xiàn)性測驗評價側(cè)重于把知識與技能應(yīng)用于實際,強調(diào)實做與表現(xiàn)。二者相輔相成,相得益彰。
學(xué)業(yè)考試是一項復(fù)雜的社會系統(tǒng)工程,關(guān)系到千家萬戶,是政策性、實踐性很強的一件大事。命題工作更要逐步適應(yīng)時代的變革、教育的發(fā)展,只有這樣才能發(fā)揮學(xué)業(yè)考試的巨大功能。我們只要用科學(xué)態(tài)度去研究、探索和實踐,相信學(xué)業(yè)考試命題改革之路會逐漸清晰地展現(xiàn)在我們面前。
(責任編輯韓大勇)