2005年,教育部頒布《關(guān)于基礎(chǔ)教育課程改革實(shí)驗(yàn)區(qū)初中畢業(yè)考試與普通高中招生制度改革的指導(dǎo)意見(jiàn)》,該指導(dǎo)意見(jiàn)明確指出:“學(xué)業(yè)考試的成績(jī)應(yīng)根據(jù)各學(xué)科課程標(biāo)準(zhǔn)的基本要求確定合格標(biāo)準(zhǔn),提供普通高中錄取用的學(xué)業(yè)成績(jī)應(yīng)以等級(jí)的形式呈現(xiàn),等級(jí)數(shù)和等級(jí)標(biāo)準(zhǔn)應(yīng)由各地根據(jù)考試結(jié)果,并結(jié)合當(dāng)?shù)貎?yōu)質(zhì)高中資源的實(shí)際情況確定?!?/p>
采取等級(jí)制,是按照一種新的標(biāo)準(zhǔn)評(píng)價(jià)學(xué)生,為高中多樣化錄取創(chuàng)造了條件。本文試從教育測(cè)量與評(píng)價(jià)學(xué)的角度對(duì)等級(jí)制度進(jìn)行一些新視角的理論探討。[1]
一、中考改革全面鋪開(kāi),成績(jī)等級(jí)制成趨勢(shì)
2005年,中考改革實(shí)驗(yàn)區(qū)已從去年的17個(gè)實(shí)驗(yàn)區(qū)拓展到500多個(gè),各地紛紛根據(jù)自身的具體情況加大中考和中招的改革力度。其中,中考學(xué)業(yè)成績(jī)采用等級(jí)制成為本次改革的一大亮點(diǎn)。
等級(jí)制的劃分存在兩個(gè)側(cè)重點(diǎn),一種是根據(jù)學(xué)生成績(jī),通過(guò)測(cè)量結(jié)果轉(zhuǎn)換法來(lái)確定不同的等級(jí),稱之為等距離區(qū)間劃分,例如海南省的劃分方案;另一種是根據(jù)當(dāng)?shù)貎?yōu)質(zhì)高中資源的分布確定等級(jí)數(shù)及劃分的標(biāo)準(zhǔn),稱之為資源劃分,例如遼寧、江西等省的劃分方案。下面簡(jiǎn)要介紹幾個(gè)課程改革實(shí)驗(yàn)區(qū)2005年中考采用等級(jí)制呈現(xiàn)考試成績(jī)的具體方案:
海南?。玻埃埃的暾n程改革實(shí)驗(yàn)區(qū)的學(xué)業(yè)考試的成績(jī)按百分制閱卷,等級(jí)制呈現(xiàn)。等級(jí)呈現(xiàn)特點(diǎn)是“等級(jí)+星”,等級(jí)設(shè)置為:A、B、C、D、E、F、G共7等,90—100分為A等,80—89分為B等、70—79分為C等,60—69分為D等,50—59分為E等,1—49分為F等,0分為G等。每科考試按120%分超量給題,對(duì)每科超過(guò)100分的給予星級(jí)記錄,101—105分加一顆星、5分一檔,以此類推,每科最多加四顆星。
江西?。玻埃埃的昊A(chǔ)教育課改實(shí)驗(yàn)區(qū)各科試卷仍舊是以分?jǐn)?shù)命制,但考試成績(jī)將以全新的等級(jí)制方式呈現(xiàn),即設(shè)A、B、C、D、E五個(gè)等級(jí)。各地根據(jù)當(dāng)?shù)馗咧薪逃Y源的情況和報(bào)考人數(shù)來(lái)劃定每個(gè)等級(jí)所占的比例,然后再將卷面分?jǐn)?shù)轉(zhuǎn)換為相應(yīng)等級(jí),卷面分?jǐn)?shù)則不再與考生“見(jiàn)面”。
遼寧省沈陽(yáng)市規(guī)定,2005年中招學(xué)業(yè)考試的成績(jī)主要是以A、B、C、D、E五級(jí)方式表現(xiàn),分別代表優(yōu)、良、中、及格、不及格,各等級(jí)比例由各市確定,但E級(jí)比例應(yīng)當(dāng)控制在5%以內(nèi)。[1]
上海市2005年中招《思想政治》(開(kāi)卷)時(shí)間為70分鐘,卷面總分為100分,考試成績(jī)呈現(xiàn)分優(yōu)秀、良好、及格、不及格四個(gè)等級(jí)。分?jǐn)?shù)不計(jì)入總分,但不及格者將不能被市實(shí)驗(yàn)性示范性高中和區(qū)縣重點(diǎn)中學(xué)錄取。
隨著基礎(chǔ)教育課程改革的不斷深化,將有越來(lái)越多的省、直轄市、自治區(qū)采取“等級(jí)制”的中考評(píng)價(jià)方式。中考學(xué)業(yè)成績(jī)采用等級(jí)制的評(píng)價(jià)方式逐漸成為趨勢(shì)。
二、成績(jī)等級(jí)制的概念及其應(yīng)用情況分析
等級(jí)制是以等級(jí)方式呈現(xiàn)學(xué)生的學(xué)業(yè)成績(jī)與表現(xiàn),具體可以分為絕對(duì)評(píng)價(jià)等級(jí)制和相對(duì)評(píng)價(jià)等級(jí)制。前者按照既定的學(xué)業(yè)標(biāo)準(zhǔn)把學(xué)生的學(xué)業(yè)成績(jī)與表現(xiàn)劃定為若干等級(jí),包括教師綜合評(píng)價(jià)法、測(cè)量結(jié)果轉(zhuǎn)換法、核心內(nèi)容參照法。而后者則是按照一定的方案來(lái)劃定每個(gè)等級(jí)所占的比例,從而體現(xiàn)每個(gè)學(xué)生的卷面成績(jī)?cè)谕惪忌鷪F(tuán)體中所處的相對(duì)位置。根據(jù)比例劃分方案或等級(jí)數(shù)的不同,可將相對(duì)評(píng)價(jià)等級(jí)制分為五分等級(jí)制、十分等級(jí)制等。[2]
以海南?。玻埃埃的晁玫燃?jí)制劃分為例,他們采用的方法是“測(cè)量結(jié)果轉(zhuǎn)換法”,屬于絕對(duì)評(píng)價(jià)等級(jí)制。這種方法通常是在舉行正式測(cè)驗(yàn)或考試之后,把測(cè)量得到的分?jǐn)?shù)按照事先規(guī)定的分?jǐn)?shù)段標(biāo)準(zhǔn)轉(zhuǎn)換成等級(jí)分?jǐn)?shù),而具體的等級(jí)數(shù),可依據(jù)實(shí)際情況確定,最常見(jiàn)的是五級(jí)記分制,其劃分規(guī)定如下表:
有些則采用七級(jí)記分制,7分為最優(yōu),4分為及格,3分以下不及格。另外還有十級(jí)記分制,通常在百分制的每10分為一個(gè)分?jǐn)?shù)段下面進(jìn)行轉(zhuǎn)換,即90—100分對(duì)應(yīng)十級(jí)記分制下的10分,80—89分對(duì)應(yīng)十級(jí)記分制下的9分,依次類推,10分最高表示優(yōu)異(特優(yōu))、9分為優(yōu)秀、8分為良好、7分為中等、6分為及格、5分及以下為不及格。[3]當(dāng)然,根據(jù)需要也有其它的轉(zhuǎn)換法,如上所提及的海南省所采用的“等級(jí)+星”的方式。
而江西省與遼寧省采用的五分等級(jí)制,雖然與絕對(duì)評(píng)價(jià)等級(jí)制中五級(jí)記分制的等級(jí)數(shù)相同,但它卻屬于相對(duì)評(píng)價(jià)。其具體的評(píng)定方法是把學(xué)生的成績(jī)(通過(guò)考試或教師綜合評(píng)估后得到的成績(jī))從高分到低分排列,然后根據(jù)考生總數(shù)按照一定比例賦予考生相應(yīng)的等級(jí)。這個(gè)比例可以視實(shí)際情況而定。其中,江西省是根據(jù)各市高中教育資源的情況和報(bào)考人數(shù)來(lái)劃定。而遼寧省除此之外還規(guī)定,E級(jí)(不及格)的比例應(yīng)控制在5%以內(nèi)。
三、從信度角度重新認(rèn)識(shí)等級(jí)劃分的科學(xué)性
采用等級(jí)制度,避開(kāi)了“分分計(jì)較”的百分制,淡化了考試分?jǐn)?shù)在同一分?jǐn)?shù)段中的細(xì)小差異,而這時(shí)爭(zhēng)議就轉(zhuǎn)到等級(jí)劃分的科學(xué)性上來(lái)。2005年的中考,海南省采用“等級(jí)+星”的分?jǐn)?shù)制度,其分?jǐn)?shù)段的劃分是否合理?“50到100分,每10分為一個(gè)檔,”這樣的劃分,合理性如何?為何“超過(guò)100分,每5分為一檔”?江西省和遼寧省采用的五分等級(jí)制,其比例分配是否科學(xué)?筆者擬從考試信度這個(gè)角度,對(duì)等級(jí)制度的科學(xué)性進(jìn)行新的探討。
1.考試信度的含義
考試信度,簡(jiǎn)單地說(shuō)是考試結(jié)果的可信程度,是推測(cè)考試可信與否最重要的量化指標(biāo)。由于任何考試結(jié)果都因考試誤差的客觀存在而受到或多或少的影響,這種誤差到底有多大,可用考試信度來(lái)刻劃。
考試信度越高,說(shuō)明考試分?jǐn)?shù)的誤差越小,考試成績(jī)?cè)侥艽韺W(xué)生個(gè)人的真實(shí)水平。
譬如,信度為0.8的考試就意味著,學(xué)生群體的成績(jī)波動(dòng)(方差)有80%由真實(shí)水平的差異性(方差)引起,另外20%則由各種誤差引起。一般認(rèn)為標(biāo)準(zhǔn)化考試的信度系數(shù)應(yīng)該在0.90以上,例如,托??荚嚨目荚囆哦仍冢埃梗狄陨希龋樱耍ㄖ袊?guó)漢語(yǔ)水平考試)考試的考試信度一般在0.98左右。
2.等級(jí)劃分中的考試信度研究
由于考試的信度總小于1,即其可靠性不能達(dá)到100%,也就是說(shuō),考試分?jǐn)?shù)誤差是客觀存在的,任何一個(gè)學(xué)生的卷面分?jǐn)?shù)X都包含真分?jǐn)?shù)T和誤差分?jǐn)?shù)E。[4]因此,在中招過(guò)程中,以一兩分之差論高低,是不科學(xué)的。這正是人們反對(duì)百分制“分分計(jì)較”的主要原因,同樣,由于這些誤差的存在,使考試信度成為分?jǐn)?shù)段劃分科學(xué)與否的理論依據(jù)。
在教育測(cè)量與評(píng)價(jià)中,學(xué)生的真實(shí)水平若用T來(lái)表示,X為學(xué)生的卷面成績(jī),SE為考試標(biāo)準(zhǔn)誤,則學(xué)生的真實(shí)水平T很可能落在區(qū)間[X-SE,X+SE]上。因此,當(dāng)分?jǐn)?shù)段劃分的區(qū)間選?。玻樱艜r(shí),該生的真實(shí)水平就能得到合理的體現(xiàn)。
其中Sx是考試標(biāo)準(zhǔn)差,Rx為考試信度,可以發(fā)現(xiàn)考試標(biāo)準(zhǔn)誤SE與信度之間存在著密切的關(guān)系。依照不同信度,不同的考試標(biāo)準(zhǔn)差,可得到以下考試標(biāo)準(zhǔn)誤SE表格:
從上表可以看出,當(dāng)標(biāo)準(zhǔn)差Sx相同時(shí),信度Rx越高,則考試的標(biāo)準(zhǔn)誤SE就越小,那么分?jǐn)?shù)段劃分的區(qū)間2SE也就相應(yīng)較小,反之亦然。
據(jù)統(tǒng)計(jì),中考的標(biāo)準(zhǔn)差一般在10到15之間,因此,當(dāng)考試信度Rx為0.9時(shí),可根據(jù)實(shí)際情況,選?。捣譃橐粋€(gè)分?jǐn)?shù)段較為合宜。若盲目地以10分為一檔,將81分與90分歸入同一個(gè)等級(jí),則在一定程度上打擊了高分者的積極性。反之,若考試信度Rx為0.75,則選?。阜忠陨蠟橐粋€(gè)分?jǐn)?shù)段較為合宜。
綜上所述,等級(jí)劃分的過(guò)程中要以考試信度為理論依據(jù),當(dāng)考試信度高時(shí),等級(jí)劃分就要細(xì)致,分?jǐn)?shù)段的取值要小。如此,才有利于修正考試誤差帶來(lái)的不公平性。在將分?jǐn)?shù)制轉(zhuǎn)化成等級(jí)制的過(guò)程中,考試信度應(yīng)當(dāng)作為重要的理論依據(jù)予以高度重視。只有增強(qiáng)對(duì)各個(gè)細(xì)節(jié)上的科學(xué)化認(rèn)識(shí),中考制度才能得到不斷的完善。
參考文獻(xiàn)
[1] 劉決生.聚焦中考等級(jí)制招生.中國(guó)教育報(bào),2005-09-21.
[2] 黃光揚(yáng).成績(jī)?cè)u(píng)定等級(jí)制的類型及其在國(guó)內(nèi)外義務(wù)教育階段中的應(yīng)用.教學(xué)與管理,1998(3).
[3] 黃光揚(yáng).教育統(tǒng)計(jì)與測(cè)量評(píng)價(jià)綜合教程.福州:福建科學(xué)技術(shù)出版社,2003.
[4] 沈小碚.考試評(píng)分體系的確立及其科學(xué)化認(rèn)識(shí).湖北招生考試,2002(6).
(責(zé)任編輯孫曉雯)