摘 要 測(cè)試公平性是語(yǔ)言測(cè)試研究主要議題之一。本文通過(guò)分析AUA中貫穿的測(cè)試公平性理念及其在英語(yǔ)高考新模式中的體現(xiàn),指出英語(yǔ)高考改革符合AUA框架對(duì)語(yǔ)言測(cè)試開(kāi)發(fā)和使用的要求,與AUA對(duì)測(cè)試公平性的追求是一致的,并基于AUA框架關(guān)于測(cè)試公平性的理念,嘗試對(duì)英語(yǔ)高考改革中的幾個(gè)關(guān)鍵問(wèn)題提出了解決辦法。
關(guān)鍵詞 AUA 框架 英語(yǔ)高考 新模式 語(yǔ)言測(cè)試公平性
2014年7月8日,《2017年高考改革方案》正式頒布,明確規(guī)定“英語(yǔ)文理同卷,實(shí)行社會(huì)化考試,一年兩考,按五級(jí)制評(píng)價(jià)”,“學(xué)生可多次報(bào)考,最終以最好成績(jī)?yōu)闇?zhǔn)”,即2017年以后,英語(yǔ)高考采用“一年兩考,取最高分,分等級(jí)計(jì)入的社會(huì)化考試”模式。那么,英語(yǔ)高考改革是否反應(yīng)了當(dāng)今世界先進(jìn)的語(yǔ)言測(cè)試?yán)砟睿渴欠耋w現(xiàn)了語(yǔ)言測(cè)試的公平性?為了回答這些問(wèn)題,本文從AUA框架的視角,分析了英語(yǔ)高考改革所體現(xiàn)的公平性,探尋其背后的理論支持與語(yǔ)言測(cè)試?yán)砟睿?duì)英語(yǔ)高考改革所涉及的幾個(gè)關(guān)鍵問(wèn)題進(jìn)行了思考和建議。
一、AUA框架與語(yǔ)言測(cè)試公平性
2003年,Bachman首次提出測(cè)試使用論證框架(Assessment Use Argument,簡(jiǎn)稱AUA)。[1]在隨后的幾年中,經(jīng)過(guò)90余次的修改,Bachman和Palmer于2010年在《語(yǔ)言評(píng)估實(shí)踐》一書(shū)中正式提出并詳細(xì)闡釋了AUA框架(見(jiàn)圖1)。[2]AUA框架是Bachman和Palmer對(duì)1996年在《語(yǔ)言測(cè)試實(shí)踐》中提出的“測(cè)試有用性”框架認(rèn)識(shí)的升華,[3]代表了當(dāng)今語(yǔ)言測(cè)試?yán)碚摪l(fā)展的前沿。
AUA規(guī)定了測(cè)試研發(fā)者和使用者必須承擔(dān)對(duì)受測(cè)試和決策影響的利益相關(guān)者的責(zé)任(見(jiàn)圖2),有力地保證了語(yǔ)言測(cè)試的公平性。測(cè)試研發(fā)者的主要責(zé)任是說(shuō)服決策制定者及其他利益相關(guān)者測(cè)試記錄是一致的,測(cè)試的解釋是有意義的、公平的、概括的、相關(guān)的和充足的。測(cè)試研發(fā)者還應(yīng)該了解測(cè)試使用和所作決策對(duì)其他利益相關(guān)者所產(chǎn)生的預(yù)期后果。決策制定者的主要責(zé)任是說(shuō)服其他利益相關(guān)者決策具有價(jià)值敏感性和均衡性以及測(cè)試使用和決策的后果具有善益性,同時(shí)還要意識(shí)到測(cè)試記錄和解釋中存在的不確定性因素。[2]AUA要求將公平性貫穿測(cè)試研發(fā)和使用的全過(guò)程,它所有的質(zhì)量屬性都體現(xiàn)了測(cè)試的公平性。
首先,后果的善益性要求基于測(cè)試使用以及所作決策的后果對(duì)于所有的利益相關(guān)者都是有益的,測(cè)試成績(jī)報(bào)告的表述必須清楚明白,所有的利益相關(guān)者都能看得懂,并做到及時(shí)和保密。
其次,決策的價(jià)值敏感性要求決策制定者在作出決策時(shí)應(yīng)考慮現(xiàn)存的教育與社會(huì)價(jià)值觀體系和法律法規(guī),認(rèn)真權(quán)衡對(duì)考生作出錯(cuò)誤分類(lèi)的嚴(yán)重后果,及格線的劃定要有利于最大限度地減少因錯(cuò)誤分類(lèi)而帶來(lái)的不利影響;決策的均衡性要求只能根據(jù)所劃定的及格線和制定的決策方案對(duì)所有考生進(jìn)行分類(lèi),而不能受其他因素的影響,所有考生和其他利益相關(guān)者都應(yīng)該清楚決策方案是如何制定與執(zhí)行的。
再次,解釋的有意義性要求對(duì)所測(cè)語(yǔ)言能力(構(gòu)念)的界定應(yīng)依據(jù)具體的教學(xué)大綱或相關(guān)語(yǔ)言能力研究成果和理論,測(cè)試任務(wù)要與所定義構(gòu)念相關(guān),施測(cè)過(guò)程能夠使考生發(fā)揮出最好水平;解釋的公平性要求所有考生都應(yīng)熟悉某測(cè)試的答題方式、步驟、所用設(shè)備和考試內(nèi)容,測(cè)試任務(wù)中不能包含對(duì)某些考生不利的話題和文化內(nèi)容,所有考生都看得懂測(cè)試記錄過(guò)程的表述,所有考生在展示自己的能力方面機(jī)會(huì)均等;解釋的概括性要求測(cè)試任務(wù)特征應(yīng)與目標(biāo)語(yǔ)言使用任務(wù)特征一致,用于評(píng)估考生測(cè)試表現(xiàn)與用于評(píng)估目標(biāo)語(yǔ)言使用任務(wù)表現(xiàn)的標(biāo)準(zhǔn)是相同的;解釋的相關(guān)性要求基于考生測(cè)試表現(xiàn)的信息應(yīng)該與所作決策需要的信息一致;解釋的充足性要求基于考生測(cè)試表現(xiàn)的信息足以對(duì)考生作出決定,不需其他額外信息。
最后,測(cè)試記錄的一致性要求測(cè)試記錄(分?jǐn)?shù)和描述)在不同的測(cè)試任務(wù)、不同的施測(cè)環(huán)節(jié)、不同的評(píng)分員以及不同的考生群體中始終保持一致。
另外,AUA框架還明確了測(cè)試研發(fā)者和決策制定者的主要責(zé)任和次要責(zé)任,在一定程度上有助于提高測(cè)試的公平性。
二、AUA框架與英語(yǔ)高考改革新模式的公平性
對(duì)照AUA框架,英語(yǔ)高考新模式的公平性主要體現(xiàn)在以下三方面。
首先,“一年兩考”意味著考生高中三年有六次機(jī)會(huì),大大增加了考生接受高等教育的機(jī)會(huì),這也是測(cè)試公平性的體現(xiàn),因?yàn)樵摯胧┰诤艽蟪潭壬媳WC了“施測(cè)過(guò)程能夠使考生發(fā)揮出最好水平”和“考生在展示自己的能力方面機(jī)會(huì)均等”,符合AUA中“解釋有意義性”和“解釋公平性”的測(cè)試質(zhì)量屬性要求。
其次,“取最高分”意味著決策者將根據(jù)由考生最好的測(cè)試表現(xiàn)所推論出的該考生的語(yǔ)言能力對(duì)其作出是否錄取的決定;“分等級(jí)計(jì)入”能夠使考生再也不會(huì)因?yàn)橛⒄Z(yǔ)只差一兩分而無(wú)緣高等教育。因此,英語(yǔ)高考的使用后果和決策后果對(duì)所有考生來(lái)說(shuō)都是有益的,也是測(cè)試公平性的體現(xiàn),符合AUA中“解釋的有意義性和相關(guān)性”、“后果的善益性”以及“決策的均衡性”。
最后,“社會(huì)化”考試意味著英語(yǔ)高考試卷的設(shè)計(jì)與開(kāi)發(fā)由專(zhuān)業(yè)的測(cè)試機(jī)構(gòu)來(lái)承擔(dān),該機(jī)構(gòu)有大量的專(zhuān)職測(cè)試研究人員,應(yīng)該是獨(dú)立、非盈利的,同時(shí)具備公信力,不能由辦學(xué)機(jī)構(gòu)、培訓(xùn)學(xué)校主辦,例如美國(guó)教育測(cè)試服務(wù)中心,擁有幾百名全職的測(cè)試研究人員,研究開(kāi)發(fā)了TOEFL、GRE考試等。英語(yǔ)高考采取社會(huì)化考試便于明確測(cè)試研發(fā)者和決策者的責(zé)任,能較好地保證測(cè)試的公平性。
三、關(guān)于英語(yǔ)高考改革的建議
以上分析表明,英語(yǔ)高考“一年兩考、取最高分、分等級(jí)計(jì)入”的社會(huì)化考試模式的改革方向是正確的,但是,英語(yǔ)高考作為大規(guī)模高風(fēng)險(xiǎn)的選拔性測(cè)試,關(guān)乎全國(guó)每年九百多萬(wàn)考生的前途和命運(yùn),必須全盤(pán)考慮和細(xì)化其設(shè)計(jì)、開(kāi)發(fā)、實(shí)施及使用方案。因此,本文基于測(cè)試公平性的理念,以AUA框架為理論指導(dǎo),對(duì)英語(yǔ)高考改革提出幾點(diǎn)建議。
1.所考查語(yǔ)言能力(構(gòu)念)的界定要清楚易懂
根據(jù)Bachman和Palmer對(duì)語(yǔ)言能力構(gòu)成要素的論述,英語(yǔ)高考應(yīng)該主要考查學(xué)生基本的語(yǔ)法和詞匯的掌握情況,常見(jiàn)文體(如敘述性和描寫(xiě)性文體)基本的閱讀理解能力,基本的聽(tīng)力理解能力以及能夠用英語(yǔ)(包括口語(yǔ)和書(shū)面語(yǔ))進(jìn)行簡(jiǎn)單的信息和思想交流的能力等,[2]并嚴(yán)格按照《高中英語(yǔ)課程標(biāo)準(zhǔn)》(以下簡(jiǎn)稱《課標(biāo)》)規(guī)定的能力標(biāo)準(zhǔn)和要求以及高校人才選拔要求確定擬測(cè)能力,所有這些在考試手冊(cè)中都要詳細(xì)說(shuō)明,而且根據(jù)不同的利益相關(guān)者要選擇使用專(zhuān)業(yè)性或非專(zhuān)業(yè)性語(yǔ)言,目的是為了讓所有的利益相關(guān)者(如考生、英語(yǔ)高考的開(kāi)發(fā)者、使用者和決策制定者)都能明白對(duì)所考核能力的描述。[2]endprint
2.考試內(nèi)容、答題方式和題型要科學(xué)合理,體現(xiàn)公平
這涉及到如何選擇考試內(nèi)容以及以何種方式和題型對(duì)這些內(nèi)容進(jìn)行考核。首先,考試內(nèi)容的選擇要緊扣《課標(biāo)》,參考高校人才選拔和培養(yǎng)需求,不能有偏題、怪題,不偏向任何考生。其次,不能出現(xiàn)冒犯考生民族禁忌文化的內(nèi)容和話題。[2]我國(guó)有56個(gè)民族,應(yīng)該充分考慮民族文化差異,避免出現(xiàn)有違民族禁忌的內(nèi)容。最后,采用所有考生都熟悉的答題方式和題型。我國(guó)幅員遼闊,東部沿海地區(qū)和內(nèi)陸欠發(fā)達(dá)地區(qū)的英語(yǔ)教育水平存在較大差異,因此,答題方式和題型應(yīng)該是所有考生都熟悉的。
3.考試過(guò)程要有利于所有考生
所有考生都熟悉并且會(huì)使用考試中使用的設(shè)備,在某些設(shè)備出現(xiàn)故障時(shí),能夠迅速啟用備用設(shè)備;考生應(yīng)該在熟悉而舒適的環(huán)境中有足夠的時(shí)間來(lái)完成考試任務(wù),這是保證考生能夠發(fā)揮出最高水平的重要條件;[2]監(jiān)考人員要進(jìn)行培訓(xùn),讓他們明白監(jiān)考步驟與要求,做到監(jiān)考過(guò)程標(biāo)準(zhǔn)統(tǒng)一,會(huì)使用或操作所需設(shè)備并能及時(shí)正確地處理突發(fā)情況。
4.評(píng)分要具有一致性
首先,評(píng)分方案、細(xì)則以及評(píng)分量表的制定至關(guān)重要,這需要二語(yǔ)習(xí)得領(lǐng)域的專(zhuān)家、語(yǔ)言測(cè)試專(zhuān)家、高中英語(yǔ)教師以及大學(xué)英語(yǔ)教師的密切配合和深入研究,在反復(fù)論證的基礎(chǔ)上達(dá)成共識(shí)。其次,要對(duì)評(píng)分員進(jìn)行培訓(xùn),讓他們充分理解評(píng)分方案、細(xì)則和評(píng)分量表,加強(qiáng)他們的評(píng)分公平性意識(shí)。
5.基于英語(yǔ)高考成績(jī)的決策應(yīng)考慮考生間的差異
考生間存在著個(gè)體差異、城鄉(xiāng)差異以及民族差異,這些差異會(huì)對(duì)他們的測(cè)試表現(xiàn)產(chǎn)生影響,從而影響他們的考試成績(jī)。個(gè)體差異主要體現(xiàn)在性別和認(rèn)知風(fēng)格方面。性別差異會(huì)使閱讀理解和寫(xiě)作中的背景材料(如體育、機(jī)械等)可能有利于男生而不利于女生。考生的認(rèn)知特點(diǎn)不僅影響他們的外語(yǔ)學(xué)習(xí),而且影響他們對(duì)某一類(lèi)測(cè)試題型的反應(yīng),從而造成與構(gòu)念無(wú)關(guān)的系統(tǒng)性偏差。城鄉(xiāng)差異主要表現(xiàn)在考生學(xué)習(xí)條件和考場(chǎng)環(huán)境的不同以及考試內(nèi)容的城市化傾向會(huì)對(duì)農(nóng)村考生產(chǎn)生不利影響。民族差異主要表現(xiàn)在考生用于學(xué)習(xí)英語(yǔ)的時(shí)間不同。因此,根據(jù)英語(yǔ)高考成績(jī)對(duì)考生作出決定時(shí),應(yīng)該充分認(rèn)識(shí)到考生間存在的各方面差異,采用DIF定量分析和定性分析相結(jié)合的方法,嚴(yán)格審查試題中是否存在性別、認(rèn)知風(fēng)格、城鄉(xiāng)以及民族偏差,如果存在偏差,要對(duì)成績(jī)進(jìn)行公平性處理。對(duì)于少數(shù)民族考生,更要采取不同的政策與措施,比如降低分?jǐn)?shù)或?qū)λ麄兊姆謹(jǐn)?shù)進(jìn)行加權(quán)處理,最大限度地減少民族差異給他們帶來(lái)的不利影響。
6.成立教育測(cè)試服務(wù)中心,建立公平性審查制度,制定公平性原則和標(biāo)準(zhǔn)
英語(yǔ)高考規(guī)模大,影響面廣,存在許多不確定性因素,很難實(shí)現(xiàn)理想的公平,因此,成立一個(gè)全職的規(guī)模性的語(yǔ)言測(cè)試服務(wù)中心(即第三方力量),建立公平性審查制度,制定公平性原則和標(biāo)準(zhǔn)非常必要,這不僅可以監(jiān)督英語(yǔ)高考的研發(fā)者、使用者和決策制定者承擔(dān)各自的責(zé)任,還可以使他們明確應(yīng)該遵循的原則和達(dá)到的標(biāo)準(zhǔn),從而有效提高公平性。具體而言,可由語(yǔ)言測(cè)試專(zhuān)家和相關(guān)職能部門(mén)在充分分析和研究的基礎(chǔ)上,參考美國(guó)教育測(cè)試服務(wù)中心的做法,利用一到兩年的時(shí)間逐步成立我國(guó)的教育測(cè)試服務(wù)中心,并由該中心負(fù)責(zé)英語(yǔ)高考公平性審查制度的建立和公平性標(biāo)準(zhǔn)的制定,這是英語(yǔ)高考改革真正實(shí)現(xiàn)社會(huì)化考試面臨的又一挑戰(zhàn)。盡管困難重重,語(yǔ)言測(cè)試專(zhuān)家也對(duì)第三方力量介入的可行性提出質(zhì)疑,[4]但是,鑒于我國(guó)嚴(yán)重缺乏對(duì)大規(guī)模高風(fēng)險(xiǎn)測(cè)試設(shè)計(jì)、開(kāi)發(fā)與使用質(zhì)量的全面研究和監(jiān)管,應(yīng)該也有必要進(jìn)行這方面的探索和嘗試,這也是促進(jìn)英語(yǔ)高考改革健康發(fā)展,早日實(shí)現(xiàn)與世界先進(jìn)語(yǔ)言測(cè)試?yán)碚摵蛯?shí)踐接軌的重要保證。
任何大規(guī)模高風(fēng)險(xiǎn)的選拔性語(yǔ)言測(cè)試都承擔(dān)著艱巨的社會(huì)責(zé)任,它會(huì)影響甚至決定一個(gè)人未來(lái)的發(fā)展和命運(yùn),我國(guó)的英語(yǔ)高考就肩負(fù)著這樣的使命,鑒于此,英語(yǔ)高考改革成了近期全社會(huì)關(guān)注的熱點(diǎn),褒貶不一??傮w來(lái)看,“一年兩考、取最高分、分等級(jí)計(jì)入”的社會(huì)化考試模式符合AUA框架對(duì)語(yǔ)言測(cè)試開(kāi)發(fā)和使用的要求,與AUA框架要求將公平性貫穿測(cè)試整個(gè)過(guò)程的核心理念是一致的。限于篇幅,本文僅就英語(yǔ)高考改革的幾個(gè)關(guān)鍵問(wèn)題給出了大致的解決辦法,主要涉及構(gòu)念的界定、內(nèi)容的選擇、評(píng)分的要求、考生間的差異、公平性審查制度和原則及標(biāo)準(zhǔn)的制定等。當(dāng)然,不管英語(yǔ)高考如何改革,我們都要有國(guó)家戰(zhàn)略意識(shí),放眼中國(guó)國(guó)際化和人才國(guó)際化的大趨勢(shì),以人的發(fā)展為第一要義,其最終目標(biāo)應(yīng)該是促進(jìn)外語(yǔ)教育觀念的轉(zhuǎn)變,使外語(yǔ)教育真正從學(xué)生全面發(fā)展的角度出發(fā),為促進(jìn)學(xué)生發(fā)展核心素養(yǎng)的養(yǎng)成做出應(yīng)有貢獻(xiàn)。
參考文獻(xiàn)
[1] Bachman, L. Constructing an assessment use argument and supporting claims about test taker-assessment task interactions in evidence-centered assessment design[J].Measurement:Interdisciplinary Research and Perspectives,2003(1).
[2] Bachman,L.& A. Palmer.Language Assessment in Practice: Developing Language Assessment and Justifying Their Use in the Real World [M].Oxford: OUP,2010.
[3] Bachman, L. & A. Palmer.Language Testing in Practice [M].Oxford: OUP,1996.
[4] 韓寶成,羅凱洲.語(yǔ)言測(cè)試效度及其驗(yàn)證模式的嬗變[J].外語(yǔ)教學(xué)與研究,2013(5)..
[作者:姜秀娟(1974-),女,山東臨沂人,曲阜師范大學(xué)副教授,碩士生導(dǎo)師,北京外國(guó)語(yǔ)大學(xué)博士研究生。]
【責(zé)任編輯 劉永慶】endprint