亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

TEM-4公平性的影響要素分析

2014-03-29 15:29:05賀滿足

赤峰學(xué)院學(xué)報·自然科學(xué)版 2014年12期

賀滿足

（湖南第一師范學(xué)院，湖南長沙410205）

TEM-4公平性的影響要素分析

賀滿足

（湖南第一師范學(xué)院，湖南長沙410205）

作為全面檢測高校英語專業(yè)基礎(chǔ)階段學(xué)生對教學(xué)大綱規(guī)定的語言知識和技能掌握情況的一種手段，TEM-4需要具備公平性以體現(xiàn)社會公正.考試公平性涉及多個因素，是考試賴以存在的基礎(chǔ).本文從考試機(jī)會、考生群體、考試內(nèi)容和考試結(jié)果評閱四個方面對TEM-4考試的公平性加以分析.

TEM-4；考試公平性；要素

當(dāng)今社會，公平已成為各個領(lǐng)域的重要價值追求目標(biāo).社會的進(jìn)步，推動了公平的實現(xiàn)，也加深了人們對公平的認(rèn)識，提高了對公平的期待與要求.在教育領(lǐng)域，教育公平問題是當(dāng)前我國社會生活和教育領(lǐng)域十分關(guān)注的熱點問題.考試作為選拔人才和檢查教學(xué)質(zhì)量的一種重要手段,其公平性也備受關(guān)注.作為一個規(guī)模大、風(fēng)險高的考試，TEM-4考試本身的質(zhì)量以及考試的公平性尤為重要，值得深入研究.

1 英語專業(yè)四級考試

英語專業(yè)四級考試（Test for English Majors-4，簡稱TEM-4）,全稱為全國高校英語專業(yè)四級考試，考試對象為高等院校英語專業(yè)二年級學(xué)生,自1991年起由教育部實行，每年舉行一次,以筆試形式考核，無口試.該考試以《高等學(xué)校英語專業(yè)英語教學(xué)大綱》為依據(jù)，全面檢查英語專業(yè)（本科層次）二年級學(xué)生對基礎(chǔ)階段所要求掌握的英語語法結(jié)構(gòu)和詞語用法以及聽、讀、寫基本技能的掌握程度.因此，TEM-4屬尺度參照性教學(xué)檢查類考試.考試由教育部高等學(xué)校外語專業(yè)教學(xué)指導(dǎo)委員會英語組組織有關(guān)測試專家命題，外語專業(yè)教學(xué)指導(dǎo)委員會辦公室負(fù)責(zé)考試的實施[1].

作為檢查各高校貫徹和落實教學(xué)大綱情況,以促進(jìn)英語專業(yè)教學(xué),提高教學(xué)質(zhì)量的一種形式,TEM-4自開考以來,其權(quán)威性在不斷提高,在教學(xué)中的評估功功能也在不斷突顯.該考試成績不僅作為學(xué)生是否達(dá)標(biāo)的依據(jù)，更是英語專業(yè)本科教學(xué)評估指標(biāo)體系中的一項指標(biāo).當(dāng)前，研究者從不同層面對TEM-4展開了研究，如鄒申、王海貞、孔文等研究了TEM-4的效度；侯艷萍、李清華等、彭康洲研究了TEM-4閱讀和寫作的難度;陸遠(yuǎn)、鄒申等研究了TEM-4寫作評分過程及評分效度；張喆等、顏靜蘭等、秦秀白研究了TEM-4對教學(xué)的反撥效應(yīng)等.這些成果，特別是構(gòu)念效度研究成果，提高了TEM-4測量的準(zhǔn)確度和分?jǐn)?shù)的解釋力度，有助于提升考試的公平性.

2 考試公平性

考試的公平性是指在考試的各個環(huán)節(jié)（包括試卷設(shè)計、開發(fā)、施考、評卷和成績公布），對所有考生公平對待、一視同仁，不存在只影響部分考生的其他相關(guān)因素，考試結(jié)果僅僅反映考生個人在考試中的知識和能力水平情況[2].根據(jù)美國教育研究學(xué)會等機(jī)構(gòu)編制的《教育與心理測量標(biāo)準(zhǔn)》[3]，考試公平性體現(xiàn)在以下幾個方面.第一，沒有偏頗(lack of bias).考試偏頗可由考試內(nèi)容、答題形式所致,也可能因為考試的使用，導(dǎo)致對不同考生群體而言，考試結(jié)果意義不一致.這種偏頗會使考試結(jié)果出現(xiàn)偏差,不能準(zhǔn)確反映所測的目標(biāo)（知識、技能或能力），從而降低考試的構(gòu)念效度.第二,考試過程的公平.包括考前準(zhǔn)備過程中，所有考生都應(yīng)有機(jī)會得到考試復(fù)習(xí)資料；考試實施過程中所有考生都受到公正待遇，具有同等機(jī)會來展現(xiàn)考試所測的知識或能力，以及給考生提供合適的條件,以便他們在考試中發(fā)揮正常.第三,基于考試結(jié)果（成績）決策的公平.標(biāo)準(zhǔn)參照類考試（CRT）結(jié)果需確保不同考生群體之間的通過率具有可比性；選拔性考試(屬常模參照考試)應(yīng)讓所有考生有同等的選拔機(jī)會.第四,就學(xué)業(yè)考試而言，考生應(yīng)有均等機(jī)會學(xué)習(xí)考試相關(guān)內(nèi)容.

從以上分析不難看出，考試公平性涉及多個因素，涵蓋考試效度(包括內(nèi)容效度和構(gòu)念效度)、考前準(zhǔn)備、考試實施、考試結(jié)果的使用和學(xué)習(xí)考試內(nèi)容的機(jī)會.這些因素既包括考試自身的質(zhì)量,也包括考試的外部條件;既有考試結(jié)果的使用,也有考試成績本身;既涉及考前,也涉及考試過程和考后階段.因而,考試公平性的概念涉及面廣,貫穿甚至超越整個考試過程,是任何考試賴以存在及使用的基礎(chǔ)[4].在實際工作中，語言測試工作者（命題、施考及評閱人員等）要將確?？荚嚬叫苑旁谑孜?并具體落實到考試的每個階段.

3 影響TEM-4考試公平性的因素

TEM-4考試用來檢查學(xué)生是否達(dá)到教學(xué)大綱所規(guī)定各項語言技能/能力、語言知識的目標(biāo)，其考試結(jié)果被用作評判考生是否達(dá)標(biāo)(即考試通過或不通過)的唯一依據(jù),這就要求考試本身質(zhì)量、考試用途等方面都要具有公平性.影響TEM-4公平性的因素有考試機(jī)會、考生群體、考試內(nèi)容和考試結(jié)果評閱等.

3.1 考試機(jī)會

為了降低考試成本，提高考試效率，TEM4每年只舉行一次.Bachman&Palmer認(rèn)為影響考試分?jǐn)?shù)的因素有四類:個人特點(如性別、年齡、母語等)、情感因素、考生所具備的背景、專業(yè)和文化知識和語言水平/能力.這四類因素中,語言水平/能力對考試成績起決定作用,但不能排除其它三類特征影響考生在考試中的表現(xiàn)[5].由此可見，一次考試往往不能準(zhǔn)確測試所有考生的真實水平，僅以某次考試結(jié)果作為學(xué)生是否達(dá)標(biāo)的依據(jù)，在公平性上有失偏頗.為了彌補(bǔ)這一不足，TEM4考試未達(dá)標(biāo)的考生可以參加下一年的考試.即使這樣，這些考生需要為第二次考試機(jī)會的到來等待一年，在時間、精神壓力等方面付出代價也不容忽視.

3.2 考生群體

TEM-4自開考以來，考生數(shù)量快速增加.據(jù)外語專業(yè)教學(xué)指導(dǎo)委員會辦公室統(tǒng)計，1992年參考院校為155所，參考學(xué)生為8554人;到了2010年，參考院校為827所，考生人數(shù)高達(dá)27萬.這些參考學(xué)生都來自全國各高等院校的英語專業(yè):綜合大學(xué)、外語院校、理工類大學(xué)、師范院校、其他院校以及獨立學(xué)院等.

這些院校既有沿海發(fā)達(dá)地區(qū)的,也有內(nèi)陸省份和邊疆地區(qū)的.表面上,TEM-4考生均為在校英語專業(yè)學(xué)生,具有同質(zhì)性,但仔細(xì)研究后不難發(fā)現(xiàn)，由于學(xué)校師資、課程設(shè)置、地理位置等方面的原因，這些考生存在許多不同特征.就語言能力而言,考生群體間(或?qū)W校之間)存在著顯著差異.影響語言能力發(fā)展的因素有多個，包括性別、年齡、外語學(xué)習(xí)起始期、專業(yè)知識/背景、學(xué)習(xí)風(fēng)格、認(rèn)知風(fēng)格、對所學(xué)語言國家文化與社會的了解/認(rèn)同程度等.這更說明科學(xué)甄別差異、合理解釋差異的必要性.因而“在分析和持續(xù)研究階段，需關(guān)注不同考生群體的實際差異或潛在差異,采取措施避免差異成為影響考試結(jié)果或分?jǐn)?shù)解釋的因素”[6].

3.3 考試內(nèi)容

考試內(nèi)容的公平性是指考試內(nèi)容對于所有考生應(yīng)有同等的作答機(jī)會和相同的答題條件，能力相當(dāng)?shù)目忌寄塬@得相同的成績,不致因考生背景的不同而導(dǎo)致正確作答幾率的嚴(yán)重失衡.影響考試內(nèi)容公平性的原因是多方面的：①考試答題是否需要特殊的專業(yè)/背景知識；②試題是否原創(chuàng)；③試題對于全部考點的代表性.由于背景/專業(yè)/文化知識可能影響考試結(jié)果,在語言水平相當(dāng)?shù)那闆r下,是否具備試題內(nèi)容涉及的背景知識就有可能成為決定TEM-4考試中閱讀、聽力或?qū)懽骺荚嚦煽兏叩偷囊蛩?因此,在考試規(guī)劃和命題段，命題小組需兼顧考生因素,使試卷具有包容性.以2011年的TEM-4為例，考試材料具有較好的代表性和較廣的覆蓋面，主題包括時事熱點、金融貿(mào)易、文化習(xí)俗、社會與生活、人物介紹、科技通訊等方面.材料主題廣泛有效避免了因考試材料選取的缺陷而產(chǎn)生的偏頗，為提升考試公平性打下了基礎(chǔ)[7].由于TEM-4考試屬于標(biāo)準(zhǔn)參照教學(xué)檢查類考試,對教學(xué)的影響不斷增強(qiáng),研究考試的反撥效應(yīng)的必要性已日趨突顯.因此,對TEM-4考試影響的研究也應(yīng)成為提升TEM-4考試公平性的一大舉措.在這方面積極開展研究可以幫助我們加深對考試目的、用途以及作用的認(rèn)識[7].

3.4 考試結(jié)果評判

考試結(jié)果評閱是指將考生的解答與試題標(biāo)準(zhǔn)答案進(jìn)行對照，根據(jù)兩者的吻合程度給考生評分的過程.為保證評分的公平性，TEM4考試閱卷小組從以下幾個方面進(jìn)行了嚴(yán)格的把關(guān)：制定科學(xué)、全面、可行的評分標(biāo)準(zhǔn)；認(rèn)真挑選評分樣卷；培訓(xùn)評卷人員以及監(jiān)控整個評卷過程.在實際的評分過程中，評卷者之間可能會存在較大的差異，其原因包括：長時間的評卷導(dǎo)致疲倦，注意力不集中;對評分標(biāo)準(zhǔn)自由度的把握，評卷教師自身的知識水平、經(jīng)驗等.因此評卷者之間存在主觀上的差異，相同評卷者在不同的時間內(nèi)也具有不穩(wěn)定性，在評分的準(zhǔn)確性、嚴(yán)厲度等方面，同一評卷者難以在多次評分中保持一致，不同評卷者對于相同被試的評分也難以相同[8].

那么，在評卷過程中如何維護(hù)考試的公平性呢？筆者認(rèn)為可以從控制閱卷的隨機(jī)誤差和系統(tǒng)誤差入手.考試評閱小組對隨機(jī)誤差的控制可以通過選擇評卷人員、強(qiáng)化評卷人員的責(zé)任心以及強(qiáng)化統(tǒng)分、登分環(huán)節(jié)的邏輯校驗來實現(xiàn).對評閱過程中系統(tǒng)誤差控制的措施有：①加強(qiáng)對評分系統(tǒng)的操作數(shù)據(jù)進(jìn)行邏輯校驗；②對評卷教師進(jìn)行嚴(yán)格的培訓(xùn)，組織他們認(rèn)真研究評分標(biāo)準(zhǔn)并試評，確保他們真正全面把握評分細(xì)則；③采用網(wǎng)上評卷，對評卷教師隨機(jī)發(fā)放試卷，實時監(jiān)控評卷中教師對評分細(xì)則的把握情況[9].如果對同一份測評卷，評卷教師的評分差異超出了可接受的范圍，則需由另一評卷老師進(jìn)行評閱.

為了提升評卷的公平性，從2009年起TEM-4考試閱卷小組開始改變評卷模式,實行計算機(jī)輔助評卷.這一評卷系統(tǒng)將先進(jìn)的計算機(jī)技術(shù)與人工評卷的豐富經(jīng)驗有機(jī)結(jié)合，采用隨機(jī)誤差和系統(tǒng)誤差控制模型對整個評分過程進(jìn)行實時監(jiān)控，極大地推進(jìn)了評分的標(biāo)準(zhǔn)化，盡可能確保了每個考生所得分?jǐn)?shù)客觀、公正，有效提升了評分的公平性.

4 結(jié)語

作為全面檢測高校英語專業(yè)基礎(chǔ)階段學(xué)生對教學(xué)大綱規(guī)定的語言知識和技能掌握情況的一種手段，TEM-4需要具備公平性以體現(xiàn)社會公正.如前所述，影響TEM-4公平性的要素有考試機(jī)會、考生群體、考試內(nèi)容和考試結(jié)果評閱等.

這些要素密切相關(guān)，缺少任何一個都將影響到考試整體的公平性.只有從這些影響要素入手，逐一分析其產(chǎn)生不公平的原因，才能有效地采取針對性措施，確保和提升TEM-4的公平性，從而穩(wěn)固其作為評價、甄別學(xué)生及教學(xué)評估指標(biāo)的地位.

〔1〕鄒申.關(guān)于考試科學(xué)屬性的思考[J].中國外語，2006(2):14-18.

〔2〕Brown JD.Testing in Language Programs[M].London: Prentice Hall(international),1996.

〔3〕American Educational Research Association,et al. Standards for educational and psychological testing[Z]. W ashington,D.C:American Educational Research Association,1999.

〔4〕鄒申.提升考試公平性———以英語專業(yè)四、八級考試為例[J].外語教學(xué)與測試，2011(1):42-50.

〔5〕Bachman L F&Palmer A S.Language Testing in Practice[M].Oxford:Oxford University Press,1996.

〔6〕鄒申.提升考試公平性——以英語專業(yè)四、八級考試為例[J].外語教學(xué)與測試，2011(1):42-50.

〔7〕鄒申，方秀才，陳煒.2011年英語專業(yè)四/八級考試分析報[J].外語測試與教學(xué),2012(1).

〔8〕賀滿足.多層面Rasch模型分析寫作測試中評卷者的偏差性[J].長沙鐵道學(xué)院學(xué)報（社科版）,2011（1）.

〔9〕郭光明，高考公平性的影響要素分析[J].教育理論與實踐，2010（6）.

H31

1673-260X（2014）06-0214-02

湖南第一師范學(xué)院科研立項課題“TEM-4考試的構(gòu)念效度與公平性研究”（XYS12S25）

赤峰學(xué)院學(xué)報·自然科學(xué)版2014年12期

赤峰學(xué)院學(xué)報·自然科學(xué)版的其它文章: 淺談輔助線在幾何證題中的應(yīng)用; 重構(gòu)模式教管并重
——湖南文理學(xué)院與常德職業(yè)技術(shù)學(xué)院普通話測試課程化培訓(xùn)模式創(chuàng)建實踐報告; 基于教學(xué)模式需求探測的課程教學(xué)改革研究
——以市場調(diào)查與預(yù)測課程為例; 高職實踐課教學(xué)的分析與應(yīng)用研究; CDIO教學(xué)模式下Web標(biāo)準(zhǔn)網(wǎng)頁設(shè)計課程教學(xué)模式改革探析; 培養(yǎng)軟件技術(shù)專業(yè)學(xué)生職業(yè)核心能力
——基于工作過程的課程開發(fā)實踐