亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

Toulmin推斷模型在考試效度論證中的應(yīng)用

2012-01-03 09:21:06陳寧

中國(guó)考試 2012年4期

關(guān)鍵詞：模型

陳寧

陳寧

Stephen E.Toulmin是20世紀(jì)下半葉最有影響的哲學(xué)家之一。他創(chuàng)立的實(shí)用推斷模型已被應(yīng)用于眾多領(lǐng)域，包括教育和心理測(cè)量。在介紹Toulmin推斷模型的基礎(chǔ)上，本文著重闡釋了基于推斷的效度論證及Toulmin模型在效度論證中的應(yīng)用（以新托福的效度論證為范例）。最后，為推動(dòng)相關(guān)工作在我國(guó)的開展，文章提出了3點(diǎn)建議：（1）重視考試的效度論證；（2）積極嘗試運(yùn)用Toulmin模型開展考試效度研究；（3）以效度論證推動(dòng)考試改革。

Toulmin推斷模型；效度論證

Stephen E.Toulmin（1922—2009）是 20世紀(jì)下半葉最有影響的哲學(xué)家之一。1958年，他提出了實(shí)用推斷的主張，并據(jù)此創(chuàng)立了“六要素推斷法”，即Toulmin推斷模型（以下簡(jiǎn)稱“Toulmin模型”）（Toul?min,1958）。半個(gè)多世紀(jì)以來(lái)，Toulmin模型在眾多領(lǐng)域得到了卓有成效的應(yīng)用，顯示了廣闊的應(yīng)用前景。20世紀(jì)90年代，Kane（1992）把該模型引入教育和心理測(cè)量中的效度論證，為效度論證提供了一個(gè)較為科學(xué)的思路和框架。

1 實(shí)用推斷與Toulmin模型

1.1 實(shí)用推斷

實(shí)用推斷源于與形式邏輯截然不同的兩個(gè)基本觀點(diǎn)：

1.1.1 理?yè)?jù)同樣需要證明

形式邏輯中的三段論武斷地認(rèn)為，前提本身毋庸置疑，不需要證明，而Toulmin認(rèn)為，很多時(shí)候，導(dǎo)出結(jié)論的理?yè)?jù)本身并非不言而喻，同樣需要證據(jù)來(lái)支持。

1.1.2 觀點(diǎn)在先，證明在后

形式邏輯認(rèn)為，推斷是通過(guò)推理導(dǎo)出新的觀點(diǎn)，而實(shí)用推斷認(rèn)為，推斷是在推理過(guò)程中驗(yàn)證和篩選既有觀點(diǎn)，或者說(shuō)，首先要給出一個(gè)感興趣的觀點(diǎn)，然后提供該觀點(diǎn)正確的理由。

由此可見，傳統(tǒng)的形式邏輯是絕對(duì)主義的純理論推斷。相比之下，實(shí)用推斷反映現(xiàn)實(shí)，更能滿足實(shí)際需要，是Toulmin模型的理論基礎(chǔ)。

1.2 Toulmin模型的基本內(nèi)容

基于實(shí)用推斷的主張，Toulmin認(rèn)為，推斷是由素材（grounds）、依據(jù)（warrant）、聲明（claim）、支撐（backing）、限定（qualifier）及反駁（rebuttal）6個(gè)要素組成的。這6個(gè)要素以及它們之間的內(nèi)在關(guān)系構(gòu)成了Toulmin模型，如圖1所示。

圖1 Toulmin推斷模型

推斷即由素材推導(dǎo)出聲明，推導(dǎo)遵循依據(jù)。素材、聲明和依據(jù)是Toulmin模型中的三個(gè)基本要素。

支撐支持依據(jù)或證明依據(jù)成立。在獲得充分的證據(jù)之前，依據(jù)只是一種假設(shè)。

表明聲明強(qiáng)度的詞語(yǔ)被稱為限定，如“或許”、“可能”、“大多”、“一般情況下”等。

有的情況下，依據(jù)不成立，進(jìn)而推斷也不成立。這種情況被稱為“反駁”。

在有些推斷中，支撐、限定或反駁不是那么顯著或重要，被稱為Toulmin模型中的備擇要素。

例1：他多年工作在教學(xué)第一線。憑經(jīng)驗(yàn)，他認(rèn)為，一般情況下，高考數(shù)學(xué)成績(jī)好的學(xué)生大學(xué)數(shù)學(xué)也會(huì)學(xué)得較好。

上面這段話包含著一個(gè)推斷?！按髮W(xué)數(shù)學(xué)也會(huì)學(xué)得較好”是推斷的結(jié)論，即聲明。這一結(jié)論的基礎(chǔ)是相關(guān)學(xué)生“高考數(shù)學(xué)成績(jī)好”，此所謂素材。由“高考數(shù)學(xué)成績(jī)好”推導(dǎo)出“大學(xué)數(shù)學(xué)也會(huì)學(xué)得較好”是“憑經(jīng)驗(yàn)”，此所謂依據(jù)。

說(shuō)他有經(jīng)驗(yàn)，證據(jù)或支撐是“他多年工作在教學(xué)第一線”?！耙话闱闆r下”是對(duì)聲明的限定；與此同時(shí)，它所隱含的“特殊情況”則會(huì)使結(jié)論不成立，此所謂反駁。

例2：（全模型回歸方程和逐步型回歸方程）都是在0.99水平下顯著，表明X與Y之間的線性關(guān)系是極顯著的，即大學(xué)變量與高考變量的線性相關(guān)關(guān)系極為顯著……因此，利用高考成績(jī)和回歸方程可以較好地預(yù)測(cè)大學(xué)一、二年級(jí)的學(xué)習(xí)成績(jī)。

上面這段話選自一個(gè)關(guān)于大學(xué)學(xué)習(xí)成績(jī)與高考成績(jī)關(guān)系的實(shí)證研究（高晶、陸仲偉，1994）。這段話包含著一個(gè)推斷：高考成績(jī)X是素材，大學(xué)一、二年級(jí)的學(xué)習(xí)成績(jī)Y是聲明，聯(lián)結(jié)二者的依據(jù)是表明它們存在顯著的線性相關(guān)關(guān)系的兩個(gè)回歸方程。

依據(jù)的支撐是用多元統(tǒng)計(jì)中的回歸分析進(jìn)行的實(shí)證研究?！拜^好地”是對(duì)聲明的限定。方差分析表明，大學(xué)成績(jī)變量與高考成績(jī)變量的線性相關(guān)關(guān)系極為顯著，但個(gè)別情況下仍可能顯著偏離這種線性相關(guān)關(guān)系，此謂反駁。

實(shí)際上，Toulmin模型凸顯了推斷的證明功能及推斷者的責(zé)任：提出聲明的同時(shí)，推斷者有責(zé)任說(shuō)明聲明的來(lái)龍去脈，并在聲明受到挑戰(zhàn)時(shí)進(jìn)行辯護(hù)，也就是說(shuō)，要“把它做好，并證明它是站得住腳的”（Toulmin,1958），而這正是考試效度論證要做的。

2 基于推斷的考試效度論證

2.1 效度和效度論證

要理解基于推斷的考試效度論證，首先要準(zhǔn)確理解教育評(píng)價(jià)中的兩個(gè)重要概念——效度和效度論證。

關(guān)于效度和效度論證，《教育與心理測(cè)量標(biāo)準(zhǔn)》（APA,AERA,&NCME,1999）開宗明義：

效度指的是證據(jù)和理論支持測(cè)驗(yàn)的意向性用途所必然要求的測(cè)驗(yàn)分?jǐn)?shù)解釋的程度。因此，開發(fā)和評(píng)估測(cè)驗(yàn)時(shí)，效度是最根本的考量。效度論證過(guò)程涉及累積證據(jù)，為的是給意向性分?jǐn)?shù)解釋提供一個(gè)合理、科學(xué)的基礎(chǔ)。評(píng)估的是意向性用途所要求的測(cè)驗(yàn)分?jǐn)?shù)解釋，而非測(cè)驗(yàn)本身。

這段話清楚地表達(dá)了以下幾層含義：第一，效度直指測(cè)驗(yàn)結(jié)果的解釋和使用。第二，效度不是一個(gè)測(cè)驗(yàn)的靜態(tài)屬性，而是關(guān)于測(cè)驗(yàn)成績(jī)解釋和使用的合理性的動(dòng)態(tài)觀點(diǎn)。第三，一個(gè)測(cè)驗(yàn)質(zhì)量如何，關(guān)鍵是看成績(jī)解釋和使用在多大程度上是合理和有效的。第四，歸根結(jié)底，效度論證就是要論證解釋和使用測(cè)驗(yàn)結(jié)果的合理性。第五，為效度論證，要累積證據(jù)。效度論證的過(guò)程就是開發(fā)、收集、使用相關(guān)證據(jù)的過(guò)程。

可是，“效度是簡(jiǎn)單的，效度論證會(huì)是困難的”（Kane,2009），實(shí)踐中，如何為效度論證累積證據(jù)，累積哪些，累積多少，是必須面對(duì)的現(xiàn)實(shí)問(wèn)題，而基于推斷的效度論證為較好地解決這些問(wèn)題提供了一個(gè)科學(xué)的框架。

2.2 基本構(gòu)想

基于推斷的考試效度論證的基本構(gòu)想是：為了論證測(cè)驗(yàn)分?jǐn)?shù)的意向性解釋和用途的合理性，就要分析分?jǐn)?shù)的意向性解釋和用途所包含的支持性推斷，進(jìn)而論證推斷的合理性。為論證推斷的合理性，就要開發(fā)、收集相關(guān)理論和實(shí)證證據(jù)——既包括支持性的，又包括反駁性的。最終，把推斷及相關(guān)證據(jù)整合成一個(gè)連貫的、令人信服的整體，就是效度論證?！巴ㄟ^(guò)把效度論證的努力聚焦于解釋和用途中所固有的推斷和假設(shè)，效度論證者可避免兩個(gè)極端：一個(gè)是使用一些方便但有限的證據(jù)來(lái)源來(lái)證明一個(gè)雄心勃勃的解釋和用途的合理性，另一個(gè)是承擔(dān)一個(gè)不堪重負(fù)的要求——收集每一種可能的證據(jù)?！保↘ane,2009）

2.3 推斷和證據(jù)的種類和數(shù)量

效度被定義為對(duì)測(cè)驗(yàn)分?jǐn)?shù)的意向性解釋和用途的評(píng)估。從這個(gè)意義上講，不管是在種類還是數(shù)量上，效度論證所需要的證據(jù)和推斷都取決于測(cè)驗(yàn)分?jǐn)?shù)的意向性解釋和用途。如果分?jǐn)?shù)的意向性解釋簡(jiǎn)單直接，基本停留在對(duì)被觀察表現(xiàn)的直接歸納上，效度論證所需要的推斷和證據(jù)就很少，甚至根本不需要什么推斷和證據(jù)。反之，分?jǐn)?shù)的意向性解釋超越被觀察表現(xiàn)越遠(yuǎn)，效度論證所需要的推斷和證據(jù)就越多（Kane,2009）。譬如，如果語(yǔ)文老師報(bào)告學(xué)生能夠認(rèn)讀一千個(gè)特定的漢字，這個(gè)結(jié)果就可能被如數(shù)接受。如果該結(jié)果被用來(lái)證明學(xué)生的語(yǔ)文學(xué)得好，我們可能首先要問(wèn)：語(yǔ)文學(xué)得好的標(biāo)準(zhǔn)是什么？為什么這些特定的漢字適合用作這個(gè)年齡和性別的學(xué)生甚至是學(xué)生總體的語(yǔ)文水平的量尺？可是，如果這些漢字的認(rèn)讀情況被用來(lái)證明學(xué)生的數(shù)學(xué)性向，我們就會(huì)置之不理。總之，在效度論證中，瞄準(zhǔn)分?jǐn)?shù)的意向性解釋是至關(guān)重要的。

2.4 不同推斷之間的關(guān)系

一般說(shuō)來(lái)，大規(guī)模標(biāo)準(zhǔn)化測(cè)驗(yàn)分?jǐn)?shù)的意向性解釋和用途要包含若干個(gè)推斷。各推斷按一定次序逐級(jí)遞進(jìn)。也就是說(shuō)，每一個(gè)推斷的成立都是后一推斷得以推進(jìn)的基礎(chǔ)。宣稱一個(gè)意向性解釋和用途有效，就意味著該論證是連貫的，所包含的推斷和假設(shè)都被證明是成立的（Kane,2006）。相反，任何一個(gè)推斷不成立，后續(xù)推斷都不可能成立，進(jìn)而分?jǐn)?shù)的意向性解釋和用途就是不合理的、無(wú)效的。

3 基于推斷的效度論證的應(yīng)用——以新托福為例

新托?？荚嚕ㄓ址Q“托福網(wǎng)考”，英文簡(jiǎn)稱TOEFL-iBT）是應(yīng)用Toulmin模型開展效度論證的典范，下面作簡(jiǎn)要介紹。欲了解細(xì)節(jié)者，請(qǐng)閱讀Chapelle,Enright&Jamieson（2008）。

3.1 6 級(jí)推斷

如圖2所示，指向分?jǐn)?shù)解釋（學(xué)術(shù)英語(yǔ)水平的證明）和使用（以英語(yǔ)為教學(xué)媒介的大學(xué)遴選國(guó)際學(xué)生的依據(jù)之一）的新托福考試的效度論證依次跨越領(lǐng)域描述（domain description）、評(píng)估（evaluation）、概化（generalization）、解釋（explanation）、類推（extrapo?lation）和使用（utilization）6級(jí)推斷。

3.1.1 領(lǐng)域描述

領(lǐng)域描述指的是，在分析目標(biāo)領(lǐng)域（北美高等教育環(huán)境中的英語(yǔ)語(yǔ)言運(yùn)用）（素材）的基礎(chǔ)上，確定測(cè)驗(yàn)領(lǐng)域（聽、說(shuō)、讀、寫各語(yǔ)言技能及代表性任務(wù)），以準(zhǔn)確獲取分?jǐn)?shù)解釋的對(duì)象——考生在題目上的可觀察表現(xiàn)（observable performance）（聲明）。該推斷的依據(jù)是，相關(guān)的可觀察表現(xiàn)反映了目標(biāo)領(lǐng)域的代表性情景中所需要的知識(shí)、技能和能力。

三項(xiàng)工作構(gòu)成對(duì)依據(jù)的支撐：（1）應(yīng)用語(yǔ)言學(xué)專家辨明了學(xué)術(shù)領(lǐng)域的典型任務(wù)；（2）應(yīng)用語(yǔ)言學(xué)專家辨明了學(xué)術(shù)任務(wù)所要求的語(yǔ)言能力；（3）制定了題目模板（task shells）

3.1.2 評(píng)估

評(píng)估要得出的結(jié)論是，相關(guān)的觀察表現(xiàn)（ob?served performance）（素材）被賦予了精確的觀察分?jǐn)?shù)（observed score）（聲明），其依據(jù)是，觀察表現(xiàn)得到合理評(píng)估，觀察分?jǐn)?shù)反映了目標(biāo)語(yǔ)言能力。

三項(xiàng)工作構(gòu)成了對(duì)依據(jù)的支撐：（1）專家們制定了評(píng)分標(biāo)準(zhǔn)；（2）專家們制定了題目作答模式；（3）對(duì)題目、各分項(xiàng)技能測(cè)驗(yàn)及相關(guān)分?jǐn)?shù)進(jìn)行了實(shí)證分析。

3.1.3 概化

概化連接的是精確的觀察分?jǐn)?shù)（素材）與一致的預(yù)期分?jǐn)?shù)（expected socre）（聲明）。該推斷成立的依據(jù)是，觀察分?jǐn)?shù)是平行題目、試卷上及不同評(píng)分人間預(yù)期分?jǐn)?shù)的準(zhǔn)確估計(jì)。

五項(xiàng)工作構(gòu)成了對(duì)依據(jù)的支撐：（1）實(shí)證研究表明，題目數(shù)量是合適的；（2）實(shí)證研究表明，題目結(jié)構(gòu)是合理的；（3）選定了最佳評(píng)分策略；（4）制定了標(biāo)定和等值方案。

3.1.4 解釋

解釋要得出的結(jié)論是，預(yù)期分?jǐn)?shù)（素材）準(zhǔn)確反映了目標(biāo)構(gòu)念（target construct）（聲明），其依據(jù)是，預(yù)期分?jǐn)?shù)的取得歸因于目標(biāo)構(gòu)念。新托福的目標(biāo)構(gòu)念是學(xué)術(shù)英語(yǔ)水平。

四項(xiàng)研究結(jié)果構(gòu)成對(duì)依據(jù)的支撐：（1）對(duì)題目作答過(guò)程和結(jié)果的研究表明，試題的設(shè)計(jì)是合理的；（2）與其他考試的相關(guān)度及因素結(jié)構(gòu)（factor structure與期望相符；（3））考試成績(jī)與英語(yǔ)學(xué)習(xí)的關(guān)系與期望相符。

3.1.5 類推

類推連接的是目標(biāo)構(gòu)念（素材）和目標(biāo)分?jǐn)?shù)（target score）（聲明）。該推斷的依據(jù)是對(duì)學(xué)術(shù)英語(yǔ)水平的評(píng)價(jià)反映了現(xiàn)實(shí)中語(yǔ)言運(yùn)用的質(zhì)量。

依據(jù)的支撐是：研究顯示，考試成績(jī)與課業(yè)安置情況、學(xué)生自評(píng)及教師評(píng)判是正相關(guān)的。

3.1.6 使用

使用連接的是目標(biāo)分?jǐn)?shù)（素材）與考試使用（聲明）。也就是說(shuō)，該推斷的結(jié)論是：考試分?jǐn)?shù)反映了考生間差異，這些差異使得高等教育機(jī)構(gòu)能夠確定合格分?jǐn)?shù)，并在各自確定的合格分?jǐn)?shù)的基礎(chǔ)上做出相關(guān)決定（錄取及課程建議）。這也是整個(gè)新托福效度論證的結(jié)論。該推斷的依據(jù)是：從托福考試獲得的有關(guān)英語(yǔ)運(yùn)用質(zhì)量的估值對(duì)協(xié)助錄取、課業(yè)安置以及指導(dǎo)英語(yǔ)教學(xué)是有用的。

三項(xiàng)工作構(gòu)成了依據(jù)的支撐：（1）制作材料并面向社會(huì)舉行了信息發(fā)布會(huì)，仍需更多支撐。（2）制作材料并面向考試使用者舉行了信息發(fā)布會(huì)，以幫助他們確定合格線，仍需更多支撐。（3）第一階段的反撥研究已經(jīng)完成，仍需更多的反撥研究。

新托福的開發(fā)大致經(jīng)歷了理論探究、制定框架、設(shè)計(jì)試題、設(shè)計(jì)分項(xiàng)技能測(cè)驗(yàn)、設(shè)計(jì)完整考試、考試定稿、最后分析7個(gè)階段。各階段任務(wù)不同，但均圍繞這6個(gè)推斷逐步深入地推進(jìn)考試開發(fā)和效度論證。

3.2 關(guān)于限定與反駁

實(shí)際上，在新托福的效度論證中，各級(jí)推斷的聲明隱含著明確的限定，即總體上，各推斷基于研究而得出的結(jié)論令人信服。盡管如此，對(duì)其中所隱含的不確定性，我們?nèi)匀灰幸粋€(gè)清醒的認(rèn)識(shí)。

圖2 新托福的效度論證

3.2.1 確定相對(duì)的，不確定是絕對(duì)的

任何研究都有一個(gè)一般的假設(shè)，即不受無(wú)關(guān)因素干擾，或者說(shuō)“其他條件均等”，而現(xiàn)實(shí)世界的紛繁復(fù)雜足以讓這些“其他”足夠不相等，進(jìn)而構(gòu)成例外（Kane,2009）。新托福的效度論證包含大量的理論和實(shí)證研究，無(wú)關(guān)因素的干擾及相應(yīng)的例外自然是存在的，只是這些干擾和例外不具備顯著意義罷了。

3.2.2 效度論證是一個(gè)不斷深化和完善的過(guò)程

本文所介紹的新托福的效度論證是在考試開發(fā)過(guò)程中完成的，這決定了其局限性。實(shí)考數(shù)據(jù)將更為豐富和真實(shí)，將確認(rèn)、充實(shí)或修訂先前的論證。正如Chapelle（2008）所指出的，在新托福效度論證的最高級(jí)推斷——使用中，要確信考試成績(jī)得到了切實(shí)合理的解釋和使用，仍需更多的支撐——仍需做更多的宣傳，仍需獲取更多的反饋，仍需做更多的反撥研究。

4 思考與建議

4.1 重視考試的效度論證

在效度的定義上，從測(cè)驗(yàn)本身延伸至測(cè)驗(yàn)的使用（包括使用的后果），不僅是測(cè)量研究者視野的拓展，更是測(cè)驗(yàn)開發(fā)者責(zé)任的擔(dān)當(dāng)。效度論證既是考試質(zhì)量的求證，也是考試質(zhì)量的說(shuō)明。正因?yàn)槿绱?，Chapelle（2008）提出，不僅要有面向?qū)I(yè)人士或業(yè)內(nèi)人士的專業(yè)版的效度論證報(bào)告，還要有面向諸如考生、家長(zhǎng)等非專業(yè)人士的大眾版的效度論證報(bào)告。只有這樣，才能更好地保障公眾的權(quán)益。

4.2 積極嘗試運(yùn)用Toulmin模型開展考試效度研究

由于缺乏科學(xué)的框架作指導(dǎo)，在證據(jù)獲取上，傳統(tǒng)的效度論證很容易產(chǎn)生隨意性——選擇易于取得的，放棄難于取得的；選擇支持意向性結(jié)論的，放棄挑戰(zhàn)意向性結(jié)論的。這樣的效度論證主觀、片面，很難服人。新托?？荚嚦晒?yīng)用Toulmin模型開展基于推斷的效度論證，論證過(guò)程科學(xué)、嚴(yán)謹(jǐn)，值得借鑒和學(xué)習(xí)。

4.3 以效度論證推動(dòng)考試改革

從本質(zhì)上講，考試改革都是某種形式的效度論證驅(qū)動(dòng)的結(jié)果。

托?？荚嚦煽?jī)是大學(xué)環(huán)境中英語(yǔ)運(yùn)用水平的證明，因此成為英語(yǔ)國(guó)家的大學(xué)錄取國(guó)際學(xué)生時(shí)的依據(jù)之一。自20世紀(jì)60年代誕生至今，托?？荚囈恢币I(lǐng)著測(cè)量實(shí)踐的潮流。然而，就是這樣一個(gè)考試，它也是在應(yīng)對(duì)挑戰(zhàn)中不斷地進(jìn)行修訂、革新。由于僅考查聽、讀不足以全面反映考生的英語(yǔ)應(yīng)用水平，1979年，ETS推出了考查寫的TWE（Test of Written English）考試。1986年，ETS又推出了考查說(shuō)的TSE（Test of Spoken English）考試。聽說(shuō)讀寫都已涵蓋，但考試的內(nèi)容和形式仍不足以充分反映大學(xué)校園英語(yǔ)使用的實(shí)際，加之面對(duì)更具交際性的劍橋雅思（IELTS）考試的競(jìng)爭(zhēng)，這才有了新托福項(xiàng)目，才有今天集聽說(shuō)讀寫于一身、更具交際性、更能反映考生學(xué)術(shù)語(yǔ)言水平的新托福。

反觀國(guó)內(nèi)歷次考試改革，又何嘗不是潛在的效度論證驅(qū)動(dòng)的結(jié)果。以高考為例，全國(guó)統(tǒng)一高考制度的確立為社會(huì)大眾提供了一條統(tǒng)一的進(jìn)步通道，但在舊托福清一色選擇題的影響下，加之要解決命題的隨意性、評(píng)分的主觀性和昂貴的考試成本等一系列問(wèn)題，20世紀(jì)80年代中期，我國(guó)掀起了一波標(biāo)準(zhǔn)化考試的浪潮。一時(shí)間，選擇題似乎成了無(wú)所不能、無(wú)所不包的萬(wàn)能題型。可是，過(guò)分倚重選擇題所帶來(lái)的弊端很快顯現(xiàn)；人們反思，要考查求異思維和創(chuàng)新能力，除了主觀題別無(wú)選擇。于是，從20世紀(jì)90年代起，主觀題的分量逐漸增加，主客觀題的比例漸趨合理，科目?jī)?nèi)及科目間綜合運(yùn)用能力的考查成為高考的重要內(nèi)容之一。

毫無(wú)疑問(wèn)，高考內(nèi)容和形式的改革為人才選拔提供了更加科學(xué)的依據(jù)，可問(wèn)題是，它仍然是唯一的依據(jù)：對(duì)大學(xué)而言，千校一卷；對(duì)學(xué)生而言，命懸一線；對(duì)考試本身而言，它僅服務(wù)選拔。一句話，單一的考試承載了過(guò)多的功能和超重的使命。一方面，一次考試，準(zhǔn)確是相對(duì)的，誤差是絕對(duì)的，卻還被過(guò)度使用——考試成績(jī)本只能證明學(xué)生的學(xué)習(xí)成績(jī)和學(xué)習(xí)能力，卻無(wú)形中被當(dāng)作所有能力的化身；另一方面，考試僅用于選拔，效能較低。正因?yàn)檫@些問(wèn)題，才有《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要（2010—2020）》中“分類考試、綜合評(píng)價(jià)、多元錄取”的高考改革思路，也才有用多元評(píng)價(jià)改造單一考試的宏偉構(gòu)想。

[1]American Educational Research Association,American Psycholog?ical Association,&National Council on Measurement in Educa?tion.Standards for educational and psychological testing.Wash?ington,DC:American Psychological Association.1999.

[2]Chapelle,C.,Enright,M.,&Jamieson,J.Building a validity argu?ment for the Test of English as a Foreign Language.New York:Routledge.2008.

[3]Chapelle,C.A.,Enright,M.K.&Jamieson,J.M.Test score inter?pretation and use.In C.A.,Chapelle,M.K.Enright&J.M.Jamie?son,(Eds.),Building a validity argument for the Test of English as a Foreign Language(pp.1-25).New York:Routledge.2008.

[4]Chapelle,C.A.The TOEFL validity argument.In C.A.,Chapelle,M.K.Enright&J.M.Jamieson,(Eds.),Building a validity argu?ment for the Test of English as a Foreign Language(pp.1-25).New York:Routledge.2008.

[5]Kane,M.An argument-based approach to validity.Psychological Bulletin,1992：112,527-535.

[6]Kane,M.Validation.In R.Brennan(Ed.),Educational measure?ment(4thed.,pp.17-64).Washington,DC:American Council on Education and National Council on Measurement in Education.2006.

[7]Kane,M.Validating the interpretations and uses of test score.In R.W.Lissitz(Ed.)The concept of validity(pp.39-64).Charlotte,NC:Information Age Publishing,Inc.2009.

[8]Kunnan,A.Fairness and ethics in language assessment:Course readings:TESL 567A.Los Angeles:California State University.2003.

[9]Toulmin,S.E.The uses of argument.Cambridge:Cambridge Uni?versity Press.1958.

[10]http://www.philosophyol.com/pol/html/25/n-10325.html.

[11]高晶，陸仲偉.高考成績(jī)與大學(xué)學(xué)習(xí)成績(jī)的回歸分析[J].丹東師專學(xué)報(bào)，1994（1）.

Toulmin’s Argument Model and Its Application in Test Validation

CHEN Ning

Being one of the most influential philosophers of the latter half of the 20th century,Stephen E.Toulmin created the practical argument model,also known as Toulmin’s model,which has been used in multiple areas,including educational and psychological measurement.Based on an introduction of the model,the article focuses on an explanation of an argument-based approach to validation and exemplified application of the approach with New TOEFL.In the end,with an aim to improve the practice of test validation in China,suggestions are made in terms of a)placing more importance in test validation,b)trying using Toulmin’s model in test validation,and c)promoting assessment reforms through test validation.

Toulmin’s Argument Model;Test Validation

G405

1005-8427(2012)04-0015-7

教育部考試中心

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

Toulmin推斷模型在考試效度論證中的應(yīng)用

1 實(shí)用推斷與Toulmin模型

1.1 實(shí)用推斷

1.1.1 理?yè)?jù)同樣需要證明

1.1.2 觀點(diǎn)在先，證明在后

1.2 Toulmin模型的基本內(nèi)容

2 基于推斷的考試效度論證

2.1 效度和效度論證

2.2 基本構(gòu)想

2.3 推斷和證據(jù)的種類和數(shù)量

2.4 不同推斷之間的關(guān)系

3 基于推斷的效度論證的應(yīng)用——以新托福為例

3.1 6 級(jí)推斷

3.1.1 領(lǐng)域描述

3.1.2 評(píng)估

3.1.3 概化

3.1.4 解釋

3.1.5 類推

3.1.6 使用

3.2 關(guān)于限定與反駁

3.2.1 確定相對(duì)的，不確定是絕對(duì)的

3.2.2 效度論證是一個(gè)不斷深化和完善的過(guò)程

4 思考與建議

4.1 重視考試的效度論證

4.2 積極嘗試運(yùn)用Toulmin模型開展考試效度研究

4.3 以效度論證推動(dòng)考試改革

3.2.1 確定相對(duì)的，不確定是絕對(duì)的