亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        論考試信度和效度的關(guān)系

        2010-08-15 00:42:55沈麗坤
        文教資料 2010年30期
        關(guān)鍵詞:效度信度一致性

        楊 華 沈麗坤

        (保定科技職業(yè)學(xué)院,河北 保定 071000)

        1.引言

        考試,作為教學(xué)的一部分,在教學(xué)過(guò)程中起著必不可少的作用。實(shí)行得當(dāng)?shù)目荚囉兄诮虒W(xué)的順利開(kāi)展,對(duì)教學(xué)有很強(qiáng)的導(dǎo)向作用,有助于提高教學(xué)效果。一次成功的考試,可以幫助教師真實(shí)有效地獲取所需要的有關(guān)學(xué)生能力或具體技能的信息。信度和效度是衡量考試質(zhì)量的兩個(gè)重要標(biāo)準(zhǔn),是考試必須滿足的兩個(gè)基本條件。成功的考試應(yīng)盡可能做到可靠、可信。

        2.考試信度

        考試信度(reliability),用確切的語(yǔ)言講,應(yīng)該是測(cè)量結(jié)果的信度??荚囍械男哦壤碚摚褪墙逃托睦頊y(cè)量中關(guān)于測(cè)量誤差的理論。

        根據(jù)現(xiàn)行的教育和心理測(cè)量理論和實(shí)踐情況,要給信度下一個(gè)較完整的定義十分困難。下面我們從定性和定量?jī)蓚€(gè)方面嘗試給信度下個(gè)定義。

        定性定義:信度是關(guān)于測(cè)量結(jié)果一致性程度的量度。這種一致性可能是關(guān)于不同時(shí)間的一致性,也可能是關(guān)于由等價(jià)項(xiàng)目組成的不同試卷間的一致性,也可能是關(guān)于不同評(píng)分者間的一致性,也可能是關(guān)于不同次決策的一致性,也可能是關(guān)于以上幾種因素不同組合情況下的一致性。這種一致性通常用信度系數(shù)(一般用相關(guān)系數(shù))表示。

        定量定義:信度是關(guān)于測(cè)量結(jié)果偏離真值大小的量度。這種量度通常用測(cè)量的標(biāo)準(zhǔn)誤差來(lái)表示(鄒申,2005:132-134)。

        考試要成為有效的測(cè)量手段,信度是其關(guān)鍵因素之一。在教學(xué)實(shí)踐中,我們可以通過(guò)重復(fù)考試法、平行卷考試法、對(duì)半分析法三種方法來(lái)測(cè)定考試信度(鄒申,2000:34-35)。

        3.考試效度

        衡量考試的另一個(gè)標(biāo)準(zhǔn)是考試效度(validity)。效度,是在教育和心理測(cè)量學(xué)這一特定語(yǔ)境中對(duì)“有效程度”或“有效性”一詞的簡(jiǎn)稱。

        簡(jiǎn)單說(shuō),考試效度就是它在多大程度上考了想要考的內(nèi)容。每次考試,不管何種類型,都應(yīng)盡可能有效??荚嚤仨氠槍?duì)提供對(duì)想要測(cè)量的個(gè)別技能的真實(shí)的測(cè)量:在一定程度上同時(shí)測(cè)量外部知識(shí)和其他技能,否則,它不是一個(gè)有效的考試。

        例如,教師編制了一套口試題目,來(lái)考試學(xué)生口頭表達(dá)語(yǔ)言的能力,考試的結(jié)果顯示這套題目的確檢查了學(xué)生在規(guī)定方面的能力,我們可以說(shuō)這套考試題目具有效度。

        又如,如果我們只想測(cè)量寫(xiě)作能力的話,下面這個(gè)考試項(xiàng)目就是無(wú)效的:“討論‘?dāng)z影是一門(mén)藝術(shù)還是科學(xué)?’”很簡(jiǎn)單,因?yàn)樗枰恍z影知識(shí),必然會(huì)對(duì)一些學(xué)生有利(Heaton,2000:159)。

        考試的效度可以通過(guò)表面效度、內(nèi)容效度、尺度關(guān)聯(lián)效度、結(jié)構(gòu)效度幾個(gè)方面來(lái)檢驗(yàn)。

        考試效度是一個(gè)整體概念,四種效度應(yīng)為這個(gè)概念的不同側(cè)面。在確定一個(gè)考試的效度時(shí),我們必須通盤(pán)考慮效度的各個(gè)方面。我們既不能只滿足考試的表面效度,又不能孤立地評(píng)價(jià)考試的內(nèi)容效度。只有聯(lián)系結(jié)構(gòu)效度來(lái)評(píng)價(jià)內(nèi)容效度時(shí),我們才能作出有意義的結(jié)論。任何論證結(jié)構(gòu)效度的過(guò)程都包含內(nèi)容效度、尺度關(guān)聯(lián)效度或表面效度等方面。

        4.信度和效度的關(guān)系

        考試效度和信度構(gòu)成評(píng)估考試的兩個(gè)主要標(biāo)準(zhǔn)。如前所述,信度是關(guān)于測(cè)量結(jié)果一致性程度的量度,指的是考試結(jié)果(分?jǐn)?shù))的可靠性;效度指的是考試達(dá)到預(yù)定目的的程度。

        一個(gè)考試可以具備較高的信度,但缺乏效度。如果我們用一個(gè)已被證明具有較高信度的閱讀試卷去考學(xué)生的寫(xiě)作能力,考試結(jié)果有很高的穩(wěn)定性也沒(méi)用。試卷的誤用無(wú)法使我們測(cè)量到期望的能力或技能。如果用尺子作為工具來(lái)測(cè)量人的體重,可能很“可靠”,在不同的被測(cè)者之間、不同的地點(diǎn)之間,可能會(huì)有很高的一致性,但這種測(cè)量對(duì)于測(cè)量體重來(lái)說(shuō)是一個(gè)有效度不高的測(cè)量。

        理想中的考試應(yīng)該既有信度又有效度。然而,信度和效度之間存在著矛盾??荚嚨男哦仍礁撸ǔPФ仍降?。包含創(chuàng)造性技能的主觀考試比如口試、角色扮演等在失去信度的情況下才可能得到較高的結(jié)構(gòu)效度和表面效度。語(yǔ)言學(xué)習(xí)行為不可能只靠從所給選項(xiàng)中選擇正確答案的能力去論證。

        考試工作者所面臨的選擇是增加有信度的考試的效度還是增加有效度的考試的信度。如果想要增加有信度的考試的效度,這是不可能達(dá)到的,因?yàn)槟切┦箍荚嚳尚诺奶卣饕舱鞘箍荚嚐o(wú)效的特征。我們可以先設(shè)計(jì)一個(gè)有效考試,然后增加其信度。一個(gè)效度高的測(cè)評(píng),一定有好的信度。但有高信度的測(cè)評(píng),不一定有好的效度。信度是效度的必要條件,但并不充分??荚嚱Y(jié)果與要考試的內(nèi)容越吻合則效度越高;反之,則效度越低??傊承y(cè)試對(duì)所要測(cè)量的行為具有更明顯的代表性;而有些則不具有代表性。

        信度是效度的前提條件。一個(gè)有效度的考試一定有信度,而一個(gè)信度很高的考試不一定有效度,這是信度與效度的最基本的關(guān)系(鄒申,1998:259)。如果考試本身不可靠,我們就不能說(shuō)考試有效地檢測(cè)了所選定的語(yǔ)言能力或技能。確定效度的一些方法需要考試結(jié)果作為基本數(shù)據(jù),如試卷內(nèi)各項(xiàng)目之間相關(guān)的關(guān)系、考試成績(jī)與考生特征之間關(guān)系的分析等。如果數(shù)據(jù)不可靠,考試效度也是無(wú)法確定的。

        信度和效度似乎存在著不可調(diào)和的矛盾,是一種“你進(jìn)我退”的關(guān)系,多一點(diǎn)信度就少一點(diǎn)效度,反之亦然。傳統(tǒng)上,人們往往努力追求絕對(duì)的信度和效度,結(jié)果終究是徒勞的。因?yàn)椴豢紤]效度,盲目增加信度,結(jié)果是一個(gè)考試在信度很高地測(cè)試著并非我們想測(cè)試的內(nèi)容;而不顧信度盲目地提高效度,其測(cè)試結(jié)果只能是不準(zhǔn)確不可信的,即絕對(duì)的信度和效度是沒(méi)有意義的。兩者相互妥協(xié)以達(dá)到共存的目的才是我們經(jīng)過(guò)努力能夠達(dá)到的,追求“絕對(duì)”只是一個(gè)美麗的“憧憬”(鄒申,1998:260)。 總而言之,對(duì)于考試來(lái)說(shuō),信度與效度都是必不可少的,信度是保證效度的基礎(chǔ),撇開(kāi)效度只談信度是沒(méi)有實(shí)際意義的。

        5.結(jié)語(yǔ)

        信度和效度是衡量考試質(zhì)量的最重要的兩項(xiàng)指標(biāo)。它們之間既相互依存,又相互排斥。一項(xiàng)考試如果可靠,則其效度很可能高,也很可能低;但是,如果一項(xiàng)考試不可靠,則該考試必然無(wú)效。保證考試的高信度和高效度是考試工作者追求的目標(biāo)。但這只能是一個(gè)理想化的目標(biāo),因?yàn)橐豁?xiàng)考試要想做到信度和效度很高往往是不可能的,但我們絕不能為了追求信度而忽視效度,也不能為了追求效度而放棄信度。

        [1]Heaton,J.B.W riting English Language Tests[M].北京:外語(yǔ)教學(xué)與研究出版社,2000,8.

        [2]鄒申.語(yǔ)言測(cè)試[M].上海:上海外語(yǔ)教育出版社,2005,9.

        [3]鄒申.英語(yǔ)語(yǔ)言測(cè)試——理論與操作[M].上海:上海外語(yǔ)教育出版社,1998,7.

        [4]鄒申,楊任明.簡(jiǎn)明英語(yǔ)測(cè)試教程[M].北京:高等教育出版社,2000,7.

        猜你喜歡
        效度信度一致性
        關(guān)注減污降碳協(xié)同的一致性和整體性
        公民與法治(2022年5期)2022-07-29 00:47:28
        注重教、學(xué)、評(píng)一致性 提高一輪復(fù)習(xí)效率
        《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識(shí)量表》的信度和效度研究
        IOl-master 700和Pentacam測(cè)量Kappa角一致性分析
        慈善募捐規(guī)制中的國(guó)家與社會(huì):兼論《慈善法》的效度和限度
        科技成果評(píng)價(jià)的信度分析及模型優(yōu)化
        基于事件觸發(fā)的多智能體輸入飽和一致性控制
        體育社會(huì)調(diào)查問(wèn)卷信度檢驗(yàn)的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
        被看重感指數(shù)在中國(guó)大學(xué)生中的構(gòu)念效度
        外語(yǔ)形成性評(píng)估的效度驗(yàn)證框架
        成人国产一区二区三区精品不卡| 性色av无码中文av有码vr| 中日av乱码一区二区三区乱码| 亚洲色图综合免费视频 | 国产精品自拍网站在线| 中文字幕亚洲精品一区二区三区| 天天天天躁天天爱天天碰2018| 91免费在线| 日韩在线精品视频免费| 精品少妇人妻久久免费| 国产一区二区三区av免费| 成年av动漫网站18禁| 无码人妻av一区二区三区蜜臀| 国产成人综合久久久久久| 亚洲一区二区三区码精品色| 亚洲成在人线视av| 国产色秀视频在线播放| 少妇性l交大片| 精品性影院一区二区三区内射| 91尤物在线看| 国产午夜免费啪视频观看| 亚洲a∨无码一区二区三区| 欧美亚州乳在线观看| 国产一区二区精品av| 久久久国产精品123| 亚洲人成未满十八禁网站| 98精品国产综合久久| 久久亚洲精品国产精品婷婷| 有坂深雪中文字幕亚洲中文| 无码中文亚洲av影音先锋| 真人男女做爰无遮挡免费视频| 国产麻豆精品久久一二三| 国产91精品高潮白浆喷水| 久久97久久97精品免视看| 无码人妻久久一区二区三区app| 国产成人精品成人a在线观看| 成年视频网站在线观看777| 国产亚洲精品一区在线| 国产激情视频在线观看的| 色噜噜狠狠一区二区三区果冻| 精品九九视频|