亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        不同組卷方式下HSK(四級)題目質(zhì)量比較研究

        2015-06-27 01:10:38盧雙雙彭杰劉小龍
        中國考試 2015年11期
        關(guān)鍵詞:區(qū)分度效度測驗(yàn)

        盧雙雙 彭杰 劉小龍

        不同組卷方式下HSK(四級)題目質(zhì)量比較研究

        盧雙雙 彭杰 劉小龍

        本文從難度、信度、區(qū)分度和結(jié)構(gòu)效度四個方面比較了人工組卷和自動組卷的HSK(四級)試卷(以下簡稱人工卷和自動卷)的題目質(zhì)量。研究結(jié)果顯示,自動卷和人工卷的題目質(zhì)量較好,在結(jié)構(gòu)效度的模型擬合度上,自動卷結(jié)構(gòu)效度能很好規(guī)避書寫1部分對閱讀理解能力的考查,擬合參數(shù)好于人工卷。結(jié)果說明計(jì)算機(jī)自動組卷成功,自動卷可對考生的漢語應(yīng)用能力準(zhǔn)確測量,可用于正式考試。

        HSK;自動組卷;人工組卷;題目質(zhì)量

        HSK考試的傳統(tǒng)組卷方式是人工組卷,命題專家根據(jù)測驗(yàn)藍(lán)圖人工拼題組卷。隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,HSK考試的題庫開始逐步建設(shè)和應(yīng)用。2015年3月,HSK考試首次采用計(jì)算機(jī)題庫自動組卷成功,并施測于印度尼西亞國民教育部考點(diǎn)的考生。為保證自動卷的試題質(zhì)量,作者對自動卷和人工卷的HSK(四級)試題質(zhì)量從難度、信度、區(qū)分度和效度四個方面進(jìn)行了比較研究。

        1 基本情況

        1.1 研究材料

        HSK考試共6個級別,即HSK(一級)至HSK(六級),HSK(四級)作為中間級別,分為聽、讀、寫三部分,可作為HSK(考試)的典型代表作研究用。為減少樣本差異性和時(shí)間帶來的練習(xí)效應(yīng),作者選取2014年10月印尼國民教育部考點(diǎn)的數(shù)據(jù)用于比較研究。研究樣本情況見表1。

        表1 研究樣本

        1.2 研究方法

        本文的比較分析包括自動卷和人工卷的難度、信度、區(qū)分度和效度的比較,是基于經(jīng)典測量理論(CTT)的分析。

        (1)難度

        難度表示試題的難易程度。客觀題和主觀題的難度計(jì)算不同。聽力、閱讀為0,1計(jì)分的客觀題,難度用平均通過率表示,計(jì)算公式見公式1。書寫部分為主觀題,難度用平均得分率表示,計(jì)算公式見公式2。通過率或得分率越高,表示難度越低,反之亦然。

        其中,P代表客觀題項(xiàng)目難度,N為考生總?cè)藬?shù),R為通過該項(xiàng)目的人數(shù)。

        其中,P代表主觀題項(xiàng)目難度,為考生在某一項(xiàng)目上的平均得分,Xmax為該項(xiàng)目的滿分。

        (2)信度

        信度表示測試結(jié)果的穩(wěn)定性,常用內(nèi)部一致性系數(shù)(α系數(shù))表示,計(jì)算公式見公式3。

        其中,K是題目數(shù)表示所有考生在第i題上的分?jǐn)?shù)變異是測驗(yàn)總分的變異。

        (3)區(qū)分度

        區(qū)分度表示試題對考生能力的高低的區(qū)分程度。區(qū)分度常用相關(guān)法計(jì)算,客觀題為0,1計(jì)分,需計(jì)算項(xiàng)目得分與測驗(yàn)總分的點(diǎn)二列相關(guān)系數(shù)。計(jì)算公式見公式4。書寫部分為主觀題,需計(jì)算項(xiàng)目得分與測驗(yàn)總分的積差相關(guān)系數(shù)。計(jì)算公式見公式5。

        其中,rpb為點(diǎn)二列相關(guān)系數(shù),為通過該項(xiàng)目的測驗(yàn)總分平均分,為未通過該項(xiàng)目的測驗(yàn)總分平均分,p為通過該項(xiàng)目的人數(shù)百分比,q為未通過該項(xiàng)目的考生人數(shù)百分比,St為全體考生測驗(yàn)總分的標(biāo)準(zhǔn)差。

        其中,x為項(xiàng)目得分的離差,為測驗(yàn)總分的離差為考生人數(shù);SX為該項(xiàng)目的標(biāo)準(zhǔn)差;SY為測驗(yàn)總分的標(biāo)準(zhǔn)差。

        (4)效度

        效度是評價(jià)測驗(yàn)有效性的最重要指標(biāo)之一,反映了測驗(yàn)對想要測量的特質(zhì)的測量程度。本文重點(diǎn)考查結(jié)構(gòu)效度。結(jié)構(gòu)效度指測驗(yàn)測量到的理論結(jié)構(gòu)的程,分析主要采用相關(guān)分析和因子分析考查試題的模型擬合度。HSK(四級)結(jié)構(gòu)(構(gòu)念)見表2。

        1.3 使用軟件

        本文主要使用MCAT,SPSS和Amos軟件進(jìn)行分析。

        2 難度比較

        自動卷和人工卷的難度值和絕對難度差值統(tǒng)計(jì)結(jié)果見表3。

        表2 HSK(四級)結(jié)構(gòu)

        表3 自動卷—人工卷難度值

        難度比較發(fā)現(xiàn),自動卷和人工卷分測驗(yàn)和整體的難度值多處在0.70~0.75,其中人工卷書寫部分為0.6,難度最大。兩套試卷的難度差異較小,各分測驗(yàn)和整體的難度差值在0.15以內(nèi)。具體分析,兩套試卷的聽力、閱讀、整體的難度差值在0.03以內(nèi),書寫部分難度差值為0.13,差值最大。分析顯示,自動卷和人工卷難度水平無明顯差異,均屬于中等偏易難度。

        3 信度比較

        自動卷和人工卷的信度值(α系數(shù))見表4。

        表4 自動卷—人工卷信度值

        結(jié)果發(fā)現(xiàn),自動卷和人工卷的α系數(shù)均在0.80以上,整體信度值在0.90以上,且兩套試卷的信度差值很小,均在0.05以內(nèi),可認(rèn)為兩套試卷考試結(jié)果可信,受隨機(jī)誤差影響小。

        4 區(qū)分度比較

        自動卷和人工卷區(qū)分度值見表5。

        表5 自動卷—人工卷區(qū)分度值

        結(jié)果發(fā)現(xiàn),自動卷和人工卷的區(qū)分度均在0.40以上,且兩者的區(qū)分度差值在0.1以內(nèi),差異很小。結(jié)果顯示自動卷和人工卷的區(qū)分度良好,能區(qū)分不同能力的考生。

        5 效度比較

        5.1 題型相關(guān)分析

        統(tǒng)計(jì)兩套試卷不同題型間的相關(guān),結(jié)果見表6和表7。分析發(fā)現(xiàn),兩套試卷不同題型間的相關(guān)顯著,同時(shí)也保持一定的獨(dú)立性。

        5.2 探索性因子分析

        用探索性因子分析對兩套試卷降維分析,結(jié)果見表8和表9。結(jié)果顯示,自動卷和人工卷均抽取了一個特征值大于1的因子,能解釋的方差分別是63.114%、64.854%,說明整套試卷主要考查一種能力,即是漢語應(yīng)用能力。

        根據(jù)HSK(四級)結(jié)構(gòu)(構(gòu)念),用斜交旋轉(zhuǎn)法提取出三個因子,考查不同題型在三個因子的因子載荷情況。結(jié)果見表10。結(jié)果發(fā)現(xiàn),自動卷和人工卷的因子載荷結(jié)果與HSK(四級)的考試構(gòu)念基本一致,自動卷的因子載荷結(jié)果甚至好于人工卷。自動卷中,聽力3個部分在因子2上載荷最大,考查考生的漢語聽力理解能力,閱讀3個部分在因子1上載荷最大,考查考生的漢語閱讀理解能力,書寫2個部分在因子3上載荷最大,考查考生的漢語書寫表達(dá)能力。除書寫1部分外,人工卷的因子載荷結(jié)果與自動卷類似,書寫1部分在因子1上載荷最大,同時(shí)在因子3上也有一定負(fù)荷,這說明人工卷的書寫1部分對考生的書寫能力和閱讀理解能力均有一定的考查。

        5.3 驗(yàn)證性因子分析

        根據(jù)探索性因子分析結(jié)果,自動卷的因子載荷結(jié)果與HSK(四級)的構(gòu)念一致,人工卷的書寫1部分考查的內(nèi)容有兩種可能,一是考查書寫能力,而

        是同時(shí)考查閱讀和書寫能力。由此得到自動卷和人工卷的可能的模型有兩種。

        表6 自動卷題型間相關(guān)

        表7 人工卷題型間相關(guān)

        表8 自動卷探索性因子分析結(jié)果

        表9 人工卷探索性因子分析結(jié)果

        表10 自動卷—人工卷因子載荷結(jié)果

        自動卷模型和人工卷模型1:

        對三個模型進(jìn)行驗(yàn)證性因子分析,三個模型擬合結(jié)果見表11。

        表11 模型擬合結(jié)果

        以上擬合指標(biāo)顯示,自動卷模型指標(biāo)好于人工卷,人工卷2擬合指標(biāo)好于人工卷1。結(jié)果說明,人工組卷的書寫1部分對考生的閱讀理解能力有一定考查,自動組卷能很好地規(guī)避這個問題,本次自動組卷成功。

        6 結(jié)論

        以上研究結(jié)果表明,自動卷難度與人工卷相近,屬于中等偏易水平;整體信度值均在0.90以上,結(jié)果可信;兩者區(qū)分度值均在0.40以上,且差值很小,區(qū)分度指標(biāo)良好;兩套試卷的模型擬合結(jié)果與HSK(四級)構(gòu)念基本一致,自動卷的模型擬合結(jié)果好于人工卷,能避免出現(xiàn)書寫1部分的擬合模糊。綜上,自動卷和人工卷題目質(zhì)量良好,將來的HSK考試中,可將自動卷用于正常考試。

        [1]戴海琦,張鋒,陳雪楓.心理與教育測量[M].廣州:暨南大學(xué)出版社,2007:45-83.

        [2]符華均,張晉軍,李亞男,等.新漢語水平考試HSK(五級)效度研究[J].考試研究,2013(3).

        A Comparative Study of HSK4 Test Project Quality under Two Different Test-paper Assembly Ways

        LU Shuangshuang,PENG Jie&LIU Xiaolong

        The article compared the project quality of HSK4 test paper assembled by content expert with automatically assembled test paper(Hereinafter referred to as“expert paper”and“automatic paper”).The project quality analysis includes the difficulty,reliability,discrimination,and the validity of projects.The results showed that both the two test papers had high project quality.In the model fitting for validity assessment,the results of automatic paper indicated that automatic paper could avoid the Writing One part’s investigation of the candidates’reading comprehension ability.Finally,the author concludes that automated test assembly program is a success. Automatic test papers can have accurate measurement of test takers’Chinese application ability and can be applied to the test in the future.

        HSK;Automatically Assemble;Assembled by Expert;Project Quality

        G405

        A

        1005-8427(2015)11-0058-6

        盧雙雙,女,漢考國際教育科技(北京)有限公司,考務(wù)專員(北京 100088)

        彭 杰,男,漢考國際教育科技(北京)有限公司,考務(wù)專員(北京 100088)

        劉小龍,男,漢考國際教育科技(北京)有限公司,考務(wù)經(jīng)理(北京 100088)

        猜你喜歡
        區(qū)分度效度測驗(yàn)
        慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
        淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
        圖形推理測量指標(biāo)相關(guān)性考察*
        江淮論壇(2018年4期)2018-08-24 01:22:30
        《新年大測驗(yàn)》大揭榜
        趣味(語文)(2018年7期)2018-06-26 08:13:48
        淺觀一道題的“區(qū)分度”
        兩個處理t測驗(yàn)與F測驗(yàn)的數(shù)學(xué)關(guān)系
        考試周刊(2016年88期)2016-11-24 13:30:50
        單維參數(shù)型與非參數(shù)型項(xiàng)目反應(yīng)理論項(xiàng)目參數(shù)的比較研究*
        被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
        外語形成性評估的效度驗(yàn)證框架
        你知道嗎?
        挺进朋友人妻雪白的身体韩国电影| 亚洲成人av在线播放不卡| 国产内射视频在线播放| 日韩精品av在线一区二区| 亚洲丝袜美腿在线视频| 中文字幕aⅴ人妻一区二区| 伊人影院综合在线| 日韩在线视精品在亚洲| 人妻乱交手机在线播放| 亚洲中文字幕日产无码| 亚洲av无码潮喷在线观看| 亚洲第一无码精品久久| 日本人妻三级在线观看| 亚洲av无码偷拍在线观看| 久热综合在线亚洲精品| 欧美日韩亚洲综合久久久| 国产精品髙潮呻吟久久av| 亚洲精品天天影视综合网| 亚洲国产精品久久久久婷婷老年 | 成人av片在线观看免费| 日本护士xxxx视频| 全免费a级毛片免费看视频| 国产91精品丝袜美腿在线| 亚洲av区,一区二区三区色婷婷| 国产揄拍国产精品| 亚洲AⅤ永久无码精品AA| 久久久免费精品国产色夜| 国产av精品麻豆网址| 中国农村妇女hdxxxx| 无码不卡一区二区三区在线观看| 风间由美中文字幕在线| 日韩一区二区三区无码影院| 久久九九国产精品怡红院| 91成人午夜性a一级毛片| 久久久亚洲精品蜜臀av| 欧美xxxxx高潮喷水| 久久老子午夜精品无码怎么打| 9丨精品国产高清自在线看| 国产一区二区免费在线视频| 亚洲中文字幕在线第二页| 国产女高清在线看免费观看|