亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用SPSS實現(xiàn)命題質(zhì)量的定量分析

        2015-09-10 07:22:44賴翔暉張華
        考試周刊 2015年88期
        關(guān)鍵詞:定量分析

        賴翔暉 張華

        摘 要: 考試是評價教育效果的重要手段,而命制試題則是考試中的重要一環(huán)。過去,對試卷命題的質(zhì)量評價常以主觀定性的方式為主?,F(xiàn)在可以依靠SPSS(統(tǒng)計產(chǎn)品與服務(wù)解決方案)軟件,實現(xiàn)對命題質(zhì)量的定量分析。

        關(guān)鍵詞: 命題質(zhì)量 定量分析 質(zhì)量評價

        一、命題定量分析的準備工作

        啟動SPSS19.0中文版,選擇“變量視圖”中,在名稱下輸入學(xué)號、題目1—12、總分等命題基本情況項目。在類型標記中,將學(xué)號定義為名義,將題目1—12定義為度量,小數(shù)根據(jù)實際情況設(shè)定,其他項保留默認設(shè)置。選擇“數(shù)據(jù)視圖”標簽,在各行內(nèi)輸入學(xué)生的各題得分和總分數(shù)據(jù)(圖2)。

        圖1 定義變量設(shè)定圖

        圖2 數(shù)據(jù)輸入圖

        二、命題的定量分析

        (一)描述性統(tǒng)計量分析

        用以描述考試總體情況的各分數(shù)統(tǒng)稱為描述性統(tǒng)計量。在SPSS中,點擊“分析—描述分析—頻率”。將“總分”等變量名稱選入待計算變量框中,在“統(tǒng)計”中選擇要計算的統(tǒng)計量,選中均值、極值、標準差、中位數(shù)等項,最后輸出結(jié)果(表3)。

        表3 有效數(shù)據(jù)的得分描述性統(tǒng)計

        (二)試題的正態(tài)分布預(yù)期

        在學(xué)生群體足夠大時,學(xué)生的能力呈正態(tài)分布。處于能力尖端和尾端的學(xué)生數(shù)量少,處于能力中端的學(xué)生數(shù)量多。在考試命題適宜,教學(xué)狀況正常,學(xué)生水平相當,試卷評閱嚴謹?shù)那疤嵯?,一份合格的試題,所反映出的學(xué)生成績應(yīng)呈現(xiàn)正態(tài)分布的特點。為研究試題能否體現(xiàn)學(xué)生能力的正態(tài)分布,可在SPSS軟件中點擊“分析—描述分析—頻率”,在“頻率”對話框中選擇“圖表”,點選繪制“總分”的直方圖并標變化曲線(圖4)。

        圖4 學(xué)生總分的直方—變化曲線圖

        若學(xué)生總分的直方—變化曲線圖能呈現(xiàn)正態(tài)分布,那么,可進一步探究命制試題的正態(tài)分布預(yù)期??衫脝蝹€樣本K-S校驗測查給定數(shù)據(jù)與正態(tài)分布間的顯著差異。在SPSS中,點擊“分析—非參數(shù)檢驗”,對“總分”進行單個樣本K-S檢驗(表5)。

        表5 試題總分的單樣本Kolmogorov-Smirnov檢驗

        (三)難度

        試題的難度(P)是測驗題目難易程度的統(tǒng)計量。試卷難度等于試卷內(nèi)各題的平均難度。要觀測命題試卷難度,應(yīng)先測量命題試卷內(nèi)各題難度。試題計分方法不同,難度計算方法不同。

        二分法計分(選擇題、判斷題)題目的難度統(tǒng)計。對于二分法計分的題目,答案只有對與錯兩種可能的結(jié)果(即答對得分,答錯不得分)。此類題目難度通常用通過率(P)表示。其中,P=1—R/N(其中R為答對該題的人數(shù),N為答題總?cè)藬?shù))。由此,可在SPSS中,運用“轉(zhuǎn)換—計算變量”方法,在“計算變量”對話框中輸入公式,直接算出二分法題目難度(表6)。

        表6 二分法計分題目難度值

        非二分法計分(主觀題、論述題)題目的難度統(tǒng)計。對于非二分法計分的題目,難度(P)可以通過公式P=1—X/W(X為該題目均分值,W為該題滿分值)計算??刹捎谩坝嬎阕兞俊狈椒ㄖ苯虞斎牍剑愠龇嵌址}目難度(表7)。

        表7 非二分法題目難度值

        全卷難度值(P)等于卷內(nèi)各題難度平均值,采用SPSS“計算變量”可得p=0.4。

        (四)區(qū)分度

        區(qū)分度是反映試題區(qū)別學(xué)生水平和能力的統(tǒng)計量。在實際統(tǒng)計時,常以考試總分作為考生的實際水平,而把某題的得分與學(xué)生總分之間的相關(guān)系數(shù)作為該題的區(qū)分度。

        客觀題的區(qū)分度統(tǒng)計,可把客觀題得分視為等間距測度的連續(xù)變量,采用Spearman等級相關(guān)分析統(tǒng)計區(qū)分度。主觀題的區(qū)分度統(tǒng)計,可把主觀題成績視為非等間距測度的連續(xù)變量,采用Pearson相關(guān)分析。在SPSS中,點擊“分析—相關(guān)—雙相關(guān)”。先選擇客觀題各題分數(shù)和總分采用Pearson相關(guān)分析(1-6),再選擇主觀題(7-12(2))各題分數(shù)和總分采用Spearman相關(guān)系數(shù)分析,得到結(jié)果合成(表8)。

        表8 各題區(qū)分度匯總表

        (五)信度

        信度是衡量一次考試可靠性、穩(wěn)定性的統(tǒng)計量。信度代表著試題的可靠性,其取值在0至1之間。信度越高,可靠性越好,但容易造成成績標準差過大。一般采用SPSS中克倫巴赫系數(shù)(Alpha模型)計算命題試卷一致性信度系數(shù)。在SPSS中,點擊“分析—度量—可靠性分析”。在可靠性分析對話框中,選擇試卷各題得分數(shù)據(jù)。點擊“統(tǒng)計量”,選擇“如果項已刪除則進行度量”,結(jié)果如下(表9-10):

        表9 信度統(tǒng)計值表

        表10 刪除變量后項目統(tǒng)計值表

        (六)效度

        效度是指測試結(jié)果的準確性與有效性程度的統(tǒng)計量,即一個測驗?zāi)軌驕y量學(xué)生水平的程度[2]??刹捎眯诵Ф确y量試題的效度。將學(xué)生的平時成績作為效度分析的校標,利用皮爾森相關(guān)系數(shù)法計算命題測試分數(shù)與校標之間的相關(guān)系數(shù),結(jié)果即為試題效度(表11)。

        圖表11 命制試題得分與平時成績間皮爾遜相關(guān)系數(shù)分析

        三、命題質(zhì)量評價

        第一,描述性統(tǒng)計量分析。由表3可知,命題平均成績?yōu)?2.54分(滿分49分),最高分45分,最低分12分,標準差為6.94。平均分、標準差數(shù)值適當,極值差距較大,體現(xiàn)了學(xué)生個體之間對題目的理解差異大。由此可見,試卷命題中,部分題目可能表意不清,引發(fā)部分學(xué)生無從下手作答的情況。此卷應(yīng)注意題干的表達,使學(xué)生清晰了解題目意圖。

        第二,正態(tài)分布預(yù)期分析。由圖4可知,學(xué)生總分變化曲線呈正態(tài)分布曲線樣式,因而命制試題具有正態(tài)分布預(yù)期。由表5進一步分析K-S檢驗中的各數(shù)值可知,Z值為0.493,sig(雙側(cè)P值)=0.851>0.05,由sig(漸進顯著性)>0.05,可得給定數(shù)據(jù)與正態(tài)分布沒有顯著性差異,即總分數(shù)據(jù)符合正態(tài)分布要求。

        第二,試題難度分析。一般認為,命題難度在0.4至0.7之間為宜,難度值小于0.4的題目難度較小,難度值大于0.7的題目較大。一般認為,最好的試題難度應(yīng)接近于中等難度(即p=0.5)。因此,本命制試題全試卷具有中等偏下的難度(p=0.4)。這份命制試題如果運用在終結(jié)性考核中,用以檢測學(xué)生在群體中知識掌握水平,作為合格水平測驗,則效果較好。但作為過程性考核,則其難度水平較低,需適當加大難度。由表6、7可知,T9、T1難度過小,建議予以刪改。T6、T3難度過大,應(yīng)進一步結(jié)合課程評價標準加以研究,檢驗是否超綱。

        第三,區(qū)分度分析。一般認為區(qū)分度在0.4以上的題目,鑒別能力優(yōu)秀;區(qū)分度在0.3至0.39間的題目,鑒別能力良好;區(qū)分度在0.39以下的題目,應(yīng)進行刪改。由表8可知,全卷區(qū)分度總體水平適宜,能夠區(qū)分學(xué)生掌握知識程度的優(yōu)劣。但T1、T3、T4、T6四題區(qū)分度較低(<0.39),說明學(xué)生在作答這些題目時,掌握的知識和對知識理解、運用的能力不能充分體現(xiàn)在試卷答題分數(shù)上,因此,應(yīng)作刪改。

        第四,信度分析。從表9可知,本次考試的信度為0.455。普遍而言,學(xué)校測驗采用試卷信度應(yīng)達到0.5以上。本命題試卷達不到可信要求,為提高本卷信度,本卷應(yīng)進行修改。從表10可知,刪除T1后全卷信度提升至5.0,故可考慮對T1進行替換。同時,目前本卷題量共12題,題目數(shù)量較少,可考慮通過適當增加題量的方法,提高全卷信度。

        第五,效度分析。從表11可知,全卷效度值為0.837,在0.01的顯著性水平下,sig.值(顯著性)為0.000,表明學(xué)生完成命制試題的得分與學(xué)生平時的成績兩者間呈顯著的相關(guān)關(guān)系。命制試題具有較高的效度。

        參考文獻:

        [1]張雪冰.試卷分析中的正態(tài)分布和非正態(tài)分布[J].安徽建筑工程學(xué)院學(xué)報(自然科學(xué)版),2009.8(17-4).

        [2]陳伙平.教育科學(xué)研究方法與原理[M].福建科學(xué)技術(shù)出版社,2005.7,124.

        猜你喜歡
        定量分析
        定量分析的特點及其重要性
        大規(guī)模古籍文本在中國史定量研究中的應(yīng)用探索
        FTA在工業(yè)氣體探測報警系統(tǒng)中的應(yīng)用
        商務(wù)英語詞匯量與商務(wù)英語閱讀能力相關(guān)性研究
        國外藝術(shù)體操科研現(xiàn)狀
        體育時空(2016年9期)2016-11-10 20:23:55
        基于層次分析法的電力公司財務(wù)風險評價
        基于實時熒光PCR的鵝鴨混合絨定量檢測
        表面增強拉曼光譜法定量檢測食品中香豆素
        秦皇島近岸海域浮游植物調(diào)查
        欧美国产亚洲日韩在线二区| 女人无遮挡裸交性做爰| 国产免费艾彩sm调教视频| 亚洲精品国产第一区二区尤物 | 国产三级av在线播放| 久久久精品人妻一区二区三区妖精 | 婷婷综合久久中文字幕蜜桃三电影| 亚洲一区二区精品久久岳| 99伊人久久精品亚洲午夜| 欧美性生交活xxxxxdddd | 又湿又紧又大又爽a视频国产| 中国丰满熟妇xxxx| 窄裙美女教师在线观看视频| 蜜桃av在线播放视频| 国产日韩精品suv| 免费无码又爽又刺激网站| 欧美成人精品福利在线视频| 人妻少妇被猛烈进入中文| 国产精品毛片va一区二区三区 | 亚洲精品夜夜夜| 日本啪啪一区二区三区| 久久精品亚洲成在人线av乱码| 亚洲国产av玩弄放荡人妇| 精品欧美乱子伦一区二区三区 | 少妇被猛烈进入到喷白浆| 亚洲第一av导航av尤物| 亚洲Va中文字幕久久无码一区| 福利视频在线一区二区三区 | a级毛片免费完整视频| 久久青草伊人精品| 亚洲成人免费久久av| 亚洲av成人片色在线观看| 亚洲精品久久国产高清情趣图文 | 免费看男女啪啪的视频网站| 成人免费播放视频777777| 亚洲精品国产成人| 人妻少妇精品视中文字幕国语| 91九色熟女潮喷露脸合集| 欧美精品黑人粗大免费| 中文字幕AⅤ人妻一区二区 | 香港台湾经典三级a视频|