亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SPSS軟件的雙語試卷質(zhì)量與學生成績定量分析

        2014-02-05 12:15:50王本洋徐正春
        中國林業(yè)教育 2014年1期
        關鍵詞:區(qū)分度效度信度

        王本洋 唐 松 徐正春

        (華南農(nóng)業(yè)大學林學院,廣州 510642)

        雙語教學是我國教育改革的一個亮點,雙語教學研究也因此成為我國教育研究的一個熱點。英國《朗文語言教學及應用語言學辭典》(Longman Dictionary of Language Teaching &Applied Linguistics)對雙語教學(Bilingual Education)的定義是the use of a second or foreign language in school for the teaching of content subject,即在學校里使用第二語言或外語進行學科教學。我國《雙語教學示范課程建設項目評審指標體系》中指出,雙語教學是指將母語外的另一種外國語言直接應用于非語言類課程教學中,并使學生同步獲取外語和學科知識的一種教學模式。

        試卷分析是考試之后的一項重要工作,其結(jié)果是對考試工作進行總結(jié)并給予恰當評價的重要依據(jù)[1]。試題質(zhì)量是保證考試成績客觀反映學生的知識、能力和素質(zhì)狀況的關鍵[2]。教師通過對試卷進行分析,評價試題的難易程度,改善和提高試題的質(zhì)量,并發(fā)現(xiàn)教學過程中的不足,改進教學方法,提高教學質(zhì)量[1]。

        試卷分析包括試卷成績分析和試卷質(zhì)量分析2部分[3-4],但多數(shù)文獻重點研究了試卷質(zhì)量的分析及其計算方法[1,5-11],對統(tǒng)計軟件在試卷分析中的應用介紹不多[3,4,12],對學 生成績 的后續(xù) 分析尚 未深入。張瑤等[13]利用層次聚類和關聯(lián)規(guī)則技術對學生試卷進行分析,得到特定題目知識點之間的相關性。譚慶[14]將關聯(lián)規(guī)則Apriori算法應用于試卷成績分析中,挖掘?qū)W生各科目成績的優(yōu)良影響關系,并產(chǎn)生關聯(lián)規(guī)則。譚慶[15]、張曉翊等[16]將k-means聚類算法應用于試卷成績分析中,對學生試卷成績進行類別劃分。

        SPSS軟件廣泛應用于經(jīng)濟學、生物學、教育學、心理學等領域,是與SAS、BMDP 齊名的3 大統(tǒng)計軟件之一。其用戶界面友好,通過菜單操作即可實現(xiàn)絕大部分統(tǒng)計分析功能。本研究借助SPSS 13.0軟件,在綜合運用基本描述性統(tǒng)計指標和4度指標評價試卷質(zhì)量的基礎上,運用方差分析方法,實現(xiàn)對“旅游禮儀禮節(jié)”雙語課程某次考試的試卷質(zhì)量及學生成績的定量分析,為更好地開展雙語教學工作提供參考。

        一、材料與方法

        (一)材料

        數(shù)據(jù)來自華南農(nóng)業(yè)大學雙語選修課程“旅游禮儀禮節(jié)”一次考試的試卷。其試題均以英語形式出現(xiàn),考生可選用中文回答的試題約占50%。試卷分4個大題,滿分100分,第一題(Part1)為選擇題,占20分;第二題(Part2)為判斷題,占20 分;第三題(Part3)為名詞解釋題,占20 分;第四題(Part4)為簡答題,占40 分。考生由2008級旅游管理專業(yè)5個班級(A~E)中選修該課程的學生組成,人數(shù)為106人,其中男生20人,女生86人。

        由于試卷質(zhì)量直接影響成績分析的有效性,因此本研究先分析試卷質(zhì)量,然后再分析學生的成績。

        (二)試卷質(zhì)量分析

        試卷定量分析常用4度指標(即難度、區(qū)分度、效度和信度)來進行,這是統(tǒng)計學方法在科學分析考試中的一種應用[1]。任漢斌和單蓉[11]以教育統(tǒng)計與測量理論為基礎,根據(jù)學生考試原始成績,用4度指標構建了試卷質(zhì)量分析的數(shù)學模型。安萍莉等[2]選擇平均成績、標準差、全距、眾數(shù)、偏度、峰度、平均難度等作為分析指標,分別從橫向的基礎課、專業(yè)基礎課、專業(yè)課和縱向的不同年份進行對比分析,對各門課的考試成績進行了研究。

        根據(jù)“旅游禮儀禮節(jié)”雙語課程的特點,該次試卷質(zhì)量分析的主要指標有12個,分為2類:一類是考試成績的基本描述性統(tǒng)計指標,包括成績的均值(Mean)、最 小 值(Min.)、最 大 值(Max.)、全 距(Range)、標 準 差(Std.Dev.)、峰 度(Ku.)、偏 度(Sk.)和成績分布正態(tài)性等8個指標;第2類是4度指標,各個指標的原始模型參見文獻[1-2,5,8,10],SPSS軟件操作參見文獻[3-4]。

        1.難度

        2.信度

        采用克朗巴哈α值(Cronbach′s Alpha)計算信度,,其中,分別表示第i題和總分的方差。

        3.效度和區(qū)分度

        用Pearson相關系數(shù)r表示效度(x,y 均為題目得分)和區(qū)分度(x,y 其中一項為題目得分,另一項為總分)。

        (三)學生成績分析

        借助方差分析[17]方法考查學生的考試成績,通過對組間差異與組內(nèi)差異的比值分析來綜合性地確定多組平均數(shù)差異的顯著性。當組間和組內(nèi)方差的F 檢驗結(jié)果有顯著性差異時,需要對各對平均數(shù)進行差異性檢驗(即多重比較)和方差齊性檢驗。

        當方差分析要求的條件不滿足時,可使用非參數(shù)檢驗方法。非參數(shù)檢驗不要求總體滿足正態(tài)性和方差齊性等條件。另外,對幾個獨立樣本差異的顯著性,可用Kruskal-Wallis檢驗,它相當于對多組平均數(shù)進行的非參數(shù)的方差分析[17]。

        二、結(jié)果與分析

        (一)基本描述性統(tǒng)計指標

        成績的基本描述性統(tǒng)計數(shù)據(jù),見表1。D 班的表現(xiàn)與其他班有差異,其平均成績低于總體平均值,全距(27)和標準差(8.684)均為最大。

        表1 成績的基本描述性統(tǒng)計指標

        成績分布的正態(tài)性檢驗,見表2。從表2看,有4個班(B、C、D 和E)的成績符合正態(tài)分布(Sig.>0.05),A 班和混合班的成績不符合正態(tài)分布(Sig.<0.05)。

        表2 成績分布的正態(tài)性

        (二)“4度”指標

        1.難度

        從試卷難 度看,D 班最大(0.16),B 班最?。?.11);從試題難度看,題三(Part3)最大,且在D 班最大(0.38),B班最小(0.18)。總體上,該套試卷不難(難度0.13<0.2),僅題三(Part3)的難度較大(難度0.24),見表3。

        表3 試卷難度

        難度分析表明,同一套試卷在不同班級表現(xiàn)出不同的難度,不同題目的難度也存在一定差異。另外,試題難度均值稍大于試卷難度。因此在僅知道各試題難度的情況下,可用其均值估算試卷難度。

        2.信度

        信度分析結(jié)果表明,該套試卷的信度值為0.995。

        3.效度和區(qū)分度

        該套試卷各題目之間的相關系數(shù),見表4,僅題三(Part3)與題四(Part4)間為0.266,其余均小于0.2,說明該套試卷的效度較高。該套試卷各題與總分之間的相關系數(shù),僅題一(Part1)與總分(Total)之間為0.293,其余均大于0.4,其中題三(Part3)與總分(Total)之間達0.743,說明該套試卷的區(qū)分度較高。

        表4 相關系數(shù)的效度和區(qū)分度

        (三)學生成績分析

        1.完全隨機設計的方差分析

        SPSS軟件設計模型為Intercept+Class+Gender+Class*gender,即檢驗班 級(Class)、性 別(Gender)以及班級與性別間交互效應(Class*gender)對成績的影響。

        方差分析結(jié)果表明,班級與性別間無交互效應(Sig.=0.791>0.05)。Levene檢驗結(jié)果表明,F(xiàn)=3.130,Sig.=0.002<0.05,表明方差不齊。在此前提下基于Games-Howell進行的Post Hoc分析表明,5 個班級間的成績沒有顯著性差異,見表5。

        表5 完全隨機設計的方差分析

        2.嵌套設計的方差分析

        SPSS 模型為Intercept+Class+Gender(class)。在班級與性別間無交互效應條件下,考慮到不同班級的不同性別間可能存在顯著性差異,因此把班級(Class)作為一級因素,性別(Gender)作為二級因素,檢驗兩個因素對成績的影響。

        方差分析表明,不同班級(Sig.=0.112>0.05)及其不同性別(Sig.=0.360>0.05)間的成績無顯著性差異,見表6。

        表6 嵌套設計的方差分析

        3.非參數(shù)檢驗

        根據(jù)前述分析,方差分析的前提條件方差齊性不滿足。因此改用非參數(shù)方法檢驗班級、性別對成績的影響。Kruskal-Wallis檢驗表明,不同班級的成績間沒有顯著性差異(Sig.=0.359>0.05),不同性別間的成績有顯著性差異(Sig.=0.022<0.05)。因此,根據(jù)成績基本描述性統(tǒng)計指標得到的結(jié)論,即D班與其他班有差異,并不具有統(tǒng)計學意義,見表1。

        進一步分析表明,平均成績方面,女生(87.86)大于男生(84.10);成績標準差方面,女生(6.096)小于男生(7.033),見表7。

        表7 成績的基本描述性統(tǒng)計指標

        三、討論與結(jié)論

        (一)關于試卷質(zhì)量

        根據(jù)數(shù)理統(tǒng)計學基本原理,一般考試成績的分布應該符合正態(tài)分布,偏度介于0 與±3 之間[2]。經(jīng)正態(tài)性檢驗,5個班級中僅A 班的成績不符合正態(tài)分布,各班成績的偏度、峰度均接近于0。因此成績呈正態(tài)分布僅具有一般意義,并非絕對。

        標準差是測定離散度的重要指標,若以標準差介于9~15之間判斷試題質(zhì)量為較好[2],則該套試卷在D 班的表現(xiàn)為質(zhì)量較好。這表明同一套試卷在不同情況下的表現(xiàn)可能不同,即標準差并非判斷試題質(zhì)量的唯一指標。

        難度指測驗試題的難易程度,一道試題的難度既可反映試題本身的復雜程度,又可間接反映教學狀況。同一試題,在不同對象、不同環(huán)境中使用,所得的難度值不一定相同[1]。因此,命題時試題難度的掌握非常復雜[11]。

        根據(jù)考試的目的和性質(zhì),一般期末考試難度值應低一些,而選拔考試難度應高一些[11]。但具體到試題難易程度的劃分,仍存在不同的難度標準。如馬少仙[5]認為,試卷難度P 在0.3~0.5之間為宜,P >0.7 為難題,P <0.2 為易題。任漢斌和單蓉[11]認為,期末考試難度值P 應介于0.2~0.4之間,小于0.2為易題。趙立新等[1]認為在常模考試中,大多數(shù)試題的難度值P 應控制在0.3~0.7之間,期末考試的試卷難度值P 控制在0.2~0.3之間較好,因為這樣既有利于測量學生的真實水平,又能較好的控制不及格率。

        但是,不及格率是一個敏感的話題??紤]到多方面的實際狀況和實踐經(jīng)驗,高年級專業(yè)課程考試的難度值P 實際上應控制在0.1~0.3之間為宜。這樣既能讓那些專業(yè)知識熟練的學生獲得高分,又能讓那些專業(yè)知識薄弱的學生勉強通過課程考試。

        效度反映測量結(jié)果的準確性和有效性的程度[18]。效度的估計方法有3 大類,即內(nèi)容效度、結(jié)構效度和效標關聯(lián)效度[19]。但前兩者無簡單有效的定量統(tǒng)計方法,效標關聯(lián)效度又稱為統(tǒng)計效度或經(jīng)驗效度,可用測驗分數(shù)和效標之間的相關系數(shù)來定量表示效度的高低[1]。

        效標可分為外部效標和內(nèi)部效標2類。效標不同,其效度可能大相徑庭[1]。一般可選擇公認的比較客觀的一次考試成績或前承(或后續(xù))課程中相關課程的成績作為外部效標[1]。但由于試題的外部效標難以尋找,因此可把試題總分作為內(nèi)部效標,把試題得分與總分之間的相關系數(shù)作為該試題的效度[11]。通常認為效標關聯(lián)效度E >0.7為優(yōu)秀,介于0.4~0.7為較好,E <0.4為差[1,11]。

        效度計算也可采用試題之間的相關系數(shù)來表示[7]。相關系數(shù)矩陣中各元素值越小,說明試卷覆蓋面越寬;反之說明題目內(nèi)容高度相關,應加以調(diào)整。一般要求相關系數(shù)小于0.2為好。

        根據(jù)區(qū)分度的含義,試卷的區(qū)分度越大越好,這也比較難以做到[1]。另外,根據(jù)不同性質(zhì)、目的和要求,可適當調(diào)整試卷區(qū)分度的評價標準[1,11]。一般認為區(qū)分度大于0.4為優(yōu),介于0.3~0.39為良好,介于0.2~0.29為尚可,小于0.2為差[1,5,11]。由于以總分為內(nèi)部效標的效標關聯(lián)效度計算結(jié)果表示了該題得分與總分具有的內(nèi)在一致性,亦體現(xiàn)了被試者水平高低的鑒別能力,因此,試題的效度也是試題的一種區(qū)分度[11]。

        信度指測量結(jié)果的穩(wěn)定性或可靠性的程度,亦即測量的結(jié)果是否真實、客觀地反映了考生的實際水平[9]。它是衡量考試質(zhì)量的一個重要技術指標,其主要作用是判斷考試的優(yōu)劣[11]。在實際測量中,可用穩(wěn)定性系數(shù)、等值系數(shù)、內(nèi)部一致性系數(shù)、系數(shù)等來度量信度,而可操作性強的有分半信度和系數(shù)[1]。利用SPSS 等統(tǒng)計軟件可以方便地求解系數(shù),因此筆者建議采用該系數(shù)為信度指標,目的是統(tǒng)一計算方法和評價標準。

        信度要求沒有明確的標準,因考試性質(zhì)和目的不同而異[1,11]。一般情況下,要求標準化測試的信度值在0.90以上[11]。對于期末考試,信度值大于0.9為優(yōu)秀,介于0.7~0.9為較好,小于0.7為不合格試卷[1,11]。

        由于沒有更好的校標可供選擇,為了統(tǒng)一計算方法和評價標準,筆者建議采用題目之間的相關系數(shù)作為效度指標,題目與總分之間的相關系數(shù)作為區(qū)分度指標。

        傳統(tǒng)試卷質(zhì)量評價側(cè)重對試卷進行宏觀整體的分析與評價,或者注重成績的基本描述性統(tǒng)計指標,或者注重試卷的4度指標。本研究表明,結(jié)合基本描述性統(tǒng)計指標的4度分析能更全面客觀地反映考試結(jié)果。為了科學合理評價試卷質(zhì)量,評價過程應避免單獨使用某一種或某一類指標。一份具有合理的難度(介于0.1~0.3 之間)、較高信度(不小于0.9)、效度(題目間相關系數(shù)不大于0.2)和區(qū)分度(題目與總分間相關系數(shù)不小于0.4)、成績近似正態(tài)分布的專業(yè)課試卷,應視為優(yōu)秀試卷。這樣,一方面可以為本科教學水平評估中的試卷質(zhì)量分析提供依據(jù),另一方面可以更科學、準確、有效地反映教師的授課水平和學生的學習效果[8]。

        (二)關于學生成績

        本次取樣的學生成績在性別間有顯著差異(Sig.=0.022<0.05),班級間沒有顯著性差異(Sig.=0.359>0.05)。

        分析表明,作為教學對象的大學生具有顯著的個體差異性[20]和一定的群體差異性。女生與男生學習成績表現(xiàn)出來的顯著性差異實際上反映了女生與男生在學習態(tài)度、學習能力、學習方法等方面的群體差異性。一般認為女生對英語的學習興趣更強,時間投入更多。筆者對學生進行的面對面訪談也證實,女生對雙語教學的興趣普遍高于男生。

        分析表明,班級之間沒有顯著性差異的原因可能有兩種,一是課程性質(zhì)為選修課,這至少保證絕大多數(shù)學生都有相似的興趣基礎,避免了必修課程的學生群體中可能存在的差異性;二是班風學風相近,這除了學生自身的原因,也與班級管理者有一定關系。

        興趣不足和時間投入較少都是造成學生學習壓力的重要原因,而學習壓力是造成大學生心理壓力的重要影響因素之一[21]。大學教學是以大學生的發(fā)展為中心,以大學生的自由、全面、和諧發(fā)展為目標的創(chuàng)造性活動[20]。因此,在大學教學尤其是雙語教學過程中,應在關注學生個體差異的基礎上,關注學生的群體差異,搞好雙語教學工作、提高雙語教學質(zhì)量。這是貫徹落實《教育部關于進一步深化本科教學改革全面提高教學質(zhì)量的若干意見》精神、適應經(jīng)濟全球化和科技革命挑戰(zhàn)、深化本科教育教學改革、推動高質(zhì)量國際化人才培養(yǎng)的重要舉措。

        [1]趙立新,陳文藝,郭子君.試卷質(zhì)量的定量評價[J].華南農(nóng)業(yè)大學學報:社會科學版,2004(4):136-141.

        [2]安萍莉,郭淑媛,王嗇,等.大學考試試題質(zhì)量研究[J].高等農(nóng)業(yè)教育,2006(2):43-46.

        [3]任艷玲,朱明放.基于統(tǒng)計軟件SPSS 的學生試卷分析方法[J].重慶工學院學報:自然科學版,2007,21(4):95-98.

        [4]徐全元,魯瑩,張雁.基于SPSS的“大學計算機基礎”考試試卷分析[J].電腦知識與技術,2009,36(5):10484-10485,10497.

        [5]馬少仙.試卷質(zhì)量的統(tǒng)計分析方法[J].西北民族學院學報:自然科學版,2001,22(4):13-16.

        [6]馮子華,程立生,鄭中兵.課程考核試卷質(zhì)量分析的EXCEL實現(xiàn)[J].高等農(nóng)業(yè)教育,2004(3):53-55.

        [7]黃敏.數(shù)理統(tǒng)計在試卷分析中的應用[J].玉溪師范學院學報,2004,20(3):10-13.

        [8]吳承禎,何麗華,林立群,等.試卷質(zhì)量分析方法及其應用[J].中國林業(yè)教育,2008,26(3):26-30.

        [9]曹雯梅,陳世昌,程亞樵,等.同異聯(lián)系勢綜合分析法在高校試卷質(zhì)量評判上的應用[J].河南農(nóng)業(yè):教育版,2008(6):3-4,6.

        [10]劉淼.用數(shù)理統(tǒng)計的原理評估試卷質(zhì)量[J].大學數(shù)學,2009,25(2):164-168.

        [11]任漢斌,單蓉.基于MATLAB 的試卷質(zhì)量分析方法研究[J].廣西民族師范學院學報,2011,28(3):30-32.

        [12]吳成秋,賀棟梁,黃波,等.SPSS for Windows在試卷分析中的應用探討[J].西北醫(yī)學教育,2006,14(4):401-403.

        [13]張瑤,陳高云,王鵬.數(shù)據(jù)挖掘技術在試卷分析中的應用[J].西南民族大學學報:自然科學版,2008,34(4):839-842.

        [14]譚慶.關聯(lián)規(guī)則Apriori算法在試卷成績分析中的應用研究[J].信陽師范學院學報:自然科學版,2009,22(2):300-303.

        [15]譚慶.基于k-means聚類算法的試卷成績分析研究[J].河南大學學報:自然科學版,2009,39(4):412-415.

        [16]張曉翊,孟德欣,余翠蘭.基于K-means算法的學生試卷成績分析[J].寧波大學學報:理工版,2010,23(4):67-70.

        [17]王孝玲.教育統(tǒng)計學[M].2 版.上海:華東師范大學出版社,2001:156-193,311-336.

        [18]胡中鋒,李方.教育測量與評價[M].廣州:廣東高等教育出版社,2000:31-58.

        [19]美國教育研究會,美國心理學協(xié)會,全美教育測量學會.教育與心理測試標準[M].燕娓琴,謝小慶,譯.沈陽:沈陽出版社,2003:1-25.

        [20]王本洋,羅富和.以人為本與因材施教的探討[J].中國林業(yè)教育,2010,28(1):1-4.

        [21]王本洋.農(nóng)林類大學生心理健康狀況SAD 分析[J].中國林業(yè)教育,2009,27(2):49-51.

        猜你喜歡
        區(qū)分度效度信度
        《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
        慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
        淺談試卷分析常用的幾個參數(shù)及其應用
        圖形推理測量指標相關性考察*
        江淮論壇(2018年4期)2018-08-24 01:22:30
        淺觀一道題的“區(qū)分度”
        科技成果評價的信度分析及模型優(yōu)化
        單維參數(shù)型與非參數(shù)型項目反應理論項目參數(shù)的比較研究*
        心理學探新(2015年3期)2015-12-27 06:25:14
        體育社會調(diào)查問卷信度檢驗的方法學探索——基于中文核心體育期刊163篇文章分析
        被看重感指數(shù)在中國大學生中的構念效度
        心理學探新(2015年4期)2015-12-10 12:54:02
        外語形成性評估的效度驗證框架
        91精品国产综合久久久蜜臀九色| 韩国19禁无遮挡啪啪无码网站| 丰满少妇人妻无码专区| 国产高清一级毛片在线看| 国产三级韩三级日产三级| 日本中文字幕一区二区有码在线| 香蕉视频在线精品视频| 国模无码视频专区一区| 午夜一区二区三区在线观看| 精品天堂色吊丝一区二区| 久激情内射婷内射蜜桃人妖| 麻豆久久五月国产综合| 中文字幕人妻乱码在线| 亚洲精品国产电影| 亚洲处破女av日韩精品| 精品九九视频| 久久少妇高潮免费观看| 久久天天躁夜夜躁狠狠| 亚洲av无码av吞精久久| 无码 免费 国产在线观看91| 九七青青草视频在线观看| 无码人妻精品一区二区三区9厂| 国产精品高潮呻吟av久久无吗| 男女激情床上视频网站| 亚洲精品中文字幕视频色| 成人欧美一区二区三区| 久久这里只精品国产99热| 黄色三级国产在线观看| 四虎永久在线精品免费一区二区| 午夜成人理论无码电影在线播放| 国产自产c区| 丝袜美腿亚洲综合一区| 国产亚洲精品a片久久久| 亚洲成在人线av| 狼人av在线免费观看| av在线免费观看蜜桃| 无码手机线免费观看| 亚洲一区二区情侣| 精品国产a一区二区三区v| 国产精选污视频在线观看| 中文精品久久久久中文|