王本洋 (華南農(nóng)業(yè)大學(xué)林學(xué)院,廣東 廣州 510642)
試卷質(zhì)量分析的數(shù)學(xué)模型及其R語(yǔ)言實(shí)現(xiàn)
王本洋 (華南農(nóng)業(yè)大學(xué)林學(xué)院,廣東 廣州 510642)
試卷質(zhì)量分析具有成熟的數(shù)學(xué)模型,但由于計(jì)算項(xiàng)目多樣、過(guò)程繁瑣,多數(shù)情況下需要借助統(tǒng)計(jì)軟件完成分析過(guò)程。結(jié)合程序流程圖,介紹了試卷質(zhì)量分析數(shù)學(xué)模型的R語(yǔ)言實(shí)現(xiàn),并以實(shí)例數(shù)據(jù)驗(yàn)證其有效性。結(jié)果表明,基于R語(yǔ)言的程序腳本可以快速獲取多種基本描述性統(tǒng)計(jì)指標(biāo)、正態(tài)性檢驗(yàn)結(jié)果和難度、區(qū)分度、效度、信度等四度指標(biāo)。R語(yǔ)言用于試卷質(zhì)量分析可行、有效,相比其他大型商業(yè)統(tǒng)計(jì)軟件,具有明顯的便捷性。
試卷評(píng)價(jià);描述性統(tǒng)計(jì);四度指標(biāo);R軟件
試卷質(zhì)量是保證考試成績(jī)客觀反映學(xué)生的知識(shí)、能力和素質(zhì)狀況的關(guān)鍵[1]。試卷質(zhì)量分析是試卷分析的重要內(nèi)容之一[2],其分析過(guò)程涉及的計(jì)算方法有成熟的數(shù)學(xué)模型[1,3]。但由于計(jì)算項(xiàng)目多樣、計(jì)算過(guò)程繁瑣,多數(shù)情況下需要借助統(tǒng)計(jì)軟件完成分析過(guò)程。其中,SPSS軟件因其用戶界面友好,通過(guò)菜單操作即可實(shí)現(xiàn)絕大部分統(tǒng)計(jì)分析功能,因此其應(yīng)用最為廣泛[4]。也有少數(shù)利用Matlab[5]等商業(yè)統(tǒng)計(jì)軟件進(jìn)行試卷質(zhì)量分析的研究報(bào)道。
但是在實(shí)際應(yīng)用中,前述軟件或者安裝過(guò)程復(fù)雜,系統(tǒng)配置要求較高,分析過(guò)程復(fù)雜(如SAS,Matlab);或者操作雖簡(jiǎn)單但步驟繁多(如SPSS,Eecel);并且都存在知識(shí)產(chǎn)權(quán)問(wèn)題。因此,作為考試之后的一項(xiàng)重要常規(guī)性工作,試卷質(zhì)量分析需要更加便捷、標(biāo)準(zhǔn)的分析環(huán)境。
R是一款完全免費(fèi)、開(kāi)源的統(tǒng)計(jì)軟件,由新西蘭Auckland大學(xué)的Robert Gentleman和Ross Ihaka 等開(kāi)發(fā)。R語(yǔ)言支持多種格式數(shù)據(jù)(Eecel、 SPSS、S-Plus、SAS等)的讀取,與廣泛使用的統(tǒng)計(jì)軟件 S/S-Plus兼容,具有完整的數(shù)據(jù)處理、統(tǒng)計(jì)分析和統(tǒng)計(jì)制圖等功能。R的開(kāi)源設(shè)計(jì)允許用戶根據(jù)需要編寫自己的程序包,并可上傳到網(wǎng)絡(luò)。R具備的平臺(tái)獨(dú)立性、開(kāi)源性和可擴(kuò)展性等特性[6]使得其在科學(xué)研究中得到越來(lái)越廣泛的應(yīng)用。戴小華[6]運(yùn)用R語(yǔ)言的GIS功能包生成了中國(guó)柑橘主要病蟲害的空間分布圖。金明和丁貴杰[7]介紹了基于R軟件平臺(tái)的馬尾松人工林林分材種結(jié)構(gòu)預(yù)測(cè)系統(tǒng)。羅玫等[8]利用R語(yǔ)言可跨平臺(tái)操作以及對(duì)矩陣運(yùn)算高速的特點(diǎn),實(shí)現(xiàn)了改進(jìn)的模糊綜合評(píng)價(jià)模型,驗(yàn)證了其在不同操作系統(tǒng)下運(yùn)行的可靠性及有效性?;赗語(yǔ)言的教學(xué)研究尚鮮見(jiàn)報(bào)道。
下面,筆者在介紹試卷質(zhì)量分析常用指標(biāo)的數(shù)學(xué)模型的基礎(chǔ)上,分析其R語(yǔ)言實(shí)現(xiàn)方法,最后以實(shí)例驗(yàn)證基于R語(yǔ)言的程序腳本用于試卷質(zhì)量分析的可行性、有效性和便捷性,為廣大教師進(jìn)行試卷分析提供參考,并為基于R軟件的深入應(yīng)用和研發(fā)提供借鑒。
根據(jù)教育測(cè)量理論[2],試卷質(zhì)量分析的指標(biāo)主要是四度,即難度(Difficulty)、區(qū)分度(Discrimination)、效度(Validity)和信度(Reliability)。試卷定量分析常用四度指標(biāo)來(lái)進(jìn)行,這是統(tǒng)計(jì)學(xué)方法在科學(xué)分析考試中的一種應(yīng)用[3]。任治斌和單蓉[5]以教育統(tǒng)計(jì)與測(cè)量理論為基礎(chǔ),根據(jù)學(xué)生考試原始成績(jī),根據(jù)四度指標(biāo)給出了試卷質(zhì)量分析的數(shù)學(xué)模型。安萍莉等[1]選擇平均成績(jī)、標(biāo)準(zhǔn)差、全距、眾數(shù)、偏度、峰度、平均難度等作為分析指標(biāo),對(duì)考試成績(jī)進(jìn)行了研究。
筆者選取試卷質(zhì)量分析的主要指標(biāo)12個(gè),分為2類:第1是考試成績(jī)的基本描述性統(tǒng)計(jì)指標(biāo),包括成績(jī)的均值(Mean)、最小值(Min.)、最大值(Max.)、全距(Range)、標(biāo)準(zhǔn)差(S.D.)、峰度(Ku.)、偏度(Sk.)和成績(jī)分布正態(tài)性等8個(gè)指標(biāo);第2類是四度指標(biāo)。各個(gè)指標(biāo)的原始模型參見(jiàn)文獻(xiàn)[1,6]。
試卷質(zhì)量分析數(shù)學(xué)模型的R語(yǔ)言實(shí)現(xiàn)(見(jiàn)圖1)由一段主調(diào)程序(Caller)、一個(gè)以函數(shù)形式存在的主程序(getPQind)、以及負(fù)責(zé)計(jì)算各指標(biāo)的子函數(shù)(Function)構(gòu)成。其中,子函數(shù)可以根據(jù)實(shí)際需要方便地增加或修改。
2.1Excel成績(jī)數(shù)據(jù)
在Excel中輸入成績(jī)數(shù)據(jù)(見(jiàn)圖2)。數(shù)據(jù)存放要求:①第1行為數(shù)據(jù)名稱;②第2行包含各題滿分?jǐn)?shù)據(jù),非滿分?jǐn)?shù)據(jù)的單元格可留空;③各題成績(jī)及總分?jǐn)?shù)據(jù)存放于連續(xù)的列。為了簡(jiǎn)化后續(xù)代碼編寫,最后將Excel文件另存為擴(kuò)展名為csv的數(shù)據(jù)文件(如eg1.csv)備用。
圖1 試卷質(zhì)量分析R語(yǔ)言實(shí)現(xiàn)流程 圖2 Excel成績(jī)數(shù)據(jù)
圖3 試卷質(zhì)量分析的R語(yǔ)言腳本程序
2.2主調(diào)程序
首次使用時(shí),需要在R軟件中新建一個(gè)程序腳本,把主調(diào)程序(圖3中的第1~2行)粘貼到該腳本中,備用。以后可重復(fù)使用該主調(diào)程序。 其中第2行應(yīng)根據(jù)實(shí)際改為成績(jī)數(shù)據(jù)所在文件夾。
2.3主函數(shù)
主函數(shù)getPQind有6個(gè)參數(shù)(見(jiàn)表1),其中第1個(gè)參數(shù)為必要參數(shù),為待分析的成績(jī)數(shù)據(jù);其他5個(gè)參數(shù)根據(jù)實(shí)際情況可選擇性輸入(見(jiàn)圖3)。 主函數(shù)getPQind的源代碼約400行,由作者編寫,具有可重用性。
表1 主函數(shù)getPQind的6個(gè)參數(shù)
注:無(wú)默認(rèn)值的參數(shù)為必要參數(shù);有默認(rèn)值的參數(shù)為可選參數(shù)。
以文獻(xiàn)[5]中的數(shù)據(jù)為例,說(shuō)明主調(diào)程序的使用方法,驗(yàn)證分析結(jié)果的有效性。然后以華南農(nóng)業(yè)大學(xué)林學(xué)院《旅游禮儀禮節(jié)》某次考試成績(jī)?yōu)槔?,介紹區(qū)分班級(jí)時(shí)試卷分析主函數(shù)getPQind的使用方法。
3.1案例1
根據(jù)文獻(xiàn)[5]準(zhǔn)備成績(jī)數(shù)據(jù),運(yùn)行圖3中的案例1代碼(第3~4行)即可獲得試卷質(zhì)量分析有關(guān)指標(biāo)(見(jiàn)圖4)。結(jié)果表明,該套試卷的考生成績(jī)不符合正態(tài)分布(p-value=0.03602),信度(ReliabilityAlpha)為0.6274。另外,試題及試卷難度為0.3071,總體區(qū)分度(PaperDiscrim2)為0.3731,以相關(guān)系數(shù)表示的試題效度(ValidityV)等其他數(shù)據(jù)與文獻(xiàn)結(jié)果一致。
3.2案例2
圖4 案例1的四度指標(biāo)等試卷分析結(jié)果 圖5 案例2的四度指標(biāo)等試卷分析結(jié)果
以華南農(nóng)業(yè)大學(xué)林學(xué)院《旅游禮儀禮節(jié)》某次考試成績(jī)數(shù)據(jù)(圖2,部分)為例,說(shuō)明主函數(shù)getPQind的高級(jí)使用方法。根據(jù)成績(jī)數(shù)據(jù),運(yùn)行圖3中案例2代碼(第7~8行)即可獲得試卷質(zhì)量分析有關(guān)指標(biāo)(見(jiàn)圖5)。其中主函數(shù)getPQind參數(shù)的意義是:該次考試有5個(gè)班級(jí)(nclass=5)參加,標(biāo)記班級(jí)的數(shù)據(jù)在第2列(nclasscol=2),成績(jī)數(shù)據(jù)從第3列開(kāi)始連續(xù)存放(ncolfrom=3),共有4個(gè)題目(nparts=4),當(dāng)前分析針對(duì)2班進(jìn)行(nclasscode=2)。結(jié)果表明,該套試卷的考生成績(jī)符合正態(tài)分布(p-value=0.2382),試卷難度為0.1132;信度為0.3494;各題區(qū)分度分別為0.5961,0.5434,0.5228,0.6791,均大于0.4;以相關(guān)系數(shù)表示的效度值均小于0.2(僅第1題與第4題間相關(guān)系數(shù)0.4054>0.2)。總體上該套試卷在2班表現(xiàn)為難度較低,信度中等,區(qū)分度和效度較高。
試卷分析是考試之后的一項(xiàng)重要工作,其結(jié)果是對(duì)考試工作進(jìn)行總結(jié)并給予恰當(dāng)評(píng)價(jià)的重要依據(jù)[3]。通過(guò)試卷分析,評(píng)價(jià)試題的難易程度,有助于改善和提高試題質(zhì)量,并發(fā)現(xiàn)教學(xué)過(guò)程中的不足,改進(jìn)教學(xué)方法,提高教學(xué)質(zhì)量[3]。試卷質(zhì)量分析項(xiàng)目較多樣,計(jì)算過(guò)程較繁瑣,需要借助統(tǒng)計(jì)軟件實(shí)現(xiàn)分析過(guò)程。SAS、Matlab、SPSS等大型統(tǒng)計(jì)軟件或者Excel軟件因?yàn)椴僮鲝?fù)雜或者存在知識(shí)產(chǎn)權(quán)問(wèn)題,不適應(yīng)常規(guī)的試卷質(zhì)量分析工作。免費(fèi)、開(kāi)源的R軟件具有完整的數(shù)據(jù)處理、統(tǒng)計(jì)分析和統(tǒng)計(jì)制圖等功能,調(diào)用本文編寫的基于R語(yǔ)言的程序腳本,用戶只需要編寫或修改2行代碼即可獲得多項(xiàng)試卷質(zhì)量分析指標(biāo)。試卷質(zhì)量分析數(shù)學(xué)模型的R語(yǔ)言實(shí)現(xiàn)利用了R軟件的統(tǒng)計(jì)環(huán)境,用于試卷質(zhì)量分析可行、有效,相比其他大型商業(yè)統(tǒng)計(jì)軟件,具有明顯的便捷性。
[1]安萍莉,郭淑媛,王嗇,等.大學(xué)考試試題質(zhì)量研究 [J].高等農(nóng)業(yè)教育,2006(2): 43-48.
[2]陳玉琨.教育評(píng)價(jià)學(xué) [M].北京: 人民教育出版社,1999.
[3]趙立新,陳文藝,郭子君.試卷質(zhì)量的定量評(píng)價(jià) [J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2004(4): 136-141.
[4]劉翔,趙昆渝,李智東.用SPSS對(duì)理工科試卷進(jìn)行分析與評(píng)價(jià) [J].長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷,2008(1): 182-185.
[5]任治斌,單蓉.基于Matlab的試卷質(zhì)量分析方法研究 [J].廣西民族師范學(xué)院學(xué)報(bào),2011,28(3): 30-31.
[6]戴小華.基于R語(yǔ)言的中國(guó)柑橘主要病蟲害空間分布圖 [J].江西農(nóng)業(yè)學(xué)報(bào),2009,21(4): 76-83.
[7]金明,丁貴杰.馬尾松人工林林分材種結(jié)構(gòu)預(yù)測(cè)系統(tǒng)在R軟件中的實(shí)現(xiàn) [J].貴州林業(yè)科技,2011,39(2): 1-5.
[8]羅玫,趙嵩正,蔣建洪.模糊綜合評(píng)價(jià)模型的R語(yǔ)言實(shí)現(xiàn) [J].航空計(jì)算技術(shù),2011,(4): 56-61,66.
10.3969/j.issn.1673-1409(N).2012.08.038
TP311.1
A
1673-1409(2012)08-N114-03
2012-05-26
國(guó)家特色專業(yè)建設(shè)點(diǎn)——林學(xué)(教高函[201015]號(hào))。
王本洋(1973-),男,1998年大學(xué)畢業(yè),博士,講師,現(xiàn)主要從事林學(xué)、高等教育學(xué)方面的教學(xué)與研究工作。
[編輯] 洪云飛