范 娟 巴桑卓瑪
(西藏大學(xué)理學(xué)院 西藏 拉薩 850000)
R是用于設(shè)計支持統(tǒng)計計算和圖形繪制的一類編程語言,也
指實(shí)現(xiàn)該語言的軟件環(huán)境,同時更是一款免費(fèi)的開放自由軟件。R是一個GNU項目,這即確保了R的開源優(yōu)勢,許多不同領(lǐng)域的工作者致力于研究編寫各專業(yè)的安裝包和函數(shù),為R的普及發(fā)展和便捷應(yīng)用提供了良好重要的現(xiàn)實(shí)基礎(chǔ)。本文基于R語言的學(xué)生成績解析作為實(shí)例主題而展開研究。
下面將借助R語言實(shí)例應(yīng)用環(huán)節(jié)計算和作圖分析,本文以高三一班69個同學(xué)的理科成績?yōu)閿?shù)據(jù)對象,課程包括語數(shù)英外物化生,原始數(shù)據(jù)存儲為表,數(shù)據(jù)分析前數(shù)據(jù)導(dǎo)入到R語言。
(一)學(xué)生成績分布
了解學(xué)生成績的分布,可采用直方圖、莖葉圖,所以本文判斷學(xué)生成績是否屬于正態(tài)分布,結(jié)合R語言的Q-Q圖,使用函數(shù)qqnorm()和qqline()驗證樣本是否正態(tài)分布,然后擬合正態(tài)分布曲線,最后對試卷評估。
本文以英語和理綜/文綜成績?yōu)闃颖具M(jìn)行實(shí)例應(yīng)用,畫出兩科成績的直方圖和Q-Q圖,判斷語文和數(shù)學(xué)成績是否屬于正態(tài)分布,評估試卷的出題質(zhì)量難易。
圖1 兩科直方圖與Q-Q圖
從圖中英語和理綜/文綜成績基本上服從正態(tài)分布,命題相對更科學(xué),質(zhì)量要更好些。最后,使用shapiro.test函數(shù),p值表示的是服從正態(tài)分布的概率,語文和數(shù)學(xué)成績P值分別為0.417和0.102,都大于0.05,兩科成績分布都屬于正態(tài)分布。
2.初步統(tǒng)計分析
通過R語言的函數(shù)功能來實(shí)現(xiàn)對學(xué)生學(xué)習(xí)成績的初步分析,以高三一班6個考試科目成績?yōu)槔?進(jìn)行分析。
表1 初步統(tǒng)計表
看表1發(fā)現(xiàn)變異強(qiáng)度最低的是語文學(xué)科,其次是數(shù)學(xué)學(xué)科,除了上面的函數(shù)外,還可以通過summary()函數(shù)來簡單地得到成績的信息。
2.學(xué)生學(xué)習(xí)成績的差異性
結(jié)合R語言中stars()函數(shù),我們據(jù)學(xué)生的成績數(shù)據(jù)畫出學(xué)生成績星圖。
Stars()函數(shù)能處理三到五維的數(shù)據(jù),英語、化學(xué)/歷史的變異系數(shù)太大,所以選取除此的五門數(shù)據(jù)進(jìn)行處理,如圖2所示,從圖中可以看到69個學(xué)生關(guān)于五個科目的成績輪廓圖,班上學(xué)習(xí)成績差異較大。
R是一套強(qiáng)大的數(shù)據(jù)統(tǒng)計、分析和制圖的軟件系統(tǒng)。本文中將R語言引入教學(xué)分析,介紹了幾個相對簡單易學(xué)的圖,在平時生活中常見的圖例都可以運(yùn)用R語言得到設(shè)計實(shí)現(xiàn)。另外,通過本次研究可知,相比通過語言描述理解計算的方式,利用圖示能夠更趨生動形象地地呈現(xiàn)數(shù)據(jù)價值,并基于當(dāng)下學(xué)生成績,有的放矢調(diào)整教學(xué)方案,逐步達(dá)到客觀理想的教學(xué)目標(biāo)。
圖2 成績星圖