王曉丹,王 正,懷麗波
(延邊大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),吉林 延吉 133002)
計(jì)算機(jī)程序設(shè)計(jì)課程不僅是培養(yǎng)學(xué)生編程能力的重要課程,也是養(yǎng)成學(xué)生計(jì)算思維的重要手段,一直被廣泛關(guān)注。近年來,有關(guān)計(jì)算機(jī)程序設(shè)計(jì)課程的教學(xué)研究成果甚多,有基于教學(xué)模式[1-2]或提升學(xué)生主觀意識(shí)方面的改革[3-4],有基于特定人群的課程培養(yǎng)研究成果[5],也有基于統(tǒng)計(jì)學(xué)檢驗(yàn)方法在教學(xué)、科研領(lǐng)域的應(yīng)用。但其中很多研究已暴露了明顯不足:有些研究忽視了客觀因素的現(xiàn)實(shí)存在及其影響,有些對(duì)客觀因素缺乏科學(xué)的、深層的挖掘,甚至有檢驗(yàn)方法的濫用、誤用現(xiàn)象存在[6-7]。
本研究以少數(shù)民族地方性綜合大學(xué)——延邊大學(xué)為研究對(duì)象,該校農(nóng)、醫(yī)、文、史、經(jīng)、法等18個(gè)學(xué)院將計(jì)算機(jī)程序設(shè)計(jì)設(shè)為公共必修課。本研究收集了2013—2017年共15 000多個(gè)觀測(cè),考生涵蓋了30個(gè)省份和2個(gè)直轄市,共31個(gè)民族的學(xué)生,每屆學(xué)生打亂專業(yè)隨機(jī)分班,每屆教師與專業(yè)班級(jí)不固定分配,既避免了數(shù)據(jù)抽樣產(chǎn)生的誤差問題,又排除了教師水平差異或班級(jí)學(xué)習(xí)氛圍等主觀因素對(duì)觀測(cè)值的影響。
對(duì)數(shù)據(jù)分類或分組之前,數(shù)據(jù)的預(yù)處理是保證結(jié)論準(zhǔn)確的必要環(huán)節(jié)。本研究首先通過數(shù)據(jù)審核,將缺考生、補(bǔ)考生及轉(zhuǎn)專業(yè)學(xué)生的重復(fù)考試成績(jī)等臟數(shù)據(jù)刪除,以學(xué)號(hào)為唯一標(biāo)識(shí),保證僅取每名學(xué)生的第一次非零成績(jī)?yōu)橛行в^測(cè)。通過對(duì)5屆學(xué)生計(jì)算機(jī)程序設(shè)計(jì)成績(jī)的數(shù)據(jù)清洗,共得到13 035個(gè)有效觀測(cè)。程序設(shè)計(jì)的百分制成績(jī)依照以下統(tǒng)計(jì)方法的需要將被分為優(yōu)、良、中、及、差5個(gè)等級(jí),或者及格、不及格2個(gè)等級(jí)。學(xué)生按照性別、考生類別、省份、民族4種方式分類后,可得到聯(lián)合分布頻數(shù)(見表1—表4)。
但聯(lián)表中的數(shù)據(jù)是樣本數(shù)據(jù),它只是總體的代表,具有隨機(jī)性,故需要用獨(dú)立性檢驗(yàn)的方法確認(rèn)所得結(jié)論在多大程度上適用于總體。由于獨(dú)立性檢驗(yàn)有兩條準(zhǔn)則[8]:一是,如果只有兩個(gè)單元,每個(gè)單元的期望頻數(shù)必須是5或5以上;二是,對(duì)于兩個(gè)以上的單元,必須滿足20%以上的單元期望頻數(shù)大于5。頻數(shù)期望值公式如式1所示:
RT為給定單元所在行的合計(jì);CT為給定單元所在列的合計(jì);n為觀測(cè)總數(shù)。為保證單元期望頻數(shù)大于5,單元所在列的合計(jì)最小值可由式(2)得出:
表2 考生類別與成績(jī)聯(lián)合分布頻數(shù)
表3 省份與成績(jī)聯(lián)合分布頻數(shù)
表4 民族與成績(jī)聯(lián)合分布頻數(shù)
因此,本研究在做民族與成績(jī)的x2獨(dú)立檢驗(yàn)時(shí),只保留人數(shù)最多的7個(gè)民族;相應(yīng)的省份分類也保留了人數(shù)最多的7個(gè),以保證相關(guān)系數(shù)比較分析結(jié)果的準(zhǔn)確性。
本研究采用獨(dú)立性檢驗(yàn),通過列聯(lián)表方式呈現(xiàn)及量化計(jì)算兩個(gè)分類變量是否存在聯(lián)系。僅以考生類別分類成績(jī)與計(jì)算機(jī)程序設(shè)計(jì)成績(jī)的相關(guān)性判定為例,說明x2檢驗(yàn)的過程。
設(shè)H0:考生類別和計(jì)算機(jī)程序設(shè)計(jì)成績(jī)之間是獨(dú)立的(不存在依賴關(guān)系);H1:考生類別和計(jì)算機(jī)程序設(shè)計(jì)成績(jī)之間不獨(dú)立(存在依賴關(guān)系)。通過頻數(shù)期望計(jì)算公式(式1)及x2計(jì)算公式(式3),可列出考生類別與成績(jī)統(tǒng)計(jì)量計(jì)算表(見表5)。
表5 統(tǒng)計(jì)量計(jì)算表
x2自由度=(R-1)(C-1)=4,為降低犯第二類錯(cuò)誤的風(fēng)險(xiǎn),即降低“零假設(shè)為假卻被接受”的概率,可適當(dāng)提高犯第一類錯(cuò)誤的概率,故將a水平定的高一些[7],可令a=0.1,查詢《x2分布臨界值表》可知:x20.1(4)=7.779。由于x2 2(4),故接受H0,拒絕H1,即考生類別與計(jì)算機(jī)程序設(shè)計(jì)成績(jī)之間不存在依賴關(guān)系,故我們不會(huì)對(duì)文理科類別繼續(xù)進(jìn)行相關(guān)系數(shù)的分析。 同樣的方法可求得性別、省份、民族3個(gè)類別的x2值分別為 367.770,806.765,1 699.023。為降低犯第一類錯(cuò)誤的風(fēng)險(xiǎn),即降低“零假設(shè)為真卻被錯(cuò)誤拒絕”的概率[7],可將a的值定得低一些。由《x2分布臨界值表》顯示,即使a取0.01,上述結(jié)果也遠(yuǎn)遠(yuǎn)大于中相應(yīng)的x0.012(4)=13.277,x0.012(24)=42.980,x0.012(24)=42.980。 在很多研究中發(fā)現(xiàn),x2檢驗(yàn)的前提條件和應(yīng)用局限性往往被忽視了,為避免夸大該方法的功能,我們對(duì)結(jié)果進(jìn)行了兩方面的修正:一是要避免樣本過大對(duì)檢驗(yàn)結(jié)果的影響;二是通過不同分組的重復(fù)性試驗(yàn),驗(yàn)證結(jié)論準(zhǔn)確度。 有研究表明當(dāng)x2值達(dá)到顯著程度而且樣本含量又很大時(shí), 需要參照Pearson 列聯(lián)系數(shù) C 值的大小, 如果C值也很大, 才可以拒絕零假設(shè)[6]。 公式(4)中x2由上一步的獨(dú)立性檢驗(yàn)得出,n為樣本總數(shù),因此C值的區(qū)間為0≤C<1。但只有相同行數(shù)和列數(shù)的聯(lián)合分布頻數(shù)表才可以比較。因此通過Pearson列聯(lián)系數(shù),首先可計(jì)算出省份、民族這兩個(gè)類別的C相關(guān)系數(shù)值分別為0.2615、0.3410,從而確定了民族這一因素,與省份相比,與計(jì)算機(jī)程序設(shè)計(jì)課程成績(jī)的相關(guān)程度更高。而且,省份與成績(jī)的相關(guān)系數(shù)小于0.3,被認(rèn)為是弱相關(guān)或不相關(guān);民族因素結(jié)果所處范圍是[0.3,0.5],被認(rèn)為是低度相關(guān)。 根據(jù)民族的箱線圖(圖1)顯示:朝鮮族學(xué)生成績(jī)的中位數(shù)(箱體中的橫線)、上下四分位數(shù)(箱體上、下沿)以及最低成績(jī)(最下方短線)均明顯低于其他民族;而且有些民族的箱線尾部存在異常值,說明此民族僅有極個(gè)別學(xué)生的成績(jī)異常低(一般認(rèn)為超出箱體1.5倍距離的值為異常值),相反有25%的朝鮮族學(xué)生成績(jī)較均勻地分布在(0,42)分之間,而非極偶然現(xiàn)象。 因此表6將學(xué)生分為朝鮮族和非朝鮮族兩組,使其與性別分類的頻數(shù)表(表1)行列數(shù)相等。再分別計(jì)算x2值,通過φ相關(guān)系數(shù)繼續(xù)深入比較性別因素與民族因素對(duì)于成績(jī)的影響程度。由計(jì)算得到性別與成績(jī)的φ相關(guān)系數(shù)為0.18,而是否為朝鮮族的分類與成績(jī)的φ相關(guān)系數(shù)為0.31。 綜合兩種檢驗(yàn)方法,我們得出相同的檢驗(yàn)結(jié)果:少數(shù)民族地區(qū)高校范圍內(nèi),民族因素對(duì)計(jì)算機(jī)程序設(shè)計(jì)成績(jī)影響最為顯著;而且延邊地區(qū)高校中朝鮮族學(xué)生的程序設(shè)計(jì)成績(jī)明顯低于其他民族學(xué)生的成績(jī)。 圖1 各民族學(xué)生成績(jī)的圖形比較 表6 民族與成績(jī)的聯(lián)合分布頻數(shù) 對(duì)以上實(shí)驗(yàn)過程繼續(xù)深入分析,可得出以下幾點(diǎn)結(jié)論: (1)本研究選取的各個(gè)客觀因素是教學(xué)過程及相關(guān)研究中涉及的,被認(rèn)為會(huì)影響計(jì)算機(jī)程序設(shè)計(jì)成績(jī)的幾項(xiàng)因素。但統(tǒng)計(jì)結(jié)果表明,僅有民族這一因素與計(jì)算機(jī)程序設(shè)計(jì)成績(jī)低度相關(guān),省份與性別呈現(xiàn)弱相關(guān)或不相關(guān)性。由此可見:一是結(jié)論符合主觀因素起決定作用的矛盾論觀點(diǎn);二是不排除其他客觀因素對(duì)成績(jī)的影響。 (2)本研究和同類研究相比,樣本量較大,一方面最大限度地減小了隨機(jī)抽樣誤差,但另一方面有可能引起x2值過大,因此驗(yàn)證零假設(shè)成立的準(zhǔn)確性更高,即可以確定考生類別與計(jì)算機(jī)程序設(shè)計(jì)成績(jī)之間不存在依賴關(guān)系。進(jìn)而說明部分高校取消該課程的文、理科區(qū)別教育是明智之舉。教師在教學(xué)過程中應(yīng)充分相信文科生可以掌握該難度的程序設(shè)計(jì),文科學(xué)生也應(yīng)有信心掌握好該課程。 (3)研究中發(fā)現(xiàn)來自吉林省的學(xué)生成績(jī)?cè)谑》莘诸愔刑幱谧畹停锌赡芤驗(yàn)榧质∮?2.3%的考生是朝鮮族,朝鮮族學(xué)生中85.7%來自吉林省,這種樣本可能影響吉林省考生成績(jī)的相關(guān)分析結(jié)論。但是研究中的樣本雖不能保證各客觀因素之間的影響完全分離,但實(shí)驗(yàn)數(shù)據(jù)在很大程度上能夠體現(xiàn)民族、省份、性別因素的客觀存在性。 (4)7個(gè)民族與7個(gè)省份之間的比較,是否為朝鮮族與性別之間的比較分析結(jié)果同時(shí)顯示:少數(shù)民族地區(qū)的民族因素對(duì)計(jì)算機(jī)程序課程成績(jī)的客觀影響最為顯著,尤其突出暴露了朝鮮族學(xué)生成績(jī)落后的嚴(yán)重性,這也與教學(xué)過程中多數(shù)人的體驗(yàn)相吻合。筆者分析認(rèn)為這與朝鮮族學(xué)生的自身特點(diǎn)及畢業(yè)去向有關(guān)。 第一,朝鮮族學(xué)校一直采用全朝鮮語授課,學(xué)習(xí)資料及高考試卷全部是朝文,因此朝鮮族學(xué)生對(duì)漢語課堂難免有不適應(yīng)的情況;還有部分學(xué)生是日語考生,面對(duì)全英文的程序表現(xiàn)出了陌生感或是排斥感。第二,延邊大學(xué)的學(xué)生會(huì)與社團(tuán)中的多數(shù)主力,由謙恭有禮、能歌善舞的朝鮮族學(xué)生擔(dān)任,豐富的活動(dòng)練就了他們的綜合素質(zhì),但也分散了很多學(xué)習(xí)精力,從而對(duì)成績(jī)?cè)斐韶?fù)面影響。第三,朝鮮語和韓國語的相通,使朝鮮族學(xué)生在韓企就業(yè)、赴韓留學(xué)時(shí)具有得天獨(dú)厚的優(yōu)勢(shì),也就使其在學(xué)習(xí)過程中感受到的壓力明顯小于其他民族的學(xué)生。 我們以較大的樣本量、嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)過程得出,影響計(jì)算機(jī)程序設(shè)計(jì)課程成績(jī)的客觀因素包括:民族、省份和性別,而考生類別與該課程成績(jī)不相關(guān)。這一理論成果將為區(qū)別教育、輔助教學(xué)及其他教學(xué)方法的研究提供最可靠的理論依據(jù),可作為該領(lǐng)域未來相關(guān)工作的基礎(chǔ)。其中朝鮮族學(xué)生所代表的少數(shù)民族地區(qū)高校中,民族因素對(duì)成績(jī)的客觀影響最為顯著,已由統(tǒng)計(jì)學(xué)方法多角度、科學(xué)地證實(shí),值得后續(xù)研究更加深入地剖析其成因與機(jī)制。 [1] 鐘玉峰, 運(yùn)海紅, 葛冬梅. 高校VB程序設(shè)計(jì)課程教學(xué)改革研究[J].黑龍江教育(高教研究與評(píng)估),2013(5): 26-2. [2] 李媛媛, 李艷輝, 沙繼東. 高職自主學(xué)習(xí)型課堂教學(xué)模式的構(gòu)建與實(shí)施——以程序設(shè)計(jì)課為例[J]. 中國成人教育, 2014(10):112-113. [3] 康桂珍. 程序設(shè)計(jì)課程教學(xué)探析[J].中國教育信息化, 2012(19): 61-63. [4] 田希山. 民族預(yù)科“程序設(shè)計(jì)語言”課教學(xué)探討[J]. 寧夏大學(xué)學(xué)報(bào), 2004(5): 6-8. [5] 賈力, 王良, 楊智, 等. 文科學(xué)生程序設(shè)計(jì)課程的教學(xué)探討[J].云南財(cái)貿(mào)學(xué)院學(xué)報(bào), 2000(4): 93-96. [6] 鄭兵云. 非參數(shù)x2檢驗(yàn)的兩個(gè)局限性問題[J]. 統(tǒng)計(jì)教育, 2007(6): 8-9. [7] 鮑貴, 席雁. 統(tǒng)計(jì)顯著性檢驗(yàn): 問題與思考[J]. 南京工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2010, 4(10): 27-32. [8] 賈俊平, 何曉群, 金勇進(jìn). 統(tǒng)計(jì)學(xué)[M]. 6版. 北京: 中國人民大學(xué)出版社, 2015: 216-395.3 列聯(lián)表的相關(guān)測(cè)量與因素的比較分析
3.1 相關(guān)系數(shù)檢驗(yàn)
3.2 重分組檢驗(yàn)
4 實(shí)驗(yàn)結(jié)果分析
5 結(jié) 語