許倩倩等
摘要:隨著數(shù)字化學(xué)習(xí)的唱響,相關(guān)網(wǎng)絡(luò)數(shù)據(jù)的不斷增多,網(wǎng)絡(luò)數(shù)據(jù)的挖掘與分析也在教育技術(shù)領(lǐng)域開始實(shí)施,旨在發(fā)現(xiàn)規(guī)律并運(yùn)用于學(xué)習(xí)實(shí)踐。本文以江南大學(xué)繼續(xù)網(wǎng)絡(luò)教育學(xué)院留存的數(shù)據(jù)為基礎(chǔ),開展數(shù)據(jù)分析,以期為今后的招生與學(xué)生的學(xué)習(xí)提供有效的建議。
關(guān)鍵詞:教育數(shù)據(jù)挖掘;相關(guān)分析;學(xué)習(xí)數(shù)據(jù)
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A 論文編號(hào):1674-2117(2015)18-0110-03
隨著網(wǎng)絡(luò)技術(shù)在教育中的普及與應(yīng)用,數(shù)字化學(xué)習(xí)(E-Learning)逐漸進(jìn)入教育者的視野并得到高校的歡迎和認(rèn)可。數(shù)字化學(xué)習(xí)為高校的校園網(wǎng)站、網(wǎng)絡(luò)教學(xué)平臺(tái)的建設(shè)和使用提供了空前的便利和支持。同時(shí),一些高校開設(shè)了繼續(xù)教育學(xué)院,為成人教育提供了更加便捷的學(xué)習(xí)平臺(tái)。繼續(xù)教育學(xué)院的學(xué)習(xí)基于網(wǎng)絡(luò),學(xué)習(xí)數(shù)據(jù)全面,能夠量化地反映其中相關(guān)內(nèi)容。因此,我們根據(jù)江南大學(xué)繼續(xù)網(wǎng)絡(luò)教育學(xué)院的3050位學(xué)生在網(wǎng)絡(luò)教育平臺(tái)上留存的數(shù)據(jù),展開了一系列教育數(shù)據(jù)相關(guān)分析。
基本信息描述
3050位學(xué)生的基本信息為男性占48.7%,女性占51.3%。在21~40歲的學(xué)生人數(shù)占到了93%以上,是繼續(xù)網(wǎng)絡(luò)教育學(xué)院學(xué)生的主要群體。
從學(xué)生入學(xué)時(shí)間來看,2012年入學(xué)人數(shù)最多,占60%以上,這是由于網(wǎng)絡(luò)教育的普及導(dǎo)致2010-2012年入學(xué)人數(shù)呈現(xiàn)急劇增長的趨勢,但在2013年因?yàn)椤熬W(wǎng)絡(luò)學(xué)憑熱”的逐漸退燒出現(xiàn)了回落。
從學(xué)生生源地來看,來自江蘇省的學(xué)生最多,其次為浙江省、福建省。如果將各地以較大的行政區(qū)區(qū)域來劃分,則華東地區(qū)一枝獨(dú)秀,學(xué)生人數(shù)占85%以上。
學(xué)生專業(yè)種類較多,共19種,包括理工類4種、漢語類3種、社法類2種、管理類4種、教育類3種、經(jīng)濟(jì)類3種。
相關(guān)分析
我們將所得數(shù)據(jù)的類型分為三大類,即基本信息、個(gè)人表現(xiàn)與最終成績。并以這三類數(shù)據(jù)為基本分類依據(jù),進(jìn)行各類數(shù)據(jù)內(nèi)與數(shù)據(jù)間的相關(guān)分析。
1.基本信息與個(gè)人表現(xiàn)、最終成績的關(guān)系
(1)性別與各類表現(xiàn)、成績之間的關(guān)系
數(shù)據(jù)分析后結(jié)果為學(xué)生的性別與其部分的表現(xiàn)及成績有微弱相關(guān),而學(xué)生性別與已學(xué)課程平均成績達(dá)到0.116的顯著相關(guān),這說明性別與課程平均成績有較小相關(guān)。
(2)年齡與各類表現(xiàn)、成績之間的關(guān)系
數(shù)據(jù)表明,年齡與全部的表現(xiàn)及成績都不存在0.1以上或小于-0.1的顯著相關(guān)。由于年齡與成績都是連續(xù)型數(shù)據(jù),因而我們依據(jù)其中的數(shù)據(jù),得到多張散點(diǎn)圖。如下頁圖1所示,在左上方呈現(xiàn)一個(gè)直角三角形的形狀,由此我們可以粗略推斷,學(xué)生年齡與入學(xué)成績存在一定的關(guān)系,年齡越大,成績越向高分處集中,說明年齡越大,對(duì)待考試越認(rèn)真。然而,這也與年齡較大的人數(shù)較少有一定的關(guān)系。
既然年齡段的成績情況不盡相同,我們根據(jù)年齡對(duì)個(gè)案進(jìn)行篩選,并重復(fù)以個(gè)人表現(xiàn)、最終成績內(nèi)容為另一個(gè)因素進(jìn)行相關(guān)分析,發(fā)現(xiàn)年齡在“≥30”“≥40”兩種篩選條件下,年齡與少部分成績出現(xiàn)了0.1以上的相關(guān)關(guān)系。在年齡段被分開的基礎(chǔ)上,我們對(duì)不同年齡段統(tǒng)考大學(xué)英語的通過率做了分析,發(fā)現(xiàn)年齡段越高,統(tǒng)考大學(xué)英語通過率越高。這個(gè)結(jié)論可能會(huì)受到年齡較大的人數(shù)較少的影響,但也在一定程度上證明了之前所獲得的年齡越大認(rèn)真程度越大的結(jié)論。
(3)入學(xué)年份與各類表現(xiàn)、成績之間的關(guān)系
研究中,首先將入學(xué)年份作為雙因素分析的因素之一進(jìn)行分析,得到入學(xué)年份與登錄平臺(tái)次數(shù)存在-0.53非常顯著的中度相關(guān)性;其次,入學(xué)年份與大學(xué)英語三、大學(xué)英語二分別存在0.248、0.179非常顯著的弱相關(guān)性。
接下來,我們對(duì)兩個(gè)中度相關(guān)的數(shù)據(jù)做進(jìn)一步分析。發(fā)現(xiàn)學(xué)生入學(xué)年份與登錄平臺(tái)次數(shù)散點(diǎn)分布圖中每個(gè)年份上都有黑色較濃重的段落(如圖2),這說明年份內(nèi)登錄平臺(tái)次數(shù)集中于一個(gè)次數(shù)段,因而入學(xué)年份與登錄平臺(tái)次數(shù)出現(xiàn)中度相關(guān)。然而,比較不同年份之間的黑色段落,可以發(fā)現(xiàn)有先上升后回落的趨勢。那么,將樣本以2011年為界進(jìn)行分隔,能否發(fā)現(xiàn)更明顯的相關(guān)性?基于這樣的猜想,我們篩選出“入學(xué)年份≤2011”的樣本,并進(jìn)行入學(xué)年份與登錄平臺(tái)次數(shù)雙變量相關(guān)分析。在這樣的篩選條件下,二者顯現(xiàn)出0.722非常顯著的較強(qiáng)相關(guān);“入學(xué)年份≥2011”的樣本,二者顯現(xiàn)出-0.719非常顯著的較強(qiáng)負(fù)相關(guān)。
綜合上述分析結(jié)果,可以推斷:入學(xué)年份與成績的弱相關(guān)原因與該年所招收學(xué)生學(xué)習(xí)是否認(rèn)真相關(guān)。當(dāng)網(wǎng)絡(luò)教育還未達(dá)到熱潮時(shí),進(jìn)入學(xué)習(xí)的學(xué)生態(tài)度認(rèn)真;而當(dāng)網(wǎng)絡(luò)教育達(dá)到熱潮時(shí),學(xué)生學(xué)習(xí)的興趣卻逐年下降。影響成績的因素較多,登錄平臺(tái)次數(shù)與學(xué)生的認(rèn)真程度有著密切關(guān)系,分段入學(xué)年份與登錄平臺(tái)次數(shù)顯示的較強(qiáng)正相關(guān)、較強(qiáng)負(fù)相關(guān)基本能夠支持這種推論。同時(shí),學(xué)生在登錄平臺(tái)時(shí)有次數(shù)要求,且不同年份具有次數(shù)要求不同的硬性規(guī)定導(dǎo)致該結(jié)果的出現(xiàn)。
(4)生源區(qū)域、專業(yè)種類分別與各類表現(xiàn)、成績之間的關(guān)系
本研究使用行政上的區(qū)域劃分來討論生源區(qū)域與學(xué)生表現(xiàn)成績的關(guān)系。我們將生源區(qū)域作為雙因素分析的因素之一進(jìn)行分析,沒有發(fā)現(xiàn)其中的Pearson相關(guān)性大于0.1或者小于-0.1的相關(guān)關(guān)系。然而,其中“生源區(qū)域”與“入學(xué)測試大學(xué)英語”、“生源區(qū)域”與“學(xué)位英語”進(jìn)行雙變量相關(guān)分析中,雖然相關(guān)性數(shù)值表現(xiàn)為0.007與-0.003的微弱相關(guān),而兩者之間不相關(guān)的雙尾檢驗(yàn)值為0.704與0.865,否定了其二者不相關(guān)的假設(shè)。所以,生源區(qū)域與入學(xué)測試大學(xué)英語、學(xué)位英語之間存在相關(guān)性。
在分析專業(yè)種類數(shù)據(jù)時(shí),同樣出現(xiàn)類似于上述的結(jié)果,“專業(yè)種類”與“學(xué)位英語”、“專業(yè)種類”與“統(tǒng)考大學(xué)英語”的雙變量相關(guān)分析中,雖然相關(guān)性數(shù)值表現(xiàn)為-0.002與0.002的微弱相關(guān),而兩者之間不相關(guān)的雙尾檢驗(yàn)值為0.914與0.907,否定了其二者不相關(guān)的假設(shè)。所以專業(yè)種類與學(xué)位英語、統(tǒng)考大學(xué)英語之間存在相關(guān)性。
2.個(gè)人表現(xiàn)內(nèi)的關(guān)系
入學(xué)測試計(jì)算機(jī)成績、入學(xué)測試大學(xué)英語、登錄平臺(tái)次數(shù)三者之間都存在中度以下的相關(guān)性。入學(xué)測試計(jì)算機(jī)成績與大學(xué)英語之間存在0.403的一般程度相關(guān)關(guān)系,顯著程度為非常顯著;入學(xué)測試計(jì)算機(jī)成績與登錄平臺(tái)次數(shù)之間存在0.2的弱相關(guān)關(guān)系,顯著程度為非常顯著。
從得到的結(jié)論中可以得出,后者的相關(guān)原因?yàn)橛?jì)算機(jī)成績好的學(xué)生更愿意接納網(wǎng)絡(luò)教育模式,因而登錄平臺(tái)次數(shù)較多。因此,我們對(duì)入學(xué)計(jì)算機(jī)成績與登錄平臺(tái)次數(shù)做了散點(diǎn)分布圖,(如圖3所示),從圖中,可明顯看出入學(xué)計(jì)算機(jī)成績越高,學(xué)生平均登錄平臺(tái)的次數(shù)就越多。
由于專業(yè)側(cè)重不同,99%以上的學(xué)生在入學(xué)時(shí),只進(jìn)行了“入學(xué)測試高等數(shù)學(xué)”與“入學(xué)測試大學(xué)語文”二者其一的考試。因此,在開展與“入學(xué)測試大學(xué)數(shù)學(xué)”與“入學(xué)測試大學(xué)語文”兩列數(shù)據(jù)有關(guān)的相關(guān)性分析時(shí),我們將相應(yīng)的未考學(xué)生除去后進(jìn)行了分析。統(tǒng)計(jì)人數(shù)為828人,這是在入學(xué)時(shí)選擇考“大學(xué)語文”的人數(shù)。在這些人中,入學(xué)大學(xué)語文與入學(xué)大學(xué)英語成績呈現(xiàn)0.289的較弱相關(guān)關(guān)系,顯著性為非常顯著。數(shù)據(jù)一定程度上證明了語言的同質(zhì)性,即能夠掌握好一門語言的人,對(duì)其他語言也能夠較好地進(jìn)行掌握與運(yùn)用。
3.個(gè)人表現(xiàn)與最終成績的關(guān)系
研究中,我們將個(gè)人表現(xiàn)中的因素與最終成績中的因素依次進(jìn)行相關(guān)分析,發(fā)現(xiàn)“大學(xué)英語二”與“已學(xué)課程平均成績”、“大學(xué)英語三”與“已學(xué)課程平均成績”分別有0.448、0.329的一般相關(guān)關(guān)系,顯著性都是非常顯著。由于大學(xué)英語二、大學(xué)英語三成績計(jì)入已學(xué)課程平均成績,且為網(wǎng)絡(luò)課程學(xué)習(xí),課程成績基本取決于學(xué)生的知識(shí)基礎(chǔ)與認(rèn)真程度,而在一門課程中表現(xiàn)良好的學(xué)生其他課程情況也不會(huì)太差,因此二者具有相關(guān)關(guān)系。
4.最終成績內(nèi)的關(guān)系
研究的最后,對(duì)學(xué)生最終成績內(nèi)的三個(gè)元素進(jìn)行相關(guān)分析,發(fā)現(xiàn)其中的學(xué)位英語與統(tǒng)考大學(xué)英語存在0.415的一般程度相關(guān)性,顯著性為非常顯著。并在此基礎(chǔ)上,對(duì)二者相關(guān)情況做進(jìn)一步研究,我們將學(xué)位英語成績劃分為大于等于60分的為“合格”與低于60分的為“不合格”。學(xué)位英語難度超過統(tǒng)考大學(xué)英語:未通過統(tǒng)考大學(xué)英語的學(xué)生在學(xué)位英語上幾乎全軍覆沒,并且通過了統(tǒng)考大學(xué)英語的學(xué)生中也有三分之一左右在學(xué)位英語考試中失利(如圖4)。因此可以說,二者確實(shí)存在一定的關(guān)系。
結(jié)論
在本次分析中,采用描述統(tǒng)計(jì)、相關(guān)分析與作圖的方法,對(duì)江南大學(xué)繼續(xù)網(wǎng)絡(luò)教育學(xué)院學(xué)生的基本信息、個(gè)人表現(xiàn)以及最終成績之間的關(guān)系進(jìn)行了了解。雖然統(tǒng)計(jì)已經(jīng)經(jīng)過一定程度的篩選,但由于樣本數(shù)量較大以及分析者能力限制,所得結(jié)果還不夠確切。但是結(jié)果已經(jīng)過推敲,在現(xiàn)有數(shù)據(jù)范圍內(nèi),發(fā)現(xiàn)了一定的規(guī)律,可以起到一些參考作用,在今后成人教育范圍內(nèi),可以給予招生與學(xué)習(xí)過程的督促、學(xué)生自我學(xué)習(xí)給予一定的參考。
參考文獻(xiàn):
[1]葛道凱.E-Learning數(shù)據(jù)挖掘:模式與應(yīng)用[J].中國高教研究,2012(3):8-14.
[2]Cristóbal Romero,Sebastián Ventura,Enrique García.Data mining in course management systems:Moodle case study and tutorial[J].Computers & Education,51(2008):368-384.
[3]李玉光,杜宏巍,黃永生.SPSS 19.0統(tǒng)計(jì)分析入門與提高[M].北京:清華大學(xué)出版社,2014.
[4]葛道凱,張少剛,魏順平.教育數(shù)據(jù)挖掘:方法與應(yīng)用[M].北京:教育科學(xué)出版社,2012.