錢源+施佺
摘 要:網(wǎng)絡學習的興起引起了對網(wǎng)絡學習過程和網(wǎng)絡學習結(jié)果如何評價的爭論與研究,網(wǎng)絡學習平臺的大數(shù)據(jù)分析也是近年來教育研究者關注的熱點問題。文章將教育數(shù)據(jù)挖掘方法中的關聯(lián)規(guī)則分析應用到網(wǎng)絡學習平臺的數(shù)據(jù)分析當中,探討網(wǎng)絡學習因素與學習結(jié)果等方面的關聯(lián),發(fā)現(xiàn)了網(wǎng)絡學習過程中存在的問題,并為網(wǎng)絡學習的教學改進、教學質(zhì)量的提高提供了豐富的決策支持信息。
關鍵詞:網(wǎng)絡學習;關聯(lián)規(guī)則;數(shù)據(jù)離散化;決策支持
中圖分類號: G434 文獻標志碼:A 文章編號:1673-8454(2016)14-0078-05
一、引言
2012年3月,教育部頒布了《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》[1],提出要實現(xiàn)優(yōu)質(zhì)數(shù)字資源建設與共享、學校信息化能力建設與提升等多項內(nèi)容,推進教育與技術(shù)的融合。本質(zhì)上而言,教育信息化即是運用信息化手段改善教育、優(yōu)化教育,這里的教育既包括傳統(tǒng)意義上的課堂教育,也包括目前興起的網(wǎng)絡教育,同時還包括教育過程、教育主體、教育內(nèi)容等多個因素。運用信息化手段實現(xiàn)教育的優(yōu)化、可持續(xù)性,提升教育質(zhì)量,提高師生信息化水平,為教育帶來新的變革。
隨著計算機技術(shù)的發(fā)展,網(wǎng)絡教育日益興起,為傳統(tǒng)教育增添了新的活力,得到普遍推廣與應用。網(wǎng)絡教育突破了時間和空間的限制,為學習者帶來了諸多便利;但是網(wǎng)絡教育存在缺少教師監(jiān)控、學習者學習過程得不到有效監(jiān)督等問題,引起了許多教育研究者的關注,特別是網(wǎng)絡學習效果以及網(wǎng)絡學習質(zhì)量、網(wǎng)絡學習影響因素等,是目前國內(nèi)外學者集中研究的重點問題。[2]
本文利用教育數(shù)據(jù)挖掘技術(shù)中的關聯(lián)規(guī)則分析,對網(wǎng)絡學習過程中產(chǎn)生的學生學習數(shù)據(jù)進行數(shù)據(jù)挖掘,探究網(wǎng)絡學習效果、網(wǎng)絡學習成績與學生網(wǎng)絡學習時間、網(wǎng)絡學習模塊、性別等因素之間的關聯(lián),為網(wǎng)絡教學的下一步改進提供決策支持信息,幫助教師了解學生真實的網(wǎng)絡學習狀況,更好地引導學生進行網(wǎng)絡學習,最終達到提高網(wǎng)絡學習質(zhì)量、推進高校教育信息化的目的。
二、教育數(shù)據(jù)挖掘與關聯(lián)規(guī)則
1.教育數(shù)據(jù)挖掘
大數(shù)據(jù)時代的到來使人們對于數(shù)據(jù)挖掘的概念已不再陌生。數(shù)據(jù)挖掘主要用于對大規(guī)模、無序雜亂的、不完全的、有噪聲的但是又包含大量為人所不知的、隱藏的有用知識的數(shù)據(jù)分析方法,它可以對數(shù)據(jù)進行收集、處理、轉(zhuǎn)化、分析、挖掘,從而得到有用信息,進而為商業(yè)決策提供支持。而教育數(shù)據(jù)挖掘,顧名思義,即數(shù)據(jù)挖掘在教育領域的應用。隨著教育信息化的開展,教育系統(tǒng)中投入使用了大量計算機辦公系統(tǒng)、網(wǎng)絡學習平臺等,這些信息化軟件在使用過程中產(chǎn)生大量數(shù)據(jù),將這些產(chǎn)生于教育領域的數(shù)據(jù)(包括傳統(tǒng)課堂的教育數(shù)據(jù))稱之為教育大數(shù)據(jù),對教育大數(shù)據(jù)進行的數(shù)據(jù)挖掘則稱為教育數(shù)據(jù)挖掘。關于教育數(shù)據(jù)挖掘的概念,國際教育數(shù)據(jù)挖掘工作組網(wǎng)站將其定義為,運用不斷發(fā)展的方法和技術(shù),探索特定的教育環(huán)境中的數(shù)據(jù)類型,提取有意義的信息,幫助教師更好地理解學生,改善他們所學習的環(huán)境,為教育者、學習者、管理者等教育工作者提供服務。[3]
2008年第一屆教育數(shù)據(jù)挖掘國際會議召開,此后教育數(shù)據(jù)挖掘的研究更是如日中天。Muna等人對2006-2013近7年中谷歌學術(shù)上300余篇教育數(shù)據(jù)挖掘相關的文章進行了綜述,介紹了國外的研究現(xiàn)狀,主要闡述了數(shù)據(jù)收集和處理方式、數(shù)據(jù)分類方法、常用數(shù)據(jù)挖掘方法以及目前所存在的問題和挑戰(zhàn)。[4]國外的教育數(shù)據(jù)挖掘?qū)嵶C研究主要用于預測學生學習成果、預測學生輟學率,幫助教師提醒學生、降低學校輟學率等。國內(nèi)的李婷等人對國內(nèi)外的教育數(shù)據(jù)挖掘進行了綜述,為了解當前教育數(shù)據(jù)挖掘發(fā)展現(xiàn)狀提供了有利的文獻資料。[5]
2.關聯(lián)規(guī)則
關聯(lián)規(guī)則是數(shù)據(jù)挖掘算法中非常經(jīng)典的挖掘算法之一,其最經(jīng)典的應用為購物籃分析。該算法通過挖掘頻繁項集來發(fā)現(xiàn)屬性之間的聯(lián)系,主要包括兩個步驟,第一步是計算密集型階段,挖掘出頻繁項集;第二步是基于頻繁項集來生成關聯(lián)規(guī)則,一般規(guī)則均描述為包含左項集(條件)和右項集(結(jié)論)的一對,并通過置信度和支持度來衡量規(guī)則的重要性和可信度。
最經(jīng)典的關聯(lián)規(guī)則算法是Apriori關聯(lián)規(guī)則算法,本文使用基于該算法的Microsoft關聯(lián)規(guī)則算法進行關聯(lián)分析。挖掘頻繁項集是關聯(lián)規(guī)則算法的核心部分,Apriori算法使用逐層搜索的迭代方法來發(fā)現(xiàn)頻繁項集。首先,找到項集數(shù)為1的頻繁項集集合,記作L1,用L1再去尋找項集數(shù)為2的頻繁項集集合,以此類推,直到?jīng)]有更大項集數(shù)的頻繁項集集合,最后,在所有的頻繁項集中找到強規(guī)則,即是用戶感興趣的關聯(lián)規(guī)則。Microsoft關聯(lián)規(guī)則主要通過支持度、概率(置信度)和重要性判斷規(guī)則的有用性和重要程度。支持度用于度量一個項集的出現(xiàn)頻率,A→B的支持度support=P(AB),指的是事件A和事件B同時發(fā)生的概率;概率是關聯(lián)規(guī)則的屬性,在數(shù)據(jù)挖掘領域也成為置信度,規(guī)則A=>B的概率可以表示為:Probability(A=>B)= Probability(B|A)=Support(A,B)/ Support(A);重要性也成為興趣度分數(shù)或者增益,用于度量項集和規(guī)則,可以用公式定義為:Importance({ A,B })= Probability(A,B)/(Probability(A)* Probability(B)),重要性為0表示無關聯(lián),重要性為正表示正關聯(lián),重要性為負表示負關聯(lián)。
三、關聯(lián)規(guī)則在網(wǎng)絡學習中的應用
1.問題提出
目前,網(wǎng)絡學習并沒有非常嚴格且通用的評價體系和指標,一般直接通過網(wǎng)絡學習的最終考試判定網(wǎng)絡學習結(jié)果;高校內(nèi)與課堂教學相結(jié)合的網(wǎng)絡學習,教師主要關注學生的網(wǎng)絡學習時間是否達到標準,最終的網(wǎng)絡學習效果仍然是通過期末的筆試成績來考察。[6][7]學生的網(wǎng)絡學習到底有沒有成效,網(wǎng)絡學習過程中有哪些欠缺之處,教師都無法發(fā)現(xiàn)。雖然有些網(wǎng)絡學習平臺會提供簡單的數(shù)據(jù)分析功能,但是遠遠不能為優(yōu)化網(wǎng)絡學習提供有力依據(jù)。
關聯(lián)規(guī)則在網(wǎng)絡學習中的應用,能通過對網(wǎng)絡學習數(shù)據(jù)的分析,發(fā)現(xiàn)網(wǎng)絡學習因素之間的關系,以及與學習成績之間的關聯(lián),根據(jù)關聯(lián)分析所得出的規(guī)則,能夠幫助教師透徹地了解學生網(wǎng)絡學習的真實狀況,從而更好地監(jiān)督學生學習,并為網(wǎng)絡學習提供改進和完善的建議,提高網(wǎng)絡學習質(zhì)量。
2.數(shù)據(jù)搜集
本文所用的數(shù)據(jù)來自于某校英語網(wǎng)絡學習平臺,該平臺由外研社提供,用于輔助大學英語教學。根據(jù)大學英語教學大綱,學生每兩周接受一次課堂輔導,每周需自主完成至少4個小時的網(wǎng)絡學習任務。在英語網(wǎng)絡學習平臺中,學生需要自主完成對課本知識的學習,包括讀寫課程、聽說課程、在線測試等,平臺還包括學習工具、廣播臺等輔助工具。學生原始學習數(shù)據(jù)主要包括網(wǎng)絡學習時間、網(wǎng)絡學習模塊以及在線測試成績,其中網(wǎng)絡學習模塊主要涉及平臺首頁、聽說教程、讀寫教程和在線測試,其他頁面瀏覽人次較少,不納入分析。
除了網(wǎng)絡學習數(shù)據(jù),本文所使用的數(shù)據(jù)還包括學生個人信息、期末英語成績以及大學英語四級成績。通過對網(wǎng)絡學習因素與英語成績的關聯(lián)分析,得到這些因素之間的關系,從而為改進大學英語網(wǎng)絡學習提供決策支持。
3.數(shù)據(jù)處理
除卻對缺失、錯誤數(shù)據(jù)的刪除、完善和修補,本文數(shù)據(jù)處理最關鍵的步驟在于如何對數(shù)據(jù)進行分類。關聯(lián)規(guī)則算法是一個計數(shù)引擎,只用于計數(shù)離散屬性狀態(tài)的相關性,因此它不接受連續(xù)屬性,只能對離散屬性值進行關聯(lián)規(guī)則分析。本文所獲得的數(shù)據(jù)均為連續(xù)值,將這些連續(xù)屬性進行離散化處理是數(shù)據(jù)處理的重點工作。
數(shù)據(jù)離散化方法主要有三類,無監(jiān)督離散化和有監(jiān)督離散化,全局離散化和局部離散化,動態(tài)離散化和靜態(tài)離散化,其中無監(jiān)督離散化又包括等寬分箱法和等頻分箱法。本文采用無監(jiān)督離散化的等頻分箱法進行數(shù)據(jù)分類,預先設定好分類數(shù),將數(shù)據(jù)按從小到大的順序排好,按數(shù)據(jù)量將數(shù)據(jù)平均分配到每一個分類,并做適當調(diào)整。相較于等寬分箱法將變量取值范圍分為N個等寬的區(qū)間,而各區(qū)間數(shù)據(jù)量分配可能存在很大偏差的數(shù)據(jù)分類方法,等頻分箱法更適合于對進行關聯(lián)規(guī)則分析的數(shù)據(jù)進行離散化分類。
需要進行離散化分類的屬性主要為在線時間、是否進行在線測試、期末英語成績、大學英語四級成績,最終得到如表1所示的離散化屬性編碼表。
在對屬性進行分類時,英語期末成績低于60分的人數(shù)不多,如果作為一個單獨分類,會導致分類間數(shù)據(jù)量的不一致,因此按照等頻分箱法分為四個類別;而在線測試分類中,有幾乎一半的學生沒有在線測試成績,因此僅分為兩個類別;此外,還定義了“學習模塊”這一屬性,根據(jù)學生在各個模塊所花時間的多少進行篩選,選出學生所花時間最多的模塊作為 “學習模塊”,考察學生在網(wǎng)絡學習過程中花費時間最多的模塊。
對進行了在線測試的學生進行單獨分析,考察其網(wǎng)絡學習習慣與期末成績的關聯(lián)。主要考慮他們在首頁、學習頁面(聽說頁面和讀寫頁面)、測試頁面所花時間,并重新對在線時間、期末英語成績進行分類,依然按照等頻分箱法對數(shù)據(jù)進行離散化,新的屬性離散化編碼表如表2所示。
4.關聯(lián)分析結(jié)果
利用SASS(SQL Server Analysis Services)進行關聯(lián)規(guī)則分析,采用的關聯(lián)規(guī)則算法是基于Apriori算法的Microsoft關聯(lián)規(guī)則,通過計算頻繁項集得到關聯(lián)規(guī)則。分兩組進行關聯(lián)分析——全部學生和參與在線測試的學生,最終得到以下規(guī)則:
(1)全部學生關聯(lián)分析結(jié)果
全部學生樣本包括10086人,挖掘英語網(wǎng)絡學習過程中“在線時間”、“學習模塊”、“期末英語成績”、“英語四級成績”、“是否進行在線測試”之間的關聯(lián),得到以下規(guī)則:
規(guī)則1:學習模塊=“首頁”,在線時間=“T3”,期末英語成績=“S1”,英語四級=“未通過”,支持度為0.447,重要性為0.545。在線時間多,但花費時間最多的頁面為首頁,期末英語成績差,英語四級未通過。
規(guī)則2:學習模塊=“在線測試”,期末英語成績=“S4”,在線時間=“T3”,英語四級=“C3”,支持度為0.624,重要性為0.369。在線時間多,花費時間最多頁面為在線測試,期末英語成績好,英語四級成績好。
規(guī)則3:期末英語成績=“S4”,英語四級=“C3”,支持度為0.586,重要性為0.465。期末英語成績好,英語四級成績好。
規(guī)則4:學習模塊=“讀寫頁面”,在線時間=“T3”,性別=“女”,在線測試=“是”,支持度為0.571,重要性為0.267。在線時間多,花費時間最多的頁面為讀寫頁面,性別為女,進行了在線測試。
規(guī)則5:學習模塊=“首頁”,在線時間=“T1”,在線測試=“否”,支持度為0.889,重要性為0.534。在線時間少,花費時間最多的頁面為首頁,未進行在線測試。
規(guī)則6:學習模塊=“在線測試”,期末英語成績=“S3”,性別=“女”,在線測試=“是”,支持度為0.504,重要性為0.478。花費時間最多的頁面為在線測試,期末英語成績好,性別為女,進行了在線測試。
從上述規(guī)則可以看出,期末英語成績好的學生往往英語四級也能取得好的成績;花費較多時間在學習頁面或測試頁面,英語成績較好;沒有好好利用網(wǎng)絡學習平臺即在無學習內(nèi)容的首頁花費時間較多的學生,一般不進行網(wǎng)絡在線測試,英語成績也一般;參與在線測試的女生較多,且女生期末英語成績往往較好。
(2)參與在線測試學生的關聯(lián)分析結(jié)果
參與在線測試的學生共5211名,對這部分學生的網(wǎng)絡學習因素和期末英語成績進行關聯(lián)分析,將“學習模塊”、“在線時間”、“首頁”、“學習頁面”、“測試頁面”作為輸入值,“期末英語成績”作為輸出值,得到以下規(guī)則:
規(guī)則1:學習模塊=“在線測試”,學習頁面=“X2”,期末英語成績=“S3”,支持度為0.833,重要性為0.411。在線測試頁面花費最多時間,學習頁面所花時間中等,期末英語成績好。
規(guī)則2:在線時間=“T1”,學習頁面=“X1”,期末英語成績=“S1”,支持度為0.547,重要性為0.385。在線時間少,學習頁面所花時間少,期末英語成績差。
規(guī)則3:學習模塊=“首頁即其他”,在線時間=“T1”,期末英語成績=“S1”,支持度為0.667,重要性為0.305。首頁所花時間最多,在線時間少,期末英語成績差。
規(guī)則4:測試頁面=“E1”,學習頁面=“X1”,期末英語成績=“S1”,支持度為0.526,重要性為0.267。測試頁面所花時間少,學習頁面所花時間少,期末英語成績差。
規(guī)則5:學習頁面=“X3”,測試頁面=“E3”,期末英語成績=“S3”,支持度為0.459,重要性為0.222。學習頁面所花時間多,測試頁面所花時間多,期末英語成績好。
從以上5條規(guī)則可以看出,如果學生的網(wǎng)絡學習習慣好,花費較多時間進行在線學習,且在學習模塊花費時間較多,則期末英語能取得好成績;而當學生網(wǎng)絡學習行為差,花費較少時間進行網(wǎng)絡學習,且在首頁花費較多時間時,期末英語成績往往較差。這表明,良好的網(wǎng)絡學習習慣與期末英語成績有著較大關聯(lián)。
四、結(jié)論分析與對策建議
通過對英語網(wǎng)絡學習平臺的學習數(shù)據(jù)等進行關聯(lián)分析,得到相關規(guī)則,發(fā)現(xiàn)了英語網(wǎng)絡學習過程中存在的諸多問題,對于教師的英語教學、學生的自主學習都有一定的啟示和指導作用。傳統(tǒng)網(wǎng)絡教學過程中,教師通常只布置學習任務,較少進行督促和指導,對于學生網(wǎng)絡學習的評判僅限于是否完成規(guī)定的學習時間及期末考試成績,這并不利于網(wǎng)絡學習的可持續(xù)發(fā)展。根據(jù)分析結(jié)果,為英語網(wǎng)絡教學提出以下幾條關鍵信息以及改進意見:
1.網(wǎng)絡學習因素與期末成績有密切關聯(lián)
根據(jù)關聯(lián)分析結(jié)果,學生在線學習時間越多,較好地完成在線測試內(nèi)容,且在學習頁面所花時間較多,期末英語會取得好的成績;而當學生花過多時間在首頁模塊“掛時間”,不進行真正的網(wǎng)絡學習時,期末英語成績往往較差。優(yōu)秀的信息選擇能力和自主學習意識是學生進行網(wǎng)絡學習必不可少的關鍵因素,只有當學生有較強的自主學習意識、自我控制力,并能抵抗網(wǎng)絡的誘惑,選擇對提升自我知識有真正幫助的學習信息時,網(wǎng)絡學習才能算是成功并達到預期的效果。為此,學校應該重視培養(yǎng)學生的網(wǎng)絡學習素質(zhì),改善網(wǎng)絡學習板塊,增強趣味性和有用性,首先引導學生對網(wǎng)絡學習產(chǎn)生興趣,進而讓學生感受到網(wǎng)絡學習對提高英語水平切實有用,才能將學生朝著正確的網(wǎng)絡學習道路上引導。網(wǎng)絡學習與傳統(tǒng)學習最大的差別在于缺少教師的監(jiān)管,教師要加強對網(wǎng)絡學習的監(jiān)管,增強師生交流。網(wǎng)絡學習需要教師付出更多的精力,要及時監(jiān)督學生是否按時完成網(wǎng)絡學習要求,還要安排固定時間與學生進行交流,對網(wǎng)絡學習過程中遇到的疑難問題進行及時輔導。
2.豐富多樣的網(wǎng)絡學習內(nèi)容有助于學生能力的提高
關聯(lián)分析結(jié)果發(fā)現(xiàn),學生的網(wǎng)絡學習因素與英語四級成績關聯(lián)性不強,說明學生的英語網(wǎng)絡學習對大學英語英語四級沒有起到促進作用。英語學習平臺不應該只是書本知識的學習,更應該是提高學生英語水平的平臺,在英語學習平臺中增加豐富的大學英語四級輔導知識、真題測試、模擬測試等板塊,讓學生在基礎知識學習完畢的基礎上能有所提升。一方面能提高學生網(wǎng)絡學習的積極性,另一方面也豐富了英語學習平臺的功能性,真正發(fā)揮英語學習平臺幫助學生學習英語、提高英語水平的初衷和目的。
3.協(xié)作與交流是網(wǎng)絡學習過程中必不可少的重要環(huán)節(jié)
該網(wǎng)絡學習平臺并沒有涉及到網(wǎng)絡互動與小組協(xié)作學習的環(huán)節(jié),存在一定的缺陷。網(wǎng)絡學習并不是孤立的個人學習,網(wǎng)絡學習過程中必要的師生、生生互動交流是必不可少的環(huán)節(jié)。小組協(xié)作學習在一定程度上能促進小組成員的學習,培養(yǎng)學生協(xié)作交流能力;師生之間的互動交流更是能讓學生感受到教師的存在,教師并沒有消失于學習過程,仍然在監(jiān)督和督促自己的學習,有助于約束學生。
4.教師的監(jiān)督和引導是網(wǎng)絡學習過程中至關重要的部分
網(wǎng)絡學習是由學生-計算機構(gòu)成的人機交互式學習,計算機無法給出及時的反饋信息,也無法監(jiān)督學生學習態(tài)度是否端正,網(wǎng)絡學習需要學生有較強的自主學習能力和自制力。在網(wǎng)絡學習中,教師看似輕松,不用面授課程;但實質(zhì)上,網(wǎng)絡教學要取得成功,教師必須付出更多的努力。首先,教師應該適時引導學生,教授學生正確進行網(wǎng)絡學習的方法;其次,教師要及時監(jiān)督學生網(wǎng)絡學習狀況,對未按時完成網(wǎng)絡學習任務的學生給予及時反饋;最后,教師要加強與學生的線上交流與互動,讓學生感受到網(wǎng)絡學習既能隨時隨地學習,又能保持與教師的溝通互動。高校在開展網(wǎng)絡教學初期,應該注重對教師網(wǎng)絡教學能力的培養(yǎng),增強教師網(wǎng)絡教學能力,從而順利開展網(wǎng)絡教學活動。
五、結(jié)束語
本文將關聯(lián)規(guī)則算法應用于網(wǎng)絡學習平臺的數(shù)據(jù)挖掘當中,分析了網(wǎng)絡學習因素與學習結(jié)果之間的關聯(lián),并且找出了網(wǎng)絡學習過程中存在的一些問題,對于網(wǎng)絡學習的教學改進提供了決策支持,為改善網(wǎng)絡教學、提高網(wǎng)絡學習質(zhì)量提供了切實的依據(jù)。
參考文獻:
[1]教育部.教育信息化十年發(fā)展規(guī)劃(2011-2020 年)[DB/OL].http://www.moe.gov.cn /ewebeditor/uploadfile/2012/03/29/20120329140800968.doc,2012-04-01.
[2] Ruipérez-Valiente J A, Mu?oz-Merino P J, Leony D, et al. ALAS-KA: A learning analytics extension for better understanding the learning process in the Khan Academy platform[J]. Computers in Human Behavior, 2014(4):90-101.
[3] Educational Data Mining [DB/OL]. http://www.educationaldatamining.org
[4]Al-Razgan M, Al-Khalifa A S, Al-Khalifa H S. Educational data mining: A systematic review of the published literature 2006-2013[C].Proceedings of the First International Conference on Advanced Data and Information Engineering (DaEng-2013). 2014: 711-719.
[5]李婷,傅鋼善.國內(nèi)外教育數(shù)據(jù)挖掘研究現(xiàn)狀及趨勢分析[J].現(xiàn)代教育技術(shù),2010(10):21-25.
[6]肖志明.關聯(lián)規(guī)則在遠程教育教學評價中的應用[J].中國遠程教育,2012(9):39-42.
[7]吳青,羅儒國,王權(quán)于.基于關聯(lián)規(guī)則的網(wǎng)絡學習行為實證研究[J].現(xiàn)代教育技術(shù),2015(7):88-94.
(編輯:魯利瑞)