丁 鵬 飛
(1. 上海旅游高等專科學校 公共教學部, 上海 201418; 2. 上海師范大學 旅游學院, 上海 200234)
在傳統(tǒng)的課堂教學中,由于難以及時獲取學生個體學習興趣、學習能力、學習進度、面臨困難等方面的動態(tài)數(shù)據,教師通常主觀地參照以往經驗和學生群體的平均接受能力來制定教學目標、內容和進度計劃等,存在一定程度的偏差,忽視了學生個體的差異性和具體特點。隨著教育信息化的不斷深入,運用學習分析技術幫助教師進行教學評估和預測成為必然趨勢。學習分析是通過各種信息化手段監(jiān)測和收集學生學習環(huán)境和過程數(shù)據,運用不同模型和方法,動態(tài)評估和預測學生的課程學習狀態(tài)和效果,使教師根據不同學生的能力水平和實際需求,探究最優(yōu)化的教學方式,為實施有針對性的分類教學提供支持和指導[1]。在學習分析技術支持下,教師可以充分關注學生個體特征,了解學生的實際需求,動態(tài)追蹤每個學生的學習進度,不斷實時調整自己的教學進度和方法,使得學生在同一個學習環(huán)境中可以有不同的學習方法、步驟和進度[2]。
國內很多學者在學習分析領域已經做了探索和嘗試。屬于學習分析理論綜述的研究有:李青等[3]對學習分析的基本概念、組成要素、應用模型、分析方法和工具進行了系統(tǒng)歸納。顧小清等[4]提出學習分析技術應注重監(jiān)測和預測學生的學習成績,最重要是及時發(fā)現(xiàn)潛在問題,對評估和預測結果進行反饋,為教學過程提出有針對性的改進策略和教育決策。郭炯等[5]對國內外2010年以來關于學習分析的期刊論文進行梳理,根據研究重點不同分為理論框架、模型研究、學習分析技術基礎、學習分析工具、應用研究、面臨挑戰(zhàn)等6大類。胡藝齡等[6]分析了網絡在線學習行為的建模機制,構建為數(shù)據、機制、結果3層次。李爽[7]將“參與、堅持、專注、交互、學術挑戰(zhàn)、學習自我監(jiān)控”6類投入作為分析在線學習行為投入的主要維度。利用數(shù)據挖掘方法對學生聚類的研究有:舒忠梅等[8]利用相關分析和數(shù)據挖掘方法相結合,識別學生學習行為投入的相關因素,并將學生聚為7類;田娜等[9]根據學生的相似特性對學生進行聚類分析,以分析對課程成績影響的各種因素;姜強等[10]利用貝葉斯網絡方法不同行為模式的學生學習風格;孫力[11]將學習者歸為4類:聚斂型、發(fā)散型、同化型、調適型。利用回歸模型對成績預測的研究有:馬杰等[12]利用回歸模型預測了成績和多要素之間的線性關系;王亮[13]也設計了學習分析的預測模型,篩選出最佳預測效果的影響因子進行 Logistic 回歸分析,并在教學管理平臺中對該模型進行了實際應用;趙慧瓊[14]利用多元回歸分析法判定影響學生學習績效的預警因素,在此基礎上構建了干預模型,對產生的學習行為數(shù)據進行二元 Logistic 回歸分析,并結合問卷調查和訪談法對該模型在學習活動、知識習得等方面的有效性進行驗證。孫力等[15]采用數(shù)據挖掘中數(shù)據分類決策樹方法,通過分析網絡學歷教育本科學生英語學習及相關信息,實現(xiàn)了對其英語統(tǒng)考成績的預測。
綜上所述,國內關于學習分析的研究多集中在理論引介、研究綜述、應用模型設計與論證等方面,實證性研究仍較缺乏。已有的研究大多是針對在線課程、網絡教育形式的教學,其數(shù)據的獲取較方便和直接;而大多數(shù)學校仍是以面授課堂教學為主、課程考試平臺為輔的線下教育,其特點在于,數(shù)據獲取來源更加多樣,反饋和干預可以更加直接。線下課堂需要通過學習分析技術解決以下問題:高校師生比失調,很難做到關注課堂上的每個學生,如何利用學生課程學習產生的數(shù)據,了解學生已經掌握什么和沒有掌握什么,識別和發(fā)現(xiàn)困難學生?是否可以將學生進行分組和聚類,開展有針對性地分類指導,使得高校大規(guī)模課堂教學和個性化學習能夠得到完美的結合[16-18]。如何根據學生在課程學習中的特定階段和特定活動,從而總結學生的學習習慣和特點,預測每個學生的學習成果;如何整合多個平臺的數(shù)據進行分析和決策,并快速反饋在實際課堂上來改進教學。
本文在查閱國內外相關文獻的基礎上,通過學習分析得到的數(shù)據,應用數(shù)據挖掘的方法構建預測和聚類模型,理解學習過程和學習行為,并依據分析結果重新調整教學活動,對學習困難的學生進行干預和指導,提高教學質量。
以我校2015級200多名學生為研究對象,以計算機應用基礎必修課為切入點。該課程需要學生分3個學期完成64學時的教學內容,并以上海市統(tǒng)一的計算機等級考試成績作為最終學習效果的檢驗標準。學生學習過程和行為跟蹤數(shù)據,包括出勤率、課堂表現(xiàn)、在線瀏覽教學資源頻次、歷次課后練習和作業(yè)完成率(以在線實時測評系統(tǒng)形式),以及前2次學校組織的期末上機考試總成績及分項成績(命名為知識點1~9,見表1)。學生個人屬性指標包括性別、生源地、高考成績、民族等。學生學習效果定量指標為參加上海市計算機等級統(tǒng)考成績。此外,利用微信平臺,進行學習初期(問卷186份)和學習結束(問卷112份)2次在線調查,獲取學生對課程目標和難度的感知、學習興趣、學習滿意度等變化情況。
表1 教學活動流程
學習分析的關鍵技術可參照數(shù)據挖掘的技術方法,如系統(tǒng)建模、分類、聚類、關聯(lián)規(guī)則、決策樹、回歸、社會網絡分析、話語分析及文本挖掘等。本文根據實驗中課程和數(shù)據的特點,采用問卷調查、圖表分析、聚類統(tǒng)計、回歸預測的方法,遵循評估-預測-干預的反饋機制進一步改進和優(yōu)化課程教學 (見圖1)。 評估,主要是利用聚類分析方法,對學習行為特征相似的學生劃分類型,分析各類學生的知識圖譜、課程滿意度,并輔助教師制定個性化的教學和輔導計劃,安排教學進度;預測分析,主要是利用回歸分析方法,以學生學習過程和行為跟蹤數(shù)據為自變量,預測其可能的考試成績或學習效果;干預,是根據評估和預測分析結果,判定每個學生是否存在學業(yè)風險,采取合適的對策和方法進行干預。
圖1 研究框架圖
經過數(shù)據清洗和預處理,刪掉缺失嚴重的數(shù)據,共得到225個樣本數(shù)據。在SPSS軟件中,從學生個人屬性、學習過程(投入)和學習績效3個方面,共選取生源地、基礎背景、作業(yè)完成率、自學進度、在線時長、登錄次數(shù)、德育成績、課堂表現(xiàn)、2次期末成績、性別10個變量,與等級考試成績進行相關性分析。10個變量的信度系數(shù)a=0.726,在可接受的范圍內,具有統(tǒng)計學意義。相關分析結果(見表2)顯示,等級考試成績與前2學期的期末成績、作業(yè)完成率、基礎背景、自學進度等變量相關系數(shù)較高,與性別、生源地、在線時長、登錄次數(shù)、課堂表現(xiàn)以及在校表現(xiàn)這些變量相關性較小,將其剔除。
表2 變量來源和等級考試成績的相關性
在對學生的學習過程與學習結果進行記錄與分析中,發(fā)現(xiàn)不少學生的學習行為呈現(xiàn)一定的相似性,可以歸為一類,不同類型之間有明顯的差異性,于是嘗試應用聚類分析技術對學生學習行為進行類型劃分,并發(fā)現(xiàn)不同類型學生的學習行為特點和規(guī)律。
在前述相關分析的基礎上,選取相關性最高的5個變量進行聚類:學習基礎、自學進度、作業(yè)完成率、課堂表現(xiàn)和前2學期考試成績。首先,將5個變量數(shù)據進行標準化;然后,利用離差平方和法(基本原理是同類之間離差平方和較小,類與類之間離差平方和較大),指定 2~6個類別進行聚類分析,并進行反復試驗;最后,根據聚類中心點的特征和不同類別之間的差異,將學生劃分為為4類,分別命名為被動型、游離型、徒勞無功型,學有余力型,并分析不同類型學生的學習投入模式及其行為特征。
根據不同類型學生各個變量平均值分布雷達圖(見圖2),歸納出其各自特征。
結合實際課堂,不同類別同學的學習狀況和學習特點總結如下:
(1) 學有余力型學生占25.5%,所有指標得分值都最高,各方面全面發(fā)展。在學完課程規(guī)定的知識和技能外,還具備進一步的拓展學習能力。 他們基礎較好,課堂表現(xiàn)積極主動,具有較強自學能力,能獨立完成學業(yè)任務。
(2) 徒勞無功型學生人數(shù)最多,占35.2%。他們基礎一般,在校表現(xiàn)貌似很好,課堂出勤率也很高,各項行為中規(guī)中矩,但學習方法不對,自學能力不足,期末成績并不理想。
(3) 游離型學生占26.2%,他們學習基礎一般,學習目的不明確,學習態(tài)度不積極,有一定自學能力,不夠努力和專心,期末成績中等,學習成績有很大提升空間。
(4) 被動型學生占13.1%,他們基礎和自學能力較差,作業(yè)完成情況較差,成績也較差,有自暴自棄傾向。
按照聚類分析的結果,又進一步統(tǒng)計了不同類型學生在2次期末考試中各知識點上的得分情況(見圖3)。由圖3可見,知識點8和9大部分學生都掌握較好,可以減少課時;但在知識點1上所有學生得分率均較低,應適當增加課時,重點講解;在知識點2和3上,4類學生得分差距較大;在知識點4上,4類學生差距最小;在知識點5和7上,被動型學生和其他3類學生差異較大。以此為依據,可以合理調整教學重點和進度。
圖3 不同類型學生知識圖譜對比
計算機等級考試合格,是學生獲得學位的必要條件之一,同時又是部分專升本考生計算機免試的條件,對于學校教學質量監(jiān)控和學生的學業(yè)評估非常重要。因此,嘗試利用已有學習過程監(jiān)測數(shù)據,運用多元線性回歸分析中的逐步回歸方法,建立符合自變量和因變量之間關系的回歸模型,以更好預測學生的學習成績和效果。這里,以等級考試成績(Y)為因變量,經過3次逐步回歸,確定學習基礎(X1)、期末考試成績(X2)和作業(yè)完成率(X3)為自變量,建立回歸方程:
Y=0.381X1+0.374X2+0.026X3+15.541
(1)
該方程顯著性為0.000,擬合度R2為0.373,具體參數(shù)見表3。
表3 多元回歸的相關系數(shù)
自變量系數(shù)的大小反映了對因變量影響的強弱程度。根據式(1),對計算機統(tǒng)考成績影響程度從大到小依次是期末考試成績、學習基礎和作業(yè)完成率。進一步利用預測成績與實際計算機統(tǒng)考成績進行比對分析(見圖4),以檢驗模型的有效性。參與建模人數(shù)為125人,預測人數(shù)為100人,預測不及格準確率為71.6%,預測及格準確率79.8%?;痉项A測效果。預測結果可為學生或教師提前發(fā)出預警和提醒,以便于及早加強干預。
圖4 預測成績與實際考試成績對比圖
大學生的學習效果很大程度上依賴于學生的自覺。如果教師對于學生的學習行為不能及時監(jiān)測、評估、反饋和干預,學生的參與度、主動性和學習效果將會進一步降低。因此,需要從學習分析視角統(tǒng)計數(shù)據、建模、分析,使教師能夠在數(shù)據支持下不斷改進教學。結合學習初期和后期的2次問卷調查結果和前述的學習特征聚類結果,發(fā)現(xiàn)不同類型的學生對課程興趣,對課程目標和難度的認知存在差異性(見圖5)。例如,被動型和徒勞無功型學生對教學目標認識不清,完成學習任務有較大困難。針對該類學生,加強學習初期教育,端正學習態(tài)度,提高課程學習興趣,改進學習體驗,是教師改進教學工作的關鍵點。同時,按照不同類型學生的學習態(tài)度和能力,可更加有針對性地布置學習任務和作業(yè),并通過作業(yè)和手機平臺來督促和反饋每位學生的學習情況。這樣教學過程能夠體現(xiàn)學習者與教師之間的互動,在分類和預測的基礎上干預和反饋,優(yōu)化學習成績和改進學習體驗,提高教學效果。
圖5 不同類型學生問卷結果對比
每周面授的課程,教師可以及時調整教學策略,并針對不同類型學生合理安排教學進度和內容。從對每個學生的情況中,做出合理判斷和分析,對于徒勞無功學生,重點改進學習方法,提高效率;對于游離型學生,關注和糾正其學習態(tài)度和不良習慣;及時加強干預,幫助被動型學生解決學習困難,樹立信心,對學有余力的學生適當拔高。針對不同類別的學生,結合不同類型學生的知識圖譜,手機上推送預警消息和不同的學習資源,給予有效的引導和建議,激發(fā)興趣,探索影響學生課程滿意度的相關因素。對困難學生及時干預和預警,從最后實際的通過率來看,干預的措施對游離型學生效果較明顯,被動型學生干預效果較差(見表4),需要調整策略進一步改進。
表4 對不同類型學生的干預及效果
以面授課堂上的學生為研究對象進行學習分析,從“計算機應用基礎”課程前2個學期學生產生的學習投入、學習績效和個人屬性特征中篩選出 10個與等級考試成績呈正相關的變量,確定了5個聚類因子,將具有相似性的學生分為4類,分類別統(tǒng)計知識圖譜;選取3個影響學生等級考試成績最大的學習行為因素構建了回歸模型,并預測了學生成績,篩選出困難學生;結合問卷結果,在第3學期的教學中有針對性地進行干預和反饋,根據對測試樣本的驗證,該方法可行有效。后續(xù)將繼續(xù)營造信息化教學環(huán)境,盡力滿足學生的多樣化個性化的需求,轉化多元異構數(shù)據,完善數(shù)據變量,改進預測模型,提高預測的準確性和反饋的實時性。