汪偉 潘夢琪 廖達海 吳南星
摘? 要:隨著現(xiàn)代信息技術(shù)的發(fā)展,教學(xué)數(shù)據(jù)采集已經(jīng)覆蓋線上線下教學(xué)的全流程,對教學(xué)數(shù)據(jù)能否進行深入挖掘分析將決定能否有效建立基于數(shù)據(jù)驅(qū)動的現(xiàn)代教學(xué)決策方式。該文從機械工程基礎(chǔ)課程線上線下教與學(xué)的采集數(shù)據(jù)出發(fā),運用相關(guān)系數(shù)分析、主成分分析及多元線性回歸等多重數(shù)據(jù)處理和分析方法,對測試成績的合理性、影響測試成績的主成分要素的相關(guān)性及權(quán)重、學(xué)業(yè)成績預(yù)測方程等進行深入研究,將信息化教學(xué)與大數(shù)據(jù)分析技術(shù)進行融合。該文初步建立基于教學(xué)數(shù)據(jù)挖掘的學(xué)習(xí)成效分析和學(xué)業(yè)診斷方法,為教學(xué)持續(xù)改進提供依據(jù)和思路,也為進一步建立數(shù)據(jù)驅(qū)動的教學(xué)反饋機制和形成個性化教學(xué)模式奠定基礎(chǔ)。
關(guān)鍵詞:相關(guān)性分析;主成分分析;多元線性回歸;信息化教學(xué);大數(shù)據(jù)
中圖分類號:G640? ? ? ? 文獻標(biāo)志碼:A? ? ? ? ? 文章編號:2096-000X(2024)05-0102-05
Abstract: With the development of modern information technology, teaching data collection has covered the whole process of online and offline education. The establishment of modern teaching decision-making mode depends on whether the teaching data can be effectively mined and analyzed. The data in the paper iscollected from the online and offline teaching and learning of the course of Fundamental of Mechanical Engineering. Several data analysis methods, such as correlation coefficient analysis, principal component analysis and multiple linear regression methods are adopted to analyze the data. Through the analysis and research, the rationality of the test scores, the correlation and weight of the principal components that affect the test scores, and the prediction equation of academic performance are all obtained. Through the presented analysis methods, the information-based teaching and data analysis technique get effective integration. The study effectiveness analysis and diagnosis methods are preliminary established based on data mining in the paper. It provides basis and thinking for teaching improving and lays the foundation for setting up the data-driven teaching feedback mechanism and personalized teaching model.
Keywords: correlation analysis; principal component analysis; multiple linear regression; information-basedteaching; bigdata
隨著互聯(lián)網(wǎng)、云計算及大數(shù)據(jù)等現(xiàn)代信息技術(shù)的發(fā)展,人們的思維、生產(chǎn)、生活及學(xué)習(xí)方式得到深刻的改變。轉(zhuǎn)變傳統(tǒng)教學(xué)模式,打造適應(yīng)新教改要求及新信息時代下的高效課堂教學(xué)模式勢在必行。翻轉(zhuǎn)課堂[1]和MOOC[2]這樣新的教學(xué)方式有效地打破了傳統(tǒng)的教學(xué)模式,使得教學(xué)過程變成以教師為主導(dǎo)和以學(xué)生為主體相結(jié)合,但是MOOC教學(xué)缺乏師生的協(xié)作探究、互動交流、討論答疑,而翻轉(zhuǎn)課堂則缺少教學(xué)數(shù)據(jù)的生成和分析,無法根據(jù)學(xué)生的反饋重新認識課堂,找出問題,有針對性地開展教學(xué)。
依據(jù)高校人才培養(yǎng)目標(biāo),需要構(gòu)建基于教學(xué)大數(shù)據(jù)分析的個性化教學(xué)模式,將整個教學(xué)活動數(shù)據(jù)化,通過數(shù)據(jù)分析調(diào)整教學(xué)計劃,真正實現(xiàn)以學(xué)生為中心,以學(xué)定教,提高課堂教學(xué)效率和教學(xué)質(zhì)量。超星泛雅平臺、藍墨云班課、雨課堂[3-5]等提供了學(xué)生和教師之間的互動及教學(xué)數(shù)據(jù)的收集平臺,如可以進行課堂上的實時答題、彈幕互動,提供學(xué)生的課外自學(xué)時間、課堂答題成績等數(shù)據(jù),但是這些教學(xué)平臺本身缺乏對于教學(xué)數(shù)據(jù)的分析和挖掘,而無法完成對于教學(xué)成效的分析和學(xué)生學(xué)業(yè)的診斷。如何將大數(shù)據(jù)分析技術(shù)和信息化教學(xué)深度融合,以技術(shù)促進教學(xué)方法創(chuàng)新,明確教學(xué)行為和教學(xué)成效的關(guān)系成為發(fā)揮這些教育數(shù)據(jù)采集平臺最佳功能的關(guān)鍵。
劉大蓮等[6]收集了學(xué)生概率論與數(shù)理統(tǒng)計、微積分兩門課程的多組數(shù)據(jù),采用可拓距的k-means聚類算法分析學(xué)生對知識點的掌握程度,針對學(xué)生給出其及格與否的某幾個具體知識點,以便學(xué)生以后進行有所側(cè)重的學(xué)習(xí)。倪雪華[7]采集了學(xué)生課余學(xué)習(xí)時間、聽課認真程度、作業(yè)完成情況的數(shù)據(jù),利用ID3算法建立決策樹,計算信息增益,最終得到了這幾組數(shù)據(jù)之間的權(quán)重關(guān)系。張貴元[8]抽取學(xué)生的各科成績,將數(shù)據(jù)預(yù)處理后用Microsoft聚類分析算法對數(shù)據(jù)進行分組分析,為學(xué)生英語測試的報考提供了合理的建議。現(xiàn)有的教學(xué)數(shù)據(jù)研究集中于分析學(xué)生平時行為數(shù)據(jù)與成績的相關(guān)性,計算其對學(xué)生成績的影響程度,以此來優(yōu)化學(xué)生的學(xué)習(xí)方法。
本文以機械工程基礎(chǔ)課程的線上自習(xí)、提問、線下作業(yè)和測試等教學(xué)數(shù)據(jù)為基礎(chǔ),通過數(shù)據(jù)挖掘評估學(xué)生針對該課程知識和能力的變化,運用多種數(shù)據(jù)分析和處理方法,如主成分分析法、多元線性回歸分析,建立學(xué)生學(xué)習(xí)成效分析和學(xué)業(yè)診斷數(shù)學(xué)模型,計算出學(xué)生學(xué)習(xí)的各個主要影響因素的權(quán)重及學(xué)業(yè)成績預(yù)測方程,初步建立基于教學(xué)大數(shù)據(jù)的教學(xué)成效分析方法,為進一步建立基于教學(xué)大數(shù)據(jù)的教學(xué)反饋機制和形成個性化教學(xué)模式奠定基礎(chǔ)。
一? 教學(xué)數(shù)據(jù)采集
以機械工程基礎(chǔ)課程為例,進行學(xué)習(xí)數(shù)據(jù)的采集和分析。該課程的教學(xué)以線下教學(xué)為主,線上教學(xué)為輔,其中線上教學(xué)依托自主開發(fā)的智慧教育平臺,該平臺主要針對大學(xué)課堂的授課、學(xué)生課前自學(xué)、課堂測試、課后作業(yè)互評、答辯互評和主題討論等場景,對教師授課的數(shù)據(jù)(學(xué)生簽到、測驗答題、課下自學(xué)、課上跟隨及作業(yè)互評情況等)進行收集和可視化處理,最終以圖片、表格等形式進行展示。
如圖1所示,在該課程的授課前,教師通過智慧教育平臺創(chuàng)建課程,制作插入問題的授課PPT并導(dǎo)入平臺;提前發(fā)布預(yù)習(xí)資料,提醒學(xué)生及時預(yù)習(xí)。在授課的過程中,在關(guān)鍵知識點處發(fā)布課堂測驗,及時了解學(xué)生對知識點的掌握程度;教師在平臺發(fā)布當(dāng)天的課后作業(yè),對教學(xué)內(nèi)容的一些重難點還可以發(fā)布主題討論,激發(fā)學(xué)生的思考,同時還可以開啟以小組為單位的答辯和互評,促進學(xué)生對于課程重難點內(nèi)容的相互交流。
通過完整一學(xué)期的授課,對學(xué)生的學(xué)習(xí)情況通過智慧平臺進行數(shù)據(jù)采集,所有數(shù)據(jù)分為線上的過程性數(shù)據(jù)和線下的階段性數(shù)據(jù)兩部分。過程性數(shù)據(jù)包括學(xué)生的課堂表現(xiàn)數(shù)據(jù)及課后的自學(xué)、討論和作業(yè)數(shù)據(jù);階段性數(shù)據(jù)為所有學(xué)生共同參與的兩次集體測試——期中測試和期末測試成績。最終采集的教學(xué)數(shù)據(jù)包括:自學(xué)參與率、自學(xué)總時長、自學(xué)完成率、自學(xué)提問次數(shù)、課堂答題得分、課堂答題時長、課堂跟隨率、課后作業(yè)成績及兩次測試的成績,部分數(shù)據(jù)截圖如圖2所示。
二? 教學(xué)數(shù)據(jù)分析
(一)? 分析思路
為了探究學(xué)生在機械工程基礎(chǔ)課程中的表現(xiàn)與成績、教學(xué)模式之間的關(guān)系,從多個角度采集和分析數(shù)據(jù)。首先,分析數(shù)據(jù)前需要確定其合理性,因此對學(xué)生的兩次測試數(shù)據(jù)進行了正態(tài)性檢驗;其次,學(xué)生的日常行為數(shù)據(jù)與成績有著一定的關(guān)聯(lián),所以分別用線上自學(xué)數(shù)據(jù)、課后作業(yè)數(shù)據(jù)與學(xué)生測試成績進行相關(guān)性分析;為進一步確定學(xué)生平時行為數(shù)據(jù)對成績的影響程度,采用主成分分析法計算各個影響因素的權(quán)重;最后,利用多元線性回歸分析得到學(xué)生期末測試成績的回歸預(yù)測方程,從而可以提前進行學(xué)業(yè)預(yù)警和針對性指導(dǎo),本文的整體數(shù)據(jù)分析流程圖如圖3所示。
(二)? 測試成績合理性分析
為了確認兩次集體測試成績的合理性,對測試成績進行基本量分析,得到平均值、標(biāo)準(zhǔn)差、方差等數(shù)據(jù),見表1。兩次測試成績的滿分均為100分,最大值均為92分,最小值分別為30分和29分,平均值分別為60.97分和63.06分,所有成績中未出現(xiàn)個位數(shù)和滿分情況。
根據(jù)經(jīng)驗法則(3σ法則),對于服從正態(tài)分布或近似正態(tài)分布的數(shù)據(jù)集,68.3%的值在+/-1個標(biāo)準(zhǔn)差范圍內(nèi),95.4%的值在+/-2個標(biāo)準(zhǔn)差范圍內(nèi),99.7%的值在+/-3個標(biāo)準(zhǔn)差范圍內(nèi)。圖4給出了兩次測試的不同分數(shù)段的頻數(shù)直方圖,以及在均值的1到3個標(biāo)準(zhǔn)差內(nèi)的分布概率,從圖4中可以看出,兩次測試的成績都符合近似正態(tài)分布的經(jīng)驗法則。同時采用夏皮洛-威爾克正態(tài)性檢驗方法(S-W檢驗)進行正態(tài)檢驗[9],通過計算得到兩次測試成績的顯著性檢驗P值見表1,兩組數(shù)據(jù)的P值均大于臨界值0.05,表明兩次測試成績通過了正態(tài)性檢驗。
(三)? 測試成績的相關(guān)性分析
隨著信息化的發(fā)展,課堂教學(xué)+線上自學(xué)的線上線下結(jié)合的教學(xué)方式越來越成為主流,為了探究學(xué)生線上自學(xué)情況與成績的相關(guān)性,以自學(xué)參與率、自學(xué)總時長、自學(xué)完成率及自學(xué)提問次數(shù)作為自變量,分別與兩次測試做雙變量相關(guān)性分析??紤]到這些自變量的數(shù)值不太符合正態(tài)分布規(guī)律,本文采用斯皮爾曼(Spearman)相關(guān)系數(shù)來描述變量之間的相關(guān)性,通過SPSS軟件分析得到線上自學(xué)情況與兩次測試的相關(guān)系數(shù)見表2。
一般情況下,在顯著性水平值為0.05時,斯皮爾曼相關(guān)系數(shù)值大于等于0.335,即表明變量之間具有較強的相關(guān)性[10]。表2中的相關(guān)系數(shù)值均大于等于0.34,表明線上自學(xué)情況與最終的測試成績具有較強的相關(guān)性,其中自學(xué)參與率和自學(xué)總時長與測試成績的相關(guān)性相對更強(相關(guān)系數(shù)值相對更大),說明投入更多精力和時間在線上自學(xué)的學(xué)生會取得更好的學(xué)習(xí)成效。對自學(xué)情況與兩次測試成績的相關(guān)系數(shù)進行對比分析,自學(xué)參與率和自學(xué)完成率的相關(guān)系數(shù)值增加,而自學(xué)總時長和自學(xué)提問次數(shù)的相關(guān)系數(shù)值則有所下降。再對學(xué)生的線上自學(xué)具體數(shù)據(jù)進行挖掘,發(fā)現(xiàn)學(xué)生的自學(xué)時間更多投入在該門課程的前一半章節(jié);而對于每一章節(jié)的學(xué)習(xí)資料來說,也是前一半內(nèi)容得到更多的關(guān)注,這說明在自學(xué)的過程中,學(xué)生們很難保持學(xué)習(xí)的連續(xù)性和一致性,使得自學(xué)的效果降低,而那些在對知識點逐步學(xué)習(xí)和理解掌握過程中,能夠堅持完成自學(xué)任務(wù)的學(xué)生會有更好的學(xué)習(xí)成效。
接下來探究課后作業(yè)完成狀況與期末測試成績的相關(guān)性,該門課程課下共布置了五次作業(yè),首先通過皮爾遜(Pearson)相關(guān)系數(shù)[11]分析五次作業(yè)成績與期末測試成績的相關(guān)性,得到系數(shù)分別為:0.217、0.505、0.277、0.111和-0.118。從數(shù)值來看,作業(yè)成績與期末測試成績的線性相關(guān)性不強,尤其是第五次作業(yè)更是出現(xiàn)了負相關(guān)。一方面是相比于期末考試,課后作業(yè)的完成時間更寬裕,而且可以查閱相關(guān)資料進行參考;另一方面在于難以對課后作業(yè)的獨立完成度進行把控。由于直接對成績進行相關(guān)性分析的結(jié)果不太理想,本文將期末測試成績轉(zhuǎn)換為類別變量,即將學(xué)生的期末測試成績定義為不及格、及格、良好和優(yōu)秀四個等級,其中低于60分為不及格,60~74分為及格,75~84分為良好,85~100分為優(yōu)秀,然后通過Eta相關(guān)系數(shù)[12]對期末測試成績(類別變量)和平時作業(yè)成績(連續(xù)變量)的關(guān)聯(lián)強度進行分析。利用SPSS軟件計算得到五次作業(yè)與期末測試的Eta相關(guān)系數(shù),見表3。
從表3中可以看出,不同等級學(xué)生的五次作業(yè)均值存在著相應(yīng)的差異,優(yōu)秀的學(xué)生作業(yè)平均分穩(wěn)定在90分以上,而不及格的學(xué)生作業(yè)平均分則在70~95分之間波動。當(dāng)Eta相關(guān)系數(shù)處于0.25~0.40之間時,變量之間存在中等程度相關(guān),而當(dāng)Eta相關(guān)系數(shù)大于0.4時變量之間存在較強相關(guān)性,這表明作業(yè)一和作業(yè)三與期末測試呈中等程度相關(guān),而其他三次作業(yè)與期末測試呈較強相關(guān)性,這為教師對作業(yè)的合理和有效性分析提供了參考。該門課程的作業(yè)一題目的內(nèi)容為力學(xué)基礎(chǔ)部分的物體受力分析,從內(nèi)容覆蓋度及難易程度上都和期末考試的試題接近,但是題目均可以直接檢索得到,影響到了作業(yè)的訓(xùn)練效果;作業(yè)三題目的內(nèi)容為機械原理部分的連桿機構(gòu)和凸輪機構(gòu),相當(dāng)于把兩章節(jié)的作業(yè)內(nèi)容合到一起,但是在題量上沒有增加,導(dǎo)致作業(yè)對知識點的覆蓋度不夠。本節(jié)的分析結(jié)果為后續(xù)的教學(xué)持續(xù)改進提供了依據(jù),一方面,要鼓勵和引導(dǎo)學(xué)生完成線上的自學(xué)任務(wù);另一方面,在作業(yè)的設(shè)置上要把握好質(zhì)和量的關(guān)系,要能激發(fā)學(xué)生對知識點的獨立思考。
(四)? 測試成績的主成分分析
對于本門課程在授課過程中課堂表現(xiàn)環(huán)節(jié)及課后自學(xué)環(huán)節(jié),可通過主成分分析法分析不同變量對于學(xué)生最終測試成績的影響程度,并計算出各個變量的權(quán)重。通過SPSS軟件計算得到課后作業(yè)平均分、自學(xué)完成率、自學(xué)參與率、自學(xué)總時長、課堂跟隨率均值、答題時長、答題次數(shù)和答題總分八個自變量的特征值、累計貢獻率及指標(biāo)權(quán)重見表4。特征值大于1是判斷主成分的通用標(biāo)準(zhǔn)[13],由表4中的數(shù)據(jù)可知,課后作業(yè)平均分、自學(xué)完成率、自學(xué)參與率這三個變量因素的特征值均大于1,而且自學(xué)參與率累計貢獻率為80.04%,對期末測試成績起著主要的作用和影響。
從表4中八個變量因素的指標(biāo)權(quán)重來看,學(xué)生的課后表現(xiàn)——課后作業(yè)平均分、自學(xué)完成率、自學(xué)參與率和自學(xué)總時長有著更高的權(quán)重系數(shù),而課堂上的表現(xiàn)——課堂跟隨率均值、答題時長、答題次數(shù)和答題總分的指標(biāo)權(quán)重相對更低,說明在課后的預(yù)習(xí)、復(fù)習(xí)、作業(yè)練習(xí)上投入足夠的精力能夠起到較好的學(xué)習(xí)成效,教師們也可以在這些環(huán)節(jié)上通過教學(xué)改革加強學(xué)生的投入度和完成度。
(五)? 測試成績的多元線性回歸性預(yù)測分析
隨著工程教育認證OBE理念的普及,以學(xué)生為中心要求加強對學(xué)生學(xué)業(yè)的過程性監(jiān)控并及時進行學(xué)業(yè)幫扶,有必要根據(jù)學(xué)生的平時考核數(shù)據(jù)建立最終測試成績的預(yù)測模型,從而提前對學(xué)生進行學(xué)業(yè)預(yù)警。多元線性回歸模型通常用來研究一個因變量與多個自變量之間的關(guān)系,在滿足模型決定系數(shù)、相關(guān)性檢驗等條件的基礎(chǔ)上,可對因變量進行預(yù)測。以期末測試的成績?yōu)橐蜃兞縔,期中測試成績和課后作業(yè)成績?yōu)樽宰兞?,分別為X1和X2,建立多元線性回歸預(yù)測方程:Y=aX1+bX2+c,其中a和b為對應(yīng)變量X1和X2的回歸系數(shù),c為預(yù)測方程的常數(shù)項。
通過SPSS軟件的回歸模塊分析得到回歸預(yù)測方程中的多元線性回歸系數(shù)及常數(shù)項分別為:a=0.79,b=1.03,c=-78.90,即具體的線性回歸預(yù)測方程為:Y=0.79X1+1.03X2-78.90。
對于該回歸模型,求得擬合優(yōu)度檢驗值——修正R2值為0.73,該值較接近于1,表明了線性回歸擬合程度較好。最后通過t檢驗對變量系數(shù)的顯著性進行檢驗,計算得到期中測試成績和課后作業(yè)成績的變量系數(shù)顯著性檢驗值分別為0.00和0.01,兩個值均小于0.05,表明了兩個自變量對因變量具有很強的解釋性。
三? 結(jié)論
為了明確教學(xué)行為和教學(xué)成效的關(guān)系,本文以機械工程基礎(chǔ)課程的線上線下教與學(xué)的過程中采集的數(shù)據(jù)為基礎(chǔ),運用多種數(shù)據(jù)分析和處理方法進行學(xué)生學(xué)習(xí)成效分析和學(xué)業(yè)診斷。
首先,通過S-W檢驗驗證了學(xué)生測試成績符合正態(tài)分布特征,具有合理性。其次,對線上自學(xué)過程中的相關(guān)變量與測試成績進行了斯皮爾曼相關(guān)性分析,以及對學(xué)生的作業(yè)成績與測試成績進行了Eta相關(guān)系數(shù)分析,基于分析結(jié)果數(shù)據(jù)對學(xué)生的線上自學(xué)投入情況,以及作業(yè)情況對學(xué)習(xí)成效的影響進行了深入剖析,為教學(xué)改進提供了依據(jù)。然后,對教學(xué)行為數(shù)據(jù)進行了主成分分析,發(fā)現(xiàn)學(xué)生的課后學(xué)習(xí)投入對學(xué)習(xí)成效有著較高的權(quán)重占比。最后,通過建立多元線性回歸模型確定期末測試成績預(yù)測方程,以此進行針對性學(xué)業(yè)指導(dǎo)。
本文的研究為大數(shù)據(jù)分析技術(shù)和信息化教學(xué)的深度融合提供了方法,同時本文的研究成果為教學(xué)改進提供了依據(jù)和思路,對提高教學(xué)質(zhì)量具有一定的指導(dǎo)意義。
參考文獻:
[1] 湯赫男,王世杰,趙鐵軍.基于慕課與翻轉(zhuǎn)課堂的機械設(shè)計實驗教學(xué)[J].機械設(shè)計,2018,35(S2):406-408.
[2] 郭安福,包春江,王敏.基于MOOC的機械設(shè)計教學(xué)實例[J].機械設(shè)計,2020,37(S2):249-253.
[3] 王莉,徐亮.基于超星泛雅平臺的混合式教學(xué)模式探索與實踐——以高職“計算機應(yīng)用基礎(chǔ)”課程為例[J].機械職業(yè)教育,2020(3):47-51.
[4] 張黎,諶俊,姚彥欣.混合式教學(xué)模式背景下基于不同在線教學(xué)平臺的應(yīng)用比較研究——以“超星泛雅”“雨課堂”為例[J].教育現(xiàn)代化,2020,7(43):26-30.
[5] 徐麗莎,錢曉山.基于藍墨云班課的“高頻電子線路”課程教學(xué)改革[J].無線互聯(lián)科技,2021,18(23):148-149.
[6] 劉大蓮,田英杰.可拓數(shù)據(jù)挖掘在學(xué)生成績分析中的應(yīng)用研究[J].智能系統(tǒng)學(xué)報,2022,17(4):707-713.
[7] 倪雪華.用數(shù)據(jù)挖掘方法分析學(xué)生成績的影響因素[J].電腦編程技巧與維護,2014(19):60-62.
[8] 張貴元.基于數(shù)據(jù)挖掘聚類算法的學(xué)生成績分析[J].電腦知識與技術(shù),2019,15(9):1-2.
[9] 張紀泉.總體分布的正態(tài)性檢驗——介紹夏皮羅-威爾克的W檢驗法[J].中國纖檢,1982(5):34-40.
[10] 吳喜之.統(tǒng)計學(xué)[M].北京:高等教育出版社,2008.
[11] 王小霞,李智紅.大學(xué)生學(xué)習(xí)風(fēng)格與英語能力的相關(guān)性研究[J].淮南師范學(xué)院學(xué)報,2014(2):134-138.
[12] 邱皓政.量化研究與統(tǒng)計分析[M].重慶:重慶大學(xué)出版社,2009.
[13] 張懿彬,張良云,張璐.基于SPSS主成分分析的數(shù)學(xué)分析成績影響因素研究[J].高師理科學(xué)刊,2017,37(4):57-60.