亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多數(shù)據(jù)平臺的學生學業(yè)預警模型構(gòu)建研究*

        2022-06-25 17:52:55林龍沈海青
        中國教育技術裝備 2022年22期
        關鍵詞:數(shù)據(jù)挖掘深度學習

        林龍 沈海青

        摘? 要? 傳統(tǒng)的基于數(shù)據(jù)挖掘技術的學業(yè)表現(xiàn)研究存在數(shù)據(jù)來源單一、學習行為靜態(tài)、數(shù)據(jù)關聯(lián)模型準確度低等問題,如何對學業(yè)表現(xiàn)進行實時動態(tài)精確監(jiān)測,更好地為教育管理者服務,實現(xiàn)學生學業(yè)預警,是目前較難解決的問題。針對以上問題,借助學校的多個平臺數(shù)據(jù)系統(tǒng),圍繞學業(yè)表現(xiàn)預警問題,采用當下前沿的深度學習方法構(gòu)建模型,進行學習表現(xiàn)預測,研究成果為學校和教師及時進行調(diào)整并給出個性化指導提供有益思路。

        關鍵詞? 教育大數(shù)據(jù);數(shù)據(jù)平臺;數(shù)據(jù)挖掘;深度學習;學業(yè)預警

        中圖分類號:G712? ? 文獻標識碼:B

        文章編號:1671-489X(2022)22-0034-04

        0? 引言

        隨著智慧校園、數(shù)字校園的推廣,大數(shù)據(jù)早已進入校園各個角落,學生在學習、生活中無時無刻不在產(chǎn)生數(shù)據(jù),背后都有相應的數(shù)據(jù)系統(tǒng)在跟蹤記錄。與此同時,教育也從經(jīng)驗向數(shù)據(jù)驅(qū)動決策、管理的方向發(fā)展,教育大數(shù)據(jù)研究和應用是當下熱議的話題。學生的學業(yè)表現(xiàn)是教育大數(shù)據(jù)應用研究的一個重要方向,也是學校教育管理者、教師、家長共同關心的焦點。不少學者將教育大數(shù)據(jù)和人工智能技術相結(jié)合,應用于學生的學習行為分析和學業(yè)表現(xiàn)預測,目前在相關方面已開展深入而廣泛的研究[1-2]。但是基于數(shù)據(jù)挖掘分析技術的學業(yè)表現(xiàn)研究還存在以下問題。

        1)數(shù)據(jù)來源單向、片面。學生的學業(yè)數(shù)據(jù)往往來源于課程成績,這類數(shù)據(jù)較為單一。實際上,評價學生的學業(yè)表現(xiàn)應該是多維度多方面的。學生無時無刻不在產(chǎn)生數(shù)據(jù),學業(yè)表現(xiàn)應該體現(xiàn)在學生學習、生活的方方面面,比如學生的德智體美勞,這五個方面都應該被納入評價范圍,因此需要構(gòu)建一個整合型教育數(shù)據(jù)系統(tǒng)。

        2)學習行為的單一性、靜態(tài)性?;趯W習行為的分析往往只考慮單一或者幾種靜態(tài)的學習行為,并未考慮學習行為隨著時間而變化的特點,因此,如何追蹤學生在學習過程中不斷變化的行為特征,如何精準確定學生相應階段的狀態(tài)變化等,是當前教育數(shù)據(jù)研究實踐中亟待解決的難題。

        3)數(shù)據(jù)關聯(lián)模型精度不夠。如何基于學習生活行為對學業(yè)表現(xiàn)的影響,構(gòu)建學業(yè)表現(xiàn)的自變量和因變量因子,從而進行客觀全面評價,并對不良趨勢進行精確預測預警,是目前研究的一個難點。

        針對以上問題,在教育大數(shù)據(jù)挖掘分析與應用中,收集和打通與學生相關的多個數(shù)據(jù)系統(tǒng),消除數(shù)據(jù)冗余,形成整合型教育數(shù)據(jù)系統(tǒng),構(gòu)建全方位的學生立體化數(shù)據(jù)庫,通過人工智能算法技術,從宏觀層面對學生學業(yè)表現(xiàn)情況進行建模研究,同時在微觀層面針對學生個體動態(tài)監(jiān)控學習過程、實時預測學習成績、有效評價學習結(jié)果,進而提供有針對性的干預和指導,顯得很有實際價值和現(xiàn)實意義[3]。

        深度學習技術由多倫多大學的Hinton教授提出,是目前機器學習的最新熱門研究領域。深度學習算法已被很多學者應用于學習預測、語音識別等諸多領域,并展示出寬廣的應用空間和價值,比其他的數(shù)據(jù)挖掘方法更具靈活性和準確性,也彌補了許多數(shù)據(jù)挖掘方法的缺點[4]。本文基于深度學習算法,綜合學生在校表現(xiàn)的多維度評價數(shù)據(jù),高效利用學習過程的動態(tài)數(shù)據(jù),構(gòu)建基于時間的學習行為表現(xiàn)模型,對學生的學習狀態(tài)進行實時監(jiān)測,從而實現(xiàn)學業(yè)表現(xiàn)異常學生的及時預警。

        1? 整合型教育數(shù)據(jù)系統(tǒng)采集

        基于學生在校學習生活多類平臺系統(tǒng),對各類數(shù)據(jù)進行收集匯總,建立學生在校檔案的立體數(shù)據(jù)庫,通過該數(shù)據(jù)庫可以了解學生在校學習生活的全方位信息。依據(jù)獲得數(shù)據(jù)的來源場合,從以下七個方面進行數(shù)據(jù)收集:

        1)招生管理系統(tǒng)中的檔案數(shù)據(jù),記錄了學生的基本信息;

        2)教學平臺數(shù)據(jù),記錄了教務管理系統(tǒng)中學生的各門課程考試成績;

        3)在線學習平臺數(shù)據(jù),記錄了課堂教學過程中學生的學習行為數(shù)據(jù);

        4)體育系統(tǒng)中的體測平臺數(shù)據(jù),記錄了學生體育鍛煉和測試的各項數(shù)據(jù);

        5)教育科研平臺數(shù)據(jù),記錄學生參與創(chuàng)新創(chuàng)業(yè)、技能比賽數(shù)據(jù);

        6)學生社會實踐平臺數(shù)據(jù),記錄學生成長過程中的學習工作行為;

        7)圖書借閱數(shù)據(jù),記錄了圖書管理系統(tǒng)中學生的閱讀記錄、借閱次數(shù)等。

        采集表1所示數(shù)據(jù)表格作為學生個體的學業(yè)表現(xiàn)數(shù)據(jù),以固定周期作為數(shù)據(jù)統(tǒng)計的內(nèi)容,將數(shù)據(jù)以向量的形式保存在系統(tǒng)中,做好標簽記錄,所有數(shù)據(jù)均以數(shù)值形式體現(xiàn)。

        2? 基于深度學習的學生學業(yè)表現(xiàn)模型構(gòu)建及預測

        2.1? 數(shù)據(jù)預處理

        根據(jù)以上七大數(shù)據(jù)系統(tǒng)中提取的數(shù)十維特征,設得到的特征矩陣為X:

        其中,X(t)=當前學期不同月份對應的特征矩陣,m=學生數(shù),n=特征個數(shù),t=時間度量間隔,本文以月份進行表示。

        由于數(shù)據(jù)維度很高,且格式不統(tǒng)一,因此需要對自變量數(shù)據(jù)X進行預處理。先對單個學生的單組數(shù)據(jù)進行歸一化,然后進行主成分分析(PCA),獲得學生單組特征數(shù)據(jù)集。具體步驟如下。

        1)標準化。對特征矩陣X中的每個月份特征X(t)進行Z-Score標準化,得到具體標準化公式:

        其中,和σ分別為每個月份特征X(t)的均值和方差。

        2)降低數(shù)據(jù)維度。利用主成分分析方法對每個固定周期特征進行降維,設定累積方差貢獻率θ,選擇累積方差貢獻率大于θ的主成分,作為降維后的特征Xd(t)。

        學生的課程種類多,數(shù)據(jù)維度高,對因變量數(shù)據(jù)Y進行預處理。設計以每學期的加權平均作為綜合成績,公式如下:

        其中,n=該生本學期的課程數(shù)量,credit=某門課程學分,score=某門課程成績。計算得到每學期的綜合加權平均成績之后,將成績按照優(yōu)秀、良好、中等、及格、不及格分成五檔,對應的分數(shù)分別為:90分及以上,80~89分,70~79分,60~69分,低于60分。以分數(shù)段進行獨熱編碼,形成學生成績標簽Y:

        2.2? 建立學習狀態(tài)異常監(jiān)測模型

        構(gòu)建many2one形式的長短時記憶網(wǎng)絡模型[5],將同一學生連續(xù)的若干個單組特征數(shù)據(jù)集輸入模型進行訓練,得到該學生的預測模型,從而實現(xiàn)對學生當前成績的預測預警。

        將Xd(t)作為輸入,Y作為輸出,訓練長短時記憶網(wǎng)絡模型(LSTM),采用交叉熵損失函數(shù)作為損失函數(shù),形式如下:

        其中,Y表示實際輸出,表示預測輸出。優(yōu)化器采用隨機梯度下降算法(SGD),為了獲取網(wǎng)絡模型的隱層單元值,在輸入與輸出處加入dropout層。另外,本模型中也可利用多個已知的歷史學業(yè)數(shù)據(jù)增多訓練次數(shù),以便提高模型的預測準確率。

        2.3? 實現(xiàn)預測預警

        在進行成績預測時,收集學生上一個學期的相應學業(yè)表現(xiàn)數(shù)據(jù),按照以上方法提取特征并進行標準化,然后進行PCA降維,將低維特征數(shù)據(jù)輸入訓練完成的LSTM模型,計算獲得網(wǎng)絡預測結(jié)果,即學生的成績類別,其中每個學生的預測結(jié)果為。

        具體實施步驟如圖1所示。

        1)對預測結(jié)果進行轉(zhuǎn)化賦值。將學生的預測結(jié)果按照所在檔次的分段平均分進行轉(zhuǎn)化。

        2)計算公式。其中,W為預警率,當W>0時,說明該生學業(yè)表現(xiàn)存在下滑;當W>30%時,說明該生退步較大,需要談話預警。

        3? 學業(yè)預警實例分析

        以臺州科技職業(yè)學院汽車專業(yè)20級97位學生為例,進行學業(yè)預警分析。首先,根據(jù)不同的數(shù)據(jù)庫,收集學生各方面數(shù)據(jù)信息,同時計算學生的綜合加權平均成績,設置2020—2021學年第二學期學生在校期間五個月的數(shù)據(jù)作為訓練樣本數(shù)據(jù),設置2021—2022學年第一學期學生的綜合加權平均成績作為因變量標簽。按照表2,對每個學生的綜合行為表現(xiàn)數(shù)據(jù)以單月為單位進行特征提取,然后進行獨熱編碼,設置如下:

        其中,Y1=[1? 0? 0? 0? 0]對應[90,100),Y2=[0? 1? 0? 0? 0]對應[80,90),Y3=[0? 0? 1??0? 0]對應[70,80),Y4=[0? 0? 0? 1? 0]對應[60,70),Y5=[0? 0? 0? 0? 1]對應(0,60)。

        最終得到學生特征矩陣X的大小為97×32,標簽矩陣Y大小為97×5。即總共學生人數(shù)97人,提取的特征為32維。對特征數(shù)據(jù)進行Z-Score標準化,然后進行PCA降維,選擇累積方差貢獻率大于90%的主成分對應的特征作為降維后的特征,降維后特征數(shù)據(jù)集為Xd(t),矩陣大小為97*4。

        以每個月份特征矩陣Xd(t)作為輸入,Y作為輸出,訓練長短時記憶網(wǎng)絡模型,采用交叉熵損失函數(shù),優(yōu)化器采用隨機梯度下降算法(SGD)。此時輸入網(wǎng)絡的序列長度為5,輸入維度為4。通過網(wǎng)格搜索法進行參數(shù)尋優(yōu),獲得優(yōu)化參數(shù):批輸入大小為32,網(wǎng)絡隱層單元為32,網(wǎng)絡隱藏層層數(shù)為1,SGD中的動量參數(shù)為0.8,學習率設置為1×10-3,dropout層的丟棄比率為0.6。

        取2021—2022學年第一學期的學業(yè)表現(xiàn)狀況來預測2021—2022學年第二學期學生的成績情況。獲取測試數(shù)據(jù),按照圖1所示步驟進行特征提取,標準化降維后輸入訓練完成的網(wǎng)絡中進行測試,最終得到每個學生的預測成績狀況。對每個學生預測成績所處分段,按照平均分進行轉(zhuǎn)化,然后計算該學生上一學期成績與轉(zhuǎn)換后的預測成績差值,獲得預警率,如表2所示。篩選預警率大于30%的學生,總共九人,即成績下滑的學生,輔導員、班主任進行談話預警。

        4? 結(jié)束語

        學生的學業(yè)表現(xiàn)與平時的學習生活息息相關,其數(shù)據(jù)應來源于學生多個方面的數(shù)據(jù)平臺,以此能更客觀全面評價學生的學業(yè)。本文基于學生在校學習生活多類平臺系統(tǒng),對各類數(shù)據(jù)進行收集匯總,建立學生在校檔案的立體數(shù)據(jù)庫,通過該數(shù)據(jù)庫可以了解學生在校學習生活的全方位信息;通過歸一化、加權平均、PCA分析對不同教育數(shù)據(jù)類別進行統(tǒng)一,以便提取相應的教育大數(shù)據(jù)特征,然后以該段時間內(nèi)的學習表現(xiàn)特征為自變量,以綜合學業(yè)成績?yōu)橐蜃兞?,基于深度學習的學業(yè)預測模型來構(gòu)建兩者之間的映射關系,最后對學生學業(yè)表現(xiàn)進行實時預測,進而對成績退步學生實現(xiàn)預警監(jiān)測。

        參考文獻

        [1] 廖鵬,劉宸銘,蘇航,等.基于深度學習的學生課堂異常行為檢測與分析系統(tǒng)[J].電子世界,2018(8):97-98.

        [2] 陳彥釗,朱雪穎,黃瑾,等.基于深度學習的大學生課堂行為分析系統(tǒng)研究[J].齊魯工業(yè)大學學報,2020,34(1):13-18.

        [3] 朱佳,張麗君,梁婉瑩.數(shù)據(jù)驅(qū)動下的個性化自適應學習研究綜述[J].華南師范大學學報(自然科學版),2020,52(4):17-25.

        [4] 陳德鑫,占袁圓,楊兵.深度學習技術在教育大數(shù)據(jù)挖掘領域的應用分析[J].電化教育研究,2019,40(2):68-76.

        [5] 吳和俊,王敏康.基于深度學習學生序列化行為的學業(yè)成績預測預警方法:CN201910401106[P].2019-05-15.

        *項目來源:2021年浙江省教育規(guī)劃課題“多數(shù)據(jù)平臺融合下的學生學業(yè)表現(xiàn)及預警模型研究”(項目編號:2021SCG131。主持人:林龍);2021年浙江省高等教育學會課題“數(shù)據(jù)驅(qū)動的大學生學業(yè)表現(xiàn)精準評價研究”(項目編號:KT2021310。主持人:林龍)。

        作者:林龍,臺州科技職業(yè)學院,講師,研究方向為教育信息化;沈海青,臺州科技職業(yè)學院,高級工程師,研究方向為汽車檢測技術(318020)。

        猜你喜歡
        數(shù)據(jù)挖掘深度學習
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        有體驗的學習才是有意義的學習
        電子商務中基于深度學習的虛假交易識別研究
        MOOC與翻轉(zhuǎn)課堂融合的深度學習場域建構(gòu)
        大數(shù)據(jù)技術在反恐怖主義中的應用展望
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        深度學習算法應用于巖石圖像處理的可行性研究
        軟件導刊(2016年9期)2016-11-07 22:20:49
        基于深度卷積網(wǎng)絡的人臉年齡分析算法與實現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        亚洲av无码一区东京热久久| 老肥熟女老女人野外免费区| 在线精品国产一区二区| 九九久久精品大片| 手机av在线观看视频| 日韩中文字幕一区二区二区| 亚洲成a人片在线观看无码3d| 边做边流奶水的人妻| 久久无码人妻一区=区三区| 亚洲中文字幕高清乱码毛片| 激情亚洲一区国产精品久久| 国产精品成人免费视频一区| 男女18禁啪啪无遮挡| 99热门精品一区二区三区无码| 精品国产迪丽热巴在线| 91国产自拍精品视频| 欧美成人看片一区二区三区尤物| 精品麻豆国产色欲色欲色欲www | 久久精品国内一区二区三区| 国产成人精品日本亚洲直播| 99国产精品欲av麻豆在线观看| 在线精品国产亚洲av蜜桃| 欧美日韩亚洲中文字幕二区| 丰满多毛少妇做爰视频| 韩国女主播一区二区在线观看| av男人操美女一区二区三区| 中文字幕一区二区三区视频 | 婷婷久久久亚洲欧洲日产国码av| 这里只有久久精品| 狼色在线精品影视免费播放| 91久久香蕉国产熟女线看| 无码区a∨视频体验区30秒| 少妇被躁爽到高潮无码文| 无码一区二区三区AV免费换脸 | 美丽的小蜜桃在线观看| 99亚洲男女激情在线观看| 亚洲国产麻豆综合一区| 日韩精品极品免费在线视频 | 国产精品久久久久久影视 | 天堂麻豆精品在线观看| 国产情侣自拍一区视频|