亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于教育大數(shù)據(jù)挖掘的大學生學業(yè)預警研究

        2020-05-11 11:49:53吳修國孫濤
        中國教育信息化 2020年4期
        關鍵詞:數(shù)據(jù)挖掘

        吳修國 孫濤

        摘 ? 要:教育大數(shù)據(jù)挖掘通過對教育領域的各種海量數(shù)據(jù)進行分析,發(fā)現(xiàn)其中存在的規(guī)律,從而指導教育教學管理水平。文章在對現(xiàn)有研究存在的問題進行分析基礎上,首先給出教育大數(shù)據(jù)挖掘的學業(yè)預警研究框架;之后,通過對大學生在校成績數(shù)據(jù)進行整合管理,基于關聯(lián)規(guī)則算法給出大學生不及格課程之間的關聯(lián)關系,以此為大學生學業(yè)提出預警(課程不及格以及留級)提示。研究結(jié)果表明,該方法為管理者有針對性地對預警學生進行幫助和干預提供了數(shù)據(jù)支撐,具有較強的應用價值,可有效提升高校教學管理水平和管理質(zhì)量。

        關鍵詞:教育大數(shù)據(jù);數(shù)據(jù)挖掘;關聯(lián)規(guī)則;學業(yè)預警

        中圖分類號:G642.47 文獻標志碼:A 文章編號:1673-8454(2020)07-0055-04

        一、引言

        近年來,隨著高校規(guī)模不斷擴大以及外界因素的影響,大學生的學習能力與素質(zhì)基礎出現(xiàn)了不同程度的下降。據(jù)統(tǒng)計,每年各高校都有部分學生因為課程掛科等原因,無法順利畢業(yè),對學生個人、家庭以及學校而言都是難以挽回的損失。學業(yè)預警是學校對在校大學生的學業(yè)表現(xiàn)(包括成績、出勤、作業(yè)情況等)進行評估之后,根據(jù)其學業(yè)表現(xiàn)情況,對學生下一步的學習進行及時提醒的一種監(jiān)督管理制度。一方面,學業(yè)預警可以幫助學生合理規(guī)劃后續(xù)課程的學習;另一方面,也可以有效提升教育教學管理水平,促進和諧高校質(zhì)量建設。與此同時,隨著教育信息化的不斷深入,各個高校都開發(fā)了相應的教學管理信息平臺,存儲了大量與教學相關的數(shù)據(jù)(比如上課出勤情況、去圖書館自習時間等),稱為教育大數(shù)據(jù)(Education Big Data,EBD)。[1]如何找到隱藏在這些數(shù)據(jù)中的某些關聯(lián)關系、挖掘出有價值的信息,從而對以后的教學活動提供有效指導,不論對學習者還是教學管理者來說都具有十分重要的意義。目前,學生以及教學管理人員,可以通過校內(nèi)的信息管理平臺方便地查找到每個人的課程成績情況,然而,這僅僅屬于教育數(shù)據(jù)利用的初級階段。對隱藏在數(shù)據(jù)中的價值沒有進行充分的利用,難以對學生學習以及教師的教學活動進行有效指導。例如,對學生而言,無法得到下一步課程學習的有效建議;而對教學管理者而言,也不能根據(jù)現(xiàn)有的成績,對任課教師的教學方法、教學內(nèi)容、教學模式給出指導性意見,沒有數(shù)據(jù)的支持,無法確保建議的有效性和合理性,因此無法保證教學的效果。[2]

        數(shù)據(jù)挖掘技術的發(fā)展為教育大數(shù)據(jù)的研究與應用提供了重要的工具。越來越多的研究者從不同視角、利用不同方法逐漸展開數(shù)據(jù)挖掘的研究,他們提出了許多數(shù)據(jù)挖掘方法與技術,同時也為不同領域的決策者提供了決策依據(jù)。然而,數(shù)據(jù)挖掘在教育領域尚未得到廣泛應用。作為教育管理者,通過對學生歷史數(shù)據(jù)的分析,一旦發(fā)現(xiàn)學生某門課程的成績出現(xiàn)問題時,要及時對他進行提醒,并采取有效措施避免問題的發(fā)生,而不是等到問題發(fā)生后再去采取措施進行補救,這是我們教育的本質(zhì)所在。由此可見,在進行基本的教學信息管理時所產(chǎn)生的教育大數(shù)據(jù),不管是涉及學生還是教學管理者,重心應該是發(fā)現(xiàn)隱藏其中的有價值信息,為決策提供數(shù)據(jù)支持,這相比過去只靠經(jīng)驗并進行判斷而言,無疑是一個重大創(chuàng)新??梢?,大數(shù)據(jù)不僅是技術手段,更是一種思維方式,為教育帶來深刻變革。[3]為此,本文通過整合管理學生在校成績數(shù)據(jù),基于關聯(lián)規(guī)則算法給出大學生不及格課程之間的關聯(lián)關系,以此為大學生學業(yè)提出預警(課程不及格以及留級)提示。

        二、基于教育大數(shù)據(jù)挖掘的大學生學業(yè)預警研究框架

        1.問題分析

        學業(yè)預警是高校加強學生學習管理、提升教育教學管理水平的重要手段。國外的研究始于20世紀90年代,目的是幫助在校學生按時完成學業(yè)。美國的普渡大學(Purdue University)、賓州滑石大學(Slippery Rock University of Pennsylvania)將學生在校表現(xiàn)情況作為學業(yè)預警的數(shù)據(jù)來源,取得了不錯的效果。相比較而言,我國的大學生學業(yè)預警研究起步較晚,早期的研究主要以制度創(chuàng)新來應對學生學業(yè)問題。近年來,有部分研究者依據(jù)大學第一學期的成績以及高考成績,預測和解釋有學業(yè)風險的學習表現(xiàn),從而幫助實施學業(yè)預警。[3][4]總體來看,目前的預警研究尚存在以下一些問題:①預警的方法、機制比較簡單。往往以學生成績作為預警的重要依據(jù),對課程之間的關系考慮較少。②缺乏相應的數(shù)據(jù)支撐,預警效果一般。預警沒有考慮學生成績之外的學業(yè)表現(xiàn),比如課堂出勤情況、圖書館借書情況等。③沒有對學業(yè)問題進行深入分析。往往是就事論事,沒有從全局的視角對學生學業(yè)進行客觀評估。

        基于教育信息化技術的發(fā)展,在進行數(shù)據(jù)管理的同時,也能保存大量與學業(yè)相關的信息,通過這些信息可以對學生學習進行可靠評價,為教育和管理者提供服務,幫助管理者做出科學的決策。[4][5]當前許多研究者以教育數(shù)據(jù)為基礎提出了許多建設性成果,但直接將其應用在學業(yè)預警研究中,尚存在以下問題:①缺乏個性化的學業(yè)預警,只依賴于當次考試成績進行粗放式預警的方法,無法有效地對學生學業(yè)進行指導。對每個學生而言,知識背景、學習能力、興趣點等存在很大差異,需要有個性化的預警措施。②不論在模型上還是算法上,尚沒有基于數(shù)據(jù)挖掘的預警研究,尤其是針對管理學科偏重于理論這一特點,使現(xiàn)有的數(shù)據(jù)挖掘工具無法直接應用,迫切需要結(jié)合學生專業(yè)特點,從多個維度挖掘分析學生學業(yè)數(shù)據(jù),特別是那些學業(yè)成績不良的數(shù)據(jù),從而為高校人才培養(yǎng)提供決策支持。③缺乏針對管理學科學業(yè)的預警機制,一旦發(fā)現(xiàn)問題不知道如何及時有效地補救??茖W合理的預警對于可能會出現(xiàn)學業(yè)或就業(yè)困難的學生而言,可以起到預警作用;而對于未來發(fā)展可能比較好的學生,學校可以提前有意識地培養(yǎng)。

        基于上述分析,本文針對大學生教育多年來積累的大量數(shù)據(jù)信息,引入數(shù)據(jù)挖掘技術中關聯(lián)規(guī)則、聚類分析、決策樹等挖掘算法,對學生課程、學業(yè)計劃、課程成績等數(shù)據(jù)間的相關性和依存性進行分析,挖掘出的結(jié)果將為學生學業(yè)預警等提供有效的決策支持。

        2.基于教育大數(shù)據(jù)挖掘的大學生學業(yè)預警研究框架

        基于教育大數(shù)據(jù)挖掘的大學生學業(yè)預警研究,主要包括不及格課程之間的關聯(lián)關系挖掘、延期畢業(yè)學生特征挖掘以及畢業(yè)學分績點預測等。如圖1所示。

        (1)首先,提出大學生學業(yè)的綜合評價考核體系的指標模型(基本屬性、學習情況屬性、社會活動情況屬性、主觀評價屬性等);其次,根據(jù)不同復雜程度和目標,選取相應的數(shù)據(jù)挖掘方法,比如關聯(lián)規(guī)則、決策樹等;最后,提出大學生學業(yè)預警機制模型,對出現(xiàn)的預警及時進行處理。

        (2)基于教育大數(shù)據(jù)的大學生學業(yè)預警算法設計,主要包括:①以教學運行數(shù)據(jù)為基礎,利用數(shù)據(jù)挖掘中的關聯(lián)規(guī)則方法,對學生教學成績庫進行挖掘作業(yè),從而發(fā)現(xiàn)課程之間,尤其是先導課程與后續(xù)課程之間的成績相關性,特別是那些一旦先行課程沒有學好、勢必會影響后續(xù)學習的課程,及時對學生學習提出預警。②以學生基本屬性數(shù)據(jù)、社會行為數(shù)據(jù)、學業(yè)成績等為基礎,運用K-Means聚類算法進行挖掘,總結(jié)延時畢業(yè)學生的總體特征。③以已經(jīng)畢業(yè)學生學業(yè)數(shù)據(jù)、課堂表現(xiàn)數(shù)據(jù)等為基礎,利用決策樹分類理論分析出學生學分績點特征,對現(xiàn)有在校學生的未來畢業(yè)學分績點進行大體上的預測,對達不到畢業(yè)學分要求的學生進行預警。高校大學生學業(yè)預警機制與援助保障體系構(gòu)建主要包括預警與援助機制建設、援助工作方案、預警平臺發(fā)布以及反饋保障等。[6]

        (3)大學生學業(yè)預警系統(tǒng)設計。基于Java平臺設計并實施基于數(shù)據(jù)挖掘的大學生學業(yè)預警平臺設計,基本功能模塊包括數(shù)據(jù)預處理、關聯(lián)課程學習預警、延時畢業(yè)學生預警、畢業(yè)學分績點預警、精準個體幫扶等。

        (4)高校大學生學業(yè)預警機制與援助保障體系構(gòu)建。主要包括預警與援助機制建設、援助工作方案、預警平臺發(fā)布以及反饋保障等。

        三、基于教育大數(shù)據(jù)挖掘的不及格課程關聯(lián)規(guī)則分析

        關聯(lián)規(guī)則是由Agrawal等人在1993年提出的,用于發(fā)現(xiàn)大量數(shù)據(jù)中項集之間的重要關聯(lián)或相關聯(lián)系。[7][8]本節(jié)以山東財經(jīng)大學管理科學與工程學院大學生掛科課程數(shù)據(jù)為挖掘?qū)ο?,利用關聯(lián)規(guī)則挖掘找出課程之間的隱含聯(lián)系,為后續(xù)課程學習提供預警信息。

        1.數(shù)據(jù)預處理

        本研究主要通過對學生掛科課程進行數(shù)據(jù)分析,目的是發(fā)現(xiàn)它們之間存在的相互聯(lián)系,以此對學生課程學習進行有效指導。主要的研究數(shù)據(jù)是從學校教務處教務管理信息系統(tǒng)數(shù)據(jù)庫中獲取學生歷史成績數(shù)據(jù),該數(shù)據(jù)包含大量編碼,需要借助于相關編碼表進行解析。原始數(shù)據(jù)如表1所示。

        學生歷史成績表包含字段較多,本文只選取了一些關鍵字段,分別是考試學年、考試學期、取得學年、取得學期、姓名、學號、課程代碼、課程名稱、考試成績以及課程標志。其中的考試學年、考試學期、取得學年、取得學期反映了大學生考試的通過情況:考試學年和考試學期表示該學生第一次參加該門課程考試的學年和學期(1表示第1學期;2表示第2學期);取得學年、取得學期表示學生最后一次參加該課程考試的學年和學期。考試成績分為百分制和五級制兩種方式。課程標志包括正常、重修、補考、緩考和缺考等。

        在數(shù)據(jù)預處理階段,主要包括數(shù)據(jù)清理、數(shù)據(jù)整合、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)規(guī)約以及數(shù)據(jù)離散化和概念分層等幾個部分。在數(shù)據(jù)清理階段,主要是將異常數(shù)據(jù)和重復數(shù)據(jù)清除,以解決孤立點和數(shù)據(jù)不一致等情況帶來的問題。對一些由于退學、休學等原因造成學生數(shù)據(jù)缺失等情況,采用了人工填補、平均值和牛頓差值等方法進行數(shù)據(jù)補充,保證數(shù)據(jù)完整性。

        2.掛科課程關聯(lián)挖掘框架設計

        圖2給出了基于FP-Growth算法的大學生課程關聯(lián)規(guī)則挖掘模型。算法的基本過程主要包括頻繁模式挖掘以及關聯(lián)規(guī)則發(fā)現(xiàn)。在頻繁模式挖掘階段,將每一門不及格課程作為一個項,所有學生的不及格課程構(gòu)成項集;將每個學生的不及格課程作為一個事務,利用關聯(lián)規(guī)則的兩個測度,度量最小支持度和最小置信度,對得到的頻繁項集和關聯(lián)規(guī)則進行篩選。在這個過程中,鏈接和剪枝是兩個重要的操作。

        3.挖掘結(jié)果與分析

        通過FP-Growth算法得到頻繁項集如表2所示。以第一行為例,Key=C06310002表示該課程號的頻繁項集,([C06310081],13)表示C06310081共出現(xiàn)了13次,([C06330085,C06340068],7)則表示C06330085和C06340068一共出現(xiàn)了7次。

        快速發(fā)現(xiàn)感興趣的關聯(lián)規(guī)則還是比較困難的;同時,大量的頻繁項集中必然夾雜很大比例的無效關聯(lián)規(guī)則和弱關聯(lián)規(guī)則,需要對挖掘到的頻繁項集進一步處理。合并所有鍵值相同的對,去掉大部分無效關聯(lián)規(guī)則和弱關聯(lián)規(guī)則;同時,在保留有限關聯(lián)規(guī)則前提下,將支持度設為0.12,置信度設為0.6,對挖掘到的頻繁模式進行處理,共篩選出120條規(guī)則,部分如表3所示。

        由以上規(guī)則可以看出哪些課程不及格,容易導致其他相關課程也出現(xiàn)不及格的情況,比如[數(shù)據(jù)結(jié)構(gòu)]→[運籌學],支持度表示數(shù)據(jù)結(jié)構(gòu)和運籌學均出現(xiàn)不及格的情況占總體不及格課程的16.1%,置信度表示數(shù)據(jù)結(jié)構(gòu)出現(xiàn)不及格情況的學生中80%的學生運籌學課程也出現(xiàn)了不及格情況。究其原因,一方面可能是學生的學習態(tài)度不端正,放松了對專業(yè)知識的學習,這就需要專業(yè)教師加強學生基礎知識的教學,輔導員及時督促學生掌握理論基礎知識;另一方面可能數(shù)據(jù)結(jié)構(gòu)作為先導課程有一定難度,學??蓢L試適當調(diào)整培養(yǎng)方案,鞏固基礎知識,加深學生對專業(yè)知識的理解。[9-11]

        參考文獻:

        [1]顧云鋒,吳鐘鳴,管兆昶等.基于教育大數(shù)據(jù)的學習分析研究綜述[J].中國教育信息化,2018(7):5-10.

        [2]周慶,肖逸楓.基于數(shù)據(jù)挖掘技術的高校學生學業(yè)預警分析[J].中國教育技術裝備, 2018(6):42-45.

        [3]Delen D. A comparative analysis of machine learning techniques for student retention management[J].Decision Support Systems,2010,49(4):498-506.

        [4]Hu Y H, Lo C L, Shih S P. Developing early warning systems to predict students online learning performance[J].Computers in Human Behavior,2014(36):469-478.

        [5]蘇兆兆,欒靜.高校本科生就餐數(shù)據(jù)挖掘分析[J].電腦知識與技術,2018(5):24-26.

        [6]邊高峰.基于數(shù)據(jù)挖掘的普通高校受資助學生精準識別研究及對策[J].科教導刊(下旬),2018(5):183-184.

        [7]趙峰,劉博妍.基于改進Apriori算法的大學生成績關聯(lián)分析[J].齊齊哈爾大學學報(自然科學版),2018(1):11-15.

        [8]陳喜華,黃海寧,黃沛杰.基于Apriori算法的學生成績分析在課程關聯(lián)性的應用研究[J].北京城市學院學報,2018(4):66-71.

        [9]傅亞莉.基于Apriori算法的高職院校課程相關性分析[J].長春工程學院學報(自然科學版),2013(4):108-111.

        [10]方毅,張春元.基于數(shù)據(jù)挖掘的多策略研究生教育課程成績分析方法研究[J].計算機工程與科學,2009(6):106-108.

        [11]袁路妍,李鋒.改進的關聯(lián)規(guī)則Apriori算法在課程成績分析中的應用[J].中國教育信息化,2017(17).

        (編輯:王天鵬)

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡流量異常識別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術在打擊倒賣OBU逃費中的應用淺析
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        數(shù)據(jù)挖掘在高校圖書館中的應用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
        天堂а在线中文在线新版| 成人自拍小视频在线看| 久久婷婷综合激情五月| 人人妻人人添人人爽欧美一区| 不卡av电影在线| 在线亚洲+欧美+日本专区| 婷婷五月综合激情| 久久久久久一级毛片免费无遮挡| 久久丫精品国产亚洲av| 亚洲国产成人久久一区www妖精| 亚洲熟女av超清一区二区三区| 麻美由真中文字幕人妻| 99蜜桃在线观看免费视频| 亚洲人妻调教中文字幕| 麻豆免费观看高清完整视频| 女人夜夜春高潮爽a∨片| 亚洲无码a∨在线视频| 元码人妻精品一区二区三区9 | 久久精品国产亚洲av四区| 国产aⅴ无码专区亚洲av| 天堂无码人妻精品av一区| 亚洲乱妇老熟女爽到高潮的片| 国产美女一级做a爱视频| 61精品人妻一区二区三区蜜桃| 国产av天堂一区二区二区| 狠狠cao日日橹夜夜十橹| 激情内射日本一区二区三区| 国产精品麻豆aⅴ人妻| 2021国产精品久久| 亚洲影院在线观看av| 亚洲一区二区三区地址| 97无码免费人妻超级碰碰夜夜 | 国产成人av综合亚洲色欲| 97久久成人国产精品免费| 日韩一区三区av在线| 成午夜福利人试看120秒| 成全高清在线播放电视剧| 无码人妻视频一区二区三区99久久| 视频精品熟女一区二区三区| 亚洲岛国一区二区三区| 国产精品h片在线播放|