楊靈芝,劉海明,袁也婷
(滄州職業(yè)技術(shù)學院,河北 滄州 061001)
高職教育數(shù)據(jù)挖掘探討與實踐研究
楊靈芝,劉海明,袁也婷
(滄州職業(yè)技術(shù)學院,河北 滄州 061001)
結(jié)合高職院校教育大數(shù)據(jù),分析并探索適合教育數(shù)據(jù)挖掘的工具和算法,對學生成績數(shù)據(jù)進行簡單挖掘,發(fā)現(xiàn)適合學生學習規(guī)律的課程體系,為教育管理者和教師提供良好的指導措施。
數(shù)據(jù)挖掘;大數(shù)據(jù);實踐
隨著信息化時代的到來,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新技術(shù)已經(jīng)慢慢滲透到人們生活的各個方面,這些新技術(shù)極大改變了信息技術(shù)的體系架構(gòu)和應用模式,大數(shù)據(jù)是當今信息互聯(lián)時代的最重要特點。越來越多不同領(lǐng)域的專業(yè)人士發(fā)現(xiàn),投入大量的資金、技術(shù)和人才,充分發(fā)掘大數(shù)據(jù)中隱藏的有價值的信息,能夠進一步推動信息社會的快速發(fā)展。
所謂數(shù)據(jù)挖掘,是從巨量數(shù)據(jù)中發(fā)現(xiàn)并找出有使用價值的知識。使用靈活的挖掘工具,借助成熟的發(fā)掘模型,采用數(shù)據(jù)挖掘相關(guān)規(guī)則,參照挖掘流程,最終發(fā)現(xiàn)一些有價值有意義的規(guī)律,了解各種數(shù)據(jù)之間的聯(lián)系或模式。傳統(tǒng)的數(shù)據(jù)挖掘與大數(shù)據(jù)時代數(shù)據(jù)挖掘的本質(zhì)是相同的,不同在于數(shù)據(jù)的結(jié)構(gòu)發(fā)生變化,數(shù)據(jù)量由海量變?yōu)榫蘖?,結(jié)果分析由因果性變?yōu)橄嚓P(guān)性分析。隨著學校教育信息智能化管理的實施,教育數(shù)據(jù)呈明顯增長趨勢,學生學習情況、教師授課情況、教師考核情況、學生就業(yè)信息等越來越多的數(shù)據(jù)充斥在學校信息化管理中。要在巨量教育數(shù)據(jù)中尋找影響學生學習主動性的因素,發(fā)掘影響教師教學積極性和執(zhí)教能力的原因,就需要采用專門的數(shù)據(jù)挖掘工具,選取適當?shù)耐诰蛩惴ǎM行多種挖掘,以便從中發(fā)現(xiàn)隱藏規(guī)律,從而為提升學校人才培養(yǎng)質(zhì)量、培養(yǎng)骨干教師和深化教學改革提供有力依據(jù)。
現(xiàn)有的信息資源包含學生管理系統(tǒng)中學生基本信息、成績信息,考勤管理系統(tǒng)中學生上課出勤情況,教師管理系統(tǒng)中授課情況、教師個人基本信息、職稱信息、科研情況,就業(yè)管理系統(tǒng)中學生就業(yè)情況、就業(yè)區(qū)域,在線學習系統(tǒng)中學生學習情況、提交作業(yè),等等,所有這些數(shù)據(jù)信息都將作為教育數(shù)據(jù)挖掘的基礎(chǔ)數(shù)據(jù)源。決策樹分類方法,能夠?qū)⒂绊懡處煖y評結(jié)果的各種因素以樹形顯示出來,并發(fā)現(xiàn)學生是影響教師測評的至關(guān)重要因素。關(guān)聯(lián)規(guī)則方法,能夠?qū)ふ页鲇绊懡處熃虒W質(zhì)量的一些規(guī)律,比如參加培訓、參加比賽等,從而提升教師執(zhí)業(yè)能力水平。聚類分析方法,將學生學習、出勤、考試、課程、作業(yè)等情況相似的歸為一組,從中找出共性規(guī)則。預測方法,對學生整體學習行為或個人學習發(fā)展趨勢作出合理預測,等等。對于一些非結(jié)構(gòu)數(shù)據(jù),可以使用R語言數(shù)據(jù)挖掘工具架構(gòu)。
在高職院校學生信息管理系統(tǒng)中,學生的學習情況是由多方面因素(成績、學習態(tài)度、考勤、課程設(shè)計成績、參加比賽情況、課前預習情況、作業(yè)提交情況)綜合評定的。從學生管理系統(tǒng)、考勤管理系統(tǒng)中抽取出學生基本信息、專業(yè)課成績信息、學生出勤信息、學生參加比賽信息等相關(guān)數(shù)據(jù),去掉無關(guān)信息,構(gòu)建學生學習情況信息表。
以通信技術(shù)專業(yè)學生數(shù)據(jù)為例,選取該專業(yè)核心課程數(shù)據(jù),從系統(tǒng)中導出所需要的數(shù)據(jù)并進行抽取,得到最終的學生學習情況信息表,如表1所示。
表1 學生評價挖掘信息表Tab.1 Student evaluation mining information form
通過分析發(fā)現(xiàn)每項指標都是連續(xù)數(shù)值,結(jié)合關(guān)聯(lián)算法要求,需要將上表信息離散化,同時轉(zhuǎn)化為Weka能夠識別的字段名稱。具體過程如下:第一,7項相關(guān)聯(lián)因素分別用peacetime,attendance,mobile communication,microwave measurement,RF optimization, graduation design,skills contest來表示,其中前6項均將成績分為優(yōu)、良、中、及格、不及格5個等級,優(yōu)為90分以上,良為80~90分,中為70~80分,及格為60~70分,不及格為60分以下,分別用A、B、C、D、E來表示。第二,參加比賽情況按照比賽級別分為國家級、省級、市級、校級和無參賽,分別用A、B、C、D、E來表示。將上述信息表進行預處理,轉(zhuǎn)換得到表2。
表2 離散化后學生評價挖掘信息表Tab.2 Discretized student evaluation mining information form
經(jīng)過數(shù)據(jù)預處理后,進行學生評價信息的數(shù)據(jù)挖掘?qū)嶒?。啟動Weka軟件,進入Explorer界面,選擇preprocess選項卡,打開離散化后的數(shù)據(jù)表格,其中表格格式要求是.csv或者.arff,觀察數(shù)據(jù)表中數(shù)據(jù)情況,包含7個屬性1 896條數(shù)據(jù)信息。選擇Associate選項卡中的最常用的Apriori算法,設(shè)定最小支持度閾值0.1,最小置信度閾值0.8,在挖掘結(jié)果界面中生成了3個頻繁項集,20條規(guī)則。然后改變Apriori算法的最小支持度、最小置信度和生成規(guī)則條數(shù)3個參數(shù),繼續(xù)進行挖掘?qū)嶒?,通過多次修改參數(shù)設(shè)置,從最終多次挖掘結(jié)果中選出幾條對學生學習行為習慣中有價值的規(guī)則進行分析,進一步提出整改措施,輔助教師更好的投入到教學工作。挖掘結(jié)果分析如下:第一,attendance=B Microwave measurement=B 17 ==> Graduation design=B 15
文章使用Weka中Apriori算法對學生的學習行為習慣進行挖掘分析,從學生學習角度找出影響學生畢設(shè)及技能的幾點規(guī)則,包含學習習慣的養(yǎng)成、技能大賽的參與情況及專業(yè)核心課程的引導等。這些挖掘結(jié)果為教育管理者和教師提供了良好的指導措施,對學生的培養(yǎng)和教師素質(zhì)的提升給出了明確的建議。
[1] 魏順平.學習分析技術(shù):挖掘大數(shù)據(jù)時代下教育數(shù)據(jù)的價值[J].現(xiàn)代教育技術(shù),2013,23(02):5-11.
[2] 牟智佳,俞顯,武法提.國際教育數(shù)據(jù)挖掘研究現(xiàn)狀的可視化分析:熱點與趨勢[J].電化教育研究,2017,38(04):108-114.
Discussionandpracticeresearchofdatamininginhighervocationaleducation
YANG Ling-zhi, LIU Hai-ming, YUAN Ye-ting
(Cangzhou Vocational and Technical College, Cangzhou 061001, China)
This paper analyzes tools and algorithms suitable for educational data mining in combination with the big data of education in higher vocational colleges. It makes a simple excavation of the students’ grade data and finds a curriculum system that suits students’ learning rules and provides good guidance for education managers and teachers.
Data mining; Big data; Practice
2017-10-15
楊靈芝(1982-),女,研究生,講師;
劉海明(1982-),男,本科,講師;
袁也婷(1983-),女,本科,講師。
TP311.13
B
1674-8646(2017)23-0062-02