文/張亞娟 洪丹丹 吳飛龍 鎖志海
為響應(yīng)“中國教育現(xiàn)代化2030”戰(zhàn)略部署,進(jìn)一步推動“教育信息化十三五規(guī)劃”的落實(shí),深化高等教育信息化發(fā)展的成果,同時充分展現(xiàn)各個相關(guān)高校利用信息技術(shù)與教育教學(xué)的深度融合,實(shí)現(xiàn)教育現(xiàn)代化的途徑和方法,由新華三集團(tuán)以及《中國教育網(wǎng)絡(luò)》雜志聯(lián)合推出了“2017高校融合創(chuàng)新與教育變革征文”活動。新華三集團(tuán)服務(wù)教育行業(yè)三十年,用新IT技術(shù)去推動教育信息化的創(chuàng)新發(fā)展與變革,讓每一個人都有更精彩的方式去認(rèn)知這個世界。本次征文評選出了來自浙江大學(xué)、吉林大學(xué)、西安交通大學(xué)、湖南大學(xué)、東北財經(jīng)大學(xué)等作者的優(yōu)秀稿件,從本期開始,本刊將分兩期選登其中的優(yōu)秀文章。
隨著教育信息化的發(fā)展,各高校在業(yè)務(wù)管理、科學(xué)研究、人才培養(yǎng)等方面都有很大的提升,特別是隨著近幾年大數(shù)據(jù)、云計算等新技術(shù)不斷提出,不僅推進(jìn)了業(yè)務(wù)系統(tǒng)的建設(shè),規(guī)范了業(yè)務(wù)操作,也積累了大量的業(yè)務(wù)數(shù)據(jù)。
近年來,很多高校開始使用大數(shù)據(jù)分析解決日常教學(xué)、管理中遇到的實(shí)際問題。據(jù)分析,在學(xué)生行為分析方面,很多高校通過對校園卡消費(fèi)、上網(wǎng)、考試成績等數(shù)據(jù)進(jìn)行分析,從而改進(jìn)學(xué)校的教學(xué)、管理等方面的問題。但是,對單一數(shù)據(jù)的分析,不能完全反應(yīng)學(xué)生所存在的所有問題,因此,如果能有效結(jié)合學(xué)生所有的消費(fèi)、生活、上課、上網(wǎng)、門禁等數(shù)據(jù),進(jìn)行全方位分析,就能及時的對學(xué)生提出學(xué)習(xí)、生活等方面的指導(dǎo)及幫助。該平臺建成后要求能夠充分利用各部門的業(yè)務(wù)數(shù)據(jù),有效的展現(xiàn)業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)價值,為提升學(xué)生的日常行為分析、管理及發(fā)展指導(dǎo)建議提供可靠的依據(jù),并且能夠支持未來潛在的數(shù)據(jù)和業(yè)務(wù)需求。
本平臺以學(xué)生工作大數(shù)據(jù)為基礎(chǔ),根據(jù)教學(xué)管理需求,對學(xué)生工作相關(guān)的數(shù)據(jù)進(jìn)行集成、分析,最終實(shí)現(xiàn)學(xué)生畫像、學(xué)業(yè)預(yù)警、精準(zhǔn)資助、行為告警以及成長推薦等功能。因此,平臺集成了網(wǎng)絡(luò)、消費(fèi)、門禁、考勤、社團(tuán)、貧困補(bǔ)助、獎助金、圖書借閱等各個相關(guān)業(yè)務(wù)的共計十三大類業(yè)務(wù)系統(tǒng)的所有數(shù)據(jù)。
數(shù)據(jù)集成是平臺的重要組成部分,是整個平臺的信息傳輸、信息交換總線。實(shí)現(xiàn)校內(nèi)各業(yè)務(wù)系統(tǒng)、異構(gòu)數(shù)據(jù)源集成,并按照統(tǒng)一標(biāo)準(zhǔn)對所有數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,同時要保證業(yè)務(wù)數(shù)據(jù)的完整性,是一項非常復(fù)雜且繁瑣的工作。在集成過程中,針對數(shù)據(jù)來源的不同,且各業(yè)務(wù)統(tǒng)間數(shù)據(jù)口徑、標(biāo)準(zhǔn)不統(tǒng)一,系統(tǒng)間數(shù)據(jù)依賴關(guān)系復(fù)雜,維護(hù)難度較大等問題,首先確定數(shù)據(jù)的權(quán)威來源,然后通過學(xué)校主數(shù)據(jù)平臺將數(shù)據(jù)同步到數(shù)據(jù)采集庫,再根據(jù)數(shù)據(jù)源的數(shù)據(jù)質(zhì)量采取不同的方式對數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)化放入分析庫。在數(shù)據(jù)抽取過程中,對各業(yè)務(wù)系統(tǒng)數(shù)據(jù)的一致性、無效值和缺失值等都進(jìn)行了一一的核對及處理,保證數(shù)據(jù)的完整性和有效性。
基于學(xué)工大數(shù)據(jù)的學(xué)生行為模型分析服務(wù)平臺是數(shù)據(jù)整合、清洗與分析挖掘的一體化平臺,它由四大部分組成,分別為:數(shù)據(jù)集成、業(yè)務(wù)管理、綜合分析和數(shù)據(jù)展示。平臺的架構(gòu)如圖1所示。
數(shù)據(jù)集成是指平臺對主數(shù)據(jù)平臺同步到采集庫里的數(shù)據(jù)質(zhì)量、編碼標(biāo)準(zhǔn)、字段格式等統(tǒng)一進(jìn)行分析,并按照學(xué)校的標(biāo)準(zhǔn)將其標(biāo)準(zhǔn)化侯放入分析庫;業(yè)務(wù)管理是指負(fù)責(zé)學(xué)生工作的老師對學(xué)生的日常事物如:第二課堂、心理咨詢、黨團(tuán)生活等進(jìn)行管理;數(shù)據(jù)綜合分析是指將學(xué)生綜合分析庫中經(jīng)過標(biāo)準(zhǔn)規(guī)范化的數(shù)據(jù)分主題進(jìn)行分析挖掘;數(shù)據(jù)展示是指將數(shù)據(jù)綜合分析中的分析結(jié)果進(jìn)行可視化的展示,通過報表展示工具將數(shù)據(jù)與美觀的圖表完美的結(jié)合在一起,并按照不同的權(quán)限供學(xué)校不同層次的用戶查看。
圖1 平臺整體架構(gòu)
學(xué)生行為可通學(xué)生校園行為(如:出勤率、到課率、軌跡、消費(fèi)、上網(wǎng)等大數(shù)據(jù))進(jìn)行量化,量化后的數(shù)據(jù)可對學(xué)生的作息時間規(guī)律性、努力程度、學(xué)習(xí)技能、經(jīng)濟(jì)狀況等多維度進(jìn)行分析,最終達(dá)到揭示學(xué)生成長軌跡,進(jìn)行學(xué)生學(xué)業(yè)預(yù)警、精準(zhǔn)資助、就業(yè)推薦等目的,從而可以為學(xué)校對學(xué)生進(jìn)行個性化與精準(zhǔn)化的教育管理與引導(dǎo)提供重要依據(jù)。下面針對學(xué)生成績預(yù)測進(jìn)行進(jìn)一步闡述。
影響學(xué)生成績的因素主要有六大類:第一課堂、第二課堂、經(jīng)濟(jì)消費(fèi)、個人信息、生活規(guī)律和上網(wǎng),且每種因素都有其關(guān)鍵指標(biāo),因此可以分別對各個因素的關(guān)鍵指標(biāo)進(jìn)行分析,如:第一課堂的學(xué)習(xí)成績、到課率、準(zhǔn)點(diǎn)率;第二課堂的學(xué)生參加活動與獎懲情況;學(xué)生經(jīng)濟(jì)消費(fèi)能力;飲食、作息和上網(wǎng)時長是否規(guī)律等作為關(guān)鍵指標(biāo)來進(jìn)行分析。選用學(xué)生上課監(jiān)控數(shù)據(jù),準(zhǔn)點(diǎn)率,出勤率,并結(jié)合上學(xué)期成績,做加權(quán)求和,目的在于反應(yīng)學(xué)生本學(xué)期的學(xué)習(xí)基礎(chǔ)與學(xué)習(xí)態(tài)度,評價學(xué)生學(xué)習(xí)是否健康,公式如下所示:
f(成績(包含德育成績))
其中f(x)為歸一化函數(shù)。再根據(jù)學(xué)生飲食是否健康。良好合理的健康飲食習(xí)慣是身體健康的保障;不良的飲食習(xí)慣則會導(dǎo)致人體正常的生理功能紊亂而感染疾病,嚴(yán)重時甚至?xí)绊懻9ぷ鲗W(xué)習(xí)生活。因此飲食要按照科學(xué)的比例進(jìn)行,公式如下:
飲食指數(shù)=(2×f(p_m )+2×f(t_d )+f(S)+f(p_n))/6
其中f(x)為歸一化函數(shù),p_m,t_d,S,p_n分別為早餐評價,用餐標(biāo)準(zhǔn)差評價,消費(fèi)差評價,宵夜評價。
其次還有作息時間是否規(guī)律、上網(wǎng)時長是否合理、準(zhǔn)點(diǎn)率和出勤率是否正常以及歷史學(xué)科成績等分析,最終形成學(xué)生學(xué)業(yè)成績分析結(jié)果。這個算法背后的思想是通過分析學(xué)生的作息時間、行為軌跡、上課情況等各事物間的相關(guān)性來進(jìn)行成績預(yù)測,例如:作息時間規(guī)律、出勤率高、去圖書館較頻繁、按時吃早餐等的同學(xué)成績較好。
本平臺根據(jù)學(xué)校的統(tǒng)一建設(shè)規(guī)劃,部署在以新華三技術(shù)有限公司的整體解決方案為基礎(chǔ)的云平臺上,云平臺層采用了基于OpenStack架構(gòu)的CloudOS高校運(yùn)營版,計算虛擬化采用了基于KVM架構(gòu)的CAS企業(yè)版,分布式存儲采用了基于Ceph架構(gòu)的ONEStor產(chǎn)品。所有產(chǎn)品采用基于主流架構(gòu)技術(shù)路線的商業(yè)化產(chǎn)品,保證了系統(tǒng)開放性和對用戶的友好性。
通過本平臺,能夠掌握學(xué)生的日常行為軌跡,實(shí)時的了解學(xué)生的狀態(tài)變化,并且可以通過分析數(shù)據(jù),提前為學(xué)生提供有效的學(xué)習(xí)、生活以及未來的職業(yè)規(guī)劃建議,進(jìn)一步提高學(xué)校管理及服務(wù)水平。
從學(xué)習(xí)方面,能及時發(fā)現(xiàn)學(xué)生的學(xué)習(xí)、作息時間以及出勤變化,及時查找變化原因,為學(xué)生提出合理的建議及有效幫助,提高學(xué)生的學(xué)習(xí)效果。在健康分析方面,可以及時關(guān)注學(xué)生的飲食習(xí)慣及消費(fèi)狀況,為學(xué)生提供良好的健康建議及精準(zhǔn)的資助服務(wù),保證學(xué)生的學(xué)習(xí)效率。從教學(xué)質(zhì)量來看,能夠?qū)崟r的反映教學(xué)狀態(tài)數(shù)據(jù),不斷提升教學(xué)質(zhì)量。在學(xué)生就業(yè)方面,通過數(shù)據(jù)分析能完善就業(yè)指導(dǎo),提高學(xué)生就業(yè)率。
本文主要闡述了了以學(xué)生工作大數(shù)據(jù)為基礎(chǔ),對相關(guān)數(shù)據(jù)進(jìn)行集成和分析,最終形成完整的學(xué)生行為數(shù)據(jù)分析及服務(wù)平臺,該分析結(jié)果可以對學(xué)校的教學(xué)、日常管理、學(xué)生指導(dǎo)等方面提供科學(xué)的、有力的依據(jù)。文中通過一種不同的視角,對影響學(xué)生相關(guān)的各因素進(jìn)行了分析,并總結(jié)了分析結(jié)果在學(xué)生學(xué)習(xí)、健康、管理、就業(yè)等方面的具體應(yīng)用,進(jìn)一步闡述了將基礎(chǔ)數(shù)據(jù)分析與學(xué)工相關(guān)數(shù)據(jù)分析相結(jié)合帶來的更寬廣的視角及更有效的分析效果。在后期的建設(shè)中,我們不僅要結(jié)合校內(nèi)的數(shù)據(jù),更要結(jié)合校外如:購物、網(wǎng)站瀏覽、社交等多個方面進(jìn)行數(shù)據(jù)抓取及分析,以達(dá)到更有效指導(dǎo)及管理效果。