劉杰逾
(吉利學(xué)院,四川 成都 610000)
作為當(dāng)前熱門的技術(shù)之一,大數(shù)據(jù)給人們的生活、學(xué)習(xí)帶來了極大的便利,同時也對高校管理產(chǎn)生了革命性改變。當(dāng)前高校校園管理主要采用的是說教與事后分析的方法,存在一定的滯后性,對學(xué)生思想動態(tài)變化及行為缺乏有效的預(yù)測與評估[1]。大數(shù)據(jù)時代的到來,打破了傳統(tǒng)高校校園管理的弊端,其能夠從海量數(shù)據(jù)中挖掘出有價值的學(xué)生信息,為校園管理提供客觀的、準確的、全面的依據(jù),預(yù)測學(xué)生行為,提升校園管理的針對性,對于學(xué)生教育管理水平的提升以及數(shù)字化校園建設(shè)有著重要的意義。
信息化時代背景下,數(shù)字化校園建設(shè)受到了高校的高度重視,在日常教學(xué)活動及教育管理工作中會產(chǎn)生大量數(shù)據(jù),主要來源于微博論壇、圖書借閱、網(wǎng)絡(luò)行為等,數(shù)據(jù)類型包括結(jié)構(gòu)化與非結(jié)構(gòu)化兩種,這些數(shù)據(jù)與學(xué)校的教學(xué)活動及管理密切相關(guān)。隨著數(shù)字化校園建設(shè)的不斷推進,數(shù)據(jù)量越來越大,形成了一個具有潛在價值的數(shù)據(jù)集合[2]。高校學(xué)生行為數(shù)據(jù)復(fù)雜多樣,整合困難,相互之間難以建立起關(guān)聯(lián)性,再加上工作人員缺乏專業(yè)數(shù)據(jù)處理經(jīng)驗,難以滿足數(shù)據(jù)挖掘需求?;ヂ?lián)網(wǎng)信息時代背景下,高校多建立校園網(wǎng),通過“一卡通”、校園網(wǎng)絡(luò)以及基礎(chǔ)教育數(shù)據(jù)均能夠?qū)崿F(xiàn)對學(xué)生行為的分析。
本研究基于學(xué)生管理工作實際,在大數(shù)據(jù)技術(shù)支持下,利用教務(wù)系統(tǒng)對學(xué)生成績信息進行采集,利用考勤系統(tǒng)采集學(xué)生上課、出勤數(shù)據(jù),挖掘綜合素質(zhì)系統(tǒng)中學(xué)生對第二課堂的參與情況。與此同時,校園一卡通涵蓋學(xué)生的圖書借閱信息,采用ETL工具將上述各個平臺數(shù)據(jù)進行抽取,并予以轉(zhuǎn)換,在Oracle數(shù)據(jù)庫中裝載,實現(xiàn)對數(shù)據(jù)的儲存與管理,按照校園管理制度設(shè)計相應(yīng)的規(guī)則庫,包括評獎評優(yōu)、違規(guī)違紀處分、成績預(yù)警等,實施數(shù)據(jù)挖掘,構(gòu)建基于學(xué)院、班級及個人三個維度的可視化過程,其主要涉及考勤、獎懲、綜合素質(zhì)與成績管理4個方面,構(gòu)建的可視化系統(tǒng)總體架構(gòu)如圖1所示。
圖1 大數(shù)據(jù)下高校學(xué)生行為分析可視化系統(tǒng)整體架構(gòu)
可視化系統(tǒng)主要包括硬件系統(tǒng)與軟件系統(tǒng)兩個部分。硬件系統(tǒng)由服務(wù)器、處理器組成,同時配備了2個64核2.1 G的內(nèi)存,硬盤為256 G,型號為Barracuda 7200.7 plus;軟件系統(tǒng)包括MySQL、Hadoop2.7.1。
目前,關(guān)于海量數(shù)據(jù)的處理方法多種多樣,其中Hadoop技術(shù)是最為成熟的一種,其由Apache軟件基金研發(fā),形成完善的生態(tài)系統(tǒng),在大數(shù)據(jù)分析處理領(lǐng)域有著舉足輕重的地位。在Hadoop技術(shù)支持下,系統(tǒng)可實現(xiàn)數(shù)據(jù)的存儲與分析,且便于數(shù)據(jù)管理,有利于維護數(shù)據(jù)安全,具有鮮明的優(yōu)勢[3]。本研究利用大數(shù)據(jù)Hadoop平臺,在集成環(huán)境MyEclipse下,開發(fā)了大數(shù)據(jù)學(xué)生管理平臺,涉及系統(tǒng)管理、個人信息與班級信息分析、地區(qū)關(guān)聯(lián)性分析等,系統(tǒng)功能如圖2所示。
圖2 平臺功能架構(gòu)分析
2.3.1 系統(tǒng)管理模塊
基于校園的大數(shù)據(jù)學(xué)生行為分析系統(tǒng)主要包括登錄、數(shù)據(jù)管理與退出3個層面。登錄用戶包括系統(tǒng)管理員與普通用戶。用戶選擇相應(yīng)身份,將用戶名、密碼輸入后能夠完成登錄,學(xué)生成績、考勤相關(guān)數(shù)據(jù)接口均需要數(shù)據(jù)管理。系統(tǒng)能夠幫助數(shù)據(jù)清洗、存儲。(1)系統(tǒng)管理員的主要職責(zé)為維護管理數(shù)據(jù),如數(shù)據(jù)導(dǎo)入、導(dǎo)出、分析,并定期更新數(shù)據(jù),對日志予以維護、管理。數(shù)據(jù)主要來源于入學(xué)基本信息、學(xué)習(xí)成績、考勤數(shù)據(jù)、綜合素質(zhì)評分等。新生入學(xué)1個月內(nèi)便能夠完成數(shù)據(jù)采集,可以將其作為學(xué)生原始信息數(shù)據(jù)[4]。在之后的學(xué)習(xí)活動中,每次考試、補考成績均會錄入學(xué)生成績系統(tǒng);考勤系統(tǒng)中主要記錄的是學(xué)生請假、曠課、遲到情況,將其作為考勤信息。綜合素質(zhì)評分則從學(xué)生綜合評估體系中導(dǎo)出,經(jīng)過整理與計算獲得可靠的數(shù)據(jù)信息。(2)輔導(dǎo)員作為班級與學(xué)生的管理者,需要對學(xué)生成績、考勤及綜合素質(zhì)評分等進行綜合管理。輔導(dǎo)員可推薦優(yōu)秀的學(xué)生參與評獎、評優(yōu),并能夠根據(jù)學(xué)生成績、考勤、違紀情況預(yù)警學(xué)生的行為,予以跟蹤、反饋[5]。(3)班主任承擔(dān)著班級管理的重任,需要對學(xué)生的基礎(chǔ)成績、考勤及綜合素質(zhì)評估情況等進行查看,在評獎、評優(yōu)方面有著重要的參與作用。當(dāng)發(fā)現(xiàn)學(xué)生存在違規(guī)、違紀、考勤異常或其他異常行為應(yīng)予以預(yù)警。(4)學(xué)生利用大數(shù)據(jù)可視化系統(tǒng)主要查看自身的基本信息、考勤、成績等,了解自身存在的不足及努力的方向,能夠?qū)`規(guī)、違紀起到警示作用。
2.3.2 學(xué)生與班級信息分析
對學(xué)生信息的分析主要包括5個方面:(1)選擇對應(yīng)的班級后,只需在人員姓名上點擊便能夠獲得學(xué)生總分、平均分及排名等相關(guān)數(shù)據(jù)。(2)考勤分析,操作方法同(1),點開對應(yīng)學(xué)生姓名后,能夠自動顯示出學(xué)生請假、曠課及遲到次數(shù)等,不僅如此還與缺課的課程相對應(yīng),數(shù)據(jù)詳細、全面。(3)綜合素質(zhì)分析,其主要涉及思想政治教育、創(chuàng)新創(chuàng)業(yè)及勞動實踐等多個方面,按照相應(yīng)的評分規(guī)則,對每項作出評分,并計算出總分,對綜合素質(zhì)評分進行排名。(4)預(yù)警分析,當(dāng)需要查看某位學(xué)生的行為數(shù)據(jù)時,可以點擊姓名查看其曠課、遲到及成績等相關(guān)數(shù)據(jù)。(5)評獎評優(yōu),按照學(xué)生成績及綜合素質(zhì)評分對學(xué)生進行排名,并推薦優(yōu)秀的人選,同時學(xué)生的曠課、遲到、補考等也是評獎評優(yōu)的重要依據(jù)。
2.3.3 地區(qū)信息分析
為了解不同地域?qū)W生成績的差異性,教師可以對每學(xué)期排名靠前的20%學(xué)生進行篩選,根據(jù)生源地不同進行劃分,計算不同生源地在總學(xué)生中的比例,并進行排名,以了解全國各個地區(qū)生源質(zhì)量。綜合素質(zhì)排名與預(yù)警總體排名方法同上。
在互聯(lián)網(wǎng)、云計算及Web等技術(shù)支持下,學(xué)生校園行為相關(guān)數(shù)據(jù)大量產(chǎn)生,高校管理人員在分析學(xué)生校園行為時多采用的是關(guān)聯(lián)法、特征分析法、異常分析法等,需要大量數(shù)據(jù)作為支撐?!耙豢ㄍā薄皥D書借閱卡”“網(wǎng)絡(luò)監(jiān)控”均屬于結(jié)構(gòu)化數(shù)據(jù),在信息采集的同時能夠?qū)π畔⒂枰赞D(zhuǎn)化?;ヂ?lián)網(wǎng)、社區(qū)論壇及貼吧則為半結(jié)構(gòu)化數(shù)據(jù)的主要來源,通常需要利用ETL工具進行處理,數(shù)據(jù)采集多采用網(wǎng)絡(luò)爬蟲工具。在提取學(xué)生行為特征方面,包括顯特征與隱特征兩個方面,在分析學(xué)生群體生活方面,可以輸入學(xué)生刷卡次數(shù)、消費金額、平均消費金額、上網(wǎng)時間等,隱特征的提取需要借助社交網(wǎng)絡(luò)平臺,提取學(xué)生上網(wǎng)類型、一卡通使用頻率等[6]。另外,學(xué)生特征提取還包括行為規(guī)律、社交情況、消費特征、圖書借閱數(shù)量及圖書借閱類型等。學(xué)生社交網(wǎng)絡(luò)作為學(xué)生行為異常的重要指標,具有預(yù)警作用,通過社交網(wǎng)絡(luò)刷卡事件的提取分類,可以進行如下排序(見表1)。
表1 學(xué)生事件發(fā)生排序
學(xué)生校園行為常見挖掘方法包括預(yù)測、聚類、關(guān)系挖掘等,依據(jù)以上信息,高校管理人員需要構(gòu)建學(xué)生離群對學(xué)生行為及情感分析,數(shù)據(jù)關(guān)聯(lián)性分析內(nèi)容主要包括家庭背景、情感態(tài)度及人際關(guān)系等。本研究采用關(guān)聯(lián)分析法,利用個體在時間、空間、生活特征等方面的相似性,對學(xué)生在特定時間范圍內(nèi)的相關(guān)數(shù)據(jù)如時間、時空重疊性,空間相似相進行分析,進而獲得學(xué)生之間移動模式相似性。在分析中需要對不同模塊分級指標、權(quán)重比例予以設(shè)計,對學(xué)生的個性特征、行為規(guī)律等進行深入分析,構(gòu)建集影像、文本、圖形等為一體的校園行為安全預(yù)警模型,預(yù)測學(xué)生的行為,防微杜漸,實現(xiàn)和諧校園的建設(shè)。預(yù)警模型的構(gòu)建采用“1+1+4+N”模式,2個1分別表示基礎(chǔ)數(shù)據(jù)源、大數(shù)據(jù)運行平臺,4指的是4個管理平臺,N主要表示多種分析挖掘技術(shù),如智能預(yù)警、多維分析、專題分析等。數(shù)據(jù)采集存儲平臺如圖3所示。
圖3 數(shù)據(jù)采集存儲平臺
大數(shù)據(jù)可視化模式主要利用SAS工具與SPSS,其能夠?qū)崿F(xiàn)對大學(xué)生行為數(shù)據(jù)的可視化管理,使得用戶數(shù)據(jù)信息的呈現(xiàn)更加直觀、方便。利用離群點分析能夠形成學(xué)生相似行為特征值聚類,并樹立成多個主題的數(shù)據(jù)分析模塊。教師可以以曲線圖的形式將學(xué)生在校期間的考試成績、出勤情況、及格率等予以動態(tài)反應(yīng)。教師可直觀地掌握學(xué)生的學(xué)習(xí)情況[7]。教師通過網(wǎng)絡(luò)行為監(jiān)控能夠了解學(xué)生群體的熱點話題及對政治敏感問題的關(guān)注情況等。利用系統(tǒng)分析安全數(shù)據(jù),能使學(xué)生的情感與態(tài)度可視化,掌握學(xué)生行動、行為軌跡,制定干預(yù)計劃。當(dāng)在監(jiān)測系統(tǒng)中出現(xiàn)超出常規(guī)的跡象時,系統(tǒng)會發(fā)出預(yù)警,應(yīng)密切跟蹤學(xué)生行為,并積極采取措施,避免不良行為的發(fā)生。
大數(shù)據(jù)時代為高校學(xué)生管理提供了新的技術(shù)支持,學(xué)生行為分析可視化系統(tǒng)的構(gòu)建能夠?qū)崿F(xiàn)對學(xué)生學(xué)情、違法違紀行為等的精準分析診斷,有利于前置預(yù)警,促進了學(xué)生管理水平的提升,保障了高校對學(xué)生的安全管控,推動了智慧數(shù)字化校園的實現(xiàn)。學(xué)生行為分析可視化系統(tǒng)擁有廣闊的發(fā)展前景。