唐元林
摘 要 簡要介紹了大數(shù)據(jù)的概念,論述了大數(shù)據(jù)應用于高校學生管理的緊迫性,同時介紹了大數(shù)據(jù)的安全管理和大數(shù)據(jù)分析方法在高校學生管理中的應用,并分析了構(gòu)建各類學生管理模型的思路和方法。
關(guān)鍵詞 大數(shù)據(jù);高校;學生管理;應用
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2019)235-0155-02
在如今信息化時代,大數(shù)據(jù)廣泛應用于各個領(lǐng)域,給各行各業(yè)帶來了巨大的變化,同時,數(shù)據(jù)量也呈指數(shù)級增長,高校在長期的運行過程中產(chǎn)生大量有價值的數(shù)據(jù),如何利用這海量的數(shù)據(jù)提升高校學生管理水平是各高校面臨的挑戰(zhàn)和機遇。
1 大數(shù)據(jù)技術(shù)概述
大數(shù)據(jù)是指那些數(shù)據(jù)量特別大,數(shù)據(jù)種類特別復雜的數(shù)據(jù)集,這種數(shù)據(jù)無法用傳統(tǒng)的數(shù)據(jù)庫進行存儲和管理。大數(shù)據(jù)的主要特點是數(shù)據(jù)量大、數(shù)據(jù)類別復雜、數(shù)據(jù)處理快和數(shù)據(jù)真實性高。數(shù)據(jù)的形式有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),如視頻、圖片、文本和網(wǎng)絡(luò)瀏覽記錄等。大數(shù)據(jù)技術(shù)主要包含5個方面:可視化分析、數(shù)據(jù)挖掘、預測性分析、語義引擎和數(shù)據(jù)質(zhì)量管理。通過數(shù)據(jù)挖掘找到影響某個結(jié)果的影響因素,并構(gòu)建相應的數(shù)據(jù)模型,通過機器學習算法,采用已有的數(shù)據(jù)不斷訓練模型參數(shù),使得模型預測更加準確。
2 大數(shù)據(jù)技術(shù)應用于高校學生管理的緊迫性
隨著近年來高校擴招政策,各個高校的學生規(guī)模不斷擴大,給高校帶來巨大的管理壓力。一方面,高校學生管理人員配備相比學生規(guī)模還是遠遠不夠;另一方面,高校學生中有很多是獨生子女,獨生子女個體的巨大差異也給高校學生管理帶來了很大的困難。隨著如今各高校各類學生管理信息系統(tǒng)的不斷完善,學生的學業(yè)數(shù)據(jù)、社團活動、出入門禁數(shù)據(jù)等數(shù)據(jù)的累積,采用大數(shù)據(jù)技術(shù)對現(xiàn)有數(shù)據(jù)進行采集、加工、分析和整理,產(chǎn)生可以反映學生個體特征的數(shù)據(jù),從而給高校學生管理人員的管理提供依據(jù)。同時,各二級學院、輔導員、班主任可以根據(jù)分析結(jié)果給學生提供個性化的幫助,如就業(yè)、選課等方面的指導,從而不斷提高高校的學生管理水平。
3 大數(shù)據(jù)技術(shù)在高校學生管理中的應用
3.1 學生相關(guān)數(shù)據(jù)的采集存儲
3.1.1 數(shù)據(jù)的屬性
大數(shù)據(jù)分析的前提是要累積一定規(guī)模的學生相關(guān)數(shù)據(jù),包括學生的成績數(shù)據(jù)、課堂考勤數(shù)據(jù)、課程平臺學習數(shù)據(jù)、參加社團活動數(shù)據(jù)、校園卡使用數(shù)據(jù)、門禁數(shù)據(jù)、圖書館借閱數(shù)據(jù)等。大數(shù)據(jù)分析要求數(shù)據(jù)必須滿足規(guī)模性、動態(tài)性、多樣性。規(guī)模性是從量上來度量,數(shù)據(jù)量越大,越接近實際情況,分析越準確,一定規(guī)模的統(tǒng)計樣本數(shù)是大數(shù)據(jù)分析的基礎(chǔ)。多樣性是從數(shù)據(jù)種類的維度上來度量,數(shù)據(jù)的種類、數(shù)據(jù)的來源越多,越有助于數(shù)據(jù)的交叉驗證,從而確保分析結(jié)果的可靠性。動態(tài)性是從時間序列的維度來度量,結(jié)合了時間維度,可以判斷某個要素隨時間的變化趨勢,使得數(shù)據(jù)分析更加科學和豐富。
3.1.2 數(shù)據(jù)的存儲
目前絕大多數(shù)高校還是采用傳統(tǒng)的服務器存儲學生的各類數(shù)據(jù),傳統(tǒng)服務器如果遇到停電等突發(fā)情況時將面臨數(shù)據(jù)丟失等風險,雖然各高校都會配備不間斷電源,但是不間斷電源最多只能維持幾個小時,還是無法滿足高校的管理需要。隨著學生規(guī)模的不斷擴大,學生管理產(chǎn)生的數(shù)據(jù)將急劇增加,服務器呈現(xiàn)多而分散的問題,不利于數(shù)據(jù)的共享和數(shù)據(jù)處理?;谠萍軜?gòu)的分布式文件系統(tǒng)(DFS)因其具備無限擴展性、冗余性、容錯性被廣泛應用于各領(lǐng)域,高校應采用云平臺來存儲學生各類數(shù)據(jù),以便更好的對數(shù)據(jù)進行整合和處理。
3.1.3 數(shù)據(jù)的來源與獲取
與學生管理相關(guān)的數(shù)據(jù)有學生成績數(shù)據(jù)庫、學生社團活動數(shù)據(jù)庫、學生選課數(shù)據(jù)庫、學生信息數(shù)據(jù)庫、學生校園卡使用數(shù)據(jù)庫、學生圖書館借閱數(shù)據(jù)庫、學生在線學習數(shù)據(jù)庫、學生出入門禁數(shù)據(jù)庫、畢業(yè)生就業(yè)數(shù)據(jù)庫、學生校內(nèi)網(wǎng)頁、論壇留言等數(shù)據(jù)。絕大多數(shù)數(shù)據(jù)庫是由學校的教務處、學生處和團委牽頭建立,組織學生填報,以教務系統(tǒng)為例,涉及學生管理數(shù)據(jù)的表有近百個。包含學生成績數(shù)據(jù),學生選課數(shù)據(jù),學生基本信息數(shù)據(jù)庫,這些數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主。學生參加社團活動數(shù)據(jù)以非結(jié)構(gòu)化數(shù)據(jù)為主。充分收集不同來源的學生管理數(shù)據(jù),數(shù)據(jù)的質(zhì)量直接決定了分析結(jié)果的準確性。
3.2 學生相關(guān)數(shù)據(jù)的安全管理
學生相關(guān)數(shù)據(jù)采集后還要做好數(shù)據(jù)安全的管理,學生相關(guān)數(shù)據(jù)的安全是大數(shù)據(jù)技術(shù)分析的前提。網(wǎng)絡(luò)的開放性決定了學生各類數(shù)據(jù)被黑客等攻擊是不可避免的。另外高校的管理人員信息安全意識普遍比較薄弱,加之缺乏信息安全相關(guān)背景知識,這給學生相關(guān)信息安全帶來很大的隱患。一方面要采用最新的信息加密技術(shù)對學生相關(guān)數(shù)據(jù)進行加密保護,同時也要做好數(shù)據(jù)的定期備份,確保系統(tǒng)出現(xiàn)故障情況下能短時間修復;另一方面,高校也要加強管理人員的信息安全教育,如各類學生管理系統(tǒng)的密碼設(shè)置規(guī)范和網(wǎng)絡(luò)使用禁忌等,確保學生信息的安全。
3.3 學生管理數(shù)據(jù)的融合和分析
通常情況下學生管理數(shù)據(jù)來源于不同部門,各部門采用的數(shù)據(jù)形式不盡相同,同時數(shù)據(jù)的結(jié)構(gòu)也不同,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),如視頻、圖片、文本和網(wǎng)絡(luò)瀏覽數(shù)據(jù)等。對于以上這些數(shù)據(jù)要采用數(shù)據(jù)融合技術(shù)將結(jié)構(gòu)不同、定義多樣的數(shù)據(jù)進行轉(zhuǎn)換,使得其成為結(jié)構(gòu)相同、語義相近的數(shù)據(jù),便于后續(xù)的數(shù)據(jù)分析和處理。
大數(shù)據(jù)技術(shù)分析主要有可視化分析、數(shù)據(jù)挖掘和預測分析等??梢暬治鍪悄軌蛑庇^的展示大數(shù)據(jù)的特點,具有良好的交互性。數(shù)據(jù)挖掘是從大量有噪聲的、模糊的、隨機的實際數(shù)據(jù)中,提取有價值的數(shù)據(jù)。預測分析是在可視化分析和數(shù)據(jù)挖掘的基礎(chǔ)上,建立模型,通過數(shù)據(jù)訓練優(yōu)化模型,從而可以利用模型預測未來可能出現(xiàn)的情況。數(shù)據(jù)挖掘是數(shù)據(jù)模型的發(fā)現(xiàn)過程,高??梢岳脭?shù)據(jù)挖掘方法構(gòu)建各類學生管理模型,比如學業(yè)預警模型、學生選課推薦模型等??梢圆捎脵C器學習算法訓練模型參數(shù),使得模型預測更加準確。
數(shù)據(jù)挖掘有4種常見的分析方法,分別是描述型分析、診斷型分析、指令型分析和預測型分析。描述型分析是最常見的大數(shù)據(jù)分析方法,注重大數(shù)據(jù)的背后發(fā)生了什么;預測型分析注重未來將發(fā)生什么;診斷型分析主要側(cè)重發(fā)生的原因;指令型分析側(cè)重給用戶提供可行的解決方案。數(shù)據(jù)挖掘采用的算法主要包括分類與預測挖掘、聚類挖掘、關(guān)聯(lián)規(guī)則、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、模糊理論、可視化技術(shù)等,其中聚類分類與預測挖掘、關(guān)聯(lián)規(guī)則和決策樹分類三種算法比較適用于高校學生管理。
3.3.1 聚類、分類與預測挖掘算法在學生管理中的應用
聚類算法主要包括K-means、 BIRCH、DBSCAN、CLIQLE等方法,高校在學生管理里時候可采用K-means算法的聚類挖掘分析技術(shù),這種分析技術(shù)能夠分析出某一類學生群體的行為特征。高??梢岳脤W生在網(wǎng)絡(luò)平臺的學習行為數(shù)據(jù),判斷某個群體學生的學習效果和課程的質(zhì)量。高校也可以利用學生就業(yè)數(shù)據(jù)庫找出就業(yè)率比較高群體學生的特征并加以分析。高??梢岳脤W生成績數(shù)據(jù)分析出有學業(yè)危機的學生群體,并進行人為干預。
3.3.2 關(guān)聯(lián)規(guī)則算法在學生管理中的應用
關(guān)聯(lián)規(guī)則算法主要用于發(fā)現(xiàn)大數(shù)據(jù)背后各要素之間可能存在的關(guān)聯(lián),主要算法有挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的Apriori算法,該算法可以用來分析某種現(xiàn)象的影響因素。高??梢酝ㄟ^學生參加社團活動數(shù)據(jù)發(fā)現(xiàn)學生的興趣,向?qū)W生推薦合適的課程。高??梢越Y(jié)合學生就業(yè)數(shù)據(jù)和學生參加社團數(shù)據(jù),得出就業(yè)率高和學生參加社團的相關(guān)度。高??梢岳脤W生在校內(nèi)實名網(wǎng)絡(luò)中網(wǎng)頁瀏覽數(shù)據(jù),分析出學生瀏覽負面信息與學生存在心理健康問題的相關(guān)度。
3.3.3 機器學習在構(gòu)建學生管理模型中的應用
為了使得模型的預測更加準確,可以采用機器學習方法訓練模型參數(shù)。機器學習分為有監(jiān)督學習和無監(jiān)督學習。高校可以采用有監(jiān)督的機器學習,通過已有的數(shù)據(jù)不斷訓練模型,使得模型的預測更加準確。通過成績數(shù)據(jù)和學生網(wǎng)絡(luò)學習等數(shù)據(jù)高校可以建立學生的學業(yè)預警模型。通過學生各類競賽數(shù)據(jù)、成績數(shù)據(jù)、社團等數(shù)據(jù)構(gòu)建學生的能力模型,給學生提供個性化的就業(yè)推薦。高??梢岳脤W生對課程的評價數(shù)據(jù)和學生網(wǎng)絡(luò)平臺的學習行為數(shù)據(jù),構(gòu)建優(yōu)質(zhì)課程模型,給學生提供更優(yōu)質(zhì)的課程資源。高??梢岳脤W生網(wǎng)絡(luò)瀏覽數(shù)據(jù)、校內(nèi)各類網(wǎng)絡(luò)留言數(shù)據(jù)建立實時的學生心理健康狀態(tài)監(jiān)測模型,及時發(fā)現(xiàn)可能存在負面情緒的學生,通過跟學生的及時溝通,化解學生的心理健康問題。
參考文獻
[1]張靜,劉危,楊兵,單文波.試析大數(shù)據(jù)分析在學科建設(shè)中的應用[J].高教學刊,2019(5):1-5.
[2]楊陽,石城,蘇力.大數(shù)據(jù)時代高校學生教育管理工作摭探[J].成才之路,2019(6):8.
[3]袁興梅.基于大數(shù)據(jù)的高校學生教育管理研究[J].中國成人教育,2018(24):34-36.