任遠 朱潤凱
摘要:本文以北京航空航天大學(xué)學(xué)生為研究對象,運用大數(shù)據(jù)思維和分析方法,基于“夢拓計劃”搭建信息平臺并采集新生行為數(shù)據(jù),根據(jù)新生的關(guān)注熱點研究大學(xué)新生的群體性特征,以探索新生適應(yīng)性教育的科學(xué)規(guī)律。
關(guān)鍵詞:新生教育;大數(shù)據(jù);科學(xué)化;夢拓計劃
中圖分類號:G40文獻標志碼:A文章編號:2095-9214(2016)03-0297-01
一、 引言
本文以新生適應(yīng)性教育為切入點,基于北京航空航天大學(xué)“夢拓計劃”,通過平臺研發(fā)、數(shù)據(jù)采集、模型構(gòu)建和特征提取,將“Mentor”的靜態(tài)信息數(shù)據(jù)與新生“夢拓組隊”的動態(tài)行為數(shù)據(jù)進行集成分析,歸納出新生整體性的心理特征和實際需求,從而為新生適應(yīng)性教育工作提出科學(xué)化建議。
二、 研究內(nèi)容
(一) “夢拓計劃”及信息平臺。北京航空航天大學(xué)基于“朋輩教育”的理念,在新生入學(xué)后實行“夢拓計劃”:選拔優(yōu)秀的二年級本科生作為“Mentor”,通過開展文化體驗課等交流活動幫助一年級新生更好地適應(yīng)大學(xué)生活,以達到開拓視野、提高素養(yǎng)、共同進步的目標。為支撐“夢拓計劃”順利實施,改變傳統(tǒng)的“指派式”的學(xué)生工作模式,我們研發(fā)了“夢拓”信息平臺,新生可根據(jù)自己的興趣點和實際需求在平臺中自由選擇“Mentor”。數(shù)據(jù)層記錄學(xué)生“Mentor組隊”過程中的行為數(shù)據(jù),用以分析學(xué)生總體特征和每個人的個性特征圖譜。目前該平臺已經(jīng)應(yīng)用到北京航空航天大學(xué)計算機學(xué)院、軟件學(xué)院、知行書院、宇航學(xué)院四個單位,共采集1039人的靜態(tài)信息數(shù)據(jù)和動態(tài)行為數(shù)據(jù)。
(二) “Mentor”特征向量提取。本文對數(shù)據(jù)庫中“Mentor”簡介進行特征標簽標注(與后臺日志時間戳一一映射),采用分詞系統(tǒng)進行分詞處理并得到163個代表“Mentor”特征的離散關(guān)鍵詞,并利用LDA模型[1]對關(guān)鍵詞進行特征分析。
利用LDA模型對163個關(guān)鍵詞進行特征分析,通過對比后臺日志時間戳對參數(shù)進行調(diào)優(yōu),最終聚類出最受新生關(guān)注的七大“Mentor”特征,構(gòu)成“Mentor”七維核心特征優(yōu)勢向量,每個分量代表著“Mentor”可能具備的特征項。本文將“Mentor”特征向量表示如下:
[文藝,體育,學(xué)習,工作,專業(yè)(技術(shù)),休閑,社交]
基于聚類得到的樣本數(shù)據(jù),本文進一步統(tǒng)計得到七維核心特征優(yōu)勢向量占比(即擁有某個分量特征的人占總?cè)藬?shù)的百分比)分別為[9.71%, 8.01%, 8.98%, 13.83%, 10.68%, 3.40%, 20.87%],占比排序為[4,6,5,2,3,7,1]。
分析分量占比數(shù)據(jù),可以看出新生對“Mentor”特征的傾向:新生群體整體偏向選擇外向交友型和工作能力突出型的學(xué)長學(xué)姐作為自己的“Mentor”,具備較強專業(yè)能力特征的“Mentor”占比也比較高;另一方面,本文結(jié)合北航實際情況將“Mentor”性別作為一個特殊的影響因子加入到研究中,并發(fā)現(xiàn)“女性Mentor”在實際組隊過程中非常受歡迎,這在一定程度上影響了一般情況下的組隊行為,可能與北航男女比例的特殊性有一定關(guān)系。
(三) 新生動態(tài)行為數(shù)據(jù)處理模型構(gòu)建。本文在研究過程中,采用北航“夢拓”信息平臺數(shù)據(jù)庫中已記錄的用戶操作時間戳、相關(guān)操作日志以及網(wǎng)頁訪問日志共計2萬余條操作數(shù)據(jù),涵蓋了新生訪問平臺的各類操作以及對于數(shù)據(jù)庫訪問的慢日志統(tǒng)計下的選擇信息。基于以上行為數(shù)據(jù),利用數(shù)據(jù)掃描處理工具Scanner對大量日志文本數(shù)據(jù)進行掃描處理,去除噪聲數(shù)據(jù)(例如管理員操作的數(shù)據(jù)等)后對有效區(qū)間內(nèi)的數(shù)據(jù)進行處理。在此基礎(chǔ)上,本文根據(jù)降溫原理構(gòu)建分量熱度模型,利用數(shù)據(jù)擬合方法進行數(shù)據(jù)分析,期望得到新生所選“Mentor”的每個特征分量熱度值并排序,以更科學(xué)地挖掘?qū)W生的行為特性和興趣關(guān)注點。
現(xiàn)將分量熱度模型描述如下:
時間刻度:以組隊時間的開始和結(jié)束為界,對時間線進行均分后得到若干具有一定粒度的時間段;為每個時間段賦予的時間標識值,即為時間刻度值;
熱度權(quán)重:即每個階段的熱度的量化的衡量值。(本文中最高熱度定為100,最低熱度定為0,可以用操作數(shù)歸一化到0-100)。
現(xiàn)將采用的公式描述如下:
總體熱度公式:
W=K*(A*T2+B*T+C)
其中,W表示熱度權(quán)重,K表示歸一化系數(shù),T表示時間刻度,C為常數(shù)。所示時間段(242-258)參數(shù)分別為:K=5.46,A=0.0528,B=-27.123,C=3489.90。
某向量分量的熱度值可用該分量在該刻度下被選擇數(shù)量與熱度權(quán)重之積的累加和表示:
H=∑(N*W)
其中,H表示分量熱度值,N表示分量數(shù)目,W表示分量熱度權(quán)重。
(四) 綜合量化分析。由于七維核心特征優(yōu)勢向量的每一個分量所占比重各不不同,因此所具有的熱度值不具有可比性,要得到最終的傾向性排序,需要進行歸一化綜合量化分析。
三、結(jié)論與建議
(一)結(jié)論。新生入學(xué)后的熱點關(guān)注問題與傳統(tǒng)的學(xué)生工作經(jīng)驗基本保持一致。研究結(jié)果表明,新生對專業(yè)的關(guān)注度不高,整體呈現(xiàn)出“專業(yè)迷?!钡奶卣?。北航作為一所具有理工科優(yōu)勢的綜合型大學(xué),各學(xué)院學(xué)科特色明顯、專業(yè)性較強,如何順利邁進專業(yè)的“門檻”,是新生面臨的挑戰(zhàn)。
(二)建議?!袄仙鷰律笔降摹皦敉赜媱潯?,是新時期新生入學(xué)教育模式的創(chuàng)新,是學(xué)校優(yōu)良傳統(tǒng)和優(yōu)秀文化得以傳承的有效載體。在選拔高年級“Mentor”時,一方面應(yīng)該選拔新生關(guān)注度較高的體育愛好者、學(xué)習優(yōu)秀者和社會工作能力突出者,這符合新生的實際需求和心理期盼;另一方面,要幫助新生開拓視野,引導(dǎo)學(xué)生轉(zhuǎn)變思想觀念,將關(guān)注度較低的“文藝氣質(zhì)類”、“文化體驗類”學(xué)生也作為重點“Mentor”候選人,以促進新生素質(zhì)的全面發(fā)展和人文素養(yǎng)的養(yǎng)成。
(作者單位:北京航空航天大學(xué)計算機學(xué)院)
參考文獻:
[1]張韞. 大數(shù)據(jù)改變教育 寫在大數(shù)據(jù)元年來臨之際[J]. 上海教育, 2013 (10): 8-11.