李 騫,王 碩,隋繼學(xué)
(河南牧業(yè)經(jīng)濟(jì)學(xué)院 能源與智能工程學(xué)院,河南 鄭州450011)
大學(xué)生逐漸成為網(wǎng)絡(luò)社會(huì)的主體,在各高校進(jìn)行校園信息化建設(shè)的過程中,信息化基礎(chǔ)設(shè)施不斷在完善。以河南牧業(yè)經(jīng)濟(jì)學(xué)院三個(gè)校區(qū)為例,無線、有線網(wǎng)絡(luò)已基本實(shí)現(xiàn)教室、宿舍、校園全覆蓋,為學(xué)生在校上網(wǎng)提供了便利,學(xué)生每日通過校園網(wǎng)上網(wǎng)、聊天、學(xué)習(xí)、游戲、購物已經(jīng)成為日常生活中不可或缺的一部分。
學(xué)生上網(wǎng)行為評估分析主要指的是通過在校園網(wǎng)出口或校園網(wǎng)不同節(jié)點(diǎn)采集網(wǎng)絡(luò)流量,識別上網(wǎng)日志及流量信息中的網(wǎng)絡(luò)行為軌跡(包括專業(yè)網(wǎng)頁瀏覽、游戲娛樂等),利用智能數(shù)據(jù)分析方法,對網(wǎng)絡(luò)資源利用情況和學(xué)生上網(wǎng)行為進(jìn)行評估和分析。隨著可視化技術(shù)、數(shù)據(jù)采集技術(shù)的提升,進(jìn)行學(xué)生上網(wǎng)行為評估是現(xiàn)代化校園了解學(xué)生日常軌跡的一種真實(shí)而重要的方式,也為進(jìn)一步研究學(xué)生校園行為活動(dòng)提供了新的思路和方法。但是,隨著校園網(wǎng)速度的加快,網(wǎng)絡(luò)應(yīng)用復(fù)雜度增加,加密網(wǎng)絡(luò)和未知網(wǎng)絡(luò)的更新也給校園網(wǎng)學(xué)生上網(wǎng)行為的數(shù)據(jù)采集與分析帶來了新的挑戰(zhàn)。
因此,本文從學(xué)生網(wǎng)絡(luò)流量數(shù)據(jù)與日志分析入手,提出了一種基于網(wǎng)絡(luò)爬蟲框架的校園網(wǎng)網(wǎng)絡(luò)流量數(shù)據(jù)獲取模型,利用機(jī)器學(xué)習(xí)算法來獲得理想的數(shù)據(jù)處理優(yōu)化模型,比較了基于網(wǎng)絡(luò)流量數(shù)據(jù)的梯度增強(qiáng)決策樹(Gradient Boosting Decision Tree,GBDT)和隨機(jī)森林(Random Forests,RF)兩種方法,對學(xué)生上網(wǎng)數(shù)據(jù)進(jìn)行各個(gè)角度的詳細(xì)分析。最后,基于學(xué)生上網(wǎng)行為數(shù)據(jù)分析,從多個(gè)方面對高校網(wǎng)絡(luò)監(jiān)控和學(xué)生教育管理給出對策和建議,為老師們研究分析在校學(xué)生學(xué)習(xí)、生活特征提供了新技術(shù)、新方法,同時(shí)大數(shù)據(jù)分析技術(shù)也必將促進(jìn)當(dāng)前高校信息化建設(shè)。
傳統(tǒng)學(xué)生溝通在實(shí)行過程中具有效率低的致命缺點(diǎn),并且也很難挖掘到學(xué)生提供信息所蘊(yùn)含的潛在信息及真實(shí)的生活學(xué)習(xí)情況。網(wǎng)絡(luò)數(shù)據(jù)與學(xué)生的生活息息相關(guān),可以被用于分析學(xué)生的行為模式。傳統(tǒng)教育理念普遍認(rèn)為學(xué)生上網(wǎng)時(shí)長和上網(wǎng)內(nèi)容會(huì)對學(xué)生學(xué)業(yè)和日常生活造成影響,但是卻很難建立學(xué)生上網(wǎng)行為與學(xué)業(yè)之間的模型,因而無法進(jìn)行相關(guān)研究。
2.2 兩組患者手術(shù)后情況比較 觀察組手術(shù)后下床活動(dòng)時(shí)間、手術(shù)后肛門排氣時(shí)間及患者手術(shù)后12 h疼痛評分明顯優(yōu)于對照組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),兩組患者住院費(fèi)用及手術(shù)后住院時(shí)間相比,差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見表3。
對于學(xué)生上網(wǎng)行為分析,主要的難點(diǎn)和研究點(diǎn)集中在:數(shù)據(jù)流量采集技術(shù)、流量準(zhǔn)確識別、上網(wǎng)行為分析模型建立三方面。針對數(shù)據(jù)流量采集技術(shù),根據(jù)實(shí)現(xiàn)方法可以分為硬件和軟件兩種類型,硬件實(shí)現(xiàn)雖準(zhǔn)確度高但是需要購買專門的設(shè)備,不適用于研究;軟件可以根據(jù)實(shí)際需求進(jìn)行開發(fā)和部署,靈活性較高。針對流量識別技術(shù),主要集中在TCP端口、深度包檢測(DIP)和機(jī)器學(xué)習(xí)。其中,TCP端口識別不適應(yīng)動(dòng)態(tài)變化,DIP技術(shù)不能應(yīng)用于加密網(wǎng)絡(luò)和未知網(wǎng)絡(luò),而機(jī)器學(xué)習(xí)不受端口、數(shù)據(jù)包、加密等復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)情況的限制[1],對學(xué)生上網(wǎng)情況的分析具有一定的實(shí)用價(jià)值,也將成為今后高校教育教學(xué)研究的一項(xiàng)重要內(nèi)容[2-3]。
國內(nèi)外許多學(xué)者基于大學(xué)生的上網(wǎng)數(shù)據(jù)進(jìn)行了分析。例如Miao[4]等人提出了一種區(qū)分大學(xué)生不同年級的方法,利用校園WiFi數(shù)據(jù)捕捉學(xué)生的行為特征,利用這些特征,采用機(jī)器學(xué)習(xí)聚類算法對不同年級的學(xué)生進(jìn)行聚類;Kamal Bunkar[5]等人建立了一個(gè)系統(tǒng),允許學(xué)生預(yù)測正在學(xué)習(xí)課程的最終成績,他們嘗試在機(jī)器學(xué)習(xí)中應(yīng)用一些算法,特別是分類,通過評估學(xué)生數(shù)據(jù)來研究可能影響學(xué)生表現(xiàn)的主要屬性,從而幫助提高高等教育的質(zhì)量;Tripti[6]等人使用不同的分類算法,根據(jù)學(xué)生的社會(huì)數(shù)據(jù)、學(xué)術(shù)數(shù)據(jù)和各種情感技能建立預(yù)測模型,將C4.5和隨機(jī)樹兩種算法應(yīng)用到學(xué)生的記錄中,發(fā)現(xiàn)隨機(jī)樹具有較高的精度。
此模塊主要對考試類別進(jìn)行管理、對考試科目進(jìn)行設(shè)置、對科目課程進(jìn)行設(shè)置等。根據(jù)考試的性質(zhì)劃分類別,在科目考試時(shí),考試只有一個(gè)科目,每名候選人對考試科目來講,是一個(gè)考試的基本單元,當(dāng)然一個(gè)科目可以包含一個(gè)或幾門課程。每一個(gè)考試分期可設(shè)置不同的考試科目和考試時(shí)間,但新增一個(gè)考試分期時(shí)系統(tǒng)自動(dòng)默認(rèn)上一個(gè)分期的設(shè)置??颇堪颇烤幪柡涂颇棵Q,同類型的科目編號在不同分期應(yīng)設(shè)置一致,這樣能適應(yīng)跨分期的科目合格統(tǒng)計(jì)與對比,以及科目題庫的重用。
由于每次迭代的訓(xùn)練集和測試集都不相同,對于上網(wǎng)數(shù)據(jù)進(jìn)行分類需要通過N次迭代得到訓(xùn)練模型,獲得更可靠的結(jié)果。每次迭代均從SQL中提取數(shù)據(jù)集,將數(shù)據(jù)集隨機(jī)分為訓(xùn)練集和測試集,對數(shù)據(jù)集進(jìn)行規(guī)范化處理。在所有迭代結(jié)束后,將最優(yōu)模型參數(shù)保存到SQL中,訓(xùn)練模型流程如圖3。
(1)數(shù)據(jù)獲取和預(yù)處理階段。利用網(wǎng)絡(luò)爬蟲獲取上網(wǎng)數(shù)據(jù),按照數(shù)據(jù)處理形式,對記錄進(jìn)行轉(zhuǎn)換,寫入數(shù)據(jù)倉庫,可采用SQL語句或批量加載,這一部分是為下一步統(tǒng)計(jì)準(zhǔn)備有用的數(shù)據(jù)。
學(xué)生上網(wǎng)數(shù)據(jù)行為分析過程可以分為以下兩個(gè)步驟。
(3)凝灰熔巖、凝灰?guī)r銅鐵礦石。該礦石中礦石礦物為磁鐵礦、針鐵礦、黃鐵礦、黃銅礦、孔雀石等,脈石礦物為晶屑、玻屑等,礦石主要為細(xì)粒結(jié)構(gòu)、他形晶粒結(jié)構(gòu),星點(diǎn)浸染狀構(gòu)造。
付軍科認(rèn)為,ERAS不僅僅是一項(xiàng)技術(shù),更多的是一種理念的更新,其核心就是圍繞患者圍手術(shù)期的加速康復(fù)采取一系列優(yōu)化措施。“這和國家講的時(shí)刻為患者利益考慮,讓患者獲得優(yōu)質(zhì)醫(yī)療服務(wù)的理念是高度契合的?!备盾娍普f,本著這樣的核心理念,以患者為中心,想辦法預(yù)防一些并發(fā)癥的發(fā)生,就會(huì)自然啟動(dòng)ERAS的各個(gè)程序,伴隨而來的便是醫(yī)療質(zhì)量的提升及對精細(xì)化醫(yī)療管理的踐行。
(2)基于機(jī)器學(xué)習(xí)的模型建立和分析階段。利用機(jī)器學(xué)習(xí)建立上網(wǎng)數(shù)據(jù)與行為的模型,這是整個(gè)行為分析的關(guān)鍵部分。需要通過從不同角度對學(xué)生上網(wǎng)行為進(jìn)行統(tǒng)計(jì)和分析,幫助教育者掌握學(xué)生上網(wǎng)需求,發(fā)掘出隱含規(guī)律,實(shí)現(xiàn)對學(xué)生上網(wǎng)情況的全面把握。
為了獲取盡量多的學(xué)生網(wǎng)絡(luò)流量數(shù)據(jù),本文采用了一個(gè)由模擬登錄瀏覽器和從網(wǎng)頁下載數(shù)據(jù)組成的網(wǎng)絡(luò)爬蟲(Spider)。由于學(xué)生在登錄瀏覽器時(shí),需輸入用戶ID、密碼以及驗(yàn)證碼,其中驗(yàn)證碼是一幅數(shù)字和字母的圖像。因此,在設(shè)計(jì)中提出了一個(gè)基于Keras的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證碼自動(dòng)識別。網(wǎng)絡(luò)爬蟲的框架如圖1所示,Web爬蟲得到的數(shù)據(jù)集示例如表1和表2所示,每天的日志數(shù)據(jù)量約4萬條,包括的核心字段有用戶賬號、用戶名稱、登錄時(shí)間、使用時(shí)長、IP地址、使用流量、行為詳情等,表2給出經(jīng)過處理后的數(shù)據(jù)集。
表1 學(xué)生上網(wǎng)數(shù)據(jù)集展示
圖1 網(wǎng)絡(luò)爬蟲框架
學(xué)生網(wǎng)絡(luò)行為可以根據(jù)不同的需求對行為進(jìn)行分類。本研究將網(wǎng)絡(luò)行為分為網(wǎng)絡(luò)學(xué)習(xí),網(wǎng)絡(luò)娛樂兩個(gè)部分,然后通過上網(wǎng)時(shí)間等數(shù)據(jù)對學(xué)生上網(wǎng)行為進(jìn)行綜合分析,并進(jìn)行標(biāo)記。處理后的數(shù)據(jù)集將保存到SQL中,如表2。Label為1代表上網(wǎng)行為好,Label為0代表上網(wǎng)行為不良,需進(jìn)行預(yù)警。
表2 處理后的數(shù)據(jù)集
此外,網(wǎng)上學(xué)習(xí)的網(wǎng)絡(luò)行為由兩部分組成,專業(yè)課學(xué)習(xí)以及課外學(xué)習(xí)。判斷依據(jù)為對專業(yè)課的關(guān)鍵詞搜索以及相應(yīng)的視頻觀看情況。研究根據(jù)學(xué)生上網(wǎng)瀏覽信息條數(shù)數(shù)據(jù)和觀看時(shí)間進(jìn)行程度等級劃分,建立相應(yīng)的數(shù)學(xué)模型。網(wǎng)上娛樂的網(wǎng)絡(luò)行為分為社交、購物、娛樂視頻、游戲、其他五種類型,并且在此類頁面中停留過長時(shí)間。由于時(shí)長較難判斷,所以主要是通過瀏覽條數(shù)來進(jìn)行娛樂行為判斷。然后將代表程度等級的結(jié)果來代替建立相應(yīng)的數(shù)學(xué)模型。
上網(wǎng)時(shí)間是對學(xué)生上網(wǎng)行為的一個(gè)綜合評價(jià)指標(biāo),因?yàn)闀r(shí)間的長短可以反映學(xué)生對于網(wǎng)絡(luò)的使用情況,適當(dāng)?shù)厥褂镁W(wǎng)絡(luò)有利于學(xué)生的學(xué)習(xí)和娛樂,而過度沉迷則不利于生活和學(xué)習(xí)。所以上網(wǎng)時(shí)間的選取一般是分時(shí)段、分時(shí)長來判斷學(xué)生對網(wǎng)絡(luò)的利用情況和分配情況,圖2給出了網(wǎng)絡(luò)行為分類的結(jié)構(gòu)。
實(shí)驗(yàn)中采用了梯度增強(qiáng)決策樹和隨機(jī)森林兩種方法,以便增加判斷結(jié)果的可信度。采用方法程序運(yùn)行時(shí)間如圖5所示,梯度增強(qiáng)決策樹算法花費(fèi)的時(shí)間更少。對于每個(gè)算法,我們使用相同的參數(shù)集進(jìn)行多次實(shí)驗(yàn)。模型的精度和曲線下面積(AUC)是每次迭代的評價(jià)標(biāo)準(zhǔn),精度和模型AUC值越高,質(zhì)量越好。圖6、圖7中水平軸表示算法運(yùn)行的迭代次數(shù),垂直軸表示算法的精度值和AUC。從性能圖來看,隨機(jī)森林(RF)算法的平均精度和平均AUC較高,即使稍高一點(diǎn),梯度增強(qiáng)決策樹(GBDT)的結(jié)果也更穩(wěn)定。根據(jù)算法性能的準(zhǔn)確性、AUC和運(yùn)行時(shí)間綜合考慮,梯度增強(qiáng)決策樹是對學(xué)生網(wǎng)絡(luò)行為分類的較好選擇。
圖2 網(wǎng)絡(luò)行為分類結(jié)構(gòu)圖
為了對比結(jié)果,本文采用梯度增強(qiáng)決策樹和隨機(jī)森林算法兩種方法對數(shù)據(jù)進(jìn)行訓(xùn)練,梯度增強(qiáng)決策樹(GBDT)是集成學(xué)習(xí)boosting的代表方法,隨機(jī)森林(RF)是集成學(xué)習(xí)bagging的代表方法[7-9]。GBDT的主要思路是基于梯度增強(qiáng)和決策樹的,思想是訓(xùn)練多個(gè)弱分類器獲得一個(gè)強(qiáng)分類器,得到更好的分類結(jié)果[10]。利用損失函數(shù)的負(fù)梯度擬合,可以用GBDT求解一些分類問題;隨機(jī)森林[11]是它從原始訓(xùn)練樣本集中隨機(jī)抽取n個(gè)樣本,生成一個(gè)新的訓(xùn)練樣本集,新的訓(xùn)練樣本集用于訓(xùn)練分類和回歸樹(classification and regression tree,CART)。根據(jù)這一策略,我們可以生成M分類和回歸樹,形成一個(gè)隨機(jī)森林。新數(shù)據(jù)的分類結(jié)果取決于每個(gè)弱學(xué)習(xí)者,最后一個(gè)分類是所有弱學(xué)習(xí)者投票最多的分類。
從流量數(shù)據(jù)中我們可以得到,學(xué)生每天產(chǎn)生100萬條日志信息,可以具體定位到每個(gè)用戶的上網(wǎng)行為軌跡,其核心字段有IP地址、終端類型、記錄時(shí)間、行為詳情。我們從中可以總結(jié)出一些學(xué)生上網(wǎng)行為的特點(diǎn)與規(guī)律:
戰(zhàn)爭年代早已遠(yuǎn)去,和平時(shí)期的軍隊(duì)沒有經(jīng)歷過戰(zhàn)場,沒有經(jīng)受過戰(zhàn)火洗禮的軍隊(duì),很難在突然發(fā)生的戰(zhàn)爭中發(fā)揮應(yīng)有的實(shí)力。而全息投影則很好地解決了這個(gè)問題,利用全息投影模擬戰(zhàn)場環(huán)境,為軍事行動(dòng)提供高空間感的仿真環(huán)境支持。這在陸軍方面或許作用不是非常顯著,但是在??哲娭杏脕砟M飛機(jī)飛行,艦隊(duì)行駛,不僅訓(xùn)練了參戰(zhàn)人員的實(shí)際操作能力,還節(jié)省了使用真實(shí)裝備進(jìn)行演練的經(jīng)費(fèi),減少了設(shè)備的損耗。
圖3 訓(xùn)練模型流程
在本文的實(shí)驗(yàn)部分中,我們利用網(wǎng)絡(luò)爬蟲獲取學(xué)生的網(wǎng)絡(luò)流量數(shù)據(jù),并基于這些數(shù)據(jù)訓(xùn)練分類器,其中計(jì)費(fèi)系統(tǒng)每天產(chǎn)生近4萬條登錄日志,包括的核心字段有用戶賬號、用戶名稱、登錄時(shí)間、使用時(shí)長、IP地址、使用流量等。我們希望通過對用戶行為進(jìn)行分析與分類,這些分類器能夠正確地對新樣本進(jìn)行分類,并及時(shí)發(fā)現(xiàn)學(xué)生上網(wǎng)過程中的需要及時(shí)注意的行為。
為了更直觀地理解分類結(jié)果,我們提取了每個(gè)記錄的一些特性,包括登錄時(shí)間、注銷時(shí)間和網(wǎng)絡(luò)流量數(shù)據(jù)。這些特征以三維形式顯示,不同類別的點(diǎn)具有不同的顏色?;尹c(diǎn)代表學(xué)生上網(wǎng)過程中存在壞記錄,需要輔導(dǎo)員和老師特別關(guān)注,黑點(diǎn)代表上網(wǎng)習(xí)慣的好記錄,可以作為學(xué)生上網(wǎng)質(zhì)量的評價(jià)標(biāo)準(zhǔn)。同時(shí),圖4中顯示出學(xué)生上網(wǎng)行為的百分比。
圖4 分類出學(xué)生上網(wǎng)行為的好與壞及百分比
如今的化妝品市場,增速已經(jīng)趨于緩慢,我國化妝品市場正在從增量市場向存量市場轉(zhuǎn)變,化妝品市場已經(jīng)基本飽和,未來市場的增長將主要依賴于消費(fèi)升級。老品牌升級換代進(jìn)軍高端似乎是必然的選擇。
圖5 GBDT與RF算法運(yùn)行時(shí)間比較
圖6 隨機(jī)森林AUC曲線與精度分析
圖7 梯度增強(qiáng)決策樹AUC曲線與精度分析
政策一:6月25日,財(cái)政部、稅務(wù)總局和科技部三部門下發(fā)了《關(guān)于企業(yè)委托境外研究開發(fā)費(fèi)用稅前加計(jì)扣除有關(guān)政策問題的通知》,《通知》對有關(guān)稅收優(yōu)惠政策進(jìn)行了明確。
綜上所述,個(gè)人網(wǎng)絡(luò)流量數(shù)據(jù)是評價(jià)學(xué)生網(wǎng)絡(luò)習(xí)慣的重要指標(biāo)。為了評估學(xué)生的在線習(xí)慣,本文通過對學(xué)生網(wǎng)絡(luò)數(shù)據(jù)中提取的大量網(wǎng)絡(luò)行為數(shù)據(jù)訓(xùn)練分類器,建立數(shù)學(xué)模型。新輸入的數(shù)據(jù)被已經(jīng)訓(xùn)練的分類器分類為正或負(fù)行為(即上網(wǎng)行為良好或者上網(wǎng)行為預(yù)警),最后為便于理解學(xué)生的上網(wǎng)習(xí)慣進(jìn)行可視化數(shù)據(jù)處理,以期從微觀的角度來探索網(wǎng)絡(luò)行為與學(xué)生學(xué)業(yè)之間的關(guān)聯(lián)關(guān)系。
(1)平均上網(wǎng)時(shí)間長,且較為集中。通過IP地址的統(tǒng)計(jì),學(xué)生上網(wǎng)的時(shí)間主要集中在18:00以后以及課間。由于學(xué)生在校期間自由支配時(shí)間比較充裕,幾乎每個(gè)學(xué)生都有手機(jī),并且大部分學(xué)生都配有手提電腦,上網(wǎng)幾乎是學(xué)生們的核心活動(dòng)。
(2)上網(wǎng)形式比較單一,以移動(dòng)接入形式為主。使用移動(dòng)客戶端的上網(wǎng)頻率遠(yuǎn)高于使用PC端。在上網(wǎng)數(shù)據(jù)中,其中通過無線Portal接入人數(shù)最多,達(dá)到5000人次。其中,使用頻率最高的是手機(jī)視頻軟件,其次是社交軟件、網(wǎng)頁訪問、購物軟件、應(yīng)用程序,其中也包含對旅游、新聞、教育資源的訪問。
《基礎(chǔ)教育課程改革綱要(試行)》指出:“大力推進(jìn)多媒體網(wǎng)絡(luò)技術(shù)在教學(xué)過程中的普遍應(yīng)用,促進(jìn)網(wǎng)絡(luò)技術(shù)與學(xué)科課程的整合,逐步實(shí)現(xiàn)教學(xué)內(nèi)容的呈現(xiàn)方式、學(xué)生的學(xué)習(xí)方式、教師的教學(xué)方式和師生互動(dòng)方式的變革,充分發(fā)揮網(wǎng)絡(luò)技術(shù)的優(yōu)勢,為學(xué)生的學(xué)習(xí)和發(fā)展提供豐富多彩的教育環(huán)境和有力的學(xué)習(xí)工具。”有效地運(yùn)用現(xiàn)代網(wǎng)絡(luò)技術(shù),可以使數(shù)學(xué)課堂的教學(xué)形式更加生動(dòng)、形象,同時(shí)在運(yùn)用網(wǎng)絡(luò)技術(shù)的過程中,揭示數(shù)學(xué)知識的形成與發(fā)展,從而使數(shù)學(xué)的教學(xué)收到事半功倍的效果。
(3)上網(wǎng)缺少目的性,以娛樂為主。根據(jù)對網(wǎng)絡(luò)日志的分析,我們發(fā)現(xiàn)學(xué)生在上網(wǎng)的過程中注意力分散,自控力差,并且沒有集中在進(jìn)行學(xué)習(xí)和研究上。其中以視頻類為目的的占25.38%;18.51%為搜索引擎及導(dǎo)航類地址;大約40%的為在線聊天類、網(wǎng)購類、知識學(xué)習(xí)類等,網(wǎng)絡(luò)為學(xué)生生活提供便捷和多種交流方式,大約有20%的學(xué)生基本沒有通過網(wǎng)絡(luò)進(jìn)行知識汲取。
(3)上網(wǎng)辨識度低。大學(xué)生的好奇心比較強(qiáng),他們對新事物充滿新鮮感,在嘗試中損害了自身利益。在樣本中,大部分學(xué)生的上網(wǎng)行為都符合正常人的行為習(xí)慣,但是部分學(xué)生在下課時(shí)間瀏覽過賭博性質(zhì)的網(wǎng)站、黃色網(wǎng)站、借貸網(wǎng)站等,但是不排除是瀏覽器惡意插件導(dǎo)致的,所以通過對比IP及其關(guān)聯(lián)賬號,可以定位這部分學(xué)生個(gè)人信息,及時(shí)反饋給學(xué)工管理處,時(shí)刻觀察學(xué)生的生活情況,并且督促該部分學(xué)生改善上網(wǎng)習(xí)慣。
針對分析結(jié)果,在高校的教育工作者進(jìn)行教育和管理的同時(shí),本文也提出了一些建議:
(1)需要不斷加強(qiáng)對學(xué)生網(wǎng)絡(luò)管理的力度,學(xué)生的自控力普遍較差,學(xué)生沉迷網(wǎng)絡(luò)環(huán)境是不可逆轉(zhuǎn)的未來趨勢,會(huì)對教育質(zhì)量以及學(xué)生的學(xué)業(yè)造成影響。必須高度重視網(wǎng)絡(luò)內(nèi)容管理,營造良好網(wǎng)絡(luò)環(huán)境,通過對學(xué)生網(wǎng)絡(luò)行為分類及預(yù)警,減少學(xué)生不良網(wǎng)絡(luò)行為的發(fā)生。同時(shí),還要重視來自各個(gè)領(lǐng)域的反饋信息,爭取提前進(jìn)行預(yù)先疏導(dǎo),從最大程度上提高大學(xué)生的網(wǎng)絡(luò)免疫能力。
(2)學(xué)校及院系需要定期開展具有吸引力的文體活動(dòng),豐富在校學(xué)生的課余時(shí)間,一方面為學(xué)生提供展示自我的平臺,另一方面對于學(xué)生依賴網(wǎng)絡(luò)有較強(qiáng)的分散效果。既可以使學(xué)生愉悅身心,也可以使校園內(nèi)文化氛圍更加濃厚,杜絕不良網(wǎng)絡(luò)環(huán)境對學(xué)生的影響。
(3)利用網(wǎng)絡(luò)平臺,正面宣傳網(wǎng)絡(luò)用途,多鼓勵(lì)學(xué)生上網(wǎng)學(xué)習(xí),做到勞逸結(jié)合。首先在網(wǎng)上開展豐富多彩網(wǎng)絡(luò)學(xué)習(xí)活動(dòng),如網(wǎng)絡(luò)知識講座、網(wǎng)絡(luò)知識競賽等。引導(dǎo)學(xué)生進(jìn)行有效地網(wǎng)絡(luò)學(xué)習(xí),獲取專業(yè)養(yǎng)料。再次,促進(jìn)網(wǎng)絡(luò)教育與傳統(tǒng)教育相結(jié)合,可以借助班會(huì)或集中教育時(shí)間來宣傳相關(guān)網(wǎng)絡(luò)知識,組建網(wǎng)絡(luò)心理健康教育中心,定期開展系列活動(dòng)。實(shí)行線上+線下的形式,一方面進(jìn)行面對面交流,另一方面有老師在網(wǎng)絡(luò)上進(jìn)行輔導(dǎo),滿足不同學(xué)生的需求。
本文主要以學(xué)生網(wǎng)絡(luò)流量數(shù)據(jù)對學(xué)生上網(wǎng)行為進(jìn)行分類與分析,并給出相應(yīng)的分析結(jié)果和建議。在實(shí)現(xiàn)方法上,我們構(gòu)建了一個(gè)網(wǎng)絡(luò)爬蟲框架獲取學(xué)生上網(wǎng)數(shù)據(jù)集。然后對數(shù)據(jù)集進(jìn)行處理,通過兩種方法梯度提升決策樹和隨機(jī)森林對分類模型進(jìn)行訓(xùn)練。最后,對這些分類模型進(jìn)行比較,使分類結(jié)果可視化,挖掘出學(xué)生的上網(wǎng)習(xí)慣。通過對實(shí)驗(yàn)結(jié)果的分析及可視化便于學(xué)生查看在線記錄,從而對學(xué)生管理提出相應(yīng)的教學(xué)管理對策,該方法可為高效解決類似問題提供一種新的辦法,有利于培養(yǎng)良好的在線習(xí)慣,輔助高校教育教學(xué)管理。