陳秀枝,吳梨梨
(福州英華職業(yè)學(xué)院,福建 福州 350014)
網(wǎng)絡(luò)教育的提法由來已久,但“互聯(lián)網(wǎng)+教育”的模式無論在國內(nèi)還是國外均是新鮮事物?!盎ヂ?lián)網(wǎng)+教育”是將當(dāng)前日新月異的互聯(lián)網(wǎng)科技發(fā)展成果與各類院校的教育教學(xué)進(jìn)行深層次融合,構(gòu)建大數(shù)據(jù)云平臺(tái),為教師及學(xué)習(xí)者提供專門定制的教育教學(xué)服務(wù)。與傳統(tǒng)教育模式相比,“互聯(lián)網(wǎng)+教育”是具有高度自主性的學(xué)習(xí)模式,學(xué)習(xí)完全依賴于學(xué)習(xí)者的學(xué)習(xí)熱情和自我控制能力,這就要求學(xué)習(xí)者本身具備一定的學(xué)習(xí)素質(zhì)和能力。然而目前大部分互聯(lián)網(wǎng)自主學(xué)習(xí)者在學(xué)習(xí)過程中均表現(xiàn)出缺乏自主性、自我控制能力及自主學(xué)習(xí)能力的現(xiàn)象。通過在互聯(lián)網(wǎng)教育中引入監(jiān)控機(jī)制并建立自主學(xué)習(xí)行為監(jiān)控系統(tǒng),采集學(xué)習(xí)者自主學(xué)習(xí)數(shù)據(jù)進(jìn)行挖掘與分析,研究其學(xué)習(xí)方式和習(xí)慣,提供基于大數(shù)據(jù)分析的互聯(lián)網(wǎng)環(huán)境下自主學(xué)習(xí)建議,可以引導(dǎo)學(xué)習(xí)者擺脫被動(dòng)學(xué)習(xí),真正將自主學(xué)習(xí)付諸實(shí)際行動(dòng),做學(xué)習(xí)的主人。因此,研究并建立基于大數(shù)據(jù)的自主學(xué)習(xí)行為監(jiān)控系統(tǒng),具有非常重要的實(shí)踐意義。
與傳統(tǒng)的課堂教學(xué)相比,互聯(lián)網(wǎng)環(huán)境下的自主學(xué)習(xí)行為具有以下主要特點(diǎn):(1)學(xué)習(xí)環(huán)境虛擬化。隨著無線互聯(lián)網(wǎng)技術(shù)的飛躍式發(fā)展,互聯(lián)網(wǎng)自主學(xué)習(xí)者脫離了傳統(tǒng)的教室封閉環(huán)境限制,可以在家庭、網(wǎng)吧、商店、公園、街頭等任何擁有無線網(wǎng)絡(luò)信號(hào)的地方進(jìn)行學(xué)習(xí),其學(xué)習(xí)環(huán)境是完全開放式且虛擬化的。(2)學(xué)習(xí)過程自主化。與傳統(tǒng)的被動(dòng)灌輸式教育不同,互聯(lián)網(wǎng)自主學(xué)習(xí)者在選擇學(xué)習(xí)方向和內(nèi)容時(shí)完全憑借個(gè)人的興趣愛好,在學(xué)習(xí)過程中也會(huì)因個(gè)人個(gè)性或外部環(huán)境影響等因素隨時(shí)中斷或繼續(xù),學(xué)習(xí)過程實(shí)現(xiàn)完全自主化。(3)學(xué)習(xí)技能深度化?;ヂ?lián)網(wǎng)學(xué)習(xí)資源浩如煙海,學(xué)習(xí)者要找到適合的學(xué)習(xí)資源,需要具備一定的互聯(lián)網(wǎng)技能,甚至可能需要進(jìn)行專門的學(xué)習(xí)技能培訓(xùn)。與傳統(tǒng)的課堂學(xué)習(xí)相比,互聯(lián)網(wǎng)學(xué)習(xí)越來越呈現(xiàn)出學(xué)習(xí)技能深度化的特征。綜合上述分析,自主學(xué)習(xí)行為監(jiān)控系統(tǒng)應(yīng)根據(jù)互聯(lián)網(wǎng)學(xué)習(xí)的特征實(shí)現(xiàn)以下基本功能:
互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的首要任務(wù)是記錄學(xué)習(xí)者的學(xué)習(xí)情況。受學(xué)習(xí)者性格及其周圍環(huán)境的影響,學(xué)習(xí)者自主學(xué)習(xí)的能力呈現(xiàn)出參差不齊、兩極分化的現(xiàn)象。而互聯(lián)網(wǎng)自主學(xué)習(xí)者的學(xué)習(xí)環(huán)境更加開放且多變,對(duì)其自主學(xué)習(xí)效果的影響因素呈幾何級(jí)數(shù)增加,如果無法實(shí)現(xiàn)學(xué)習(xí)數(shù)據(jù)及軌跡的記錄存儲(chǔ),則一切后續(xù)的分析、改進(jìn)、提高都成為了空談。所以,自主學(xué)習(xí)行為監(jiān)控系統(tǒng)首先應(yīng)能實(shí)現(xiàn)在各種不同的環(huán)境及外界因素影響下完整收集記錄學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)、跟蹤其學(xué)習(xí)軌跡等功能,為進(jìn)一步的個(gè)性學(xué)習(xí)統(tǒng)計(jì)分析提供基礎(chǔ)數(shù)據(jù)支持。
自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的最主要作用就是反饋學(xué)習(xí)效果。互聯(lián)網(wǎng)自主學(xué)習(xí)是完全開放性且自主化的學(xué)習(xí),學(xué)習(xí)者擁有選擇是否使用自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的權(quán)利,而是否使用的決定性因素就在于系統(tǒng)能夠在多大程度上反饋學(xué)習(xí)者的學(xué)習(xí)效果。因此,自主學(xué)習(xí)行為監(jiān)控系統(tǒng)在實(shí)現(xiàn)收集并記錄如點(diǎn)擊鼠標(biāo)、觀看視頻、瀏覽網(wǎng)頁、提問發(fā)帖等學(xué)習(xí)者的學(xué)習(xí)行為軌跡后,應(yīng)能根據(jù)相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析及挖掘,借此了解學(xué)習(xí)者個(gè)人的行為習(xí)慣,判斷其學(xué)習(xí)的規(guī)律,確定哪些知識(shí)技能是學(xué)習(xí)者還沒有掌握的、比較不易理解的、需要反復(fù)加深印象的,并將上述這些信息綜合整理后反饋給學(xué)習(xí)者,向其智能推薦可能所需的相關(guān)學(xué)習(xí)資源。與課堂教學(xué)的傳統(tǒng)模式相比,學(xué)習(xí)者將能以符合自己個(gè)性的學(xué)習(xí)模式和學(xué)習(xí)途徑來進(jìn)行學(xué)習(xí),從而得到有別于以往其他任何學(xué)習(xí)模式的學(xué)習(xí)體驗(yàn)。
目前的互聯(lián)網(wǎng)教育服務(wù)主要是在知識(shí)結(jié)構(gòu)、課程設(shè)計(jì)、學(xué)習(xí)資源等方面下功夫,忽視了對(duì)學(xué)習(xí)者的學(xué)習(xí)行為的采集分析,因而在自主學(xué)習(xí)過程中普遍存在著教師角色介入不足、教學(xué)課程缺少針對(duì)性、學(xué)習(xí)者和授課人之間缺乏交流、學(xué)習(xí)者得不到被人尊重的感覺等等問題,這對(duì)自主學(xué)習(xí)者的學(xué)習(xí)熱情產(chǎn)生了一定程度的影響,也是目前互聯(lián)網(wǎng)自主學(xué)習(xí)效果不佳的一個(gè)重要原因?;ヂ?lián)網(wǎng)自主學(xué)習(xí)不是一個(gè)人孤獨(dú)地反復(fù)背誦記憶的過程,設(shè)計(jì)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)應(yīng)充分考慮到學(xué)習(xí)者的關(guān)注重點(diǎn)和情感因素,應(yīng)完善授課人和學(xué)習(xí)者之間、學(xué)習(xí)者相互之間建立起交互聯(lián)系的溝通機(jī)制。學(xué)習(xí)者通過在開放式的網(wǎng)絡(luò)教育平臺(tái)自由發(fā)言,可以減少課堂教學(xué)時(shí)學(xué)生普遍存在的畏懼心理,改變傳統(tǒng)教育模式中被動(dòng)接受知識(shí)的限制,甚至授課人和學(xué)習(xí)者都可以在相互學(xué)習(xí)的氛圍中共同進(jìn)步。這樣一來,就激發(fā)了學(xué)習(xí)者的學(xué)習(xí)熱情,使其更有動(dòng)力去了解和掌握越來越深度化的互聯(lián)網(wǎng)學(xué)習(xí)技能,從而大幅提高自主學(xué)習(xí)效率。
由于互聯(lián)網(wǎng)學(xué)習(xí)環(huán)境的虛擬性及開放多變,互聯(lián)網(wǎng)自主學(xué)習(xí)行為的數(shù)據(jù)采集有一定的難度?;ヂ?lián)網(wǎng)自主學(xué)習(xí)行為數(shù)據(jù)采集的關(guān)鍵在于確定互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的數(shù)據(jù)采集內(nèi)容,即正確適當(dāng)?shù)囟x互聯(lián)網(wǎng)自主學(xué)習(xí)行為的數(shù)據(jù)模型。
互聯(lián)網(wǎng)自主學(xué)習(xí)行為數(shù)據(jù)模型的定義難點(diǎn)是:模型過于籠統(tǒng),則可能丟失許多與學(xué)習(xí)者互聯(lián)網(wǎng)學(xué)習(xí)相關(guān)的行為數(shù)據(jù),缺少進(jìn)一步分析的基礎(chǔ)支持;模型過于細(xì)致,則會(huì)導(dǎo)致記錄的數(shù)據(jù)量過于龐大,分析計(jì)算將消耗極大的資源,嚴(yán)重影響行為監(jiān)控系統(tǒng)的實(shí)時(shí)運(yùn)行效率。
綜合以上因素分析,定義互聯(lián)網(wǎng)自主學(xué)習(xí)行為數(shù)據(jù)模型應(yīng)抓住問題的本質(zhì),即自主學(xué)習(xí)行為的主體?;ヂ?lián)網(wǎng)自主學(xué)習(xí)行為的主體無疑是學(xué)習(xí)者本身,那么學(xué)習(xí)者所進(jìn)行的行為活動(dòng)、行為客體、行為環(huán)境就是需要記錄并分析的數(shù)據(jù)要素。因此,本文將互聯(lián)網(wǎng)自主學(xué)習(xí)行為數(shù)據(jù)模型定義為行為主體(W)、行為活動(dòng)(D)、行為客體(T)。行為主體(W)即數(shù)據(jù)模型中的用戶身份,是由字母及數(shù)字組成的互聯(lián)網(wǎng)自主學(xué)習(xí)者在高校教育云平臺(tái)上的唯一賬號(hào),用以辨認(rèn)用戶的身份,確定數(shù)據(jù)記錄的歸屬。行為活動(dòng)(D)則是由學(xué)習(xí)者訪問高?;ヂ?lián)網(wǎng)教育云平臺(tái)期間所做的所有操作及操作所用的時(shí)間共同組成,是數(shù)據(jù)記錄的主要內(nèi)容,也是數(shù)據(jù)模型的核心要素。行為客體(T)也就是學(xué)習(xí)者自主學(xué)習(xí)時(shí)的對(duì)象,表明了學(xué)習(xí)者學(xué)習(xí)的目的,也是分析其喜好興趣的最主要因素。操作對(duì)象需要在模型中進(jìn)一步細(xì)化定義其屬性,其中需定義的對(duì)象屬性主要包括操作對(duì)象類型、名稱及標(biāo)識(shí)等。
互聯(lián)網(wǎng)自主學(xué)習(xí)行為數(shù)據(jù)模型正確定義之后,下一步需要確定自主學(xué)習(xí)行為監(jiān)控系統(tǒng)數(shù)據(jù)采集的具體方式。根據(jù)互聯(lián)網(wǎng)自主學(xué)習(xí)行為的主要特征,本研究采用服務(wù)器Web日志加上后臺(tái)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)采集。通過服務(wù)器Web日志可以清楚地得知用戶在何時(shí)、何地(IP地址信息),在何種環(huán)境下(何種操作系統(tǒng)、何種瀏覽器等信息)訪問了什么網(wǎng)站,是否訪問成功等諸多與學(xué)習(xí)者自主學(xué)習(xí)緊密相關(guān)的信息,因此,通過服務(wù)器Web日志來采集自主學(xué)習(xí)行為數(shù)據(jù)是較為便捷且容易實(shí)現(xiàn)的技術(shù)手段。但Web日志無法確定用戶身份,且無法實(shí)時(shí)獲取用戶在網(wǎng)站所進(jìn)行的操作和相關(guān)信息。為解決這些問題,需要引入后臺(tái)數(shù)據(jù)庫作為Web日志的有效支撐。后臺(tái)數(shù)據(jù)庫負(fù)責(zé)存儲(chǔ)網(wǎng)站管理者及訪問者注冊(cè)、瀏覽、點(diǎn)擊、發(fā)帖、評(píng)論等所有操作數(shù)據(jù)和信息,并建立相關(guān)數(shù)據(jù)表,方便之后的信息檢索。引入后臺(tái)數(shù)據(jù)庫后,可有效彌補(bǔ)服務(wù)器Web日志的不足,有效采集互聯(lián)網(wǎng)自主學(xué)習(xí)數(shù)據(jù)。
確立系統(tǒng)模型是組建自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的第一步。鑒于自主學(xué)習(xí)行為監(jiān)控系統(tǒng)的主要作用,本研究將模型分為三大模塊:一是數(shù)據(jù)收集模塊,通過服務(wù)器Web日志及后臺(tái)數(shù)據(jù)庫收集并存儲(chǔ)自主學(xué)習(xí)行為相關(guān)數(shù)據(jù)并建立自主學(xué)習(xí)行為數(shù)據(jù)庫。二是統(tǒng)計(jì)分析模塊,負(fù)責(zé)提取分析自主學(xué)習(xí)行為數(shù)據(jù)庫中的數(shù)據(jù),并匹配相關(guān)算法開展數(shù)據(jù)挖掘,確定學(xué)習(xí)者互聯(lián)網(wǎng)自主學(xué)習(xí)的行為模式、學(xué)習(xí)習(xí)慣及興趣偏好。三是反饋展示模塊,向?qū)W習(xí)者提供符合其行為模式、學(xué)習(xí)習(xí)慣及興趣偏好的個(gè)性化學(xué)習(xí)建議,并通過圖形化界面向?qū)W習(xí)者展示。
圖1 互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)模型
1.多層分布式.NET技術(shù)。本研究采用微軟推出的.NET互聯(lián)網(wǎng)開發(fā)平臺(tái)進(jìn)行網(wǎng)絡(luò)應(yīng)用程序的開發(fā)。采用分布式多層技術(shù),通過多臺(tái)互相連接的計(jì)算機(jī)分別執(zhí)行不同的功能來解決異構(gòu)數(shù)據(jù)庫、不同網(wǎng)絡(luò)語言及差異化平臺(tái)協(xié)同問題。NET平臺(tái)基本構(gòu)架為三層:數(shù)據(jù)服務(wù)層、應(yīng)用服務(wù)層、表示層。用戶只要使用IE瀏覽器,就可以在任意地點(diǎn)存取、執(zhí)行系統(tǒng),極大地方便了自主行為監(jiān)控系統(tǒng)的應(yīng)用。
2.數(shù)據(jù)庫技術(shù)。根據(jù)自主學(xué)習(xí)系統(tǒng)龐大的數(shù)據(jù)使用需求,本研究采用SQLServer2012數(shù)據(jù)庫管理系統(tǒng)。SQL Server2012可提供數(shù)百TB容量的全面端到端的數(shù)據(jù)處理方案,且完全支持云平臺(tái),同時(shí)還減少了數(shù)據(jù)系統(tǒng)的多平臺(tái)管理、分析的復(fù)雜程度。在.NET平臺(tái)上,調(diào)用SQLServer2012數(shù)據(jù)庫通過ADO.NET實(shí)現(xiàn)。
3.Web數(shù)據(jù)挖掘技術(shù)。自主學(xué)習(xí)行為監(jiān)控系統(tǒng)采集的數(shù)據(jù)包含了系統(tǒng)數(shù)據(jù)和學(xué)習(xí)者自主學(xué)習(xí)行為相關(guān)數(shù)據(jù),直接從數(shù)據(jù)的層面上看,無法得到學(xué)習(xí)者的學(xué)習(xí)習(xí)慣、行為模式及興趣偏好,需要通過Web數(shù)據(jù)挖掘來分析歸納。學(xué)習(xí)者使用互聯(lián)網(wǎng)自主學(xué)習(xí)平臺(tái)賬號(hào)登錄系統(tǒng)后,自主學(xué)習(xí)的行為數(shù)據(jù)經(jīng)過預(yù)處理后形成信息矩陣。在本研究所構(gòu)想的環(huán)境中,自主學(xué)習(xí)者人數(shù)眾多,但每次訪問的資源頁面相對(duì)不多。因此,采用稀疏矩陣的三元組表示法進(jìn)行系統(tǒng)數(shù)據(jù)存儲(chǔ)。其數(shù)據(jù)挖掘的具體方式如下:
(1)檢索超出系統(tǒng)設(shè)定訪問頻率的頻繁訪問頁面及訪問時(shí)間;
(2)通過訪問頁面的頻率檢索出頻繁訪問的客戶群體及相關(guān)頁面集;
(3)利用遍歷矩陣,配合連接強(qiáng)度閾值,獲得訪問頁面的常用路徑;
(4)用聚類分析方法進(jìn)行數(shù)據(jù)挖掘,得到用戶的學(xué)習(xí)習(xí)慣及興趣偏好。
本研究采用K均值聚類算法。其基本算法分為四步:
①聚類中心初始化。選擇K個(gè)樣本點(diǎn)作為初始化的聚類中心。記為Z1(1),Z2(2),…,ZK(1)。
②聚類。按最大近似度原則,將每一個(gè)樣本數(shù)據(jù)分配給K個(gè)聚類中心,成為K大類。在第m次循環(huán)時(shí),若有‖X-Zj(m)‖<‖X-Zi(m)‖,i,=1,2,∧,K,i≠j則有x∈fj(m)。fj(m)為第m次循環(huán)時(shí),第j個(gè)聚類中心Zj所代表的子集合。
④若Zi(m)=Zi(m+1),i=1,2,∧K,則算法收斂,否則轉(zhuǎn)到②)繼續(xù)循環(huán)。
完成計(jì)算分析后,將結(jié)果數(shù)據(jù)存入數(shù)據(jù)庫。
4.OWC圖表可視化技術(shù)。本研究采用微軟公司推出的Office Web Component(OWC)組件進(jìn)行圖形化反饋。使用OWC圖表組件,可以充分應(yīng)用IE提供的大量交互功能,可以使互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)呈現(xiàn)圖表化的反饋界面,數(shù)據(jù)更加清晰簡(jiǎn)潔,用戶體驗(yàn)較好。
系統(tǒng)搭建完成后,首先在福州英華職業(yè)學(xué)院內(nèi)進(jìn)行試運(yùn)行。試運(yùn)行主要測(cè)試了系統(tǒng)運(yùn)行基本狀況、網(wǎng)絡(luò)訪問效率、自主學(xué)習(xí)行為統(tǒng)計(jì)及反饋效果等基本功能,對(duì)發(fā)現(xiàn)的系統(tǒng)界面不夠友好、占用網(wǎng)絡(luò)資源較高、反饋圖表不夠直觀等問題提出改進(jìn)建議,為進(jìn)一步完善系統(tǒng)奠定基礎(chǔ)。本系統(tǒng)在試運(yùn)行階段即在福州英華職業(yè)學(xué)院師生中取得了廣泛的好評(píng)和較好的使用效果,今后預(yù)計(jì)在福建省內(nèi)各兄弟院校擴(kuò)大試運(yùn)行范圍,征求改進(jìn)意見,以期建成真正適應(yīng)當(dāng)前廣大高校學(xué)生及自主學(xué)習(xí)者需求的互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng)。
本文通過研究并建立基于大數(shù)據(jù)的互聯(lián)網(wǎng)自主學(xué)習(xí)行為監(jiān)控系統(tǒng),實(shí)現(xiàn)對(duì)自主學(xué)習(xí)數(shù)據(jù)的采集和挖掘與分析,以期提供基于大數(shù)據(jù)分析的互聯(lián)網(wǎng)環(huán)境下自主學(xué)習(xí)建議,引導(dǎo)學(xué)習(xí)者擺脫被動(dòng)學(xué)習(xí),真正將自主學(xué)習(xí)付諸實(shí)際行動(dòng),做學(xué)習(xí)的主人。通過實(shí)踐表明,研究并建立該系統(tǒng),對(duì)于改善學(xué)習(xí)者學(xué)習(xí)積極性,提高自主學(xué)習(xí)效率具有非常重要的實(shí)踐意義。