魏 慶
(河南財(cái)經(jīng)政法大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,鄭州 450002)
國(guó)外,盡管E-learning概念的提出已有十年,但真正“紅火”起來(lái)只是近五年的事。據(jù)IDC統(tǒng)計(jì),自1998年以來(lái),美國(guó)E-learning市場(chǎng)的年增長(zhǎng)率是83%。是什么促使E-learning市場(chǎng)在短短幾年內(nèi)有了如此之快的增長(zhǎng)?其實(shí),這是來(lái)自時(shí)代的壓力。知識(shí)經(jīng)濟(jì)時(shí)代,恰恰是知識(shí)和技能極度短缺的時(shí)代,因?yàn)樗鼈兊陌胨テ谠絹?lái)越短。員工50%的知識(shí)和技能會(huì)在3到5年內(nèi)過(guò)期,在IT領(lǐng)域這個(gè)半衰期更短。時(shí)代的特征決定了人們必須改變觀念,“終生學(xué)習(xí)”不再是口號(hào)。我們的上一輩,也就是我們的父母,他們?cè)谥袑W(xué)或大學(xué)所學(xué)到的技能足以使他們?cè)谝簧墓ぷ髦腥玺~(yú)得水。而現(xiàn)在的一代則沒(méi)有這樣的幸運(yùn)。知識(shí)經(jīng)濟(jì)時(shí)代的每一個(gè)人除了通過(guò)不斷學(xué)習(xí)以獲得新的技能,力求跟上變化,其他別無(wú)選擇。
有人將E-learning界定為用因特網(wǎng)技術(shù)來(lái)實(shí)施一系列的學(xué)習(xí)解決方案,用以傳播知識(shí)、提高效率。按照美國(guó)培訓(xùn)和發(fā)展協(xié)會(huì)(ASTD)的定義,E-learning是指由網(wǎng)絡(luò)電子技術(shù)支撐或主導(dǎo)實(shí)施的教學(xué)內(nèi)容或?qū)W習(xí)體驗(yàn),E-learning必須具備以下特征:
1)基于Internet/Intranet,這是E-learning最主要的特征,正是有這樣的技術(shù)背景,才極大方便了資料的即時(shí)更新、數(shù)據(jù)的分發(fā)和共享、學(xué)員之間的即時(shí)交流。
2)運(yùn)用標(biāo)準(zhǔn)的網(wǎng)絡(luò)技術(shù),通過(guò)計(jì)算機(jī)把知識(shí)傳輸給最終用戶。這里的關(guān)鍵在于運(yùn)用標(biāo)準(zhǔn)的網(wǎng)絡(luò)技術(shù),如TCP/IP協(xié)議,網(wǎng)頁(yè)瀏覽技術(shù)等組成的平臺(tái)。
3)不局限于信息和技能的傳授,其學(xué)習(xí)方式、內(nèi)容及結(jié)果早已超越了傳統(tǒng)學(xué)習(xí)或培訓(xùn)所涵蓋的外延,E-learning是學(xué)習(xí)理念的革命。
這里要特別說(shuō)明的是,E-learning與利用光盤的學(xué)習(xí)方式不同。用光盤進(jìn)行單機(jī)學(xué)習(xí)不乏優(yōu)點(diǎn),如豐富的視頻效果和動(dòng)畫(huà),不受傳輸帶寬的影響,但它缺乏網(wǎng)絡(luò)特性,無(wú)法做到即時(shí)更新和共享學(xué)習(xí),因此,它不是真正意義上的E-learning。
現(xiàn)在已有的E-learning服務(wù)大致可以分為四種:在線公告、在線培訓(xùn)、在線知識(shí)分享和在線指導(dǎo)。在線公告即在第一時(shí)間內(nèi)通過(guò)網(wǎng)絡(luò)發(fā)布重要信息;在線培訓(xùn)是通過(guò)網(wǎng)絡(luò)向員工傳播技能的一種有效方式,培訓(xùn)師可籍此了解培訓(xùn)效果;在線知識(shí)分享和在線指導(dǎo)是培訓(xùn)雙方在網(wǎng)上開(kāi)展交流、互動(dòng)。
相比簡(jiǎn)單的費(fèi)用節(jié)省之外還有其他一些好處,這就是E-learning所具有的靈活、快速、便捷的特點(diǎn),而且特別易于管理。
E-learning可以提供同步或不同步的培訓(xùn)模式。不同步的溝通技術(shù)包括討論、e-mail和共享數(shù)據(jù)庫(kù)等。這些技術(shù)能讓身處不同地區(qū),甚至是世界各地的學(xué)員們分享豐富的學(xué)習(xí)資源,以及在課程和作業(yè)上進(jìn)行合作,而無(wú)須考慮時(shí)間、地點(diǎn)的局限,因而我們經(jīng)常稱E-learning為“隨時(shí)、隨地的學(xué)習(xí)”。不同步的溝通亦為教員提供了方便。教員不一定要立刻提供幫助,而是可以離線進(jìn)行。課程的評(píng)估、布置作業(yè)、安排測(cè)驗(yàn)亦可以如此。
若采用同步的、實(shí)時(shí)的模式,公司的所有員工可以在規(guī)定的時(shí)候同時(shí)進(jìn)行交流,卻無(wú)需離開(kāi)辦公室或家。同步的合作是由教員作為主導(dǎo)者,學(xué)員們?cè)谔摂M的環(huán)境中與教員交流,及互相討論。教員通過(guò)交互式的在線學(xué)習(xí)及時(shí)、有針對(duì)性地指導(dǎo)學(xué)員。E-learning軟件可以不斷更新,使企業(yè)有持續(xù)不斷的最新鮮的培訓(xùn)內(nèi)容,給學(xué)員及時(shí)的資訊。軟件包可以進(jìn)行調(diào)整以適應(yīng)不同的用戶。因此,用戶可以為自己定制所需的學(xué)習(xí)素材,掌控完整的學(xué)習(xí)過(guò)程,以達(dá)到最好的學(xué)習(xí)效果。一旦需要更新,立刻所有人都可以得到最新的培訓(xùn)。
研究表明E-learning可以使人們學(xué)習(xí)效率提高25%-40%,正是從“要我學(xué)”到“我要學(xué)”的轉(zhuǎn)變激發(fā)了人們的學(xué)習(xí)興趣,從而提升了效率。
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。這個(gè)定義包括好幾層含義:數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識(shí);發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問(wèn)題。
何為知識(shí)?從廣義上理解,數(shù)據(jù)、信息也是知識(shí)的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識(shí)。人們把數(shù)據(jù)看作是形成知識(shí)的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識(shí)可以被用于信息管理,查詢優(yōu)化,決策支持和過(guò)程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的簡(jiǎn)單查詢,提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫(kù)技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計(jì)、可視化技術(shù)、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點(diǎn)。
數(shù)據(jù)挖掘在E-learning中的具體應(yīng)用體現(xiàn)在以下三個(gè)方面: E-learning特征的數(shù)據(jù)挖掘和E-learning教學(xué)設(shè)計(jì)的數(shù)據(jù)挖掘,E-learning在線分析處理的數(shù)據(jù)挖掘。
1)E-learning特征的數(shù)據(jù)挖掘
將數(shù)字化內(nèi)容與學(xué)科課程相整合,是達(dá)到E-learning目標(biāo)的具體途徑。E-learning數(shù)字化特征使信息的存儲(chǔ)、加工、重放、復(fù)制過(guò)程變得簡(jiǎn)單可靠,標(biāo)準(zhǔn)易于統(tǒng)一,這使數(shù)據(jù)挖掘用于E-learning成為可能。E-learning多媒化特征是以計(jì)算機(jī)多媒體技術(shù)為依托,使信息媒體設(shè)備一體化,信息表征多元化,真實(shí)現(xiàn)象慮擬化,建立結(jié)構(gòu)化、動(dòng)態(tài)化、形象化的E-learning教學(xué)內(nèi)容。這此是數(shù)據(jù)挖掘應(yīng)用于E-learning的前提。E-learning網(wǎng)絡(luò)化特征突破時(shí)空限制、實(shí)現(xiàn)資源共享、多向互動(dòng)和多邊合作。
2)E-learning教學(xué)模式的數(shù)據(jù)挖掘
E-learning的教學(xué)模式主要是研究型學(xué)習(xí)模式、案例研習(xí)模式、發(fā)現(xiàn)式學(xué)習(xí)模式、資源型學(xué)習(xí)模式、協(xié)作型學(xué)習(xí)模式和虛擬教學(xué)模式。E-learning的資源學(xué)習(xí)系統(tǒng)要求能夠提供資源答理下具,為教師組織、編輯、管理資源提供幫助,為學(xué)生利用資源進(jìn)行學(xué)習(xí)提供方便,允許教師根據(jù)教學(xué)的需要,隨時(shí)增減資源,根據(jù)不同的教學(xué)內(nèi)容和學(xué)習(xí)者特征進(jìn)行教學(xué)設(shè)計(jì)。基于數(shù)據(jù)挖掘的e-Learning資源型學(xué)習(xí)系統(tǒng)由教師或?qū)W習(xí)者擔(dān)任目標(biāo)樣本,并進(jìn)行系統(tǒng)設(shè)置,提取目標(biāo)的特征信息,根據(jù)目標(biāo)特征自動(dòng)在網(wǎng)絡(luò)上搜集資料。
3)數(shù)據(jù)挖掘和E-learning在線分析處理
一個(gè)經(jīng)常問(wèn)的問(wèn)題是,數(shù)據(jù)挖掘和E-learning在線分析處理到底有何不同。下面將會(huì)解釋,他們是完全不同的工具,基于的技術(shù)也大相徑庭。E-learning在線分析處理是決策支持領(lǐng)域的一部分。傳統(tǒng)的查詢和報(bào)表工具是告訴你數(shù)據(jù)庫(kù)中都有什么(what happened),E-learning在線分析處理則更進(jìn)一步告訴你下一步會(huì)怎么樣(What next)、和如果我采取這樣的措施又會(huì)怎么樣(What if)。用戶首先建立一個(gè)假設(shè),然后用E-learning在線分析處理檢索數(shù)據(jù)庫(kù)來(lái)驗(yàn)證這個(gè)假設(shè)是否正確。
數(shù)據(jù)挖掘通過(guò)預(yù)測(cè)未來(lái)趨勢(shì)及行為,做出前攝的、基于知識(shí)的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的、有意義的知識(shí),主要有以下五類功能。
1)自動(dòng)預(yù)測(cè)趨勢(shì)和行為
數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫(kù)中尋找預(yù)測(cè)性信息,以往需要進(jìn)行大量手工分析的問(wèn)題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個(gè)典型的例子是市場(chǎng)預(yù)測(cè)問(wèn)題,數(shù)據(jù)挖掘使用過(guò)去有關(guān)促銷的數(shù)據(jù)來(lái)尋找未來(lái)投資中回報(bào)最大的用戶,其它可預(yù)測(cè)的問(wèn)題包括預(yù)報(bào)破產(chǎn)以及認(rèn)定對(duì)指定事件最可能作出反應(yīng)的群體。
2)關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。
3)聚類
數(shù)據(jù)庫(kù)中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點(diǎn)是,在劃分對(duì)象時(shí)不僅考慮對(duì)象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。
4)概念描述
概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征,后者描述不同類對(duì)象之間的區(qū)別。生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多,如決策樹(shù)方法、遺傳算法等。
5)偏差檢測(cè)
數(shù)據(jù)庫(kù)中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫(kù)中檢測(cè)這些偏差很有意義。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等。偏差檢測(cè)的基本方法是,尋找觀測(cè)結(jié)果與參照值之間有意義的差別。
E-learning帶來(lái)信息量的急劇增長(zhǎng),對(duì)信息提取提出更高要求,很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找教育決策的依據(jù)。因此有必要借助數(shù)據(jù)挖掘?qū)-learning的應(yīng)用進(jìn)行挖掘,發(fā)現(xiàn)其中隱藏的規(guī)律,為信息技術(shù)與課程整合提供依據(jù)。
[1] 王銳,馬德濤,陳晨. 數(shù)據(jù)挖掘技術(shù)及其應(yīng)用現(xiàn)狀探析[J].電腦應(yīng)用技術(shù), 2007,(02):147-149.
[2] 李丹丹. 數(shù)據(jù)挖掘技術(shù)及其發(fā)展趨勢(shì)[J]. 電腦應(yīng)用技術(shù),2007,(02):177-179.
[3] 武森,俞曉莉,倪宇,王瑞峰.數(shù)據(jù)挖掘中的聚類技術(shù)在學(xué)生成績(jī)分析中的應(yīng)用[J].中國(guó)管理信息化,2009,(15):104-108.
[4] 黃科軍,王靜萍. 淺談數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].益陽(yáng)職業(yè)技術(shù)學(xué)院學(xué)報(bào), 2007,(02):163-165.