摘 要:針對高職教育發(fā)展的現(xiàn)狀和高職學(xué)生在課程選擇等方面存在的問題,介紹了高職教育教學(xué)研究中引入數(shù)據(jù)挖掘技術(shù)的必要性,并提出了如何有效利用數(shù)據(jù)挖掘方法和商業(yè)智能工具對高職學(xué)生的學(xué)習(xí)過程進(jìn)行個性化分析的研究思路,在此基礎(chǔ)上,給出了具有數(shù)據(jù)集成、數(shù)據(jù)建模、數(shù)據(jù)分析與展現(xiàn)功能的高職學(xué)生個性化學(xué)習(xí)分析系統(tǒng)的整體框架。
關(guān)鍵詞:高職教育;個性化學(xué)習(xí);數(shù)據(jù)挖掘;商業(yè)智能
中圖分類號:TP311.13
作為我國高等教育一支重要生力軍——高等職業(yè)教育近幾年來的發(fā)展可謂迅猛,無論是學(xué)校數(shù)還是學(xué)生人數(shù),高職??频囊?guī)模已是我國高等教育的半壁江山。高職教育對人才的培養(yǎng)目標(biāo)是為國家和地方經(jīng)濟(jì)的發(fā)展輸送適應(yīng)生產(chǎn)、建設(shè)服務(wù)等一線急需的應(yīng)用型高素質(zhì)人才,《國務(wù)院關(guān)于大力發(fā)展職業(yè)教育的決定》中就提出了“堅(jiān)持以就業(yè)為導(dǎo)向,深化職業(yè)教育教學(xué)改革”,要求加強(qiáng)職業(yè)院校對學(xué)生實(shí)踐能力和職業(yè)技能的培養(yǎng)。
1 現(xiàn)狀
目前,高職學(xué)生在學(xué)校完成系統(tǒng)的課程學(xué)習(xí)依然是高職教育教學(xué)的主要方式,在此過程中,由于學(xué)生個體特性、就業(yè)意向、專業(yè)方向等各種因素的影響,獲取的知識無論從方式方法、內(nèi)容結(jié)構(gòu),還是真正掌握的程度來說都因人而異,而這其中有相當(dāng)大的部分是學(xué)生主動性選擇的結(jié)果;此外,在高職教育教學(xué)改革的嘗試中,大類招生、拓展專業(yè)等多項(xiàng)措施在很多職業(yè)院校中已然試行,這就給予學(xué)生更多的自主權(quán)和選擇的機(jī)會。
然而,在自主選擇的過程中,由于沒有一個可參照的、適合自己的挑選標(biāo)準(zhǔn),高職學(xué)生進(jìn)行各項(xiàng)選擇時在很大程度上有著“扎堆隨大流”、“哪個課能混好過”的心理,這就導(dǎo)致主動選擇的課程,其學(xué)習(xí)過程并不順暢、學(xué)習(xí)效果也不理想,沒有提升自身知識結(jié)構(gòu)的質(zhì)量。這種高職教育中教與學(xué)環(huán)節(jié)的脫節(jié)會對高職學(xué)生的能力培養(yǎng)產(chǎn)生有著不可忽視的影響。
2 研究思路
隨著教育信息化的深入發(fā)展,先進(jìn)的信息技術(shù)手段在教育教學(xué)的方方面面都得以有效利用,這也為學(xué)生綜合能力培養(yǎng)的探索與嘗試提供了新的途徑,數(shù)據(jù)挖掘技術(shù)就是其中很重要的一種。數(shù)據(jù)挖掘指的是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。在此過程中,數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的,而從中發(fā)現(xiàn)的是用戶所感興趣的知識內(nèi)容,這些知識應(yīng)該是可以接受和理解、并且能加以進(jìn)一步運(yùn)用的。
數(shù)據(jù)挖掘技術(shù)之所以在教育行業(yè)有更為廣泛、實(shí)際的應(yīng)用,這是由于各個學(xué)校都會有自己的一整套數(shù)據(jù)庫系統(tǒng),用于記錄學(xué)生的學(xué)籍信息、課程教學(xué)過程等歷史數(shù)據(jù),這樣,就可以嘗試運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)和智能分析工具,通過對高職教育研究和教學(xué)過程中積累的海量數(shù)據(jù)進(jìn)行采集分類、挖掘和分析,從多角度、多層次出發(fā),構(gòu)建識別個體特點(diǎn)、知識構(gòu)成和獲取方式等要素之間關(guān)聯(lián)模式的數(shù)據(jù)模型。數(shù)據(jù)挖掘是一門交叉學(xué)科,其理論和方法有很多,包括K-最近鄰分類器、判別分析、人工神經(jīng)網(wǎng)絡(luò)和分類樹等,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這里就是要將數(shù)據(jù)挖掘方法與高職教育教學(xué)研究相結(jié)合,設(shè)計(jì)實(shí)際的分析應(yīng)用系統(tǒng),具體來說:
(1)數(shù)據(jù)挖掘技術(shù)面向高職教育這一特定領(lǐng)域中的主體——高職學(xué)生,針對專門的指標(biāo),包括個體特性、專業(yè)要求、就業(yè)意向等,著眼于課程這個知識載體,對它們之間的關(guān)系進(jìn)行深層次、智能化的挖掘、分析;
(2)數(shù)據(jù)挖掘的應(yīng)用會具體到建模、變量篩選和導(dǎo)入等方面,而不只是一些抽象的挖掘算法的研究;
(3)數(shù)據(jù)分析采用先進(jìn)的商業(yè)智能工具,同樣,數(shù)據(jù)的展現(xiàn)手段基于ASP.Net平臺,具有開放化、模塊化、網(wǎng)絡(luò)化特點(diǎn)。
3 系統(tǒng)框架
系統(tǒng)定位于個性化學(xué)習(xí)分析,其框架結(jié)構(gòu)參見圖1,主要由數(shù)據(jù)集成、數(shù)據(jù)建模、數(shù)據(jù)分析及展現(xiàn)等部分構(gòu)成。具體來說,數(shù)據(jù)集成模塊完成定義數(shù)據(jù)結(jié)構(gòu)、裝載、清洗、合并數(shù)據(jù)的功能;數(shù)據(jù)建模是指建立數(shù)據(jù)分析OLAP及數(shù)據(jù)挖掘模型;數(shù)據(jù)分析旨在分析和比較各種不同算法得出的結(jié)果,尋找最為匹配的算法,而數(shù)據(jù)展現(xiàn)的作用是根據(jù)分析結(jié)構(gòu)靈活創(chuàng)建數(shù)據(jù)報(bào)告。
圖1 系統(tǒng)框架結(jié)構(gòu)
在此架構(gòu)下,各個子系統(tǒng)的功能如下所述:
(1)數(shù)據(jù)集成。分析和歸納課程教學(xué)過程中產(chǎn)生的系列數(shù)據(jù),根據(jù)其特征和行為設(shè)計(jì)及定義便于分析和挖掘的數(shù)據(jù)結(jié)構(gòu),然后并進(jìn)行數(shù)據(jù)集成。數(shù)據(jù)集成的工作包括從異構(gòu)數(shù)據(jù)源獲取數(shù)據(jù),將其進(jìn)行清洗、轉(zhuǎn)換、合并,然后加載到數(shù)據(jù)倉儲中。數(shù)據(jù)集成執(zhí)行的時間、相互的順序、成敗對將來的分析結(jié)果的有效性則至關(guān)重要。
(2)數(shù)據(jù)建模。典型的數(shù)據(jù)挖掘工具將在構(gòu)建了數(shù)據(jù)倉庫后進(jìn)行分析并生成結(jié)果,一些工具也可以使用關(guān)系型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析的結(jié)果獨(dú)立于數(shù)據(jù)倉庫中使用的數(shù)據(jù)。數(shù)據(jù)挖掘核心的部分就是選擇挖掘算法并建立數(shù)據(jù)模型,這樣就可以根據(jù)學(xué)生個體信息、學(xué)生成績等數(shù)據(jù)之間的關(guān)系將這些學(xué)生劃分成分析有意義的組群并預(yù)測他們的行為;當(dāng)把這些組發(fā)送回分析過程時,數(shù)據(jù)挖掘引擎允許分析人員和用戶根據(jù)這些簇進(jìn)行劃分和細(xì)化。
(3)數(shù)據(jù)分析與展示。以學(xué)生個體信息和課程數(shù)據(jù)為輸入,利用所篩選出的最佳建模方法,逐步提出一個可實(shí)現(xiàn)個性化學(xué)習(xí)分析的數(shù)據(jù)模型,以衡量及提高模型預(yù)測的準(zhǔn)確度。將分析結(jié)果以特定的客戶端或Web方式進(jìn)行展現(xiàn),以Asp.Net建立的分析結(jié)果展示平臺,具有高度的開放性、通用性和可擴(kuò)展性。通過建模創(chuàng)建了正確的模型,數(shù)據(jù)挖掘的重點(diǎn)就從分析轉(zhuǎn)到結(jié)果上,數(shù)據(jù)報(bào)告的展現(xiàn)方式有多種,可通過專業(yè)的報(bào)告工具,也可自行編寫Web網(wǎng)站進(jìn)行發(fā)布。
4 結(jié)束語
在高職教育教學(xué)研究中運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)手段,針對各項(xiàng)課程教學(xué)、學(xué)生管理數(shù)據(jù)進(jìn)行深度挖掘、分析,研究個性化學(xué)習(xí)模式,為學(xué)生的自我學(xué)習(xí)規(guī)劃提供具體化、智能化分析結(jié)果以供參照,在此情況下,先進(jìn)技術(shù)手段的支持,對教與學(xué)都有著不可忽視的影響。同時,也為人才培養(yǎng)的探索與嘗試提供新途徑。
參考文獻(xiàn):
[1]趙云鵬,石麗,劉瑩.基于數(shù)據(jù)挖掘的高校規(guī)模分析及應(yīng)用研究.第九屆全國信息獲取與處理學(xué)術(shù)會議論文集[C].2011.
[2]王丹.數(shù)據(jù)挖掘在高職院校教學(xué)管理中的應(yīng)用[J].清遠(yuǎn)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2010(12).
[3]干娟.基于決策樹算法的學(xué)生綜合測評系統(tǒng)的設(shè)計(jì)[J].安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報(bào),2011(04).
作者簡介:王錚鈞(1970-),女,江蘇蘇州人,副教授,研究生,主要研究方向:人工智能,數(shù)據(jù)挖掘。
作者單位:深圳職業(yè)技術(shù)學(xué)院 計(jì)算機(jī)工程學(xué)院,廣東深圳 518055