亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于TDC模式的數(shù)據(jù)挖掘課程教學(xué)新方法

        2015-05-30 08:40:10石向榮
        經(jīng)濟師 2015年5期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        摘 要:文章通過對目前“數(shù)據(jù)挖掘”課程教學(xué)中存在問題的調(diào)研,結(jié)合實際工作中的見聞與思考,并匯總相關(guān)文獻的研究結(jié)論,提出解決教學(xué)中所存在問題的整體方案。該方案可歸結(jié)為以“理論”、“數(shù)據(jù)”、“代碼”為核心的TDC教學(xué)模式,從而提出一種大學(xué)數(shù)據(jù)挖掘課程的新式教學(xué)方法。

        關(guān)鍵詞:數(shù)據(jù)挖掘 任務(wù)驅(qū)動法 TDC教學(xué)模式

        中圖分類號:F222 文獻標識碼:A

        文章編號:1004-4914(2015)05-253-02

        一、引言

        數(shù)據(jù)挖掘作為一門新興的學(xué)科,是高等數(shù)學(xué)、統(tǒng)計學(xué)以及數(shù)據(jù)庫技術(shù)等交叉發(fā)展的產(chǎn)物,它廣泛應(yīng)用于商業(yè)、工程、醫(yī)學(xué)、農(nóng)學(xué)等諸多領(lǐng)域。隨著我國社會經(jīng)濟的發(fā)展,各行業(yè)信息化程度不斷提升,產(chǎn)生了可供分析挖掘的海量數(shù)據(jù)。因此,如何充分利用這些數(shù)據(jù)并從中提煉有價值的信息,成為學(xué)術(shù)界日益關(guān)注的焦點問題。近年來,為緊跟社會發(fā)展的步伐,國內(nèi)外高校紛紛開設(shè)數(shù)據(jù)挖掘課程,該課程具有鮮明的時代特點和較強的實用性,受到了學(xué)生們的廣泛歡迎,但又由于課程內(nèi)容復(fù)雜、模型眾多、理論較抽象、對數(shù)學(xué)基礎(chǔ)要求較高,在教學(xué)過程中也暴露出一些問題,主要表現(xiàn)為:

        一是課程理論部分內(nèi)容特別豐富,且呈不斷膨脹趨勢,如果不適時地改革傳統(tǒng)教學(xué)方式,新內(nèi)容將使學(xué)習(xí)者應(yīng)接不暇,對授課教師也形成不小的壓力。

        二是適合于課堂教學(xué)并且生動有趣的實例數(shù)據(jù)相對較少。由于有價值的數(shù)據(jù)資源大多存在于金融、電信、保險等行業(yè),而這些數(shù)據(jù)往往涉及行業(yè)機密,因此,尋找合適的數(shù)據(jù)資源以供課堂教學(xué)使用并非易事。

        三是適合于課堂教學(xué)使用的示例程序相對較少。目前可以呈現(xiàn)數(shù)據(jù)挖掘效果的軟件有不少,可方便地從輸入數(shù)據(jù)中挖掘出結(jié)果,適合于商業(yè)使用,但對于以學(xué)習(xí)原理為目的的學(xué)生而言并無補益。

        針對上述諸多問題,一些教學(xué)研究者從不同的角度提出了改革建議,如:覃義(2012)提出數(shù)據(jù)挖掘的教學(xué)應(yīng)與實驗相結(jié)合,并且應(yīng)與驗證式的實驗形成區(qū)別,避免給學(xué)生提供數(shù)據(jù)而讓學(xué)生按照步驟進行挖掘的方式,以培養(yǎng)學(xué)生的實踐能力;王麗麗(2013)提出以CDIO(構(gòu)思、設(shè)計、實施、運作,Conceive, Design, Implement,Operate)理念為指導(dǎo),以CDIO過程為主導(dǎo),以項目驅(qū)動法為方法,改革課程教學(xué)方式,對教學(xué)目標、教學(xué)內(nèi)容、教學(xué)方式進行重設(shè),增加項目教學(xué),實踐證明,上述改革舉措能有效培養(yǎng)學(xué)生思考和主動學(xué)習(xí)的能力、提升工程實踐和團隊合作能力。而黃嵐(2014)從教學(xué)資源的角度出發(fā),提出通過構(gòu)建三大類挖掘資源庫以輔助教學(xué)的模式。但這些新的改革方案都是從某一特定角度出發(fā),解決了當(dāng)前數(shù)據(jù)挖掘教學(xué)中存在的某些具體問題,具有局限性,正如李衛(wèi)華(2014)指出,項目驅(qū)動法僅適用于小班化教學(xué),當(dāng)班級人數(shù)超過50時,該方法無法順利開展,其局限性顯而易見。

        為了對數(shù)據(jù)挖掘課程的整個教學(xué)模式進行根本性、徹底性的變革,筆者經(jīng)過反復(fù)思考,結(jié)合與授課同學(xué)交流的體會,提出一種T(理論,Theory)、D(數(shù)據(jù),Data)、C(代碼,Code)相結(jié)合的新式教學(xué)方法。T為大綱規(guī)定的理論性內(nèi)容,D為精心準備的各行業(yè)案例數(shù)據(jù),C為實現(xiàn)具體算法的程序代碼。該教學(xué)法讓同學(xué)們在編程實戰(zhàn)中學(xué)會并掌握數(shù)據(jù)挖掘的基本理論,同時還初步掌握1~2門編程語言。整套改革方案包括如下相互聯(lián)系的幾個組成部分。

        二、重設(shè)課程教學(xué)大綱

        當(dāng)前,數(shù)據(jù)挖掘課程教育界有一套公認為標準的教學(xué)大綱,是2006年由美國計算機學(xué)會數(shù)據(jù)挖掘?qū)iT興趣小組(ACM SIGKDD)擬定的。SIGKDD的大綱從數(shù)據(jù)庫、數(shù)據(jù)預(yù)處理、統(tǒng)計推理等8個方面入手,將課程教學(xué)內(nèi)容分為基礎(chǔ)和高級兩個專題。其中,基礎(chǔ)部分包括:導(dǎo)論、數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉庫與OLAP、關(guān)聯(lián)規(guī)則與頻繁模式挖掘、分類、聚類與孤立點分析、時間序列與序列模式、文本與Web挖掘、數(shù)據(jù)挖掘的可視化、數(shù)據(jù)挖掘應(yīng)用10章;高級部分包含基礎(chǔ)部分后9章的全部內(nèi)容,另外還引入了更復(fù)雜的算法及數(shù)據(jù)流挖掘、時空與多媒體數(shù)據(jù)挖掘等內(nèi)容。

        可見,大綱規(guī)定的內(nèi)容,特別是高級專題部分,具有隨社會發(fā)展不斷膨脹的特點,而本文所提出的教學(xué)改革方案,是以不增加課堂教學(xué)總學(xué)時為前提的。不僅如此,還將考慮增加程序設(shè)計部分的講授內(nèi)容,由此要求對“標準版”大綱的內(nèi)容實施裁減,新的大綱以“讓學(xué)生掌握基本的數(shù)據(jù)挖掘理論”為前提,適當(dāng)刪減理論部分的內(nèi)容,增加課程實踐部分的學(xué)時。例如,在決策樹分類算法部分,介紹ID3算法這一典型即可,對其變種C4.5可交給同學(xué)自學(xué),綜合而言,對標準版大綱的重新組織方案可參看表1。

        按照這種方案對教學(xué)內(nèi)容刪減之后,并不會削弱同學(xué)們對數(shù)據(jù)挖掘基本理論的理解,這是由于這些算法中,所保留的基本算法或原型算法往往能體現(xiàn)某一大類算法的本質(zhì)特點,而所刪減部分的內(nèi)容只是在細節(jié)問題上和原型算法有一些差異,無關(guān)算法的核心內(nèi)容,這就解決了Theory部分的教學(xué)問題,而利用所節(jié)余的時間,輔以程序?qū)崿F(xiàn)(Code)的教學(xué),反過來還能進一步夯實所學(xué)的理論,加深理解。

        三、全方位多角度改革教學(xué)方式

        (一)搜集有價值的案例數(shù)據(jù)

        數(shù)據(jù)在數(shù)據(jù)挖掘課程中的重要性也許是所有課程中最重要的,2014年,學(xué)者黃嵐專門研究了課程數(shù)據(jù)資源庫的建立之于課堂教學(xué)的重要意義。為取得良好的教學(xué)效果,激發(fā)學(xué)習(xí)熱情,須要精心選擇一批好的案例,搜集一批具有一定規(guī)模的數(shù)據(jù),避免紙上談兵。例如,用于頻繁模式發(fā)現(xiàn)的數(shù)據(jù),其事務(wù)條數(shù)至少應(yīng)達到上百或以上規(guī)模,才能體現(xiàn)本課程的價值。當(dāng)然,這些實例數(shù)據(jù)的來源應(yīng)當(dāng)真實可靠,有說服力,并且和社會普遍關(guān)注的問題有一定相關(guān)性,這樣才能更好地抓住受眾的眼球。例如在講授時間序列分析時,可采集一批股票或期貨市場的價格數(shù)據(jù)。為做好數(shù)據(jù)準備工作,任課教師團隊須要投入一定的時間精力與學(xué)術(shù)界、企業(yè)界交流,爭取他們在數(shù)據(jù)上對大學(xué)教學(xué)工作的支持。

        (二)選擇合適的輔助學(xué)習(xí)軟件

        傳統(tǒng)的教學(xué)方式側(cè)重于講授理論,為加深對理論的理解,會有一些書面練習(xí),但是數(shù)據(jù)挖掘課程的特點決定了其數(shù)據(jù)規(guī)模往往較龐大,因此通過計算器和草稿紙的傳統(tǒng)演算方式來完成計算任務(wù)并不切實際,因而亟待引入專門的計算軟件輔助挖掘工作的開展。

        目前能勝任數(shù)據(jù)挖掘任務(wù)的程序并不少見,如馬守東(2013)所推薦采用的SAS軟件,以及曾垂?。?014)在教學(xué)中使用的Clementine軟件。但是,這些軟件設(shè)計的初衷是為了解決工業(yè)上的數(shù)據(jù)挖掘?qū)嶋H問題,而非為了輔助教學(xué),對教學(xué)而言,這些軟件的弊端是過于“重量級”。另一方面,其工作方式往往是,經(jīng)過簡單的參數(shù)配置,同時確保輸入數(shù)據(jù)格式符合要求,即可在短時間內(nèi)輸出挖掘結(jié)果。如此過程對于學(xué)生而言無異于黑箱操作,學(xué)習(xí)者無法深入領(lǐng)會挖掘算法的原理、來龍去脈,因而無助于培養(yǎng)動手實踐能力,副作用很明顯。

        另一種可能考慮的方案是選擇諸如Java、C、C++之類的主流程序設(shè)計語言,但是如果選擇它們,同樣會有一些問題,如:上述高級語言的學(xué)習(xí)本身即是一個復(fù)雜的過程,如果在課堂上講解語言本身,可能會沖淡課程的主題,顧此失彼。而如果不講,則對于沒有經(jīng)過有效訓(xùn)練的同學(xué),難以在短時間內(nèi)掌握,徒增對課程的畏懼心理;課程學(xué)習(xí)對象未必是接受過專門訓(xùn)練的計算機專業(yè)同學(xué),甚至并不具備程序設(shè)計基礎(chǔ),因此受眾的軟件開發(fā)能力可能參差不齊,由此會帶來教學(xué)效果的大打折扣。

        例如,對于經(jīng)管類專業(yè)本科生而言,數(shù)據(jù)挖掘的教學(xué)內(nèi)容對他們有著較強的吸引力,但相對薄弱的計算機編程基礎(chǔ)卻使他們對課程望而卻步,因此選擇一款合適的軟件開發(fā)工具很有必要,這樣的工具既能有效地體現(xiàn)算法的內(nèi)涵,展現(xiàn)整個算法實現(xiàn)過程的全貌,又能相對比較直觀,不需要具備底層的計算機知識即可快速上手,易學(xué)易用。筆者在教學(xué)實踐中發(fā)現(xiàn),由MathWorks公司推出的科學(xué)計算軟件matlab符合上述要求,使用matlab輔助課程教學(xué),效果良好。近年來,一款和matlab有著類似風(fēng)格的統(tǒng)計工具軟件R語言逐漸風(fēng)靡起來,并且在數(shù)據(jù)挖掘界也受到好評,又由于它相對matlab更輕量級且開源、免費,因此可以預(yù)料R同樣能夠勝任數(shù)據(jù)挖掘的輔助教學(xué)任務(wù)。

        (三)引入豐富的現(xiàn)代教學(xué)方式

        數(shù)據(jù)挖掘?qū)儆谛屡d的信息技術(shù)類課程,目前,優(yōu)質(zhì)教師資源匱乏,適合本科生使用的優(yōu)秀參考書也不多見,并且課程的鮮明特點是:西方發(fā)達國家的數(shù)據(jù)挖掘技術(shù)領(lǐng)先于我們,其教學(xué)工作也比我國更有成效。為此,可充分利用網(wǎng)絡(luò)資源,將分散在互聯(lián)網(wǎng)上的優(yōu)秀材料匯集起來,引薦給同學(xué),包括原版的電子教材、課件甚至教學(xué)視頻;還可以開通微信公共號或群,在公共平臺上一方面可以推送反映數(shù)據(jù)挖掘技術(shù)最新進展的科技短文,激發(fā)同學(xué)興趣和學(xué)習(xí)熱情,還可以利用平臺開展課程答疑,增強同學(xué)們對課程的認同感、向心力;為彌補課堂教學(xué)學(xué)時的不足,可利用提供翻轉(zhuǎn)教學(xué)的MOOC平臺,將某些知識點翻轉(zhuǎn)到課前講授、在課中僅作答疑或?qū)嵺`。

        (四)改革課程考核方式

        課程的考核須要體現(xiàn)學(xué)生對基本原理、基本理論的了解掌握程度和應(yīng)用能力,因此,對本課程而言,如果將考卷設(shè)計成記憶概念、代入公式這樣的風(fēng)格,并不合適;同樣,基于數(shù)據(jù)規(guī)模的考慮,傳統(tǒng)的集中考查方式也無法勝任,一道題的計算工作量可能耗費數(shù)小時。在一些類似課程中,教師們往往采用“大作業(yè)”或“完成某具體任務(wù)”的方式來檢查學(xué)生掌握知識的水平,但這種開放式的檢查方式難以防范舞弊行為,會帶來不公平。因此,如何科學(xué)地評判同學(xué)接受知識的真實水平成為一個難題,一個初步設(shè)想是,考慮設(shè)計出基于數(shù)據(jù)挖掘的課程考評系統(tǒng),利用同學(xué)們上機時所采集的信息,如點擊、停留時間等,結(jié)合平時測驗成績建立模型,最終獲得每個同學(xué)的合理分數(shù)。當(dāng)然,這項工作目前還處于設(shè)想階段,其可行性如何有待進一步論證。

        四、結(jié)束語

        為解決數(shù)據(jù)挖掘課程教學(xué)中遇到的一系列問題,本文提出一種基于TDC模式的教學(xué)新方法。但數(shù)據(jù)挖掘畢竟是一門新興課程,本文所提的方法其效果究竟如何,還有待實踐的檢驗。注意到高校課程表中存在這樣一些課程,如“運籌學(xué)”、“人工智能”、“模式識別”等,雖然與“數(shù)據(jù)挖掘”內(nèi)容不同,但其共同點是理論性強、內(nèi)容抽象、需要案例展現(xiàn)、需要程序?qū)崿F(xiàn)。因此了解和借鑒這些課程相關(guān)專家教授的先進經(jīng)驗,為我所用,不失為提高教學(xué)效果的可行方法。

        本文提出的TDC模式中,一個值得注意的細節(jié)問題是T和 C的比例分配問題。如果過多強調(diào)程序設(shè)計的語法、方法、技巧會喧賓奪主,而少了又達不到應(yīng)有的效果。因此,如何科學(xué)地規(guī)劃理論授課和編程實踐的比例,才能獲得最佳的教學(xué)效果,這是一個值得進一步深入研究的問題。

        參考文獻:

        [1] 覃義,楊丹江,劉憶寧.《數(shù)據(jù)挖掘》本科教學(xué)的體舍與創(chuàng)新.科技信息,2012(10)

        [2] 王麗麗.CDIO視角下項目驅(qū)動法在“數(shù)據(jù)倉庫與數(shù)據(jù)挖掘”教學(xué)中的應(yīng)用.電子商務(wù),2013(9)

        [3] 黃嵐.數(shù)據(jù)挖掘課程實踐教學(xué)資源庫建設(shè).計算機教育,2014(12)

        [4] 李衛(wèi)華.數(shù)據(jù)挖掘與數(shù)據(jù)倉庫教學(xué)改革探討.惠州學(xué)院學(xué)報, 2014(12)

        [5] SIGKDD.Data Mining Curriculum:A Proposal.2006; Available from:http://www.sigkdd.org/curriculum/index.html.

        [6] 馬守東,龔永峰.關(guān)于數(shù)據(jù)挖掘課程教學(xué)探索.電腦編程技巧與維護,2013(24)

        [7] 曾垂省.生物信息學(xué)專業(yè)之?dāng)?shù)據(jù)挖掘教學(xué)實踐與思考.廣東化工, 2014(7)

        (作者單位:浙江財經(jīng)大學(xué)信息學(xué)院 浙江杭州 310018)

        (作者簡介:石向榮,工學(xué)博士,講師,研究方向:數(shù)據(jù)挖掘和分析。)

        (責(zé)編:賈偉)

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
        亚洲人成网站在线播放2019| 97人妻碰免费视频| 大陆啪啪福利视频| 国产午夜亚洲精品不卡福利| 九九日本黄色精品视频| 人妻乱交手机在线播放| 成人免费自拍视频在线观看| 无码免费一区二区三区| 精品十八禁免费观看| 青青草伊人视频在线观看| 久久精品国产av麻豆五月丁| 天堂√在线中文官网在线| 波多野结衣一区| 日韩精人妻无码一区二区三区 | 嗯啊好爽高潮了在线观看| 欧美bbw极品另类| 亚洲国产精品久久久久久网站 | 国产精品天堂| 国产一区二区三区四区色| 日韩精品在线视频一二三 | 日韩a级精品一区二区| 男女猛烈xx00免费视频试看| 四虎成人精品无码永久在线| 亚洲精品一区二区三区播放 | 91精品欧美综合在线观看| 国产一级内射一片视频免费| 精品人妻少妇嫩草av无码专区| 少妇人妻偷人精品无码视频| 亚洲精品高清av在线播放| 丰满人妻中文字幕一区三区| 国产成人无码一区二区三区| 亚洲国产精品久久人人爱| 91日韩高清在线观看播放| 美女一区二区三区在线观看视频| 无遮挡很爽很污很黄的女同 | 在线看亚洲十八禁网站| 麻豆人妻性色av专区0000| 玩弄放荡人妇系列av在线网站| 日韩精品一区二区三区视频| 中文字幕偷拍亚洲九色| 在线a亚洲视频播放在线播放 |