辜 姣
(江南大學(xué) 理學(xué)院, 江蘇 無錫 214122)
?
基于案例教學(xué)的大數(shù)據(jù)課程教學(xué)實踐探索
辜 姣
(江南大學(xué) 理學(xué)院, 江蘇 無錫 214122)
近年來,隨著大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,企業(yè)、學(xué)校和社會都對大數(shù)據(jù)人才培養(yǎng)保持高度關(guān)注。為了更好地開展大數(shù)據(jù)課程的教學(xué)工作,本文結(jié)合大數(shù)據(jù)的真實案例,分析出大數(shù)據(jù)具有多維度和自洽性的特點;根據(jù)在教學(xué)過程中遇到的問題,提出引導(dǎo)學(xué)生學(xué)習(xí)機器智商、使用案例教學(xué),采取多元融合教學(xué)模式的解決方案;對大數(shù)據(jù)課程的開展進行了一些教學(xué)嘗試和探索,為大數(shù)據(jù)課程的建設(shè)提供了一定的思路。
大數(shù)據(jù); 案例教學(xué); 機器智商; 多元融合
當(dāng)今社會是一個科技高速發(fā)展、信息高速增長的社會,大數(shù)據(jù)是這個高科技時代的產(chǎn)物。近年來,隨著大數(shù)據(jù)的蓬勃發(fā)展,企業(yè)和社會都迫切需要大數(shù)據(jù)相關(guān)人才。隨著國務(wù)院《大數(shù)據(jù)發(fā)展行動綱要》發(fā)行,高校進行大數(shù)據(jù)課程建設(shè)勢在必行。根據(jù)中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會人才統(tǒng)計報告,大數(shù)據(jù)人才缺口在五年內(nèi)將會達到1 300萬人左右。為了彌補大數(shù)據(jù)人才的巨大缺口,從學(xué)生中培養(yǎng)相關(guān)數(shù)據(jù)人才正是大勢所趨。目前,大數(shù)據(jù)方面的研究與教育在美國等發(fā)達國家已經(jīng)上升為國家戰(zhàn)略,然而在我國許多高校并未開展大數(shù)據(jù)的相關(guān)課程和專業(yè),社會亟需具有大數(shù)據(jù)視野的綜合性人才。為了更好地開展大數(shù)據(jù)相關(guān)課程教學(xué),根據(jù)實際課堂講學(xué),我們發(fā)現(xiàn)大數(shù)據(jù)具有多維度、自洽性的特點。此外,針對大數(shù)據(jù)課程教師教學(xué)和學(xué)生學(xué)習(xí)現(xiàn)狀,我們探索出學(xué)習(xí)機器智商、使用案例教學(xué)與傳統(tǒng)教學(xué)相結(jié)合、對學(xué)生進行多元教學(xué)和評價的三條解決方案,希望對這門課程的建設(shè)提供一些思路。
1.1 大數(shù)據(jù)定義
大數(shù)據(jù)(Big Data)即多數(shù)據(jù)或海量數(shù)據(jù)[1-3]。
1.2 大數(shù)據(jù)特征
業(yè)界通常用4個V來概括大數(shù)據(jù)的特征,具體而言:Volume,即數(shù)據(jù)體量巨大;Variety,即數(shù)據(jù)類型多樣;Value,即處理速度快;Velocity,即價值密度低。根據(jù)實際課堂講解以及相關(guān)案例分析,我們發(fā)現(xiàn)大數(shù)據(jù)還具有其他特征,即在復(fù)雜性(Complexity)層面上具有多緯度(Multi-dimension)和自洽性(Self-consistency)的特點。
1.2.1 Multi-dimension 即數(shù)據(jù)由多維度構(gòu)成。當(dāng)人類進行某項活動時,產(chǎn)生的海量數(shù)據(jù)存在于多個維度,并且互相呼應(yīng)。以人類出行為例,人們可以使用公共汽車、地鐵、火車、飛機、私家車等交通工具外出。首先,由于實名制,由飛機和火車承載的個體出行軌跡可以根據(jù)出行記錄繪出。由地鐵、公汽、私家車承載的出行軌跡可以通過城市監(jiān)控錄像等找出。因此,人們出行這項活動可以通過交通維度上的數(shù)據(jù)進行記錄。其次,智能手機已經(jīng)成為人們生活工作中不可缺少的工具,只要出行人攜帶手機,通過各地的基站和手機連接的數(shù)據(jù)即可描繪出行軌跡。這些數(shù)據(jù)從地理定位這個維度記錄出行活動。此外,在個人出行中不可避免會進行吃飯、住宿、游玩、購物等項目。隨著互聯(lián)網(wǎng)支付的普及,在相應(yīng)的網(wǎng)絡(luò)支付運營商以及酒店運營商的商業(yè)記錄里也會體現(xiàn)出與此次出行相關(guān)的數(shù)據(jù)。由于某項活動的數(shù)據(jù)往往同時在多個維度上產(chǎn)生,因此我們說大數(shù)據(jù)具有多維度的特點。
1.2.2 Self-consistency 即不同維度上的數(shù)據(jù)可以互相呼應(yīng),互相驗證。仍以個體出行為例,如果個體的交通數(shù)據(jù)反映出個體在某特定時間段內(nèi)在城市A和城市B活動,那么因為吃住產(chǎn)生的支付維度上的數(shù)據(jù)以及基站對手機地理定位維度上的數(shù)據(jù)應(yīng)該僅限于城市A、城市B以及途經(jīng)城市。這也意味著隨著大數(shù)據(jù)技術(shù)的提高,人們對過去覺得只有“自己知道”的事情進行掩飾的難度將會越來越大。
由于大數(shù)據(jù)課程是新開課程,教學(xué)方法尚不成熟,在學(xué)習(xí)和教學(xué)過程中普遍存在以下特點:
2.1 學(xué)生學(xué)習(xí)熱情高漲
社會對大數(shù)據(jù)專業(yè)人才的需求隨著互聯(lián)網(wǎng)技術(shù)的進步、全球信息產(chǎn)業(yè)的崛起而日益增大。加之媒體對大數(shù)據(jù)等互聯(lián)網(wǎng)新名詞的頻繁使用,導(dǎo)致學(xué)生普遍對大數(shù)據(jù)的相關(guān)知識有著迫切的學(xué)習(xí)熱情。大學(xué)生作為年輕人,對新生事物保持著較高的關(guān)注度。此外,隨著一批互聯(lián)網(wǎng)經(jīng)紀(jì)公司的快速發(fā)展,也出現(xiàn)了大量與大數(shù)據(jù)相關(guān)的崗位招聘。因此,越來越多的學(xué)生急切地希望從學(xué)校環(huán)境中學(xué)習(xí)大數(shù)據(jù)的相關(guān)課程,掌握大數(shù)據(jù)的相關(guān)理論知識和數(shù)據(jù)處理技術(shù)。
2.2 教材相對滯后
大數(shù)據(jù)是近些年互聯(lián)網(wǎng)的新興事物,目前已經(jīng)出版多本由互聯(lián)網(wǎng)領(lǐng)域里領(lǐng)軍人物所編著的相關(guān)書籍。如《大數(shù)據(jù)時代》[4]、《爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維》[5]等。這些書籍通過生動有趣的實例講解大數(shù)據(jù)的歷史與相關(guān)概念,更適合作為讀物,很難作為教材,讓學(xué)生集中學(xué)習(xí)相關(guān)理論、掌握相關(guān)算法以及相關(guān)數(shù)據(jù)處理技術(shù)。
2.3 大數(shù)據(jù)應(yīng)用范圍廣泛,知識迭代較快,教學(xué)難以深入
大數(shù)據(jù)這個領(lǐng)域本身也在蓬勃發(fā)展,知識迭代迅速。為了讓學(xué)生學(xué)習(xí)科技前沿,課程應(yīng)與實際社會現(xiàn)象相關(guān)。而兼顧理論知識講解和數(shù)據(jù)處理技術(shù)的展現(xiàn)則成為一個難點。此外,由于大數(shù)據(jù)本身也是一門正迅速發(fā)展和變化的新興事物,許多知識形成體系呈現(xiàn)在課本上已經(jīng)“過時”,因此教學(xué)上難以深入講解。
3.1 引導(dǎo)學(xué)生學(xué)習(xí)機器智商
大數(shù)據(jù)進行數(shù)據(jù)處理的主要媒介是計算機,而計算機解決問題的思路與人類大腦擅長使用的歸納總結(jié)往往背道而馳。計算機的優(yōu)勢在于高速的運算速度,以及大容量的數(shù)據(jù)存儲。因此,教師應(yīng)該引導(dǎo)學(xué)生在設(shè)計算法時更多地從計算機的思考模式出發(fā),即提高機器智商。以識別圖片中的狗這一任務(wù)為例,人類通過歸納總結(jié)出狗的外貌特征,能輕松識別出圖片中的狗。而計算機識別圖片中狗的能力需要建立在與大量現(xiàn)有狗的圖片數(shù)據(jù)對比上。在程序設(shè)計時,很難通過總結(jié)歸納并變成可執(zhí)行的語句。如果要通過算法讓計算機識別狗,往往需要進行大量的數(shù)據(jù)比對,如果相近,則認(rèn)為狗在圖片中,反之圖片中沒有狗。因此,按此思路設(shè)計算法比歸納總結(jié)出狗的特征并讓計算機明白這個思路去設(shè)計算法要更加合適。在大數(shù)據(jù)課程學(xué)習(xí)中,我們發(fā)現(xiàn)部分學(xué)生仍然追尋歸納總結(jié)的思路,而不考慮看似繁復(fù),卻能充分利用計算機快速計算和大存儲容量特點的算法。因此在教學(xué)中,我們應(yīng)該讓學(xué)生進行機器智商的學(xué)習(xí),只有這樣,才能使用計算機更好地對大量數(shù)據(jù)進行處理。
3.2 使用案例教學(xué)法
在現(xiàn)代教學(xué)過程中,案例教學(xué)法是一種常見的教學(xué)方法[6]。我們采用案例教學(xué)法與傳統(tǒng)教學(xué)相結(jié)合,讓學(xué)生扮演系統(tǒng)設(shè)計人員,分析用戶的需求,根據(jù)所學(xué)的理論,對實際問題進行分析和討論,并設(shè)計解決方案,完成從理論知識學(xué)習(xí)到實踐和應(yīng)用的過程。例如,F(xiàn)acebook從2010年陸續(xù)公開相關(guān)數(shù)據(jù)以來,如今有超過1 000萬個應(yīng)用使用其相關(guān)數(shù)據(jù)于社交網(wǎng)絡(luò)上。我們可以使用Facebook的部分?jǐn)?shù)據(jù),設(shè)計開放性問題,如通過社交數(shù)據(jù)分析,提出有價值的市場建議。學(xué)生可以尋找小范圍的Facebook數(shù)據(jù)進行分析,通過在線活躍用戶量的分析找到集中社交上網(wǎng)的時間,對企業(yè)選擇電視廣告播出時間提出建議;也可以從多個熱點話題分析出人們最關(guān)心的領(lǐng)域,為投資公司對項目的選擇提出建議等。此外,雖然是開放性問題,但均建立在使用一定計算工具上。學(xué)生可以使用R、Matlab、C等不同程序語言,從而深入體會出各程序語言作為數(shù)據(jù)分析工具時的優(yōu)勢。使用案例教學(xué)法與傳統(tǒng)教學(xué)相結(jié)合,不僅可以提高學(xué)生的興趣,也能使學(xué)生提高解決現(xiàn)實問題的能力。
3.3 使用多元融合的教學(xué)手段和評價體系
為了提高學(xué)生的學(xué)生興趣,大數(shù)據(jù)課程應(yīng)該采取多元教學(xué)手段。不僅應(yīng)該體現(xiàn)在知識學(xué)習(xí)上,還應(yīng)該體現(xiàn)在教學(xué)手段和教學(xué)評價上[7]。在知識學(xué)習(xí)上,理論概念的講解仍以傳統(tǒng)教學(xué)為主要模式,而算法的應(yīng)用則應(yīng)以案例為主線組織教學(xué),兩者相結(jié)合才能更好地滿足不同階段的學(xué)習(xí)需求。在教學(xué)手段上,充分利用多媒體技術(shù),便于學(xué)生對于知識的理解。特別是在算法的講解中,使用動畫展示算法執(zhí)行過程,使學(xué)生更容易理解數(shù)據(jù)處理過程。在教學(xué)評價上,考核方式應(yīng)該多元化,上課表現(xiàn)、案例的分析與解決、小組表現(xiàn)、期末考試等多元考試方式綜合運用。同時理論成績和實際成績相結(jié)合,以小組形式,共同完成綜合大作業(yè),通過自評、互評、教師評價加權(quán)的方式進行效果評價。
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大數(shù)據(jù)分析已成為現(xiàn)代高端人才應(yīng)當(dāng)具備的基本技能之一,大數(shù)據(jù)課程的建設(shè)與開展勢在必行。本文先簡要介紹了大數(shù)據(jù)的特點,提出除了“4V”,大數(shù)據(jù)還具有多維度、自洽性的特點。然后,對現(xiàn)有大數(shù)據(jù)課程現(xiàn)狀進行分析。針對教學(xué)中出現(xiàn)的問題,我們認(rèn)為有下列三種途徑可以使大數(shù)據(jù)課程更好地進行。首先,引導(dǎo)學(xué)生學(xué)習(xí)機器智商,使學(xué)生能更好地駕馭計算機這個數(shù)據(jù)處理工具。其次,使用案例教學(xué)法與傳統(tǒng)教學(xué)相結(jié)合,在不同階段采取不同的教學(xué)組織形式更能適應(yīng)課程需要。最后,采用多元融合的教學(xué)手段和評價體系更適合大數(shù)據(jù)這門課程的開展。我們將繼續(xù)進行探索和研究,希望在同行的共同努力下,為該課程的建設(shè)和發(fā)展做出貢獻。
[1] 涂新莉,劉波,林偉偉.大數(shù)據(jù)研究綜述[J].計算機應(yīng)用研究,2014,31(6):1612-1616.
[2] 劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學(xué)學(xué)報(工學(xué)版),2014,48(6):957-972.
[3] 蔣亦樟,錢鵬江,謝振平.“物云大智”在現(xiàn)代教育中的應(yīng)用與思考[J].無錫職業(yè)技術(shù)學(xué)院學(xué)報,2016,15(4):1-6.
[4] Mayer-Sch?nberger V. 大數(shù)據(jù)時代 [M].盛揚燕, 周濤,譯.杭州:浙江大學(xué)出版社,2013:27-94.
[5] Barabási A L. 爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維 [M].馬慧,譯.北京:中國人民大學(xué)出版社,2012:245-307.
[6] 陳玉榮. 試論案例教學(xué)法[J]. 中國職業(yè)技術(shù)教育, 2004(31):19-21.
[7] 張善新. 基于多元融合的數(shù)據(jù)結(jié)構(gòu)課程教學(xué)方法初探[J]. 無錫職業(yè)技術(shù)學(xué)院學(xué)報,2016,15(6):39-42.
責(zé)任編輯 俞 林
Exploration on the “Big Data” Teaching Practice Based on the Teaching Case
GUJiao
(School of Science, Jiangnan University, Wuxi 214122, China)
With the rapid development of big data technology in recent years, companies, universities and the whole society begin to pay close attention to education of talents in the field of Big Data. In order to carry out the course of Big Data well, this paper analyzes some real cases and finds that Big Data has its own characteristics of multi-dimension and self-consistency. According to the problems encountered in the teaching process, three suggestions are provided: guiding students to learn the machine intelligence quotient, employing the case teaching, and adopting the teaching mode of multi-integration. This paper discusses the attempts and explorations of the Big Data course, which provides some ideas for the construction of the Big Data course.
Big Data; case teaching; machine intelligence quotient (MIQ); multi-integration
2017-03-14
中央高校基本科研基金項目“復(fù)雜網(wǎng)絡(luò)的歸一化拉普拉斯譜性質(zhì)研究及其應(yīng)用”(JUSRP115A16);江南大學(xué)教改項目“大數(shù)據(jù)背景下信息與計算科學(xué)專業(yè)創(chuàng)新人才培養(yǎng)模式研究與實踐”(JG2015063)
辜姣(1983— ),女,湖北黃石人,講師,博士,研究方向:數(shù)據(jù)挖掘。
10.13750/j.cnki.issn.1671-7880.2017.03.007
G 40-012; G 712
A
1671-7880(2017)03-0023-03