王婧娟 那麗春 方玉玲
關(guān)鍵詞:數(shù)據(jù)分析;數(shù)據(jù)可視化;教學(xué)設(shè)計;課程建設(shè)
隨著信息技術(shù)和數(shù)據(jù)存儲技術(shù)的快速發(fā)展,海量數(shù)據(jù)噴涌而出。如何從雜亂無章的數(shù)據(jù)中提取對人們有用的信息,并將結(jié)果以可視化圖形模式提供給用戶,是至關(guān)重要的問題。目前各高校均在自己傳統(tǒng)專業(yè)的基礎(chǔ)上,增添了人工智能、大數(shù)據(jù)等前沿技術(shù)課程。例如筆者所在的上海立信會計金融學(xué)院,面向各個學(xué)院的本科生開設(shè)了數(shù)據(jù)分析與可視化、Python數(shù)據(jù)處理技術(shù)、人工智能基礎(chǔ)與應(yīng)用等數(shù)據(jù)與信息素養(yǎng)課程[1]。這些課程均聚焦企業(yè)需求,在傳統(tǒng)專業(yè)的基礎(chǔ)上進行更新,目標(biāo)是培養(yǎng)出高素質(zhì)的綜合型人才。
本文主要以數(shù)據(jù)分析與可視化課程為例,闡述在當(dāng)今大數(shù)據(jù)時代的背景下,如何將前沿的數(shù)據(jù)分析與可視化技術(shù)融入本財經(jīng)院校各院系課程建設(shè)和教學(xué)中。
1 數(shù)據(jù)分析與可視化課程的現(xiàn)狀與挑戰(zhàn)
數(shù)據(jù)分析與可視化課程是公共通識課模塊長學(xué)段限定選修課程,課程內(nèi)容豐富全面[2]。大數(shù)據(jù)專業(yè)將此課程設(shè)計為專業(yè)基礎(chǔ)課程,以培養(yǎng)大學(xué)生數(shù)據(jù)分析和編程能力[3]。數(shù)據(jù)分析與可視化通識課程旨在培養(yǎng)廣泛的基礎(chǔ)知識和技能,側(cè)重點不是“專”,而是“識”和“通”。
數(shù)據(jù)分析與可視化課程的目標(biāo)是讓學(xué)生學(xué)習(xí)數(shù)據(jù)分析與可視化的基本方法,使學(xué)生掌握數(shù)據(jù)分析、設(shè)計和可視化開發(fā)的技能,且具備較好的分析和解決問題的能力,為未來從事數(shù)據(jù)科學(xué)相關(guān)領(lǐng)域的工作奠定牢固的基礎(chǔ)[4]。因此,如何進行該課程的建設(shè)以達到人才培養(yǎng)目標(biāo)是一個非常重要的問題[5]。
彭煥卜等[6]分析云南大學(xué)本科生某門課程的選修者的相關(guān)數(shù)據(jù),對選修者的成績、學(xué)習(xí)能力、學(xué)習(xí)內(nèi)容等進行分析并可視化展示,增強數(shù)據(jù)分析與可視化在教育教學(xué)中的應(yīng)用。楊艷霞等[7]采取案例教學(xué)法對網(wǎng)絡(luò)爬蟲得到的數(shù)據(jù)進行分析及可視化操作。然而這些探究對于非計算機專業(yè)的數(shù)據(jù)分析與可視化課程的建設(shè)借鑒意義不大。原因有:1) 上述參考文獻面向的是計算機相關(guān)專業(yè)的數(shù)據(jù)分析與可視化課程,對專業(yè)知識要求較高,而公共通識課大部分的選修同學(xué)編程基礎(chǔ)薄弱,應(yīng)在課程教學(xué)設(shè)計中考慮到此學(xué)情及通識課的構(gòu)建目標(biāo),培養(yǎng)學(xué)生更廣的知識面和處理問題的綜合能力;2) 數(shù)據(jù)分析與可視化課程內(nèi)容較多但學(xué)時有限,面對豐富的課程內(nèi)容不能只采取線下教學(xué),否則內(nèi)容設(shè)置和計劃難以落地實施。
以下將從教學(xué)研究和教學(xué)效果等方面對本課程建設(shè)進行探究,為數(shù)據(jù)分析與可視化課程及后續(xù)相關(guān)課程建設(shè)提供參考。
2 數(shù)據(jù)分析與可視化課程教學(xué)研究
數(shù)據(jù)分析與可視化課程的教學(xué)目標(biāo)是培養(yǎng)學(xué)生的信息數(shù)據(jù)可視化處理技能。本節(jié)提出此課程的教學(xué)內(nèi)容設(shè)計和實施方案。
2.1 課程定位與設(shè)計思路
由于Python簡單易學(xué),具有豐富的第三方庫,現(xiàn)成為眾多非計算機專業(yè)首選的編程語言。本課程使用Python語言,基于Numpy、Pandas、Matplotlib第三方庫,IDE是Jupyter Notebook(anaconda3) 。通過本課程的教授,讓學(xué)生掌握數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)可視化等內(nèi)容。在教學(xué)的過程中,對教學(xué)方法進行變革,提高學(xué)生的編程能力和計算思維,讓學(xué)生學(xué)會運用所學(xué)知識解決實際問題,培育具備數(shù)據(jù)素養(yǎng)和數(shù)據(jù)分析技能的應(yīng)用型人才。此外,激發(fā)學(xué)生動手編程的興趣,為將來高年級的學(xué)習(xí)打好扎實的基礎(chǔ)。
2.2 分層次教學(xué)模式設(shè)計
課程教學(xué)模式設(shè)計依據(jù)“認識數(shù)據(jù)、數(shù)據(jù)存儲訪問、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化”分層次逐層展開,如圖1所示。第一層是認識數(shù)據(jù),即掌握基本的Py?thon編程基礎(chǔ),建立從現(xiàn)實世界去理解計算機領(lǐng)域的抽象知識;第二層涉及數(shù)據(jù)文件的讀寫操作;第三層是針對特定應(yīng)用領(lǐng)域的數(shù)據(jù)進行處理與分析;第四層是可視化展示數(shù)據(jù)分析的結(jié)果。
第一層,認識數(shù)據(jù),掌握編程基礎(chǔ)。此內(nèi)容由淺入深,指引學(xué)生理解并運用Python語言基本語法,開發(fā)設(shè)計簡單應(yīng)用。首先讓學(xué)生逐步領(lǐng)會計算機編程的思維方式,掌握Python編程基礎(chǔ),理解變量、數(shù)據(jù)類型、操作符、表達式、字符串、流程控制語句等相關(guān)概念。讓學(xué)生熟練使用Jupyter Notebook進行簡單編程。接著深入講解Python內(nèi)建數(shù)據(jù)結(jié)構(gòu),包括:列表、元組、字典和集合,以及函數(shù)的定義和調(diào)用。演示典型示例,強化學(xué)生編程能力,幫助學(xué)生構(gòu)建模塊化程序設(shè)計思維。
第二層,數(shù)據(jù)存儲訪問。此內(nèi)容讓學(xué)生了解不同文件的類型及文件處理的過程和數(shù)據(jù)文件的讀寫訪問方法。通過實際操作向?qū)W生展示常用的txt和csv文件的讀寫操作,讓學(xué)生掌握如何通過程序?qū)ν獠看鎯ξ募M行操作。
第三層,數(shù)據(jù)處理與分析。數(shù)據(jù)處理與分析絕對繞不過兩個強大的第三方庫,即Numpy和Pandas。此內(nèi)容通過學(xué)習(xí)這兩個庫,讓學(xué)生掌握常用的數(shù)據(jù)處理操作技能,通過具體的案例應(yīng)用,進一步增強學(xué)生的編程思維。Numpy專門用來處理多維數(shù)組,其運算效果遠高于普通的列表。Pandas是基于Numpy的數(shù)據(jù)分析工具,能方便地操作大型數(shù)據(jù)集。通過第三方庫的學(xué)習(xí),學(xué)生可快速掌握常用的數(shù)據(jù)預(yù)處理、數(shù)據(jù)選擇、排序、統(tǒng)計、查詢、透視表等方法。
第四層,數(shù)據(jù)可視化。此內(nèi)容是讓學(xué)生能用可視化工具對數(shù)據(jù)進行可視化展示。該內(nèi)容主要是基于第三方庫matplotlib,讓學(xué)生掌握折線圖、散點圖、柱狀圖、直方圖、餅圖和箱線圖等常用繪圖方法。針對不同的數(shù)據(jù)和不同的應(yīng)用場景,選擇合適的繪圖方法是關(guān)鍵。至此,學(xué)生能靈活選擇數(shù)據(jù)繪圖方法,對數(shù)據(jù)分析的結(jié)果圖形化展示,實現(xiàn)數(shù)據(jù)分析完整流程。
2.3 教學(xué)實施方案
由于非計算機專業(yè)學(xué)生對編程普遍不感興趣,很難建立良好的程序設(shè)計思維,以下從教、學(xué)、評三方面來探討教學(xué)實施方案。
2.3.1 線上線下教學(xué)
本課程采取線上和線下混合式教學(xué)方式。首先,在課前,利用線上超星學(xué)習(xí)通平臺,推送知識點學(xué)習(xí)視頻,讓學(xué)生在課前預(yù)習(xí)將要學(xué)習(xí)的基礎(chǔ)知識,找出各自的疑惑點。其次,在線下教學(xué)過程中,學(xué)生帶著疑惑聽課,教師在授課時,通過學(xué)生互動反饋,重點解決學(xué)生課前預(yù)習(xí)過程中的疑難點,這樣線下授課更具針對性。然后,在線發(fā)布課程作業(yè),進一步鞏固課程學(xué)習(xí)的知識及技能。教師課后批改課程作業(yè),了解學(xué)生對知識點的掌握情況,針對常見問題可進一步強調(diào)重難點?;趯W(xué)生課前預(yù)習(xí)、課上互動、課程作業(yè)測試等過程,更全面地了解學(xué)生的學(xué)習(xí)情況,針對常見問題,實行“精準(zhǔn)教學(xué)”。
2.3.2 以學(xué)生為中心的分組學(xué)習(xí)
該課程是公共選修課,由于不同學(xué)院的學(xué)生對編程的掌握快慢不同,比如數(shù)學(xué)院的學(xué)習(xí)者利用自身的專業(yè)優(yōu)勢,學(xué)習(xí)編程知識較快,但外國語學(xué)院的學(xué)生就難以適應(yīng)快節(jié)奏學(xué)習(xí),因此,教師要注重異質(zhì)分組,互補共進。每組由5至8名學(xué)生構(gòu)成,以小組為單位完成數(shù)據(jù)分析與可視化項目設(shè)計等任務(wù)。小組教學(xué)已被證實在計算機教學(xué)中具有較好效果[8],不僅能促進學(xué)生交流,還能創(chuàng)建濃厚的課堂研討互動氣氛。與個人相比,分組的優(yōu)勢是小組成員能發(fā)揮各自的所長并在協(xié)作中彌補自身不足,共同進步。每次課程實驗在超星平臺發(fā)布,由小組長提交,內(nèi)容包括代碼、小組內(nèi)的分工、組內(nèi)互評等。線下上課時,每組進行匯報,教師對共性問題及各組的情況進行評價,如數(shù)據(jù)解讀、任務(wù)的設(shè)計與實現(xiàn)、程序設(shè)計思路等,通過組內(nèi)和組外兩層學(xué)習(xí)反饋,增強學(xué)生對知識的領(lǐng)悟和應(yīng)用。
2.3.3 多元考核評價
數(shù)據(jù)分析與可視化課程涵蓋的知識面較廣,不僅包括基本語法,還包含應(yīng)用能力的培養(yǎng),單一的課程考核方式不能全面測驗學(xué)生的學(xué)習(xí)程度。本課程的總成績包括平時考核成績和終結(jié)性考核成績。平時考核成績包括課堂考勤、超星視頻、課程實驗、階段性測驗,占總成績的70%;終結(jié)性考核是以小組為單位的期末綜合大作業(yè),占總成績的30%。其中,期末大作業(yè)是讓每個小組的學(xué)生根據(jù)其感興趣的領(lǐng)域采集、分析數(shù)據(jù)再可視化展示結(jié)果。在課程的最后一個教學(xué)周,讓每個小組長提交本組的數(shù)據(jù)集、源代碼和分析報告,每個小組派代表在課程上進行匯報。期末大作業(yè)的打分從小組的選題是否新穎、數(shù)據(jù)獲取及處理的工作量、可視化展示的效果、復(fù)雜度等評價。組內(nèi)可根據(jù)成員對大作業(yè)的貢獻度以及參與度互相評分。除此之外,為了調(diào)動學(xué)生在課堂上的積極性及主動性,教學(xué)互動等也考慮在評分中。
3 課程教學(xué)效果分析
2021年第一學(xué)期面向非計算機專業(yè)本科二年級學(xué)生開設(shè)了數(shù)據(jù)分析與可視化課程。學(xué)生已在一年級通過《Python程序設(shè)計基礎(chǔ)》學(xué)習(xí)了基本的語法和程序設(shè)計思維,由于課時有限僅學(xué)習(xí)到列表的相關(guān)知識,且所學(xué)內(nèi)容非常淺,學(xué)生對編程的興趣普遍不高。課程開始前對學(xué)生做了問卷調(diào)查,95%的學(xué)生認為本課程對未來的學(xué)習(xí)及就業(yè)有益,62%的同學(xué)感覺編程較難。
3.1 知識難點分析
根據(jù)2021年第一輪的教學(xué)經(jīng)驗,發(fā)現(xiàn)學(xué)生對于基礎(chǔ)的Python語法掌握較好,函數(shù)和控制結(jié)構(gòu)掌握情況相對較弱。對于Numpy學(xué)習(xí)的難點在于多維數(shù)組,Pandas的學(xué)習(xí)難點在于兩個Pandas數(shù)據(jù)結(jié)構(gòu)——Se?ries和DataFrame的運用。在學(xué)習(xí)Matplotlib這部分內(nèi)容時,由于函數(shù)較多,且每個函數(shù)的參數(shù)也較多,學(xué)生對于圖形的選擇和圖的格式設(shè)置會產(chǎn)生眼花繚亂的感覺,因此,針對這些難點在教學(xué)中需要重點突破。
3.2 應(yīng)用實踐能力評價
期末綜合大作業(yè)讓學(xué)生分組選擇他們感興趣的數(shù)據(jù),由于本門課程針對的是非計算機專業(yè)的學(xué)生,主要包括以下學(xué)院:金融學(xué)院、國際經(jīng)貿(mào)學(xué)院、保險學(xué)院、法學(xué)院、統(tǒng)計與數(shù)學(xué)學(xué)院、人文藝術(shù)學(xué)院、金融科技學(xué)院。上交的大作業(yè)的數(shù)據(jù)集涉及金融、房地產(chǎn)、就業(yè)等多類數(shù)據(jù)集。期末綜合大作業(yè)的考核方式是百分制,包括數(shù)據(jù)的選?。?%) 、數(shù)據(jù)的導(dǎo)入導(dǎo)出(5%) 、數(shù)據(jù)預(yù)處理(20%) 、數(shù)據(jù)分析(30%) 、數(shù)據(jù)可視化(20%) 和小組匯報講解(20%) 。期末綜合大作業(yè)的評價結(jié)果如圖2所示。
每個小組均有自主設(shè)計分析問題的能力。對于問題的提出和對分析結(jié)果的闡釋方面,得分率較高;對于數(shù)據(jù)的圖形化展示方面,圖形選取的合理性和表達的精準(zhǔn)性等方面有待增強。
針對非計算機專業(yè)的學(xué)生,雖然他們編程基礎(chǔ)弱,但通過小組合作的方式學(xué)生可以提交高質(zhì)量的項目大作業(yè)。各個小組對擅長領(lǐng)域的數(shù)據(jù)集進行了深刻分析,較好地完成了數(shù)據(jù)分析與可視化作業(yè)。
4 結(jié)束語
數(shù)據(jù)分析與可視化作為一門新課程,為實現(xiàn)教育培養(yǎng)目標(biāo),需持續(xù)從教學(xué)內(nèi)容、教學(xué)方法和過程等方面不斷完善。本文針對數(shù)據(jù)分析與可視化課程,基于分層次教學(xué)模式的教學(xué)理念和線上線下混合式教學(xué)模式,從課程定位、設(shè)計思路、以學(xué)生為中心的分組學(xué)習(xí)和多元考核評價等多方面進行了設(shè)計和探究。通過小組展示項目大作業(yè),能看出課程教學(xué)改革效果顯著,學(xué)生能應(yīng)用所學(xué)知識對某領(lǐng)域或某行業(yè)的數(shù)據(jù)進行挖掘與分析實踐,進而挖掘出數(shù)據(jù)潛在的聯(lián)系和價值。未來將進一步完善內(nèi)容體系,精練課程內(nèi)容和方法,爭取打造具有高階性、創(chuàng)新性和挑戰(zhàn)度的雙一流課程。