張程偉
摘要:《數(shù)據(jù)分析基礎(chǔ)》課程是數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的一門專業(yè)基礎(chǔ)課程。本文主要介紹了浙大城市學院《數(shù)據(jù)分析基礎(chǔ)》課程的建設(shè)思路,并總結(jié)了2020年教學實踐情況。
關(guān)鍵詞:數(shù)據(jù)分析;課程建設(shè);教學實踐
一、引言
《數(shù)據(jù)分析基礎(chǔ)》是我校大數(shù)據(jù)專業(yè)的必修課程。張彩伢等[1]提到在大數(shù)據(jù)專業(yè)人才培養(yǎng)模式中要構(gòu)建多層次的實踐教學體系:基礎(chǔ)實驗層、綜合設(shè)計層和應(yīng)用創(chuàng)新層?!稊?shù)據(jù)分析基礎(chǔ)》就是基礎(chǔ)實驗層的實踐類課程。周黎鳴等[2]分析了工科背景下數(shù)據(jù)分析的課程設(shè)計,側(cè)重于可視化的實現(xiàn),而我校數(shù)據(jù)分析課程是在理科背景下,側(cè)重于采用統(tǒng)計方法進行數(shù)據(jù)分析,主要教授R語言和Python語言的數(shù)據(jù)分析編程方法。朝樂門等[3]指出數(shù)據(jù)科學課程的一大難點就是理論基礎(chǔ)的跨學科性,數(shù)據(jù)分析實踐就是統(tǒng)計學、機器學習及可視化的一個重要接合點,無論對學生的學習還是對老師的教學都充滿著挑戰(zhàn)。
我校該課程主要介紹R語言以及Python語言的編程基礎(chǔ)以及數(shù)據(jù)分析相關(guān)理論方法。該課程的教學可以讓學生熟悉數(shù)據(jù)分析相關(guān)的工具R以及Python的編程環(huán)境和編程技術(shù),同時培養(yǎng)學生能夠使用R以及Python進行數(shù)據(jù)分析處理的能力,最終使學生掌握數(shù)據(jù)可視化以及基本數(shù)據(jù)分析的相關(guān)理論方法和具備使用R以及Python編程工具進行編程實現(xiàn)的能力。學生通過該課程的學習,提高動過手能力和獨立思考能力,能夠更好更輕松地將后續(xù)學習中關(guān)于數(shù)據(jù)處理的理論模型知識應(yīng)用到實處。
二、浙大城市學院統(tǒng)計軟件課程教學探索歷程
《數(shù)據(jù)分析基礎(chǔ)》是數(shù)據(jù)分析工具語言類的課程,隨著計算機相關(guān)軟件的發(fā)展,浙大城市學院的相關(guān)教學也經(jīng)歷了以下幾個階段:
2008年開始面向統(tǒng)計專業(yè)開設(shè)了《實用統(tǒng)計軟件》,培養(yǎng)學生實用計算機軟件進行統(tǒng)計建模分析的能力。課程教學內(nèi)容從使用SPSS進行統(tǒng)計分析到使用SAS進行統(tǒng)計分析的編程實現(xiàn),從菜單式數(shù)據(jù)分析的計算機應(yīng)用到統(tǒng)計建模的編程實現(xiàn)。
2016年開始面向統(tǒng)計專業(yè)開設(shè)《統(tǒng)計軟件基礎(chǔ)(雙語)》,為了跟上學科發(fā)展的潮流,更好地開拓學生的統(tǒng)計建模實現(xiàn)能力,課程內(nèi)容轉(zhuǎn)為使用R語言進行統(tǒng)計建模分析。
2019年開始,我校新開設(shè)數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè),為了使學生在未來的學習和研究中擁有足夠的數(shù)據(jù)處理和計算編程能力,開設(shè)《數(shù)據(jù)分析基礎(chǔ)》,重點介紹統(tǒng)計建模的R語言以及成熟的用于數(shù)據(jù)分析的Python語言的編程基礎(chǔ)以及數(shù)據(jù)分析相關(guān)理論方法和計算機編程實現(xiàn)。
三、課程建設(shè)
本課程建設(shè)的重點主要放在案例的設(shè)計和課堂教學形式的優(yōu)化。
本課程作為一門新開課程,建立在歷史開設(shè)的幾門相關(guān)課程的基礎(chǔ)之上,擁有一些教學案例的積累。教學內(nèi)容包括: R編程環(huán)境的熟悉、R語言數(shù)據(jù)結(jié)構(gòu)、基本統(tǒng)計分析及繪圖的R實現(xiàn)以及Python語言的基本語法、numpy科學計算庫、pandas數(shù)據(jù)分析處理庫和利用Matplotlib庫進行數(shù)據(jù)可視化。
數(shù)據(jù)分析基礎(chǔ)這門課程的特色在于培養(yǎng)學生熟悉使用相關(guān)計算機編程語言的同時還要熟悉數(shù)據(jù)分析的相關(guān)理論基礎(chǔ)的同時,將二者結(jié)合起來,達到能夠使用R或者Python進行具體的數(shù)據(jù)處理和分析。
改革的創(chuàng)新點也在于和通過大量具體的數(shù)據(jù)分析案例入手,進行案例教學,在課堂上培養(yǎng)學生能夠針對不同數(shù)據(jù)案例給出相應(yīng)的分析建模方法,然后利用計算機進行編程實現(xiàn),而不是單純割裂地進行R語言或者Python語言的編程教學或者是數(shù)據(jù)分析理論的教學。
教學形式上增加學生的動手參與的機會,改革課程考核的方式,注重考查教學過程中學生的參與程度與效果。課程成績的評定將包括:平時成績(考勤+作業(yè))以及期末考查,期末考查的形式以上機完成一次綜合的數(shù)據(jù)分析實訓為主,不唯考,重過程,看成效。
作為首開課程,在未來的教學過程中,將會首先將課程體系建設(shè)完善,完善教學的內(nèi)容和教學的案例以及考核內(nèi)容。然后調(diào)研大數(shù)據(jù)專業(yè)后續(xù)專業(yè)課程任課老師的教學需要,調(diào)整優(yōu)化本課程的教學內(nèi)容,使本課程融入專業(yè)課程建設(shè)的需要,提升學生的專業(yè)能力,更好地為其在后續(xù)的專業(yè)學習和研究服務(wù)。
(一) 課程教學內(nèi)容及課時安排:
1. Python語言基礎(chǔ)(8學時)
2. Numpy基礎(chǔ)(8學時)
3. Pandas入門(8學時)
4. Python繪圖與可視化(8學時)
5. Python數(shù)據(jù)分析初步(4學時)
6. R語言基礎(chǔ)知識(8學時)
7. R數(shù)據(jù)結(jié)構(gòu)(8學時)
8. R數(shù)據(jù)轉(zhuǎn)換(4學時)
9. R數(shù)據(jù)可視化(4學時)
10. R描述性統(tǒng)計分析及隨機模擬(4學時)
(二)考核重點:熟悉Python的使用環(huán)境和編程方法,能夠使用Python進行基本的數(shù)據(jù)處理與分析任務(wù)。熟悉R語言的語法結(jié)構(gòu)與數(shù)據(jù)處理方法,能夠使用R進行基本的數(shù)據(jù)處理與分析任務(wù)。
(三)必須掌握的基本知識點:Python的運行編譯環(huán)境;Python語言基礎(chǔ),序列函數(shù)的使用,循環(huán)語句以及分支控制語句的應(yīng)用;內(nèi)建的數(shù)據(jù)結(jié)構(gòu)以及函數(shù)的定義與使用;numpy多維數(shù)組及逐元素通用函數(shù);pandas數(shù)據(jù)結(jié)構(gòu)及其基本操作;數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)可視化方法;數(shù)據(jù)的分組、聚合。熟悉R中的內(nèi)容顯示;變量、向量的生成、管理與運算;函數(shù)的定義;程序包的裝載與使用;數(shù)據(jù)的輸入、輸出與管理;矩陣、數(shù)據(jù)框的定義與管理;數(shù)據(jù)的轉(zhuǎn)換;字符串與日期類數(shù)據(jù);統(tǒng)計相關(guān)基礎(chǔ)運用(數(shù)據(jù)匯總,描述性統(tǒng)計分析,樣本均值t檢驗,正態(tài)性檢驗等);R繪圖及圖形控制;其他一些關(guān)于R編程的有用方法。
考核內(nèi)容為平時十二次實驗作業(yè)每次提交,期中進行一次Python數(shù)據(jù)分析技能的上機考核,期末進行一次R數(shù)據(jù)分析技能的上機考核。
(四)考核的評定(評分)標準:(1)課程要求學生全程參與并簽到,不得無故缺勤。考勤總分為10分,無故缺勤一次減2分,無故缺勤次數(shù)達到3次,取消該課程的考核資格。(2)平時作業(yè)每次滿分10分,按照解答的準確性以及態(tài)度進行評分,最后總合按30分折算加入期末總評。(3)期中及期末考核按照完成任務(wù)的質(zhì)量和數(shù)量進行評分,各滿分100分。(4)期末總評=平時作業(yè)成績(30分)+考勤(10分)+期中考核(30%)+期末考核(30%)
四、教學實踐
以上課程體系,經(jīng)過一輪針對2019級學生的教學,學生成績?nèi)缦卤硭荆簠⑴c考核的總?cè)藬?shù)為63人,及格率為97%,優(yōu)秀率為62%。
從考核結(jié)果來看,學生基本能夠掌握并運用所學Python或者R語言進行簡單的數(shù)據(jù)分析工作,整體表現(xiàn)較好,學生們的學習主動性較強,在一個學期之內(nèi)基本掌握了兩門數(shù)據(jù)分析語言,成績理想。存在的問題主要有部分同學對于數(shù)據(jù)分析應(yīng)用的上機考核形式不是很熟悉,平時缺乏練習。
參考文獻:
[1] 張彩伢,王貴. 理科大數(shù)據(jù)專業(yè)數(shù)據(jù)分析人才培養(yǎng)模式的探究[J]. 教育現(xiàn)代化,2021,8(01):37-41.
[2] 周黎鳴,林英豪,李征,陳小潘.新工科背景下大數(shù)據(jù)專業(yè)課程建設(shè)[J].計算機時代,2021(01):102-105.
[3] 朝樂門,楊燦軍,王盛杰,趙俊鵬,許夢甜.全球數(shù)據(jù)科學課程建設(shè)現(xiàn)狀的實證分析[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2017,1(06):12-21.