李海林
摘 要: 近年來,大數(shù)據(jù)引起了各界相關部門的高度關注,中科院和各高校開始重視該方向的教學和研究。針對目前大數(shù)據(jù)帶來的社會影響力,根據(jù)大數(shù)據(jù)具體特性以及數(shù)據(jù)挖掘學科交叉性強的特點,結合實際教學經驗,分別從培養(yǎng)數(shù)據(jù)意識、加強理論體系、創(chuàng)新教學方法和深入科學研究等四個方面來探索如何設計高校數(shù)據(jù)挖掘課程,以解決大數(shù)據(jù)時代下數(shù)據(jù)挖掘課程因抽象而帶來的問題,為培養(yǎng)優(yōu)秀的大數(shù)據(jù)研究人才奠定理論基礎。
關鍵詞: 大數(shù)據(jù); 數(shù)據(jù)挖掘; 教學方法; 人才培養(yǎng)
中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2014)02-54-02
0 引言
近年來,隨著科技進步和社會的發(fā)展,以數(shù)據(jù)為中心的各領域產生了越來越多的數(shù)據(jù),引起了各界業(yè)內人士的高度關注。2012年初,美國政府投入2億美元啟動“大數(shù)據(jù)研究和發(fā)展計劃”,使得大數(shù)據(jù)研究上升為國家意志,這意味著大數(shù)據(jù)對將來科學技術、經濟發(fā)展,以至國家安全都有深遠的影響。大數(shù)據(jù)的特點[1-2]可以歸結為四個V,即Volume(體量大)、Variety(模態(tài)多)、Velocity(速度快)和Value(價值密度低)。然而,從這樣的數(shù)據(jù)中挖掘和發(fā)現(xiàn)潛在有用的信息和知識,對數(shù)據(jù)理論分析和數(shù)據(jù)挖掘技術的要求也相應提高。
數(shù)據(jù)挖掘作為高校理學和工學專業(yè)設計中一門主導課程[3-4],其原始目的主要是讓大學本科學生對數(shù)據(jù)挖掘的相關基礎知識有一定的了解,并對較為成熟的技術和方法具有相應的應用分析能力。然而,針對大數(shù)據(jù)在現(xiàn)今各領域中的重要性以及它所帶來的諸多問題和挑戰(zhàn),則應該從高校課程設置的層面作考慮,建立并完善適應時代發(fā)展的人才培養(yǎng)體系。本文根據(jù)大數(shù)據(jù)的特點和其發(fā)展方向,探索如何提高數(shù)據(jù)挖掘課程的教學質量,從教學層面探討大數(shù)據(jù)研究人才的培養(yǎng)。
1 教學探索
1.1 科學引導,培養(yǎng)數(shù)據(jù)意識
數(shù)據(jù)挖掘是以數(shù)據(jù)為驅動的理論分析和應用課程,它既有具體性又有抽象性。具體性表現(xiàn)為其研究內容是以具體的數(shù)據(jù)為對象挖掘出的信息和知識比較客觀,具有一定的解釋性和理解性。抽象性表現(xiàn)為數(shù)據(jù)挖掘過程中理論、技術和方法等概念,課堂上一般難以在短時間內被消化和理解。針對這些問題,在進行數(shù)據(jù)挖掘課程設計之前,先要科學地引導學生對數(shù)據(jù)挖掘產生興趣,并且逐漸培養(yǎng)學生的數(shù)據(jù)意識。
在數(shù)據(jù)挖掘課程中,可以先安排2至4個學時來講解什么是數(shù)據(jù),讓學生理解數(shù)據(jù)在當今社會中的重要意義。特別地,針對大數(shù)據(jù)時代的到來,更多地讓學生了解何謂“大數(shù)據(jù)”,大數(shù)據(jù)來自生活中的哪些方面,大數(shù)據(jù)的增長方式和情況如何,哪些領域中通過大數(shù)據(jù)相關研究取得了什么樣的成果等。同時,通過實例或視頻教學引導學生知道數(shù)據(jù)就在身邊,并且能夠通過數(shù)據(jù)挖掘技術來發(fā)現(xiàn)有用的信息和知識,為企業(yè)、政府和高校服務,使學生知道數(shù)據(jù)對于企業(yè)競爭的意義。另外,為了增強學生對數(shù)據(jù)挖掘更深刻的認識,通過數(shù)據(jù)分析或數(shù)據(jù)挖掘相關的招聘案例,從招聘熱門程度、職位性質、工資待遇以及可持續(xù)性發(fā)展的前景等就業(yè)規(guī)劃角度來吸引學生對大數(shù)據(jù)以及數(shù)據(jù)挖掘的了解和興趣,以便為接下來的數(shù)據(jù)挖掘課程學習做好心理準備。
1.2 深化基礎,加強理論體系
大數(shù)據(jù)的特征決定了現(xiàn)有的數(shù)據(jù)中心技術很難滿足其分析需求,主要表現(xiàn)在去噪降維技術、數(shù)據(jù)特征表示、數(shù)據(jù)存儲、數(shù)據(jù)整合、非結構化和半結構化處理、數(shù)據(jù)通信傳輸和處理等方面。這些決定了數(shù)據(jù)挖掘技術面臨著更嚴峻的挑戰(zhàn),并且數(shù)據(jù)挖掘的知識將涉及到數(shù)據(jù)庫技術、機器學習、統(tǒng)計分析、模式識別、信息檢索、高性能和智能計算等學科內容。然而,在目前的大學生課程體系中,難以在有限的時間內開設這些課程。針對這個問題,我們的做法是:將數(shù)據(jù)挖掘課程授課對象定位在高年級的學生,即大三或大四年級,這些學生一般對學習目標有較清晰的認識,并且有一定的知識儲備;做好前期課程的準備,如開設高等數(shù)學、高等代數(shù)、統(tǒng)計分析、概率等數(shù)學體系課程,以及算法設計與分析、數(shù)據(jù)庫原理、計算機系統(tǒng)原理等計算機課程,為學好數(shù)據(jù)挖掘打下必要的基礎理論。除些之外,鼓勵學生自覺學習這些相關課程,并推薦一些經典且較易理解的文章和書籍。為了讓學生更好地了解國內外最新有關大數(shù)據(jù)的知識以及數(shù)據(jù)挖掘技術的進展,大學生英文閱讀理解和寫作水平的培養(yǎng)也值得關注。因此,在數(shù)據(jù)挖掘課程體系中,需要深化基礎技能和理論體系,為后期學習數(shù)據(jù)挖掘課程提供便利條件和知識儲備。
1.3 聯(lián)系實踐,創(chuàng)新教學方法
理論來源于實踐,而實踐是檢驗理論的途徑。由于學生對大數(shù)據(jù)認識的模糊性以及數(shù)據(jù)挖掘理論和算法的抽象性,數(shù)據(jù)挖掘教學方法應該讓學生明白所學課程內容的具體原理和實際應用領域。在基本的教學過程中,對數(shù)據(jù)挖掘的基本概念、原理和算法的講解最好結合案例教學法[5-6],并且使用具體的數(shù)據(jù)演算實例來分析數(shù)據(jù)挖掘的過程和結果,使學生從實際案例中明白數(shù)據(jù)挖掘技術在處理大數(shù)據(jù)過程中的作用和意義。
除了從授課內容和教學方法方面改善外,學生自己的積極參與可以大大提高整個教學質量。學生是課堂學習的主體對象,被動學習的效果不如主動學習,即讓學生欣然接受數(shù)據(jù)挖掘中的新內容和新方法,并且鼓勵他們利用所學知識去解決科學實踐問題。因此,在數(shù)據(jù)挖掘課程設計過程中可以采用案例采編及案例分析法,讓學生自己獨立或組隊去搜集新課程內容涉及到的案例,讓他們每兩周提供一次案例分析報告,報告內容主要是數(shù)據(jù)挖掘在數(shù)據(jù)分析中的作用以及處理過程。同時,在上機實驗時,讓學生演算案例中的具體實例,進而有針對性地指導、啟發(fā)學生積極思考。另外,針對每次案例采集和實驗,讓學生提交相應的分析報告,使得教師能更好地把握好學生對數(shù)據(jù)挖掘新內容理解和接收程度。
1.4 增強興趣,深入科學研究
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘將面臨著比以往更大的挑戰(zhàn),這也使得數(shù)據(jù)挖掘將涉及到更多的學科,造成教學難度加大。因此,在教學工作中,教師要發(fā)揮主導作用,積極引導學生學習新知識的興趣。例如,讓學生間隔性地去了解大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘技術解決了什么問題,哪些企業(yè)或政府在這方面又有了什么創(chuàng)舉,甚至讓他們調查如今各大型招聘網(wǎng)中有關大數(shù)據(jù)分析和數(shù)據(jù)挖掘等職位的情況,進而增強學生對數(shù)據(jù)挖掘的興趣。
另外,高年級中部分學生可能將選擇深造,出國或考研。針對這部分學生,可以鼓勵其選擇數(shù)據(jù)挖掘方向的科學研究。通過分配一些具體且較為長期的課題任務讓這些學生來完成,其研究內容可以精細到一個數(shù)據(jù)挖掘算法的研究,這樣可以培養(yǎng)他們對問題的深刻認識,有助于他們對研究問題和研究方法的精確把握??梢酝ㄟ^閱讀經典文獻,掌握最新技術和方法,努力培養(yǎng)學生的創(chuàng)新性思維,并且鼓勵和引導他們進行學術性創(chuàng)作。通過把科學研究引入到實際教學中,不僅可以培養(yǎng)學生接收新知識的能力,還可以提高其解決問題的能力,為他們后期的大數(shù)據(jù)科學研究打下較為堅實的基礎。
2 結束語
數(shù)據(jù)挖掘是大數(shù)據(jù)環(huán)境下高校急需開設的一門重要課程。傳統(tǒng)教學主要是講解數(shù)據(jù)挖掘的基礎知識,學生對于抽象的概念和知識難以理解。針對數(shù)據(jù)挖掘交叉性強且知識結構較為復雜的情況,提出相應的教學策略以提高學生對知識內容和技術方法的興趣。本文根據(jù)大數(shù)據(jù)的特征、作用和意義,結合實際教學經驗,重點從培養(yǎng)學生的數(shù)據(jù)意識、加強理論體系、創(chuàng)新教學方法和深入科學研究等方面進行數(shù)據(jù)挖掘課程教學設計,為提高大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘課程的教學質量提供參考依據(jù)。實踐教學結果表明,該教學方法不僅能夠提高學生對數(shù)據(jù)挖掘的興趣,更有利于學生掌握課程的主要內容,并且對培養(yǎng)學生在計算機科學領域中數(shù)據(jù)算法研究能力具有一定的幫助。本文教學方法主要應用于大學本科的數(shù)據(jù)挖掘課程,對于研究生的大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘教學模式和課程設計有待于進一步探索和研究。
參考文獻:
[1] 王珊,王會舉,覃雄派等.架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機學報,2011.34(10):1741-1752
[2] 李國杰,程學旗.大數(shù)據(jù)研究:未來科技及經濟社會發(fā)展的重大戰(zhàn)略領域[J].中國科學院院刊,2012.27(6):647-657
[3] 黃美麗.“數(shù)據(jù)倉庫與數(shù)據(jù)挖掘”研討型教學實踐探析[J].計算機時代,2012.12:52-53,55
[4] 劉建偉.數(shù)據(jù)挖掘課程設計的教學探索[J].科技信息,2013.23:55-56
[5] 王華秋.任務驅動的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程案例教學[J].黑龍江教育(高教研究與評估),2011.6:52-53
[6] 周森鑫,盛鵬飛,王夫芹.數(shù)據(jù)挖掘課程案例教學研究[J].計算機技術與發(fā)展,2012.11:183-186