黃丹珍 李小強
摘 要: 文章根據(jù)數(shù)據(jù)倉庫發(fā)展的現(xiàn)狀和教學存在的問題,從理論和實踐出發(fā),對這些問題進行闡述,以求在以后的數(shù)據(jù)倉庫課程教學中取得較好的教學效果。
關(guān)鍵詞: 數(shù)據(jù)倉庫 存在問題 解決策略
在當今的信息時代,數(shù)據(jù)時刻以指數(shù)方式增長,人們每天都在不知不覺中與形形色色的數(shù)據(jù)打交道,如銀行查詢?nèi)】?、電話通訊等。然而在這個數(shù)據(jù)大爆炸時代的背景下,如何利用這些信息和數(shù)據(jù),并從這些數(shù)據(jù)中提煉出幫助人們選擇和決策的信息,成了當今社會的一門重要科學;當然也成了當今高校的一門重要課程和研究方向(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)。因為數(shù)據(jù)倉庫是建立在數(shù)據(jù)庫基礎(chǔ)上的一門科學,而且理論與實踐都較復雜,所以一般在本科高年級或者研究生才開設(shè)此專業(yè)和課程。我從數(shù)據(jù)倉庫原理特點出發(fā),探討了當前數(shù)據(jù)倉庫原理課程教學中存在的一些問題及解決策略。
一、教學內(nèi)容不統(tǒng)一
因數(shù)據(jù)倉庫是一門新型科學技術(shù),教學目標和教學大綱要求沒有明確的要求,因此該專業(yè)的課程選擇非常廣泛,各高校教學側(cè)重點有所不同。
由于數(shù)據(jù)倉庫的主要特點是強調(diào)解決現(xiàn)實生活中的問題,這樣課程安排和教學的內(nèi)容必須貼近行業(yè)需求,說白了就是讓學生在就業(yè)時有好的選擇,因此,該專業(yè)對學生的實踐、動手能力的要求標準非常高。目前,我接觸的大多數(shù)數(shù)據(jù)倉庫理論課程,雖然注重實用技能,但教學方法仍然停留在傳統(tǒng)基礎(chǔ)上,有很大比例的教學內(nèi)容是圍繞原理展開,對實際應用和操作能力的要求遠遠不夠,因此,對在原有課程內(nèi)容繼續(xù)進行調(diào)整,使設(shè)置課程的基本原則建立在將數(shù)據(jù)倉庫理論與現(xiàn)實生活實踐相結(jié)合的基礎(chǔ)上,并使學生自由選擇課程內(nèi)容,使不同專業(yè)方向的學生有選擇地培養(yǎng)動手能力,同時通過調(diào)整理論課和選修課的比例,獲得符合自身發(fā)展方向的知識。
事實上,盡管數(shù)據(jù)倉庫的技術(shù)發(fā)展飛速,但基礎(chǔ)理論是相對穩(wěn)定的,也就是說,數(shù)據(jù)倉庫的基本理論是變化不大的,因此,在進行教學時要保持教學大綱基本穩(wěn)定,而課程內(nèi)容設(shè)置時,努力將基本理論擴展到操作實踐中,使學生在掌握數(shù)據(jù)倉庫理論的基礎(chǔ)上更理解實踐中為何要這樣設(shè)計,并且推陳出新。
二、教材的選擇存在的問題
數(shù)據(jù)倉庫教材,無論是對教師還是學生來講,都有不可替代的作用,它是該課程教學內(nèi)容的主要依據(jù),教材的不同,直接影響教學方法的實施。目前,市面上的數(shù)據(jù)倉庫教材形式多種多樣,根據(jù)學生對職業(yè)規(guī)劃側(cè)重點的不同,基本教材可分為原理教材、實踐應用型教材和理論與應用型教材。對學習數(shù)據(jù)倉庫的學生而言,僅僅學習理論,與應用脫鉤顯然是不行的,因此,大多數(shù)高校選擇應用型教材或者理論和應用相結(jié)合的教材,但這樣籠統(tǒng)地選擇仍然是不夠的。根據(jù)數(shù)據(jù)倉庫的特點,學生專業(yè)方向有很大不同,目前存在的專業(yè)方向大致有數(shù)據(jù)過濾、數(shù)據(jù)抽取、數(shù)據(jù)建模、數(shù)據(jù)報表等,因為專業(yè)方向的不同直接影響學生的未來就業(yè),這無疑增加了教材選擇的難度,同時,同一類型的教材無法滿足不同學生的需求,編纂者無法把教學內(nèi)容涵蓋所有的理論和實踐。
以上都是教材選擇面臨的問題,要通過簡單選擇不同類型的教學材料顯然是不能夠解決所有問題的。這就要求教師在教學過程中,盡量選擇和補充符合專業(yè)和專業(yè)方向所需要的材料,同時通過改變教學方法,使教學內(nèi)容更具有突出的針對性和實用性。
三、教學設(shè)計存在的問題
教學設(shè)計就是指課堂教學的設(shè)想和計劃,這對數(shù)據(jù)倉庫這門課來講非常重要,因為數(shù)據(jù)倉庫原理的復雜性且技術(shù)本身還在不斷更新,簡單地采用課題實錄、過程呈現(xiàn)或者導學案例只會使課堂索然無味。
我認為數(shù)據(jù)倉庫教學設(shè)計應該在以下幾個方向設(shè)計:
1.營造氛圍,借機提出問題
一堂課的氣氛很重要,導入課題更重要,在數(shù)據(jù)倉庫的教學中要精心設(shè)計導入語,做到一上課就牢牢地吸引學生的注意力,并激發(fā)學生的學習興趣。
2.加強與學生的探討、互動
在課堂合適的時機,加強與學生的互動,引用不同的案例,使學生在老師的引導下,充分發(fā)揮主動性與能動性,提高自我解決問題的能力,這對學習數(shù)據(jù)倉庫這門課來講很容易做到,同時建議老師采用這種教學方式。
3.解釋、概括
某些老師不重視這個環(huán)節(jié),通常比較簡單或沒有。建議:不能忽視,將這個環(huán)節(jié)上出一定的特色。很多老師在這個環(huán)節(jié)略微帶過,其實這部分很重要,所謂老師的職責“傳道授業(yè)解惑也”,在課堂的結(jié)尾處,對數(shù)據(jù)的倉庫的精髓進行概括和解釋,一般會取得畫龍點睛的效果。
4.當堂訓練,鞏固達標
這個環(huán)節(jié)跟所有的課一樣,主要讓學生當堂鞏固,加深理解。
四、教學方式、方法要有所側(cè)重
數(shù)據(jù)倉庫作為一門實踐標準要求很高、而理論基礎(chǔ)又比較深的課程,在教學目標的設(shè)定上對學生提出比較高的要求,不僅要求學生有比較扎實的理論基礎(chǔ),而且要求實踐操作能力強。但目前從事教學的教師有豐富項目經(jīng)驗的非常少,這就使這門課教學方法顯得單一甚至枯燥,有的學校甚至直接將實踐這一非常重要的技能培訓直接扔給學生的實習單位;而單一的理論教學,會導致學生缺乏實際的操作經(jīng)驗,不能滿足工作的需要,很難達到企業(yè)的用人標準,更別說滿意。
因此,為了解決上述問題,我們應該從根源入手,根據(jù)教學目標的要求,加強對學生實踐技能的培養(yǎng),這些都需要對教學方式和教學方法進行改革。
首先在硬件配置方面,給學生提供模擬崗位操作實踐環(huán)境,通過以理論、應用、培養(yǎng)個人能力為目標的教學方式,讓學生在掌握數(shù)據(jù)倉庫理論的基礎(chǔ)上,對各種實際的數(shù)據(jù)倉庫開發(fā)項目進行分析演練,以達到學以致用的教學目的。同時,在教學方法上和教學過程中,教師要積極引導學生通過各種方式自主設(shè)計數(shù)據(jù)倉庫項目,從被動和主動兩方面,培養(yǎng)他們學習和實踐的能力。下面介紹幾種比較合適數(shù)據(jù)倉庫的教學方法:
1.老師、學生互動式的教學方法
互動式教學指在教學過程中,學生與老師雙方在平等的基礎(chǔ)上進行交流、探討、協(xié)商,根據(jù)各自依據(jù),彼此討論、辯解甚至激烈的碰撞,達到以理服人、以事實為依據(jù)的教學效果,這種教學方法既能調(diào)動學生學習的主動性,又可以拓展學生的創(chuàng)造性思維。
這里我們舉一個關(guān)于數(shù)據(jù)抽取的教學方法,當然是先由老師講解數(shù)據(jù)抽取的原理、必要性及實現(xiàn)的過程;接著老師就要通過一個具體的簡單實例(用SQL來實現(xiàn))講解一個具體實現(xiàn)的過程,接著老師可以提出問題,在問題的基礎(chǔ)上提出更復雜的案例,由于前面老師已經(jīng)作了比較詳細的案例分析,學生一般都可以通過自己的思考和動手完成這個更復雜的案例,接著老師就可以數(shù)據(jù)抽取的算法準確性、效率提出問題,并講解對大型數(shù)據(jù)進行數(shù)據(jù)抽取時應該做哪些準備,有經(jīng)驗的老師還可以介紹他們在具體生活中的案例是怎樣實現(xiàn)的等,通過這些講解,讓學生深入思考、理解數(shù)據(jù)抽取的精髓,并開始探討如何改進現(xiàn)有的案例算法,達到課程循序漸進、逐步理解、到掌握的最高目的。對于一些具體案例,老師還可以通過精彩的視頻演示給學生看后,再探討、再加以理論與現(xiàn)實的引導,從而使學習過程生動、直觀,最后使學生實現(xiàn)掌握的目標。
2.自主學習
數(shù)據(jù)倉庫是一門理論比較深,高年級或者是研究生才上的課程,因此學習該課程的學生一般都具備良好的信息技術(shù)基礎(chǔ),自學能力也比較強,所以,該課程由老師引導,解剖難點后,讓學生自主學習是一種很好的教學方法。比如,數(shù)據(jù)采集與數(shù)據(jù)清洗部分的講解,如果老師一味在課程上講,如何如何,其結(jié)果是學生一知半解,或者只有一個印象,但如果把學生分組,老師共同參與討論,學生在分組討論中理解為何有些數(shù)據(jù)必須在歸納在這個維度上,那些數(shù)據(jù)必須剔除,那些數(shù)據(jù)是錯誤的;最終老師做歸納總結(jié)。通過這種自主學習的過程,讓學生摸索現(xiàn)實項目中存在的問題,老師與學生共同學習、討論,這樣不僅加強了學生對專業(yè)知識的掌握,而且鍛煉了學生的口才,加強了師生之間的交流。
3.教師博客、微博與數(shù)據(jù)倉庫教學
現(xiàn)在上課的時間一般是45分鐘,學生要在課題上掌握所有知識是不可能的,因此在課余時間加強與老師的溝通是一種必不可少的方式。目前比較多的方式是E-mail,但該方式功能太過單一。校園網(wǎng)也提供了基于論壇、師生互動等平臺,但由于受校園網(wǎng)的限制,應用也不是太廣泛。最近興起了微信等平臺,老師可把自己的教學理念、教學日志、教學內(nèi)容等上傳到網(wǎng)上,也可引用國內(nèi)外優(yōu)秀資料鏈接到自己網(wǎng)頁上;學生可在老師上微信上留言、討論、下載等,老師也可隨時隨地地回答學生的問題,這就極大地豐富了交流的方式,不受空間和時間的限制。
4.考核方式
數(shù)據(jù)倉庫這門課目前大多數(shù)學校的考核方式還是以期末筆試為依據(jù),這就在一定程度上遏制學生平時學習的動力,大學學生很喜歡的一種方式是期末突擊學習,應付考試。杜撰這種弊端,就要調(diào)整考核方式,使學生花更多時間在平時積累實踐經(jīng)驗上,這里我們可以借鑒一些國外的教學的經(jīng)驗:
(1)把學生分成很多組(可以自由組合,體現(xiàn)民主),讓學生在業(yè)余時間完成規(guī)定的實驗項目;這個作為平時成績的一個重要依據(jù)。
(2)有條件的學校,邀請一些從這里畢業(yè)的老生回來串聯(lián),讓他們介紹他們實踐中的實戰(zhàn)經(jīng)驗,并在允許的情況下讓學生自愿加入一些項目的開發(fā),這個也可以作為平時成績加分的參考。
(3)基于數(shù)據(jù)倉庫的特性,期末考試改為上機開卷考試,在規(guī)定時間完成項目的比例,作為評分依據(jù)。
五、在數(shù)據(jù)倉庫不同專業(yè)方向講解的側(cè)重點不同
1.數(shù)據(jù)采集,數(shù)據(jù)清洗
數(shù)據(jù)采集是建立數(shù)據(jù)倉庫的第一步,它是保證后面數(shù)據(jù)挖掘的準確性的保證,在講解此部分時,要側(cè)重業(yè)務流程的講解,不斷地提示學生數(shù)據(jù)采集時要保證數(shù)據(jù)來源的準確性與關(guān)聯(lián)性,同時對不用的和不正確的數(shù)據(jù)進行清洗。在進行案例教學時,盡量選擇簡單業(yè)務流程的案例,同時在案例中舉幾個例子說明數(shù)據(jù)來源的重要性及數(shù)據(jù)清洗的必要性;在案例教學中,還讓學生初步理解什么是事實表,什么是維度表等。
2.數(shù)據(jù)建模
數(shù)據(jù)建模是數(shù)據(jù)倉庫建立的第二步,這一部分講解較為復雜,首先要讓學生理解什么是邏輯表和物理表,理解這兩部分可以引用工具教學,市面上的建模工具比較多,選取一款比較流行的(例:ERstudio);事實表和維度表是這部分的重點,要詳細講解,這是學生理解數(shù)據(jù)倉庫后面部分的基石,另外在星系模型、雪花型模型講解時,可采用類比講解法,比較為何幾種模型存在的必要性。
3.數(shù)據(jù)抽取
數(shù)據(jù)抽取聽起來好像是比較簡單的一步,這一部分老師講解時一般會比較簡單,但它是連接實時數(shù)據(jù)與數(shù)據(jù)倉庫關(guān)鍵的一步,也是技術(shù)性要求較高的一步,這部分可以專門作為一門課程講,老師可選擇用SQL/Plus語言講解,條件好的學校也可以選擇比較流行的軟件(infomatica等)進行講解,因為該部分技術(shù)性較強,盡量讓學生上機訓練,安排學生按一定時間完成要求的案例任務。
4.數(shù)據(jù)集市
數(shù)據(jù)集市是數(shù)據(jù)倉庫子集,主要是把中央數(shù)據(jù)倉庫劃分成若干個不同子集,以滿足不同部門對歷史數(shù)據(jù)的報告需求。這一部分老師講解時主要是讓學生搞清數(shù)據(jù)集市與數(shù)據(jù)倉庫概念上的區(qū)別。
5.數(shù)據(jù)展示
數(shù)據(jù)展示對技術(shù)、藝術(shù)都有一定的專業(yè)要求,同時對交流能力也要求很高,這部分老師講解時可把它分三部分進行。首先在講解技術(shù)時讓學生加深對維度表的理解,同時引用一到兩款軟件,了解數(shù)據(jù)展示是怎么進行的;在講解展示的方式時,比較不同類型的報表直覺效果,并向?qū)W生強調(diào)雖然給決策層提供的數(shù)據(jù)一樣,但不同的展示方式往往取得意想不到的效果,報表盡量做到直觀、簡單,同時給學生若干個案例,讓學生用不同的報表展示方式展示相同的數(shù)據(jù)進行類比;在講解對決策層的業(yè)務理解需求時,主要是給學生講解交流技巧,讓學生在掌握決策層需求時,頭腦中有設(shè)計的思路等。
六、結(jié)語
根據(jù)數(shù)據(jù)倉庫發(fā)展的現(xiàn)狀和目前教學過程存在的問題,本文作者根據(jù)自己的工作經(jīng)驗(6年數(shù)據(jù)倉庫工程師,2年高校計算機教學),從理論和實踐出發(fā),對這些問題做了簡要闡述,以求在以后的數(shù)據(jù)倉庫課程教學中,取得較好的教學效果,使學生在學習這門課中掌握數(shù)據(jù)倉庫的精髓,同時體會到團隊和溝通的重要性。隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展和需求的不斷更新,數(shù)據(jù)倉庫這課還需要不斷深化和探索,最終越來越與現(xiàn)實接軌,并達到提高教學質(zhì)量的目的。
參考文獻:
[1]李嶶,李宛州.基于數(shù)據(jù)倉庫技術(shù)的進銷存系統(tǒng)的設(shè)計與實現(xiàn).2001(10):93-94.
[2]W.H.Inmon.數(shù)據(jù)倉庫.機械工業(yè)出版社,2000,5.
[3]林字等編著.數(shù)據(jù)倉庫原理與實踐.北京:人民郵電出版社,2003.
[4]張春陽,周繼恩,劉貴全,蔡慶生.基于數(shù)據(jù)倉庫的決策支持系統(tǒng)的構(gòu)建,計算機工程,2002(4):249-252.
[5]陳德軍,盛翊智,陳綿云.基于數(shù)據(jù)倉庫的OLAP在DSS中的應用研究.2003(1):30-31.
[6]朱明,數(shù)據(jù)挖掘.合肥:中國科技大學出版社,2002,5.
[7]陳京民等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2002.
[8]毛國君等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2005.
[9]陳文偉等.數(shù)據(jù)挖掘技術(shù)[M].北京:北京工業(yè)大學出版社,2002.