文/張瑾 張增修 周玨
美國高校的信息化建設進度總體上比我們快十年,我們現(xiàn)在遇到的問題,他們十幾年前已面對過。因此,了解美國高校如何利用數(shù)據(jù)為學校的管理決策服務,可以給我們帶來一些重要啟示。
高校的數(shù)據(jù)建設可以分為數(shù)據(jù)采集建設和數(shù)據(jù)應用建設。數(shù)據(jù)采集建設期間,各種業(yè)務系統(tǒng)分頭建設上線,逐步積累大量業(yè)務數(shù)據(jù)。如何應用這些業(yè)務數(shù)據(jù)就是數(shù)據(jù)應用建設。本文介紹了美國高校的數(shù)據(jù)應用建設情況,即在建設數(shù)據(jù)倉庫的基礎上進行數(shù)據(jù)挖掘,以期對正處于由數(shù)據(jù)采集建設向數(shù)據(jù)應用建設過渡的我國大多數(shù)高校有所啟示。
在過去十幾年里,國內(nèi)幾乎所有的高校都不同程度地開展各種業(yè)務系統(tǒng)的建設。這些業(yè)務系統(tǒng)涵蓋學生、教學、科研、財務、人事等各項管理。各種業(yè)務系統(tǒng)的不斷上線,提高了管理的效率和質(zhì)量,提升了學校為師生服務的意識,使學校各項制度的執(zhí)行更加到位,并且積累了大量的業(yè)務數(shù)據(jù)。目前,多數(shù)高校業(yè)務系統(tǒng)大規(guī)模建設的階段已進入尾聲,面對海量數(shù)據(jù),很多高校開始思考這樣一個問題:這些數(shù)據(jù)應該如何被利用,使其成為學校決策的強有力支持。
美國高校的信息化建設進度總體上比我們快十年,我們現(xiàn)在遇到的問題,他們十幾年前已碰到過。因此,了解美國高校如何利用數(shù)據(jù)為學校的管理決策服務,可以給我們帶來一些重要啟示。
美國高校的數(shù)據(jù)應用建設是建立在數(shù)據(jù)倉庫基礎上的數(shù)據(jù)挖掘。其實,就數(shù)據(jù)倉庫和數(shù)據(jù)挖掘這兩個概念本身而言,并沒有必然的聯(lián)系。數(shù)據(jù)挖掘不一定要建立在數(shù)據(jù)倉庫的基礎上,任何數(shù)據(jù)都可以進行挖掘。當然,越準確、越全面的數(shù)據(jù)對數(shù)據(jù)挖掘而言更有價值。因此,美國高校普遍認為,數(shù)據(jù)倉庫建設是進行數(shù)據(jù)挖掘的基礎,數(shù)據(jù)挖掘是對數(shù)據(jù)倉庫的一種高級應用。美國高校數(shù)據(jù)應用建設的一般模式如圖所示。
美國高校的數(shù)據(jù)倉庫建設是在完成各個業(yè)務系統(tǒng)建設后進行的。擁有了各種業(yè)務系統(tǒng)后,很多美國高校發(fā)現(xiàn)他們依然無法便捷地獲得各種數(shù)據(jù)報表。當需要獲得報表時,發(fā)現(xiàn)各個業(yè)務系統(tǒng)沒有提供靈活、強大的報表工具,因此,用戶必須自己去做報表。自己制作,費時費力是肯定的,而且一個報表制作完成后,下一次需要使用該報表,還要重復制作。更關鍵的問題是,用戶自己制作報表,需要用戶有查詢數(shù)據(jù)庫的能力。例如,理解數(shù)據(jù)庫結構,懂得SQL語法,正確執(zhí)行查詢條件。這些都對用戶的信息素養(yǎng)提出很高的要求,從而限制了各種業(yè)務系統(tǒng)報表在學校中的獲得和使用。由于報表的獲得比較困難,并且準確性、權威性也存在質(zhì)疑,因此,學校無法使用報表去做分析和決策。
為了解決數(shù)據(jù)報表獲取上的問題,構建以數(shù)據(jù)事實為依據(jù)的學校決策氛圍,很多美國高校開始意識到要建立校級數(shù)據(jù)倉庫。
早在2002年,根據(jù)Robert Kvavik博士對全美500所高校的調(diào)研結果顯示,39%的高校已經(jīng)或者正在建設數(shù)據(jù)倉庫,37%的高校計劃在接下來的3年里建設數(shù)據(jù)倉庫,并且,其中的1/3將會在2003年開始數(shù)據(jù)倉庫的建設。目前,美國有一百多所大學擁有自己的數(shù)據(jù)倉庫,并對外提供數(shù)據(jù)服務。高等教育數(shù)據(jù)倉庫網(wǎng)站(Data Warehousing in Higher Education,http://dheise.andrews.edu/dw/DWData.htm)列出了最新的擁有數(shù)據(jù)倉庫的美國大學名單及數(shù)據(jù)倉庫的訪問地址。
建設數(shù)據(jù)倉庫給學校的工作帶來的好處包括:不同來源的數(shù)據(jù)在數(shù)據(jù)倉庫中被抽取轉(zhuǎn)換成同一格式的元數(shù)據(jù)進行存貯,用戶能夠快速、便捷地獲取所需要的數(shù)據(jù)報表,節(jié)省了編輯、組織數(shù)據(jù)報告所花費的時間和精力。
數(shù)據(jù)倉庫的建設對學校的理念、工作方式產(chǎn)生深刻影響。在數(shù)據(jù)世界里打破現(xiàn)實世界中各個院系、部門的物理屏障,使建立學校共享的數(shù)據(jù)資源成為一種共識,使基于數(shù)據(jù)事實的決策方式深入人心。
圖 美國高校數(shù)據(jù)應用建設的一般模式
所謂數(shù)據(jù)挖掘就是從數(shù)據(jù)中發(fā)現(xiàn)某些規(guī)律,以分析預測出所分析對象的趨勢,從而做出相應的決策。例如,某個在網(wǎng)上開店的企業(yè)根據(jù)客戶填寫的資料,近期的購物傾向,可以分析出客戶的喜好,并推薦相應的商品給客戶。
數(shù)據(jù)挖掘可以運用于學校管理的方方面面?;趯嶋H需求的、靈活而有創(chuàng)意的數(shù)據(jù)挖掘,為學校的各個方面的工作提供有價值的參考。
美國高校的很多數(shù)據(jù)挖掘工作是借助一些數(shù)據(jù)分析工具完成的。這些工具有自行開發(fā)的,也有商業(yè)工具。以下介紹幾個美國高校對學生在校期間的學習方面的數(shù)據(jù)進行分析挖掘的案例。
普渡大學(Purdue University )
有些學生缺課多,課后也很少參與交流和提問,這些學生很有可能不能順利完成學業(yè)。如果通過數(shù)據(jù)分析發(fā)現(xiàn)有這種傾向的學生,并讓學術顧問對其進行早期干預,部分學生能夠避免最終不能完成學業(yè)的結果。
普渡大學認為決定學生是否能完成學業(yè)的數(shù)據(jù)有兩類:
1. 學生的學術能力方面的數(shù)據(jù)(例如考試的成績)。
2. 學生自身努力情況的數(shù)據(jù)(例如登錄課程管理系統(tǒng)的情況)。
具體而言是以下六種數(shù)據(jù):ACT或SAT成績、GPA、課程管理系統(tǒng)使用情況數(shù)據(jù)、課程管理系統(tǒng)分析數(shù)據(jù)、課程管理系統(tǒng)作業(yè)完成情況數(shù)據(jù)、課程管理系統(tǒng)課程的日程數(shù)據(jù)。普渡大學建立了專門針對新生的數(shù)據(jù)分析模型和針對所有學生的數(shù)據(jù)分析模型。以上六種數(shù)據(jù)在兩個模型中分別所占的權重不同。
中佛羅里達大學(University of Central Florida)
美國高校普遍通過部署學習管理系統(tǒng)來為學生營造傳統(tǒng)課堂之外的自主學習環(huán)境。美國大多數(shù)高校使用的是Blackboard商業(yè)軟件,也有部分高校嘗試開源軟件。學習管理系統(tǒng)的部署豐富了高校的教學模式。
目前,主要存在3種教學模式:
1. 面對面教學模式:即傳統(tǒng)的以教師為中心的教學模式;
2.混合式教學模式:即面對面教學模式與在線教學模式相結合的教學模式。在這種教學模式中,學習管理系統(tǒng)被看作是面對面教學模式的補充。在課堂教學之外,學生可以從教學管理系統(tǒng)中獲得相關的、更加豐富的教學資源,自主進行拓展學習,并和其他師生在線討論。
3.完全的在線教學模式:即一門課程完全由學生通過教學平臺自主學習,沒有面對面教學的環(huán)節(jié)。
以上三種教學模式,哪種更優(yōu)一直是一個有爭議的話題。中佛羅里達大學對以上三種教學模式的教學效果進行分析,為未來學校的課程設置提供參考。
首先,分析是分專業(yè)進行的,因為不同的專業(yè)特點和課程要求,對最佳教學模式的選擇不同。
其次,分析中使用到的數(shù)據(jù)有教學模式(Modality)、課程等級(Course Level)、班級規(guī)模(Class Size)、學生性別(Gender)、學生的種族(Ethnicity)、學生年齡(Age)、SAT成績、所屬學院(College)、高中的GPA和累計GPA。
最后,分析的目標是:在某個專業(yè)中,根據(jù)以往的關于這三種教學模式中的“成績優(yōu)秀(Satisfaction)”、“順利通過(Success)”、“中途放棄(Withdrawal)”和“未通過課程(No-Success)”的比例的數(shù)據(jù),預測未來各種教學模式下的“成績優(yōu)秀”、“順利通過”、“中途放棄”和“未通過課程”的比例。
通過對現(xiàn)有數(shù)據(jù)的分析,預測出未來三種教學模式在某個專業(yè)中的教學效果前景,為該專業(yè)的課程設計提供參考。
奧斯丁皮耶州立大學(Austin Peay State University)
在美國,學生進入高校后,在專業(yè)范圍內(nèi),學生的學習自主性大大增加,甚至有很多學校在學生進校的時候并不定專業(yè),只是分文理科,學生可以有很多選擇。整個大學期間,在學術顧問的指導下,學生需要自行選擇每個學期合適的課程,安排學習計劃,最終達到某專業(yè)的畢業(yè)要求。
在面臨眾多課程選擇的時候,學生常常感到迷茫:哪種選擇是最適合自己完成高等教育所有課程的最佳安排,課程的先后次序該怎樣安排最合理。學校的課程介紹往往過于簡單,不會針對具體的學生進行個性化介紹。學術顧問雖然對本專業(yè)的課程比較了解,但是學生在讀期間會涉及選讀很多本專業(yè)以外的課程,對于這些課程,學術顧問無法為學生提供有效的幫助。
因此,奧斯丁皮耶州立大學開發(fā)使用了一個課程指南系統(tǒng)(course-recommendation system),叫做學位指南針(Degree Compass),幫助學生制定最適合自己的學習計劃。
該學位指南針系統(tǒng)的分析原理如下:
1. 數(shù)據(jù)依據(jù)
(1)過去學生學習情況的數(shù)據(jù)。
(2)某位需要給予幫助的學生的基本數(shù)據(jù)。
2. 數(shù)據(jù)匹配
根據(jù)需要為幫助的學生提供基本數(shù)據(jù),從以往學生的案例庫中找到最匹配的數(shù)據(jù)。例如,與該學生具有相似專業(yè)背景、學術能力的學生的課程計劃記錄,從而提供建議性課程計劃,供該學生參考。
當然,數(shù)據(jù)挖掘不僅僅局限于對學習的分析方面,在整個高校的各種管理工作環(huán)節(jié)中,數(shù)據(jù)挖掘點無處不在。例如美國高校都是自主招生的。每年的招生工作一般是由潛在的學生自行通過電話、郵件獲取招生簡章,了解學校的情況和自己想要申請的專業(yè)后,自行在線申請的。美國很多高校每年要接收成千上萬份申請。為了盡快鎖定最可能被錄取的潛在學生,節(jié)省整個招生工作的成本,貝勒大學(Baylor University)使用一個招生預測模型,根據(jù)學校所掌握的申請人的情況,分析預測出最可能的潛在學生的名單,將招生工作的重點放在這些學生上。
總之,美國高校的很多數(shù)據(jù)挖掘點是出于實際需求。實際需求與創(chuàng)新思路的結合,就是好的數(shù)據(jù)挖掘點。
有些學生缺課多,課后也很少參與交流和提問,這些學生很有可能不能順利完成學業(yè)。如果通過數(shù)據(jù)分析發(fā)現(xiàn)有這種傾向的學生,并讓學術顧問對其進行早期干預,部分學生能夠避免最終不能完成學業(yè)的結果。
近十年間,我國高校通過建設和上線各種業(yè)務系統(tǒng),優(yōu)化了管理工作的流程,規(guī)范了管理制度,并且提高了工作效率,方便了師生。伴隨著各種業(yè)務系統(tǒng)的使用,各種業(yè)務數(shù)據(jù),包括中間數(shù)據(jù)被大量積累下來。我國很多高校精心保存這些數(shù)據(jù),但只是讓這些數(shù)據(jù)逐年積累在存貯中,而沒有有效使用它們?,F(xiàn)在是我們開始考慮如何使用這些數(shù)據(jù),進行數(shù)據(jù)應用建設的時候了。
數(shù)據(jù)應用建設的最終目標是讓數(shù)據(jù)分析的結果成為學校決策的主要依據(jù),即讓事實說話。
大多數(shù)美國高校的數(shù)據(jù)應用建設分兩個階段進行:
1. 數(shù)據(jù)倉庫:對各種業(yè)務數(shù)據(jù)分類整合,使用戶方便獲取各種業(yè)務數(shù)據(jù)報表。
2. 數(shù)據(jù)挖掘:開發(fā)使用各種數(shù)據(jù)分析工具,對數(shù)據(jù)倉庫中獲取的業(yè)務數(shù)據(jù)進行分析,發(fā)現(xiàn)規(guī)律,預測未來。
通過以上兩個階段的建設,可搭建一個靈活的集成、挖掘和分析數(shù)據(jù)的技術平臺。很顯然,實現(xiàn)數(shù)據(jù)應用的目標不能僅僅依靠技術建設,更重要的是學校管理層具備以數(shù)據(jù)為依據(jù)的管理決策理念,并致力于在學校里推行這種理念,使之形成風氣。同時,盡管一個好的數(shù)據(jù)應用平臺使管理人員不需要去直接接觸數(shù)據(jù)庫查詢語法,但是學校行政部門的管理人員還是需要具備能夠輕松使用各種數(shù)據(jù)進行分析的素養(yǎng)。