彭紅利PENG Hong-li;王艷WANG Yan
(①西安建筑科技大學(xué),西安 710055;②西安航空職業(yè)技術(shù)學(xué)院,西安 710089)
(①Xi'an University of Architecture and Technology,Xi'an 710055,China;②Xi'an Aeronautical Polytechnic Institute,Xi'an 710089,China)
我國(guó)的高等教育研究從20 世紀(jì)90年代到現(xiàn)在,經(jīng)過(guò)了信息時(shí)代開(kāi)始走向一個(gè)新的階段,更加的國(guó)際化,在教育研究方面表現(xiàn)出越來(lái)越多的技術(shù)化和專(zhuān)業(yè)化?,F(xiàn)在的高等教育研究越來(lái)越多的使用到互聯(lián)網(wǎng)和數(shù)據(jù)庫(kù),這就是研究技術(shù)化的集中體現(xiàn)。一些大學(xué)從很早的時(shí)候就開(kāi)始基于計(jì)算機(jī)化和網(wǎng)絡(luò)化開(kāi)展各項(xiàng)事務(wù),比如學(xué)生注冊(cè)選課系統(tǒng)、交費(fèi)系統(tǒng)、工資系統(tǒng)、財(cái)務(wù)系統(tǒng)等,這對(duì)于高等教育研究來(lái)說(shuō)是前進(jìn)的一大步。而且在大學(xué)管理的很多個(gè)領(lǐng)域都可以應(yīng)用到這些理論和模式,比如規(guī)劃研究、學(xué)生事務(wù)的研究、財(cái)政狀況的研究、教師事務(wù)的研究等。這也是目前美國(guó)院校研究所涵蓋的六個(gè)主要研究?jī)?nèi)容。
我國(guó)的商業(yè)智能技術(shù)要遠(yuǎn)遠(yuǎn)的落后于一些發(fā)達(dá)國(guó)家。與此有關(guān)的一些研究報(bào)告顯示,在2006年,世界上的商業(yè)智能系統(tǒng)的市場(chǎng)規(guī)模已經(jīng)達(dá)到了140 億美元。這個(gè)商業(yè)智能系統(tǒng)在國(guó)外被應(yīng)用的比較廣,而且很成功,比如借助了商業(yè)智能系統(tǒng)的cadbury 巧克力公司,它的市場(chǎng)份額就在很短的時(shí)間內(nèi)提升了2%等,還有很多這樣成功的應(yīng)用商業(yè)智能系統(tǒng)的案例。
現(xiàn)階段我國(guó)的高等教育信息化主要體現(xiàn)在三個(gè)方面:一是包括檔案、人事考勤等在內(nèi)的行政管理類(lèi);二是包括教務(wù)系統(tǒng)、就業(yè)管理、新生入學(xué)管理等在內(nèi)的教學(xué)教輔類(lèi);三是包括水電繳費(fèi)、上機(jī)管理、門(mén)禁管理、校園網(wǎng)繳費(fèi)在內(nèi)的一卡通應(yīng)用類(lèi)。并且這每個(gè)系統(tǒng)之間都是一個(gè)獨(dú)立的個(gè)體,它們的結(jié)構(gòu)、分布情況都是不一樣的,這無(wú)疑會(huì)給信息的整理工作帶來(lái)很多的挑戰(zhàn)。如果高校的領(lǐng)導(dǎo)想整體的了解一下高校的狀況,沒(méi)有的一個(gè)直接的途徑,必須先進(jìn)入每個(gè)系統(tǒng),然后再通過(guò)手工整理每個(gè)系統(tǒng)中的信息和數(shù)據(jù),最后匯總起來(lái)才可以。所以,現(xiàn)在很多的高校開(kāi)始把各種應(yīng)用系統(tǒng)整合在一起,建立一種統(tǒng)一的信息門(mén)戶,實(shí)行單點(diǎn)登錄,只有這樣,數(shù)據(jù)的整合工作才能變得方便和快捷。
總之,雖然采用商業(yè)智能技術(shù)對(duì)高校的信息整合工作很有益處,但是現(xiàn)階段在我國(guó)的普及面還不是很廣,甚至一些高校還僅僅處在起步階段。所以以高等教育院校積極的普及這種商業(yè)智能系統(tǒng),為更多的用戶提供決策支持。
2.1 研究?jī)?nèi)容
2.1.1 學(xué)生事物的研究 按系部或二級(jí)學(xué)院按班級(jí)對(duì)學(xué)生個(gè)人全部信息,學(xué)生每學(xué)期所選課程,學(xué)生每學(xué)期各門(mén)功課考試成績(jī)。
2.1.2 教師事物的研究 按系部或二級(jí)學(xué)院對(duì)教師個(gè)人信息,教師工資和課時(shí)費(fèi),教師每學(xué)期所上的課程,課程名稱(chēng)和課時(shí),教師每年的科研項(xiàng)目,發(fā)表論文。
2.2 關(guān)鍵技術(shù)
2.2.1 數(shù)據(jù)倉(cāng)庫(kù)建立 數(shù)據(jù)倉(cāng)庫(kù)實(shí)際上是一個(gè)“以大型數(shù)據(jù)管理信息系統(tǒng)為基礎(chǔ)、附加在這個(gè)數(shù)據(jù)庫(kù)系統(tǒng)之上地、存儲(chǔ)了從企業(yè)所有業(yè)務(wù)數(shù)據(jù)庫(kù)中獲取的綜合數(shù)據(jù)的、并能利用這些綜合數(shù)據(jù)為用戶提供經(jīng)過(guò)處理后的有用信息的應(yīng)用系統(tǒng)”,它絕不僅僅是一個(gè)簡(jiǎn)單的信息庫(kù)。
ETL (ExtractionTransformationLoading) 就是抽取、清洗、轉(zhuǎn)換、裝載,是數(shù)據(jù)倉(cāng)庫(kù)在實(shí)現(xiàn)過(guò)程中,將數(shù)據(jù)由數(shù)據(jù)源系統(tǒng)并向數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)加載的主要過(guò)程。ETL 過(guò)程關(guān)系勤數(shù)據(jù)地質(zhì)量,這是非常重要的一個(gè)環(huán)節(jié),它是數(shù)據(jù)整合的解決方案,也是建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的關(guān)鍵一環(huán)。用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù)以后,經(jīng)過(guò)對(duì)數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉(cāng)庫(kù)的模型,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。
2.2.2 聯(lián)機(jī)分析處理 1993年關(guān)系數(shù)據(jù)庫(kù)之父(EECodd)首先提出了聯(lián)機(jī)分析處理 (on -LineAnalytiealProcessing,oLAp),這是一種能夠?yàn)闇?zhǔn)確定義多維模型、操縱多維立方體提供技術(shù)基礎(chǔ)。這項(xiàng)技術(shù)是孕育用戶分析大型數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)包含信息深入洞察的技術(shù)。OLAP 具有匯總、合并和聚集的功能,它還能夠從不同的角度觀察信息,它是一種分析技術(shù)。但是在采用OLAP 的工具的時(shí)候需要其他分析工具的輔助,它雖然支持多維分析和決策,也可以進(jìn)行深層次的分析,但只是靠OLAP 是不能的。
2.2.3 數(shù)據(jù)挖掘 通過(guò)分析和分類(lèi)大量的歷史和存儲(chǔ)數(shù)據(jù),可以發(fā)現(xiàn)有效的數(shù)據(jù)模式與關(guān)系的過(guò)程就是數(shù)據(jù)挖掘(DataMining,DM),其中還包括過(guò)去和預(yù)測(cè)未來(lái)趨勢(shì)的有用信息。數(shù)據(jù)挖掘是一門(mén)涉及面很廣的交叉性學(xué)科,包括機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、模式識(shí)別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù),同時(shí)它也是一種發(fā)掘型的工具、是一種決策支持的過(guò)程。數(shù)據(jù)挖掘可以做到聯(lián)機(jī)分析處理所不能做到的工作,它可以發(fā)現(xiàn)復(fù)雜精細(xì)的答案。
數(shù)據(jù)挖掘能夠作為一種依據(jù),利用預(yù)定的規(guī)則,它可以幫助挖掘和分析數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中的已有數(shù)據(jù),然后識(shí)別與抽取出隱含的模式和有趣的知識(shí),決策者在決策時(shí)往往會(huì)參考此項(xiàng)數(shù)據(jù)。從數(shù)據(jù)中發(fā)現(xiàn)模式是數(shù)據(jù)挖掘的目的,模式按照功能的不同可以被分成兩大類(lèi):預(yù)測(cè)型(Predictive)模式、描述型(Deseriptive)模式。
2.3 研發(fā)目標(biāo) 在高等院校的校園網(wǎng)站上,根據(jù)用戶的不同需求,可以直接抽取原始數(shù)據(jù),生成相關(guān)的數(shù)據(jù)報(bào)表或者是數(shù)據(jù)分析圖。
項(xiàng)目將采用商業(yè)智能將高校信息系統(tǒng)中的數(shù)據(jù)轉(zhuǎn)化為知識(shí),幫助學(xué)校高層領(lǐng)導(dǎo)做出一些重要決策。
3.1 技術(shù)方案 本項(xiàng)目的研究工作主要包括商業(yè)智能理論分析,商業(yè)智能活動(dòng)圖如圖1 所示,商業(yè)智能架構(gòu)圖如圖2 所示。實(shí)現(xiàn)商業(yè)智能的步驟是建立數(shù)據(jù)倉(cāng)庫(kù)、根據(jù)主題建立數(shù)學(xué)模型,數(shù)據(jù)挖掘及產(chǎn)生數(shù)據(jù)分析結(jié)果。
①在進(jìn)行商業(yè)智能系統(tǒng)的總體架構(gòu)設(shè)計(jì)前,需要先進(jìn)行需求分析。
②在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的過(guò)程中,應(yīng)該注意一些問(wèn)題。比如分析不同用戶的主題時(shí),應(yīng)該先分析同類(lèi)數(shù)據(jù)源和異類(lèi)數(shù)據(jù)源的不同,并對(duì)用戶的需求進(jìn)行一個(gè)充分的掌握;建立面向主題的數(shù)據(jù)倉(cāng)庫(kù)時(shí),應(yīng)選擇MicrosoftSQLServer2005數(shù)據(jù)庫(kù)管理系統(tǒng);海量的數(shù)據(jù)可能會(huì)對(duì)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用和性能帶來(lái)一定的影響,這時(shí)可以采取分區(qū)表技術(shù)解決。
③設(shè)計(jì)ETL 程序包應(yīng)該以SQLServer2005 的5515 服務(wù)為基礎(chǔ),然后創(chuàng)建一個(gè)中間數(shù)據(jù)庫(kù),對(duì)多個(gè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)源進(jìn)行抽取、清洗、轉(zhuǎn)換、加載,在這個(gè)過(guò)程中也應(yīng)該考慮到ETL 程序包的執(zhí)行效率優(yōu)化的問(wèn)題。
圖1 商業(yè)智能活動(dòng)圖
圖2 商業(yè)智能架構(gòu)圖
④研究相關(guān)的OLAM 相應(yīng)理論,在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,利用SQLserver2005 的SSAS 服務(wù),創(chuàng)建了面對(duì)主題的多維分析模型,并對(duì)其進(jìn)行了分析;以sQL server2005 數(shù)據(jù)挖掘的流程為指導(dǎo),在多維分析模型的基礎(chǔ)上創(chuàng)建了挖掘模型,面對(duì)探討的問(wèn)題,討論了基于MierosoftsQLserver2005的決策樹(shù)算法,實(shí)現(xiàn)了基于OLAM 技術(shù)的各類(lèi)指標(biāo)的查詢、分析與挖掘。
⑤要想展現(xiàn)數(shù)據(jù)的多樣化,那么系統(tǒng)前端數(shù)據(jù)展現(xiàn)平臺(tái)應(yīng)該采用SQLServer2005 Reportserviees。
3.2 創(chuàng)新點(diǎn)
①提出將商業(yè)智能應(yīng)用于高校信息系統(tǒng)。目前商業(yè)智能系統(tǒng)已經(jīng)隨著高校校園信息化進(jìn)程的推進(jìn)而得到了廣泛的應(yīng)用,但是各應(yīng)用系統(tǒng)的數(shù)據(jù)是分布的、異構(gòu)的、彼此獨(dú)立的,信息不能互通。本項(xiàng)目研究有效解決各種應(yīng)用系統(tǒng)的數(shù)據(jù)整合問(wèn)題。
②本項(xiàng)目提出了以數(shù)據(jù)倉(cāng)庫(kù)技術(shù)為核心、以聯(lián)機(jī)分析處理技術(shù)和數(shù)據(jù)挖掘技術(shù)為手段的商業(yè)智能解決方案。它可以滿足各種不同用戶的需求,最終形在報(bào)表和統(tǒng)計(jì)分析圖,也可以用于指導(dǎo)學(xué)校高層領(lǐng)導(dǎo)的重要決策。
[1]蔣萌.中職學(xué)校數(shù)字化校園建設(shè)的實(shí)踐探索[J].浙江現(xiàn)代教育技術(shù),2009(01).
[2]劉小波,陳志民,葉志嬋,劉華日.無(wú)線網(wǎng)絡(luò)在數(shù)字化校園中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版),2010(04).
[3]楊福燕.多媒體網(wǎng)絡(luò)教學(xué)之探討[J].科技信息,2009(17).