韓翟
摘要:鐵路運輸一項非常復雜的工程,這其中存在著戰(zhàn)略、管理和生產(chǎn)3個層次全系列的決策活動。建立良好的鐵路運輸決策支持系統(tǒng)的關鍵就是要做好數(shù)據(jù)的共享、整理和輸出工作,使得能夠獲取的海量數(shù)據(jù)能夠成為鐵路運輸決策的基礎和依據(jù)。傳統(tǒng)的信息管理系統(tǒng)經(jīng)過發(fā)展衍生出了決策支持系統(tǒng),目前鐵路決策支持系統(tǒng)架構中對于信息進行整理儲存的的數(shù)據(jù)倉庫技術以及在此基礎上對數(shù)據(jù)進行分析預測的數(shù)據(jù)挖掘技尤為關鍵。本文對這兩種技術在鐵路運輸決策支持系統(tǒng)里的應用進行了梳理,以期提高鐵路運輸?shù)慕?jīng)濟效益和社會效益。
關鍵詞:鐵路運輸;決策支持系統(tǒng);數(shù)據(jù)倉庫;數(shù)據(jù)挖掘
中圖分類號:U292.12;TP3111
文獻識別碼:A
文章編號:1001-828x(2016)036-000354-01
20世紀90年代起,鐵路運輸管理信息系統(tǒng)(TMIS)的發(fā)展開始走向正軌,如今在鐵路運輸三個層次的許多方面都可以看到鐵路運輸管理信息系統(tǒng)的應用。在票務工作、鐵路運輸生產(chǎn)管理、鐵路運輸計劃規(guī)劃、車輛管理、貨運信息整理等各個方面,鐵路信息管理系統(tǒng)都有所應用。但由于各類系統(tǒng)是各自獨立的,形成了一個個數(shù)據(jù)孤島,使得數(shù)據(jù)共享成為一個問題,這也對運輸?shù)臎Q策活動造成障礙。因此建立良好的鐵路運輸決策支持系統(tǒng)的關鍵就是要做好數(shù)據(jù)的共享、整理和輸出工作,使得能夠獲取的海量數(shù)據(jù)能夠成為鐵路運輸決策的基礎和依據(jù)。
一、鐵路運輸決策支持系統(tǒng)架構
決策支持系統(tǒng)(Decision Support systems,簡稱Dss)是20世紀70年代,在傳統(tǒng)的管理信息系統(tǒng)(Management Information Systems,簡稱MIsl的基礎上形成和發(fā)展起來的。目前鐵路決策支持系統(tǒng)架構中對于信息進行整理儲存的的數(shù)據(jù)倉庫技術以及在此基礎上對數(shù)據(jù)進行分析預測的數(shù)據(jù)挖掘技尤為關鍵。
鐵路運輸決策支持系統(tǒng)的功能包括數(shù)據(jù)的管理和存儲、信息查詢和輸出、運輸績效分析、市場需求分析和預測、違規(guī)行為判斷和客戶關系管理等。具體系統(tǒng)架構分為數(shù)據(jù)源、數(shù)據(jù)存儲與管理、OLAP服務和前端工具與應用四部分。其中數(shù)據(jù)源主要由三大部分的信息組成:第一部分是經(jīng)濟指標、貨票信息、車號識別信息、貨運營銷系統(tǒng)信息;第二部門是調度系統(tǒng)、貨車追蹤系統(tǒng)、集裝箱系統(tǒng)的系統(tǒng)信息;第三部分為十八點統(tǒng)計、精密統(tǒng)計的統(tǒng)計信息。數(shù)據(jù)存儲與管理主要指的就是數(shù)據(jù)倉庫,數(shù)據(jù)源產(chǎn)出的信信息通過摘取、整理、加載、刷新等儲存在數(shù)據(jù)倉庫內(nèi),并根據(jù)維度對數(shù)據(jù)進行劃分形成數(shù)據(jù)集市。而OLAP服務則是在數(shù)據(jù)倉庫的基礎上對數(shù)據(jù)進行挖掘和分析。數(shù)據(jù)倉庫的數(shù)據(jù)直接大批量輸出或者通過數(shù)據(jù)集市的方式輸出,在OLAP服務環(huán)節(jié)利用數(shù)據(jù)挖掘和知識發(fā)掘工具進行匯總和聚集機制。從鐵路運輸決策支持系統(tǒng)的建構分析中可知,數(shù)據(jù)倉庫技術和數(shù)據(jù)挖掘技術是鐵路運輸決策支持系統(tǒng)的關鍵部門,對于大量數(shù)據(jù)的儲存和分析處理都集中在這兩個環(huán)節(jié)。
二、數(shù)據(jù)倉庫技術
數(shù)據(jù)倉庫技術是大量數(shù)據(jù)儲存和分析處理的基礎,其結構包括元數(shù)據(jù)和數(shù)據(jù)集市。元數(shù)據(jù)由鐵路應用系統(tǒng)中的貨運信息、車輛信息、貨票信息等組成,經(jīng)過抽取和處理之后存儲于數(shù)據(jù)緩沖庫,并通過加載傳送到鐵路全局數(shù)據(jù)倉庫,最后分解傳送至數(shù)據(jù)集市。數(shù)據(jù)集市根據(jù)主題會還原成鐵路應用系統(tǒng)所對應的三大維度,包括貨運信息、經(jīng)濟指標和市場信息。經(jīng)過分解的數(shù)據(jù)會各自匹配到多維數(shù)據(jù)庫中,并最終輸出信息進行分析應用。
存儲于數(shù)據(jù)倉庫中的數(shù)據(jù)的特點可以概括為“四性”:
1.規(guī)模性。數(shù)據(jù)倉庫的數(shù)據(jù)來自于經(jīng)濟指標、貨票信息、車號識別信息、貨運營銷系統(tǒng)信息、調度系統(tǒng)、貨車追蹤系統(tǒng)、集裝箱系統(tǒng)、十八點統(tǒng)計和精密統(tǒng)計的各類信息。因此數(shù)據(jù)倉庫的數(shù)據(jù)量龐大,具有可觀的規(guī)模。
2.歷史性。數(shù)據(jù)在數(shù)據(jù)倉庫中的儲存時間很長,可以長達數(shù)年。這些數(shù)據(jù)會記錄時間標記,可以滿足橫向、縱向信息比較。并且通過對歷史數(shù)據(jù)的整理,可以進行預測等的功能的實現(xiàn)。
3.集成性。從各個鐵路應用系統(tǒng)來的數(shù)據(jù)進入數(shù)據(jù)倉庫后都會被統(tǒng)一處理,儲存在數(shù)據(jù)緩存庫,并統(tǒng)一加載和分解。
4.只讀性。數(shù)據(jù)倉庫是一個信息源,它只是為在其上開發(fā)的DSS或EES等提供信息服務。因此它應是只讀數(shù)據(jù)庫,一般不能輕易改動,只能定期刷新。
三、數(shù)據(jù)挖掘技術
數(shù)據(jù)倉庫將大量歷史數(shù)據(jù)集中處理,而數(shù)據(jù)挖掘技術則是將數(shù)據(jù)倉庫的作用發(fā)揮出來的一項重要技術。數(shù)據(jù)挖掘是一種可以從如數(shù)據(jù)倉庫中提取隱藏的預測性信息的新技術,相對于數(shù)據(jù)倉庫其最大的特點是展望性和預測性。作為一種數(shù)據(jù)分析的工具,數(shù)據(jù)挖掘可以在大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)之間潛在的關系模式,找出不被重視的信息,即可以充分利用好大量數(shù)據(jù),并以此為基礎,找出盡可能多的數(shù)據(jù)關系,以此為鐵路決策提供依據(jù)。
大數(shù)據(jù)時代為我們提供了大量數(shù)據(jù)作為依據(jù),因此要想在利用好這些數(shù)據(jù),數(shù)據(jù)挖掘技術至關重要。數(shù)據(jù)挖掘可以對已知數(shù)據(jù)進行分析,對已有關系進行探索和發(fā)現(xiàn),這樣的結果更具有實踐意義和現(xiàn)實性。并且利用數(shù)據(jù)挖掘技術,可以讓數(shù)據(jù)本身說話,尋求出更多的可能性,建立新的業(yè)務模型,幫助決策者調整市場策略,作出正確的決策。
四、結語
鐵路運輸決策支持系統(tǒng)是服務于決策過程,而其中實現(xiàn)科學化和智能化的關鍵是數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術。數(shù)據(jù)倉庫是基礎,通過整理、分類、儲存數(shù)據(jù)解決了各系統(tǒng)之間信息孤島的問題;而數(shù)據(jù)挖掘則是在數(shù)據(jù)倉庫的基礎上更好地利用好數(shù)據(jù),最終實現(xiàn)決策的最優(yōu)化。