耿占佳王 南付玉霞吳 慧張 靜耿占雄
(1-5石家莊信息工程職業(yè)學(xué)院 河北 石家莊 050035)
(6石家莊市欒城區(qū)人民檢察院 河北 石家莊 050000)
基于OLAP的煉鋼生產(chǎn)物流數(shù)據(jù)分析
耿占佳1王 南2付玉霞3吳 慧4張 靜5耿占雄6
(1-5石家莊信息工程職業(yè)學(xué)院 河北 石家莊 050035)
(6石家莊市欒城區(qū)人民檢察院 河北 石家莊 050000)
鋼廠在煉鋼生產(chǎn)過程會產(chǎn)生龐大的物流數(shù)據(jù),如何有效的進(jìn)行數(shù)據(jù)分析,以幫助決策者提高決策力成為亟待解決的問題。本文在數(shù)據(jù)倉庫技術(shù)(DW)和數(shù)據(jù)挖掘技術(shù)(DM)的基礎(chǔ)上,基于聯(lián)機分析處理技術(shù)(OLAP)創(chuàng)建煉鋼生產(chǎn)物流信息數(shù)據(jù)倉庫、物流信息多維數(shù)據(jù)集,進(jìn)行數(shù)據(jù)挖掘,最終實現(xiàn)科學(xué)分析數(shù)據(jù),幫助管理者進(jìn)行決策。
數(shù)據(jù)倉庫;聯(lián)機分析處理;物流數(shù)據(jù);數(shù)據(jù)挖掘
1.1 數(shù)據(jù)倉庫中的數(shù)據(jù)的構(gòu)建是多維視圖架構(gòu),目的是用于決策支持。數(shù)據(jù)倉庫技術(shù)具有以下三方面的主要功能。一數(shù)據(jù)倉庫具有對物流信息歷史數(shù)據(jù)進(jìn)行查詢的功能,并能夠以企業(yè)級的標(biāo)準(zhǔn)報表和視圖形式為用戶提供前端顯示。二數(shù)據(jù)倉庫用來構(gòu)建多維視圖數(shù)據(jù)集,并在此基礎(chǔ)上進(jìn)行多維分析。三數(shù)據(jù)挖掘的實現(xiàn)以數(shù)據(jù)倉庫的成功建立為基礎(chǔ)。
1.2 數(shù)據(jù)挖掘(Data Mining),就是從已經(jīng)存放在數(shù)據(jù)倉庫或其他數(shù)據(jù)載體的大量的數(shù)據(jù)中抽取并得到準(zhǔn)確的、隱晦的、有意義的、直觀的數(shù)據(jù)信息描述的過程。
典型的數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)如圖1所示。
圖1 數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)Fig. 1 The structure of Data Mining
1.3 OLAP是用來針對特定分析目的(主題)設(shè)計多維數(shù)據(jù)集,并對多維數(shù)據(jù)集進(jìn)行選擇、分類、查詢、修改等操作。而當(dāng)前各類數(shù)據(jù)庫系統(tǒng)的實際應(yīng)用的情況說明,單一的關(guān)系型數(shù)據(jù)庫系統(tǒng)(OLTP數(shù)據(jù)庫)不能滿足企業(yè)用戶對數(shù)據(jù)庫查詢的深層次要求,單靠SQL語句對數(shù)據(jù)庫進(jìn)行簡單查詢也不能滿足企業(yè)分析人員的多角度分析要求。在這一背景下多維數(shù)據(jù)集和多維分析的概念被提上了發(fā)展的前臺。
OLAP通過多維方式對企業(yè)生產(chǎn)過程實時和歷史數(shù)據(jù)進(jìn)行分析、查詢和前端顯示。OLAP的特點或者說優(yōu)勢,便是仿照數(shù)據(jù)庫查詢用戶的多角度思考模式,預(yù)先為用戶建立多維的數(shù)據(jù)庫模型,使其便可以方便快速地從各個分析角度獲取生產(chǎn)過程數(shù)據(jù),具有極大的分析靈活性。
2.1 煉鋼生產(chǎn)物流信息系統(tǒng)總體設(shè)計方案
一以某鋼廠煉鋼生產(chǎn)過程中的物流信息現(xiàn)狀進(jìn)行分析,發(fā)現(xiàn)主要需求集中在天車調(diào)度管理與成本控制兩方面;二以數(shù)據(jù)倉庫技術(shù)為基礎(chǔ),采用OLAP技術(shù)實現(xiàn)數(shù)據(jù)分析,煉鋼物流信息系統(tǒng)架構(gòu)主要分為四層,聯(lián)機分析層、DW層、用戶接口層、OLTP層。其中聯(lián)機分析層的實現(xiàn)平臺為SQL數(shù)據(jù)庫系統(tǒng)中的Analysis Manager功能模塊,關(guān)系數(shù)據(jù)庫層以源歷史數(shù)據(jù)庫作為數(shù)據(jù)源;三煉鋼生產(chǎn)物流信息系統(tǒng)設(shè)計的目的是為了進(jìn)行成本分析。成本分析的主題可分為3個子主題:原料主題、作業(yè)點主題、應(yīng)商主題。四通過對煉鋼物流數(shù)據(jù)進(jìn)行分析研究,發(fā)現(xiàn)影響原料成本的主要因素是原料的消耗情況。原料消耗情況又受時間、作業(yè)點、供應(yīng)商等多方因素影響。根據(jù)鋼廠現(xiàn)狀,本文設(shè)計以下維度:日期維的粒度、原料消耗信息維的粒度、供應(yīng)商維的粒度。五建立物理數(shù)據(jù)庫。在SQL Server 2000數(shù)據(jù)庫系統(tǒng)的Enterprise Manager(企業(yè)管理器)模塊中,分別建立關(guān)系數(shù)據(jù)庫、維度表與事實表。
2.2 物流信息數(shù)據(jù)倉庫的ETL實現(xiàn)
ETL(Extraction Transformation and Loading),指的是對異構(gòu)目的數(shù)據(jù)源中數(shù)據(jù)的抽取、轉(zhuǎn)換和裝載。其過程是由前端ETL工具把源數(shù)據(jù)從分散無序的各種數(shù)據(jù)源中提取出來,在進(jìn)行了有效性檢驗和數(shù)據(jù)格式統(tǒng)一化轉(zhuǎn)換后根據(jù)多維數(shù)據(jù)集的設(shè)計模式對這些處理過的基本數(shù)據(jù)進(jìn)行OLAP聚合操作,最終導(dǎo)入至物流信息數(shù)據(jù)倉庫中。最終決策的分析與制定者可通過前端查詢工具分析數(shù)據(jù)倉庫內(nèi)容,進(jìn)而為企業(yè)制定合理的成本控制計劃與安全生產(chǎn)方案。
2.3 煉鋼生產(chǎn)物流信息數(shù)據(jù)倉庫的構(gòu)建
(1)數(shù)據(jù)倉庫的建立以本機上的Windows Server 2003 Enterprise Editioin Servise Pack 2操作系統(tǒng)與Microsoft SQL Server 2000 Servise Pack 4企業(yè)版數(shù)據(jù)庫系統(tǒng)為平臺,聯(lián)機分析(OLAP)服務(wù)器的建立與功能實現(xiàn)的平臺為SQL數(shù)據(jù)庫系統(tǒng)的Analysis Manager模塊中的Analysis Services服務(wù)。
(2)在已經(jīng)構(gòu)建的數(shù)據(jù)倉庫的“多維數(shù)據(jù)集”節(jié)點,新建多維數(shù)據(jù)集,將“原料消耗成本”作為事實數(shù)據(jù)表,將“日期編號”、“原料編號”、“原料消耗點編號”作為多維數(shù)據(jù)集度量值,將維度設(shè)置為日期、原料消耗信息、原料信息、供應(yīng)商信息,組織結(jié)構(gòu)設(shè)置為星型模型,每一維度又下設(shè)不同的成員屬性。如時間維下設(shè)有日期編號、日期、年、月、日、周6個成員屬性等。
(3)元數(shù)據(jù)為分析人員對已構(gòu)建的多維數(shù)據(jù)集提供了一個完整、全面、直觀的審視工具,整個多維數(shù)據(jù)集的所有關(guān)系、維度、數(shù)據(jù)源信息一目了然。作為數(shù)據(jù)倉庫的核心功能之一,元數(shù)據(jù)中的信息不僅描述了數(shù)據(jù)倉庫中數(shù)據(jù)分析主題的維度劃分形式,各個分析主題的屬性度量值在數(shù)據(jù)倉庫中的具體存儲位置也有描述,與數(shù)據(jù)倉庫分析主題有關(guān)的其它內(nèi)容也有說明。從這個方面來說,一個準(zhǔn)確實用的數(shù)據(jù)倉庫都建立在一個準(zhǔn)確、清晰的元數(shù)據(jù)基礎(chǔ)上。本文構(gòu)建好物流信息數(shù)據(jù)倉庫后的元數(shù)據(jù)顯示如圖2所示。
圖2 物流信息數(shù)據(jù)倉庫元數(shù)據(jù)Fig.2 The metadata in logistic data warehouse
本文從某鋼廠的現(xiàn)狀出發(fā),通過創(chuàng)建物流信息數(shù)據(jù)倉庫與多維數(shù)據(jù)集,應(yīng)用OLAP技術(shù)舉例說明了數(shù)據(jù)挖掘分析的應(yīng)用,最終為管理者提供主題明確、挖掘適度、高效準(zhǔn)確的分析結(jié)果,幫助決策者更好的管理企業(yè)。
[1] 丁琳琳,信俊昌,王國仁,黃山.基于Map-Reduce的海量數(shù)據(jù)高效Skyline查詢處理[J]. 計算機學(xué)報. 2011(10).
[2]王斌,徐照興.數(shù)據(jù)挖掘技術(shù)研究.電腦知識與技術(shù),2009,27:6-9.
[3] 王爍生.煉鋼生產(chǎn)過程物流調(diào)度與優(yōu)化項目研究. 河北科技大學(xué)碩士論文,2010,3:25-45.
[4] A.A.VAISMAN,M.M.ESPIL,M.PARADELA.P2P OLAP: Data model, implementation and case study Information Systems,2009,04:231-257.
Data analysis of steel making production logistics based on OLAP
GENG Zhan-jia, WANG Nan, FU Yu-xia, WU Hui, ZHANG Jing. (Shijiazhuang Information Engineering Vocational College, Hebei Province, Shijiazhuang 050035, China;) GENG Zhan-xiong.(The People's Procuratorate of Luancheng District, Shijiazhuang City, Hebei Province, Shijiazhuang 50000 China)
Steel in steel-making process will produce a large logistics data, how to effectively analyze data, to help decision makers to improve decisions become the problems to be solved. In this paper, the technology of data warehouse (DW) and data mining (DM) technology based on, on-line analytical processing (OLAP) create steelmaking production logistics information data warehouse and logistics information data cubes, data mining based on, and ultimately scientific analysis of the data, help managers to make decisions.
Data warehouse; On-line analytical processing; Logistics data; Data mining
TF345
A
1009-5624-(2016)02-0029-02