陳曉杰 許振華 張婭鋒
[摘要]介紹數(shù)據(jù)挖掘的概念、體系、過程和技術方法,分析基于數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)的體系架構,指出應用數(shù)據(jù)挖掘技術的煙草物流綜合管理系統(tǒng)的優(yōu)勢。
[關鍵詞]數(shù)據(jù)挖掘 數(shù)據(jù)倉庫 煙草物流
中圖分類號:TP3 文獻標識碼:A 文章編號:1671-7597(2009)0110098-02
一、引言
現(xiàn)代物流是極具潛力的新興產(chǎn)業(yè),作為繼物質資源、人力資源之后的“第三利潤源”而被高度重視。中國煙草行業(yè)的銷售配送網(wǎng)絡經(jīng)過多年的發(fā)展已經(jīng)具有現(xiàn)代物流的基本特征,包括卷煙運輸、卷煙存儲、卷煙分揀(加工)和卷煙配送等環(huán)節(jié)。由于現(xiàn)在卷煙物流配送實施地區(qū)統(tǒng)一配送,客戶基數(shù)非常大,因此導致每個物流環(huán)節(jié)都產(chǎn)生大量的數(shù)據(jù)。另外現(xiàn)代物流信息技術的使用也使得數(shù)據(jù)庫的規(guī)模不斷擴大,產(chǎn)生了巨大的數(shù)據(jù)流,使企業(yè)很難對這些數(shù)據(jù)進行準確、高效的收集和及時處理,因此也很難幫助決策者做出快速、準確的決策,難以實現(xiàn)對卷煙物流過程的全程監(jiān)控,降低整個卷煙物流的成本。數(shù)據(jù)挖掘技術正可以解決這些問題,能夠幫助企業(yè)在物流信息管理中,及時、準確的收集和分析客戶、市場及整個企業(yè)內部的各種信息,對客戶的行為及市場趨勢進行有效的分析,了解不同客戶的需求,從而可以為客戶提供針對性的服務,大大提高客戶對企業(yè)和產(chǎn)品的滿意度。
二、數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘(Data Mining),又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)是指從大量的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,獲取有效的、新穎的、潛在有用的、最終可理解的模式。數(shù)據(jù)挖掘是一門交叉學科,涉及到數(shù)據(jù)庫技術、人工智能技術、數(shù)理統(tǒng)計、可視化技術、信息提取、空間數(shù)據(jù)提取和并行計算等方面,它把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。數(shù)據(jù)挖掘系統(tǒng)一般由數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫,數(shù)據(jù)庫服務器,知識庫,數(shù)據(jù)挖掘引擎,模式評估模塊和圖形用戶界面組成。數(shù)據(jù)模式可以從不同類型的數(shù)據(jù)庫挖掘,如關系數(shù)據(jù)庫,數(shù)據(jù)倉庫,面向對象的數(shù)據(jù)庫,也可以從其他類型的信息存儲中提取,包括空間的、時間相關的、文本的、多媒體的和遺產(chǎn)數(shù)據(jù)庫,以及萬維網(wǎng)等。數(shù)據(jù)挖掘過程一般由三個步驟組成,即數(shù)據(jù)準備、數(shù)據(jù)挖掘、結果的解釋和評價。在數(shù)據(jù)挖掘的處理過程中,數(shù)據(jù)挖掘方法是最為關鍵的,目前數(shù)據(jù)挖掘的方法主要有以下幾類:關聯(lián)規(guī)則方法、分類和聚類方法、數(shù)據(jù)統(tǒng)計方法、機器學習方法、多層次數(shù)據(jù)匯總歸納、神經(jīng)網(wǎng)絡方法、決策樹方法和序列模式分析方法。
三、數(shù)據(jù)挖掘在煙草物流綜合管理系統(tǒng)中的應用
煙草卷煙物流經(jīng)過幾年的發(fā)展,逐步建立了半自動卷煙分揀系統(tǒng)、自動卷煙分揀系統(tǒng)、數(shù)字倉儲系統(tǒng)和配送車輛GIS系統(tǒng)等物流相關的信息系統(tǒng)。這些信息系統(tǒng)通過應用網(wǎng)絡技術、EDI、人工智能、條形碼、無線pos、電子標簽,RFID等各種先進技術,將物流作業(yè)信息化,物流信息處理電子化和計算機化,極大的提高了工作效率,但是由此也產(chǎn)生了大量的信息,難以及時準確的處理,給領導決策帶來了困難。在這個背景下,物流綜合管理系統(tǒng)的開發(fā)迫在眉睫。物流綜合管理系統(tǒng)是架構在分揀系統(tǒng)、倉儲系統(tǒng)、車輛監(jiān)控系統(tǒng)之上的物流決策系統(tǒng),是一種結合了數(shù)據(jù)挖掘技術和人工智能的新型經(jīng)營決策系統(tǒng)。它通過數(shù)據(jù)收集、智能篩選對卷煙采購、卷煙存儲、卷煙分揀、卷煙配送、日常管理和績效考核的各個環(huán)節(jié)的大量信息進行采集,并利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術對其進行分析處理,以此確定相應的卷煙物流管理決策。物流綜合管理系統(tǒng)的開發(fā)和應用,實現(xiàn)了商業(yè)企業(yè)卷煙商流、物流各個環(huán)節(jié)的無縫銜接,滿足了卷煙物流配送中心精細化管理的要求。通過調度管理、倉儲管理、分揀管理、送貨管理,實現(xiàn)配送中心各作業(yè)活動的前后銜接、左右貫通;通過現(xiàn)場管理、安全管理、設備管理對配送中心的作業(yè)細節(jié)進行細致管理;通過成本核算,對配送中心的費用進行計算,并生成各項費用指標,實現(xiàn)物流成本監(jiān)控與分析;通過績效考核模塊,對配送中心進行多級考核;通過監(jiān)控預警模塊,以文字、表格、圖形等多種形式展現(xiàn)作業(yè)數(shù)據(jù)、管理數(shù)據(jù),實現(xiàn)全面的管理監(jiān)控與管理優(yōu)化分析,為配送中心的高效、服務、低成本運作提供管理決策工具。
(一)卷煙物流管理信息系統(tǒng)數(shù)據(jù)倉庫的建立
數(shù)據(jù)倉庫的建立是數(shù)據(jù)挖掘的基礎。數(shù)據(jù)倉庫是一個面向主題的、集成的、時變的、非易失的數(shù)據(jù)集合,支持管理決策制定。煙草物流分揀、倉儲、配送等各個作業(yè)系統(tǒng)作為數(shù)據(jù)倉庫的原始數(shù)據(jù)源,為數(shù)據(jù)倉庫提供訂單、配貨單、客戶信息、結算信息、倉儲信息、分揀信息等大量數(shù)據(jù)資料和報表。另外,日常管理的臺賬、應急預案等信息也通過相應的數(shù)據(jù)接口導入到數(shù)據(jù)倉庫中。數(shù)據(jù)倉庫通過ETL過程(抽取、轉換和加載)處理這些原始數(shù)據(jù),并且根據(jù)煙草物流的特點和公司領導決策的要求,按照工作流的方式組織、存儲和管理這些數(shù)據(jù)。物流綜合管理系統(tǒng)的領導決策、成本核算、績效考核、報表查詢和作業(yè)管理等子模塊通過數(shù)據(jù)倉庫接口,對數(shù)據(jù)倉庫中的數(shù)據(jù)進行聯(lián)機分析和數(shù)據(jù)挖掘,從而取得用戶需要的數(shù)據(jù)模式,并以合適方式展現(xiàn)給用戶。
(二)應用數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)的體系架構
根據(jù)煙草物流綜合管理系統(tǒng)項目建設目標和主要需求的分析,基于數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)的總體框架可分為基礎網(wǎng)絡層、核心數(shù)據(jù)層、應用支撐層、應用服務層以及表現(xiàn)層五個層次,同時還綜合考慮到物流綜合管理系統(tǒng)的標準體系建設和信息安全體系建設,系統(tǒng)體系架構如圖1所示:
1.網(wǎng)絡基礎層:基礎網(wǎng)絡層包括物流綜合管理系統(tǒng)所涉及的計算機設備、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、應用服務器、通訊系統(tǒng)等,操作系統(tǒng)選擇安全、穩(wěn)定,支持多用戶并發(fā)請求的系統(tǒng),并同時考慮到與數(shù)據(jù)庫服務和應用服務系統(tǒng)軟件選型的兼容性問題;數(shù)據(jù)庫系統(tǒng)滿足安全、穩(wěn)定、大容量、面向事務等關系型數(shù)據(jù)庫基本功能。
2.核心數(shù)據(jù)層:核心數(shù)據(jù)層是物流綜合管理系統(tǒng)的數(shù)據(jù)信息中心,即數(shù)據(jù)倉庫,包含物流綜合管理系統(tǒng)及其他相關應用的所有數(shù)據(jù)。從數(shù)據(jù)的種類看,有結構化和非結構化兩類數(shù)據(jù),從物流管理系統(tǒng)的應用來區(qū)分,包括基礎信息庫、業(yè)務信息庫及物流信息庫。除了物流管理系統(tǒng)自行管理的數(shù)據(jù)之外,很多業(yè)務數(shù)據(jù)和物流信息,來自于其他信息系統(tǒng)如:業(yè)務,分揀、倉儲、營銷、呼叫中心等各類系統(tǒng)。因此,建立數(shù)據(jù)倉庫,對原始數(shù)據(jù)進行轉換、處理、加載,形成統(tǒng)一的接口和交換模式,就成了這些數(shù)據(jù)順利應用的前提。
3.應用支撐層:應用支撐層通過選擇合適的數(shù)據(jù)挖掘技術和方法向物流應用服務層提供所需的各種服務,如數(shù)據(jù)交換服務的統(tǒng)一接口、和統(tǒng)一交換等;同時用戶權限和日志管理服務也歸入這個層次。服務支撐層的目標是為應用服務建立一個支撐環(huán)境:一方面可以為應用系統(tǒng)的開發(fā)提供幫助,另一方面,通過一致的應用支撐層的建設,可以為建成系統(tǒng)的統(tǒng)一性、一致性提供保證。應用支撐層的實現(xiàn)內容:應用支撐層需要實現(xiàn)的功能包括數(shù)據(jù)挖掘、數(shù)據(jù)訪問、消息服務、事務處理、日志處理等。
4.應用服務層:以瀏覽器/服務器(B/S)模式部屬了物流應用服務,并通過IE瀏覽器提供表現(xiàn)層訪問。應用服務包括物流調度管理系統(tǒng)、物流作業(yè)管理系統(tǒng)(一號工程、倉儲、分揀、送貨)、物流管理系統(tǒng)(日常管理、安全管理、費用管理、績效管理)、分析決策系統(tǒng)(各類預案管理、監(jiān)控預警、分析決策)等。
5.表現(xiàn)層:該層次提供系統(tǒng)使用人員訪問應用服務的接入方式。實現(xiàn)界面顯示邏輯和集成,比如信息在不同終端瀏覽器等設備上展現(xiàn)。
(三)應用數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)的優(yōu)勢
與傳統(tǒng)的煙草物流信息管理系統(tǒng)相比,應用數(shù)據(jù)挖掘技術的煙草物流綜合管理系統(tǒng)有以下優(yōu)勢。
1.傳統(tǒng)的煙草物流信息系統(tǒng)通常就是將涉及到的卷煙物流環(huán)節(jié)劃分成各個功能模塊,模塊間信息相對獨立,信息交互能力差,存在大量的信息孤島,無法為用戶領導決策提供幫助。應用數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng),通過采用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術來抽取、處理、挖掘整個煙草物流環(huán)節(jié)的信息,統(tǒng)一組織管理數(shù)據(jù),并且將業(yè)務部門、物流部門以及上游供應商(煙廠)等信息綜合在一起,實現(xiàn)了整個煙草供應鏈信息的高度共享和快速反應。
2.傳統(tǒng)的煙草物流信息系統(tǒng)考慮到系統(tǒng)的運行效率,對于歷史數(shù)據(jù)一般不會保存太久,通常的做法是將歷史數(shù)據(jù)另庫存放,如果要查詢歷史信息,需要選擇歷史數(shù)據(jù)庫才能查詢,作同比和環(huán)比分析時非常麻煩。而應用數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)由于使用了數(shù)據(jù)倉庫,因此具有長時間的歷史數(shù)據(jù)存儲。這為數(shù)據(jù)的趨勢分析,同比分析以及模型預測提供了基礎,也為決策者決策提供了長期的數(shù)據(jù)支持。
3.應用數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)由于對原始數(shù)據(jù)都進行了統(tǒng)一的處理加工,因此具有非常強的可擴展性。如果物流綜合管理系統(tǒng)有新的需求需要用到其他系統(tǒng)的數(shù)據(jù),那么只要根據(jù)統(tǒng)一的接口規(guī)則,將數(shù)據(jù)導入到數(shù)據(jù)倉庫中進行處理、加工,然后通過事先定義好的挖掘方法就可以根據(jù)用戶的需求展現(xiàn)給用戶。
四、結束語
基于數(shù)據(jù)挖掘的煙草物流綜合管理系統(tǒng)是一個綜合性的現(xiàn)代物流管理系統(tǒng),系統(tǒng)既解決了物流動態(tài)管理問題,又解決了各個子系統(tǒng)的數(shù)據(jù)對接問題,使數(shù)據(jù)資源得到有效利用,更解決了行業(yè)內物流成本統(tǒng)計中,因費用界限、口徑不清造成統(tǒng)計可比性較差的問題,同時也為領導決策和預算管理奠定了基礎。
參考文獻:
[1]JIAWEI HAN,MICHELINE KAMBER著、范明、孟小峰等譯,《數(shù)據(jù)挖掘:概念與技術(原書第2版)》,機械工業(yè)出版社,2007.2-1版次.
[2]李其芳,《數(shù)據(jù)挖掘技術在物流信息系統(tǒng)中的應用》,載《商品儲運與養(yǎng)護》,2006.第01期,第17-19頁.
[3]畢方明、張永平,《數(shù)據(jù)挖掘技術研究》,載《計算機工程與設計》,2004.第12期,第25卷,第2242-2244頁.
[4]吳慧香,《數(shù)據(jù)挖掘在物流企業(yè)信息系統(tǒng)中的應用》,載《科技信息(學術版)》,2007.第29期,第324頁.
[5]別文群、鐘其,《基于數(shù)據(jù)挖掘的物流信息系統(tǒng)的分析和設計》,載《物流技術》,2005.第6期,第83-84頁.
[6]李宗璞,《數(shù)據(jù)挖掘技術在物流系統(tǒng)中的應用》,載《商場現(xiàn)代化》,2006.第05期,134-135頁.
[7]劉曉華,《數(shù)據(jù)挖掘在商業(yè)中的應用》,載《商場現(xiàn)代化》,2006.第34期,第74-75頁.
作者簡介:
陳曉杰,浙江省煙草公司臺州市公司信息中心。