摘要:文章闡述了企業(yè)在兩化融合發(fā)展進(jìn)程中數(shù)據(jù)開發(fā)利用的需求,給出了以實(shí)際操作層、信息系統(tǒng)層和數(shù)據(jù)分析層為組成部分的數(shù)據(jù)開發(fā)利用體系框架,并結(jié)合CRISP-DM模型提出了企業(yè)進(jìn)行數(shù)據(jù)開發(fā)利用的實(shí)施過程,最后提出具體實(shí)施過程中的關(guān)鍵點(diǎn)。
關(guān)鍵詞:兩化融合;CRISP-DM模型;數(shù)據(jù)開發(fā)利用 文獻(xiàn)標(biāo)識碼:A
中圖分類號:F427 文章編號:1009-2374(2015)21-0029-02 DOI:10.13535/j.cnki.11-4406/n.2015.21.015
信息化和工業(yè)化融合(以下簡稱“兩化融合”)是當(dāng)今國家乃至世界發(fā)展的大趨勢,對于企業(yè)而言,兩化融合是將信息化作為手段,夯實(shí)工業(yè)化基礎(chǔ),推進(jìn)企業(yè)數(shù)據(jù)、技術(shù)、業(yè)務(wù)流程、組織結(jié)構(gòu)的互動創(chuàng)新和持續(xù)優(yōu)化,從而打造信息化環(huán)境下新型能力的過程。近年來,隨著企業(yè)單項(xiàng)應(yīng)用的增加及集成度的提升,計(jì)算機(jī)對數(shù)據(jù)的處理能力顯著提高,隨之而來的數(shù)據(jù)量與日俱增。市場競爭的加劇、企業(yè)規(guī)模的增大、數(shù)據(jù)復(fù)雜度的提升都要求企業(yè)實(shí)現(xiàn)數(shù)據(jù)的開發(fā)利用,為領(lǐng)導(dǎo)決策提供相應(yīng)的依據(jù)。為進(jìn)一步規(guī)范企業(yè)數(shù)據(jù)的開發(fā)利用,《信息化與工業(yè)化融合管理體系要求》中也著重提出了“有效地開發(fā)利用數(shù)據(jù)”的要求。故本文提出在兩化融合過程中,企業(yè)利用CRISP-DM(cross-industry standard process for data mining)模型規(guī)范數(shù)據(jù)開發(fā)利用的過程。
1 數(shù)據(jù)開發(fā)利用體系框架
數(shù)據(jù)開發(fā)利用體系框架如圖1所示,可分為三個
部分:
1.1 實(shí)際操作層
涵蓋研發(fā)、制造、銷售等環(huán)節(jié),是企業(yè)數(shù)據(jù)的最初來源和最終落腳點(diǎn),各部門負(fù)責(zé)采集其中的數(shù)據(jù),將其作為信息系統(tǒng)的輸入,并利用決策的結(jié)果對實(shí)際業(yè)務(wù)進(jìn)行調(diào)整。
1.2 信息系統(tǒng)層
涵蓋企業(yè)ERP、OA、PLM等已有信息系統(tǒng),對其進(jìn)行集成應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)、接口的標(biāo)準(zhǔn)化和規(guī)范化,確保為數(shù)據(jù)分析層提供有效的數(shù)據(jù)。
1.3 數(shù)據(jù)分析層
涵蓋了數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和決策支持/商業(yè)智能三部分,用于將信息系統(tǒng)中的數(shù)據(jù)提取出來,并根據(jù)需要進(jìn)行轉(zhuǎn)換和存儲,然后按照特定目的進(jìn)行挖掘、統(tǒng)計(jì)和分析,從而產(chǎn)生供管理者參考的決策,可包括:研發(fā)方向調(diào)整、銷售市場細(xì)分、職能部門優(yōu)化等,最終將決策反饋至實(shí)際操作層,并對信息系統(tǒng)作相應(yīng)變更。
2 利用CRISP-DM模型實(shí)現(xiàn)企業(yè)數(shù)據(jù)開發(fā)利用
CRISP-DM由歐盟機(jī)構(gòu)于1999年聯(lián)合起草,為全工業(yè)界提供數(shù)據(jù)挖掘利用的全生命周期管理標(biāo)準(zhǔn)。CRISP-DM模型定義了六個過程,按照此模型,企業(yè)可按如下步驟實(shí)施數(shù)據(jù)開發(fā)利用:
2.1 商業(yè)理解
從企業(yè)戰(zhàn)略出發(fā),確定可持續(xù)競爭優(yōu)勢和需要打造的信息化環(huán)境下新型能力,再細(xì)化到需要實(shí)現(xiàn)的兩化融合目標(biāo),從待實(shí)現(xiàn)的目標(biāo)中提出需解決的數(shù)據(jù)開發(fā)利用問題,進(jìn)行數(shù)據(jù)開發(fā)利用策劃,需涵蓋開發(fā)目標(biāo)、涉及部門、數(shù)據(jù)來源、開發(fā)過程等。
2.2 數(shù)據(jù)理解
根據(jù)數(shù)據(jù)開發(fā)利用策劃,從各部門、各流程、各崗位、各系統(tǒng)中收集相關(guān)數(shù)據(jù),并對數(shù)據(jù)質(zhì)量加以鑒別,以確保數(shù)據(jù)的準(zhǔn)確性、全面性、有效性,此外,還需初步探索數(shù)據(jù)自身的特征及數(shù)據(jù)間的相互聯(lián)系,形成對潛在信息的假設(shè)。
2.3 數(shù)據(jù)準(zhǔn)備
根據(jù)與數(shù)據(jù)開發(fā)利用目標(biāo)的相關(guān)性、數(shù)據(jù)質(zhì)量及開發(fā)利用技術(shù),進(jìn)行建模前的數(shù)據(jù)準(zhǔn)備。首先進(jìn)行數(shù)據(jù)表制作,將數(shù)據(jù)統(tǒng)一格式后進(jìn)行記錄,然后為適應(yīng)建模工具進(jìn)行數(shù)據(jù)清理,這一過程一般需反復(fù)實(shí)施多次,直至篩選出最終數(shù)據(jù)集。
2.4 建立模型
根據(jù)待數(shù)據(jù)開發(fā)利用的問題類型,選擇對應(yīng)的建模技術(shù)。與以往類似的可對原技術(shù)加以修改沿用,與以往不相同的則需要重新建模。在此過程中,當(dāng)涉及到數(shù)據(jù)不匹配時(shí),可能會重新進(jìn)行數(shù)據(jù)準(zhǔn)備過程,實(shí)現(xiàn)對數(shù)據(jù)參數(shù)的精準(zhǔn)校對。
2.5 模型評估
在數(shù)據(jù)模型最終部署之前,需對修改和新增的模型進(jìn)行再評估,回顧其中每個步驟、每個數(shù)據(jù)、每個邏輯,尤其要考慮和兩化融合目標(biāo)的關(guān)聯(lián)性,確定是否可解決提出的數(shù)據(jù)開發(fā)利用問題,為模型部署成功提供
保障。
2.6 部署實(shí)施
由信息部門和相關(guān)業(yè)務(wù)部門共同完成相關(guān)信息系統(tǒng)的搭建、改造和完善,明確各部門、各崗位參與數(shù)據(jù)開發(fā)利用的主體和具體職責(zé),以制度文件的形式規(guī)范下來,共同參與數(shù)據(jù)開發(fā)利用過程。
3 數(shù)據(jù)開發(fā)利用的關(guān)鍵點(diǎn)
根據(jù)對應(yīng)的規(guī)范要求和過程指導(dǎo),為確保有效開發(fā)和利用數(shù)據(jù),在具體實(shí)施過程中應(yīng)重點(diǎn)關(guān)注以下幾點(diǎn):
3.1 重視商業(yè)理解,統(tǒng)籌管理全局
商業(yè)理解是數(shù)據(jù)開發(fā)利用的第一步,它關(guān)注數(shù)據(jù)開發(fā)利用過程中的方向性問題。應(yīng)由領(lǐng)導(dǎo)層深入?yún)⑴c,正確把握兩化融合目標(biāo),明確待解決問題對達(dá)成目標(biāo)的關(guān)聯(lián)度和貢獻(xiàn)性,在各部門提出需求的基礎(chǔ)上,重點(diǎn)關(guān)注最迫切的數(shù)據(jù)開發(fā)利用方向。只有始終抓住這個重點(diǎn),才能對后續(xù)的實(shí)施全局起決定性的指導(dǎo)作用。
3.2 嚴(yán)把數(shù)據(jù)來源,推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)的可靠性、真實(shí)性、完整性是數(shù)據(jù)開發(fā)利用的基礎(chǔ),也是達(dá)成兩化融合目標(biāo)的保障。如果數(shù)據(jù)質(zhì)量不好,即使模型很完美,也不可避免產(chǎn)生一個偏差或者錯誤的結(jié)果。應(yīng)嚴(yán)格篩選和過濾各部門、流程、崗位及系統(tǒng)提供的數(shù)據(jù),推進(jìn)數(shù)據(jù)處理環(huán)節(jié)的標(biāo)準(zhǔn)化,并建立相應(yīng)的數(shù)據(jù)校對機(jī)制,逐步提高數(shù)據(jù)的質(zhì)量。
3.3 落實(shí)責(zé)任主體,明確具體職責(zé)
職責(zé)分配落實(shí)是確保數(shù)據(jù)開發(fā)利用有序進(jìn)行的關(guān)鍵,也是長期進(jìn)行數(shù)據(jù)治理的必要措施。如果不能從制度上落實(shí)職責(zé),很容易造成數(shù)據(jù)的遺漏和丟失。應(yīng)制定相關(guān)制度,規(guī)定數(shù)據(jù)采集和維護(hù)的周期,指定專門崗位按制度要求負(fù)責(zé)數(shù)據(jù)的采集、匯總、校驗(yàn)、錄入等,并由上級領(lǐng)導(dǎo)對數(shù)據(jù)的真實(shí)性進(jìn)行審核,對數(shù)據(jù)的準(zhǔn)確性負(fù)責(zé)。
3.4 定期回顧總結(jié),提升決策質(zhì)量
對數(shù)據(jù)的定期回顧和總結(jié)是不斷提升決策質(zhì)量的必要環(huán)節(jié),它關(guān)注于數(shù)據(jù)開發(fā)利用中的方向修正問題。如果無法通過回顧總結(jié)發(fā)現(xiàn)其中的疏漏和不完善,會對決策準(zhǔn)確性造成影響。應(yīng)周期性地對數(shù)據(jù)的質(zhì)量及數(shù)據(jù)對達(dá)成目標(biāo)的貢獻(xiàn)性進(jìn)行回顧總結(jié),調(diào)整優(yōu)化相應(yīng)業(yè)務(wù)流程和崗位職責(zé),對應(yīng)地更新信息系統(tǒng),確保數(shù)據(jù)開發(fā)利用的高效和準(zhǔn)確。
4 結(jié)語
隨著工業(yè)4.0時(shí)代的到來,IT技術(shù)的發(fā)展為企業(yè)帶來了新的思路,數(shù)據(jù)作為企業(yè)各生產(chǎn)環(huán)節(jié)的核心,對其進(jìn)行開發(fā)利用是企業(yè)必須持續(xù)推進(jìn)、不斷提升的系統(tǒng)性、全局性工作。必須圍繞數(shù)據(jù)對企業(yè)的經(jīng)營發(fā)展做長遠(yuǎn)布局,梳理當(dāng)前已有的管理、生產(chǎn)、銷售、人員等數(shù)據(jù),調(diào)整優(yōu)化信息系統(tǒng)、管理制度、崗位職責(zé),實(shí)現(xiàn)企業(yè)從傳統(tǒng)制造向智能制造的轉(zhuǎn)型。
參考文獻(xiàn)
[1] 中華人民共和國工業(yè)和信息化部.信息化和工業(yè)化融合管理體系要求(試行)[S].2014.
[2] 野村綜合研究所.圖解CIO工作指南[M].北京:人民郵電出版社,2014.
[3] 郭亮.用CRISP-DM模型來規(guī)范企業(yè)數(shù)據(jù)中心建設(shè)
[J].華北科技學(xué)院學(xué)報(bào),2008,4(5).
作者簡介:華苗苗(1987-),女,浙江人,浙江省電子信息產(chǎn)品檢驗(yàn)所助理工程師,碩士,研究方向:兩化融合。
(責(zé)任編輯:周 瓊)