段海夢, 王 冰, 焦慧星
(中國電建集團西北勘測設(shè)計研究院有限公司, 西安 710065)
第四次工業(yè)革命以來,信息技術(shù)飛速發(fā)展,互聯(lián)網(wǎng)應用充分普及,信息化、數(shù)字化、智能化正在深刻促進工程行業(yè)產(chǎn)業(yè)變革。十三五期間,OA辦公、人力資源管理、財務管理、項目管理、檔案管理等基礎(chǔ)業(yè)務信息系統(tǒng)已初步覆蓋工程企業(yè)內(nèi)部管理的方方面面[1],為企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型奠定基礎(chǔ)。十四五期間,數(shù)據(jù)將作為企業(yè)資產(chǎn)的重要組成部分[2],幫助企業(yè)應對數(shù)字經(jīng)濟時代的到來[3]。企業(yè)需要借助云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、區(qū)塊鏈等新一代信息技術(shù)實現(xiàn)對數(shù)據(jù)資源的全面開發(fā)和利用,使數(shù)據(jù)發(fā)揮潛在價值和聚合效應,完成數(shù)據(jù)到資源再到資產(chǎn)的轉(zhuǎn)變。
本文結(jié)合所依托的勘測設(shè)計、施工建造類企業(yè)特征,重點面向工程企業(yè)經(jīng)營管理領(lǐng)域,對企業(yè)業(yè)績資源進行全面整合與應用。業(yè)績資源作為企業(yè)綜合競爭力的體現(xiàn),在行業(yè)間同質(zhì)化競爭程度越來越激烈的情況下[4],對企業(yè)拓展市場、成功競標等具有重要意義。業(yè)績資源通常包括工程業(yè)績、人員業(yè)績、資質(zhì)、獲獎等各類資料,內(nèi)容繁多,構(gòu)成復雜,來源廣泛,且分散于不同的業(yè)務系統(tǒng)和業(yè)務人員手中,面臨數(shù)據(jù)質(zhì)量參差不齊、孤島化嚴重、使用效率低等問題,極大的阻礙了數(shù)據(jù)應用價值和潛在效益的發(fā)揮。通過構(gòu)建企業(yè)級業(yè)績共享平臺,對分散于各業(yè)務系統(tǒng)和業(yè)務人員手中的數(shù)據(jù)資源進行系統(tǒng)化、標準化、集成化、共享化的管理和應用,能夠幫助企業(yè)分析和明確市場定位[5],提高項目投標效率和中標概率[6],同時應用于管理輔助決策等。
國內(nèi)工程行業(yè)數(shù)據(jù)管理與應用研究中,吳沂梅[7]提出了一種基于Excel表格進行監(jiān)理企業(yè)業(yè)績管理的設(shè)計方法,該方法相對簡單原始,無法對大規(guī)模數(shù)據(jù)進行實時和共享式的管理與利用。黃曉輝[8]基于企業(yè)數(shù)據(jù)中心和數(shù)據(jù)挖掘技術(shù)開展了投標報價及相關(guān)輔助決策系統(tǒng)的研究,該方法對企業(yè)基礎(chǔ)信息化及數(shù)據(jù)管理水平要求較高,在信息化發(fā)展和管理水平有限的企業(yè)難以實施。劉致彤等[9]利用Kettle ETL工具開發(fā)了面向集團級的統(tǒng)一數(shù)據(jù)資源調(diào)配和交互服務,該方法主要對工程管理領(lǐng)域的合同、項目等數(shù)據(jù)進行梳理和建模,服務于項目管理。
對不同企業(yè)而言,需根據(jù)自身信息化發(fā)展水平與管理需求,建立相關(guān)核心數(shù)據(jù)庫進而提供有價值的應用服務。本文基于數(shù)據(jù)倉庫技術(shù)對工程企業(yè)豐富的業(yè)績資源進行分層建模與管理利用,建立了一個企業(yè)級業(yè)績共享平臺。數(shù)據(jù)倉庫[10]是一種為管理決策提供異構(gòu)數(shù)據(jù)集成與重組服務的技術(shù),能夠為復雜數(shù)據(jù)的處理、存儲、分析提供支撐,具有面向主題、集成穩(wěn)定等特點。不同于基礎(chǔ)業(yè)務信息系統(tǒng)面向管理和事務處理的操作型數(shù)據(jù)庫,數(shù)據(jù)倉庫技術(shù)主要研究和解決如何從多源異構(gòu)數(shù)據(jù)中獲取目標信息。該技術(shù)能夠?qū)θ珮I(yè)務環(huán)節(jié)、全生命周期的各類數(shù)據(jù)進行整合,為企業(yè)提供全面數(shù)據(jù)服務與應用,已經(jīng)在銀行[11]、電力[12]等行業(yè)管理中得到廣泛實踐和應用。
工程企業(yè)業(yè)績共享平臺旨在建立統(tǒng)一的數(shù)據(jù)資源管理服務對企業(yè)經(jīng)營管理相關(guān)的工程、人員、獲獎、資質(zhì)、市場等各類業(yè)績數(shù)據(jù)進行全面、準確、安全的管控與應用,通過數(shù)據(jù)加工與聚合,滿足經(jīng)營管理工作的一站式資料檢索和使用需求。平臺應重點解決數(shù)據(jù)孤島化問題(數(shù)據(jù)分散、缺乏關(guān)聯(lián)、多來源數(shù)據(jù)沖突),通過集成與共享,充分發(fā)揮數(shù)據(jù)潛在價值和聚合效應。平臺的核心功能包括數(shù)據(jù)采集與聚合,數(shù)據(jù)質(zhì)量與安全控制,信息檢索與應用服務。
(1) 數(shù)據(jù)采集與聚合
全面梳理企業(yè)核心業(yè)績資源分布情況,建立主題數(shù)據(jù)體系和數(shù)據(jù)倉庫模型。對分散于各相關(guān)業(yè)務系統(tǒng)及業(yè)務人員手中的數(shù)據(jù)資料進行統(tǒng)一采集、清洗、整理、聚合,實施系統(tǒng)化、標準化的管理與存儲。實現(xiàn)從單一數(shù)據(jù)到關(guān)聯(lián)主題數(shù)據(jù)的轉(zhuǎn)變。
(2) 質(zhì)量與安全控制
構(gòu)建數(shù)據(jù)分析檢測機制,完成對缺失、低質(zhì)量、沖突數(shù)據(jù)的補充采集與報錯糾正;通過權(quán)限控制、日志監(jiān)控、備份等措施保證數(shù)據(jù)不被更改、泄露、丟失。確保數(shù)據(jù)完整性、一致性、準確性、安全性。
(3) 信息檢索與應用服務
利用大數(shù)據(jù)檢索及分析機制,為用戶提供搜索引擎式資料檢索服務;同時提供統(tǒng)計分析與輔助決策等功能,滿足不同層級企業(yè)人員的數(shù)據(jù)使用需求,最大限度提高工作效率。
平臺采用B/S架構(gòu),依托開源框架進行開發(fā)。整體分為3層,如圖1所示。
最底層為數(shù)據(jù)層,該層完成對數(shù)據(jù)的采集、加工、處理、存儲,生成統(tǒng)一和標準化的主題關(guān)聯(lián)數(shù)據(jù)集,提供面向應用的具體數(shù)據(jù)。采用ODS-DW-DM三層數(shù)據(jù)倉庫模式[13]建立統(tǒng)一數(shù)據(jù)服務。結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)分別存儲于SqlServer數(shù)據(jù)庫和ftp統(tǒng)一文件管理器中。中間層為后臺服務層,提供信息檢索、數(shù)據(jù)檢測、文件加密、權(quán)限管理、安全認證、定時備份等應用服務和運維服務?;赟pring Boot框架開發(fā)并部署于Linux CentOS服務器。
最上層為前臺應用表現(xiàn)層,提供全域檢索、企業(yè)中心、業(yè)績庫、數(shù)據(jù)采集、系統(tǒng)維護等五大板塊50余項功能頁面,用戶通過瀏覽器端登錄訪問和使用相關(guān)功能。使用Layui框架開發(fā)。
平臺底層采用ODS-DW-DM三層數(shù)據(jù)倉庫模式實現(xiàn)業(yè)務管理、數(shù)據(jù)整合共享、系統(tǒng)應用三分離。根據(jù)業(yè)務領(lǐng)域信息化水平能力,ODS(Operation Data Storage)原始操作型數(shù)據(jù)層以業(yè)務系統(tǒng)自動化采集、業(yè)務人員人工采集兩種形式獲取原始業(yè)績數(shù)據(jù),并以全量或增量兩種模式進行數(shù)據(jù)更新。隨后按照所制定的企業(yè)主題數(shù)據(jù)體系,將數(shù)據(jù)轉(zhuǎn)化、加工后進入DW(Data Warehouse)主題數(shù)據(jù)倉庫層,形成標準化集成主題數(shù)據(jù)。最后面向搜索、統(tǒng)計分析等具體應用功能,對數(shù)據(jù)進行復雜計算和加工,形成DM(Data Market)數(shù)據(jù)集市層。
建立數(shù)據(jù)倉庫的關(guān)鍵是進行主題數(shù)據(jù)體系及關(guān)聯(lián)業(yè)務系統(tǒng)梳理。主題數(shù)據(jù)體系聚焦實體對象完整特征及關(guān)聯(lián)關(guān)系,打破單一業(yè)務系統(tǒng)數(shù)據(jù)局限性,提供聚合化、關(guān)聯(lián)式的數(shù)據(jù)服務。通過對企業(yè)業(yè)績相關(guān)全管理鏈數(shù)據(jù)分布情況的統(tǒng)計和分析,得到圖2所示的包含工程、人員、獲獎、資質(zhì)、相關(guān)方、其他等六大主題在內(nèi)的關(guān)聯(lián)數(shù)據(jù)模型。
以工程主題為例,主要包括工程基本信息、合同信息(子主題)、招投標文件、項目信息(子主題)、履約文件、工程特性值、獲獎信息、參建人員等基礎(chǔ)元數(shù)據(jù)。數(shù)據(jù)來源包括:檔案系統(tǒng)、項目管理系統(tǒng)、經(jīng)營合同系統(tǒng)等。人員、獲獎、資質(zhì)、相關(guān)方等主題類似,均由多來源數(shù)據(jù)構(gòu)成完整主題對象。主題間通過共有特征進行關(guān)聯(lián)穿透。
平臺主要功能包括全域檢索、企業(yè)中心、業(yè)績庫、數(shù)據(jù)采集、系統(tǒng)維護等五大板塊。
3.1.1全域檢索
基于全文檢索技術(shù)實現(xiàn)對海量數(shù)據(jù)的一站式檢索服務,用戶輸入任意關(guān)鍵詞返回分類業(yè)績資料詳情,最大限度提高工作效率,降低平臺使用門檻及學習成本。圖3展示了用戶輸入檢索詞“抽水蓄能 浙江”后返回的分類業(yè)績信息。雙擊搜索結(jié)果條目即可進入主題數(shù)據(jù)詳情。
3.1.2企業(yè)中心
利用大數(shù)據(jù)統(tǒng)計分析技術(shù)對平臺收錄數(shù)據(jù)整體情況、常用經(jīng)營指標(如新簽合同地域分布、業(yè)務板塊分布)等進行分析和展示,應用于企業(yè)管理輔助決策等。圖4為平臺高頻檢索詞匯云圖。
3.1.3業(yè)績庫
提供對工程、人員、獲獎、資質(zhì)、相關(guān)方、其他六大主題業(yè)績數(shù)據(jù)的分類應用功能,可實現(xiàn)數(shù)據(jù)的分類、分級授權(quán)使用。相比全域檢索的模糊式查詢,用戶可在特定類別業(yè)績臺賬下設(shè)定常用過濾條件,實現(xiàn)更有針對性的資料查找與分析。圖5展示了由檔案系統(tǒng)、經(jīng)營合同系統(tǒng)、項目管理系統(tǒng)、報評獎系統(tǒng)等多個來源的數(shù)據(jù)集成加工后構(gòu)成的一個完整工程業(yè)績詳情。以工程為根節(jié)點,向下可穿透查看相關(guān)的合同子主題和項目子主題,由項目子主題的參建人員可關(guān)聯(lián)到相關(guān)人員主題,實現(xiàn)主題間的便捷化、穿透式、關(guān)聯(lián)性推薦查詢。
3.1.4數(shù)據(jù)采集
受限于企業(yè)不同業(yè)務環(huán)節(jié)信息化管理水平不一致的現(xiàn)狀,對信息化覆蓋程度高的業(yè)務領(lǐng)域采用自動化采集的模式從相關(guān)業(yè)務系統(tǒng)獲取數(shù)據(jù);對信息化水平有限的領(lǐng)域,采用人工采集的形式完成對數(shù)據(jù)的補充和完善。如工程主題下的工程特性值和履約文件采集,由多名授權(quán)專業(yè)工程人員進行資料搜集與實名制錄入,經(jīng)相關(guān)管理人員審核后更新發(fā)布。同時平臺通過自動檢測缺失數(shù)據(jù)和用戶在線反饋錯誤數(shù)據(jù)兩種機制標記低質(zhì)量數(shù)據(jù),根據(jù)數(shù)據(jù)來源由原業(yè)務系統(tǒng)或授權(quán)人員進行維護,達到數(shù)據(jù)動態(tài)治理與質(zhì)量提升的目標。
3.1.5系統(tǒng)維護
提供日志監(jiān)控(含數(shù)據(jù)監(jiān)控、用戶行為監(jiān)控)、權(quán)限分配(多層級授權(quán)管理)、基礎(chǔ)數(shù)據(jù)配置等常用運維功能。保證系統(tǒng)安全與數(shù)據(jù)安全。
平臺自2020年10月上線運行以來,已在16家生產(chǎn)經(jīng)營機構(gòu)投入使用,所收錄主題數(shù)據(jù)量及相關(guān)功能板塊訪問量統(tǒng)計如表1所示。
表1 平臺運行指標表
在數(shù)據(jù)治理方面,平臺集成關(guān)聯(lián)業(yè)務系統(tǒng)11個,加工整合主題數(shù)據(jù)54 015個,底層存儲數(shù)據(jù)10萬余條,補充采集與報錯糾正837條數(shù)據(jù),對人員證件管理、中標結(jié)果管理、合同信息錄入等多個管理環(huán)節(jié)進行漏洞修補和反向監(jiān)督,有效促進企業(yè)數(shù)據(jù)質(zhì)量和整體信息化水平提升。
在使用覆蓋面及有效性方面,平臺上線400余天,授權(quán)用戶368人,累計訪問45 165人次。日均訪問量大于100人次,高峰期單日訪問量超500人次,累計檢索詞匯26 089個。在水利樞紐、水環(huán)境治理、智慧城市、城鄉(xiāng)建設(shè)等不同業(yè)務領(lǐng)域、千余個經(jīng)營項目中投入使用,幫助企業(yè)挖掘潛在市場,極大地提高了工作效率與知識利用水平。平臺上線后企業(yè)中標率得到一定提升,為企業(yè)帶來新的經(jīng)濟收益。
(1) 本文以工程企業(yè)業(yè)績共享平臺建設(shè)為例,提出了一種基于數(shù)據(jù)倉庫技術(shù)全面整合企業(yè)各環(huán)節(jié)業(yè)績數(shù)據(jù),構(gòu)建多主題、多層次、互聯(lián)化的數(shù)據(jù)服務體系的方法。有效地解決了數(shù)據(jù)資源分散化、質(zhì)量參差不齊、使用效率低等問題。能夠為企業(yè)各級管理者提供一站式、綜合化、高質(zhì)量、高效率的數(shù)據(jù)應用服務。
(2) 平臺的建成對推動企業(yè)數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)資源利用、管理提升、數(shù)字化轉(zhuǎn)型等具有重要意義。通過對數(shù)據(jù)的統(tǒng)一化、標準化管理及智能化監(jiān)控,能夠有效監(jiān)督和反向促進相關(guān)管理環(huán)節(jié)的治理能力,提高企業(yè)基礎(chǔ)信息化水平。
(3) 平臺已被廣泛應用于企業(yè)市場定位分析、項目投標和管理輔助決策中,為企業(yè)贏得了新的市場收益。下一步將繼續(xù)借助數(shù)據(jù)挖掘、機器學習等先進技術(shù),開發(fā)競標價格分析、智慧編標等功能,進一步提高企業(yè)核心數(shù)字化競爭力。