徐國慶
【摘 ?要】數(shù)據要素對提升企業(yè)價值具有重要意義,但數(shù)據質量、標準、安全、基礎數(shù)據和元數(shù)據缺失、思想認識不統(tǒng)一等問題在很大程度上限制了數(shù)據紅利的發(fā)揮,需要通過數(shù)據治理,采取對歷史臟數(shù)據進行清洗、統(tǒng)一規(guī)則流程和數(shù)據標準、加強數(shù)據安全管理、加強基礎數(shù)據和元數(shù)據管理、通過集團一體化統(tǒng)一實施等措施加以解決。論文在對上述內容進行分析的基礎上提出,在宏觀層面還要促進國家法規(guī)與行業(yè)規(guī)范的互補,打造良性循環(huán)的數(shù)據生態(tài),實施數(shù)據生命周期全流程管理和分類治理,綜合提升數(shù)據治理環(huán)境,助力數(shù)據治理提升數(shù)據應用價值。
【關鍵詞】數(shù)據治理;數(shù)據應用價值;數(shù)據質量
【中圖分類號】F49 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2023)01-0042-03
1 引言
鑒于近年來中國數(shù)字經濟的快速發(fā)展,黨中央、國務院把大數(shù)據的戰(zhàn)略地位提升至國家級。國家通過將數(shù)據與土地、勞動力、資本、技術并列為生產要素,希望在更深層次上促進數(shù)據資源的開發(fā)利用。深入挖掘數(shù)據要素應用價值,提升企業(yè)運行效率,實現(xiàn)精準決策,提高營銷針對性,創(chuàng)新商業(yè)模式,對企業(yè)而言意義重大。但數(shù)據要發(fā)揮作用,現(xiàn)階段存在的障礙也不少,數(shù)據質量問題、標準問題、安全問題、基礎數(shù)據和元數(shù)據缺失問題、思想認識不統(tǒng)一問題等在很大程度上限制了數(shù)據紅利的發(fā)揮,需要通過數(shù)據治理來解決上述問題,幫助企業(yè)實現(xiàn)價值創(chuàng)造。
2 目前數(shù)據應用存在的問題
大數(shù)據技術的發(fā)展和信息化的普及,使企業(yè)能夠積累大量的數(shù)據。然而,數(shù)據量大并不代表數(shù)據價值高,也不代表數(shù)據能夠直接被使用,直接能為企業(yè)帶來價值。數(shù)據質量問題、數(shù)據標準不一致問題、數(shù)據安全問題、基礎數(shù)據和元數(shù)據管理缺失問題、集團內共享思想不統(tǒng)一問題等情況的存在,直接影響數(shù)據分析的有效性。
2.1 數(shù)據質量問題
一些企業(yè)由于歷史原因,數(shù)據庫多,平臺多,孤立應用多,同時數(shù)據多頭錄入,錄入不及時、數(shù)據錄入錯誤或者遺漏,功能重復開發(fā),信息與業(yè)務融合不緊密等,造成了數(shù)據來源多且雜,相互邏輯關系亂,數(shù)據分布離散性高,數(shù)據形態(tài)各異,結構不一致,錯誤和遺漏嚴重,導致數(shù)據應用難、技術共享難、業(yè)務協(xié)調難、安全無保障等問題。同時,數(shù)據質量管理規(guī)則不明甚至缺失,沒有包含標準、組織、流程、質量、安全、技術等多個層面的數(shù)據治理方案框架,缺乏整體的數(shù)據質量管控體系。
2.2 數(shù)據標準不一致問題
標準化是現(xiàn)代社會流水化生產、分工協(xié)作的基礎,是反復實踐之后得出的最有效率的生產組織方式。數(shù)據形成標準化后,數(shù)據價值更容易實現(xiàn)。但不同的系統(tǒng),由于管理視角和需求深度的不同,導致數(shù)據指標的選擇不同。而每個指標的統(tǒng)計范圍不一樣,所選擇的口徑也不一樣,導致指標的信息含義也不一樣,最終造成系統(tǒng)間數(shù)據標準不一致,因此難以實現(xiàn)跨系統(tǒng)的共享和復用。同樣的問題還存在于企業(yè)內各部門之間,或者集團內各企業(yè)之間,因為數(shù)據標準不統(tǒng)一,造成數(shù)據應用過程中準確性、一致性欠缺。這種情況在分支機構層級多、業(yè)務板塊多元化、跨行業(yè)范圍廣、前后產業(yè)鏈長的集團更為普遍。由于集團內各企業(yè)的信息系統(tǒng)是分別建設,系統(tǒng)建設所處階段不同,建設水平不一,行業(yè)規(guī)范和監(jiān)管要求不同,內部需求不一致,各子公司、各部門數(shù)據管理能力參差不齊,加上缺乏統(tǒng)一規(guī)劃、統(tǒng)一規(guī)范、統(tǒng)一管理,各自建設,最終造成數(shù)據標準不統(tǒng)一。
2.3 數(shù)據安全問題
數(shù)據安全方面,隨著企業(yè)數(shù)據開放和各類共享平臺的搭建,企業(yè)與外界進行數(shù)據交互的機會變多,使企業(yè)面臨的數(shù)據安全風險也加大。從數(shù)據完整生命周期來看,數(shù)據在各個環(huán)節(jié),如采集、存儲、傳輸、匯總、加工、交換、刪除等都面臨不同程度的安全隱患,來自外部的攻擊,內部的泄密,軟硬件故障,工作疏忽或人為惡意造成數(shù)據丟失或損壞,都是隱患來源。
2.4 基礎數(shù)據、元數(shù)據管理缺失問題
基礎數(shù)據又稱“公共數(shù)據”,是指在各個系統(tǒng)中被重復共享、反復使用的數(shù)據。
基礎數(shù)據主要包括客戶、供應商、產品、項目、員工、組織、科目等數(shù)據,是企業(yè)信息化管理的基礎。如果在各信息系統(tǒng)中對基礎數(shù)據的統(tǒng)一管理缺失,會直接影響工作效率和數(shù)據分析結果的質量。元數(shù)據是“描述其他數(shù)據的數(shù)據”,它能解釋數(shù)據意味著什么,來源于哪里,哪些部門可以由哪種方式訪問這些數(shù)據等,可以看作是數(shù)據的“索引”。通過對元數(shù)據的規(guī)范管理,實現(xiàn)各類數(shù)據的快速檢索、血緣分析和數(shù)據地圖展示。元數(shù)據管理的缺失,將造成即使發(fā)現(xiàn)錯誤數(shù)據,也難以進行溯源管理和責任認定。
2.5 集團內數(shù)據共享思想認識不統(tǒng)一問題
集團內不同子公司擁有不同的利益結構和訴求,以及嚴格的外部監(jiān)管要求和內部商業(yè)秘密保密制度,互相之間數(shù)據協(xié)同的顧慮較多,都希望數(shù)據只進不出,本機構的底層敏感豐富數(shù)據不敢開放。內部子公司之間的利益關系阻礙了集團層面數(shù)據治理工作的落實。
3 數(shù)據治理的相應措施
要解決上述數(shù)據應用問題,需要對企業(yè)現(xiàn)有數(shù)據管理情況進行自我檢查,系統(tǒng)掌握數(shù)據治理環(huán)境現(xiàn)狀,包括目前的管理組織、制度和流程、數(shù)據分類、編碼方式、安全標準、交換標準等。在此基礎上,重點檢查數(shù)據質量管理現(xiàn)狀,包括數(shù)據邏輯一致性、結構完整性、應用合規(guī)性、處置及時性、使用有效性、存儲冗余程度等。檢查摸底完成后,對企業(yè)業(yè)務進行梳理,圍繞市場熱點、業(yè)務痛點、流程堵點,對歷史臟數(shù)據進行清洗,統(tǒng)一規(guī)則流程和數(shù)據標準,加強數(shù)據安全管理,加強基礎數(shù)據管理、元數(shù)據管理,通過集團一體化統(tǒng)一實施,分步驟、分階段、分層次、分場景逐步開展數(shù)據治理。
3.1 對歷史數(shù)據進行數(shù)據清洗
數(shù)據清洗是處理臟數(shù)據的過程,如數(shù)據的字段格式錯誤及邏輯錯誤、字段冗余或缺失、數(shù)據邏輯不一致或信息異常等情況。數(shù)據清洗要清晰掌握原有質量標準、情況和實際業(yè)務對數(shù)據的質量需求,重點在于設定數(shù)據排查規(guī)則,發(fā)現(xiàn)異常與錯誤,識別錯誤數(shù)據產生的原因和存在形式,選擇合適的清洗方案,對錯誤數(shù)據依次執(zhí)行清洗規(guī)則,然后評估清洗、修正效果,最后將干凈數(shù)據替換至原數(shù)據庫。另外還要制定規(guī)則,規(guī)范后續(xù)數(shù)據錄入,特別是線下手工采集的數(shù)據,保證新產生數(shù)據的及時性、準確性、完整性和規(guī)范性。
3.2 統(tǒng)一設計數(shù)據標準、制度、流程和規(guī)則
數(shù)據標準主要包括數(shù)據命名規(guī)則、字段結構確定,以及數(shù)據編碼定義和取值含義規(guī)則。數(shù)據標準作為數(shù)據質量控制的準則、數(shù)據模型搭建的參考、信息系統(tǒng)設計的依據,在編制、落地過程中需要注意梳理各類制度章程和國家標準,將相關規(guī)范具象到標準中,結合企業(yè)應用價值主張落地實施。
以國家標準、行業(yè)標準作為參考,重點對企業(yè)業(yè)務和數(shù)據進行調研和分析,結合數(shù)據標準、需求和現(xiàn)狀,基于企業(yè)實際情況,從業(yè)務、技術、管理3個角度出發(fā)建立標準。通常,根據業(yè)務特點確定數(shù)據編碼、命名、字段含義、分類、分級標準;根據技術屬性確定數(shù)據類型、格式,以及字段結構長度;從管理角度確定數(shù)據來源、使用規(guī)范和管理標準化。
在系統(tǒng)建設頂層規(guī)劃時,提前考慮系統(tǒng)間的集成關系,以及數(shù)據的共享需求、執(zhí)行標準和相關制度安排,與企業(yè)的戰(zhàn)略目標、業(yè)務流程緊密聯(lián)系,從而更好地支撐功能實現(xiàn)。其他系統(tǒng)流轉過來的數(shù)據,需要經過重新采集、清洗和加工才能使用。
3.3 加強數(shù)據安全管理
嚴格權限管理,對重要數(shù)據進行備份,對加密、修改、刪除等高危動作進行身份認證,確保數(shù)據訪問和操作安全;建立適應數(shù)據全生命周期管理的安全管理體系,根據各個環(huán)節(jié)的風險點和風險程度,執(zhí)行分類分級防護要求,確保覆蓋采集、存儲、傳輸、使用、刪除、銷毀等全流程;建立統(tǒng)一的數(shù)據資產監(jiān)控系統(tǒng)從多個維度進行監(jiān)控,數(shù)據加密與脫敏、水印與防泄露、數(shù)據溯源等防護技術與防護工具聯(lián)動,數(shù)據每一步操作都留下印記,便于回溯審視數(shù)據治理路徑,打造安全防御體系;聘請專業(yè)機構對集團數(shù)據安全進行評估,制定分類分級管理措施,選擇合適的數(shù)據安全等級保護方案,提升在數(shù)據邊界確定、數(shù)據使用管控、訪問權限等級控制、數(shù)據運行安全監(jiān)測、數(shù)據例行處置安全評估、應急響應與處置等方面的風險防控能力。另外還要明確外部數(shù)據權屬問題,確保數(shù)據使用合規(guī),有效避免獲取和使用中的法律風險。
3.4 加強基礎數(shù)據、元數(shù)據管理
需要企業(yè)在業(yè)務層面統(tǒng)一數(shù)據底層標準,進行基礎數(shù)據、元數(shù)據管理?;A數(shù)據管理確保核心數(shù)據“一點產生,多點使用”,為將來有業(yè)務協(xié)同奠定基礎;通過元數(shù)據管理,重點解決系統(tǒng)之間數(shù)據交互問題,保證交互順暢。建立數(shù)據資產管理目錄,使其由系統(tǒng)后臺的“黑箱子”,轉化為前臺界面可查、可看的“數(shù)據字典”,為數(shù)據系統(tǒng)互相調用、共享流通、提升效能打下基礎。
3.5 集團層面達成共識實施自上而下的一體化工程
集團內部數(shù)據資源龐大,數(shù)據結構復雜。不同公司的源系統(tǒng)改造存在很大困難,數(shù)據梳理、數(shù)據編碼重構及映射等方面的系統(tǒng)改造影響面非常廣。各子公司涉及的行業(yè)領域范圍不同,每個行業(yè)的監(jiān)管和運營對數(shù)據治理有差異化的需求,因此對集團數(shù)據管控方案的普適性要求較高。
強化集團范圍的數(shù)據共享,需要作為“一把手”工程來抓,提高整個集團的思想認識,打破機構和業(yè)務間的數(shù)據孤島,防止系統(tǒng)分散建設。集團層面統(tǒng)一規(guī)劃基礎數(shù)據編碼規(guī)則和應用集成接口,打造統(tǒng)一的基礎數(shù)據管理平臺,在該平臺對各種數(shù)據實施集中管控。規(guī)范集團內部數(shù)據交換,統(tǒng)一規(guī)則,對接口、文件名、內容方面統(tǒng)一標準,提高數(shù)據共享效率,保障數(shù)據交換工作順利進行。
4 數(shù)據治理提升數(shù)據價值未來發(fā)展路徑展望
從更宏觀、更長遠的角度看,通過數(shù)據治理提升數(shù)據應用價值,需要通過國家法規(guī)與行業(yè)規(guī)范的互補共同優(yōu)化數(shù)據治理環(huán)境,打造良性循環(huán)的數(shù)據生態(tài),實施數(shù)據全生命周期管理和分類治理,綜合提升數(shù)據治理環(huán)境,助力數(shù)據治理提升數(shù)據應用價值。
4.1 國家法規(guī)與行業(yè)規(guī)范互補,共同優(yōu)化數(shù)據治理環(huán)境
近年來,國家不斷出臺數(shù)據合規(guī)方面的法律法規(guī),已經建立了包括《網絡安全法》《數(shù)據安全法》等在內的法規(guī)體系。金融業(yè)特別是銀行業(yè)作為信息、數(shù)據較為集中的行業(yè),監(jiān)管機構銀保監(jiān)會以及人民銀行也發(fā)布了金融機構數(shù)據治理、金融數(shù)據安全分級和個人金融信息保護方面的指引與指南,引導金融行業(yè)數(shù)據治理規(guī)范。
國家法規(guī)作為底線標準,具有強制力,在數(shù)據治理方面雖有具體規(guī)定,但必然不會過多干預,因為數(shù)據治理問題是企業(yè)為了實現(xiàn)自身商業(yè)價值而開展的活動,本質是企業(yè)自身發(fā)展的驅動力、自己的競爭力,因此國家法規(guī)不宜強制干涉。數(shù)據治理的規(guī)則,更多的是自愿性的標準以及國際認證標準等,不具有法律約束力、強制力,而是通過有關標準來引導企業(yè)實施有效的數(shù)據治理并通過相關的商業(yè)認證,在一定范圍內對企業(yè)數(shù)據治理水平提供一種公示的效應,這就需要行業(yè)規(guī)范來補充。
4.2 打造良性循環(huán)的數(shù)據生態(tài)
數(shù)據行業(yè)生態(tài)方面,可以探索數(shù)據的內部市場化交易平臺;對于需要的外部數(shù)據,進行集團統(tǒng)一采購;內部交易或對外統(tǒng)一采購后制定交易和結算規(guī)則,供數(shù)據使用部門、數(shù)據提供部門模擬定價和核算,促進資源的有效利用,激發(fā)參與主體的共享數(shù)據熱情。
執(zhí)行層面上,盤點、梳理現(xiàn)有的系統(tǒng)、流程、數(shù)據資源,厘清各方需求,摸清數(shù)據真實狀況;各相關部門一起,從整合需求、頂層規(guī)劃設計入手,制定數(shù)據標準,完善規(guī)則內容,積累數(shù)據庫資源,實現(xiàn)業(yè)務與數(shù)據的貫通;定計劃或定期分析數(shù)據質量問題,綜合評估分析,找出問題原因,對癥下藥制定解決方案。企業(yè)還可以發(fā)揮數(shù)據和應用場景結合的優(yōu)勢,促進數(shù)字技術與業(yè)務經營的深度融合,以應用為目標、需求為方向、平臺為承載、技術為保障、數(shù)據為中心,分步實施,突出重點,先行保障急用項目,以用促建,整合數(shù)據庫,集成各子系統(tǒng),最終打造完整的數(shù)據生態(tài)系統(tǒng),形成良性循環(huán)。
4.3 實施數(shù)據全生命周期管理和分類治理
搭建綜合管理平臺,將基礎數(shù)據和元數(shù)據管理、數(shù)據標準、數(shù)據質量管理都包括在內,涵蓋數(shù)據采集、傳輸、存儲、管理、應用、處置等全部環(huán)節(jié),實施數(shù)據全生命周期管理。
數(shù)據類型包含基礎數(shù)據、交易數(shù)據(事務)、元數(shù)據、參考數(shù)據、統(tǒng)計分析數(shù)據(指標)等。對數(shù)據應分類治理,因為不同類型的數(shù)據,治理的關注點、方法、效果都不同。數(shù)據量大,但不是簡單堆積就能產生價值,還要考慮價值密度,并選用合適的分析模型,用技術手段進行挖掘分析,才能洞察有意義的信息,實現(xiàn)數(shù)據價值,因此需要從應用的角度出發(fā),結合數(shù)據使用周期或頻率、數(shù)據分類重要性、信息精準性、數(shù)據安全等級、行業(yè)監(jiān)管要求等,在產品設計、客戶畫像、風險預警、作業(yè)流程等維度進行評估,對數(shù)據進行重要性分類管理,對應確定安全、存儲、應用方面的策略。
【參考文獻】
【1】韋葦,任錦鸞,李文姬.基于國際比較的數(shù)據治理體系及優(yōu)化策略[J].科技智囊,2022(07):1-7.
【2】張莉,卞靖.數(shù)字經濟背景下的數(shù)據治理策略探析[J].宏觀經濟管理,2022(02):35-41.
【3】馮曉娜,雷會鋒,王璐.基于數(shù)據中臺視角的企業(yè)數(shù)字化轉型探析[J].航空財會,2021,3(01):41-44.