李堯++程廣明
摘 要:該文論述了數(shù)據(jù)治理研究進展,分析了云計算環(huán)境下的數(shù)據(jù)特點,針對性地提出了云端數(shù)據(jù)治理體系概念。云端數(shù)據(jù)治理體系利用PDCA質(zhì)量循環(huán)控制方法,并借鑒了項目管理、數(shù)據(jù)治理、IT治理等領域的實施方法論,為有需要的組織在優(yōu)化數(shù)據(jù)治理戰(zhàn)略、建立更加完善的數(shù)據(jù)治理流程、強化數(shù)據(jù)治理保障等過程提供參考。
關鍵詞:數(shù)據(jù)治理 云端數(shù)據(jù)治理 治理體系 云計算
中圖分類號:TP274 文獻標識碼:A 文章編號:1674-098X(2017)01(a)-0096-02
云計算作為“云、物、移、大、智”的最基礎支撐,為數(shù)據(jù)爆發(fā)式增長與數(shù)據(jù)快速流動提供了關鍵基礎設施。云計算的優(yōu)勢在于能夠支撐起越來越大規(guī)模的海量數(shù)據(jù)的存儲、處理、分享與協(xié)作。但隨著數(shù)據(jù)規(guī)模不斷增長,以及非結構化數(shù)據(jù)所占比重的提高,數(shù)據(jù)的價值密度越來越低。如何在保證數(shù)據(jù)安全的同時發(fā)揮數(shù)據(jù)所蘊含的價值,是所有將數(shù)據(jù)視為資產(chǎn)的機構必須思考的問題。數(shù)據(jù)治理是發(fā)揮數(shù)據(jù)價值、保護數(shù)據(jù)安全的有效措施,但隨著云計算對數(shù)據(jù)所處環(huán)境變化起到的主導作用,研究云計算環(huán)境下的數(shù)據(jù)治理十分有必要。
1 數(shù)據(jù)治理主要研究進展
在數(shù)據(jù)治理研究領域,國際數(shù)據(jù)管理協(xié)會(DAMA)、數(shù)據(jù)治理研究所(DGI)、IBM、CMMI研究所等組織提出了多種數(shù)據(jù)治理框架或數(shù)據(jù)治理模型。
DAMA認為數(shù)據(jù)管理是規(guī)劃、控制和提供數(shù)據(jù)及信息資產(chǎn)的一種業(yè)務職能,包括開發(fā)、執(zhí)行和監(jiān)督有關數(shù)據(jù)的計劃、政策、項目、流程、方法和程序,從而控制、保護、交付和提高數(shù)據(jù)資產(chǎn)的價值[1]。該定義突出了數(shù)據(jù)管理的職能、過程和規(guī)范3個關鍵詞。在職能上認為數(shù)據(jù)管理是業(yè)務數(shù)據(jù)管理專員和技術數(shù)據(jù)管理專員共同承擔的責任;在過程上,認為數(shù)據(jù)管理是數(shù)據(jù)資產(chǎn)管理的權威性和控制性活動,是在數(shù)據(jù)管理和使用層面之上進行規(guī)劃、監(jiān)管和控制;在規(guī)范上,認為數(shù)據(jù)管理必須遵守相關的規(guī)則和規(guī)范,才能確保數(shù)據(jù)管理過程能夠順利進行。
DGI認為數(shù)據(jù)治理應建立獨立的數(shù)據(jù)治理理論體系,從組織、規(guī)則、過程3個層面提出了數(shù)據(jù)治理框架。組織即制定和執(zhí)行數(shù)據(jù)治理規(guī)則和規(guī)范的組織結構,包含數(shù)據(jù)利益相關者、數(shù)據(jù)治理委員會和數(shù)據(jù)管理者;規(guī)則即建立、協(xié)調(diào)和規(guī)范數(shù)據(jù)治理工作的規(guī)則,以及指導不同部門共同制定和執(zhí)行規(guī)則的協(xié)同工作規(guī)范,包含使命和愿景、目標、治理成效的度量標準、財務策略、數(shù)據(jù)規(guī)則和定義、決策權、職責分工、控制6個組件;過程即數(shù)據(jù)治理應遵循的工作步驟和流程,包括主動、被動和正在進行的數(shù)據(jù)治理過程。
IBM認為數(shù)據(jù)治理是根據(jù)企業(yè)的數(shù)據(jù)管控政策,利用組織人員、流程和技術的相互協(xié)作,使企業(yè)能將數(shù)據(jù)作為企業(yè)的核心資產(chǎn)來管理和應用的一門學科。IBM定義了11個要素來開展數(shù)據(jù)治理,11個要素分為支撐域、核心域、促成因素和成果。其中支撐域包括數(shù)據(jù)架構、分類與元數(shù)據(jù)、審計/日志與報告;核心域包括數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)生命周期管理、信息安全與隱私;促成因素包括組織結構與意識、人員、策略;成果包括數(shù)據(jù)風險管理與合規(guī)、價值。
CMMI研究所提出了以成熟度概念評價數(shù)據(jù)治理能力,形成了數(shù)據(jù)管理成熟度模型(DMM)。DMM模型由20個數(shù)據(jù)管理過程域和5個以CMMI過程域為基礎的支持過程域構成,其中這20個過程域分別屬于數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量、數(shù)據(jù)操作和平臺與架構5大職能域。針對每個過程域,DMM均以執(zhí)行級、管理級、定義級、度量級和優(yōu)化級5個等級衡量過程域治理能力成熟度。
除此之外,Gartner、普華永道等公司也提出了各自的數(shù)據(jù)治理模型。雖然這些數(shù)據(jù)治理模型在傳統(tǒng)數(shù)據(jù)治理階段發(fā)揮了很大的作用,但面對云計算環(huán)境下的數(shù)據(jù)特點,這些數(shù)據(jù)治理模型存在一定的不適應性或者難以滿足云端數(shù)據(jù)治理需求。
2 云計算環(huán)境下數(shù)據(jù)的特點
2.1 云計算環(huán)境下數(shù)據(jù)的體量更大、種類更復雜
IDC報告顯示,預計到2020年全球數(shù)據(jù)總量將超過40 ZB,這一數(shù)據(jù)量是2011年的22倍。中國在2013年產(chǎn)生的數(shù)據(jù)總量超過0.8 ZB,是2012年的兩倍,相當于2009年全球的數(shù)據(jù)總量。預計到2020年,中國產(chǎn)生的數(shù)據(jù)總量將是2013年的10倍,超過8.5 ZB。
2.2 云計算環(huán)境下數(shù)據(jù)遠程存儲和遠程傳輸更普遍
根據(jù)Gartner統(tǒng)計,2012年全球共有329 EB個人數(shù)據(jù),只有不到7%的個人數(shù)據(jù)存儲在云端。隨著消費者使用智能手機和平板電腦產(chǎn)生的數(shù)據(jù)越來越多,消費者將開始選擇本地存儲之外的存儲方式。2016年全球個人數(shù)據(jù)急劇膨脹到4.1 ZB,其中約有36%的個人數(shù)據(jù)被轉移到云端。數(shù)據(jù)在云端的存儲必然對數(shù)據(jù)遠程傳輸提出更多的要求,例如數(shù)據(jù)傳輸?shù)陌踩⑺俾?、完整性等。因此,在?shù)據(jù)本地化存儲空間不足和成本高昂的背景下,數(shù)據(jù)存儲在云端或異地數(shù)據(jù)中心將越來越多。
2.3 云計算環(huán)境下數(shù)據(jù)的安全威脅更多、合規(guī)要求更復雜
美國IDG公司2013年對1 300多位企業(yè)高管進行調(diào)研,66%的企業(yè)高管認為安全問題是云計算的關鍵因素。近年來,云服務上的數(shù)據(jù)安全事件頻發(fā)。2013年,斯諾登“棱鏡門”事件曝光了美國國家安全局的秘密監(jiān)聽計劃,獲取用戶數(shù)據(jù)。2012年8月,蘋果公司的iCloud云服務受到黑客攻擊,黑客刪除了部分用戶資料,而云平臺并未備份用戶數(shù)據(jù),導致用戶數(shù)據(jù)的丟失。為了保護數(shù)據(jù),各國紛紛制定了很多數(shù)據(jù)使用和保護法律法規(guī),這對開展以數(shù)據(jù)為基礎的業(yè)務合規(guī)性提出了更復雜的要求。
3 云端數(shù)據(jù)治理體系
總體來看,有效推動云端數(shù)據(jù)治理,亟待解決的不是技術問題,更多的是各種管理問題。云端數(shù)據(jù)治理是以云端數(shù)據(jù)為主要治理對象,通過制定云端數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)管理、數(shù)據(jù)優(yōu)化、數(shù)據(jù)安全與隱私保護等相關策略,指導組織規(guī)劃、構建、評估和優(yōu)化數(shù)據(jù)治理體系。
云端數(shù)據(jù)治理體系利用PDCA質(zhì)量循環(huán)控制方法,并借鑒了項目管理、數(shù)據(jù)治理、IT治理等領域的實施方法論,如圖1所示。其中P是統(tǒng)籌和規(guī)劃,指根據(jù)云端數(shù)據(jù)治理的項目目標,對照業(yè)務需求,確定云端數(shù)據(jù)治理實施的范圍和戰(zhàn)略,規(guī)劃實現(xiàn)目標確定必要的過程;D是構建和運行,指在受控條件下,運行云端數(shù)據(jù)治理的過程;C是監(jiān)督和評估,指對云端數(shù)據(jù)治理體系進行評估與診斷、監(jiān)視與測量、審核、考核,并報告結果;A是改進和優(yōu)化,是指采取措施,包括審計、績效考核、糾正措施和預防措施等,以持續(xù)改進過程績效。
為使組織的云端數(shù)據(jù)治理體系有效運行,需確定和管理眾多相互關聯(lián)的活動。通過使用資源和實施管理,將輸入轉化為輸出的一項或一組活動,可以視為一個過程。
輸入端,應根據(jù)組織的業(yè)務戰(zhàn)略和目標,制定云端數(shù)據(jù)治理體系的戰(zhàn)略和目標。根據(jù)業(yè)務需求,識別組織的數(shù)據(jù)需求和數(shù)據(jù)問題,同時需要考慮監(jiān)管的合規(guī)性和一致性。有效的云端數(shù)據(jù)治理體系一定是與組織的業(yè)務價值緊密相連。組織使用IT技術配合和支撐各種業(yè)務,目的都是為了達成業(yè)務目標和實現(xiàn)業(yè)務戰(zhàn)略。
輸出端,數(shù)據(jù)策略是云端數(shù)據(jù)治理的基本規(guī)則,這些策略貫穿云端數(shù)據(jù)治理體系的所有過程,描述了什么可以做,什么不該做。數(shù)據(jù)規(guī)程是云端數(shù)據(jù)治理的程序,是完成某項活動的詳細步驟。云端數(shù)據(jù)治理體系是識別、管理和解決云端數(shù)據(jù)問題的有效途徑,最終目標之一是為了管理并解決云端數(shù)據(jù)問題。在體系的運行過程中,云端數(shù)據(jù)治理專業(yè)人員應不斷溝通、培訓和推廣數(shù)據(jù)的重要性,提高利益相關者對云端數(shù)據(jù)治理體系的認可。
云端數(shù)據(jù)治理的內(nèi)容包括戰(zhàn)略、數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量、數(shù)據(jù)操作、數(shù)據(jù)架構、安全與隱私5大職能域,在治理體系中,需要不斷優(yōu)化這5大職能域,實現(xiàn)云端數(shù)據(jù)的科學治理。
4 結語
云端數(shù)據(jù)治理是一項復雜的持續(xù)改進的過程,而不是一個一蹴而就的工程,需要不斷評估現(xiàn)狀,并及時改進。云端數(shù)據(jù)治理從治理戰(zhàn)略、組織架構、數(shù)據(jù)質(zhì)量、數(shù)據(jù)操作、管理平臺等多個方面著手,通過策劃、構建、評估和改進,建立一個完善的治理管理體系,為組織海量的云端數(shù)據(jù)治理工作提供清晰的路線規(guī)劃,促進各部門人員共同參與決策。
參考文獻
[1] DAMA International.DAMA數(shù)據(jù)知識管理知識體系指南[M].馬歡,劉晨,譯.北京:清華大學出版社,2012.
[2] 程廣明.大數(shù)據(jù)治理模型與治理成熟度評估研究[J].科技與創(chuàng)新,2016(9):6-7.
[3] CMM IInstitute.Data Management Maturity(DMM)[Z].2014.