程廣明
摘 要:介紹了“大數(shù)據(jù)治理”的概念,提出了人與組織、策略和能力的三維架構(gòu)大數(shù)據(jù)治理模型,并在此基礎(chǔ)上提出了包括初始級(jí)、基本級(jí)、定義級(jí)、管理級(jí)和優(yōu)化級(jí)五個(gè)評(píng)價(jià)等級(jí)的大數(shù)據(jù)治理成熟度評(píng)估模型。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)治理;成熟度評(píng)估;策略
中圖分類號(hào):TP274 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.15913/j.cnki.kjycx.2016.09.006
隨著云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的快速發(fā)展,人類產(chǎn)生的數(shù)據(jù)量呈指數(shù)級(jí)增長。據(jù)資料顯示,2012年,全球數(shù)據(jù)量達(dá)到2.8 ZB,預(yù)計(jì)到2020年,全球數(shù)據(jù)量將達(dá)到40 ZB。大數(shù)據(jù)蘊(yùn)含著巨大的價(jià)值,如今,互聯(lián)網(wǎng)、電信和金融等行業(yè)的眾多企業(yè)已將數(shù)據(jù)視作企業(yè)的寶貴資產(chǎn)。然而,數(shù)據(jù)價(jià)值密度與數(shù)據(jù)總量成反比。面對(duì)巨大的數(shù)據(jù)規(guī)模,如何管理和利用數(shù)據(jù),使其發(fā)揮價(jià)值是企業(yè)必須考慮的重要問題。大數(shù)據(jù)的價(jià)值所在使其面臨著隱私和安全方面的威脅。大數(shù)據(jù)治理將組織的部門、流程、人等元素與數(shù)據(jù)的整個(gè)生命周期聯(lián)系在了一起,對(duì)組織數(shù)據(jù)管理和保護(hù)有著至關(guān)重要的作用。
1 大數(shù)據(jù)治理的定義
“大數(shù)據(jù)治理”不是一個(gè)橫空出世的概念,它是在傳統(tǒng)的數(shù)據(jù)治理基礎(chǔ)上提出的適應(yīng)大數(shù)據(jù)時(shí)代的產(chǎn)物?!禗GI數(shù)據(jù)治理框架》一文將數(shù)據(jù)治理定義為“數(shù)據(jù)相關(guān)事務(wù)的決策和授權(quán)的執(zhí)行”,并進(jìn)一步解釋為信息處理過程決策權(quán)和職責(zé)的策略,約定了由誰負(fù)責(zé)處理哪些信息,并在什么情況下采用哪種方法,以及何時(shí)來執(zhí)行。也有學(xué)者將數(shù)據(jù)治理定義為“組織架構(gòu)、規(guī)則、人員權(quán)利和義務(wù)、處理信息的信息系統(tǒng)”。
美國學(xué)者桑尼爾·索雷斯在《大數(shù)據(jù)治理》一書中這樣定義大數(shù)據(jù)治理:“大數(shù)據(jù)治理是廣泛信息治理計(jì)劃的一部分,即制訂與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)和數(shù)據(jù)變現(xiàn)的政策。
我們可以對(duì)上述大數(shù)據(jù)治理定義作進(jìn)一步的分解解讀。首先,大數(shù)據(jù)治理是信息治理計(jì)劃的一部分,這是其定位。這就要求組織在制訂信息治理框架時(shí),必須將大數(shù)據(jù)納入其中,比如在信息治理委員會(huì)中增加數(shù)據(jù)科學(xué)家,在信息治理目標(biāo)中增加大數(shù)據(jù)治理目標(biāo)等。其次,大數(shù)據(jù)治理主要是數(shù)據(jù)處理的一系列相關(guān)政策的制訂,這是其內(nèi)涵。再次,必須優(yōu)化大數(shù)據(jù),這是大數(shù)據(jù)治理的重點(diǎn)。大數(shù)據(jù)體量大、種類繁多,且價(jià)值密度低,組織必須對(duì)其進(jìn)行優(yōu)化,比如定義元數(shù)據(jù)、凈化大數(shù)據(jù)、實(shí)施數(shù)據(jù)生命周期管理等。從次,大數(shù)據(jù)隱私保護(hù)至關(guān)重要,這是大數(shù)據(jù)治理的約束。看似沒有任何價(jià)值的單一數(shù)據(jù)集合在一起時(shí),會(huì)發(fā)現(xiàn)新的價(jià)值,這是大數(shù)據(jù)價(jià)值體現(xiàn)的重要途徑之一。而大數(shù)據(jù)價(jià)值的體現(xiàn)往往會(huì)涉及數(shù)據(jù)的隱私,這就要求組織在進(jìn)行大數(shù)據(jù)價(jià)值體現(xiàn)時(shí),必須注重大數(shù)據(jù)的隱私處理。最后,大數(shù)據(jù)必須變現(xiàn),這是大數(shù)據(jù)治理的目的所在。組織將數(shù)據(jù)視作其資產(chǎn)的一種,要將其轉(zhuǎn)化成組織可以使用的現(xiàn)金,而變現(xiàn)的方式可以是單純地出售數(shù)據(jù)本身,也可以是利用數(shù)據(jù)開發(fā)新業(yè)務(wù)。
2 大數(shù)據(jù)治理模型
基于以上概念分析,我們可以將大數(shù)據(jù)治理模型理解為人與組織、策略和能力的三維架構(gòu)。人與組織是數(shù)據(jù)治理的主體,涉及政府、企業(yè)界、學(xué)術(shù)界、社會(huì)組織、自然人等,他們分別承擔(dān)著不同的治理職責(zé)。策略是大數(shù)據(jù)治理的工具,能力是大數(shù)據(jù)治理的手段。圖1所示為大數(shù)據(jù)治理模型三維架構(gòu)。
具體來說,人與組織包含利益相關(guān)者、治理委員會(huì)、管理委員會(huì)和內(nèi)部員工。利益相關(guān)者指組織內(nèi)部和外部環(huán)境中受組織決策和行動(dòng)影響的任何相關(guān)者,數(shù)據(jù)的產(chǎn)生者、管理者、使用者和監(jiān)督者等;治理委員會(huì)是組織治理數(shù)據(jù)的最高機(jī)構(gòu),負(fù)責(zé)作出數(shù)據(jù)相關(guān)事務(wù)的決定,并將數(shù)據(jù)治理標(biāo)準(zhǔn)和措施匯報(bào)給數(shù)據(jù)的利益相關(guān)者;管理委員會(huì)負(fù)責(zé)具體實(shí)施治理委員會(huì)制定的各項(xiàng)數(shù)據(jù)治理決定,并將數(shù)據(jù)治理結(jié)果匯報(bào)給治理委員會(huì);內(nèi)部員工是數(shù)據(jù)治理架構(gòu)中不可或缺的一部分,貫徹執(zhí)行數(shù)據(jù)治理委員會(huì)和管理委員會(huì)制定的各項(xiàng)數(shù)據(jù)治理策略。
策略是組織制定的所有與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)和數(shù)據(jù)變現(xiàn)的準(zhǔn)則和規(guī)范,包括組織數(shù)據(jù)治理的使命和愿景、治理指標(biāo)、數(shù)據(jù)治理規(guī)則和定義、權(quán)利與職責(zé)、控制措施。數(shù)據(jù)治理的使命和愿景包括數(shù)據(jù)治理的整體目標(biāo),給予數(shù)據(jù)利益相關(guān)者持續(xù)與跨界的數(shù)據(jù)保護(hù)和服務(wù),不合規(guī)準(zhǔn)則引發(fā)的問題的解決方案等;數(shù)據(jù)治理指標(biāo)定義了數(shù)據(jù)治理目標(biāo)的衡量方法;數(shù)據(jù)治理規(guī)則和定義包括與數(shù)據(jù)相關(guān)的政策、標(biāo)準(zhǔn)、合規(guī)要求、業(yè)務(wù)規(guī)則和數(shù)據(jù)定義等;權(quán)利和職責(zé)規(guī)定了由誰來負(fù)責(zé)制訂數(shù)據(jù)相關(guān)的決策、何時(shí)實(shí)施、如何實(shí)施,以及組織和個(gè)人在數(shù)據(jù)治理策略中該做什么;控制措施主要針對(duì)數(shù)據(jù)未治理風(fēng)險(xiǎn)防范和數(shù)據(jù)治理過程中可能發(fā)生的各類風(fēng)險(xiǎn),以及如何做好數(shù)據(jù)隱私保護(hù)。
能力則反映了組織進(jìn)行數(shù)據(jù)治理所具備的條件和水平,包括元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、業(yè)務(wù)流程整合、主數(shù)據(jù)管理和信息生命周期管理。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),即描述數(shù)據(jù)和信息資源的信息。元數(shù)據(jù)管理就是整合大數(shù)據(jù)與企業(yè)的元數(shù)據(jù)庫。數(shù)據(jù)質(zhì)量管理準(zhǔn)則包括數(shù)據(jù)識(shí)別、采集、測(cè)量、提升和論證質(zhì)量、整合組織數(shù)據(jù)的方法,比如具備應(yīng)對(duì)非結(jié)構(gòu)化數(shù)據(jù)占據(jù)數(shù)據(jù)總量絕大部分情況的能力。業(yè)務(wù)流程整合要求組織制定的大數(shù)據(jù)治理計(jì)劃必須與組織的核心業(yè)務(wù)流程相匹配,以便從核心業(yè)務(wù)流程中獲取大數(shù)據(jù)治理的關(guān)鍵支持政策。主數(shù)據(jù)管理描述了一組規(guī)程、技術(shù)和解決方案,用于維護(hù)業(yè)務(wù)數(shù)據(jù)的一致性、完整性、相關(guān)性和精確性。大數(shù)據(jù)治理需要制訂將大數(shù)據(jù)整合到主數(shù)據(jù)管理環(huán)境的政策。信息生命周期管理則要求組織判斷應(yīng)該將何種數(shù)據(jù)保留在數(shù)據(jù)分析系統(tǒng),何種數(shù)據(jù)需要存檔,何種數(shù)據(jù)需要?jiǎng)h除。
3 大數(shù)據(jù)治理成熟度評(píng)估
表1 大數(shù)據(jù)治理成熟度等級(jí)評(píng)價(jià)表
等級(jí) 等級(jí)描述
初始級(jí) a.沒有定義與數(shù)據(jù)治理相關(guān)的架構(gòu)和角色
b.沒有正式的數(shù)據(jù)治理策略
c.不具備數(shù)據(jù)治理能力
基本級(jí) a.定義了數(shù)據(jù)治理角色和職責(zé),管理者意識(shí)到數(shù)據(jù)治理的重要性,但對(duì)管理知識(shí)知之甚少
b.已有的數(shù)據(jù)治理策略已經(jīng)文件化,但不具有連貫性
c.數(shù)據(jù)治理能力十分有限,只有很少一部分人掌握數(shù)據(jù)治理通用級(jí)別的知識(shí)
定義級(jí) a.定義了數(shù)據(jù)治理角色和職責(zé),管理者能主動(dòng)推動(dòng)數(shù)據(jù)治理計(jì)劃實(shí)施
b.數(shù)據(jù)策略已經(jīng)文件化,并涵蓋了針對(duì)特殊數(shù)據(jù)的治理策略;策略通過公共渠道容易獲取,大多數(shù)利益相關(guān)者能夠理解
c.具備數(shù)據(jù)治理的全部要素,一部分人知道詳細(xì)的數(shù)據(jù)治理能力
管理級(jí) a.定義了完備的數(shù)據(jù)治理角色和職責(zé),并有專門的數(shù)據(jù)質(zhì)量專家,管理者能主動(dòng)推動(dòng)數(shù)據(jù)治理計(jì)劃實(shí)施
b.所有的數(shù)據(jù)策略都已經(jīng)文件化,并且是審計(jì)合規(guī)的,都能通過公用渠道獲取,數(shù)據(jù)治理利益相關(guān)者主動(dòng)關(guān)注策略的增添、更新和刪除
c.所有定義的數(shù)據(jù)治理能力層級(jí)都有可用的方法,建立了系統(tǒng)化的數(shù)據(jù)治理處理流程
優(yōu)化級(jí) a.定義了完備的數(shù)據(jù)治理角色和職責(zé),管理委員會(huì)來自各個(gè)部門,擁有元數(shù)據(jù)管理小組、數(shù)據(jù)質(zhì)量技能中心、主數(shù)據(jù)管理委員會(huì)等
b.所有的數(shù)據(jù)策略都已經(jīng)文件化,并且是審計(jì)合規(guī)的,所有的數(shù)據(jù)治理利益相關(guān)者都參與了策略發(fā)展過程;制訂了自動(dòng)化的政策,以保證數(shù)據(jù)在整個(gè)組織內(nèi)保持一致、準(zhǔn)確和可靠
c.所有定義的數(shù)據(jù)治理能力層級(jí)所指定的部門和關(guān)鍵數(shù)據(jù)是固定的,能夠在數(shù)據(jù)處于靜態(tài)和動(dòng)態(tài)時(shí)進(jìn)行數(shù)據(jù)質(zhì)量修復(fù),數(shù)據(jù)不間斷地被跟蹤檢查,且任何偏離標(biāo)準(zhǔn)的問題都可以立即解決
成熟度評(píng)估是組織大數(shù)據(jù)治理狀態(tài)和能力的一種衡量方式。大數(shù)據(jù)治理模型共三個(gè)維度,具體涵蓋14個(gè)評(píng)價(jià)指標(biāo)。每個(gè)指標(biāo)分別以5個(gè)等級(jí)來衡量其成熟度,然后再統(tǒng)籌考慮評(píng)價(jià)指標(biāo)權(quán)重,得到組織大數(shù)據(jù)治理的整體成熟度評(píng)價(jià)。根據(jù)綜合評(píng)價(jià)結(jié)果,組織大數(shù)據(jù)治理成熟度可以分為以下5個(gè)等級(jí),即初始級(jí)、基本級(jí)、定義級(jí)、管理級(jí)和優(yōu)化級(jí)。
4 總結(jié)
數(shù)據(jù)體量巨大、種類繁多、價(jià)值密度低和處理速度快是大數(shù)據(jù)的四大主要特征。面對(duì)爆發(fā)式增長的大數(shù)據(jù),開展大數(shù)據(jù)治理是充分利用數(shù)據(jù)價(jià)值、保護(hù)數(shù)據(jù)隱私和安全等的重要途徑。結(jié)合前期研究,本文提出了人與組織、策略和能力的三維架構(gòu)大數(shù)據(jù)治理模型,并制定了詳細(xì)的成熟度評(píng)價(jià)指標(biāo),對(duì)組織的大數(shù)據(jù)治理狀況進(jìn)行評(píng)價(jià),提出了包括初始級(jí)、基本級(jí)、定義級(jí)、管理級(jí)和優(yōu)化級(jí)5個(gè)等級(jí)的大數(shù)據(jù)治理成熟度評(píng)價(jià)模型。
參考文獻(xiàn)
[1]Sunil Soares,著.大數(shù)據(jù)治理[M].匡斌,譯.北京:清華大學(xué)出版社,2014.
〔編輯:劉曉芳〕