大數(shù)據(jù)趨勢下企業(yè)多樣化的數(shù)據(jù)策略
為保障企業(yè)多樣化的數(shù)據(jù)策略,企業(yè)需要考慮大數(shù)據(jù)趨勢下數(shù)據(jù)應(yīng)用全生命周期的各個(gè)階段。
大數(shù)據(jù)趨勢下應(yīng)用的核心是數(shù)據(jù)資產(chǎn)。數(shù)據(jù)成為新的價(jià)值來源,得益于數(shù)據(jù)平臺和數(shù)據(jù)即服務(wù),掃除了部分障礙,數(shù)據(jù)共享和整合得以簡化。新的數(shù)據(jù)共享模式會(huì)逐漸淘汰數(shù)據(jù)所有權(quán)這一理念。企業(yè)不同的業(yè)務(wù)部門都將創(chuàng)建、使用并與他人共享數(shù)據(jù)。
為更有效地對數(shù)據(jù)進(jìn)行使用,需要對數(shù)據(jù)資產(chǎn)價(jià)值進(jìn)行評估。價(jià)值評估的關(guān)鍵要素包括數(shù)據(jù)的效用(即質(zhì)量、來源、時(shí)效性),獨(dú)特性或唯一性,“生成”(收集、匯總等)數(shù)據(jù)的難易程度,使用和共享限制,可用性和整合性,可信度,業(yè)務(wù)需求匹配度,以及從第三方獲得數(shù)據(jù)的支持度等。高價(jià)值的數(shù)據(jù)資產(chǎn),會(huì)成為企業(yè)資產(chǎn)的重要組成部分,不僅能間接推動(dòng)業(yè)務(wù)發(fā)展,數(shù)據(jù)服務(wù)還會(huì)直接為企業(yè)創(chuàng)造價(jià)值。
為保障企業(yè)多樣化的數(shù)據(jù)策略,企業(yè)需要考慮大數(shù)據(jù)趨勢下數(shù)據(jù)應(yīng)用全生命周期的各個(gè)階段。生命周期的第一步應(yīng)該是要明確組織,明確相應(yīng)的規(guī)劃、建設(shè)和運(yùn)營組織。大數(shù)據(jù)應(yīng)用的實(shí)施有別于傳統(tǒng)應(yīng)用實(shí)施。數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師等新角色需要被引入項(xiàng)目團(tuán)隊(duì)。尤其重要的是數(shù)據(jù),科學(xué)家角色的引入。數(shù)據(jù)科學(xué)家應(yīng)該具備統(tǒng)計(jì)分析能力、對數(shù)據(jù)的提取與綜合能力以及數(shù)據(jù)的可視化表示能力。
生命周期的第二步就是做現(xiàn)狀評估,評估前進(jìn)行對外調(diào)研、對內(nèi)客戶調(diào)研和自身狀況摸底,最后對標(biāo),做差距分析,找出差異。找出差異后,要給出成熟度現(xiàn)狀評估。一般而言,大數(shù)據(jù)應(yīng)用成熟度可以劃分為四個(gè)階段:初始期(僅有概念,沒有實(shí)踐);探索期(已經(jīng)了解基本概念,也有專人進(jìn)行了探索,有了基本的大數(shù)據(jù)技術(shù)儲備);發(fā)展期(已經(jīng)擁有或正在建設(shè)明確的戰(zhàn)略、團(tuán)隊(duì)、工具、流程);成熟期(有了穩(wěn)定且不斷成熟的戰(zhàn)略、團(tuán)隊(duì)、工具、流程)。
有了數(shù)據(jù)組織建設(shè)、了解自身數(shù)據(jù)現(xiàn)狀、差距和需求,我們就可以制定數(shù)據(jù)的戰(zhàn)略目標(biāo)了。數(shù)據(jù)戰(zhàn)略的制定是整個(gè)數(shù)據(jù)生命周期的靈魂和核心,它將成為整個(gè)組織數(shù)據(jù)發(fā)展的指引。數(shù)據(jù)戰(zhàn)略的內(nèi)容,需要簡潔,又要能涵蓋公司內(nèi)外干系人的需求;同時(shí)要明確,以便清晰地告訴所有人目標(biāo)和愿景是什么;還有就是要現(xiàn)實(shí),這個(gè)目標(biāo)經(jīng)過努力是能達(dá)成的。所以從企業(yè)現(xiàn)有數(shù)據(jù)開始采取漸進(jìn)式的策略,要比激進(jìn)的“大躍進(jìn)”更加容易取得成效。
在需求和戰(zhàn)略明確之后,基于數(shù)據(jù)價(jià)值的數(shù)據(jù)定義就是一切數(shù)據(jù)管理的前提。通過元數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)定義。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是為了提升企業(yè)信息資產(chǎn)的可用性,對信息資產(chǎn)各個(gè)方面特征加以描述的信息。技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)和管理元數(shù)據(jù)。
接下去是數(shù)據(jù)獲取、數(shù)據(jù)挖掘和分析、數(shù)據(jù)展示。大數(shù)據(jù)的種類很多,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。數(shù)據(jù)獲取的工具,很多以交互式探索及數(shù)據(jù)挖掘?yàn)榇淼臄?shù)據(jù)價(jià)值發(fā)掘類工具漸成趨勢。數(shù)據(jù)獲取的方式有很多,可以通過內(nèi)部服務(wù)、外部API、外部合作批量獲取、爬蟲等多種手段獲取。數(shù)據(jù)獲取的原則一定要以數(shù)據(jù)價(jià)值為導(dǎo)向。
數(shù)據(jù)挖掘和分析需要集成的數(shù)據(jù)挖掘和分析平臺。平臺要滿足業(yè)務(wù)需求,而不是業(yè)務(wù)要去適應(yīng)平臺要求。集成的平臺應(yīng)該能檢索、分類、關(guān)聯(lián)、挖掘、推送和方便地實(shí)施元數(shù)據(jù)管理等。大數(shù)據(jù)管理的價(jià)值,最終要通過多種形式的數(shù)據(jù)呈現(xiàn),來幫助管理層和業(yè)務(wù)部門進(jìn)行商業(yè)決策。大數(shù)據(jù)的決策者需要將大數(shù)據(jù)的系統(tǒng)與BI(商業(yè)智能)系統(tǒng)和KM(知識管理)系統(tǒng)集成,通過報(bào)表、分析、儀表盤、移動(dòng)端等形式而展現(xiàn)出來的。
最后是數(shù)據(jù)的治理。數(shù)據(jù)的治理指的是數(shù)據(jù)管理層,組建專門的治理控制團(tuán)隊(duì),制定一系列策略、流程、制度和考核指標(biāo)體系,來監(jiān)督、檢查、協(xié)調(diào)多個(gè)相關(guān)職能部門的目標(biāo),從而優(yōu)化、保護(hù)和利用數(shù)據(jù),保障其作為一項(xiàng)企業(yè)戰(zhàn)略資產(chǎn)真正發(fā)揮價(jià)值,其核心是數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量和數(shù)據(jù)效率。
以上每個(gè)階段都有可能會(huì)遇到如何確定新型技術(shù)與企業(yè)已有科技投資和信息資產(chǎn)有效組合的最佳平衡點(diǎn)問題。短期相對有效的策略就是讓他們互補(bǔ)而不是替代。