車品覺
信息及數(shù)據(jù)的收集處理自古有之,幾千年來變化不大,直到個人電腦的普及才開始出現(xiàn)了改變:首先是數(shù)據(jù)化的領(lǐng)軍企業(yè),包括谷歌、亞馬遜、臉書及中國的百度、阿里、騰訊等帶動了一波數(shù)據(jù)量級的增長,然后是移動應(yīng)用和人工智能所引起的智能熱潮,前述公司的高速發(fā)展都跟這些能力相關(guān)。再加上物聯(lián)網(wǎng)的加入,讓我們在不知不覺之間每天都在生產(chǎn)著數(shù)據(jù),甚至消費著數(shù)據(jù)。如今可以說幾乎全民都參與在大數(shù)據(jù)的生命周期之中。
然而,與幾年前相比,大數(shù)據(jù)的結(jié)構(gòu)組成很不一樣了,因為需求的細分、終端的發(fā)達導(dǎo)致數(shù)據(jù)變得越來越零散。同時,數(shù)據(jù)安全的規(guī)管也改變了分享數(shù)據(jù)的形式和難度,匯聚數(shù)據(jù)的成本正在不斷提高。由于數(shù)據(jù)的核心價值來自分享流通,因此成本效應(yīng)成為企業(yè)及政府機構(gòu)數(shù)據(jù)化的絆腳石。曾經(jīng)有一段時間,阿里集團也為幾百PB級別的云存儲成本而擔心影響企業(yè)收益。
數(shù)據(jù)中臺建設(shè)刻不容緩
其實所謂中臺就像廚房,因為不可能為每一道菜從頭切菜、腌肉,有很多中間的工序其實可以預(yù)先及統(tǒng)一準備好,菜式可以有創(chuàng)意但類似的半成品可以標準化。試想一下如果每個阿里的App都有自己不同的流量收集及統(tǒng)計方法,是不是既浪費資源又難管理呢?事實上,當年阿里內(nèi)部確實有三個不同的流量數(shù)據(jù)統(tǒng)計工具,后來迫不得已才統(tǒng)一起來。
近年來筆者作為國內(nèi)一些市政府和互聯(lián)網(wǎng)企業(yè)的咨詢專家及顧問,都遇到過如何建立橫向數(shù)據(jù)治理系統(tǒng)的問題。筆者發(fā)現(xiàn),治理工作越早開展,成本越可控,否則難度就像有些企業(yè)高管開玩笑式自嘲那樣:這不是開著飛機換引擎嗎?
當初在阿里時,在企業(yè)飛速發(fā)展的過程中,我們發(fā)現(xiàn)數(shù)據(jù)使用面臨著如下挑戰(zhàn):各部門低水平重復(fù)開發(fā)數(shù)據(jù)集,浪費了大量的存儲和計算資源;數(shù)據(jù)資源缺乏沉淀機制,導(dǎo)致計算能力難以提升,進化低效;數(shù)據(jù)割裂,算法分離,帶來混亂和質(zhì)量的不確定性;業(yè)務(wù)變更時,數(shù)據(jù)及數(shù)據(jù)產(chǎn)品反應(yīng)不及時;組織架構(gòu)制約了數(shù)據(jù)的共建和共享;缺乏數(shù)據(jù)的規(guī)范及配套激勵機制。
2016年阿里內(nèi)部總結(jié)發(fā)現(xiàn),數(shù)據(jù)的“匯—管—用”過程中伴隨著如下一些現(xiàn)象:數(shù)字業(yè)務(wù)變化速度非常快,數(shù)據(jù)處理技術(shù)及方法都很類似,數(shù)據(jù)及算法中間層能量的積累能產(chǎn)生巨大效能。因此,做好數(shù)據(jù)治理工作成為當時筆者在阿里的主要任務(wù),也隨之誕生了阿里數(shù)據(jù)中臺及數(shù)據(jù)委員會。
無獨有偶,企業(yè)內(nèi)一些數(shù)據(jù)治理問題,在各地市政府機構(gòu)內(nèi)部也重復(fù)在發(fā)生。如果缺乏頂層設(shè)計,數(shù)字化步伐都追隨各個職能部門的發(fā)展,數(shù)據(jù)體系也基于業(yè)務(wù)單元垂直積累,就會形成煙囪式體系。垂直式數(shù)據(jù)體系的優(yōu)點是緊貼場景、反應(yīng)敏捷,缺點是數(shù)據(jù)分散、欠規(guī)范,難以共用關(guān)聯(lián)成為合力,大數(shù)據(jù)價值優(yōu)勢被削弱。此外,煙囪式數(shù)據(jù)體系還會造成混亂的數(shù)據(jù)調(diào)用和拷貝,以及系統(tǒng)功能建設(shè)和維護帶來的重復(fù)投資,不僅造成人力、財力、資源的浪費,更糟糕的是時間的浪費以及數(shù)據(jù)質(zhì)量的參差不齊。在目前高速發(fā)展的互聯(lián)網(wǎng)市場大環(huán)境下,商機是稍縱即逝的,數(shù)據(jù)中臺的建設(shè)刻不容緩。
在認同大數(shù)據(jù)是未來創(chuàng)新核心的前提下,需要把數(shù)據(jù)戰(zhàn)略的先進性、前瞻性放到優(yōu)先考慮的位置。否則大數(shù)據(jù)的能力會隨著粗放式營運而變得停滯不前,淪為有名無實;數(shù)據(jù)愈亂,建立大數(shù)據(jù)的能力門檻愈高,從信息化到數(shù)據(jù)化的時間節(jié)點都會影響治理難度。管理層必須理解,從信息化到數(shù)據(jù)化再到應(yīng)用,必須有強大的技術(shù)支持、靈活的政策保障,以及開放的生態(tài)支撐,如此方可馬到功成。
簡單地看,數(shù)據(jù)中臺有點像一條生產(chǎn)流水線,從原始數(shù)據(jù)收集到提煉成穩(wěn)定的數(shù)據(jù)。在這一制作過程中,需要有一套生產(chǎn)管理流程體系,用以保證數(shù)據(jù)品質(zhì)、時效性、一致性等關(guān)鍵點。但與生產(chǎn)流水線的差別在于,數(shù)據(jù)中臺不僅需要關(guān)注數(shù)據(jù)生產(chǎn)過程中的效率問題,還需具備以下能力:一、收集數(shù)據(jù)被消費之后的反饋閉環(huán);二、解決多源異構(gòu)的數(shù)據(jù)組合的效率;三、具備業(yè)務(wù)發(fā)生變化時的快速自適應(yīng)力;四、保障數(shù)據(jù)服務(wù)的穩(wěn)定性。
連接和共享是數(shù)據(jù)中臺的核心
在阿里有一個說法,關(guān)聯(lián)不起的數(shù)據(jù)就不叫大數(shù)據(jù)。試想如果要讓淘寶的推薦系統(tǒng)猜到你喜歡的商品,不能同時(甚至實時)關(guān)聯(lián)起你在天貓看過或者買過的商品,結(jié)果肯定會大打折扣。由此可以看出你的購物及瀏覽清單關(guān)聯(lián)得越多,就越有利于推薦你心儀的產(chǎn)品。
連接能力是一個數(shù)據(jù)智能平臺的基礎(chǔ)。連接指的是將不同來源的數(shù)據(jù)連接、匹配、融合的能力,讓用戶能連接到云端和本地化的結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),包含支持不同類型的數(shù)據(jù)存儲平臺。這個概念不強調(diào)對數(shù)據(jù)的擁有,而強調(diào)能夠觸及和返回數(shù)據(jù)的廣度及豐富程度。
共享能力是評估一個數(shù)據(jù)智能平臺是否為合格的首要標準。共享不代表要完全的透明,而是構(gòu)建一個合理的、區(qū)分權(quán)限的、能夠保護數(shù)據(jù),同時讓知識的價值流轉(zhuǎn)的機制。為了保護數(shù)據(jù)而不讓算法或者從數(shù)據(jù)中得到的洞察知識流轉(zhuǎn)起來,無疑是不合理的。因此一個數(shù)據(jù)智能平臺存在的意義就是共享,同時保障不應(yīng)該共享的部分。
數(shù)據(jù)治理是數(shù)據(jù)中臺的起點
筆者曾經(jīng)為不少企業(yè)做顧問,其中最容易讓大家明白數(shù)據(jù)治理的重要性是這句話:有治理數(shù)據(jù)的企業(yè)在生產(chǎn)及加工過程中,可以節(jié)省70%的工作量。當中的道理很簡單,治理的目的就是為了優(yōu)化數(shù)據(jù)的生產(chǎn)過程。
數(shù)據(jù)中臺圍繞數(shù)據(jù)生命周期的各階段(產(chǎn)生、存儲、增強、使用、傳輸、共用共創(chuàng)、更新、銷毀等)而建立,服務(wù)的對象可以是IT研發(fā)者、數(shù)據(jù)科學專家、產(chǎn)品經(jīng)理、分析師、決策管理者等。使用者會因需要而加工數(shù)據(jù),情況有點像石油提煉。
而數(shù)據(jù)生產(chǎn)過程中還有一種極其重要的數(shù)據(jù),被稱為元數(shù)據(jù),又叫數(shù)據(jù)中的數(shù)據(jù)。對元數(shù)據(jù)管理得當,就可以讓數(shù)據(jù)在生產(chǎn)過程中變得更精淮、穩(wěn)定及可被追溯。元數(shù)據(jù)管理須記錄生產(chǎn)過程中各項數(shù)據(jù)因素,包括生命周期、調(diào)度情況、品質(zhì)保障、安全監(jiān)控、數(shù)據(jù)字典、數(shù)據(jù)血緣關(guān)系等。元數(shù)據(jù)是數(shù)據(jù)中臺的精髓,有利于數(shù)據(jù)在生命周期中的監(jiān)督、成本管理或分攤、追蹤數(shù)據(jù)價值。
因此,數(shù)據(jù)中臺所需的第五種能力,就是建立一個協(xié)作平臺,讓整個數(shù)據(jù)的生產(chǎn)到服務(wù)更規(guī)范有序,可追溯,又化繁為簡地把前面所提到的四種能力有機匯聚起來。這并非一件技術(shù)性的工作,大部分依賴于人的管理。
數(shù)據(jù)服務(wù)賦能快速創(chuàng)新
數(shù)據(jù)可以作預(yù)處理,幫助企業(yè)增加效能。算法當然也可以模塊化,以作組合使用。不需要每個創(chuàng)新業(yè)務(wù)都從頭開始,我們希望創(chuàng)新業(yè)務(wù)的人員可以更聚焦在業(yè)務(wù)工作上。
一切數(shù)據(jù)都是應(yīng)業(yè)務(wù)目標驅(qū)動而形成的,產(chǎn)生于業(yè)務(wù)且又服務(wù)于業(yè)務(wù)。可以通過松耦合的數(shù)據(jù)服務(wù)帶來業(yè)務(wù)的復(fù)用。例如淘寶和天貓有著各自的買家評價服務(wù),但在防止刷屏的時候,會使用相同的數(shù)據(jù)模型鑒別虛假評價。所以盡管業(yè)務(wù)場景不一樣,但很多基礎(chǔ)數(shù)據(jù)模型及算法可以被重復(fù)使用。
經(jīng)過清晰的沉淀,算法可以通過重新編排、組合,成為服務(wù)接口,響應(yīng)業(yè)務(wù)的基本需求。由于具備快速編排、組合數(shù)據(jù)服務(wù)的能力,企業(yè)能以較小的成本投入來構(gòu)建出一個創(chuàng)新的前端業(yè)務(wù)。這在傳統(tǒng)模式構(gòu)建的系統(tǒng)中是前所未有的,容許快速試錯,是更加適合如今互聯(lián)網(wǎng)的輕量化運營模式。
組織架構(gòu)與配套激勵機制
有一位市長跟筆者分享建立智慧城市的經(jīng)驗時說,不能想象一個被承襲了百年的組織架構(gòu)會一下子適應(yīng)新的智能時代,新時代必將帶來種種沖擊。好處未到之前,我們還得循循善誘。
任何完善的體系建設(shè)依靠的都不僅僅是技術(shù)工具,缺乏完善的組織結(jié)構(gòu)及激勵機制也不可能令中臺順暢運行。多年來的經(jīng)驗證明了技術(shù)架構(gòu)和治理組織的建立同樣重要,而近年來很多企業(yè)及政府也紛紛設(shè)立起獨立的數(shù)據(jù)治理委員會。前面提到數(shù)據(jù)中臺的核心理念是“以通促用、以用帶存”,這里的“通”不僅是數(shù)據(jù)的聯(lián)通,也關(guān)乎人為組織結(jié)構(gòu)的聯(lián)通,而且是橫(功能部門之間)、縱(數(shù)據(jù)生命周期的各個環(huán)節(jié))都要通。
與此同時,數(shù)據(jù)中臺管理需要制定并形成有效的規(guī)范,讓數(shù)據(jù)治理小組從實例中由下而上地提煉出大綱,并由固定團隊負責推進、制定工作機制(互惠互利及激勵方式)、優(yōu)先資源配置等。
※※※※※
數(shù)據(jù)技術(shù)“中臺”之所以成為攻堅大數(shù)據(jù)能力的重要途徑,一是因為數(shù)據(jù)中臺確實解決了煙囪式數(shù)據(jù)各自為政的問題;其次更有利于推動輕盈的前臺業(yè)務(wù)創(chuàng)新,同時能把應(yīng)用中的數(shù)據(jù)回流,形成更豐富的中臺資源。數(shù)據(jù)中臺作為推動數(shù)據(jù)化營運的利器,同時也能成為營運數(shù)據(jù)的中心(兩者結(jié)合為閉環(huán))。
根據(jù)多年的經(jīng)驗,筆者可以大膽地說,數(shù)據(jù)中臺的建立刻不容緩:因為在大數(shù)據(jù)時代,業(yè)務(wù)與數(shù)據(jù)之間有很強的聯(lián)系,但數(shù)據(jù)內(nèi)容及結(jié)構(gòu)更新速度非??欤粩?shù)據(jù)算法上的技術(shù)很類似,但各師各法;數(shù)據(jù)質(zhì)量人人都說重要,但必須明確由誰負責。
數(shù)據(jù)及其服務(wù)能力的匯聚與集中管控協(xié)同,很大程度上會促進企業(yè)一體化運維的能力?;ヂ?lián)網(wǎng)大數(shù)據(jù)時代的中臺特點是:一方面具備海量多源異構(gòu)數(shù)據(jù)的整合能力;另一方面是促進創(chuàng)新且變化多端的業(yè)務(wù)前端服務(wù)能力。
大數(shù)據(jù)中臺的建設(shè)及行業(yè)普及,如今還是摸著石頭過河的狀態(tài),任何中臺都是在不斷互動回饋的過程中成長起來的,而非一次性搭建成功。但可以肯定的是,這是個“一把手”工程,必須秉持打破傳統(tǒng)管理的決心,做好長期斗爭的準備。