張敏翀
今天我們看到大量與行業(yè)相關(guān)的數(shù)據(jù),當(dāng)全球流量經(jīng)濟(jì)陷入停滯的時(shí)候,數(shù)據(jù)仍在以每?jī)赡攴环乃俣仍鲩L(zhǎng),給我們非常大的想象空間。這么多跟數(shù)據(jù)相關(guān)的行業(yè)以及這么大的存儲(chǔ)量,應(yīng)該怎樣合理利用?今天,數(shù)據(jù)流通是新的方向,在絕大部分的行業(yè)里實(shí)際上沒有形成完全壟斷的格局,數(shù)據(jù)是呈分布式存在的,數(shù)據(jù)不僅是在本行業(yè)進(jìn)行流通,而且大量的行業(yè)數(shù)據(jù)正在跨越應(yīng)用。
Teradata調(diào)查顯示,很多公司僅存儲(chǔ)了15%與其業(yè)務(wù)相關(guān)的數(shù)據(jù),其他85%的數(shù)據(jù)駐留在其他公司或網(wǎng)站上。Gartner預(yù)測(cè),到2017年,約2/3的大數(shù)據(jù)整合項(xiàng)目將是企業(yè)防火墻之外(外部數(shù)據(jù))的整合。
今天全球數(shù)據(jù)第三方數(shù)據(jù)交易的市場(chǎng)規(guī)模不斷擴(kuò)大,得益于較完備的法規(guī)和市場(chǎng)信用體系,國(guó)外涌現(xiàn)了諸如Experian、Equifax、Trans Union、Dun&Bradstreet、Acxiom、Twitter Gnip、LinkedIn Fliptop、Oracle BlueKai等一大批數(shù)據(jù)交易市場(chǎng)。其中Acxiom是新秀,其他絕大部分都是基于傳統(tǒng)數(shù)據(jù)庫(kù)建立的數(shù)據(jù)交易市場(chǎng)。
在美國(guó),數(shù)據(jù)資源有它的特殊性,既是價(jià)值也包含了隱私,數(shù)據(jù)公司在轉(zhuǎn)型,用應(yīng)用和服務(wù)來(lái)包裹安全和隱私。去年,美國(guó)第三方數(shù)據(jù)資源市場(chǎng)規(guī)模大概是60億美元,中國(guó)的第三方數(shù)據(jù)資源市場(chǎng)大概在30億元到40億元之間。
上海數(shù)據(jù)交易中心是由上海市人民政府常務(wù)會(huì)議批準(zhǔn),在2016年4月份成立的。上海數(shù)據(jù)交易中心是國(guó)家大數(shù)據(jù)交易標(biāo)準(zhǔn)的試點(diǎn)基地。其實(shí),整個(gè)數(shù)據(jù)產(chǎn)品的應(yīng)用大致分為四個(gè)階段:第一階段,成為業(yè)務(wù)系統(tǒng)的附屬產(chǎn)品;第二階段,成為整個(gè)業(yè)務(wù)的重要驅(qū)動(dòng);第三階段,數(shù)據(jù)本身成為產(chǎn)品,第四階段,應(yīng)用和服務(wù)成為數(shù)據(jù)的外殼。上海數(shù)據(jù)交易中心定位為一個(gè)公開合法的數(shù)據(jù)交易平臺(tái),我們要遵循兩個(gè)基本原則:第一叫目的先進(jìn)原則,數(shù)據(jù)價(jià)值是跟應(yīng)用相關(guān)聯(lián),一方面要降低數(shù)據(jù)的成本,另一方面要比較好地控制數(shù)據(jù)風(fēng)險(xiǎn);第二叫目的圍繞應(yīng)用,一方面要符合安全合規(guī)要求,數(shù)據(jù)里面關(guān)聯(lián)的主體不能被流通,另一方面,生命周期比較短的數(shù)據(jù)要經(jīng)過(guò)透明處理。
我們主要的角色是數(shù)據(jù)供方和數(shù)據(jù)需方的組織者,包括市場(chǎng)交易機(jī)制的設(shè)計(jì)以及數(shù)據(jù)安全流通。我們的業(yè)務(wù)流程跟普通的交易基本上一致,但是里面有很多不一樣的細(xì)節(jié)。我們的關(guān)注要點(diǎn)在于效率、留存、安全、質(zhì)量和價(jià)格。大數(shù)據(jù)是一個(gè)早期市場(chǎng),它的需求是非標(biāo)的,是跨越式的。所以我們今天做數(shù)據(jù)交易的時(shí)候發(fā)現(xiàn),供方根據(jù)自己理解所做的標(biāo)簽化產(chǎn)品和服務(wù)化產(chǎn)品跟需方是對(duì)不上的,是兩個(gè)不同的標(biāo)準(zhǔn)體系。供方數(shù)據(jù)和需方需求呈碎片化,他們之間需要一個(gè)組織去實(shí)現(xiàn)轉(zhuǎn)換。怎樣保持?jǐn)?shù)據(jù)的一致性?怎樣規(guī)范靜態(tài)數(shù)據(jù)留存問(wèn)題?這是我們關(guān)注的問(wèn)題。此外,我們也比較關(guān)心數(shù)據(jù)的安全和質(zhì)量。
整個(gè)數(shù)據(jù)結(jié)構(gòu)是技術(shù)+規(guī)則的體系,上海數(shù)據(jù)交易中心成立一年的時(shí)間里,我們陸續(xù)制定了大量的數(shù)據(jù)交易業(yè)務(wù)規(guī)則、技術(shù)標(biāo)準(zhǔn)。我們?cè)诩夹g(shù)上也采取了相關(guān)措施,包括數(shù)據(jù)傳輸和交換,既需要使交換雙方識(shí)別數(shù)據(jù)之間的關(guān)系,又要保護(hù)關(guān)聯(lián)關(guān)系本身的不可識(shí)別性。
ex-ID是以一套約定的算法,對(duì)所需關(guān)聯(lián)的ID進(jìn)行加密轉(zhuǎn)換后的流通專用ID。既可以保持識(shí)別原有數(shù)據(jù)關(guān)聯(lián)性的能力,又能保護(hù)ID本身的隱私。
目前交易市場(chǎng)面臨一些問(wèn)題和挑戰(zhàn),第一,互聯(lián)網(wǎng)數(shù)據(jù)匯聚格局基本形成,互聯(lián)網(wǎng)數(shù)據(jù)資源日漸向以騰訊為代表的社交入口、以百度為代表的搜索入口、以阿里巴巴為代表的電商入口集中。第二,行業(yè)應(yīng)用創(chuàng)新能力不足,我國(guó)數(shù)據(jù)應(yīng)用局限在電子商務(wù)、精準(zhǔn)營(yíng)銷等有限的領(lǐng)域,且大多以初級(jí)資源產(chǎn)品為主,數(shù)據(jù)產(chǎn)品和服務(wù)創(chuàng)新能力不足。第三,市場(chǎng)信用體系缺失,市場(chǎng)缺乏信任機(jī)制,技術(shù)服務(wù)方、數(shù)據(jù)分發(fā)商、數(shù)據(jù)查詢節(jié)點(diǎn)等私下緩存并對(duì)外共享、交易數(shù)據(jù),數(shù)據(jù)使用企業(yè)不按協(xié)議要求私自留存、復(fù)制甚至轉(zhuǎn)賣數(shù)據(jù)的現(xiàn)象普遍存在。
長(zhǎng)遠(yuǎn)來(lái)看,對(duì)數(shù)據(jù)隱私和數(shù)據(jù)權(quán)利的尊重是保障大數(shù)據(jù)企業(yè)可持續(xù)發(fā)展的關(guān)鍵因素。目前所有的數(shù)據(jù)對(duì)供給方是有機(jī)制的,商業(yè)主體卻沒有很好的機(jī)制來(lái)保護(hù)。從交易模式來(lái)看,主要有中介服務(wù)模式、數(shù)據(jù)集市模式、C2B個(gè)人數(shù)據(jù)交易模式。2026年,基于云的數(shù)據(jù)服務(wù)將是一個(gè)方向。從整個(gè)數(shù)據(jù)資源總量來(lái)看,中國(guó)的公共數(shù)據(jù)資源占到全國(guó)數(shù)據(jù)總量的2/3以上。未來(lái)整個(gè)數(shù)據(jù)的格局由互聯(lián)網(wǎng)平臺(tái)轉(zhuǎn)向多網(wǎng)融合,從而使得整個(gè)競(jìng)爭(zhēng)焦點(diǎn)轉(zhuǎn)向開發(fā)和利用而不是數(shù)據(jù)資源。
今天,全球數(shù)據(jù)交易的三個(gè)模式里,個(gè)人數(shù)據(jù)是一直無(wú)法得到保障的,未來(lái)如果能把PIMS(個(gè)人信息管理體系)標(biāo)準(zhǔn)強(qiáng)制推廣的話,個(gè)人對(duì)數(shù)據(jù)的控制權(quán),對(duì)數(shù)據(jù)的經(jīng)濟(jì)價(jià)值收獲會(huì)比較大,但這個(gè)過(guò)程會(huì)比較漫長(zhǎng)。
最后談?wù)剛€(gè)人對(duì)數(shù)據(jù)流通的發(fā)展建議:首先,可通過(guò)建立“刑事追責(zé)、行政監(jiān)管與民事救濟(jì)”相結(jié)合等方式保障數(shù)據(jù)流通生態(tài)體系;第二,要加強(qiáng)行業(yè)應(yīng)用創(chuàng)新,提升企業(yè)核心競(jìng)爭(zhēng)能力;第三,要妥善處理跨境數(shù)據(jù)流動(dòng)問(wèn)題。(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)endprint