鄭渝川
大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)。這句話(huà)已經(jīng)被重復(fù)過(guò)無(wú)數(shù)次。先別忙著進(jìn)行樂(lè)觀(guān)地展望,我們現(xiàn)在所談到的大數(shù)據(jù),其實(shí)幅度和深度都相當(dāng)有限,大量信息被封鎖在信息孤島上。各級(jí)地方政府和各部委,自上世紀(jì)90年代起上馬了各自的電子政務(wù)工程,發(fā)展到現(xiàn)在,已實(shí)現(xiàn)基本的數(shù)據(jù)積累,各項(xiàng)業(yè)務(wù)辦理和機(jī)關(guān)運(yùn)轉(zhuǎn)也切換到電子平臺(tái)上。但各項(xiàng)電子政務(wù)工程并未實(shí)現(xiàn)真正意義上的信息共享,跨部門(mén)調(diào)閱數(shù)據(jù)很多情況下需要部門(mén)或地方領(lǐng)導(dǎo)出面,就更談不上這些數(shù)據(jù)無(wú)障礙開(kāi)放給社會(huì)和企業(yè)了。
電子商務(wù)、金融、電信等行業(yè)的龍頭企業(yè),深耕大數(shù)據(jù)也很有成效,沉淀了大量的有效數(shù)據(jù),以及對(duì)于該企業(yè)價(jià)值不大,卻有著較高社會(huì)應(yīng)用價(jià)值的數(shù)據(jù)。這些信息和數(shù)據(jù)被認(rèn)為是企業(yè)的核心資產(chǎn),企業(yè)在加大信息采集、數(shù)據(jù)挖掘分析的成本投入同時(shí),拒絕與其他企業(yè)、公共組織共享。
孤島化的大數(shù)據(jù),帶來(lái)的最突出問(wèn)題是數(shù)據(jù)采集分析的重復(fù)化,造成大量社會(huì)成本無(wú)謂消耗,也使得數(shù)據(jù)挖掘分析的水平長(zhǎng)期難以提高。對(duì)于創(chuàng)業(yè)者和初創(chuàng)企業(yè)來(lái)說(shuō),信息和數(shù)據(jù)采集的成本之高,常常超出他們的負(fù)擔(dān)能力,因而信息孤島造成的結(jié)果是抑制創(chuàng)新創(chuàng)業(yè),現(xiàn)有的創(chuàng)業(yè)者和企業(yè)也將盡可能避免在信息和數(shù)據(jù)采集上投入過(guò)多成本,將更主要的精力放在營(yíng)銷(xiāo)噱頭上。
可以說(shuō),中國(guó)大數(shù)據(jù)發(fā)展已經(jīng)走到了一個(gè)重要關(guān)口,如果繼續(xù)延續(xù)現(xiàn)有的信息孤島局面,政府、企業(yè)、社會(huì)組織、科研機(jī)構(gòu)各自為政,數(shù)據(jù)挖掘分析的水平還是會(huì)繼續(xù)提升,經(jīng)濟(jì)和社會(huì)應(yīng)用價(jià)值也會(huì)體現(xiàn),但必然因此滯后于美國(guó)等國(guó)家,且差距也將越來(lái)越大。與之相應(yīng)的另一種選擇就是,積極推進(jìn)信息開(kāi)放、數(shù)據(jù)共享,實(shí)現(xiàn)數(shù)據(jù)資源的融合集聚,跟上大數(shù)據(jù)的發(fā)展潮流。
《塊數(shù)據(jù)》這本書(shū)針對(duì)條塊分割“條數(shù)據(jù)”,提煉出一個(gè)對(duì)應(yīng)的概念“塊數(shù)據(jù)”,即以開(kāi)放、共享、連接為特征的數(shù)據(jù)融合集聚機(jī)制,不但匯集了現(xiàn)有分隔化的大數(shù)據(jù)實(shí)體的數(shù)據(jù)資源,而且還借助智能設(shè)備、社交網(wǎng)絡(luò) 擴(kuò)張數(shù)據(jù)來(lái)源?!皦K數(shù)據(jù)”圍繞人及其活動(dòng)而產(chǎn)生,不但要收集人的靜態(tài)數(shù)據(jù),還要記錄人的行為活動(dòng)數(shù)據(jù),以及思想、意識(shí)和意愿數(shù)據(jù)。但要真正走出目前的“條數(shù)據(jù)”,走向“塊數(shù)據(jù)”,仍面臨著諸多現(xiàn)實(shí)障礙。