大數(shù)據(jù)的核心任務(wù)是數(shù)據(jù)資源化和數(shù)據(jù)資產(chǎn)化,做大數(shù)據(jù)首先必須得有數(shù)據(jù),有數(shù)據(jù)就得有數(shù)據(jù)資源,稱(chēng)為數(shù)據(jù)資源化。有了數(shù)據(jù),如果數(shù)據(jù)沒(méi)加以利用,將會(huì)迎來(lái)數(shù)據(jù)“寒冬”。就是數(shù)據(jù)資產(chǎn)化和數(shù)據(jù)應(yīng)用的問(wèn)題,我國(guó)80%的數(shù)據(jù)資源在政府手里,沒(méi)有得到充分應(yīng)用。國(guó)家對(duì)解決數(shù)據(jù)資源問(wèn)題提煉出“四個(gè)任務(wù)”,數(shù)據(jù)共享、數(shù)據(jù)融合、數(shù)據(jù)集中、數(shù)據(jù)開(kāi)創(chuàng)。
目前國(guó)家有八個(gè)大數(shù)據(jù)融合實(shí)驗(yàn)區(qū),三個(gè)新型智慧城市標(biāo)桿市,近十年的時(shí)間,全國(guó)都在持續(xù)努力研究數(shù)據(jù)的發(fā)展方向。特別是數(shù)據(jù)融合、數(shù)據(jù)集中,在學(xué)術(shù)上稱(chēng)之為數(shù)據(jù)集成和數(shù)據(jù)質(zhì)量。現(xiàn)在數(shù)據(jù)加工基地、數(shù)據(jù)加工清洗等行業(yè)在過(guò)去十年中是數(shù)據(jù)庫(kù)界主要研究方向。
我們以“兩化”來(lái)解決“兩化”,以數(shù)據(jù)模塊化來(lái)解決數(shù)據(jù)資源化的問(wèn)題,以數(shù)據(jù)活化來(lái)解決數(shù)據(jù)資產(chǎn)化的問(wèn)題。數(shù)據(jù)塊化的發(fā)展模式,對(duì)于提升政務(wù)服務(wù),是數(shù)據(jù)為民服務(wù)的思想,“讓數(shù)據(jù)多跑路,讓群眾少跑腿?!倍鴶?shù)據(jù)塊化總結(jié)為,采集、共享、應(yīng)用、推送、碰撞、嵌入。數(shù)據(jù)塊化是從網(wǎng)格采集來(lái)數(shù)據(jù),我們將碎片化的數(shù)據(jù)形成非常好的數(shù)據(jù)資源,把條數(shù)據(jù)變成塊數(shù)據(jù),或者把碎片化數(shù)據(jù)變成數(shù)據(jù)資產(chǎn)的過(guò)程。
我們把塊數(shù)據(jù)定義成二元組,第一是塊與實(shí)體的結(jié)合,第二個(gè)結(jié)合是塊與關(guān)系的結(jié)合。這兩個(gè)結(jié)合,最后它在底層數(shù)據(jù)模型所表現(xiàn)的是實(shí)體屬性之間的關(guān)系,實(shí)際上本質(zhì)是一個(gè)關(guān)系的結(jié)合。它讓我們看到數(shù)據(jù)之間的二元組是一個(gè)集合與集合之間的關(guān)系,而塊數(shù)據(jù)的大小屬于一個(gè)篇序關(guān)系。國(guó)內(nèi)政務(wù)大數(shù)據(jù),尤其是城市一級(jí)的大數(shù)據(jù)離不開(kāi)網(wǎng)格化。網(wǎng)格到社區(qū)、到街道、到區(qū)縣、到城市、到省、到國(guó)家,不同的層級(jí)之間的數(shù)據(jù)能否有一個(gè)一體化構(gòu)架,用同樣的數(shù)據(jù)模型完好組織,用不同塊數(shù)據(jù)來(lái)哺育不同層級(jí)的政府治理。
數(shù)據(jù)塊化里有的三個(gè)定律,第一個(gè)是數(shù)據(jù)資源化定律,它對(duì)我們制定IT規(guī)劃,購(gòu)買(mǎi)硬件設(shè)備有非常好的指導(dǎo)。今天大數(shù)據(jù)技術(shù),與摩爾定律密切相關(guān)。某種程度上,精確大數(shù)據(jù)的底層主流技術(shù)是應(yīng)摩爾定律而生,但是在算法、增量技術(shù)、突破計(jì)算復(fù)雜性理論方面有很多進(jìn)展。原來(lái)我們最好的算法是多項(xiàng)式算法,用多項(xiàng)式算法計(jì)算一個(gè)地區(qū)發(fā)展時(shí),即使運(yùn)用最好的掃描算法,也需要5.28年。第二是數(shù)據(jù)獨(dú)立定律,也叫數(shù)據(jù)外部性定律,這個(gè)數(shù)據(jù)外部性定律是我們做一項(xiàng)工作、時(shí),它可以有外部的數(shù)據(jù)資源。另一方面它指導(dǎo)我們IT系統(tǒng)的設(shè)計(jì),是業(yè)務(wù)驅(qū)動(dòng)、需求驅(qū)動(dòng),現(xiàn)有IT系統(tǒng)的設(shè)計(jì)是數(shù)據(jù)驅(qū)動(dòng)。業(yè)務(wù)驅(qū)動(dòng)和需求驅(qū)動(dòng)設(shè)計(jì)出來(lái)的系統(tǒng)和數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì)出來(lái)的系統(tǒng)的考慮點(diǎn)、時(shí)效性、數(shù)據(jù)碎片化各不相同。所以,只有數(shù)據(jù)獨(dú)立定律,數(shù)據(jù)才能成為一種資源,如果數(shù)據(jù)不能獨(dú)立,它依附于軟件系統(tǒng),不可能成為一種資源。
數(shù)據(jù)塊化或是數(shù)據(jù)資源化最后一個(gè)定律叫數(shù)據(jù)資源定律,也叫養(yǎng)魚(yú)池定律。數(shù)據(jù)是一種不可再生資源,為了讓數(shù)據(jù)形成資源,就需要有數(shù)據(jù)思維,更需要有數(shù)據(jù)清洗、匯聚、整合加工的能力。數(shù)據(jù)怎么做?在采集這一領(lǐng)域,把滴滴和摩拜這種共享經(jīng)濟(jì)的理念用在我們的網(wǎng)格采集、政府?dāng)?shù)據(jù)采集中。還包括數(shù)據(jù)沉淀和一卡通等的數(shù)據(jù)的匯聚。在今年的世博會(huì)上,我們推出了全球第一款解決“五跨式任務(wù)”的GLDM。提出“化”操作理念,以數(shù)據(jù)塊化解決數(shù)據(jù)資源化的問(wèn)題。
“化”是以數(shù)據(jù)活化來(lái)解決數(shù)據(jù)資產(chǎn)化的問(wèn)題,是數(shù)據(jù)的資產(chǎn)化的三定律,第一個(gè)定律叫跨界定律。數(shù)據(jù)怎么流通,流通的原動(dòng)力在哪兒,流通滾雪球定律,我們實(shí)際需要尋找數(shù)據(jù)升值空間。
第二個(gè)定律是數(shù)據(jù)的相對(duì)完全定律。一個(gè)數(shù)據(jù),只有相對(duì)完全,才能產(chǎn)生大的應(yīng)用,什么是大數(shù)據(jù)?一個(gè)人的數(shù)據(jù)也可能是大數(shù)據(jù),所以大數(shù)據(jù)是一個(gè)相對(duì)的概念。
第三個(gè)定律是數(shù)據(jù)開(kāi)放定律,它解決了我們今天數(shù)據(jù)分享開(kāi)放的核心技術(shù),所以這個(gè)定律也推動(dòng)我們數(shù)據(jù)開(kāi)放事業(yè)?!八罃?shù)據(jù)”變成“活數(shù)據(jù)”依靠的是什么?可以嘗試數(shù)據(jù)大腦,把碎片化政府變成整體政府、透明政府、高效政府、服務(wù)型政府,這些政府就是我們所說(shuō)的大數(shù)據(jù)政府,它可以做很多分析來(lái)解決民生問(wèn)題。所以我們用數(shù)據(jù)資源庫(kù)里的十二主題庫(kù)來(lái)解決民生十二難,比如身份認(rèn)證難、群眾填表難、辦事照相難、關(guān)系證明難,造假無(wú)懲戒使人渾水摸魚(yú),辦事難等。用一庫(kù)一APP來(lái)支撐,最后實(shí)現(xiàn)的是統(tǒng)一的融合城市。有了大數(shù)據(jù),秒級(jí)填表,隨身辦事兒用APP。
最后最關(guān)鍵的還是大數(shù)據(jù)庫(kù)的支撐,所以有了一個(gè)完好的數(shù)據(jù)庫(kù),我們可以手機(jī)拍照,半年復(fù)用,一次搞定。我們做了國(guó)家大部分的綜合實(shí)驗(yàn)區(qū)和新型智慧城市標(biāo)桿市。我們的理想是希望用大數(shù)據(jù)來(lái)發(fā)展民生和產(chǎn)業(yè),助力城市發(fā)展,形成大數(shù)據(jù)支撐民生服務(wù)和政府行政效力提升的數(shù)據(jù)連接的數(shù)連城市,數(shù)據(jù)資源富集的數(shù)據(jù)城市和大類(lèi)產(chǎn)業(yè)完備、企業(yè)集聚的數(shù)據(jù)生態(tài)城市。