傅正++邢黎聞
4月26日,在北京召開(kāi)的中國(guó)
首席信息官(CIO)聯(lián)盟第一次工作會(huì)議暨互聯(lián)網(wǎng)創(chuàng)新與信息化論壇上,工業(yè)和信息化部副部長(zhǎng)楊學(xué)山指出,黨中央國(guó)務(wù)院確定中國(guó)要建設(shè)網(wǎng)絡(luò)強(qiáng)國(guó),其中一個(gè)關(guān)鍵的基礎(chǔ)問(wèn)題是人才,而首席信息官是信息人才隊(duì)伍的領(lǐng)軍者和中堅(jiān)力量。因此首席信息官聯(lián)盟應(yīng)該帶領(lǐng)中國(guó)的首席信息官隊(duì)伍,在中國(guó)信息化發(fā)展過(guò)程中發(fā)揮作用。
同時(shí),他在論壇上作了“大數(shù)據(jù)的現(xiàn)狀與發(fā)展”的主題報(bào)告。在報(bào)告中,他強(qiáng)調(diào),要高度重視大數(shù)據(jù)相關(guān)技術(shù)的重要性,利用信息技術(shù)在大數(shù)據(jù)的體系下提升核心競(jìng)爭(zhēng)力。
從歷史發(fā)展的角度看大數(shù)據(jù)
楊學(xué)山指出,最近兩年多來(lái),大數(shù)據(jù)的概念在全世界引起了關(guān)注,大數(shù)據(jù)的應(yīng)用廣泛而且發(fā)展很快,2013年全世界每天所產(chǎn)生的信息量等于2000年一年所產(chǎn)生的信息量。信息技術(shù)的廣泛深入應(yīng)用,使得信息資源真正變成了推動(dòng)社會(huì)進(jìn)步的基本資源。
原聲重現(xiàn) 在人類(lèi)社會(huì)發(fā)展的過(guò)程中,信息從來(lái)都十分重要。我們看人類(lèi)社會(huì)發(fā)展史,語(yǔ)言的產(chǎn)生和有記錄的文字的產(chǎn)生,對(duì)人類(lèi)文明的發(fā)展具有重要的作用;再看國(guó)與國(guó)之間的競(jìng)爭(zhēng),中國(guó)的驛站、長(zhǎng)城的峰谷,一直到后來(lái)從郵政系統(tǒng)、電話(huà)系統(tǒng)、到互聯(lián)網(wǎng)系統(tǒng),我們可以看到信息在人類(lèi)社會(huì)的發(fā)展過(guò)程中,歷來(lái)在各個(gè)方面都十分重要。為什么到了今天,我們要研究大數(shù)據(jù)?這是因?yàn)樵谛畔⒓夹g(shù)、信息資源和應(yīng)用的一起推動(dòng)下,猛然使得信息資源在人類(lèi)社會(huì)發(fā)展中站的位置,回歸到它應(yīng)該站的位置上去了。我在說(shuō)這句話(huà)的時(shí)候,意味著什么?意味著我們?cè)瓉?lái)沒(méi)有把它放在它應(yīng)該站的位置上。我們說(shuō)近的,德國(guó)的工業(yè)革命史里邊有一個(gè)重要的歷史性概念,叫“信息互為體系”,或者叫“信息物理系”,是什么呢?原來(lái)工業(yè)革命那么多年,使得物理系統(tǒng)如材料、能源、裝備、工藝都十分強(qiáng)大,但是信息在這個(gè)評(píng)分中,是處于比較弱的。而德國(guó)工業(yè)革命就表明,新的技術(shù)革命、新的產(chǎn)業(yè)發(fā)展方向是要在信息物理空間里發(fā)展的。我們?cè)偻巴?0多年,在上世紀(jì)70年代初,哈佛大學(xué)的肯尼迪政府學(xué)院有一個(gè)信息資源研究組,當(dāng)時(shí)他們就提出了資源三角形,就是材料、能源、信息,在管理之下一起推動(dòng)社會(huì)的進(jìn)步,這已經(jīng)四十多年了。這四十多年理論的階段,卻沒(méi)有得到實(shí)踐的支撐,尤其在中國(guó),信息和我們的物質(zhì)財(cái)富相比,它的重要性要低很多。但是現(xiàn)在這個(gè)局面已經(jīng)發(fā)生了變化,這個(gè)變化是因?yàn)樾畔⒓夹g(shù)能夠有能力獲取、處理、傳輸、存儲(chǔ)。由于我們的社會(huì)在發(fā)展的過(guò)程中,產(chǎn)生了越來(lái)越多的問(wèn)題,這些問(wèn)題需要信息來(lái)解決。所以,人類(lèi)社會(huì)在走向現(xiàn)代化的過(guò)程里面,進(jìn)入了一個(gè)新的階段。這個(gè)新的階段,就是材料、能源、信息真正成為了推動(dòng)社會(huì)文明進(jìn)步的基本資源。所以,我說(shuō),從這樣的歷史角度來(lái)看大數(shù)據(jù),就能夠把前面、后面連接起來(lái)。
大數(shù)據(jù)的本質(zhì)、核心、基礎(chǔ)是數(shù)據(jù)本身
楊學(xué)山認(rèn)為,大數(shù)據(jù)的本質(zhì)、核心、基礎(chǔ)是數(shù)據(jù)本身,要把對(duì)信息的管理和處理水平提高到一個(gè)新高度。
原聲重現(xiàn) 我們講到大數(shù)據(jù),它的本質(zhì)、它的核心、它的基礎(chǔ)是數(shù)據(jù)本身,是信息本身,也就是說(shuō)真正重要的是數(shù)據(jù)本身,是信息本身。我們想想,用在互聯(lián)網(wǎng)上購(gòu)買(mǎi)藥品的信息來(lái)預(yù)測(cè)流感的發(fā)生,那也是因?yàn)槟阌匈?gòu)買(mǎi)藥品的信息,否則的話(huà),光有互聯(lián)網(wǎng)上那么多天量的信息,也是沒(méi)有價(jià)值的。我們大家都在做位置服務(wù),GPS導(dǎo)航。我在一個(gè)地方(忘了是哪個(gè)地方),他們跟我說(shuō),這個(gè)導(dǎo)航的地圖可以精確到一個(gè)大院,它能告訴你什么地方有一個(gè)缺口,從這個(gè)缺口你可以進(jìn)到這個(gè)大院里面去。這意味著什么?如果沒(méi)有這么細(xì)膩的信息的話(huà),它這個(gè)功能是做不到的。所以在講大數(shù)據(jù)的時(shí)候,一定要聚焦到信息本身、數(shù)據(jù)本身。所有的變革、所有的作用、所有的革命性影響都要依賴(lài)于信息的數(shù)量和質(zhì)量。信息的數(shù)量、信息的質(zhì)量再加上恰當(dāng)?shù)膽?yīng)用連接,就成了關(guān)鍵數(shù)據(jù)。反過(guò)來(lái)說(shuō),即使有了這么多信息,但是如果沒(méi)有恰當(dāng)?shù)奶幚砟芰Φ脑?huà),這個(gè)信息依然是無(wú)效的。這就需要我們對(duì)信息的處理和管理提高到一個(gè)新的水平。如果沒(méi)有對(duì)信息進(jìn)行有效地組織和管理,信息利用就是空談。所以在講信息的質(zhì)量的時(shí)候,我們不僅要講數(shù)量、系統(tǒng)性、及時(shí)性,還得講前面的處理究竟是構(gòu)織成什么樣的。
數(shù)據(jù)一定要和應(yīng)用連接起來(lái)
楊學(xué)山指出:要把數(shù)據(jù)和國(guó)家、企業(yè)、社會(huì)服務(wù)連接起來(lái),根據(jù)需求采集、處理、應(yīng)用數(shù)據(jù),大數(shù)據(jù)才能落到實(shí)處。
原聲重現(xiàn) 我們一定要抓住大數(shù)據(jù),不論是國(guó)家、機(jī)構(gòu)、企業(yè)、還是社會(huì)服務(wù),一定要把數(shù)據(jù)和應(yīng)用連接起來(lái),而不是為數(shù)據(jù)而數(shù)據(jù)、為大而大、為變而變。同樣一個(gè)信息結(jié)合,對(duì)著不同的應(yīng)用,數(shù)據(jù)的價(jià)值實(shí)際上是不一樣的。北京市的霧霾究竟怎么形成的,現(xiàn)在專(zhuān)家也有一些結(jié)論了,但為了這個(gè)結(jié)論花費(fèi)了很多的時(shí)間和金錢(qián)。但我們?yōu)槭裁匆敲炊鄷r(shí)間那么多錢(qián)去得出這個(gè)結(jié)論呢?那是因?yàn)槲覀儗?duì)原來(lái)客觀存在的數(shù)據(jù),有的雖然收集了但是沒(méi)有集合在一起,沒(méi)有為了分析這個(gè)成因去做合理的構(gòu)建;另外一個(gè)重要原因是很多信息客觀存在,但是沒(méi)有去收集,所以為了分析成因,還要再去抓取。所以,不管是管理、服務(wù),還是企業(yè)、老百姓的各種各樣的信息需求,都要和信息資源的收集、處理、利用連接起來(lái),這樣前面所講的才能夠落到實(shí)處。
數(shù)據(jù)利用要包羅眾項(xiàng)技術(shù)
楊學(xué)山強(qiáng)調(diào),要高度重視技術(shù),技術(shù)是信息實(shí)現(xiàn)價(jià)值的核心所在,沒(méi)有技術(shù),數(shù)據(jù)再大、再動(dòng)態(tài)、再前沿、再細(xì),也不能產(chǎn)生價(jià)值。
原聲重現(xiàn) 其實(shí)我在剛才講的過(guò)程中,已經(jīng)把技術(shù)的重要性說(shuō)了出來(lái)。為什么會(huì)有那么多的信息、信息從哪兒冒出來(lái)?很簡(jiǎn)單,我們現(xiàn)在人手一個(gè)智能手機(jī),這個(gè)智能手機(jī)就是信息的一個(gè)發(fā)生源;我們有互聯(lián)網(wǎng),所以人人都可以把信息加上去、拿下來(lái);我們有那么多的傳感器,那么多的傳感器產(chǎn)生了天量信息。這些都是由于技術(shù),如果沒(méi)有技術(shù),剛才說(shuō)的2013年一天就產(chǎn)生2001一年的信息量,是不可能實(shí)現(xiàn)的。十年,人的變化是十分有限的,社會(huì)形態(tài)的變化也是十分有限的,但是技術(shù)的變化使得13年一天的信息量相當(dāng)于01年一年的信息總量,所以我們一定要包容技術(shù)。
但對(duì)大數(shù)據(jù)來(lái)說(shuō),除了剛才說(shuō)的要有傳感技術(shù)來(lái)傳感,要有傳輸技術(shù)來(lái)傳輸,要有終端技術(shù)來(lái)獲取利用,中間還有一大堆存儲(chǔ)和處理,這些技術(shù)都可以歸納到大信息技術(shù)應(yīng)用上來(lái)。但是對(duì)于大數(shù)據(jù)來(lái)說(shuō),除了這些技術(shù)之外,我們還要關(guān)注一個(gè)更加重要的技術(shù),就是如何按照兩個(gè)途徑處理好數(shù)據(jù)本身?一個(gè)途徑是數(shù)據(jù)本身的途徑,第二個(gè)途徑是應(yīng)用維度的統(tǒng)計(jì)集合,按照這兩個(gè)結(jié)構(gòu)如何把信息處理好、管理好和應(yīng)用好的技術(shù),是大數(shù)據(jù)技術(shù)和其它技術(shù)如云計(jì)算、物聯(lián)網(wǎng)和智慧城市不一樣的地方。而這個(gè)技術(shù)是信息實(shí)現(xiàn)價(jià)值的核心問(wèn)題,沒(méi)有這個(gè)技術(shù),數(shù)據(jù)再大、再動(dòng)態(tài)、再精密、再系統(tǒng),它也是不能產(chǎn)生價(jià)值的。這個(gè)技術(shù)本身是極其難得的,我多次講過(guò),在未來(lái)我們談信息技術(shù)的發(fā)展,假定放眼三十年,最關(guān)鍵最困難的技術(shù)是這個(gè)技術(shù),我只能說(shuō)我希望三十年后我們真正能夠把這個(gè)技術(shù)做好。
面對(duì)大數(shù)據(jù)的幾大重點(diǎn)
楊學(xué)山明確需要對(duì)大數(shù)據(jù)系列相關(guān)技術(shù)的發(fā)展進(jìn)行統(tǒng)籌規(guī)劃,要有長(zhǎng)遠(yuǎn)規(guī)劃,也要有近期的著力點(diǎn),不斷滿(mǎn)足發(fā)展需求;不管是機(jī)構(gòu)還是企業(yè),都要根據(jù)自身急需解決的問(wèn)題,不要為大數(shù)據(jù)的概念框架所累,利用信息技術(shù)在大數(shù)據(jù)的體系下提升核心競(jìng)爭(zhēng)力。
原聲重現(xiàn) 我們面對(duì)大數(shù)據(jù),重點(diǎn)是什么?很多人建議國(guó)家要有大數(shù)據(jù)戰(zhàn)略。國(guó)家大數(shù)據(jù)戰(zhàn)略,我們的朝向是什么?對(duì)于國(guó)家來(lái)說(shuō),我想首先是要有和國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展、國(guó)家利益、國(guó)家安全相匹配的、相一致的數(shù)據(jù)資源;其次,一定要對(duì)數(shù)據(jù)進(jìn)行高水平地組織和管理,所以,第一要?jiǎng)?wù),作為國(guó)家的長(zhǎng)期目標(biāo)就是要有資源,但是這樣的資源又是在隨著技術(shù)和歷史的發(fā)展不斷地發(fā)展起來(lái)的,絕對(duì)不是說(shuō)有就有的。因此,我們既要有長(zhǎng)期的規(guī)劃,又要有當(dāng)前的著力點(diǎn)。
其次,我們一定要對(duì)一系列相關(guān)的技術(shù)進(jìn)行統(tǒng)籌考慮。在發(fā)展過(guò)程中,要不斷滿(mǎn)足資源的利用和其它相關(guān)傳輸處理技術(shù)能夠同步發(fā)展。目前,最短腿的兩塊是傳感和數(shù)據(jù)本身,中間經(jīng)過(guò)幾十年的發(fā)展相對(duì)來(lái)說(shuō)要好一些,但是我們要讓他并行起來(lái),要和我們的目標(biāo)結(jié)合起來(lái)。同時(shí)我們?cè)跇?gòu)成這樣一個(gè)系統(tǒng)之后,如何保證它的安全?因?yàn)閷?shí)際上這個(gè)資源和其它的如礦產(chǎn)資源具有同等的重要性,那么這樣的資源,如何根據(jù)網(wǎng)絡(luò)的特征和數(shù)據(jù)本身的特征來(lái)保證安全,這是技術(shù)問(wèn)題,當(dāng)然還有自我認(rèn)識(shí)問(wèn)題,但首先得有技術(shù)手段,沒(méi)有技術(shù)手段,你認(rèn)識(shí)再高,也沒(méi)有用。那么,切入點(diǎn)是什么?切入點(diǎn)是不管是企業(yè)還是政府機(jī)構(gòu),我們一定要圍繞著我想要解決的問(wèn)題或者是現(xiàn)在履行的職責(zé)或者企業(yè)發(fā)展,從什么樣的信息最被需要,用什么樣的處理方式、什么樣層次的數(shù)據(jù)和應(yīng)用能夠連接最能解決問(wèn)題切入。我們?cè)谧乃袡C(jī)構(gòu),千萬(wàn)不要為大數(shù)據(jù)的概念方框所累,我們要用它來(lái)解決問(wèn)題,用它來(lái)提高在大數(shù)據(jù)體制下的核心競(jìng)爭(zhēng)力。