陳紀(jì)英
如果把大數(shù)據(jù)比做新大陸,第一個發(fā)現(xiàn)者是美國人。大約一年前,2012年3月,奧巴馬當(dāng)局發(fā)布了《大數(shù)據(jù)研究和發(fā)展計劃》,對大數(shù)據(jù)戰(zhàn)略的重視堪比當(dāng)年克林頓政府提出的信息高速公路戰(zhàn)略。而眼下,在中國大數(shù)據(jù)最積極的參與者,仍然還是阿里巴巴、騰訊這些互聯(lián)網(wǎng)企業(yè)。
大數(shù)據(jù)究竟是一座金礦還是水坑?中美兩國在大數(shù)據(jù)上的差距究竟多大?阿里巴巴、騰訊、百度,在大數(shù)據(jù)時代,能否超越谷歌?帶著這些疑問,《中國新聞周刊》專訪了中國社會科學(xué)院信息化研究中心秘書長姜奇平。姜是最早把“大數(shù)據(jù)”概念引入中國的專家之一,也是推動大數(shù)據(jù)進(jìn)入國家戰(zhàn)略的積極呼吁者,在過去十年,他一直致力于互聯(lián)網(wǎng)經(jīng)濟(jì)學(xué)理論前沿研究。
中國新聞周刊:大數(shù)據(jù)的概念怎么界定?
姜奇平:大數(shù)據(jù)其實是托夫勒在1980年《第三次浪潮》中早就預(yù)言的,“如果說IBM的主機(jī)拉開了信息化革命的大幕,那么大數(shù)據(jù)則是第三次浪潮的華彩樂章”。從信息高速公路到大數(shù)據(jù),都是以“第三次浪潮”為標(biāo)志的第二次現(xiàn)代化。
大數(shù)據(jù)時代是第三次浪潮信息革命的高級階段。主要有幾大特點,從規(guī)模上來說是海量數(shù)據(jù);從數(shù)據(jù)形態(tài)上來說既包括了結(jié)構(gòu)化數(shù)據(jù),也包括非結(jié)構(gòu)化數(shù)據(jù),具體形態(tài)有文字、數(shù)字、圖片、音頻、視頻等。再進(jìn)一步引申,大數(shù)據(jù)的處理工具是開源軟件,這些軟件主要用于分布式計算,與之相反的是集中計算模式。
中國新聞周刊:具體而言,大數(shù)據(jù)時代經(jīng)濟(jì)領(lǐng)域?qū)媾R哪些變革?
姜奇平:大數(shù)據(jù)有光明的商業(yè)前景?,F(xiàn)在大的互聯(lián)網(wǎng)公司都有大數(shù)據(jù)戰(zhàn)略。2013年將是大數(shù)據(jù)產(chǎn)業(yè)元年,保守估計,將來大數(shù)據(jù)市場規(guī)模至少將會有上萬億元。具體而言,大數(shù)據(jù)這個產(chǎn)業(yè)鏈包括數(shù)據(jù)存儲,數(shù)據(jù)挖掘、數(shù)據(jù)開發(fā)應(yīng)用等環(huán)節(jié)。
首先,大數(shù)據(jù)產(chǎn)業(yè)本身會有大發(fā)展。從信息產(chǎn)業(yè)來講,未來大數(shù)據(jù)會和云計算、物聯(lián)網(wǎng)結(jié)合起來,并出現(xiàn)很多數(shù)據(jù)中心,推動技術(shù)創(chuàng)新,推動技術(shù)服務(wù)產(chǎn)業(yè)的興起。
大數(shù)據(jù)行業(yè)的發(fā)展,連帶的也會引起其他產(chǎn)業(yè)的分化變革。比如傳統(tǒng)的統(tǒng)計、分析軟件行業(yè),以前賣的是產(chǎn)品,未來可以賣數(shù)據(jù)分析服務(wù),這些領(lǐng)域都會展開,并在未來會形成數(shù)據(jù)產(chǎn)業(yè)鏈。這些都是我們能預(yù)見到的場景。
大數(shù)據(jù)還會成為很多行業(yè)的主營業(yè)務(wù)之一。比如銀行和電子商業(yè)行業(yè),以前數(shù)據(jù)部門是輔助部門,現(xiàn)在數(shù)據(jù)業(yè)務(wù)逐漸成為金融行業(yè)的主營業(yè)務(wù)。還有電子商務(wù)行業(yè),以前以交易為主,但是現(xiàn)在數(shù)據(jù)已經(jīng)成了阿里巴巴的三大主營業(yè)務(wù)之一。
在電子商務(wù)領(lǐng)域,大數(shù)據(jù)將會帶來產(chǎn)銷逆轉(zhuǎn),從B2C、C2C升級為C2B,過去廠家從自己的判斷出發(fā),生產(chǎn)出來商品向消費者推銷。未來則是先去分析用戶的需求,根據(jù)用戶的需求向用戶提供定制化的服務(wù)。
現(xiàn)在美國出現(xiàn)了情境定價,比如一件衣服就生產(chǎn)一件,這樣的話商品附加值很高,利潤率很高。
另外一方面,可能本來成本很高的產(chǎn)品,也會降低下來。比如3D打印,以前制造一個模具很貴,所以只能給所有人提供標(biāo)準(zhǔn)化的產(chǎn)品,因為只有規(guī)模效應(yīng)才能降低成本。
中國新聞周刊:2012年3月29日,奧巴馬政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展計劃》,對大數(shù)據(jù)的重視堪比之前的信息高速公路。中國應(yīng)該出臺這樣的戰(zhàn)略么?
姜奇平:中國應(yīng)該盡快出臺國家層面的大數(shù)據(jù)戰(zhàn)略。目前在大數(shù)據(jù)的國家戰(zhàn)略層面,中國與美國還有不小的鴻溝。中國在涉及先進(jìn)生產(chǎn)力、科技創(chuàng)新的重大潮流方面,很多時候都是被動地跟在美國后面。中國時下的觀念水平還停留在第一次現(xiàn)代化上,只對第二次浪潮的東西(如包括高鐵在內(nèi)的“鐵公基”之類)產(chǎn)生靈光。這是我們步步趕不上趟的深層原因之一。這個問題不是在科技創(chuàng)新層面能解決的。變被動為主動的關(guān)鍵,是跳出就事論事的追趕,形成以信息生產(chǎn)力為基礎(chǔ)發(fā)展新文明的觀念。
而美國政府高度重視大數(shù)據(jù),奧巴馬政府2012年3月29日發(fā)布了《大數(shù)據(jù)研究和發(fā)展計劃》,提出要收集龐大而復(fù)雜的數(shù)字資料,并從中獲得知識和洞見,以提升能力。但中國在大數(shù)據(jù)上還沒有形成自己的頂層戰(zhàn)略。
大數(shù)據(jù)的關(guān)鍵并不在數(shù)據(jù)原料的多少,而在于數(shù)據(jù)加工能力,這才是大數(shù)據(jù)真正的價值。海量的大數(shù)據(jù)堆積起來,如果不能加以利用,也是沒有價值的。在即將到來的大數(shù)據(jù)時代,最有價值的不是數(shù)據(jù)采礦業(yè),而是數(shù)據(jù)加工處理能力。
如果中國陷入群龍無首、無頭蒼蠅式的大數(shù)據(jù)狂潮,大干快上大數(shù)據(jù)中心大樓、大產(chǎn)業(yè)園,這樣很有可能只是肥了投機(jī)房地產(chǎn)或鉆稅收優(yōu)惠空子的人,仍然避免不了落人數(shù)據(jù)鴻溝。要解決這個問題,就要把產(chǎn)業(yè)文章做在數(shù)據(jù)加工增值上,不光要“收集龐大而復(fù)雜的數(shù)字資料”,更要著力“從中獲得知識和洞見以提升能力”。
除了國家的頂層設(shè)計,大數(shù)據(jù)行業(yè)也要盡快建立大數(shù)據(jù)的技術(shù)標(biāo)準(zhǔn)。中國是全球最大的大數(shù)據(jù)市場之一,所以在大數(shù)據(jù)的技術(shù)標(biāo)準(zhǔn)方面應(yīng)該掌握話語權(quán),我們提倡的是以市場為導(dǎo)向的技術(shù)標(biāo)準(zhǔn)。能制定標(biāo)準(zhǔn),相當(dāng)于制定游戲規(guī)則,才能在以后的發(fā)展中掌握主動權(quán)。
中國新聞周刊:從技術(shù)上層面來說,中國公司和美國公司的差距大嗎?
姜奇平:存在技術(shù)差距。在數(shù)據(jù)存儲方面,美國比較先進(jìn)的有EMC公司。而IBM則是通過整合大數(shù)據(jù)的信息和應(yīng)用,給企業(yè)提供“硬件+軟件+數(shù)據(jù)”的整體解決方案的,技術(shù)實力很強大。還有像亞馬遜擁有大量的用戶信息和交易數(shù)據(jù),對用戶信息的大數(shù)據(jù)分析,解決自己公司的精準(zhǔn)營銷和個性化廣告推介等問題。而臉書則擁有大量的用戶信息以及用戶之間的網(wǎng)絡(luò)狀關(guān)系信息。比如臉書把大量的用戶和氣好友按照各個緯度進(jìn)行細(xì)分,然后進(jìn)行精準(zhǔn)化的營銷,前景遠(yuǎn)大。
中國新聞周刊:5年后,全世界最有名的大數(shù)據(jù)公司里,會不會有來自中國的公司呢?
姜奇平:我想,這些技術(shù)鴻溝并非沒有趕超的可能性,中國公司在某些方面也有自己的優(yōu)勢。比如阿里巴巴,現(xiàn)在掌握了大量交易信息,交易信息比搜索信息復(fù)雜同時含金量也更高,整體上的數(shù)據(jù)量可能比谷歌更豐富。阿里巴巴大數(shù)據(jù)戰(zhàn)略方向清晰但是現(xiàn)在阿里巴巴要提高加工能力,比如如何用數(shù)據(jù)戰(zhàn)略真正落實小而美戰(zhàn)略,小前端、大平臺、富生態(tài)如何實現(xiàn)。數(shù)據(jù)是很有價值的富礦,但是如果放在那里沒有充分開采,就很浪費。
百度跟谷歌相比,是負(fù)擔(dān)小,未來大數(shù)據(jù)的重要方向是移動互聯(lián)網(wǎng)?,F(xiàn)在谷歌有安卓系統(tǒng),但是這塊未來可能是個雞肋,因為這塊未來和大數(shù)據(jù)的分布式計算要求難兼容。百度沒這個包袱,而且百度現(xiàn)在也在和移動開發(fā)者合作。
騰訊呢,現(xiàn)在有殺手級產(chǎn)品微信、QQ,在移動互聯(lián)網(wǎng)時代,通過這些產(chǎn)品能完整掌握互聯(lián)網(wǎng)用戶的生活軌跡。不用愁騰訊怎么賺錢。
為什么說騰訊百度等可能超越谷歌?谷歌等互聯(lián)網(wǎng)的模式是水庫模式,等到了建立在分布式計算基礎(chǔ)上的智能網(wǎng)絡(luò)時代,水庫塌陷了,是一個個水坑了。而騰訊的微信,底層架構(gòu)技術(shù)很好,能夠適應(yīng)大數(shù)據(jù)時代的分布式計算的要求。
中國新聞周刊:在大數(shù)據(jù)領(lǐng)域,未來是大公司有機(jī)會還是小公司有機(jī)會?
姜奇平:大公司小公司都有機(jī)會。很多創(chuàng)業(yè)公司也有機(jī)會,大數(shù)據(jù)行業(yè)應(yīng)該有這樣的傳奇,一個年輕人現(xiàn)在進(jìn)入行業(yè),未來成為首富,這并非不可能。為什么呢?因為大數(shù)據(jù)是基于開源軟件的,代碼是公開的,你可以去看,而且數(shù)據(jù)的獲取沒有很高的門檻。年輕人缺的是資金,但是現(xiàn)在數(shù)據(jù)就在那里,就相當(dāng)于工廠給你建好了,就看你能不能生產(chǎn)出好的有創(chuàng)意的有價值的數(shù)據(jù)產(chǎn)品了。