每每講到大數(shù)據(jù),我的美國同行,谷歌董事長施密特經(jīng)常說的一句話是:“在過去兩年,我們生產(chǎn)的數(shù)據(jù),是占全部人類文明史上所有數(shù)據(jù)總和的90%?!币簿褪钦f,過去一萬年產(chǎn)生的數(shù)據(jù)也只占整個數(shù)據(jù)的10%。
言外之意是,現(xiàn)在數(shù)據(jù)已經(jīng)爆炸了,我們要解決的是信息爆炸、數(shù)據(jù)太多的問題。像百度這樣的公司,在技術(shù)上有相當(dāng)多年的積累,在我們看來,技術(shù)已經(jīng)基本就位;但是我們真正想要的數(shù)據(jù)現(xiàn)在沒有,或是還沒有搜集上來,已經(jīng)被搜集上來的數(shù)據(jù)基本沒有價值。
比如說最近比較火的智能硬件。戴個手環(huán)、弄個眼鏡,搜集了很多數(shù)據(jù),但把這些數(shù)據(jù)拿回來之后總覺得用不上,覺得沒法分析。比如戴眼鏡,人平時眼睛能看到的,一天24小時除了閉著眼睡覺之外,把剩下能看到的全部搜集過來,但這些有什么用?我們想來想去,其實是沒有用的。
我覺得下一個方向其實是新數(shù)據(jù)。就是要思考,什么數(shù)據(jù)能夠真正幫助人們解決問題。今年4月1日的時候,我們講了一個概念性的產(chǎn)品,就是百度筷搜。很多人問你們什么時候出這個產(chǎn)品,我們想買。實際上,這個東西我們還沒做出來。
但是,這東西確實是代表方向的。當(dāng)我們說,你有一雙筷子,在你吃飯的時候就能知道這盤菜有沒有用地溝油,或者這個蔬菜是不是重金屬超標(biāo)了……那么大家就會覺得這個東西太有用了,我想要這個東西。
目前來說,這個數(shù)據(jù)還沒有,我們還沒有能力收集這些數(shù)據(jù)。但是這個的確是代表了一個方向,因為你本來天天就在吃飯、本來每天都在用筷子,不像你本來不戴手環(huán)你卻戴上了;你本來不戴眼鏡,卻戴了這個很重的東西,這是完全不一樣的。
我本來就干的事,同時幫我收集數(shù)據(jù),這些數(shù)據(jù)可以立刻告訴我一些有價值的信息;或者這些數(shù)據(jù)也許不會立刻告訴我有哪些信息,立刻告訴我的也不一定有價值,但是,我如果堅持這樣做下去,也許就會有價值。
這樣的不是“快數(shù)據(jù)”,而是“慢數(shù)據(jù)”?!奥龜?shù)據(jù)”會對消費者有很大的價值。而這種“慢數(shù)據(jù)”的收集方法,又不是來自于那些原本不需要戴的東西,一定是平時就在干的事,順便就把這些數(shù)據(jù)收集上來了。
比如說我天天都要刷牙,我在刷牙的過程中,唾液的情況都是可以接觸到、可以分析的。也許有一種癌癥,就可能會在被現(xiàn)代醫(yī)學(xué)檢查出來前的五年,通過檢測唾液,持續(xù)檢測半年之后就可以知道癌癥可能會發(fā)生,這樣的數(shù)據(jù)如果收集上來,就會非常有價值。
所以我覺得,新一代的數(shù)據(jù)收集,不管是收集工具也好,或者說數(shù)據(jù)本身也好,都會有很大的發(fā)展。但是這里面,難點并不在于你制造出來一個新型的硬件,而在于能夠找到那個點,找到什么數(shù)據(jù)對人們是有價值的。
其實在健康方面的大數(shù)據(jù)也講了很長時間了。比如說,人類的基因測序,過去很多國家花了納稅人很多的錢,搞了這個人類的基因圖譜?,F(xiàn)在成本急劇下降,可能花一千美元,用幾天的時間,就能夠把整個人的基因測出來了。理論上來講,這個數(shù)據(jù)也是可以告訴你,你這個人的身體會發(fā)生什么變化、有什么特點、未來會有什么風(fēng)險。
這種類型的數(shù)據(jù),我認為是未來真正有價值的數(shù)據(jù),過去不管產(chǎn)生了多少數(shù)據(jù),其實都浪費掉了。所以從這個意義來講,現(xiàn)在傳統(tǒng)產(chǎn)業(yè)在數(shù)據(jù)上仍然沒有優(yōu)勢,互聯(lián)網(wǎng)公司目前在數(shù)據(jù)上也沒有優(yōu)勢。
所以,這樣的東西,是需要每一個行業(yè)以及擁有行業(yè)知識、行業(yè)經(jīng)驗的人,來積極擁抱互聯(lián)網(wǎng),來跟互聯(lián)網(wǎng)進行結(jié)合,才能夠做出來。