胡泳
大數(shù)據(jù)的中心原則涉及搜尋運(yùn)營(yíng)數(shù)據(jù)之間的相關(guān)性,這個(gè)想法簡(jiǎn)單明了。借助廉價(jià)的云存儲(chǔ),我們現(xiàn)在可以收集與各種業(yè)務(wù)流程相關(guān)的令人眼花繚亂的數(shù)據(jù),從到達(dá)公司裝卸碼頭的卡車數(shù)量,到在給定的日期和時(shí)間內(nèi)每分鐘處理的訂單量,再到假日周末后的星期一收到的客戶投訴數(shù)量。新的功能強(qiáng)大的處理器和可擴(kuò)展的數(shù)據(jù)庫(kù)使熟練的操作員可以挖掘這些數(shù)據(jù),以尋找數(shù)據(jù)內(nèi)的模式:特別是操作變量之間的相關(guān)性。通過(guò)發(fā)現(xiàn)這些模式,大數(shù)據(jù)有望暴露出復(fù)雜的關(guān)系,以解決瓶頸問(wèn)題,改善日常運(yùn)營(yíng)。在理想狀態(tài)下,我們可以認(rèn)為,數(shù)據(jù)驅(qū)動(dòng)生產(chǎn)力的全新時(shí)代由此開(kāi)始。
問(wèn)題在于這些相關(guān)性常常是虛假的。這使得數(shù)據(jù)專業(yè)人士往往需要揮舞魔杖來(lái)確定哪些大數(shù)據(jù)關(guān)系是有意義的,而哪些僅僅是巧合。要想解決這個(gè)問(wèn)題,其實(shí)可以用一種更簡(jiǎn)單的方法來(lái)顯示相關(guān)性:納入帶有語(yǔ)境的“小數(shù)據(jù)”(small data)。情境意識(shí),也就是上下文,可以使看似復(fù)雜的情況變得清晰明了。情境的最簡(jiǎn)單示例可能是位置。Google Now就是使用你當(dāng)前的位置來(lái)提供高度相關(guān)的搜索建議,例如在步行范圍內(nèi)的商家。其他形式的情境信息還包括人(例如與你一起工作的人)和時(shí)間(例如重合的日歷預(yù)約)。對(duì)企業(yè)推薦引擎最有用途的情境類型之一是主題,比如郵件的信頭信息。了解到一個(gè)員工目前最關(guān)注的事情,推薦引擎可以建議與這些主題中相關(guān)的電子郵件、文檔和商業(yè)交易。很明顯,將電子郵件用作情境的錨定物,可以消除無(wú)關(guān)內(nèi)容的提示,因?yàn)閿?shù)據(jù)工具意識(shí)到這些無(wú)關(guān)內(nèi)容與你當(dāng)前念茲在茲的東西完全不相干。
進(jìn)行情境計(jì)算(contextual computing)所需的四種關(guān)鍵數(shù)據(jù)為:社交、興趣、行為和個(gè)人。這四方面中有些已經(jīng)相當(dāng)成熟,而有些在這幾年才開(kāi)始流行。能自如地掌握并運(yùn)用這四項(xiàng)數(shù)據(jù)的玩家,將在互聯(lián)網(wǎng)行業(yè)的競(jìng)爭(zhēng)中占據(jù)極大的優(yōu)勢(shì)。社交數(shù)據(jù)顯示了你如何與其他人聯(lián)系以及他們?nèi)绾蜗嗷ヂ?lián)系。它還揭示了這些聯(lián)系的性質(zhì)和情感相關(guān)性。在理想的情境計(jì)算狀態(tài)下,軟件和服務(wù)的輕輕一推就可以將兩個(gè)陌生人聯(lián)系到一起,他們同時(shí)在同一地點(diǎn),并且可以相處融洽。然而,如果你對(duì)某個(gè)人的活動(dòng)和興趣知之甚少,那么世界上的所有社交數(shù)據(jù)都將毫無(wú)用處。而一個(gè)人的口味和喜好很大程度上是圍繞著彼此相關(guān)的主題組織起來(lái)的。它也與同你自己的生活非常相似的個(gè)人之間的口味重疊相關(guān)。但興趣圖譜無(wú)法讀取你的好奇心可能將你引入的新方向。而且,它也做不到根據(jù)你所閱讀的內(nèi)容有效地推薦你喜歡的餐廳或度假勝地。行為是最可以輕松掌握的數(shù)據(jù)。行為數(shù)據(jù)很容易描述你實(shí)際所做的事情,而不是你聲稱要做的事情。傳感器可以完成這項(xiàng)工作,自我報(bào)告機(jī)制也是如此。這些數(shù)據(jù)可以與興趣數(shù)據(jù)兩相對(duì)照,從而使計(jì)算機(jī)能夠(也許比你更好)算出你下一步做什么的可能性。個(gè)人則是與一個(gè)人的最深層信仰、核心價(jià)值觀和個(gè)性有關(guān)的一組數(shù)據(jù)。它是令一個(gè)人在世界上與眾不同的原因,就像社交數(shù)據(jù)有助于顯示一個(gè)人與他人相似的原因一樣。鑒于心理學(xué)仍然難以準(zhǔn)確解釋我們的個(gè)人認(rèn)同如何發(fā)揮作用,因此以可計(jì)算的形式記錄此類信息的過(guò)程甚為緩慢就不足為奇了。
單獨(dú)掌握某一大項(xiàng)的數(shù)據(jù),并不能得出可靠的結(jié)論,以及作出完美的情景計(jì)算。也因此,對(duì)待大數(shù)據(jù)要有正確的態(tài)度。既不要忽視數(shù)據(jù)的價(jià)值,也不要把數(shù)據(jù)當(dāng)成神。