□文/B座12樓
除了上帝,任何人都必須用數(shù)據(jù)來說話
□文/B座12樓
看過美劇《疑犯追蹤》的人大概都會被芬奇先生創(chuàng)造的那臺超級機器震撼——只要出現(xiàn)一個名字,這臺超級智慧體就會入侵所有服務(wù)器自動檢索出此人在網(wǎng)上所有的蹤跡和信息,包括財務(wù)信息、犯罪紀錄、消費行為、社交關(guān)系、活動軌跡等,并通過對這些數(shù)據(jù)的分析和關(guān)聯(lián)性分析來定性個體。在任何一個有攝像頭的地方,這臺人工智能機都能通過五官識別技術(shù)定位你。在上帝凝視下,你無處可逃。
雖然這種超級機器在現(xiàn)實社會中并不存在,但在智能手、云服務(wù)、互聯(lián)網(wǎng)蓬勃發(fā)展的時代,當你社交、娛樂、支付、出行時,海量的數(shù)據(jù)每時每刻都會產(chǎn)生。
如果這些留存在云端服務(wù)器的數(shù)據(jù)被搜集起來集中分析,那這些結(jié)果又將如何被應(yīng)用,改變目前的商業(yè)形態(tài)、技術(shù)形態(tài)以及生活方式呢?
舉個簡單的例子,只要通過手機定位,你的地理位置和移動軌跡將全面暴露在運營商及應(yīng)用軟件后臺面前。通過早上幾點出門,公司所在位置判斷出收入水平與消費水平;通過與你處在相同時間相同空間的用戶推測出你的社交關(guān)系;通過你住址位置推測出你的房價、房貸壓力甚至是家庭成員狀況……
這是如何做到的?大數(shù)據(jù)。
基于每時每刻產(chǎn)生的大數(shù)據(jù)的采集、處理、應(yīng)用和管理,大數(shù)據(jù)能夠產(chǎn)生的商業(yè)價值已經(jīng)逐漸被發(fā)現(xiàn)。
日前,“盈動實驗室”組織了一次行業(yè)內(nèi)的沙龍,邀請了多位資深專家探討了大數(shù)據(jù)的商業(yè)未來話題。
根據(jù)Gartner的定義,大數(shù)據(jù)是使用高效的信息處理方式以具備更強的洞察力、決策力和流程優(yōu)化能力的、海量的、多元的數(shù)據(jù)資產(chǎn)。
阿里云創(chuàng)新負責人“風劍”認為,阿里云在大數(shù)據(jù)應(yīng)用領(lǐng)域在全球?qū)儆陬I(lǐng)先水平,致力于把大數(shù)據(jù)的理念和思想植入到數(shù)據(jù)的框架之中。大數(shù)據(jù)的利用分三個層次:大數(shù)據(jù)平臺、大數(shù)據(jù)工具和大數(shù)據(jù)應(yīng)用。
專注于大數(shù)據(jù)人工智能客服領(lǐng)域的易云科技負責人王磊認為,大數(shù)據(jù)的特點在于容量大、沒有明確的規(guī)則、復(fù)雜、非相關(guān)性、變化非???。就技術(shù)層面而言,大數(shù)據(jù)對存儲、計算能力要求高;數(shù)據(jù)的幀數(shù)不斷加快且呈現(xiàn)爆炸式,就要求分析能力快,對實時性要求高;數(shù)據(jù)的種類多,含有文本、音頻、照片等不同形式;就應(yīng)用層面而言,全數(shù)據(jù)才能真實還原事物本身的規(guī)律;要求應(yīng)用場景豐富,不間斷學(xué)習;大數(shù)據(jù)是基于對現(xiàn)實世界變量的關(guān)聯(lián)分析來對未來預(yù)測,只有加入越來越多的變量才能真實模擬現(xiàn)實的運行。
大數(shù)據(jù)最大的價值是什么?這是企業(yè)和創(chuàng)業(yè)者最常問的問題。
風劍認為,獲得數(shù)據(jù)和數(shù)據(jù)管理是前提,場景化才是大數(shù)據(jù)的價值所在。把數(shù)據(jù)放在不同的應(yīng)用場景里,會產(chǎn)生不同的價值。
大數(shù)據(jù)最大的魅力就是不確定性。這種不確定性不僅因為數(shù)據(jù)來源的不確定和處理過程的不確定,還因為其結(jié)果的不確定。比如,用人工智能去預(yù)測奧運會項目的勝負就違背了大數(shù)據(jù)的魅力。
既然大數(shù)據(jù)如此有價值有魅力,那么應(yīng)該如何發(fā)揮大數(shù)據(jù)的魅力?
專注于大數(shù)據(jù)征信領(lǐng)域的EcreditPal負責人夏真認為,數(shù)據(jù)量多并不意味著就具有競爭優(yōu)勢,單一緯度的數(shù)據(jù)無用,數(shù)據(jù)鏈接能力才是決定數(shù)據(jù)是否能發(fā)揮價值的因素。如何將看似不相關(guān)的、比較斷裂的信息鏈接起來去解決問題,才是大數(shù)據(jù)分析的關(guān)鍵。這就要求對大數(shù)據(jù)在進行即時處理的同時,發(fā)展出有效的模型去有效預(yù)測趨勢。
既然大數(shù)據(jù)如此重要,那么應(yīng)該如何獲得海量的信息樣本呢?“互聯(lián)網(wǎng)+”的發(fā)展使越來越多行業(yè)產(chǎn)生的數(shù)據(jù)得到紀錄,數(shù)據(jù)范圍和所屬行業(yè)不斷被豐富。對企業(yè)而言,企業(yè)內(nèi)部、外部市場的大數(shù)據(jù)都具有價值。風劍指出,企業(yè)大數(shù)據(jù)包括三大塊,三塊之間來源不同,獲取難度越來越高,也具有不同的采集跟合作方式。
1 .企業(yè)社會類數(shù)據(jù):社會活動相關(guān)信息;
2 .企業(yè)日志類數(shù)據(jù):企業(yè)運營活動留下的足跡;
3 .企業(yè)經(jīng)營類數(shù)據(jù):最核心的機密數(shù)據(jù),是企業(yè)生存的根本。
風劍認為,大數(shù)據(jù)的未來在傳統(tǒng)企業(yè),而不在互聯(lián)網(wǎng)企業(yè),因為互聯(lián)網(wǎng)企業(yè)對數(shù)據(jù)的掌控能力太強了。
夏真認為,數(shù)據(jù)來源是大數(shù)據(jù)公司首要要解決的問題。第一類來源主要是具有平臺性質(zhì)的搜索引擎與社交軟件,目前大數(shù)據(jù)的主要來源還是集中在有用戶入口的企業(yè),用戶在網(wǎng)絡(luò)或者APP上的用戶行為、內(nèi)容、交互產(chǎn)生的數(shù)據(jù)都在不斷地被積累,比如國內(nèi)的百度、阿里、騰訊、平安、京東,國外的Google、Facebook、雅虎。第二類來源是具有廣泛的用戶人群的運營商的快速搜集。
初創(chuàng)公司的機遇就在于掌握數(shù)據(jù)分析技術(shù)去輔助已經(jīng)掌握大數(shù)據(jù)的企業(yè),通過接觸用戶來積累數(shù)據(jù)。在可以預(yù)見的未來,數(shù)據(jù)的產(chǎn)生、積累、建模、應(yīng)用都會由不同的公司來做,在這個鏈條上發(fā)展不同的能力就是初創(chuàng)公司的機遇。強大的數(shù)據(jù)分析能力、數(shù)據(jù)變現(xiàn)能力、數(shù)據(jù)建模能力、對應(yīng)用場景切入的深刻度,都是初創(chuàng)公司的競爭力所在。
隨著互聯(lián)網(wǎng)與云服務(wù)的發(fā)展,越來越多的行業(yè)數(shù)據(jù)、企業(yè)數(shù)據(jù)、用戶數(shù)據(jù)得到記錄,通過傳感器采集到的物聯(lián)網(wǎng)數(shù)據(jù)和通過網(wǎng)站、應(yīng)用軟件、社交平臺檢測采集到的互聯(lián)網(wǎng)數(shù)據(jù)能不能發(fā)揮價值,取決于對數(shù)據(jù)的算法和分析技術(shù)是否成熟。
易云科技負責人王磊認為,大數(shù)據(jù)的發(fā)展趨勢一定會實時化起來,無論是獲取還是分析的渠道都會更加實時化。
風劍認為,我國無論是對實時數(shù)據(jù)、即時數(shù)據(jù)還是離線數(shù)據(jù)的處理技術(shù)都是非常成熟的。例如,阿里雙十一實時處理能力足夠強,無論是千億量級別的即時數(shù)據(jù)還是離線數(shù)據(jù)都能夠處理。
這其中,針對通用型的大數(shù)據(jù)分析解決方案主要包括數(shù)據(jù)處理、數(shù)據(jù)可視化、產(chǎn)品定位、企業(yè)管理、運營危機處理、危機預(yù)警與市場營銷部分。針對垂直領(lǐng)域,大數(shù)據(jù)分析在征信和金融領(lǐng)域、交通領(lǐng)域、醫(yī)療領(lǐng)域、文化娛樂產(chǎn)業(yè)和智慧城市等方面應(yīng)用前景廣闊。
人工智能機器最重要的作用就是通過對數(shù)據(jù)的整理和分析來幫助人判斷,從而作出更好的決策。但能達到具有人的思維能力、語言處理能力、情感能力的機器能否問世?只能說,目前尚未突破?!?/p>