甄靜慧
蛋撻與颶風有什么關系?Google為什么能夠預測美國流感的流行趨勢?Target公司怎么知道女性顧客懷孕并及時向她推銷母嬰用品——繼“云”之后,這兩年從硅谷到北京,大數(shù)據(jù)成為了IT界最新最火的話題之一。
在福建一家大型醫(yī)院,故事是這樣發(fā)生的。醫(yī)院CT掃描的收費,費用由數(shù)百到上千元不等;而X光胸片的收費則只要幾元。根據(jù)醫(yī)院政策,病人照CT和X光,醫(yī)生可以得到提成,但是提成比例不一樣,X光的提成比CT高很多。
前兩年,醫(yī)院向一家大型信息技術公司購買了一套大數(shù)據(jù)分析工具,以及一些針對該醫(yī)院開發(fā)的新報表。分析發(fā)現(xiàn)的問題讓管理層大為震驚——原來,由于X光與CT的提成比例差異,該醫(yī)院普放室和CT室長期達成協(xié)議,將大量CT項目寫成普放。“這樣對病人沒有影響,醫(yī)生的提成卻大幅增加,提成增加的部分則由兩科室醫(yī)生利益均沾?!绷私鈨?nèi)情的人士透露,這個問題在該醫(yī)院已經(jīng)持續(xù)了3年。杜絕了這一現(xiàn)象后,醫(yī)院每年節(jié)省了近200萬元的支出。
而這,不過是大數(shù)據(jù)方興未艾之際,數(shù)據(jù)分析技術在醫(yī)療行業(yè)的小試牛刀。
大數(shù)據(jù),是指以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品和服務,或深刻的洞見——牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授維克托·邁爾-舍恩伯格在他的著作《大數(shù)據(jù)時代》中指出。
海量數(shù)據(jù)是與“樣本分析”相對的一個概念?!昂荛L時間以來,因為記錄、儲存和分析數(shù)據(jù)的工具不夠好,我們只能收集少量數(shù)據(jù)進行分析?!边@就是隨機采樣和樣本分析,維克托說,“但它本身存在許多固有的缺陷。”比如采樣過程無法完全排除偏見等。然而今天,情況已經(jīng)完全不一樣了??萍及l(fā)展使人類擁有了足夠的數(shù)據(jù)處理、存儲能力以及分析技術,準確分析大量數(shù)據(jù)已經(jīng)成為了可能。那么,何不放棄樣本分析,收集全面而完整的數(shù)據(jù)?它會帶來前所未有的變化——這就是大數(shù)據(jù)時代維克托和IT專家們的呼吁。
2009年,在很多人對大數(shù)據(jù)概念仍然陌生之際,互聯(lián)網(wǎng)巨頭Google率先以一種震驚社會的方式向人們詮釋了大數(shù)據(jù)到底能做什么。當年,全球出現(xiàn)了一種新的流感病毒——甲型H1N1。人們期待政府能夠及時公布流感病例,以作防范。然而,由于普通人總習慣在患病多日后才去醫(yī)院,新流感病例的通告都會有一兩周的延遲。唯彼時Google打破了這一“常規(guī)”,它宣告其能預測冬季流感的傳播,而且可以具體到特定的地區(qū)和州。
Google的自信正是來源于大數(shù)據(jù)技術,它保存了人們多年來所有的搜索記錄,把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節(jié)性流感傳播時期的數(shù)據(jù)進行比較,在處理了4.5億個不同的數(shù)學模型后,得出與官方數(shù)據(jù)相關性高達97%的預測準確率。最重要的是,Google的預測判斷非常及時,不像疾控中心那樣具有滯后性,它幫助美國公共衛(wèi)生機構的官員在重要時刻獲得了非常有價值的數(shù)據(jù)信息。
而同樣在2009年,作為“智慧地球”、“智慧城市”等一系列名詞的創(chuàng)造者,IBM正式開始在中國推銷與醫(yī)療、公共交通、食品安全等一系列公共服務相關的技術解決方案,這些解決方案有很多同樣是建立在大數(shù)據(jù)技術基礎上。
“什么叫智慧的交通?”IBM大中華區(qū)預測分析軟件專家劉海亮侃侃而談,“我只要每天追蹤你的手機信號,就能知道你什么時間進入哪條路,開車還是坐公交,從哪下車。大概追蹤半年,就能總結出你的行為趨勢。如果把整個廣州市所有人的行為都整合起來,我們就可以預測每條路什么時候會堵,什么時候不堵。于是我不僅能告訴司機現(xiàn)在哪條路在堵車,還能告訴他未來3小時哪條路不堵。”
從醫(yī)療到交通——這意味著,建立在大數(shù)據(jù)基礎上的技術變革,正以一種前所未有的方式,滲透進每一個公共領域。
不過,如果認為大數(shù)據(jù)只不過是IT巨頭和政府公共服務之間的事情,那么作為企業(yè)來說,很可能就會錯失先機?!按髷?shù)據(jù)最重要的并不是數(shù)據(jù)本身,而是對數(shù)據(jù)的分析應用?!眲⒑A帘硎?。事實上,數(shù)據(jù)在社會的每個領域無處不在,大數(shù)據(jù)對商業(yè)領域的影響,絲毫不亞于其在公共領域掀起的波瀾,關鍵點只在于“創(chuàng)新”。我們能看到,大數(shù)據(jù)的很多應用都來源于傳統(tǒng)認為最不可能和最沒有價值的地方,卻由此而產(chǎn)生新的商業(yè)模式。
比如日本先進工業(yè)技術研究所教授越水重臣做了一個“坐姿”研究。他把人體屁股特征轉化成數(shù)據(jù),從而根據(jù)人體對座位的壓力差異識別出乘坐者的身份,準確率高達98%。他的目的是將這項技術應用在汽車防盜系統(tǒng)上,讓汽車能輕易識別出駕駛者是不是車主。越水重臣的思路,正是把那些以往從不被認為與數(shù)據(jù)相關的事物轉化為可量化的數(shù)據(jù),從而使信息產(chǎn)生獨特的價值。
遵循著這個思路,傳統(tǒng)產(chǎn)業(yè)同樣可以得到大數(shù)據(jù)的支持,使原有的商業(yè)平臺和商業(yè)模式獲得“進化”。
以廣東一家大型汽車廠為例,其車門噴漆工序共要重復14次,其中只要有任何一次噴漆出現(xiàn)瑕疵,整個汽車門就廢了,因此,該工序?qū)Τ杀究刂浦陵P重要。這個問題看起來跟大數(shù)據(jù)風馬牛不相及,然而記者卻了解到,年前該汽車廠通過對噴漆車間溫度、壓力、濕度等各種數(shù)據(jù)分析,以及對所有新車門、噴氣成與敗進行對比,成功將廢鐵率降低,從而有效降低了生產(chǎn)成本。
在美國,傳統(tǒng)商業(yè)利用大數(shù)據(jù)實現(xiàn)精準營銷的案例更是不勝枚舉。2004年,沃爾瑪通過數(shù)據(jù)分析發(fā)現(xiàn),每當在季節(jié)性颶風來監(jiān)之前,POP-Tarts蛋撻的銷量會增加,所以每當風暴來臨,他們會把蛋撻放在靠近颶風用品的位置,以便行色匆匆的顧客采購從而增加銷量。而美國折扣零售商Target甚至能利用對顧客購買行為的數(shù)據(jù)分析,知道哪些女性顧客懷孕了甚至預測出其預產(chǎn)期。這樣,該公司就能夠在孕期的每個階段給客戶寄送相應的優(yōu)惠券。
是的,我們貌似已經(jīng)進入了一個數(shù)據(jù)為王的時代,大數(shù)據(jù)技術仿佛為企業(yè)鋪開了無限商機的可能性,但同時,對于很多企業(yè)來說,這也是一個兩難的挑戰(zhàn)。
“我知道這是好東西,但是當IT界大力宣揚它的好處時,企業(yè)要考慮的卻是實實在在的成本投入。”珠三角一家制造企業(yè)老板王濤表示。誠然,在中國,對大數(shù)據(jù)產(chǎn)業(yè)的布局已經(jīng)開始。中關村已成立大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟;云天使基金、中云融匯基金、大數(shù)據(jù)實驗室孵化基金等三支產(chǎn)業(yè)投資基金更是從大數(shù)據(jù)產(chǎn)業(yè)的“種子期”就開始關注其發(fā)展。但對于傳統(tǒng)企業(yè)來說,進入大數(shù)據(jù)時代的門檻并不低。劉海亮向記者坦言,大數(shù)據(jù)從咨詢到落地,投資幅度上下很大,“如果企業(yè)自身有IT技術能力,只是購買一些工具,幾百萬甚至一兩百萬就夠了;但若是全套技術和方案的購買,則可能要投入上千萬甚至上億?!?/p>
企業(yè)擔心的另一個問題是,用以大數(shù)據(jù)技術分析的數(shù)據(jù)既然是企業(yè)的核心競爭力,沒有企業(yè)真正愿意把這些核心數(shù)據(jù)交給第三方的數(shù)據(jù)公司?!八裕髷?shù)據(jù)的項目最終都會走向企業(yè)自主開發(fā)之路?!?/p>
“然而,無論是上千萬的投入,還是建立IT團隊,對一般企業(yè)來說,都是成本非常高的?!痹谕鯘劾?,大數(shù)據(jù)是一把雙刃劍,“以往不用它也挺好,但現(xiàn)在,你就得考慮是忍痛投入巨款,還是眼看著對手搶占先機了?!?/p>
劉海亮承認,目前全球大數(shù)據(jù)技術的發(fā)展仍處于起步階段,但國外企業(yè)對技術的投入遠比中國企業(yè)多得多,因為國內(nèi)企業(yè)受限于在IT產(chǎn)業(yè)鏈所處的位置,普遍在數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能等領域基礎薄弱,布局大數(shù)據(jù)對很多企業(yè)來說門檻還是有點高。但國內(nèi)相對強勢的互聯(lián)網(wǎng)企業(yè)、電信運營商、電信設備供應商已經(jīng)開始啟動產(chǎn)業(yè)布局。
而在大數(shù)據(jù)發(fā)展已有相當時日的美國,面臨的則是一個更前沿的問題——倫理拷問。無疑,企業(yè)運用大數(shù)據(jù),就是希望更精準把握客戶行為,這極大地刺激著他們進一步采集、存儲、循環(huán)利用人們個人數(shù)據(jù)的野心。如果說互聯(lián)網(wǎng)時代我們的隱私受到了威脅,大數(shù)據(jù)時代無疑會加深這種威脅。想想看:亞馬遜監(jiān)視著我們的購物習慣,百度監(jiān)視著我們的網(wǎng)頁瀏覽習慣,微博更是什么都知道。
我們在接觸任何信息的時候都在向別人提供可被分析的數(shù)據(jù)——這無論如何不是一個令消費者舒服的想法。因此,如Facebook這樣的企業(yè),因為知道太早透露用戶數(shù)據(jù)的許多新用途會讓用戶反應過激,只能選擇忍耐。另外,公司在不斷為其收集的數(shù)據(jù)數(shù)量和類型,包括隱私問題進行商業(yè)模式和政策上的調(diào)整。