摘 要:信息是推動世界發(fā)展、科技進步的不竭動力。而作為信息時代的產(chǎn)物——大數(shù)據(jù),逐漸成為大家討論的話題。下面將對大數(shù)據(jù)時代進行簡單概述,介紹大數(shù)據(jù)前沿的公司以及大數(shù)據(jù)時代的利與弊。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;認知計算系統(tǒng)
中圖分類號:TP181
1 大數(shù)據(jù)時代的概述
最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,他稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!?“大數(shù)據(jù)”在物理學、生物學等領域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關注。大數(shù)據(jù)作為云計算、物聯(lián)網(wǎng)之后IT行業(yè)又一大顛覆性的技術革命。云計算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價值的資產(chǎn)。企業(yè)內部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠遠超越現(xiàn)有企業(yè)IT架構和基礎設施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。
當大數(shù)據(jù)還在眾說紛紜時,維克托·邁爾-舍恩伯格就以對大數(shù)據(jù)進行了深入而系統(tǒng)的研究,并與麥肯思·庫克耶編輯在《經(jīng)濟學人》發(fā)表了大數(shù)據(jù)專題論文,他曾說,世界的本質就是數(shù)據(jù),大數(shù)據(jù)將開啟一次重大的時代變革。
2 大數(shù)據(jù)的引領者
Google,Microsoft,亞馬遜,IBM,蘋果,F(xiàn)acebook,twitter,VISA都是大數(shù)據(jù)時代的領軍企業(yè),他們都洞察到了大數(shù)據(jù)的發(fā)展,在其中他們“受益匪淺”。
IBM執(zhí)行總裁羅睿蘭認為,“數(shù)據(jù)將成為一切行業(yè)當中決定勝負的根本因素,最終數(shù)據(jù)將成為人類至關重要的自然資源?!蔽唇?jīng)處理的數(shù)據(jù)就像源礦,毫無價值,只有經(jīng)過分析與處理的數(shù)據(jù)才有價值。大數(shù)據(jù)及分析最大的魅力就在于能夠為國家、企業(yè)、醫(yī)療機構等帶來分析洞察力,依托數(shù)據(jù)更加科學的來進行決策,進一步推動生產(chǎn)力發(fā)展。對于大數(shù)據(jù)分析,IBM采用的是一種“人工智能”+“大數(shù)據(jù)”的方式來提供大數(shù)據(jù)分析和服務,即“Watson Foundations”。
曾在《危險邊緣》中一舉成名的沃森能夠戰(zhàn)勝人類的“秘技”主要有以下幾個:能夠識別自然語言;從知識庫中搜索證據(jù)來支持假設的答案;具有學習能力。IBM認為,隨著信息的增加,以學習的、交互的方式,隨著數(shù)據(jù)的進一步增長逐步提高認知的分析行為,就是“認知計算”。在IBM內部,“沃森”所代表的就是“認知計算”,IBM已經(jīng)將認知計算作為未來大數(shù)據(jù)分析的戰(zhàn)略方向?!拔稚被贗BM Power硬件平臺,實際上“沃森”的認知計算能力并不僅限于Power,而是能移植到其他IBM系統(tǒng)上。IBM的Watson Foundations是一個開放式平臺,傳統(tǒng)的大數(shù)據(jù)解決方案用戶也能獲得認知計算帶來的好處。
現(xiàn)在,IBM已經(jīng)創(chuàng)建了三大類認知計算系統(tǒng):新一代的對話系統(tǒng);新一代的探索系統(tǒng);新一代的決策系統(tǒng),這是認知計算的最高應用境界,能幫助客戶提供最佳的決策,如根據(jù)客戶過往購物情況和實時購物情況,預測接下來客戶要買什么。
“沃森”正變得越來越受歡迎,因為它所代表的“認知計算”讓大數(shù)據(jù)及分析變得更加簡單。
在國內,百度已經(jīng)致力于開發(fā)自己的大數(shù)據(jù)處理和存儲系統(tǒng);騰訊也提出目前已經(jīng)到了數(shù)據(jù)化運營的黃金時期,如何整合這些數(shù)據(jù)成為未來的關鍵任務。每一個商業(yè)巨頭都在緊緊把握這次機會。
3 大數(shù)據(jù)時代的利與弊
一分鐘內,微博推特上新發(fā)的數(shù)據(jù)量超過10萬;社交網(wǎng)絡“臉譜”的瀏覽量超過600萬……你把它們當作抒情議論的工具,華爾街的斂財高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財富”,先人一步用其預判市場走勢,而且取得了不俗的收益。他們究竟是怎么利用這些數(shù)據(jù)的?這些數(shù)據(jù)具體有六大價值:
(1)華爾街根據(jù)民眾情緒拋售股票;(2)對沖基金依據(jù)購物網(wǎng)站的顧客評論,分析企業(yè)產(chǎn)品銷售狀況;(3)銀行根據(jù)求職網(wǎng)站的崗位數(shù)量,推斷就業(yè)率;(4)投資機構搜集并分析上市企業(yè)聲明,從中尋找破產(chǎn)的蛛絲馬跡;(5)美國疾病控制和預防中心依據(jù)網(wǎng)民搜索,分析全球范圍內流感等病疫的傳播狀況;(6)美國總統(tǒng)奧巴馬的競選團隊依據(jù)選民的微博,實時分析選民對總統(tǒng)競選人的喜好。
幾乎每一個成功的人,成功的企業(yè)都充分利用了大數(shù)據(jù)的絕妙優(yōu)勢。
蘋果公司的傳奇總裁史蒂夫·喬布斯在與癌癥斗爭的過程中采用了不同的方式,成為世界上第一個對自身所有DNA和腫瘤DNA進行排序的人。他得到的不是只有一系列標記的樣本,而是包括整個基因密碼的數(shù)據(jù)文檔。對于一個普通患者,醫(yī)生只能期望他的DNA排列同實驗中使用的樣本足夠相似。但是,史蒂夫·喬布斯的醫(yī)生們能夠基于喬布斯的特定基因組成,按所需效果用藥。如果癌癥病變導致藥物失效,醫(yī)生可以及時更換另一種藥,也就是喬布斯所說的,“從一片睡蓮葉跳到另一片上。”喬布斯開玩笑說:“我要么是第一個通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人。”雖然他的愿望沒有實現(xiàn),但是他獲得的所有數(shù)據(jù)還是將他的生命延長了好幾年,也才有了iphone的一次次創(chuàng)新,帶給我們的一次次驚喜。[1]
采用所有數(shù)據(jù)而不是樣本數(shù)據(jù),增加了我們解決問題的方法和能力,降低了我們的直接和間接經(jīng)濟損失,甚至挽救或者延長了人的生命,這就是大數(shù)據(jù)的魅力所在。
沃爾瑪是世界上最大的零售商,在網(wǎng)絡帶來的巨大數(shù)據(jù)之前,沃爾瑪在美國企業(yè)中擁有的數(shù)據(jù)資源是最多的。在20世紀90年代,通過把每一個產(chǎn)品記錄為數(shù)據(jù),沃爾瑪可以讓供應商監(jiān)控銷售速率、數(shù)量以及存貨的情況,利用此沃爾瑪成為了世界上最大的“寄售店”。而且在2004年,沃爾瑪對歷史交易記錄這個龐大的數(shù)據(jù)庫進行了觀察,這個數(shù)據(jù)庫記錄的不僅僅包括每一個顧客的購物清單以及消費額,還包括購物籃中的物品,具體時間,甚至購買當日的天氣。他們注意到,每當季節(jié)性颶風來臨之前,不僅手電筒的銷售量增加了,而且POPTarts蛋撻的銷量也增加了。因此當季節(jié)性颶風來臨時,沃爾瑪會把庫存的蛋撻放在靠近颶風用品的位置,從而增加銷售量。[2]
當數(shù)據(jù)點以數(shù)量級方式增長時,我們會觀察到許多似是而非的相關關系,大數(shù)據(jù)的相關關系分析法更準確、更快,也更不易受到偏見的影響。[3]
任何事物都有兩面性,大數(shù)據(jù)難道帶給我們的只有好處而無弊端嗎?不,當然不是。大數(shù)據(jù)的最大弊端就是隱私。
Google、Yahoo!、微軟搜索、Ask.com以及萬維網(wǎng)進行邊路的其他許多搜索引擎,通過碎網(wǎng)頁的諸葛搜索,使得所有人僅在搜索框中鍵入一兩個關鍵字就能訪問這些網(wǎng)頁。然而在不經(jīng)意間,搜索引擎記住了許多,比網(wǎng)上發(fā)布的信息多得多。Google能識別出我們每個人在什么時候搜索了什么的,以及我們可能覺得足夠準確并點擊進去的搜索結果是什么。毫不夸張的說,Google對我們的了解比我們自己能夠記住的還要多。[4]
他們得到了我們如此之多的隱私(并非我們自愿給予的),我們完全處于赤裸的狀態(tài)(雖然Google等都對他們存儲的信息進行定期的刪除)。我們的隱私不再隱私。
大數(shù)據(jù)為我們帶來便利的同時,也為我們埋下了巨大隱患。但是我們不會因為它的不足就摒棄它,相反地我們要好好利用它,并對它產(chǎn)生的弊端進行研究,拿出合理的解決方案。
參考文獻:
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤譯.大數(shù)據(jù)時代[M].浙江人民出版社,2012(12):33-34.
[2]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤譯.大數(shù)據(jù)時代[M].浙江人民出版社,2012(12):50.
[3]維克托·邁爾-舍恩伯格,肯尼思·庫克耶. 盛楊燕,周濤譯.大數(shù)據(jù)時代[M].浙江人民出版社,2012(12):51.
[4]維克托·邁爾-舍恩伯格.刪除[M].袁杰譯.浙江人民出版社,2013(01):12-13.
作者單位:沈陽農業(yè)大學,沈陽 110866