郭晨晨
【摘要】 從大數(shù)據(jù)的提出到現(xiàn)在僅僅幾年時間,但已經成為整個社會各個領域的熱門話題。從事大數(shù)據(jù)工作的人才更是受到了包括百度、騰訊、阿里巴巴等互聯(lián)網掌舵公司的追捧。但是需要注意的是任何技術或者科學成果都有的局限性,讓大數(shù)據(jù)更好的為人類服務需要我們更多的理性。
【關鍵詞】 大數(shù)據(jù) 局限性 理性
一、大數(shù)據(jù)時代的到來
提到“大數(shù)據(jù)”,需要對“數(shù)據(jù)”的重要性做簡單的分析。本質上數(shù)據(jù)都是人創(chuàng)造的,它伴隨人類歷史的發(fā)展,從古至今一直影響著人類的思考、行為,改變著人類的世界觀、價值觀。
大數(shù)據(jù)時代的核心仍然是數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)是一個個數(shù)字或者可以進行編碼的簡單文本,是一種結構化的信息量,分析起來要簡單很多。
而大數(shù)據(jù)卻包羅萬象,以文本、圖片、視頻、音頻等等眾多形式出現(xiàn)。它包含很多非結構化數(shù)據(jù)和半結構化數(shù)據(jù)。
麥肯錫是研究大數(shù)據(jù)的先驅,在其報告中給出的大數(shù)據(jù)定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集。但它同時強調,并不是說一定要超過特定TB 值的數(shù)據(jù)集才能算是大數(shù)據(jù)。
維基百科對于大數(shù)據(jù)的描述是在無法容許的時間里,用常規(guī)軟件對其內容進行抓取、管理和處理的數(shù)據(jù)集合。
大數(shù)據(jù)時代的到來與其說是人類智慧的創(chuàng)造性成果,不如說是對于信息爆炸時代處理海量信息的一種無奈的解決方法。
二、大數(shù)據(jù)的技術特點
任何一種新技術的應用都是水到渠成的結果,假如環(huán)境沒有準備好,無論什么樣的技術想取得預期的效果都是極為困難的,大數(shù)據(jù)應用對于環(huán)境的要求是極其苛刻的。
Volume、Velocity、Variety、Veracity是大數(shù)據(jù)的4V特點,處理數(shù)量巨大、結構復雜、類型眾多數(shù)據(jù)構成的數(shù)據(jù)集合自然不能僅僅使用單一簡單的技術來完成。
大數(shù)據(jù)是基于云計算的移動互聯(lián)網、物聯(lián)網、社交網絡、電子商務、智慧城市的跨界融合。云計算廣泛應用了分布式技術,它是一個體系架構,包含分布是數(shù)據(jù)處理技術、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫等。
正是云技術給了人們廉價獲取海量計算和存儲的能力,使大數(shù)據(jù)處理技術成為可能。
三、大數(shù)據(jù)應用的副作用
3.1大數(shù)據(jù)應用需要更多理性思考
大數(shù)據(jù)的熱潮其提出之初就被人們所預料到。
麥肯錫稱:“數(shù)據(jù),已經滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
然而,在大數(shù)據(jù)熱一浪高過一浪之時,很需要給大數(shù)據(jù)潑一盆涼水降降溫。
信息化宣傳言過其實已經是“新常態(tài)”,人們宣傳數(shù)據(jù)庫、信息共享、物聯(lián)網、云計算,發(fā)布會和研討會上這些新事物、往往賦予了它超過現(xiàn)實本身的意義。
每次都會描述一個無限樂觀的前景,然而現(xiàn)實的發(fā)展和人們本來的預期并不是同樣的軌跡。信息化效益不是一個短期工程,技術亦不是最關鍵的因素,理性的思考才是長久之計。
3.2大數(shù)據(jù)熱產生的浮躁社會氛圍
縱觀人類歷史,人們對于預測未知的熱衷從未消失過。現(xiàn)實世界中,缺少實時記錄的工具,許多行為看起來是“人似秋鴻有來信,事如春夢了無痕”,互聯(lián)網“處處行跡處處痕”的特點確實為人們發(fā)現(xiàn)規(guī)律,預測未來提供可能。
非理性的宣傳夸張了大數(shù)據(jù)的成果,增大了大數(shù)據(jù)的迷惑性,大數(shù)據(jù)在這種影響下變得無所不能。我們不能盲目神化大數(shù)據(jù)。
3.3大數(shù)據(jù)應用的局限性和危害
“大數(shù)據(jù)”,簡單來說就是無限規(guī)模的數(shù)據(jù)量。需要正確認識的是接收海量的信息帶來的并不一定是可以高效利用的信息。
在這個信息爆炸的時代,整個互聯(lián)網充斥著大量負面、虛假的信息。在利用大數(shù)據(jù)技術分析數(shù)據(jù)時,這些信息可能會使“規(guī)律”變得“非規(guī)律”。
例如在教育方式的選擇問題上,如果利用大數(shù)據(jù)分析,我們貌似從海量數(shù)據(jù)中把握出了多數(shù)人接收知識的“規(guī)律”,然而對于那些并不適合的孩子來說就應該被所謂的“規(guī)律”所限定發(fā)展,被“規(guī)律”所拖垮嗎?
數(shù)據(jù)的增長并不意味著有用信息的增長,更不意味著人們放棄獨立思考、獨立決策的能力。過度膨脹的數(shù)據(jù)讓人們在遇到具體問題時過分依賴網絡搜索查詢,這在一定程度上限制了人們智慧的創(chuàng)造性。
大數(shù)據(jù)規(guī)律始于分析者的感覺和猜測,是一種人為創(chuàng)新和思想成果,分析結果除了技術層面還受分析者本身文化層次和悟性的影響,規(guī)律的主觀性不可避免,大數(shù)據(jù)的虛假規(guī)律也不可避免。
這在很大程度上構成了大數(shù)據(jù)的局限性。大數(shù)據(jù)說到底僅僅是一種工具,走向成功,獨立思考,發(fā)揮思維的創(chuàng)造性是關鍵問題。