現(xiàn)在,不管是參加行業(yè)會議還是瀏覽網(wǎng)站,到處都在說“大數(shù)據(jù)”這個詞,躲都躲不開。2012年美國6個聯(lián)邦政府部門宣布投入2億多美元啟動“大數(shù)據(jù)發(fā)展研究計劃”,這預(yù)示著針對大數(shù)據(jù)的應(yīng)用開發(fā)已經(jīng)實實在在成為國家戰(zhàn)略,至少也是眾多IT公司新的發(fā)展機會。
簡單理解,大數(shù)據(jù)好像就是大量數(shù)據(jù),但大量數(shù)據(jù)不一定就算是大數(shù)據(jù)了。傳統(tǒng)數(shù)據(jù)的概念只是“數(shù)字”,產(chǎn)生數(shù)據(jù)的方式也比較單一,手工錄入的數(shù)據(jù)占了大部分的數(shù)據(jù)量。大數(shù)據(jù)時代,人們發(fā)送的每一條短信、微博,監(jiān)視器搜集到的聲音、視頻、圖像、影像、地理位置等都構(gòu)成了大數(shù)據(jù)的來源。在一個企業(yè)內(nèi)部,大數(shù)據(jù)來自企業(yè)生態(tài)鏈的各個環(huán)節(jié),可以來自企業(yè)內(nèi)部的管理過程、生產(chǎn)過程,也可以來自外部,包括供應(yīng)商、社交媒體、網(wǎng)絡(luò),以及為支持研發(fā)、生產(chǎn)、銷售而購買或建立的數(shù)據(jù)庫。
大數(shù)據(jù)的特征是數(shù)據(jù)量巨大、數(shù)據(jù)種類繁多、非結(jié)構(gòu)化、非標準化數(shù)據(jù)普遍。大數(shù)據(jù)并不因為其數(shù)據(jù)量巨大而有真正價值,大數(shù)據(jù)的真正價值在于數(shù)據(jù)的交叉復(fù)用和數(shù)據(jù)共享。沒有經(jīng)過計算的數(shù)據(jù)會使很多數(shù)據(jù)淪為沉默數(shù)據(jù)或者有應(yīng)用前景的非“活化”數(shù)據(jù),也就是說,雖然數(shù)據(jù)都存儲了,數(shù)據(jù)信息都存在了,但還沒有真正挖掘出數(shù)據(jù)中的巨大價值。
從大數(shù)據(jù)特征上看,大數(shù)據(jù)可分成大數(shù)據(jù)技術(shù)、大數(shù)據(jù)工程、大數(shù)據(jù)科學(xué)和大數(shù)據(jù)應(yīng)用四個方面。目前人們談?wù)撟疃嗟氖谴髷?shù)據(jù)技術(shù)和大數(shù)據(jù)應(yīng)用。簡單來說,從各種各樣類型的數(shù)據(jù)中,通過技術(shù)手段,快速獲得有價值信息的能力就是大數(shù)據(jù)技術(shù);對大數(shù)據(jù)進行系統(tǒng)的建設(shè)規(guī)劃、統(tǒng)籌管理、運營安排等就是大數(shù)據(jù)工程;在大數(shù)據(jù)發(fā)展研究過程中探討其發(fā)展規(guī)律、研究其與社會發(fā)展變化的關(guān)系及其自身發(fā)展內(nèi)在關(guān)聯(lián)等活動我認為就是大數(shù)據(jù)科學(xué)的范疇;如何將大數(shù)據(jù)技術(shù)成果和技術(shù)用于生產(chǎn)運營、企業(yè)發(fā)展、社會管理及各種可能的商業(yè)應(yīng)用等屬于大數(shù)據(jù)應(yīng)用范疇。
今天,如何有效地利用大數(shù)據(jù),科學(xué)地組織管理大數(shù)據(jù),務(wù)實地使用大數(shù)據(jù)提供商業(yè)解決方案,通過大數(shù)據(jù)應(yīng)用改進社會管理系統(tǒng),已經(jīng)不是單純的IT技術(shù)問題,而是與企業(yè)未來發(fā)展、社會組織管理息息相關(guān)的關(guān)鍵性問題。大數(shù)據(jù)時代已經(jīng)到來!大數(shù)據(jù)正在成為IT業(yè)界的焦點話題,也會迅速成為政府有效的管理手段,會迅速提高政府的服務(wù)水平,但前提是我們要掌握大數(shù)據(jù),用好大數(shù)據(jù)。
發(fā)展大數(shù)據(jù)需要一步一步用適合“自己身板”的節(jié)奏走,步子大了或者快了會接不上氣,步子小了慢了會扯后腿?,F(xiàn)在,只有做好準備,卯足氣力,敞開胸懷主動去迎接大數(shù)據(jù)的挑戰(zhàn)和機遇。