大數(shù)據(jù)是什么?其實很簡單,大數(shù)據(jù)其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產(chǎn)生的數(shù)據(jù),在大數(shù)據(jù)時代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價值。大數(shù)據(jù)有4個特點,分別為:大量(Volume)、多樣(Variety)、高速(Velocity)、價值(Value),一般我們稱之為4V。
1.大量。大數(shù)據(jù)的特征首先就體現(xiàn)為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。隨著信息技術的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(微博、推特、臉書)、移動網(wǎng)絡、各種智能工具,服務工具等,都成為數(shù)據(jù)的來源。
2.多樣。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進行分析,從而進一步推薦用戶喜歡的東西。
3.高速。大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。大數(shù)據(jù)對處理速度有非常嚴格的要求,服務器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
4.價值。這也是大數(shù)據(jù)的核心特征。大數(shù)據(jù)最大的價值在于通過從大量不相關的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預測分析有價值的數(shù)據(jù),并通過機器學習方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運用于農(nóng)業(yè)、金融、醫(yī)療等各個領域。