BAT的大數(shù)據(jù)行動
文/王怡文,武漢市第六中學高三班
本文研究分析了阿里巴巴、百度、騰訊三大公司在大數(shù)據(jù)方面的技術(shù)特點、發(fā)展重點和商業(yè)應用領(lǐng)域等。
大數(shù)據(jù);技術(shù);應用
大數(shù)據(jù)(big data),又稱海量資料,是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。BAT是中國三大互聯(lián)網(wǎng)公司百度公司(Bai du)、阿里巴巴集團(Alibaba)、騰訊公司(Tencent)的英文首字母縮寫。近年來,BAT對大數(shù)據(jù)表現(xiàn)出超常規(guī)的激情。
阿里巴巴董事局主席馬云認為:“第一次工業(yè)革命能源是煤,誕生商業(yè)模式是工廠。第二次工業(yè)革命誕生主要能源是石油,誕生的行為是公司。這一切皆是創(chuàng)新,數(shù)據(jù)將成為主要的能源,如果離開了數(shù)據(jù),任何組織的創(chuàng)新都基本上是空殼。如果沒有數(shù)據(jù),如果不對未來進行準備,我覺得災難會是非常之大的?!彼?,馬云認為數(shù)據(jù)是新的工業(yè)革命的能源;并認為“人類正從IT時代走向DT(data technology)時代”,云計算和大數(shù)據(jù)是阿里巴巴的未來。
而百度公司創(chuàng)始人李彥宏則提出不太一樣的觀點,認為“數(shù)據(jù)不是根本,數(shù)據(jù)有點像新時代的能源,像燃料,推動時代進步的是技術(shù),是創(chuàng)新,不是這些資源?!辈⑶疫€舉例,說工業(yè)時代煤像數(shù)據(jù)一樣是原料,但煤的重要性肯定不如蒸汽機。他認為,人工智能時代最寶貴的也不是數(shù)據(jù),是因為數(shù)據(jù)帶來的技術(shù)的創(chuàng)新?!?/p>
騰訊董事會主席兼CEO馬化騰則是這么認為的“大數(shù)據(jù)的發(fā)展,更重要的一個要素是場景,或者我們稱之為戰(zhàn)場,再通俗一點就是市場,我覺得這是最關(guān)鍵的”。馬化騰表示,有了應用場景,有了市場,數(shù)據(jù)自然會產(chǎn)生,也會驅(qū)動技術(shù)發(fā)展,人才也會隨之而來。所以,馬化騰給我們的啟發(fā)是,大數(shù)據(jù)和人工智能的發(fā)展規(guī)劃,要從場景出發(fā)。
三位創(chuàng)始人對大數(shù)據(jù)的看法角度不盡相同,但同樣認為大數(shù)據(jù)對我們未來的生活會造成不可估量的影響。而爭做大數(shù)據(jù)時代的領(lǐng)跑者,也成為了當前互聯(lián)網(wǎng)公司迫在眉睫的首要任務。
阿里巴巴通過淘寶、天貓、支付寶等平臺經(jīng)過長期積累,逐漸開啟了日增長數(shù)據(jù)量百T的嶄新時代。大量來自買賣雙方的搜索與交易信息組成了阿里的海量數(shù)據(jù)庫,從而構(gòu)建了阿里數(shù)據(jù)平臺。這些極具價值的商業(yè)數(shù)據(jù)信息為阿里轉(zhuǎn)型為社會的基礎(chǔ)服務提供商、數(shù)據(jù)服務商奠定了堅實的基礎(chǔ)。阿里巴巴的大數(shù)據(jù)技術(shù)發(fā)展始于20 03年。2003年從Oracle單節(jié)點時期開始;2004年公司成立數(shù)據(jù)倉庫部門,搭建OLAP平臺在線分析處理業(yè)務數(shù)據(jù),通過BIEE的報表分析工具提供業(yè)務數(shù)據(jù)、決策數(shù)據(jù);2007年開始搭建對內(nèi)數(shù)據(jù)平臺,從DAC平臺到阿里數(shù)據(jù)平臺的不斷迭代升級,承載各業(yè)務線和行業(yè)的報表;到2009年時,基于oracle產(chǎn)品構(gòu)建的全球領(lǐng)先的RAC集群達到頂峰成為國內(nèi)每天處理量最大、最忙的數(shù)據(jù)倉庫,同年淘寶第一個分布式計算系統(tǒng)Hadhoop集群,規(guī)模為300臺;2010年,數(shù)據(jù)大爆炸的一年,RAC集群已經(jīng)不能滿足業(yè)務發(fā)展速度,從RAC遷移到了Hadoop,阿里自主開發(fā)了大規(guī)模分布式計算機系統(tǒng);2011年,阿里巴巴對外以生意參謀為載體,基于阿里巴巴集團數(shù)據(jù)公共層建設(shè)、數(shù)據(jù)產(chǎn)品整合契機推出統(tǒng)一的數(shù)據(jù)產(chǎn)品平臺——生意參謀,通過數(shù)據(jù)披露、分析、診斷、建議、優(yōu)化、預測幫助商家推進數(shù)據(jù)化運營;2012年,阿里自主研發(fā)的離線數(shù)據(jù)處理平臺,支持海量數(shù)據(jù)存儲和計算,可以提供海量數(shù)據(jù)倉庫的解決方案和針對大數(shù)據(jù)的分析建模服務;到2016年時,集團中臺事業(yè)群成立,啟動全域數(shù)據(jù)建設(shè),公共層onedata產(chǎn)品升級,全方位支持全域數(shù)據(jù)建設(shè),并陸續(xù)啟動優(yōu)土、阿里媽媽等全域數(shù)據(jù)建設(shè)。
百度大數(shù)據(jù)最重要的來源是通過“爬蟲”搜集的 100 多個國家的近萬億網(wǎng)頁數(shù)據(jù),數(shù)據(jù)量是在 EB 級的規(guī)模。百度的數(shù)據(jù)非常多樣化,其收集的數(shù)據(jù)既有非結(jié)構(gòu)化的或者半結(jié)構(gòu)化的數(shù)據(jù),包括網(wǎng)頁數(shù)據(jù)、視頻和圖片等數(shù)據(jù),也有結(jié)構(gòu)化的數(shù)據(jù),如用戶的點擊行為數(shù)據(jù)、廣告客戶的付費行為數(shù)據(jù)等。
百度大數(shù)據(jù)主要服務三類人群:一類是互聯(lián)網(wǎng)網(wǎng)民,通過大數(shù)據(jù)和自然語言處理技術(shù)讓網(wǎng)民的搜索更加準確;第二類是廣告主,通過大數(shù)據(jù)讓廣告主的廣告和搜索關(guān)鍵詞的匹配度更高,或者和網(wǎng)民正在看的網(wǎng)頁內(nèi)容匹配度更高;第三類是,也是在重點推進的百度大數(shù)據(jù)引擎,重點是服務傳統(tǒng)行業(yè)擁有數(shù)據(jù)的企業(yè)。
百度從2007年開始引進Hadoop 0.15.1,隨后快速發(fā)展,2011年百度的MR單集群規(guī)模達到5000臺,到2013年已經(jīng)多達1.3萬臺,這也是截止到目前為止全世界最大的單集群。2015年,新Shuffle技術(shù)完成全面上線,Hadoop默認Shuffle實現(xiàn)為基于磁盤Pull模式,計算過程顯式分成Map、Shuffle、Reduce過程;Baidu研發(fā)的新Shuffle采用內(nèi)存流式Push模式,Map端完成部分記錄處理后直接從內(nèi)存中將計算結(jié)果推送給下游。
百度大數(shù)據(jù)引擎的作用可以從兩方面體現(xiàn):1.對于政府機構(gòu):如交通部門有車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、路網(wǎng)監(jiān)控、船聯(lián)網(wǎng)、碼頭車站監(jiān)控等地方的大數(shù)據(jù),如果這些數(shù)據(jù)與百度的搜索記錄、全網(wǎng)數(shù)據(jù)、L BS數(shù)據(jù)結(jié)合,在利用百度大數(shù)據(jù)引擎的大數(shù)據(jù)能力,則可以實現(xiàn)智能路徑規(guī)劃和運力管理;衛(wèi)生部門擁有流感法定報告數(shù)據(jù)、全國流感樣病例哨點監(jiān)測和病原學監(jiān)測數(shù)據(jù),如果和百度的搜索記錄及全網(wǎng)數(shù)據(jù)結(jié)合,便可進行流感預測、疫苗接種指導。2.對于企業(yè):很多企業(yè)也擁有海量大數(shù)據(jù),不過很多企業(yè)的大數(shù)據(jù)處理和挖掘能力比較弱,如果應用百度大數(shù)據(jù)引擎,則可以對海量數(shù)據(jù)進行可靠低成本的存儲,進行智能化的由淺人深的價值挖掘。
2009年騰訊搭建了第一個Hadoop集群,2010年TDW v0.1版本發(fā)布,次年智能廣告上線,實現(xiàn)離線數(shù)據(jù)和實時查詢。2012年進入發(fā)展期,TPR全實時流程上線,到2013年TDBank上線,同年Oracle全部下線。從2014年開始發(fā)展進入穩(wěn)定期,2014年,JStorm TRC上線,TDW開始節(jié)源,Gaia單集群量達到8800臺,同年底發(fā)布Docker on Gaia。2015年,騰訊Spark集群量達到全球第一。2016年,Angle上線,同時大數(shù)據(jù)套件產(chǎn)品通過數(shù)據(jù)中心聯(lián)盟大數(shù)據(jù)基礎(chǔ)能力認證,成為第一批獲得認證的互聯(lián)網(wǎng)企業(yè),數(shù)據(jù)平臺在Sort Benchma rk排序獲得第一名。
騰訊大數(shù)據(jù)平臺有如下核心模塊:TDW、TRC、TDBank和Gai a。簡單來說,TDW用來做批量的離線計算,TRC負責做流式的實時計算,TDBank則作為統(tǒng)一的數(shù)據(jù)采集入口,而底層的Gaia則負責整個集群的資源調(diào)度和管理。
TDW是海量數(shù)據(jù)處理平臺的核心部件,主要用于對騰訊內(nèi)部提供數(shù)據(jù)挖掘、產(chǎn)品報表、經(jīng)營分析等離線海量數(shù)據(jù)分析服務。它是基于 Hadoop、Hive、PostreSQL 之上的大數(shù)據(jù)平臺,具有查詢引擎、計算引擎、存儲引擎的分層結(jié)構(gòu),可根據(jù)用戶需求進行深度定制。當前,TDW正在向著實時化發(fā)展,通過引入HBase提供了千億級實時查詢服務,并開始投入Spark研發(fā)為大數(shù)據(jù)分析加速。
TDBank是數(shù)據(jù)實時收集與分發(fā)平臺。構(gòu)建數(shù)據(jù)源和數(shù)據(jù)處理系統(tǒng)間的橋梁,將數(shù)據(jù)處理系統(tǒng)同數(shù)據(jù)源解耦,為離線計算TDW和在線計算TRC平臺提供數(shù)據(jù)支持。針對不同應用場景,TDBank提供數(shù)據(jù)的主動訂閱模式,以及不同的數(shù)據(jù)分發(fā)支持(分發(fā)到TDW數(shù)據(jù)倉庫,文件,DB,HBase,Socket等)。
TRC騰訊實時計算平臺,專門為對時間延敏感的業(yè)務提供海量數(shù)據(jù)實時處理服務。TRC是基于開源的Storm深度定制的流式處理引擎,用Java重寫了Storm的核心代碼。為了解決了資源利用率和集群規(guī)模的問題,重構(gòu)了底層調(diào)度模塊,實現(xiàn)了任務級別的權(quán)限管理、資源分配、資源隔離,通過和Gaia這樣的資源管理框架相結(jié)合,做到了根據(jù)線上業(yè)務實際利用資源的狀況,動態(tài)擴容&縮容,單集群輕松超過1000臺規(guī)模。
Gaia:統(tǒng)一資源調(diào)度平臺。它能夠讓應用開發(fā)者像使用一臺超級計算機一樣使用整個集群,極大地簡化了開發(fā)者的資源管理邏輯。Gaia提供高并發(fā)任務調(diào)度和資源管理,實現(xiàn)集群資源共享,具有很高的可伸縮性和可靠性,它不僅支持MR等離線業(yè)務,還可以支持實時計算,甚至在線service業(yè)務。
阿里巴巴大數(shù)據(jù)商業(yè)應用的核心就是通過DT,以激活生產(chǎn)力為目的,點燃整個數(shù)據(jù)和激發(fā)整個數(shù)據(jù)的力量,被社會所用,被銷售所用,為制造業(yè)所用,為消費者信用所用。讓阿里巴巴的數(shù)據(jù)以及數(shù)據(jù)技術(shù)工具成為中國新商業(yè)的基礎(chǔ)設(shè)施。阿里巴巴大數(shù)據(jù)未來將由“基于云計算的數(shù)據(jù)開放+大數(shù)據(jù)應用”組成:
(1)基于云計算的數(shù)據(jù)開放。云計算使中小企業(yè)可以在阿里云上獲得數(shù)據(jù)存儲、數(shù)據(jù)處理服務,也可以構(gòu)建自己的數(shù)據(jù)應用。云計算是數(shù)據(jù)開放的基礎(chǔ),云計算可以給到全球的數(shù)據(jù)開發(fā)者一個數(shù)據(jù)的工作平臺,阿里分布式的存儲平臺和在這個平臺上的算法工具,可以更好的為數(shù)據(jù)開發(fā)者所用。
(2)在大數(shù)據(jù)應用上馬云已經(jīng)在整個數(shù)據(jù)應用上確定了兩個方案:
第一從IT到DT(數(shù)據(jù)技術(shù)),阿里巴巴的數(shù)據(jù)資產(chǎn)是以電商為主,其中,淘寶和天貓每天會產(chǎn)生豐富多樣的數(shù)據(jù),阿里巴巴已經(jīng)沉淀了包括交易、金融、生活服務等多種類型的數(shù)據(jù),這些數(shù)據(jù)能夠幫助阿里巴巴進行數(shù)據(jù)化運營。
另外一個最為重要的應用是金融領(lǐng)域-小微金融。在小微金融企業(yè)融資領(lǐng)域。阿里巳經(jīng)通過其電商數(shù)據(jù)中的交易、信用、SNS等多種數(shù)據(jù)來決定是否可以發(fā)放貸款以及放貸的額度。
第二是讓阿里巴巴的數(shù)據(jù)、讓阿里巴巴的工具能夠成為中國商業(yè)的基礎(chǔ)設(shè)施。阿里巴巴巳經(jīng)開始在轉(zhuǎn)型,阿里將由自己直接面對消費者變成支持網(wǎng)商面對消費者,阿里會根據(jù)其已有的運營和數(shù)據(jù)經(jīng)驗,開發(fā)更多的工具,幫助網(wǎng)商成長,讓網(wǎng)商們更懂得用最好的工具、服務去服務好消費者。
因此,阿里巴巴目前的數(shù)據(jù)產(chǎn)品主要分為三個板塊:1.生意參謀,基于全渠道數(shù)據(jù)融合、全鏈路數(shù)據(jù)產(chǎn)品集成,為商家提供數(shù)據(jù)披露、分析、診斷、建議、優(yōu)化、預測等一站式數(shù)據(jù)產(chǎn)品服務。目前,服務的商家已經(jīng)超過2000萬,月服務商家超過600萬;在月成交額30萬元以上的商家中,逾90%在使用生意參謀。2.孔明燈,先的第三方云BI工具,以“讓業(yè)務更清晰,讓決策更高效”為愿景,提供一站式多維分析、數(shù)據(jù)建模、可視化應用、智能建站等工具套件;幫助企業(yè)快速有效進行數(shù)據(jù)的可視化及聯(lián)合(多維)分析,完成數(shù)據(jù)決策。3.阿里指數(shù),以阿里電商數(shù)據(jù)為核心,面向媒體、市場研究員以及社會大眾提供的社會化大數(shù)據(jù)展示平臺;提供地域、行業(yè)等角度指數(shù)化的數(shù)據(jù)分析,作為市場及行業(yè)研究的參考、社會熱點的洞察工具。
百度因為其咬定數(shù)據(jù)不放松行業(yè)和技術(shù)優(yōu)勢,在大數(shù)據(jù)商業(yè)應用方面,主要是通過對海量數(shù)據(jù)進行深加工,力圖打造成覆蓋社會各領(lǐng)域和社會生活各方面的智能專家。
百度大數(shù)據(jù)引擎代表了互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)服務能力開放和合作的趨勢,百度大數(shù)據(jù)引擎由以下幾個方面構(gòu)成。
開放云——百度的大規(guī)模分布式計算和超大規(guī)模存儲云,開放云大數(shù)據(jù)開放的是基礎(chǔ)設(shè)施和硬件能力。百度是全球首家大規(guī)模商用 ARM 服務器的公司,而ARM 架構(gòu)的特征是能耗小和存儲密度大,同時百度還是首家將 GPU(圖形處理器)應用在機器學習領(lǐng)域的公司,實現(xiàn)了能耗節(jié)省的目的。百度開放云生命科學解決方案可以幫助生物信息領(lǐng)域用戶存儲海量的數(shù)據(jù),并調(diào)度強大的計算資源來進行基因組、蛋白質(zhì)組等大數(shù)據(jù)分析。此外,百度自行研發(fā)的基因大數(shù)據(jù)芯片可以使運算速度得到數(shù)倍的提升、IT成本實現(xiàn)數(shù)量級的下降,幫助研究生命活動規(guī)律,促進醫(yī)療健康行業(yè)發(fā)展。
數(shù)據(jù)市場——“數(shù)據(jù)市場”是“百度數(shù)智平臺(di.baidu.com)”旗下的數(shù)據(jù)產(chǎn)品售賣平臺?!鞍俣葦?shù)智平臺”匯集百度大數(shù)據(jù)核心能力,運用大規(guī)模機器學習和數(shù)據(jù)建模等前沿技術(shù),對海量數(shù)據(jù)進行挖掘、處理和分析,打造易用產(chǎn)品和成熟行業(yè)解決方案,致力于為千萬家企業(yè)客戶提供專業(yè)、穩(wěn)定的數(shù)據(jù)智能服務。數(shù)據(jù)市場為百度將海量數(shù)據(jù)組織起來的軟件能力,與數(shù)據(jù)庫軟件的作用類似,不同的是數(shù)據(jù)工廠是被用作處理 TB級甚至更大的數(shù)據(jù)。百度數(shù)據(jù)市場支持超大規(guī)模異構(gòu)數(shù)據(jù)查詢,支持 SQL-like 以及更復雜的查詢語句,支持各種查詢業(yè)務場景。
百度大腦——百度大腦將百度此前在人工智能方面的能力開放出來,主要是大規(guī)模機器學習能力和深度學習能力。此前它們被應用在語音、圖像、文本識別以及自然語言和語義理解方面,并通過百度 Inside 等平臺開放給智能硬件。這些能力將被用來對大數(shù)據(jù)進行智能化的分析、學習、處理、利用,并對外開放。
百度天算平臺——天算平臺將百度的大數(shù)據(jù)、人工智能全面進行開放,相關(guān)行業(yè)用戶可以使用這些技術(shù)簡單的搭建起自己的大數(shù)據(jù)和人工智能平臺,同時天算平臺針對幾個行業(yè)推出了定制化的方案,百度希望通過這些行業(yè)解決方案,相關(guān)的用戶可以更容易地搭建自己的智能系統(tǒng),更快地享受到大數(shù)據(jù)和人工智能給他們帶來的好處,為日志分析、數(shù)字營銷、生命科學、輿情等行業(yè)提供了定制的解決方案。
騰訊大數(shù)據(jù)從數(shù)據(jù)應用的不同環(huán)節(jié)可以分為三個層面,包括數(shù)據(jù)分析、數(shù)據(jù)工具、數(shù)據(jù)平臺。
(1)數(shù)據(jù)分析層有四個產(chǎn)品:騰訊移動分析 MTA,專業(yè)的移動應用數(shù)據(jù)分析能力,提供實時數(shù)據(jù)統(tǒng)計分析服務,監(jiān)控版本質(zhì)量、渠道狀況、用戶畫像屬性及用戶細分行為,通過數(shù)據(jù)可視化展現(xiàn),協(xié)助產(chǎn)品運營決策;網(wǎng)站數(shù)據(jù)分析 TA,統(tǒng)計分析展示網(wǎng)站的訪問情況、來源情況、訪問路徑等,幫助站長清晰地了解訪客的行為、屬性等,以方便站長進行有效地網(wǎng)站運營,同時為網(wǎng)站的決策提供更加有力的數(shù)據(jù)支持;HTML5數(shù)據(jù)分析,專業(yè)的移動應用數(shù)據(jù)分析能力,提供實時數(shù)據(jù)統(tǒng)計分析服務,監(jiān)控版本質(zhì)量、渠道狀況、用戶畫像屬性及用戶細分行為,通過數(shù)據(jù)可視化展現(xiàn),協(xié)助產(chǎn)品運營決策;微信小程序分析,支持小程序關(guān)鍵指標,如訪問用戶、打開次數(shù)、使用時長等的實時統(tǒng)計分析,同時提供自定義事件打點分析,完美補充微信的基礎(chǔ)統(tǒng)計能力。
(2)數(shù)據(jù)工具層面兩個產(chǎn)品:騰訊移動推送-信鴿,專業(yè)移動A pp推送平臺,支持百億級的通知/消息推送,將相關(guān)信息及時送達精準定向的用戶,并與用戶持續(xù)友好互動。大幅提升用戶活躍度、留存率;云數(shù)據(jù)庫CDB for PostgreSQL,能夠在云端輕松設(shè)置、操作和擴展目前功能最強大的開源數(shù)據(jù)庫 PostgreSQL,騰訊云將負責絕大部分處理復雜而耗時的管理工作,如 PostgreSQL 軟件安裝、存儲管理、高可用復制、以及為災難恢復而進行的數(shù)據(jù)備份,讓您更專注于業(yè)務程序開發(fā)。
(3)數(shù)據(jù)平臺層面兩個產(chǎn)品:大數(shù)據(jù)處理套件TBDS,是基于騰訊多年海量數(shù)據(jù)處理經(jīng)驗,對外提供的可靠、安全、易用的大數(shù)據(jù)處理平臺??梢园葱璨渴鸫髷?shù)據(jù)處理服務實現(xiàn)數(shù)據(jù)處理需求,例如報表展示,數(shù)據(jù)提取、分析,客戶畫像等大數(shù)據(jù)應用;騰訊推薦,為各種大小型網(wǎng)站、APP提供推薦服務,擁有8億月活躍用戶,千億社交關(guān)系鏈,囊括了廣告、電商、新聞、游戲等眾多領(lǐng)域,千萬級維度深度刻畫每一位用戶,深度挖掘用戶屬性,同時SDK支持多種平臺,實現(xiàn)跨屏推薦。
不只是BAT的大數(shù)據(jù)在行動。其實IBM、谷歌,亞馬遜,F(xiàn)aceb ook等一大批公司在大數(shù)據(jù)技術(shù)開發(fā)和大數(shù)據(jù)商業(yè)應用方面都涉足很深。早在大數(shù)據(jù)概念進入媒體視野之前,IBM就提出“智慧地球”的概念,其核心是把“智慧”嵌入系統(tǒng)和流程之中,使服務的交付、產(chǎn)品開發(fā)、制造、采購和銷售得以實現(xiàn),通過其建立的8個全球分析解決方案中心網(wǎng)絡,使億萬人生活和工作的方式變得更加智慧。谷歌所提供的大數(shù)據(jù)分析智能主要是應用客戶的情緒分析、交易上風險、產(chǎn)品推薦?;贑olossus,谷歌為不但為用戶提供了可以計算、存儲以及應用的云服務。計算服務包括了計算的引擎以及應用的APP引擎;存儲服務是利用了云存儲、云SQL以及云數(shù)據(jù)的存儲、永久磁盤等服務;云應用服務包括BigQuery、云終端(Cloud Endpoint s)、緩沖、隊列等。Facebook收集、存儲和分析用戶數(shù)據(jù),他們還會通過下列方式確定或影響用戶的行為:(1)跟蹤Cookies來跟蹤用戶瀏覽Web的行為;(2)面部識別:Facebook可以借助用戶分享的圖像數(shù)據(jù)在Web和其他Facebook用戶資料中跟蹤用戶;(3)分析用戶喜好。作為全球知名的大數(shù)據(jù)產(chǎn)品服務商之一的亞馬遜則通過大數(shù)據(jù)來實現(xiàn)客戶的精準營銷。國內(nèi)方面,華為大數(shù)據(jù)主要主要針對廣告營銷、電商、車聯(lián)網(wǎng)等大數(shù)據(jù)應用場景的云計算大數(shù)據(jù)方案,幫助企業(yè)用戶構(gòu)建大數(shù)據(jù)平臺,解決企業(yè)的海量數(shù)據(jù)存儲和分析需求。小米進入了智能設(shè)備領(lǐng)域后,充分感受到了大數(shù)據(jù)的浪潮撲面而來, 投入10億美金開始做翱義云服務計劃,在這個計劃里面,小米的重心放在應用層,金山軟件的重心放在開放云服務,并預計云服務收入會快速增長。國內(nèi)三大通訊運營商和中國銀聯(lián)等數(shù)據(jù)優(yōu)勢企業(yè)在大數(shù)據(jù)技術(shù)和商業(yè)應用方面開啟了征程。
綜上所述,大數(shù)據(jù)技術(shù)為人類全面深刻地認識社會、了解自身提供了一種全新的方式和視角;大數(shù)據(jù)時代,人們將面臨更多未知的挑戰(zhàn),百舸爭流,“一切皆有可能”。正如馬云所說的一樣,“我們要感知大數(shù)據(jù)、思考大數(shù)據(jù),我覺得,這是我們共同的未來?!?/p>
[1]車凱龍,鐵茜.國內(nèi)外社交網(wǎng)絡(SNS)大數(shù)據(jù)應用比較研究——以Facebook和騰訊為例[J].圖書館學研究,2014,(18):18-23.
[2]陳園園.Facebook:基于SNS的大數(shù)據(jù)公司[J].互聯(lián)網(wǎng)周刊,2012,(24):60-61.
[3]傅志華.BAT三巨頭“玩轉(zhuǎn)”大數(shù)據(jù)[J].中國戰(zhàn)略新興產(chǎn)業(yè),20 15,(01):78-80.
[4]趙雪峰.基于互聯(lián)網(wǎng)企業(yè)的大數(shù)據(jù)分析系統(tǒng)研究[D].成都理工大學,2016.
[5]范卉青.搶灘大數(shù)據(jù)發(fā)展 互聯(lián)網(wǎng)巨頭各有所愛[J].通信世界,2016,(15):13.
王怡文(2000.4—)湖北省武漢市第六中學高三班,研究方向:社會經(jīng)濟熱點問題分析與研究。