在本文中,作者整理了在中國境內(nèi)活躍的大數(shù)據(jù)領(lǐng)域最具影響力的企業(yè),它們有的是計算機或者互聯(lián)網(wǎng)領(lǐng)域的巨頭,有的則是剛剛創(chuàng)辦不久的初創(chuàng)企業(yè)。但它們有一個共同點,那就是它們都看到了大數(shù)據(jù)帶來的大機會,并毫不猶豫地挺進了這個領(lǐng)域。
首先來盤點一下那些提供大數(shù)據(jù)工具的老牌廠商,看看他們是如何利用自身優(yōu)勢地位沖擊大數(shù)據(jù)領(lǐng)域,并將新產(chǎn)品及新方案推廣到新一輪技術(shù)浪潮當中?
大數(shù)據(jù)是比云計算還要新興的一個術(shù)語,但是從(表一)中列舉的一些公司不難發(fā)現(xiàn),在業(yè)內(nèi),大數(shù)據(jù)被科技企業(yè)看作是云計算之后的另一個巨大商機,包括IBM、微軟、谷歌、亞馬遜等一大批知名企業(yè)紛紛掘金這一市場;另外,很多初創(chuàng)企業(yè)也開始加入到大數(shù)據(jù)的淘金隊伍中,如Cloudera、Clustrix等。但縱觀國內(nèi)大數(shù)據(jù)服務提供商市場,大數(shù)據(jù)這一概念,對國內(nèi)企業(yè)來說或許還稍顯陌生,在最具影響力的前30家企業(yè)中,國內(nèi)企業(yè)幾乎還是一片空白,相對來說,國內(nèi)大數(shù)據(jù)起步較晚,但依舊有些企業(yè)不遺余力的投入大數(shù)據(jù)這片藍海,并且發(fā)展態(tài)勢良好,下面就來盤點下大數(shù)據(jù)領(lǐng)域國內(nèi)的主力陣營吧?。ㄒ姳矶?/p>
國內(nèi)做大數(shù)據(jù)的公司依舊分為兩類:一類是現(xiàn)在已經(jīng)有獲取大數(shù)據(jù)能力的公司,如百度、騰訊、阿里巴巴等互聯(lián)網(wǎng)巨頭以及華為、浪潮、中興等國內(nèi)領(lǐng)軍企業(yè),涵蓋了數(shù)據(jù)采集,數(shù)據(jù)存儲,數(shù)據(jù)分析,數(shù)據(jù)可視化以及數(shù)據(jù)安全等領(lǐng)域;另一類則是初創(chuàng)的大數(shù)據(jù)公司,他們依賴于大數(shù)據(jù)工具,針對市場需求,為市場帶來創(chuàng)新方案并推動技術(shù)發(fā)展。其中大部分的大數(shù)據(jù)應用還是需要第三方公司提供服務。
越來越多的應用涉及到大數(shù)據(jù),這些大數(shù)據(jù)的屬性,包括數(shù)量,速度,多樣性等等都是呈現(xiàn)了大數(shù)據(jù)不斷增長的復雜性,所以,大數(shù)據(jù)的分析方法在大數(shù)據(jù)領(lǐng)域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。基于此,對大數(shù)據(jù)進行分析的產(chǎn)品有哪些比較倍受青睞呢?(見表三)
而在這里面,最耀眼的明星當屬Hadoop,Hadoop已被公認為是新一代的大數(shù)據(jù)處理平臺,EMC、IBM、Informatica、Microsoft以及Oracle都紛紛投入了Hadoop的懷抱。對于大數(shù)據(jù)來說,最重要的還是對于數(shù)據(jù)的分析,從里面尋找有價值的數(shù)據(jù)幫助企業(yè)作出更好的商業(yè)決策。下面,我們就來看看以下十大企業(yè)級大數(shù)據(jù)分析利器吧。(見表四)
隨著數(shù)據(jù)爆炸式的增長,我們正被各種數(shù)據(jù)包圍著。正確利用大數(shù)據(jù)將給人們帶來極大的便利,但與此同時也給傳統(tǒng)的數(shù)據(jù)分析帶來了技術(shù)的挑戰(zhàn),雖然我們已經(jīng)進入大數(shù)據(jù)時代,但是“大數(shù)據(jù)”技術(shù)還仍處于起步階段,進一步地開發(fā)以完善大數(shù)據(jù)分析技術(shù)仍舊是大數(shù)據(jù)領(lǐng)域的熱點。
在當前的互聯(lián)網(wǎng)領(lǐng)域,大數(shù)據(jù)的應用已經(jīng)十分廣泛,尤其以企業(yè)為主,企業(yè)成為大數(shù)據(jù)應用的主體。大數(shù)據(jù)真能改變企業(yè)的運作方式嗎?答案毋庸置疑是肯定的。隨著企業(yè)開始利用大數(shù)據(jù),我們每天都會看到大數(shù)據(jù)新的奇妙的應用,幫助人們真正從中獲益。大數(shù)據(jù)的應用已廣泛深入我們生活的方方面面,涵蓋醫(yī)療、交通、金融、教育、體育、零售等各行各業(yè)。
大數(shù)據(jù)特色介紹
在IBM圍繞大數(shù)據(jù)開發(fā)出的產(chǎn)品中,DB2、Informix與InfoSphere數(shù)據(jù)庫平臺、Cognos與SPSS分析應用可謂最為知名。近期發(fā)布的POWER8是IBM第一個面向大數(shù)據(jù)設(shè)計的系統(tǒng)。
英特爾Hadoop發(fā)行版最大特色就是憑借英特爾硬件加速獲取高性能和高安全性。但英特爾近來宣布停止發(fā)行自己的Hadoop版本,轉(zhuǎn)而支持Hadoop發(fā)行商Cloudera,并成為Cloudera最大的股東。
在捕獲大數(shù)據(jù)的環(huán)節(jié): 提供了Oracle數(shù)據(jù)庫和Oracle NoSQL數(shù)據(jù)庫;在大數(shù)據(jù)分析階段:提供了Oracle Exadata數(shù)據(jù)庫云服務器、Oracle Exalytics商務智能云服務器、Oracle數(shù)據(jù)倉庫和Oracle高級分析等解決方案。
HP提供與大數(shù)據(jù)相關(guān)的硬件、軟件以及服務,其最為知名的當數(shù)Vertica分析平臺。
Teradata憑借自家硬件平臺、數(shù)據(jù)庫以及分析軟件而聲名遠播。它同時針對零售及運輸行業(yè)推出了專門的分析工具。Teradata Aster大數(shù)據(jù)分析平臺,客戶無需部署,就可以受益于開源Apache Hadoop。
SAP推出了一系列分析工具,但其中知名度最高的當數(shù)其HANA內(nèi)存數(shù)據(jù)庫。
Amazon歷來以企業(yè)云平臺著稱,但同時也推出了眾多大數(shù)據(jù)產(chǎn)品:如基于Hadoop的Elastic MapReduce、DynamoDB大數(shù)據(jù)數(shù)據(jù)庫以及能夠與Amazon Web Services順利協(xié)作的Redshift規(guī)?;⑿袛?shù)據(jù)倉儲方案。
EMC發(fā)布的Apache Hadoop發(fā)行版Pivotal HD,可以與Greenplum數(shù)據(jù)庫進行整合,而不僅僅是在Hadoop中運行SQL。
富士通的Hadoop內(nèi)存計算一體機平臺可全面提升大數(shù)據(jù)分析計算速度;全新M10小型機平臺打造可插拔的Oracle數(shù)據(jù)庫服務機。
微軟發(fā)布的新一代并行數(shù)據(jù)倉庫一體機SQL Server Parallel Data Warehouse(簡稱PDW),提供了大規(guī)模并行處理并具備靈活線性橫向擴展能力的數(shù)據(jù)倉庫平臺。
谷歌公司推出的大數(shù)據(jù)產(chǎn)品包括BigQuery——一款基于云的大數(shù)據(jù)分析平臺。
為企業(yè)級市場提供大數(shù)據(jù)系統(tǒng)處理的創(chuàng)業(yè)公司 Cloudera,于2008年首次為企業(yè)客戶帶來Apache Hadoop平臺。
戴爾在數(shù)據(jù)分析端有Kitenga軟件,幫助企業(yè)用戶做更深的數(shù)據(jù)挖掘。
SAS的核心競爭力就體現(xiàn)在集群環(huán)境下的運算和算法,是第一家把大量且復雜的精密數(shù)據(jù)分析運算應用到Hadoop集群。
Splunk主要關(guān)注機器數(shù)據(jù)分析業(yè)務,全新版本Splunk Enterprise 6.1為全球化企業(yè)提供任務關(guān)鍵型運維智能。
專注于Apache Hadoop框架,支持跨計算機集群分布式處理大型數(shù)據(jù)集,主要產(chǎn)品為Hortonworks數(shù)據(jù)平臺。
VMware vSphere大數(shù)據(jù)擴展版使得vSphere能夠控制Hadoop部署并幫助企業(yè)用戶簡化大數(shù)據(jù)項目啟動流程。
作為企業(yè)級大數(shù)據(jù)及分布式軟件開發(fā)方案提供商,產(chǎn)品線包括企業(yè)級Hadoop和軟件開發(fā)生命周期管理。
專注于數(shù)據(jù)集成領(lǐng)域Informatica推出的HParser是一種針對Hadoop而優(yōu)化的數(shù)據(jù)轉(zhuǎn)換環(huán)境;還有PowerCenter大數(shù)據(jù)版在減少新技術(shù)風險、降低大數(shù)據(jù)項目成本方面頗具優(yōu)勢。
Red Hat和Hortonworks擴展大數(shù)據(jù)戰(zhàn)略聯(lián)盟,通過緊密整合HDP和開放式混合云技術(shù),為客戶部署下一代大數(shù)據(jù)應用程序。
Pivotal推出的Pivotal大數(shù)據(jù)套件(Pivotal Big Data Suite)整合了Pivotal所有領(lǐng)先的數(shù)據(jù)技術(shù),客戶可以隨時隨地按需使用其中的任何一種技術(shù)。
NetApp的存儲產(chǎn)品 Filer 可提供簡單、快速、可靠、可擴展的數(shù)據(jù)管理解決方案,解決數(shù)據(jù)共享、數(shù)據(jù)保護、數(shù)據(jù)管理等一系列問題。
對tweet、支付、簽到和一些與互聯(lián)網(wǎng)相關(guān)的問題進行了分析,為客戶提供了很好的數(shù)據(jù)分析支持,客戶只需在幾天就能安裝和運行。
Clustrix可以為SQL數(shù)據(jù)庫提供專利數(shù)據(jù)應用方法,幫助人們處理大量的數(shù)據(jù),使SQL數(shù)據(jù)庫無限擴容成為可能。
在收購ParAccel之后,Actian的數(shù)據(jù)庫產(chǎn)品套件包因為引入了大數(shù)據(jù)能力而會變得更加豐富。其分析工具SecureAlert能夠識別犯罪行為,并向執(zhí)法機構(gòu)提供了參考性較高的犯罪預測。
1010data以電子表格的形式為用戶提供大數(shù)據(jù)的處理界面。
parStream是入圍的唯一一家“快數(shù)據(jù)”公司,其產(chǎn)品能夠?qū)崟r分析海量結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。
10Gen最具影響力的得意佳作要數(shù)其開源MongoDB——一款業(yè)界領(lǐng)先的NoSQL數(shù)據(jù)庫。該公司的戰(zhàn)略投資伙伴包括英特爾、紅帽以及In-Q-Tel。
Tableau專注于將數(shù)據(jù)可視化應用在地圖上。
MapR已將一套特殊功能融入其Hadoop發(fā)行版中。例如網(wǎng)絡文件系統(tǒng)(NFS)、災難恢復以及高可用性功能,還有最具代表性的NoSQL數(shù)據(jù)庫M7。
MarkLogic為非結(jié)構(gòu)化數(shù)據(jù)配備了自己的數(shù)據(jù)庫, MarkLogic Server。
Syncsort在高性能數(shù)據(jù)處理、數(shù)據(jù)集成以及數(shù)據(jù)保護與恢復軟件上頗具實力。
NoSQL數(shù)據(jù)庫的初創(chuàng)企業(yè),其商業(yè)模式是與大型企業(yè)合作推廣其旗艦產(chǎn)品Couchbase Server。
Datameer分析解決方案(DAS)是一款面向Hadoop、針對企業(yè)用戶的商業(yè)智能(BI)平臺,可通過JDBC、Hive、HTTP或其他標準,連接到任何數(shù)據(jù)源。
在分析數(shù)據(jù)庫Sybase IQ 15.4中,添加了如MapReduce API、對預測模型語言的支持、集成的Hadoop以及擴展數(shù)據(jù)挖掘算法函數(shù)庫等功能。
大數(shù)據(jù)特色介紹
阿里巴巴擁有交易數(shù)據(jù)和信用數(shù)據(jù),更多是在搭建數(shù)據(jù)的流通、收集和分享的底層架構(gòu)。
華為云服務整合了高性能的計算和存儲能力,為大數(shù)據(jù)的挖掘和分析提供專業(yè)穩(wěn)定的IT基礎(chǔ)設(shè)施平臺,近來華為大數(shù)據(jù)存儲實現(xiàn)了統(tǒng)一管理40PB文件系統(tǒng)
百度的優(yōu)勢體現(xiàn)在海量的數(shù)據(jù)、沉淀十多年的用戶行為數(shù)據(jù)、自然語言處理能力和深度學習領(lǐng)域的前沿研究。近來百度正式發(fā)布大數(shù)據(jù)引擎,將在政府、醫(yī)療、金融、零售、教育等傳統(tǒng)領(lǐng)域率先開展對外合作。
浪潮互聯(lián)網(wǎng)大數(shù)據(jù)采集中心已經(jīng)采集超過2PB數(shù)據(jù),并已建立5大類數(shù)據(jù)分類處理算法。近日成功發(fā)布海量存儲系統(tǒng)的最新代表產(chǎn)品AS130000。
騰訊擁有用戶關(guān)系數(shù)據(jù)和基于此產(chǎn)生的社交數(shù)據(jù),騰訊的思路主要是用數(shù)據(jù)改進產(chǎn)品,注重QZONE、微信、電商等產(chǎn)品的后端數(shù)據(jù)打通。
中興通訊推出的“聚焦ICT服務的高效數(shù)據(jù)中心整體服務解決方案”,可幫助運營商有效解決大數(shù)據(jù)時代建設(shè)IDC面臨的大部分問題,提升運營商ICT融合服務能力。
中科曙光XData大數(shù)據(jù)一體機可實現(xiàn)任務自動分解,并在多數(shù)據(jù)模塊上并行執(zhí)行,全面提高了復雜查詢條件下的效率。
勝天成自主研發(fā)的大數(shù)據(jù)產(chǎn)品“i維數(shù)據(jù)”,頗具創(chuàng)新,近期又與IBM達成戰(zhàn)略合作關(guān)系,涵蓋Linux on Power市場、智慧城市、存儲業(yè)務、管理服務、咨詢與應用管理服務。
神州數(shù)碼啟動了“智慧城市”戰(zhàn)略布局,先后推出了市民融合服務平臺、自助終端服務平臺等產(chǎn)品,并在佛山、武漢等智慧城市建設(shè)中實踐運用。
用友在商業(yè)分析、大數(shù)據(jù)處理等領(lǐng)域進行研發(fā),先后推出了用友BQ、用友AE等產(chǎn)品。
東軟大數(shù)據(jù)戰(zhàn)略以醫(yī)療行業(yè)為突破口,憑借在社保、醫(yī)療行業(yè)積累的資源,搭建了東軟熙康這一智慧醫(yī)療平臺。
金蝶KBI與金蝶ERP無縫集成,實現(xiàn)BI數(shù)據(jù)采集——集成——分析決策支持的一體化應用。
寶德大數(shù)據(jù)云備份,是一個專為大數(shù)據(jù)而設(shè)的云備份方案,支持實體機及虛擬機備份,而且具有無限擴充的可能,并且完全自動。
大數(shù)據(jù)時代的IP治理和審計,啟明星辰提供了終端審計、終端數(shù)據(jù)防泄露、日志審計,通過綜合審計平臺來幫助用戶解決IP治理需求等解決方案。
通過收購天行網(wǎng)安,可以拓展在公安行業(yè)的應用,目前正著力開拓行業(yè)應用市場,挖掘各個產(chǎn)業(yè)鏈中的大數(shù)據(jù)價值。
零售、證券、生物、政府等都是榮之聯(lián)大數(shù)據(jù)業(yè)務的主要目標行業(yè),已為零售業(yè)提供了大數(shù)據(jù)分析的解決方案,解決了庫存問題。
作為國內(nèi)領(lǐng)先的高端IT綜合服務商,主要服務于金融業(yè)的大數(shù)據(jù)。
專注于公安市場,其業(yè)務包括電子數(shù)據(jù)取證、電子數(shù)據(jù)鑒定、網(wǎng)絡輿情分析、數(shù)字維權(quán)、公證云、搜索云以及取證云服務。
國內(nèi)存儲技術(shù)與服務供應商賽思信安推出了自主研發(fā)的大數(shù)據(jù)管理系統(tǒng),適用范圍包括互聯(lián)網(wǎng)、公眾服務、商業(yè)智能、金融、醫(yī)療衛(wèi)生、能源等多個行業(yè)。
作為大數(shù)據(jù)、食品安全、法務軟件等相關(guān)熱門行業(yè)軟件,同時也是公安領(lǐng)域大數(shù)據(jù)的上市公司。
天璣科技的數(shù)據(jù)中心運維管理服務,為大數(shù)據(jù)的分析能力提供了強大的后臺支撐和保障。
東方國信主營業(yè)務為企業(yè)商業(yè)智能軟件及系統(tǒng)解決方案,收購北科億力和科瑞明,有效拓展了工業(yè)和金融大數(shù)據(jù)領(lǐng)域。
華三全融合虛擬化網(wǎng)絡技術(shù)能夠極大簡化網(wǎng)絡結(jié)構(gòu),減輕網(wǎng)絡管理和維護量,為企業(yè)數(shù)據(jù)中心大規(guī)模建設(shè)提供最強有力的技術(shù)支持。
??低暬谟⑻貭朒adoop發(fā)行版,并融合可以靈活按需調(diào)配IT資源對應用和服務進行支持的開放架構(gòu)云計算技術(shù),打造出了視頻智能云計算方案。
高德與阿里將在地圖搜索、產(chǎn)品商業(yè)化、數(shù)據(jù)共享、云計算等領(lǐng)域展開合作,特別是在數(shù)據(jù)共享方面,高德和阿里巴巴將共建一個大數(shù)據(jù)服務體系。
作為提供導航地圖、地理信息系統(tǒng)軟件建設(shè)的內(nèi)容提供商,現(xiàn)在已嘗試使用大數(shù)據(jù)為政府部門提供決策。
專注于商業(yè)智能領(lǐng)域(BI)、數(shù)據(jù)倉庫領(lǐng)域、數(shù)據(jù)庫領(lǐng)域的專業(yè)咨詢、項目實施、軟件開發(fā)、系統(tǒng)集成等方面,為金融、電信、快速消費品等行業(yè)提供相應方案。
信合運通專注于為運營商和行業(yè)客戶提供基于大數(shù)據(jù)的深度分析和挖掘技術(shù)、渠道支撐服務及行業(yè)解決方案。
專注于從事數(shù)據(jù)可視化,可為客戶提供數(shù)據(jù)可視化的創(chuàng)意設(shè)計、制作和軟硬件集成系統(tǒng)服務。
在國內(nèi)唯一以企業(yè)大數(shù)據(jù)分析的角度對有投資價值和并購價值的企業(yè)進行價值判斷,持續(xù)跟蹤企業(yè)動態(tài)變化的金融大數(shù)據(jù)公司。
永洪BI通過完全自主知識產(chǎn)權(quán)的數(shù)據(jù)集市產(chǎn)品(Z-Data Mart)支持大數(shù)據(jù),Z-Data Mart匯聚了數(shù)十項自有專利,涵蓋了分布式存儲和計算、分布式傳輸和實時通信等關(guān)鍵領(lǐng)域。
作為大數(shù)據(jù)服務提供商,其DataQuate解決方案主要用于解決運營商大數(shù)據(jù)的接入、挖掘及應用,為運營商大數(shù)據(jù)的價值轉(zhuǎn)化提供端到端服務。
以數(shù)據(jù)挖掘為核心、以商業(yè)智能和精準營銷為主線、以SAAS云平臺為主要服務模式,目前專注于電商領(lǐng)域,為客戶提供行業(yè)領(lǐng)先的數(shù)據(jù)分析和精準營銷平臺服務。
致力于為浙江、全國公安交通管理行業(yè)提供一流的信息化服務、產(chǎn)品和方案解決能力,其借助英特爾Hadoop分發(fā)版,已解決了大數(shù)據(jù)的采集和處理問題。
勒卡斯是致力于為客戶提供全方位直復營銷解決方案和服務的大數(shù)據(jù)公司,主要有潛客溝通、會員管理、CRM軟件定制及客戶市場調(diào)研四大業(yè)務。
專業(yè)數(shù)據(jù)采集系統(tǒng)的制造商。
主要做中國主流社交平臺的“大數(shù)據(jù)”分析,通過整合各大社交平臺的用戶數(shù)據(jù)、行為數(shù)據(jù)和 UGC 內(nèi)容,為企業(yè)和個人用戶提供定制化服務。
數(shù)據(jù)中心擁有基于OLAP技術(shù)的強大交互式數(shù)據(jù)挖掘平臺,可提供不同深度的分析報告,滿足不同視角的數(shù)據(jù)挖掘和分析需求。
今日發(fā)布了醫(yī)療領(lǐng)域的大數(shù)據(jù)“未病”預警云服務“康諾云”,有針對個人健康管理而設(shè)計的云律血壓節(jié)律儀、云悅體質(zhì)分析儀和云動智能健康監(jiān)測腕表3款智能硬件。
主要為電子商務企業(yè)提供站內(nèi)流量轉(zhuǎn)化和商業(yè)智能分析的整體優(yōu)化解決方案,旗下有推薦引擎技術(shù)平臺以及跨網(wǎng)站消費偏好平臺。產(chǎn)品主要有BRE和BAE。
AdMaster是國內(nèi)少有的第三方數(shù)字營銷監(jiān)測和調(diào)研機構(gòu),專注于為廣告主提供全流程的網(wǎng)絡廣告效果監(jiān)測、分析評估、媒介優(yōu)化咨詢和技術(shù)解決方案等服務。
介紹
一個分布式系統(tǒng)基礎(chǔ)架構(gòu),不僅可以運行在商用硬件系統(tǒng),還可以輕松地集成結(jié)構(gòu)化、半結(jié)構(gòu)化和甚至非結(jié)構(gòu)化數(shù)據(jù)集。
用于處理高速、大型數(shù)據(jù)流的分布式實時計算系統(tǒng),為Apache Hadoop添加了可靠的實時數(shù)據(jù)處理功能,同時還增加了低延遲的儀表板、安全警報。
Spark是一個基于內(nèi)存計算的開源的集群計算系統(tǒng),用Scala語言實現(xiàn),構(gòu)建在HDFS上,能與Hadoop很好的結(jié)合,而且運行速度比MapReduce快100倍。
高性能計算與通信,是美國實施信息高速公路而上實施的計劃。
世界最老牌的數(shù)據(jù)分析、數(shù)據(jù)挖掘軟件,憑借Visual Analytics軟件進入到大數(shù)據(jù)領(lǐng)域。
用于統(tǒng)計分析的R語言有個擴展R + Hadoop,可以在Hadoop集群上運行R代碼。
將數(shù)據(jù)分析、分類以及篩選的算法引入Hadoop集群當中,輕松實現(xiàn)了大數(shù)據(jù)的分析、挖掘工作。
作為全球應用最廣泛的統(tǒng)計分析軟件,可用于統(tǒng)計學分析運算、數(shù)據(jù)挖掘、預測分析和決策支持。
RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,其數(shù)據(jù)挖掘任務涉及范圍廣泛,包括各種數(shù)據(jù)藝術(shù),能簡化數(shù)據(jù)挖掘過程的設(shè)計和評價。
Apache Drill 實現(xiàn)了 Google's Dremel,有助于Hadoop用戶實現(xiàn)更快查詢海量數(shù)據(jù)集的目的。