大數(shù)據(jù)火了起來,甚至在前不久召開的2013夏季達(dá)沃斯論壇上還專門舉辦了一場關(guān)于“大數(shù)據(jù)概念是否被過度炒作”的辯論會,其火熱程度可見一斑。
根據(jù)計(jì)世資訊2013年3月發(fā)布的中國大數(shù)據(jù)市場調(diào)查報(bào)告顯示,相較2011年,2012年中國大數(shù)據(jù)市場規(guī)模增長52.4%,達(dá)到3.2億元。預(yù)計(jì)到2017年,中國大數(shù)據(jù)市場的年增長率都將超過60%,到2017年,達(dá)到37.9億元的市場規(guī)模,在經(jīng)濟(jì)、整體IT市場低迷的情況下,實(shí)現(xiàn)大幅逆勢增長。
在日前由《計(jì)算機(jī)世界》報(bào)主辦的“大數(shù)據(jù)時(shí)代的商業(yè)智能高峰論壇”上,來自IT廠商的代表、業(yè)內(nèi)專家、資深分析師及用戶代表就大數(shù)據(jù)熱門話題展開了激烈的討論。
焦點(diǎn)一:
大數(shù)據(jù)是不是大忽悠?
IT技術(shù)的每一次更新迭代都面臨同樣的問題,前兩年的云計(jì)算、如今的大數(shù)據(jù)無不如此。實(shí)際上我們回過頭來看,所有的技術(shù)和產(chǎn)業(yè)的發(fā)展都有泡沫化的過程,包括互聯(lián)網(wǎng)、金融危機(jī)、云計(jì)算、大數(shù)據(jù),都會有一個(gè)泡沫化的過程,而泡沫破滅的過程也正是這項(xiàng)技術(shù)落地的過程。
大數(shù)據(jù)熱起因是其可以產(chǎn)生更多的價(jià)值,而在當(dāng)前這個(gè)時(shí)間點(diǎn)熱,一方面是越來越多的人意識到了其中的價(jià)值,另一方面則與技術(shù)的發(fā)展成熟密不可分。戴爾云計(jì)算及大數(shù)據(jù)高級解決方案架構(gòu)師郝繼玖和EMC資深技術(shù)顧問楊永波在這個(gè)問題上所持的觀點(diǎn)基本相同,他們認(rèn)為并不是之前沒有大數(shù)據(jù),而是沒有能力處理。當(dāng)下這個(gè)時(shí)間點(diǎn)一方面是數(shù)據(jù)規(guī)模確實(shí)越來越大,而另一方面計(jì)算能力也達(dá)到了一定的水平,當(dāng)這兩者都具備的時(shí)候,才催生了大數(shù)據(jù)時(shí)代的到來。
作為用戶代表,IDG集團(tuán)中國區(qū)副總裁、計(jì)世傳媒集團(tuán)董事許偉明表示認(rèn)同,他認(rèn)為主要是當(dāng)前IT系統(tǒng)的計(jì)算能力和成本都已經(jīng)降低到了可以負(fù)擔(dān)的水平,由此推動(dòng)了大數(shù)據(jù)的快速發(fā)展。
作為大數(shù)據(jù)領(lǐng)域的專家,北京理工大學(xué)計(jì)算機(jī)學(xué)院院長助理、大數(shù)據(jù)搜索與挖掘?qū)嶒?yàn)室主任張華平副教授表達(dá)了他的看法。他表示,雖然當(dāng)前大數(shù)據(jù)還停留在泡沫階段,不過大數(shù)據(jù)的泡沫不會比云計(jì)算大,因?yàn)樵朴?jì)算更多涉及的是架構(gòu)問題,業(yè)內(nèi)分歧比較多,而大數(shù)據(jù)關(guān)注的只是業(yè)務(wù),更加專注,因此也會更快地實(shí)現(xiàn)落地。
焦點(diǎn)二:
上馬大數(shù)據(jù)要做哪些準(zhǔn)備?
根據(jù)計(jì)世資訊發(fā)布的大數(shù)據(jù)市場調(diào)研報(bào)告顯示,未來半數(shù)以上的企業(yè)會采用大數(shù)據(jù)解決方案。用戶如果真的要部署大數(shù)據(jù)解決方案,要做哪些準(zhǔn)備?
了解需求、獲得老板的認(rèn)可,是首先要考慮的。許偉明認(rèn)為,從公司角度來看,最大的問題是如何獲得老板的支持;而從業(yè)務(wù)層面出發(fā),則需要考慮實(shí)際的需求。比如你所處的企業(yè)如果數(shù)據(jù)量很大,則需要在IT架構(gòu)上做準(zhǔn)備,考慮包括數(shù)據(jù)是怎么收集的、從哪里收集、如何與其他數(shù)據(jù)進(jìn)行匹配等問題。而在操作過程中,則可以首先嘗試一些開源的工具進(jìn)行小范圍測試,做一些基本了解,然后再找相關(guān)的專家仔細(xì)進(jìn)行評估。
這僅僅是最基礎(chǔ)的部分,在此之上,企業(yè)還要將項(xiàng)目與整體業(yè)務(wù)緊密地聯(lián)系在一起。因?yàn)槿绻皇菃为?dú)考慮某一部分的業(yè)務(wù),失敗的概率非常大。楊永波表示,從IT架構(gòu)層面來講,很多數(shù)據(jù)的獲取并不容易,打通所有層級、部門的數(shù)據(jù)是比較難的,但是只有把信息打通了,才擁有了真正的大數(shù)據(jù)。
郝繼玖則進(jìn)一步做了補(bǔ)充:“大數(shù)據(jù)相應(yīng)的IT架構(gòu)搭建完成后,還需要考慮服務(wù)的標(biāo)準(zhǔn)化,因?yàn)殡S著數(shù)據(jù)量、設(shè)備及人員的增加,如何分工、保證高質(zhì)量的運(yùn)維效果是需要迫切考慮的問題,這個(gè)過程就需要建立統(tǒng)一的服務(wù)標(biāo)準(zhǔn)和流程?!?/p>
除了技術(shù)層面的問題外,還有一個(gè)很大的問題就是隱私問題。張華平講到,現(xiàn)在有很多大數(shù)據(jù)隱私被濫用的問題,無論從國家還是公司層面來講,要想把大數(shù)據(jù)做好,都面臨數(shù)據(jù)公開的問題,需要各個(gè)部門數(shù)據(jù)的融合。因此,利用大數(shù)據(jù)的時(shí)候,要考慮隱私的問題。另外,還需要考慮數(shù)據(jù)本身的生命周期問題,有一些老的或者過時(shí)的數(shù)據(jù),可能對你最后的分析結(jié)果產(chǎn)生特別糟糕的影響。因此,專業(yè)的人才不可或缺,應(yīng)該有一些數(shù)據(jù)分析師,或者跟業(yè)務(wù)相關(guān)的數(shù)據(jù)科學(xué)家對數(shù)據(jù)進(jìn)行分析。
焦點(diǎn)三:
用開源平臺還是商業(yè)軟件?
一提到大數(shù)據(jù)很多人會想到Hadoop。作為開源平臺的忠實(shí)支持者,張華平認(rèn)為做開源和共享平臺,從最終的情況來看,獲取的價(jià)值更大。因?yàn)殚_源軟件參與的用戶多,反饋多,更容易改進(jìn)和完善。
不過,楊永波并不這么看,他認(rèn)為Hadoop不等于大數(shù)據(jù),針對非結(jié)構(gòu)化數(shù)據(jù)的分析,Hadoop是比較好的平臺,也是現(xiàn)在被廣泛接受的平臺。但也正因?yàn)槠涫情_源平臺,也存在一些弊端,比如服務(wù)質(zhì)量無法保證。另外,Hadoop有很多版本,要真正實(shí)現(xiàn)商用,需要用戶具備足夠高的技術(shù)水平。因此,用戶在選擇時(shí)并不能一味追求開源,需要綜合考慮自己的情況。
對此,許偉明表示認(rèn)同楊永波的觀點(diǎn),他認(rèn)為無論是開源還是商業(yè)軟件,最重要的還是服務(wù)質(zhì)量、服務(wù)速度,不能一味考慮成本問題。
郝繼玖表示:“大數(shù)據(jù)發(fā)展速度越來越快,給IT市場帶來的空間也越來越大。因此,在開源平臺方面,我們一直在積極參與,推動(dòng)行業(yè)的發(fā)展。戴爾并不提供大數(shù)據(jù)運(yùn)行平臺,提供的只是其中的計(jì)算能力。”
焦點(diǎn)四:
大數(shù)據(jù)時(shí)代,安全如何保證?
大數(shù)據(jù)并沒有人排斥,但在記者采訪過程中,經(jīng)常有用戶問這樣的問題:如何保證我的信息安全,如果無法保證安全,大數(shù)據(jù)還上不上?對此,張華平一語中的,“我們不會因?yàn)楦哞F出事不坐高鐵,不會因?yàn)轱w機(jī)出事不坐飛機(jī),大數(shù)據(jù)是科技發(fā)展的趨勢,但要把握好方向,這需要法律的完善?!?/p>
張華平的觀點(diǎn)得到了與會嘉賓的贊同。郝繼玖認(rèn)為,數(shù)據(jù)是把雙刃劍。消費(fèi)者網(wǎng)購時(shí)需要提供家庭地址,才能給你運(yùn)過來,這是經(jīng)過同意獲取你的信息,因?yàn)橛辛己玫姆森h(huán)境進(jìn)行統(tǒng)一管理,所以買家不用那么擔(dān)心;而生活中很多時(shí)候是濫用信息的收集,是在用戶不知情的情況下搜集你的信息,這就需要相應(yīng)立法進(jìn)行保護(hù)。大數(shù)據(jù)也是類似的,只讓適合的人利用我的數(shù)據(jù)。另外,關(guān)于大數(shù)據(jù)的報(bào)道,未來也要有嚴(yán)格的法律保護(hù)體系,保證我的數(shù)據(jù)不被泄露出去。
許偉明還在此基礎(chǔ)上提到了平衡,他講到,一個(gè)信息點(diǎn)傳播出去,對某個(gè)人而言,可能是隱私受到了侵犯,但從另一個(gè)角度來看,你把互聯(lián)網(wǎng)當(dāng)成是一個(gè)系統(tǒng),你不斷地訓(xùn)練這個(gè)系統(tǒng),讓其更好地為你服務(wù),其實(shí)也不是壞事。“我們做媒體的,研究的大數(shù)據(jù)就包括精準(zhǔn)的廣告投放。比如在你閱讀的時(shí)候,獲得了你想要的廣告信息,對用戶而言也不是壞事。再比如你在研究旅行的時(shí)候,給你一些旅行社的信息,或者給你一些比較便宜的飛機(jī)票等,相信客戶還是愿意看的。實(shí)際上你可以有意識地泄露一些你的信息,這樣系統(tǒng)會分析你的數(shù)據(jù),真正地幫助你,所以我覺得沒必要恐懼。而惡意的信息收集、未經(jīng)用戶允許收集的信息,都是違法的。這其中就需要平衡,不能因?yàn)橛锌赡鼙恍孤峨[私就不用大數(shù)據(jù)?!?/p>
鏈接
2013大數(shù)據(jù)平臺最佳創(chuàng)新產(chǎn)品獎(jiǎng)
Dell PowerEdge C8000
數(shù)據(jù)中心基礎(chǔ)設(shè)施解決方案獎(jiǎng)
Nutanix虛擬計(jì)算平臺
2013大數(shù)據(jù)優(yōu)秀解決方案
帝聯(lián)科技“云主機(jī)解決方案”
南大通用GBase 8a數(shù)據(jù)庫
Informatica PowerCenter大數(shù)據(jù)版
2013大數(shù)據(jù)優(yōu)秀產(chǎn)品獎(jiǎng)
華為12800交換機(jī)
浪潮云海大數(shù)據(jù)一體機(jī)
SAS可視化分析平臺
知意圖精準(zhǔn)推薦系統(tǒng)
2013大數(shù)據(jù)人才培養(yǎng)貢獻(xiàn)獎(jiǎng)
慧科教育
大數(shù)據(jù)時(shí)代的商業(yè)智能高峰論壇召開
繼移動(dòng)互聯(lián)、云計(jì)算之后,大數(shù)據(jù)再次挑動(dòng)整個(gè)IT產(chǎn)業(yè)的神經(jīng)。9月12日,在《計(jì)算機(jī)世界》舉辦的“大數(shù)據(jù)時(shí)代的商業(yè)智能”高峰論壇上,來自大數(shù)據(jù)和商業(yè)智能領(lǐng)域的眾多專家、學(xué)者和用戶,圍繞大數(shù)據(jù)的基礎(chǔ)架構(gòu)與上層應(yīng)用的建設(shè)以及如何推動(dòng)大數(shù)據(jù)落地來激發(fā)企業(yè)的競爭力和創(chuàng)造力進(jìn)行了深入的探討。作為IT行業(yè)的領(lǐng)導(dǎo)者,戴爾、EMC等知名廠商參加了本次大會并做了主題演講。
誘人的市場規(guī)模吸引了眾多廠商的加入,而越來越多的用戶也因?yàn)榭春闷鋸V闊的應(yīng)用前景而紛紛投身其中。為了鼓勵(lì)大數(shù)據(jù)相關(guān)廠商的技術(shù)和產(chǎn)品創(chuàng)新,推動(dòng)大數(shù)據(jù)技術(shù)的順利落地,本屆大會還為一批優(yōu)秀的產(chǎn)品及解決方案進(jìn)行了頒獎(jiǎng),具體獲獎(jiǎng)名單如左表。