在歷經(jīng)一段時(shí)間的概念炒作后,大數(shù)據(jù)如今已經(jīng)被人們所普遍熟知。人們關(guān)注的焦點(diǎn)也不再停留在什么是大數(shù)據(jù)、大數(shù)據(jù)有怎樣的特點(diǎn),而是更多將注意力集中在大數(shù)據(jù)該如何落地,即我們?nèi)绾翁幚磉@些數(shù)據(jù),從而幫助我們分析決策。當(dāng)然伴隨大數(shù)據(jù)受關(guān)注程度的日益增加,各種有關(guān)大數(shù)據(jù)的分析模型、平臺(tái)、工具也層出不窮。
“要處理這些數(shù)據(jù),首先要對(duì)各種不同類型的數(shù)據(jù)進(jìn)行整理歸類,找出規(guī)律所在。這其中很重要的一點(diǎn)就是將Web、社交網(wǎng)絡(luò)等產(chǎn)生的半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)變成計(jì)算機(jī)可以理解的內(nèi)容。”惠普軟件集團(tuán)Autonomy信息分析部副總裁兼總經(jīng)理Rohit de Souza在接受本報(bào)記者采訪時(shí)表示。
不難看出,數(shù)據(jù)歸類整理是整個(gè)數(shù)據(jù)利用過程的基石,也是大數(shù)據(jù)發(fā)揮價(jià)值的關(guān)鍵所在。
對(duì)此,業(yè)界各類解決方案的普遍做法是首先將大量的各類數(shù)據(jù)集中到統(tǒng)一的數(shù)據(jù)倉庫中,然后進(jìn)行整理分類,從而為下一步分析應(yīng)用做準(zhǔn)備。不過其中也有不同,惠普Autonomy便是這樣一款大數(shù)據(jù)分析工具。
“在信息爆炸式增長的時(shí)代,將海量的信息移來移去無疑會(huì)增加成本和難度。”Rohit表示,惠普Autonomy數(shù)據(jù)分析工具能夠直接對(duì)接各類應(yīng)用所產(chǎn)生的數(shù)據(jù),并進(jìn)行分類整理,而無需數(shù)據(jù)倉庫的介入,這無疑大大增加了數(shù)據(jù)的處理效率。
這僅是Autonomy數(shù)據(jù)分析工具的優(yōu)勢之一,類似的領(lǐng)先之處還有很多。比如,其能夠根據(jù)實(shí)際情景、結(jié)合上下文,智能識(shí)別來自各種應(yīng)用的各類數(shù)據(jù)。Rohit還舉了一個(gè)形象的例子來說明該特性。他說,同樣是Apple,它是指水果還是手機(jī)?恐怕只有結(jié)合實(shí)際情景才能做出判斷,而Autonomy能夠很好地做到這一點(diǎn)。
再比如,Autonomy能夠處理各種類型的數(shù)據(jù),包括視頻、音頻、郵件、短消息等,而這些數(shù)據(jù)可以來自微博、微信等社交媒體,也可以來自傳統(tǒng)的企業(yè)應(yīng)用。據(jù)Rohit介紹,Autonomy通過連接器能夠直接對(duì)接400多類應(yīng)用,幾乎囊括了目前市面上的所有應(yīng)用類型。
正是由于其多方面的優(yōu)勢,Autonomy收獲了不錯(cuò)的市場反響。據(jù)悉,目前惠普Autonomy數(shù)據(jù)分析工具已經(jīng)在包括電信、金融、傳媒等在內(nèi)的多個(gè)行業(yè)的多種場景得到應(yīng)用。如中國移動(dòng)使用該工具可檢索任一手機(jī)中的應(yīng)用數(shù)據(jù),而中央電視臺(tái)未來廣告則用其捕捉視頻中商標(biāo)等內(nèi)容的出現(xiàn)頻次,同時(shí)利用情感分析功能,從觀眾所發(fā)出的微博、微信內(nèi)容中抓取情感部分,二者相結(jié)合以完成二次、三次營銷。
從目前情況來看,無論是市場方面還是技術(shù)方面,惠普Autonomy在大數(shù)據(jù)時(shí)代都取得了一定的成績。談及Autonomy在中國的規(guī)劃時(shí),Rohit表示,一方面惠普會(huì)不斷完善產(chǎn)品、提升性能;另一方面惠普則將繼續(xù)結(jié)合中國用戶的實(shí)際需求,加深產(chǎn)品的本地化程度。
而就在近日,惠普Autonomy剛剛更新其產(chǎn)品線,推出了HP IDOL 10.5版本。其除了加強(qiáng)與HP HAVEn大數(shù)據(jù)平臺(tái)的關(guān)鍵組件(包括HP ArcSight、HP Vertica和Apache Hadoop)的集成程度外,還大幅提升了HP IDOL的分析能力、可靠性和易用性,以幫助用戶更好地對(duì)數(shù)據(jù)進(jìn)行整理歸類。