“IDC報(bào)告顯示,到2020年,中國(guó)產(chǎn)生的數(shù)據(jù)量將達(dá)到9ZB?!叭绻麑⑦@些數(shù)據(jù)印刷裝訂成冊(cè),形成的書將厚得超過(guò)在冥王星和地球之間往返30次的距離?!?月25日,在英特爾至強(qiáng)處理器 E7 v2 產(chǎn)品家族的發(fā)布會(huì)上,英特爾(中國(guó))有限公司產(chǎn)品平臺(tái)事業(yè)部總經(jīng)理Brent Young所形容的這個(gè)數(shù)據(jù)世界,離我們還有不到6年。但今天,大多數(shù)人一定依然覺(jué)得它十分遙遠(yuǎn)。
不要著急,我們與數(shù)據(jù)親密接觸的時(shí)間,或許能伴隨英特爾至強(qiáng)處理器 E7 v2 產(chǎn)品家族的面世而大幅縮短。作為通往大數(shù)據(jù)未來(lái)的關(guān)鍵,這個(gè)全新的計(jì)算平臺(tái)或許會(huì)驅(qū)動(dòng)整個(gè)產(chǎn)業(yè)鏈向大數(shù)據(jù)快步進(jìn)發(fā)。
內(nèi)存計(jì)算的突破
正如Brent Young所說(shuō),對(duì)計(jì)算平臺(tái)而言,大數(shù)據(jù)是一種“新負(fù)載”,它所對(duì)應(yīng)的將是對(duì)內(nèi)存計(jì)算、內(nèi)存分析和大規(guī)模虛擬化的需求。英特爾至強(qiáng)E7 v2正是為這種“新負(fù)載”而設(shè)計(jì)的。擁有最多15個(gè)處理內(nèi)核,每插槽1.5TB內(nèi)存容量,平均性能為上一代產(chǎn)品的兩倍,最高可支持32路的服務(wù)器平臺(tái)……這些改變,讓英特爾至強(qiáng)E7 v2相比上一代產(chǎn)品有了本質(zhì)上的變化。
人們對(duì)大數(shù)據(jù)的最初設(shè)想,是具備對(duì)數(shù)據(jù)的實(shí)時(shí)分析能力,而支撐實(shí)時(shí)分析能力的恰恰是內(nèi)存計(jì)算。過(guò)去幾年,應(yīng)用層的眾多需求都指向內(nèi)存計(jì)算,這個(gè)訴求雖然一直驅(qū)動(dòng)著計(jì)算的發(fā)展,但質(zhì)的變化遠(yuǎn)沒(méi)有E7 V2顯著。從以往計(jì)算平臺(tái)的演進(jìn)來(lái)看,多核、并行的發(fā)展趨勢(shì),并不能有效解決大數(shù)據(jù)實(shí)時(shí)分析的需求。在浪潮集團(tuán)副總裁胡雷鈞看來(lái),E7 V2與上一代產(chǎn)品相比,內(nèi)存的可擴(kuò)展能力提升了3倍,是最令人感到興奮的地方。原先必須放到硬盤上的數(shù)據(jù)現(xiàn)在可以放到內(nèi)存中,意味著未來(lái)80%以上的數(shù)據(jù)庫(kù)都可以放在內(nèi)存中運(yùn)行,連續(xù)的數(shù)據(jù)處理能力將大幅提升,其意義將是劃時(shí)代的。
“基于Hadoop架構(gòu)的大數(shù)據(jù)分析,對(duì)處理器和內(nèi)存之間的帶寬要求同樣很高。光有大內(nèi)存并不一定會(huì)讓內(nèi)存計(jì)算發(fā)揮其應(yīng)有的效力。E7 v2不僅有足夠大的內(nèi)存容量,還有足夠強(qiáng)大的內(nèi)存帶寬的擴(kuò)展能力,才能讓軟件體現(xiàn)出足夠好的性能?!焙租x強(qiáng)調(diào),這些新特性將讓未來(lái)的大數(shù)據(jù)應(yīng)用有更大的發(fā)揮空間。
大數(shù)據(jù)是技術(shù)推動(dòng)的結(jié)果,扼制住大數(shù)據(jù)的恰恰也是技術(shù)本身的局限性。長(zhǎng)久以來(lái),內(nèi)存計(jì)算的變革主要依賴系統(tǒng)上的優(yōu)化,“胡雷鈞們”要突破眾多技術(shù)難關(guān)僅能獲得“一小步”改善。而基于計(jì)算平臺(tái)的突破性變革,才是讓內(nèi)存計(jì)算跨出“一大步”的關(guān)鍵。
從分析到實(shí)時(shí)分析
數(shù)據(jù)宇宙中的東西對(duì)人們似乎很重要,但當(dāng)前的大數(shù)據(jù)分析、大數(shù)據(jù)應(yīng)用,還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到人們的預(yù)期。人們已經(jīng)看到了那個(gè)將由大數(shù)據(jù)改變一切的未來(lái),但卻觸不可及;人們努力嘗試著各種大數(shù)據(jù)應(yīng)用,但代價(jià)卻是長(zhǎng)時(shí)間的等待或高昂的成本?;趥鹘y(tǒng)的計(jì)算平臺(tái),大數(shù)據(jù)的價(jià)值根本沒(méi)有被挖掘出來(lái)。
在發(fā)布會(huì)現(xiàn)場(chǎng),戴爾的工程師展示了一個(gè)真實(shí)的大數(shù)據(jù)應(yīng)用案例。這是一個(gè)基于HANA和BU平臺(tái)的智能交通應(yīng)用,主要是對(duì)一個(gè)城市的交通狀況進(jìn)行實(shí)時(shí)分析,數(shù)據(jù)量約為100億條、40TB。按照戴爾大中華區(qū)企業(yè)級(jí)解決方案部市場(chǎng)總監(jiān)彭宇恒的話說(shuō),這個(gè)演示如果運(yùn)行在以前的平臺(tái)至少需要幾個(gè)小時(shí),有時(shí)甚至還“跑”不出來(lái)。但在E7 V2平臺(tái)上,不管是基于投入、成本比或勞動(dòng)強(qiáng)度進(jìn)行的運(yùn)價(jià)補(bǔ)貼可選性分析,還是通過(guò)基于空間熱點(diǎn)的地理位置分析實(shí)現(xiàn)的車輛調(diào)度、駕駛路徑優(yōu)化,抑或是基于一定區(qū)域?qū)哲嚳蛰d率的行駛速度和負(fù)重車行駛速度的分析判斷城市道路擁堵狀況,出分析結(jié)果的時(shí)間均為秒級(jí)。
“比如我們選擇一周的數(shù)據(jù),一般是100GB左右。再選擇管理駕駛艙,再選擇一個(gè)時(shí)間段,系統(tǒng)就會(huì)立即對(duì)這個(gè)時(shí)間段的數(shù)據(jù)進(jìn)行回歸分析,得出數(shù)據(jù)分布圖,還能細(xì)化到每小時(shí)、每天、每輛車的數(shù)據(jù)展示,參數(shù)可以隨時(shí)調(diào)整?!迸碛詈愕恼麄€(gè)演示過(guò)程就像在玩游戲,無(wú)需等待,所有的分析結(jié)果都是實(shí)時(shí)按照他的操作顯示成圖表。對(duì)于這樣驚人的分析速度,彭宇恒給出的解釋是,因?yàn)檫@是“內(nèi)存計(jì)算”。所有的數(shù)據(jù)都在內(nèi)存中,可以被實(shí)時(shí)讀取,所以數(shù)據(jù)分析的圖形可以實(shí)時(shí)動(dòng)態(tài)變化。
這次演示帶給觀者的最強(qiáng)烈感受是,一直在阻礙人們接近大數(shù)據(jù)應(yīng)用時(shí)代的東西似乎已被移除。如果說(shuō)這是計(jì)算平臺(tái)的又一次進(jìn)步,那么這次進(jìn)步正在改變的正是人們對(duì)數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用的感官認(rèn)知。更關(guān)鍵的是,它帶來(lái)了成本效益上的巨大變化,而這才是大數(shù)據(jù)被廣泛應(yīng)用的前提。
2018年,內(nèi)存計(jì)算技術(shù)市場(chǎng)規(guī)模將達(dá)到132.3億美元,是2013年的6倍之多。內(nèi)存計(jì)算會(huì)在系統(tǒng)內(nèi)存中放置整個(gè)大型數(shù)據(jù)集進(jìn)行分析,而非在傳統(tǒng)硬盤上進(jìn)行。這意味著企業(yè)可以“實(shí)時(shí)”完成復(fù)雜的數(shù)據(jù)分析,為用戶提供之前無(wú)法想象的全新體驗(yàn)和服務(wù)。面對(duì)海量數(shù)據(jù)的實(shí)時(shí)分析,企業(yè)束手無(wú)策,很難高效、實(shí)時(shí)地分析數(shù)據(jù),并用其進(jìn)行高效的商業(yè)決策、改善用戶體驗(yàn)、完成精準(zhǔn)的廣告營(yíng)銷等的局面將宣告結(jié)束。
服務(wù)器產(chǎn)業(yè)再度進(jìn)入創(chuàng)新期
E7 v2的價(jià)值還不僅僅是在大數(shù)據(jù)分析領(lǐng)域發(fā)酵。胡雷鈞認(rèn)為,在關(guān)鍵業(yè)務(wù)領(lǐng)域,E7 v2對(duì)于大幅提升系統(tǒng)穩(wěn)定性又提供了更多的可能。“幾年前,在底層硬件平臺(tái)還沒(méi)有像今天這么完善的情況下,我們一直在上層尋求突破。但實(shí)際上,如果從系統(tǒng)的角度去做更多保障CPU穩(wěn)定性的設(shè)計(jì),不僅困難大,耗費(fèi)的精力也會(huì)很多,而且還可能費(fèi)力不討好。一個(gè)處理器的生命周期一般只有兩年或兩年多一點(diǎn),但這種優(yōu)化就要花上幾個(gè)月甚至半年時(shí)間?!彼嬖V記者,現(xiàn)在很多問(wèn)題都已經(jīng)被英特爾在處理器端解決,上層的軟件可以做更多創(chuàng)造性工作。例如,過(guò)去如果處理器周邊的電路上落有灰塵,在電磁環(huán)境不好的時(shí)候,隨時(shí)可能因?yàn)殪o電短路發(fā)生錯(cuò)誤,而這些意外錯(cuò)誤積累到一定程度隨時(shí)可能會(huì)發(fā)生突變。如果可以利用軟件查看到這些問(wèn)題,就可以立即解決,而以前這些問(wèn)題是沒(méi)有辦法解決的?,F(xiàn)在我們通過(guò)CPU提供的一些特性就可以用軟件隨時(shí)凍結(jié)或關(guān)閉CPU,而不影響業(yè)務(wù)運(yùn)行。因?yàn)樘幚砥饔辛诉@樣的特性,服務(wù)器廠商才能在系統(tǒng)平臺(tái)上進(jìn)行相應(yīng)的設(shè)計(jì),處理器特性的豐富也會(huì)給浪潮的設(shè)計(jì)帶來(lái)更大的想象空間。
“從計(jì)算的角度看,E7 v2將會(huì)帶來(lái)強(qiáng)勁的創(chuàng)新加速效應(yīng)?!痹诤租x眼中,服務(wù)器廠商等待已久的創(chuàng)新機(jī)會(huì)即將因?yàn)镋7 v2而到來(lái)。
通過(guò)E7 v2,英特爾已經(jīng)把高性能計(jì)算領(lǐng)域的很多關(guān)鍵技術(shù)移植到了商業(yè)應(yīng)用領(lǐng)域,商用服務(wù)器產(chǎn)品的潛能將由此被激發(fā),而在大數(shù)據(jù)分析領(lǐng)域,它又提供了解決核心問(wèn)題的突破性方法。當(dāng)初,E5的推出曾被服務(wù)器市場(chǎng)認(rèn)為是恰逢“云”時(shí),而今天E7 v2的面世在大數(shù)據(jù)領(lǐng)域似乎也產(chǎn)生了類似的效果。英特爾如果能贏得整個(gè)產(chǎn)業(yè)鏈的響應(yīng),很可能會(huì)讓國(guó)內(nèi)的大數(shù)據(jù)應(yīng)用在明年出現(xiàn)全新局面。