劉丹
2019年8月7日,賽靈思公司宣布推出Alveo數(shù)據(jù)中心加速器卡產(chǎn)品組合的最新成員Alveo U50。與Alveo U200,U250,U280版本產(chǎn)品不同,Alveo U50是業(yè)界首款面向任意服務(wù)器和各種云而打造的自適應(yīng)計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)加速器,在更大吞吐量、更低延遲和更高功耗效率方面實(shí)現(xiàn)了10~20倍的大幅提升。
“Alveo U50,是一個(gè)非常標(biāo)準(zhǔn)化的即插即用型加速卡,性能更佳,可以用于更廣泛的部署環(huán)境、更廣泛的服務(wù)器,包括網(wǎng)絡(luò)和存儲(chǔ)加速等能力,都大大超越了之前版本?!?/p>
據(jù)賽靈思數(shù)據(jù)中心業(yè)務(wù)部產(chǎn)品規(guī)劃和市場(chǎng)營(yíng)銷總監(jiān)Jamon Bowen介紹,Alveo U50的特點(diǎn)是尺寸較小,支持第四代PCIe,不像GPU加速器那樣的是一個(gè)大型號(hào)的卡。Alveo U50采用了UltraScale+架構(gòu),集成了超高帶寬的HBM2存儲(chǔ)器技術(shù),所以大幅縮小了產(chǎn)品尺寸。且因?yàn)閮?nèi)存加在了FPGA芯片上,所以不僅能夠釋放巨大的空間,還能使性能獲得顯著提升。比如:HBM性能是DDR的10倍,功耗不到75 W。
Alveo U50的推出,實(shí)現(xiàn)了賽靈思自2018年推出Alveo產(chǎn)品系列的最初愿景———不僅加速計(jì)算,同時(shí)還加速網(wǎng)絡(luò)和存儲(chǔ),實(shí)現(xiàn)在Alveo平臺(tái)上的整體加速。這一刻,夢(mèng)想終于變成了現(xiàn)實(shí)。
繼承賽靈思Alveo以往產(chǎn)品的優(yōu)勢(shì),Alveo U50在靈活應(yīng)變和性能方面,表現(xiàn)卓越。很多部署數(shù)據(jù)中心的客戶,經(jīng)常會(huì)抱怨器件編程非常困難,賽靈思的Alveo有一個(gè)非常開(kāi)放的平臺(tái)和環(huán)境,可簡(jiǎn)化硬件編程程序,通過(guò)公共平臺(tái)進(jìn)行加速。另外,開(kāi)發(fā)者也能更便捷地使用加速平臺(tái),實(shí)現(xiàn)原來(lái)只有在軟件領(lǐng)域才有可能實(shí)現(xiàn)的硬件IP的靈活應(yīng)變能力。最主要的是,Alveo U50涵蓋解決方案的領(lǐng)域更廣泛,包括數(shù)據(jù)分析、視頻與圖象處理、機(jī)器學(xué)習(xí)、生命科學(xué)和金融計(jì)算。
對(duì)于用戶來(lái)說(shuō),部署下一代數(shù)據(jù)中心,上云一定是必經(jīng)之路,所以Alveo U50是一個(gè)全堆棧的解決方案,不僅支持本地服務(wù)器,還能支持云端服務(wù)。Alveo U5可以和開(kāi)源框架進(jìn)行連接,比如:在Kubernetes環(huán)境中,用戶可以發(fā)現(xiàn)并直接使用硬件加速插件,開(kāi)發(fā)者可以把Alveo U50和Docker配合起來(lái)使用。如果沒(méi)有這樣一個(gè)標(biāo)準(zhǔn)產(chǎn)品的配置,用戶可能需要花費(fèi)大量人力物力的投資才能夠?qū)崿F(xiàn)這一功能。所以,Alveo U50對(duì)于大規(guī)模的數(shù)據(jù)中心場(chǎng)景來(lái)說(shuō)非常適用,這也是Alveo U50令賽靈思公司引以為傲的。
具體而言,Alveo U50有以下特點(diǎn):
1.深度學(xué)習(xí)推斷加速。針對(duì)語(yǔ)音翻譯的計(jì)算負(fù)載,Alveo U50比CPU、GPU擁有更高的吞吐量和低時(shí)延的推斷性能。和英偉達(dá)T4相比,Alveo U50性能提升高達(dá)10倍,能夠用于很多不同的網(wǎng)絡(luò)。U50的尺寸非常小,符合需要邊緣計(jì)算的用例場(chǎng)景。同時(shí),對(duì)于需要在同城提供數(shù)據(jù)中心運(yùn)行服務(wù)的企業(yè)來(lái)說(shuō),這款產(chǎn)品也是首選。
2.數(shù)據(jù)庫(kù)分析加速。運(yùn)行TPC-H Query5基準(zhǔn)測(cè)試時(shí),Alveo U50相比存儲(chǔ)器的CPU,大大提高了吞吐量和查詢速度。針對(duì)一些商業(yè)信息分析領(lǐng)域,企業(yè)擁有龐大的數(shù)據(jù)庫(kù),其中有很多供應(yīng)商、很多的產(chǎn)品,也有很多的銷售數(shù)據(jù),企業(yè)需要按照季度做決策,了解哪個(gè)產(chǎn)品的銷售額是多少、降價(jià)策略或者推銷方式是否真正有效等。在這些場(chǎng)景加速過(guò)程中,會(huì)用到很多的標(biāo)簽節(jié)點(diǎn),會(huì)列出很多有關(guān)的表格,然后進(jìn)行具體的查詢。每一個(gè)節(jié)點(diǎn),對(duì)帶寬的要求也非常高,而帶寬又是Alveo U50進(jìn)行加速的關(guān)鍵節(jié)點(diǎn)。對(duì)比英特爾最先進(jìn)的多核處理器XEON系列的產(chǎn)品,Alveo U50的處理速度提升高達(dá)4倍,如果加2張就是8倍,如果加3張就是12倍。
3.金融模擬場(chǎng)景下的網(wǎng)絡(luò)計(jì)算加速。在金融領(lǐng)域,很多時(shí)候都需要建模,這樣才能給金融工具來(lái)定價(jià)。通常都有大量的數(shù)據(jù)輸入,然后做幾百萬(wàn)字的模擬,最后得出來(lái)一個(gè)平均值,通過(guò)得到一個(gè)范圍的結(jié)果,來(lái)確定在最糟糕的情況下風(fēng)險(xiǎn)如何,很多金融企業(yè)都需要這樣做才能夠定合約和證券的價(jià)格。針對(duì)金融模式場(chǎng)景,Alveo U50的功率效率比CPU高20倍,能夠更快速地獲得結(jié)果。賽靈思一直在開(kāi)發(fā)計(jì)算庫(kù),讓開(kāi)發(fā)者能夠在Alveo U50當(dāng)中使用這數(shù)據(jù)函數(shù)進(jìn)行最優(yōu)化的編碼,同時(shí)能夠在平臺(tái)上完成其他的應(yīng)用設(shè)計(jì)、建立模型。這個(gè)對(duì)于計(jì)算加速來(lái)說(shuō),是非常重要的擴(kuò)展,尤其能把所有的數(shù)學(xué)函數(shù)都吸收進(jìn)來(lái)。
4.針對(duì)電子交易的網(wǎng)絡(luò)加速。金融領(lǐng)域還有一個(gè)重要場(chǎng)景,就是用加速技術(shù)支持交易。通過(guò)市場(chǎng)數(shù)據(jù)的關(guān)鍵信息做出計(jì)算,縮短計(jì)算和決定之間的時(shí)間差,這對(duì)于金融界來(lái)說(shuō)非常關(guān)鍵。使用Alveo U50可以在不到500 ns的時(shí)間內(nèi)完成。首先收到市場(chǎng)數(shù)據(jù),然后用綜合的C語(yǔ)言來(lái)寫一個(gè)交易邏輯,然后跟這樣的交易邏輯進(jìn)行執(zhí)行和回應(yīng)。如果是CPU的話,第一步要從網(wǎng)絡(luò)上把這個(gè)數(shù)據(jù)放入到界面的接口,然后進(jìn)行緩存,如果是單向的話,要耗時(shí)400 ns,而且這僅僅是第一步,讓數(shù)據(jù)包進(jìn)入到內(nèi)存的層級(jí),而且數(shù)據(jù)進(jìn)去之后,數(shù)據(jù)的運(yùn)行環(huán)境首先要發(fā)出信號(hào),說(shuō)明這個(gè)運(yùn)行環(huán)境發(fā)生了變化。然后這個(gè)網(wǎng)絡(luò)再把信息進(jìn)行一個(gè)解碼,從用戶轉(zhuǎn)變?yōu)楹诵模缓笤侔阉鼈鬏斀o需要執(zhí)行交易的部分。整個(gè)過(guò)程需要不斷持續(xù),才能使得交易的邏輯轉(zhuǎn)為核心,然后再轉(zhuǎn)給其他有關(guān)的各端。整個(gè)過(guò)程大概需要10 ms。Alveo U50的性能在時(shí)間上是CPU的20倍,所需時(shí)間幾乎對(duì)于CPU來(lái)說(shuō)僅僅只能夠完成將數(shù)據(jù)進(jìn)入到CPU內(nèi)存層級(jí)第一步的時(shí)間。
5.存儲(chǔ)工作負(fù)載加速。過(guò)去,很多字節(jié)都需要一系列傳輸程序才能進(jìn)行處理,流程非常復(fù)雜。比如:要去壓縮、解壓、加密和解密,還要進(jìn)行數(shù)據(jù)保護(hù)。Alveo U50可以將壓縮、解壓吞吐量提高20倍。以Hadoop為例,如果來(lái)看Hadoop的大小,首先看數(shù)據(jù),還有查詢數(shù)據(jù)的工作量,對(duì)于帶寬來(lái)說(shuō)提出了很高的要求。如果要做高性能的計(jì)算,這個(gè)數(shù)據(jù)就沒(méi)有辦法壓縮,這樣基礎(chǔ)設(shè)施就需要擴(kuò)大一倍,且需要更多的存儲(chǔ)、更多的帶寬。而Alveo U50可以非常順利的進(jìn)行壓縮,并且能在高帶寬的環(huán)境下完成。壓縮之后,存儲(chǔ)空間和帶寬只占原來(lái)的一半。所以,有了這樣的加速之后,用戶部署的成本只有原來(lái)的1/2,不僅可以進(jìn)行壓縮,同時(shí)還可以確保性能不會(huì)受到影響。
總之,Alveo系列產(chǎn)品的用途非常廣泛,雖然它并不像機(jī)器學(xué)習(xí)、推斷加速等概念這樣火熱,但是確實(shí)是用戶非常需要的后端服務(wù),能夠幫助數(shù)據(jù)中心客戶節(jié)約大量成本。
計(jì)算機(jī)與網(wǎng)絡(luò)2019年16期