迎九
近日,Habana Labs宣布美國圣地亞哥超算中心為Voyager研究計劃選擇了Habana Lab AI 加速器。后者是典型的ASIC(專用芯片),但是可與英偉達的GPU在AI訓練市場一比高低。為何Habana Lab AI 加速器有如此強大的威力?未來的超算架構會青睞哪種AI芯片?值此機會,電子產(chǎn)品世界記者采訪了Habana Labs中國區(qū)總經(jīng)理于明揚先生。
1 用于Voyager研究計劃的Habana Lab AI加速器
據(jù)悉,超微 (Supermicro)提供內置Habana Gaudi AI訓練和Goya AI推理加速器的高性能計算系統(tǒng),將用于加州大學圣地亞哥分校圣地亞哥超級計算機中心(SDSC)的Voyager超級計算機,以提供高性能的AI計算能力,計劃于2021年秋季投入使用。
Voyager將致力于推進跨學科和工程領域的人工智能研究。其采用了Habana獨特的互聯(lián)技術,用336片Gaudi加速器有效地提升了AI訓練能力,這種架構很好地擴展了大型超級計算機的訓練應用。Gaudi是目前業(yè)界唯一內置集成10個支持RoCE v2(RDMA over Converged Ethernet)100G以太網(wǎng)端口的AI處理器,可以有效提升擴展的靈活性,避免擴展能力受限于吞吐量。Voyager系統(tǒng)還采用了16片Habana Goya處理器用于AI推理模型。
之所以采用Habana的芯片,因為效率可以大為提升。例如Habana與AWS合作時,AWS稱在AWS EC2實例上,8卡的Gaudi 解決方案可以在TensorFlow上每秒處理1.2萬張圖像訓練ResNet-50模型。
AI處理業(yè)務中,既有GPU、FPGA,也有AI專用芯片(例如Habana的ASIC),他們各有所長,因此異構將成超算主流。
● GPU表現(xiàn)的是靈活性,在靈活性的基礎上同時具有性能的優(yōu)勢。
● FPGA擅長整形與定制化。首先在整形表現(xiàn)了很好的性能,另外在靈活性與定制化之間選擇了一個平衡。但是,F(xiàn)PGA有較大的應用門檻——如果客戶想通過FPGA深度定制化實現(xiàn)加速,可能要對于FPGA的Verilog、VHDL語言有深入的了解。
● 以Habana為代表的ASIC路線。ASIC在模型加速過程中可以實現(xiàn)很好的定制化加速;同時因為Habana對于計算架構有深入的理解,又最大限度地保持了靈活性。另外,在很多應用場景下更接近于GPU的使用習慣,但性能又要比GPU有很大的提升。
因此,在未來在異構的場景中,GPU、FPGA和ASIC會承擔不同的角色,很可能在一個大型的計算集群中承擔不同的功能。
例如,在一些要求高精度的科學計算中,GPU會發(fā)揮其優(yōu)勢。FPGA的64位浮點計算的能力很強,在整形計算中的能力以及對于某些計算中的一些定制化的功能,有可能幫助其在流媒體的預處理、一些格式的轉換中表現(xiàn)出一定的優(yōu)勢。而對于典型的AI應用,ASIC架構方案有望實現(xiàn)更高效的性能,以幫助客戶降低訓練的成本,提升效率。
因此可以預言,在超算中,異構是未來的一個趨勢。超算中很可能會選擇X86的架構作為整個計算、業(yè)務的調度和管理,所以X86架構會存在。同時GPU會在科學運算、高精度浮點運算中起到重要的角色。再有,超算對于未來AI應用有非常強的需求,這種應用中有可能會使用ASIC解決方案,諸如Habana ASIC解決架構方案,這樣的組合給客戶帶來最大的靈活性,同時也可以助力超算最大限度地提升性能,而且降低其運營成本。
異構架構的應用挑戰(zhàn)是如何在不同架構上部署自己和客戶的業(yè)務。因此,如何提供這種融合的管理平臺,幫助客戶能自動地把其需求部署到不同的架構中,可能是一大關鍵。