齊健
日前,NVIDIA GTC 2020秋季大會在線上舉行,在本次大會中,NVIDIA的硬件、軟件以及行業(yè)解決方案等多條產(chǎn)品線均推出了重要更新。其中包括全新處理器DPU,基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40,本地或遠(yuǎn)程實時協(xié)作平臺Omniverse的公測版本,一站式AI基礎(chǔ)設(shè)施NVIDIA DGX SuperPODTM的企業(yè)版解決方案,云AI視頻流平臺NVIDIA Maxine平臺,以及NVIDIA與全球醫(yī)療健康公司葛蘭素史克(GSK)及其AI 團隊在醫(yī)療健康領(lǐng)域的創(chuàng)新突破。
全新處理器BlueField DPU系列
“數(shù)據(jù)中心已成為新型計算單元。在現(xiàn)代化、安全的加速數(shù)據(jù)中心中,DPU已成為其重要的組成部分。CPU、GPU和DPU的結(jié)合,可構(gòu)成完全可編程的單一AI計算單元,提供前所未有的安全性和算力。”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,數(shù)據(jù)中心已經(jīng)成為NVIDIA的主要業(yè)務(wù)之一,其在NVIDIA的總營收占比中也日益增加。
隨著各行業(yè)對數(shù)據(jù)應(yīng)用重視度的不斷上升,NVIDIA對數(shù)據(jù)應(yīng)用產(chǎn)品的研發(fā)投入也逐步攀升。NVIDIA推出的最新處理器DPU(Data Processing Unit,數(shù)據(jù)處理單元),是一款由新型DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)架構(gòu)支持的處理器產(chǎn)品。其可實現(xiàn)具有突破性的網(wǎng)絡(luò)、存儲和安全性能。其中,DOCA架構(gòu)是一款全新的數(shù)據(jù)中心IOC(Infrastructure On A Chip - 基礎(chǔ)架構(gòu)級芯片)架構(gòu)。
經(jīng)過優(yōu)化的BlueField-2 DPU可從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲和安全任務(wù),使企業(yè)能夠?qū)⑵銲T基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)樽钕冗M(jìn)的數(shù)據(jù)中心。此類數(shù)據(jù)中心可實現(xiàn)加速、具有完全可編程性,并具有“零信任”安全功能,防止數(shù)據(jù)泄露和網(wǎng)絡(luò)攻擊。
單個BlueField-2 DPU可以提供相當(dāng)于消耗125個CPU內(nèi)核所提供的數(shù)據(jù)中心服務(wù)。由此釋放CPU內(nèi)核,以運行各種其他企業(yè)應(yīng)用程序。NVIDIA當(dāng)前的DPU系列中包括兩款PCIe產(chǎn)品:NVIDIA BlueField-2 DPU和NVIDIA BlueField-2X DPU。
同NVIDIA CUDA編程模型助力開發(fā)者構(gòu)建GPU加速應(yīng)用程序類似,全新NVIDIA DOCA 軟件開發(fā)套件可助力開發(fā)者在DPU加速數(shù)據(jù)中心基礎(chǔ)設(shè)施服務(wù)上構(gòu)建應(yīng)用程序。DOCA為開發(fā)者提供全面的開放式平臺,助力構(gòu)建運行于BlueField系列DPU上的軟件定義硬件加速的網(wǎng)絡(luò)、存儲、安全及管理應(yīng)用程序。DOCA已完全集成于NVIDIA NGC中,該軟件目錄可提供便捷的容器化軟件環(huán)境,使第三方應(yīng)用程序提供商能夠利用先進(jìn)的DPU數(shù)據(jù)中心加速服務(wù),為客戶開發(fā)、認(rèn)證并分發(fā)應(yīng)用程序。
基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40
與上一代產(chǎn)品相比,NVIDIA Ampere GPU架構(gòu)能夠提供驚人性能。Blackmagic、Chaos Group和Luxion等軟件合作伙伴的早期測試顯示了用戶通過該全新GPU所獲得的性能提升。
NVIDIA RTX A6000和NVIDIA A40通過突破性的技術(shù)提供更強大的性能,包括:第二代RT Core:最高可提供2倍于上一代的吞吐量,以及并行光線追蹤、著色和計算功能。第三代Tensor Core:最高可提供5倍于上一代的吞吐量,并支持全新TF32和BF16數(shù)據(jù)格式,結(jié)合稀疏運算特性提供10倍加速性能。
全新CUDA Core最高可提供2倍于上一代的FP32吞吐量,能夠顯著提高圖形和計算能力。48 GB GPU內(nèi)存,其中單個GPU可提供的最大內(nèi)存通過NVLink連接兩個GPU可以擴展到96 GB。
通過添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件,為遠(yuǎn)程用戶提供針對圖形工作負(fù)載和強大虛擬工作站實例的大規(guī)模支持,賦力高端設(shè)計、AI和計算工作負(fù)載的更大規(guī)模工作流程。PCIe Gen 4可提供2倍于上一代的帶寬,加速Lenovo ThinkStation P620等PCIe Gen 4服務(wù)器和工作站中數(shù)據(jù)密集型工作負(fù)載(如數(shù)據(jù)科學(xué)、混合渲染和視頻流)的GPU數(shù)據(jù)傳輸。
公測版Omniverse
在GTC的主題演講中,黃仁勛宣布NVIDIA Omniverse平臺已進(jìn)入公測階段,他表示:“物理和虛擬世界將會日益融合。Omniverse讓位于全球各地或居家辦公的創(chuàng)作者團隊,能夠像編輯文檔一樣在同一個設(shè)計上輕松開展協(xié)作。這是《星際迷航》全息甲板的初始,它終成現(xiàn)實?!?img src="https://cimg.fx361.com/images/2021/02/08/qkimagescadccadc202011cadc20201119-2-l.jpg"/>
Omniverse整合了NVIDIA在圖形、仿真和AI領(lǐng)域的突破,是全球首個基于NVIDIA RTX的3D仿真模擬和協(xié)作平臺。該平臺融合了物理和虛擬世界,能夠?qū)崟r模擬出細(xì)節(jié)逼真的現(xiàn)實世界。遠(yuǎn)程團隊可以通過該平臺同時開展項目協(xié)作,例如負(fù)責(zé)3D建筑設(shè)計迭代的建筑師、修改3D場景的動畫師以及協(xié)作開發(fā)自動駕駛汽車的工程師,整個協(xié)作就像是在線上共同編輯文檔一樣簡單。
NVIDIA在為期一年的搶先體驗計劃之后發(fā)布了公測版Omniverse。搶先體驗項目期間,愛立信、Foster + Partners、工業(yè)光魔(ILM)和其他40多家公司以及多達(dá)400位個人創(chuàng)作者和開發(fā)者對該平臺進(jìn)行了評估并向NVIDIA工程團隊提供了反饋。
Omniverse基于皮克斯應(yīng)用廣泛的Universal Scene Description(USD),一種能夠在3D應(yīng)用中實現(xiàn)通用互換的先進(jìn)格式。該平臺還使用了多項NVIDIA技術(shù),例如實時照片級逼真渲染、物理效果、材質(zhì)以及在業(yè)內(nèi)領(lǐng)先3D軟件產(chǎn)品之間的交互式工作流程。Omniverse所能實現(xiàn)的協(xié)作和仿真模擬對于機器人、汽車、建筑、工程與建設(shè)、制造以及媒體和娛樂行業(yè)的客戶而言至關(guān)重要。
企業(yè)版NVIDIA DGX SuperPODTM解決方案
企業(yè)版NVIDIA DGX SuperPODTM解決方案是NVIDIA推出的首個一站式AI基礎(chǔ)設(shè)施,能夠讓企業(yè)以驚人的速度安裝功能強大的AI超級計算機——通常只需短短幾周時間。已上市的DGX SuperPOD是由包含20個到140個獨立的NVIDIA DGX A100TM系統(tǒng)構(gòu)建的集群,現(xiàn)已發(fā)往韓國、英國、瑞典和印度,預(yù)計在年底前安裝完畢。
DGX SuperPOD系統(tǒng)以借助NVIDIA Mellanox HDR InfiniBand網(wǎng)絡(luò)互聯(lián)的20個模塊來銷售,AI性能最低可達(dá)到100 petaflops,最高可達(dá)700 petaflops,可運行最復(fù)雜的AI工作。
從定制化容量規(guī)劃和數(shù)據(jù)中心設(shè)計服務(wù),到應(yīng)用程序性能測試和開發(fā)人員操作培訓(xùn),企業(yè)版DGX SuperPOD解決方案是實現(xiàn)大規(guī)模AI創(chuàng)新的捷徑。每臺DGX SuperPOD均由NVIDIA認(rèn)證的合作伙伴進(jìn)行調(diào)試、堆疊和配置。這些精心選拔而出的NVIDIA AI專家可確保安裝輕松易行,即便是通過大量電纜連接數(shù)十甚至數(shù)百個節(jié)點的AI基礎(chǔ)設(shè)施的安裝流程也十分簡單。
安裝后,NVIDIA和認(rèn)證專家將與客戶合作,以確保其AI工作負(fù)載通過NGC中的最新NVIDIA軟件進(jìn)行優(yōu)化,包括云原生GPU優(yōu)化型容器、模型和適用于特定行業(yè)的SDK。
企業(yè)版DGX SuperPOD解決方案是基于NVIDIA多年致力于創(chuàng)造全球最先進(jìn)的AI系統(tǒng)的成果打造而成,旨在推動NVIDIA在汽車、醫(yī)療健康、對話式AI、推薦系統(tǒng)、數(shù)據(jù)科學(xué)和計算機圖形等領(lǐng)域的工程。
NVIDIA Selene是一款280節(jié)點的DGX SuperPOD,在今年早些時候發(fā)布的TOP500和MLPerf測試中均名列前茅,奠定了AI更高的門檻。其DGX SuperPOD架構(gòu)還實現(xiàn)了效率突破,其20 gigaflops /瓦的效率創(chuàng)造了Green500性能記錄。
AI基礎(chǔ)設(shè)施需要極高的存儲速度,以并行處理各類數(shù)據(jù),例如文本、表格數(shù)據(jù)、音頻和視頻。NVIDIA 企業(yè)版DGX SuperPOD解決方案采用全閃存存儲并經(jīng)過優(yōu)化,能滿足客戶的特定要求以及AI工作負(fù)載的獨特需求。DDN是企業(yè)版DGX SuperPOD解決方案首個通過NVIDIA認(rèn)證的存儲合作伙伴。
目前,NVIDIA正在基于NVIDIA DGX SuperPODTM解決方案推動一項名為Cambridge-1的超級計算機建造計劃,這是一款80節(jié)點的DGX SuperPOD,具備400 petaflops 的AI性能。2020年年底一經(jīng)部署便將成為英國最快的超級計算機。該系統(tǒng)將被用于英國學(xué)術(shù)界、業(yè)界和初創(chuàng)企業(yè)在AI和醫(yī)療健康領(lǐng)域的合作研究。