全球首臺(tái)基于AMD EPYC 處理器和AMDInstinct 加速器的Exascale 超級(jí)計(jì)算機(jī),AMD(超威)助力Frontier 成就最強(qiáng)算力,AMD 正在為全球速度領(lǐng)先和超高能效的超級(jí)計(jì)算機(jī)提供動(dòng)力,也進(jìn)一步展示了其技術(shù)在高性能計(jì)算(HPC)領(lǐng)域的持續(xù)性領(lǐng)跑地位。
2022 年5 月30 日, 世界超算兩大學(xué)術(shù)會(huì)議之一的ISC 在德國(guó)漢堡舉行,本次會(huì)議公布了第59 屆的全球超級(jí)計(jì)算機(jī)Top500 榜單。登頂本次榜單的是由美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室研制,基于AMD EPYC CPU 和AMD Instinct 加速器的Frontier 超級(jí)計(jì)算機(jī),該超級(jí)計(jì)算機(jī)在Top500、Green500 和HPL-AI 性能排行榜上均獲得第一名,這在業(yè)界尚屬首次。事實(shí)上,AMD 正在為全球TOP10 超級(jí)計(jì)算機(jī)中的五臺(tái),和TOP10 高效超級(jí)計(jì)算機(jī)中的八臺(tái)提供動(dòng)力。
據(jù)介紹,F(xiàn)rontier 在美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室的計(jì)算設(shè)施(OLCF) 占地372 平方米, 由74 個(gè)Cray E X 機(jī)柜組成,擁有9,408 個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配備一個(gè)AMD Milan“ Trento” 7A53 EPYCCPU 和四個(gè)AMD Instinct MI250X GPU(GPU核心總數(shù)達(dá)到了37,632)。每個(gè)節(jié)點(diǎn)通過(guò)HewlettPackard Enterprise(HPE) 的200 Gbit/ 秒的Slingshot-11 互相連接。每個(gè)節(jié)點(diǎn)在CPU 上運(yùn)行512GiB DDR4 內(nèi)存,在整個(gè)節(jié)點(diǎn)上運(yùn)行了512GiB HMB2e( 每個(gè)GPU128GiB) 以及一致的內(nèi)存。整個(gè)Frontier 系統(tǒng)聚合了8,730,112 個(gè)計(jì)算核心,9.2PB 的內(nèi)存(包括4.6PB 的DDR4 和4.6PB 的HBM2e),37PB 的節(jié)點(diǎn)本地存儲(chǔ),并可訪問(wèn)716PB 的中心范圍存儲(chǔ)。
在Linpack 基準(zhǔn)測(cè)試中,這臺(tái)超級(jí)計(jì)算機(jī)的穩(wěn)定運(yùn)行速度可高達(dá)1. 1EPl op/ s(百億億每秒),理論速度高達(dá)1.68EPlop/s。根據(jù)榜單的成績(jī)來(lái)看,F(xiàn)rontier 無(wú)疑是是鶴立雞群的存在,以穩(wěn)定速度計(jì),比排名第二的日本超級(jí)計(jì)算機(jī)Fugaku 整整快了2.49 倍,理論速度更是快了3.14 倍。事實(shí)上Frontier 的穩(wěn)定速度,甚至超過(guò)了最新Top500榜單中后面七個(gè)系統(tǒng)的分?jǐn)?shù)總和。
Frontier 不僅在性能有成倍提升, 還擁有非常出色的功耗表現(xiàn)。相比之下,F(xiàn)rontier 功耗僅為21,100KW, 比排名第二的Fugaku 的29,899KW 功耗還要更低,僅相當(dāng)于Fugaku 的71%。同時(shí),F(xiàn)rontier 還以每瓦52.23gigaflops的極高能效比, 超過(guò)了日本的PreferredNetworks MN-3 系統(tǒng),在Green500 中也位居榜首。
此外,F(xiàn)rontier 測(cè)試和開發(fā)的系統(tǒng)(TDS)在Green500 榜單上也名列前茅, 僅通過(guò)一個(gè)基于優(yōu)化后第三代AMD EPYC( 霄龍) 處理器和AMD Instinct MI250x 加速器的機(jī)柜就可提供62.68 gigaflops/watt 的能效。最終, 根據(jù)High-Performance Lin pack-AcceleratorIntrospection 或HPL-AI 測(cè)試顯示,F(xiàn)rontier的混合精度計(jì)算性能達(dá)到了6.68 exaflops。
Frontier 下一步將繼續(xù)進(jìn)行該系統(tǒng)的測(cè)試和驗(yàn)證,將于2022 年晚些時(shí)候進(jìn)行最終驗(yàn)收以及早期科學(xué)訪問(wèn),并在2023 年初向全面科學(xué)開放。
在其他AMD EPYC 和AMD InstinctMI200 系統(tǒng)中,CSC 的Lumi 超級(jí)計(jì)算機(jī)以152petaflops 的性能在Top500 榜單中排名第三,并以51.63 gigaflops/watt 的能效在Green500 榜單中同樣排名第三,GENCI-CINES 的Adastra 系統(tǒng)則在Top500 榜單中排名第十,在Green500 榜單中排名第四。這些系統(tǒng)進(jìn)一步強(qiáng)調(diào)了AMD Instinct 加速器在節(jié)點(diǎn)、機(jī)柜和系統(tǒng)層面的超高性能和效率。
此外,Top500 和Green500 榜單還展示了整個(gè)HPC 行業(yè)對(duì)AMD 解決方案采用的迅速增長(zhǎng)。
在Top500 榜單中,AMD 共為94 個(gè)系統(tǒng)提供動(dòng)力,年同比增長(zhǎng)95%,同樣AMD Instinct MI200加速器也首次進(jìn)入Top500 榜單,并為7 個(gè)系統(tǒng)提供動(dòng)力。這一代基于AMD Instinct 的系統(tǒng)在Top500 榜單上所提供的性能幾乎相當(dāng)于Top500上其余161 個(gè)加速系統(tǒng)的flops 之和。
反觀Green500 榜單,AMD EPYC 處理器和AMD Instinct 加速器正在驅(qū)動(dòng)著排名前四的高效超級(jí)計(jì)算機(jī)。除此之外,AMD 產(chǎn)品在前十名中獨(dú)占8 席,在前二十名高效超級(jí)計(jì)算機(jī)中也占了17 席。
AMD 高級(jí)副總裁兼數(shù)據(jù)中心解決方案事業(yè)部總經(jīng)理Forrest Norrod 表示:“我們很高興看到AMD EPYC 處理器和AMD Instinct 加速器正在驅(qū)動(dòng)著世界上速度領(lǐng)先、超高能效的超級(jí)計(jì)算機(jī),和首臺(tái)突破Exascale 瓶頸的超級(jí)計(jì)算機(jī)。創(chuàng)新并為超級(jí)計(jì)算機(jī)提供更強(qiáng)性能和效率,這對(duì)解決世界上極為復(fù)雜的挑戰(zhàn)至關(guān)重要。AMD EPYC 處理器和AMD Instinct 加速器將繼續(xù)加速高性能計(jì)算的發(fā)展,并為推動(dòng)科學(xué)發(fā)現(xiàn)提供所需的性能。”
橡樹嶺領(lǐng)導(dǎo)計(jì)算設(shè)施科學(xué)中心主任 BronsonMesser 認(rèn)為:“ 基于AMD 和HPE 的Frontier超級(jí)計(jì)算機(jī)代表著科學(xué)和HPC 行業(yè)的巨大進(jìn)步。
我們與AMD 的合作對(duì)于我們確保部署世界上領(lǐng)先的計(jì)算科學(xué)平臺(tái)至關(guān)重要。Frontier 超級(jí)計(jì)算機(jī)通過(guò)更強(qiáng)大的AMD CPU 和AMD Instinct 加速器,以及增強(qiáng)型AMD ROCm 5.0 開放軟件平臺(tái)的綜合性能,為全人類利益提供研究人員所需的科學(xué)研究性能?!?/p>
Lumi 超級(jí)計(jì)算機(jī)基礎(chǔ)設(shè)施主管PekkaManninen 說(shuō):“Lumi 是EuroHPC 世界級(jí)超級(jí)計(jì)算機(jī)中的一員,也是適用于人工智能的領(lǐng)先平臺(tái)之一,該超級(jí)計(jì)算機(jī)在建造之初便考慮到領(lǐng)先的環(huán)境可持續(xù)性和性能。AMD EPYC 處理器和AMD Instinct 加速器幫助我們實(shí)現(xiàn)了雄心勃勃的科學(xué)研究目標(biāo),同時(shí)還滿足甚至超越了歐盟極嚴(yán)苛的氣候目標(biāo)。我們對(duì)其達(dá)到51.63 gigaflops/watt 的能效,并榮膺Green500 榜單中的第三名感到十分自豪?!?/p>
事實(shí)上,對(duì)AMD 來(lái)說(shuō)本次排名更有意義,因?yàn)镕rontier 超算使用的是AMD 的第三代EPYC64 核處理器及Instinct MI250X 加速卡,最強(qiáng)超算同時(shí)用了AMD 的CPU 及顯卡,某種意義上來(lái)說(shuō),AMD 在高性能計(jì)算上終于重回巔峰。在超算領(lǐng)域,AMD 上一次拿到TOP 500 第一還是2012 年的泰坦超算,當(dāng)時(shí)的處理器是AMD 皓龍6274 16核,加速卡是NVIDIA 的Tesla K20X,峰值浮點(diǎn)性能最終達(dá)到了27 PFlops,即2.7 億億次。泰坦超算在2019 年就退役了,經(jīng)過(guò)近兩年的研發(fā),依靠AMD EPYC 處理器性能優(yōu)勢(shì),AMD 終于在超級(jí)計(jì)算機(jī)領(lǐng)域開始收復(fù)失地,隨著Frontier 超算終于拿回了久違的桂冠。
回看這次超算大會(huì),AMD 無(wú)疑是這次的TOP500 超算榜單中的最大贏家,可謂大獲全勝,不僅僅Frontier 超算拿到第一,實(shí)際上在前十名中有5 個(gè)超算都基于AMD 處理器的,其中包括第三名的Lumi、第七名的Perlmutter、第八名的Selene 及第十名的Adasdtra。
AMD 正在通過(guò)幫助來(lái)自制造業(yè)、生命科學(xué)、金融服務(wù)、氣候研究等眾多關(guān)鍵研究領(lǐng)域的合作伙伴和客戶部署各種規(guī)模的集群領(lǐng)導(dǎo)著HPC 的發(fā)展。例如,AMD EPYC 處理器正在為泰國(guó)國(guó)家科學(xué)技術(shù)發(fā)展局的最新超級(jí)計(jì)算機(jī)提供動(dòng)力,并為醫(yī)學(xué)、天氣預(yù)報(bào)等方面的研究提供性能。此外,俄亥俄州超級(jí)計(jì)算機(jī)中心近日宣布的全新HPC 集群Ascend,也是由基于AMD EPYC 處理器的DellTechnologies PowerEdge 服務(wù)器驅(qū)動(dòng)。
AMD Instinct 和ROCm 生態(tài)系統(tǒng)可為客戶提供針對(duì)HPC、AI 和機(jī)器學(xué)習(xí)以及HIP 和OpenMP 編程模型、編譯器工具鏈和科學(xué)與工業(yè)應(yīng)用分析工具等關(guān)鍵應(yīng)用程序的支持。此外,AMD Accelerator Cloud 還可提供一個(gè)可遠(yuǎn)程訪問(wèn)、評(píng)估和充分利用AMD Instinct 加速器和ROCm 軟件的環(huán)境。
云端HPC 通過(guò)擴(kuò)大其對(duì)計(jì)算的訪問(wèn),釋放了關(guān)鍵的研究應(yīng)用程序和商業(yè)工作負(fù)載,進(jìn)而實(shí)現(xiàn)更好的產(chǎn)品設(shè)計(jì)并加速上市時(shí)間。使用機(jī)密計(jì)算的最新Google Cloud C2D 虛擬機(jī)(VMs)擴(kuò)展了AMD EPYC 處理器的勢(shì)頭,為領(lǐng)先的云服務(wù)提供商提供高性能且高效的HPC 解決方案。電動(dòng)超級(jí)跑車廠商Rimac 最近采用了基于使用AMD3D-Cache 技術(shù)的第三代AMD EPYC 處理器的Microsoft(微軟)Azure HBv3 虛擬機(jī),以提高其電動(dòng)車超級(jí)跑車模擬的性能和可擴(kuò)展性。
AMD 正在通過(guò)幫助來(lái)自制造業(yè)、生命科學(xué)、金融服務(wù)、氣候研究等眾多關(guān)鍵研究領(lǐng)域的合作伙伴和客戶部署各種規(guī)模的集群,領(lǐng)導(dǎo)HPC 的發(fā)展。
我們矢志于讓HPC 的算力以更高效便捷的方式對(duì)外提供,將HPC 價(jià)值徹底釋放;
● 采用基于使用AMD 3D V-Cache 技術(shù)的第三代AMD EPYC 處理器的 Microsoft AzureHBv3 虛擬機(jī),為 Rimac 提高其電動(dòng)車超級(jí)跑車模擬的性能和可擴(kuò)展性;
● 云端HPC 通過(guò)擴(kuò)大其對(duì)計(jì)算的訪問(wèn),釋放了關(guān)鍵的研究應(yīng)用程序和商業(yè)工作負(fù)載,進(jìn)而實(shí)現(xiàn)更好的產(chǎn)品設(shè)計(jì)并加速上市時(shí)間。
AMD EPYC 處理器:獨(dú)特“ZEN3” 架構(gòu)、領(lǐng)先的7nm 制程工藝、強(qiáng)大1/0(128 條PCle 4.0通道)和內(nèi)存帶寬等優(yōu)勢(shì),讓AMD EPYC 助力Frontier 突破Exascale 瓶頸;
Infinity 架構(gòu):AMD Infinity 架構(gòu)助力x86 性能、效率、安全功能和整體系統(tǒng)吞吐能力大幅提高,AMD InfinityFabric 技術(shù)實(shí)現(xiàn)芯片間高帶寬、低延遲的互連和一致性的結(jié)構(gòu);
AMD Instinct 加速器E :AMD Instinct 加速器提供靈活的高性能計(jì)算引擎、高帶寬內(nèi)存以及可擴(kuò)展的連結(jié)和通信技術(shù),為百億億級(jí)超級(jí)計(jì)算機(jī)的計(jì)算挑戰(zhàn)提供有力支持。