動互聯(lián)時代,Arm總是顯得格外活躍,除傳統(tǒng)物聯(lián)網(wǎng)設備外,當蘋果Macbook Air搭載基于Arm設計的M1CPU亮相時,不少人意識到或許有必要重新認識一下這個控制全世界超1300億個設備的處理器陣營了,而隨著v9架構的出現(xiàn),Arm及其陣營再次成為聚光燈下的焦點。
Arm時隔十年推出v9架構
2021年1季度末,英國芯片設計公司Arm正式宣布推出新一代芯片架構Arm v9,這是自十年前Arm v8推出以來,該架構的首次重大變革。新的v9架構兩大重點是人工智能和安全,預計第一批搭載Armv9架構的處理器最快在今年年底前發(fā)貨。
Arm首席執(zhí)行官西蒙·塞加斯(Simon Segars)表示,v9架構將提高安全性和信任度,并為未來十年的計算機技術奠定基礎?!爱斘覀冋雇扇斯ぶ悄芏x的未來時,我們必須奠定一個領先的計算基礎,為應對未來的獨特挑戰(zhàn)做好準備,Armv9就是答案。它將處于下一代3000億顆基于Arm的芯片的最前沿,其驅動力是建立在通用計算的經(jīng)濟性、設計自由度和可獲得性基礎上的普遍的專業(yè)化、安全和強大的處理需求?!?/p>
據(jù)悉,Armv9有三大主要改進,即安全性更高,更好的AI性能,以及總體上速度更快。Arm表示,到2020年代中期,將有超過80億臺語音輔助設備,90%的應用將包含AI元素。Arm與富士通合作創(chuàng)建了可擴展矢量擴展(SVE),現(xiàn)在SVE2是Armv9的一部分,用于更好的機器學習和數(shù)字信號處理。
龐大的Arm生態(tài)
Armv9能夠快速成為市場關注的焦點,很大程度上得益于Arm龐大的生態(tài)陣營影響力。
根據(jù)Arm最新統(tǒng)計數(shù)據(jù)顯示,在2020年的最后一個季度,Arm的芯片合作伙伴共出貨73億顆Arm 架構芯片(年增22%),創(chuàng)下出貨量歷史新高,相當于每秒出貨超過900顆芯片、每日出貨7,000萬顆芯片。Arm的合作伙伴在2020年總出貨量高達250億顆Arm架構的芯片(年增13%),累計總數(shù)已超過1,900億。此外,Arm的GPU出貨量累計超過80億,其中在2020年GPU出貨超過10億,Arm Mali GPU持續(xù)位居全球GPU出貨量榜首。
龐大出貨量的背后是持續(xù)擴張的Arm生態(tài)陣營,在2020財年(2020年4月至2021年3月),Arm與104家客戶簽署了162個授權協(xié)議,其中有超過一半的授權對象為首次與Arm合作的企業(yè)。Arm近期合作的新客戶還包括SEMIFIVE與Telechips。此外,Arm Flexible Access目前已有90家合作伙伴,通過該計劃,這些合作伙伴可以更簡易地獲取各項全球領先的Arm IP、工具與支持。
在龐大的生態(tài)陣營支持下,Armv9架構必然能夠快速落地,進而為數(shù)字生活時代帶來一場全新的變革。
同步更新的Arm Mali GPU套件
視覺體驗仍然是消費者與設備交互、并享用設備的關鍵,Arm推出面向最廣泛應用的多款GPU,搭配全面計算解決方案中的Armv9CPU,提供卓越的用戶體驗。
Mali過去幾年一直是出貨量最大的GPU。新款Arm Mali-G710是針對旗艦智能手機和不斷增長的Chromebook筆記本市場所推出的高性能GPU,在計算密集型體驗方面(如AAA高保真游戲)的性能提升20%。對于各種與機器學習有關的任務(如全新相機和視頻模式的圖像增強),Mali-G710也帶來了35%的機器學習性能提升。
Arm的互連技術對于提高系統(tǒng)性能至關重要。最新的CoreLink CI-700一致性互連技術和CoreLink NI-700片上網(wǎng)絡互連技術與Arm CPU、GPU和NPU IP無縫搭配,可跨SoC 解決方案增強系統(tǒng)性能。CoreLink CI-700和CoreLink NI-700對新的Armv9-A功能提供硬件級支持,如內存標簽擴展(Memory Tagging Extension)等等。
下一代處理器性能大提升
從2011年11月發(fā)布ARMv8開始,ARMv8已經(jīng)走過將近10年時間。ARMv8架構的主要特點是增加對64位指令集的支持,包括目前性能最強的Cortex-X1/A78,都是基于ARMv8.x指令集打造。ARM在2021年3月31日正式推出ARMv9指令集,在兼容ARMv8的基礎上,提升處理器性能,同時提升安全性、增強矢量計算、機器學習及數(shù)字信號處理。
在人們最為關注的性能方面,下一代的Matterhorn架構及Makalu架構會保持30%以上的IPC性能提升,加上未來更先進工藝帶來的頻率提升,最終CPU性能提升有望達到40%。
以智能手機等移動平臺使用的Cortex-X/A系列為例,X1/A78的性能比16nm Cortex-A72提升2.5倍。ARMv9同時還將內存延遲從150ns降至90ns、頻率從2.6GHz到33GHz、內存帶寬從20GB/s提升至60GB/s、并加快緩存的存儲速度等。
ARMv9與性能有關的重要升級就是SVE2指令集,SVE最早是ARM與富士通合作的浮點性能擴展,TOP500超算富岳就使用SVE指令集SVE2就是第二代SVE浮點指令。與SVE的128位矢量相比,SVE2可以支持128為倍數(shù)、最多2048位運算。
因此SVE2可以增強ML機器學習、DSP信號處理能力,提升未來5G、虛擬現(xiàn)實、增強現(xiàn)實以及CPU本地運行ML的性能,同時ARM未來還會繼續(xù)提升AI人工智能性能。ARMv9第三大升級就在于數(shù)據(jù)安全,全新的CCA機密計算體系架構基于TrustZone安全技術,并引入動態(tài)域技術。
未來3000億ARM芯片的基礎
ARM官方稱是10年來最重要的創(chuàng)新,是未來3000億ARM芯片的基礎。
與上一代的ARMv8相比ARMv9處理器將不再局限于移動/嵌入式市場,現(xiàn)已經(jīng)擴展到PC、HPC高性能計算、深度學習等新市場,以滿足全球對功能日益強大的安全、人工智能(AI)和無處不在的專用處理的需求。
Amv9架構有兩個核心側重點:人工智能和安全。ARM表示到21世紀中葉,將會有超過80億臺語音輔助設備,90%的應用將包含AI元素。在安全方面,Armv9會獲得Arm Confidential Compute Architecture(CCA),在使用時屏蔽數(shù)據(jù)的訪問,在硬件層面保護數(shù)據(jù)。此外,還會有一個叫做Realms的東西,應用程序可以在安全和非安全區(qū)域之外使用。
悄然改變的人類生活應用場景
科技正在醫(yī)療保健、環(huán)境可持續(xù)發(fā)展與生產(chǎn)力提升中扮演越來越重要的角色,Arm的技術也正被采用在各種多元的應用中,給全世界帶來積極的影響。最近的實例包括:
·Arm與Neocortix公司合作提供Arm 64位計算的支持,促成了Folding@home與Rosetta@home兩個項目,項目利用數(shù)十億顆Arm架構設備的閑置計算容量,協(xié)助醫(yī)學研究人員對抗新冠肺炎病毒。
·Arm的伙伴Hypergiant公司致力于探索AI技術的使用,改善可從大氣中移除二氧化碳的藻類生物反應器(該Eos生物反應器由Arm CPU所賦能)。
·在印度尼西亞的一個項目中,Rainforest Connection組織與保育人士合作,部署基于Arm CPU與GPU技術的設備,監(jiān)聽所在地每一處重型機器與電鋸的聲音,以打擊非法盜伐。
隨著Armv9架構的落地以及5G、AI等前沿新興技術的融合突破,相信會有越來越多的人類生活應用場景在潛移默化中逐漸改變的。
Arm陣營CPU架構也進入64位時代
ARM日前明確表示了這代指令集升級64位的決心,官方聲明中指出2023年ARM所有的大小核架構都將采用64位,32位指令屆時會被淘汰。至于之前擔心放棄32位會導致兼容之類的問題,ARM認為64位已經(jīng)是成熟的技術,進入純64位時代沒問題。
在手機處理器中,蘋果2013年發(fā)布的iPhone 5s是首個支持64位的,A7處理器首發(fā)ARM 64位架構,之后高通在驍龍810上也支持64位了,安卓5.0之后谷歌也原生支持了64位ARM處理器了。
國內市場,今年4月份小米應用商店、OPPO軟件商店、vivo應用商店、騰訊應用寶、百度手機助手宣布,今后發(fā)布于各應用商店的所有應用必須有序支持64位Arm架構,今年底前全體應用及游戲均需按計劃上傳含有64位構建的APK(涵蓋存量應用更新及新版本發(fā)布)。按照時間表,中國市場所有的移動安卓應用程序定于2022年8月底前全面普及64位。
快速跟進的合作伙伴
面對未來可期的Armv9,Arm各合作伙伴也是相當?shù)姆e極地跟進。在5月31日的臺北電腦展上-ARM CEO Simon Segars公開透露,聯(lián)發(fā)科是Arm的長期合作伙伴,每年出貨數(shù)億顆Arm芯片,年底前也將推出首款基于Armv9架構的新品。聯(lián)發(fā)科則表示Armv9會給下一代天璣5G產(chǎn)品賦予新的能力,帶來更好的體驗。
此外,有業(yè)內人士爆料稱高通正在開發(fā)一款代號為SM8450'Waipio的芯片,將作為驍龍888(SM8350)的繼任者,同樣會基于Armv9架構以及4nm工藝。
隨著上游芯片的出現(xiàn),相信搭載Armv9架構的終端產(chǎn)品也會快速進入市場。
盯上數(shù)據(jù)中心市場的Arm陣營
以往Intel和AMD兩大陣營在數(shù)據(jù)中心市場擁有絕對的話語權,而今天,雖然兩家依舊強大,但Arm陣營卻依托Armv9架構開始攻城略地。Arm公布了Ne。verse V1和N2服務器芯片平臺的最新性能數(shù)據(jù),其處理能力比上一代N1提高了40%~50%。Neoverse V1平臺首次支持可伸縮矢量擴展(SVE,N2平臺則率先采用全新Armv9架構的平臺,擁有比N1更高的核心數(shù)、性能和能效。盡管Arm并未直接對比Neoverse平臺與英特爾、AMD產(chǎn)品的性能,但從圖中可以看到,Neoverse系列芯片已經(jīng)非常有競爭力。
基于Neoverse平臺的新功能,Arm合作伙伴及客戶能更加順利地實現(xiàn)從云端到邊緣的部署。在云服務方面,騰訊與Arm持續(xù)合作,騰訊在硬件測試和軟件支持方面持續(xù)投入,使其在云應用上能采用Arm Neoverse技術,每瓦性能表現(xiàn)出色,軟件部分既支持已編譯和解譯的代碼庫,也支持為這些代碼庫提供支撐的微服務框架。
阿里云在即將上線的基于Arm架構ECS實例上完成了測試,并在SPECjbb測試數(shù)據(jù)中表現(xiàn)出色,通過雙方緊密合作,基于Arm架構運行的DragonWell JDK性能提高了50%。用戶及開發(fā)者現(xiàn)可到阿里云網(wǎng)站上注冊,獲取Arm系列實例的受邀測試。
除了在主流應用用例中,Graviton2和Neoverse也被應用于更多專用處理的應用場景。例如在EDA方面,Arm獲得了所有主要工具供應商的支持,并且詳細計劃了Arm如何將EDA的工作負載移上云端。對于目前運行的各種工作負載和應用程序,Arm正嘗試推出能兼顧高算力和低功耗的計算解決方案,這對于主導x86架構的服務器處理器供應商英特爾和AMD無疑正造成新的沖擊。
寫在最后:
在公開場合中,Arm高級副總裁兼終端設備事業(yè)部總經(jīng)理Paul Williamson表示“我們正致力于將Armv9技術引入到各個領域,以系統(tǒng)級設計最大限度地提高性能。安全的專用處理能力所具備的諸多優(yōu)勢,意味著基于Arm架構的計算技術正在構建超越智能手機市場以外的領導地位,借助移動生態(tài)系統(tǒng)帶來的巨大規(guī)模優(yōu)勢,在筆記本電腦、臺式機、云等應用領域打造領先的解決方案?!盇rm全新的全面計算解決方案采用系統(tǒng)范圍的整體優(yōu)化方法,橫跨硬件中、物理IP、軟件、工具和標準。
全面計算解決方案也將解鎖整個生態(tài)系統(tǒng)的新體驗,例如,專為移動設備設計、支持AI功能的交互式應用場景,可以使用戶身臨其境觀看電視中豐富的8K內容。所有的這一切再加上安全技術作為基礎,將為未來十年構建可信的數(shù)字化服務。