張平
2022年2月17日,英特爾在線上舉行了2022年投資者大會,主要介紹了未來一年乃至更長期的發(fā)展戰(zhàn)略,其公布的技術(shù)發(fā)展信息涵蓋數(shù)據(jù)中心和人工智能、客戶端計算、加速計算和圖形、代工業(yè)務(wù)、軟件和先進(jìn)技術(shù)、網(wǎng)絡(luò)和邊緣計算以及未來的技術(shù)展望。會上,英特爾對2021年6月才成立的加速計算和圖形AXG部門的規(guī)劃最為引人關(guān)注,從中我們不僅可以透過行業(yè)巨頭的眼睛去觀察未來的計算世界,更可以了解科技將如何擁抱未來。
擁抱市場更為開放
英特爾將Core計算劃分為三個階段,1980年到2000年左右為第一階段,Web 1.0連接了大約10億臺x86架構(gòu)的PC終端,這個時代的主要任務(wù)是“數(shù)據(jù)化一切”。第二階段則是從2000年至今,計算基于移動和云端,大約有100億臺連接上云端的設(shè)備,這個階段的主旨是“連接一切”,客戶端方面則以創(chuàng)意、創(chuàng)作和Web 2.0為主。第三階段,則是2022年以后的時代,主要設(shè)備包括x86CPU、英特爾Xe架構(gòu)GPU以及相關(guān)軟件,大約有1000f乙設(shè)備連接,實現(xiàn)“無處不在的智能”。其主要的呈現(xiàn)方式是為每一個人賦能,實現(xiàn)每個人的內(nèi)容創(chuàng)造和數(shù)字化產(chǎn)權(quán),這個時代也被稱為Web 3.0時代。
英特爾在加速計算和圖形部分所需要執(zhí)行的任務(wù),就是為第二、第三個階段的應(yīng)用需求提供算力。英特爾認(rèn)為2022年以后,將出現(xiàn)智能機器人、虛擬經(jīng)濟(jì)等內(nèi)容,所需要的算力更為恐怖。現(xiàn)在人們大概需要10的10 -15次方的算力,未來可能會提升至10的30次方。這種數(shù)量級的大幅度增長依靠的就是持續(xù)增強的芯片算力和軟件平臺。
為此,英特爾將傳統(tǒng)的核心計算和加速計算結(jié)合起來,在傳統(tǒng)計算方面,數(shù)字化一切、連接一切、賦能一切是其運作的核心;加速計算方面,游戲、媒體、HPC以及虛擬經(jīng)濟(jì)是計算核心。這兩者通過Zetta級別的算力以及元宇宙結(jié)合在一起,創(chuàng)造“無處不在的AI”和“持久沉浸的網(wǎng)絡(luò)”體驗。為了完成上述目標(biāo)、持續(xù)推動計算發(fā)展,英特爾AXG將分為三個部門,分別是超級計算(主管HPC-AI以及媒體)、自定義計算(區(qū)塊鏈、邊緣計算)以及虛擬計算(游戲、內(nèi)容創(chuàng)作和元宇宙)。英特爾估計,現(xiàn)在AXG部門的營收大約是100億美元,而到2026年,這個數(shù)據(jù)將暴漲到1550f乙美元,其中超級計算部分年化增長率高達(dá)23%、自定義計算部分高達(dá)11%,虛擬計算部分增長率也有4%,2026年這三個部分將帶來450億美元、300億美元、250f乙美元的營收,其余的550億美元營收來自軟件、系統(tǒng)和服務(wù)。
AXG部門在具體實現(xiàn)相關(guān)目標(biāo)的時候,需要將整個計算系統(tǒng)進(jìn)行細(xì)分。在Xe系統(tǒng)沒有加入英特爾的系統(tǒng)架構(gòu)時,英特爾將計算任務(wù)從內(nèi)到外分為工藝、封裝、內(nèi)存、10、架構(gòu)以及軟件系統(tǒng)等多個部分。英特爾在工藝方面計劃未來通過Intel 7、Intel 4、Intel 3以及Intel20A、Intel 18A等工藝來實現(xiàn)自己的目標(biāo)。值得注意的是Intel 4,之前它的名稱是Intel 5,但是這—次,英特爾認(rèn)為其能夠達(dá)到更高的效能,因此改名為Intel 4。在封裝方面,英特爾提出了利用EMIB、Foveros、Foveros Omni和Foveros Direct等技術(shù)綜合實現(xiàn)多芯片和封裝架構(gòu)的升級。內(nèi)存方面則是DDR和HBM,10方面通過Ethernet以及PCle,架構(gòu)方面則是未來的x86性能核心和x86效能核心。最后則是龐大的軟件系統(tǒng),英特爾將持續(xù)為Unity、KVM、vmware、Windows、Linux、XGBoost等:一攬子軟件提供支持,使其更好、更快地運行在英特爾的軟硬件平臺上。
在英特爾加入了Xe架構(gòu)家族之后情況發(fā)生了變化。在內(nèi)存方面,英特爾增加了RAMBO緩存,這是—種連接CPU、GPU和HBM緩存的中介層,用于改善不同檔次緩存之間的性能鴻溝,實現(xiàn)比較平穩(wěn)的性能過渡。在10方面,英特爾加入了Xe Link以及CXL,其中前者是用于Xe GPU互聯(lián)的總線,后者是英特爾基于PCle 5.0提出的連接擴展,可以使得內(nèi)存和設(shè)備存儲在保持緩存一致性的情況下,還擁有Bias靈活性,這種功能對大規(guī)模計算來說是非常重要的。在架構(gòu)方面,英特爾加入了Xe LP、Xe HPG以及Xe HPC等多種GPU架構(gòu),為未來的加速計算打下堅實的基礎(chǔ)。
不過,這還沒有結(jié)束,英特爾龐大的IP庫資源還需要全新的IDM2.0計劃的加持。在IDM 1.0時代,所有這些IP都被英特爾綁定,尤其是制造工藝只依賴英特爾這一個單一來源。但是進(jìn)入IDM 2.0時代后,英特爾對待市場和技術(shù)更為開放,在工藝方面加入了臺積電作為合作伙伴,英特爾接下來將利用臺積電的N7、N6、N5等工藝加強了自己的產(chǎn)能和技術(shù)實力。GPU路線圖
在了解了英特爾有關(guān)產(chǎn)業(yè)的一些宏大構(gòu)想之后,再來看看英特爾在虛擬計算領(lǐng)域的進(jìn)展。
英特爾目前在虛擬計算領(lǐng)域的產(chǎn)品主要是支持英特爾DeepLink技術(shù)、具有x86核心和集成顯卡的處理器以及英特爾ARC獨立GPU。Deep Link技術(shù)是英特爾推出的可以自動同時調(diào)用集成顯卡和獨立顯卡功能乃至性能的技術(shù)。英特爾宣稱,目前旗下的ARC獨立顯卡在OEM廠商中擁有超過50款設(shè)計,超過100個軟件方面的合作伙伴(主要針對XeSS技術(shù)和Deep Link技術(shù)),2022年將推出首款獨立顯卡,筆記本電腦的產(chǎn)品在第一季度推出,面向桌面的產(chǎn)品在第二季度推出,第三季度還將推出面向工作站的產(chǎn)品,預(yù)計全年英特爾將銷售400萬塊ARC顯卡。
2022年也就是即將推出的英特爾首款A(yù)RC獨立顯卡采用的架構(gòu)代號為“Alchemist”,2023到2024年將推出Battlemage架構(gòu)和對應(yīng)的產(chǎn)品,2024年以后將推出Celestial架構(gòu)的產(chǎn)品,整個發(fā)展節(jié)奏基本上是一年推出一代產(chǎn)品。與之搭配的CPU平臺則分別是2022年的Alder Lake和Raptor Lake、2023-2024年的Meteor Lake或者下一代產(chǎn)品、2024年的更下一代產(chǎn)品。值得注意的是,如果使用英特爾CPU(包含集成的GPU)搭配ARC獨立顯卡,用戶將會獲得Deep Link和XeSS技術(shù)。并且從下一代開始,英特爾將以Tile GPU、SoC和CPU的方式來設(shè)計桌面處理器產(chǎn)品,其具體的指代還有待英特爾進(jìn)一步給出結(jié)果。
最后在ARC顯卡和相關(guān)產(chǎn)品部分還要提到的是,英特爾目前正在推進(jìn)名為“Project Endgame”的云游戲平臺,計劃在2022年上線。這個平臺將采用各種類型的”XPU”產(chǎn)品,不出意外的話,將以英特爾自家的產(chǎn)品為主。加強視頻和媒體功能
本次加速計算和圖形部分的另一個重要內(nèi)容則是視頻和媒體部分的加強。英特爾給出的數(shù)據(jù)顯示大約有80%的互聯(lián)網(wǎng)內(nèi)容是以視頻的形式存在的。這里面包合了直播、優(yōu)質(zhì)內(nèi)容等,比如目前最流行的短視頻社交和vlog等。這里面的計算需求包括視頻框架gstremer、AI工具AI Analytics Toolkit、視頻程序FFMPEG以及AI相關(guān)視頻處理軟件OpenVINO等,針對的應(yīng)用包括視頻轉(zhuǎn)碼、云游戲、虛擬桌面、媒體AI處理等。針對這些功能,英特爾推出了名為Arctic Sound-M的數(shù)據(jù)中心GPU產(chǎn)品,并稱這款產(chǎn)品為唯一的開源媒體解決方案堆棧,且是首個支持AV1編碼的GPU產(chǎn)品。Arctic Sound-M目前可以提供四種重要應(yīng)用下的加速:一是媒體轉(zhuǎn)碼,Arctic Sound-M支持最多8條4K視頻流同時進(jìn)行處理,支持30多個1080p視頻流進(jìn)行同時處理;二是云游戲,Arctic Sound-M在720p分辨率下,最多同時支持30余個Android游戲同時運行;三是虛擬桌面,Arctic Sound-M能夠同時支持最多60個虛擬桌面應(yīng)用同時運行;四則是媒體A功口強功能,ArcticSound-M的最高算力在INT8模式下高達(dá)150TOPS,能夠輕松完成大量的AI相關(guān)計算任務(wù)。ArcticSound-M在2月發(fā)布會上就已經(jīng)進(jìn)入樣品階段,預(yù)計將在2022年中期正式發(fā)布。
另外,在HPC AI計算方面,目前英特爾的至強處理器已經(jīng)獲得了超級計算機高達(dá)85%的市場份額,之前依靠的是Xeon SapphireRapids產(chǎn)品。而今英特爾又再接再厲,發(fā)布了全新的Xeon SapphireRapids HBM版本,通過板載HBM存儲芯片,為處理器提供了更多的內(nèi)存帶寬,降低了處理器的內(nèi)存延遲所帶來的性能損失。英特爾宣稱,新的Xeon Sapphire RapidsHBM的內(nèi)存帶寬是之前非HBM產(chǎn)品的4倍,并且相比第三代Xeon處理器,其性能最高能夠達(dá)到2.8倍,這款產(chǎn)品將在2022年第二季度正式出貨。同樣是在HPC AI計算方面,英特爾之前預(yù)熱很多次的PonteVecchio終于要正式發(fā)布了,它將在今年晚些時候正式上市,首個用戶將會是美國國防部。英特爾宣稱Ponte Vecchio是超級算力GPU,目前主要用于搭建名為Aurora的超級計算機,這款超級計算機預(yù)計將獲得超過2Exa Flops的計算性能。單獨評價Ponte Vecchio的話,英特爾宣稱其性能也是之前的可比產(chǎn)品的大約2.6倍。
在算力目標(biāo)方面,英特爾計劃通過架構(gòu)、功耗、處理器和封裝、內(nèi)存和10方面的進(jìn)步,在2027年進(jìn)入Zetta級別計算能力,Zetta級別計算能力是指大約1024倍Exa級別,考慮到現(xiàn)在超級計算機的能力尚未達(dá)到Exa級別,也就是說,英特爾計劃在5年內(nèi)將系統(tǒng)性能最高提升1000倍,這是一個艱巨的任務(wù),英特爾在未來的時間段內(nèi)究竟還有哪些做法還有待觀察。
最后英特爾還梳理了—下未來的產(chǎn)品路線。英特爾認(rèn)為,超算市場目前’將由Arctic Sound-M、XeonSapphire Rapids HBM、PonteVecchio以及相應(yīng)的OneAPI、XeGPU、x86 CPU以及XPU來完成。在自定義計算市場目前的產(chǎn)品陣列是Blockchain Accelerator以及部分定制化的服務(wù)產(chǎn)品,其中前者是英特爾之前推出的區(qū)塊鏈加速器,用于數(shù)據(jù)貨幣相關(guān)應(yīng)用。而虛擬計算市場,英特爾將采用ARC獨立顯卡和后期的Celestial架構(gòu)所使用的多芯片封裝技術(shù)來占領(lǐng),當(dāng)然Deep Link技術(shù)也必不可少。英特爾的棋局
從計算的角度來看,英特爾在過去很長一段時間都是以CPU計算為主。CPU是典型的串行計算,邏輯計算能力強大但是無法做到同時處理大量的并行計算,而后者正是GPU的強項。在人們使用計算機的早期,串行計算占據(jù)主流地位,并行計算的需求還沒有如此凸顯。但是隨著GPU的發(fā)展、計算需求的發(fā)展,人們還是逐漸發(fā)現(xiàn),類似GPU這樣以并行計算為主的產(chǎn)品,在合適的環(huán)境、軟件和需求的配合下,能夠?qū)崿F(xiàn)比CPU強大百倍干倍的計算效能。于是,并行計算逐漸取代了串行計算,尤其是AI相關(guān)產(chǎn)業(yè)興起后,GPU以及各類AI加速芯片,更是以狂奔的速度,帶來了人類計算發(fā)展史上最大規(guī)模的擴張和前進(jìn)。
其實英特爾并非沒有為并行計算做過努力,英特爾在之前嘗試過采用眾多x86小核心組建Larrabee架構(gòu),實現(xiàn)片上大規(guī)模并行計算,但是這條路最終被證明難以和GPU抗衡,因此也以停產(chǎn)告終。最終,英特爾選擇重新進(jìn)入GPU產(chǎn)業(yè)界,推出了Xe架構(gòu)和相關(guān)產(chǎn)品,這一次英特爾應(yīng)該是走對了。
從目前的產(chǎn)品狀況來看,英特爾的首款A(yù)RC獨立顯卡ARCAlchemist即將在2022年上市,并且英特爾宣稱其全年銷量可達(dá)400萬片。從目前泄露的產(chǎn)品信息等內(nèi)容來看,ARC Alchemist的性能可能不會太強,比如其對位產(chǎn)品可能是RTX 3060甚至RTX 3060 Ti.而對更高端的RTX 3090等產(chǎn)品幾乎沒有威脅,況且2022年AMD和英偉達(dá)都要更新產(chǎn)品線,可能屆時ARC Alchemist只能定位中端。但是這并不意味著英特爾第一步走得不好。在GPU這類產(chǎn)品上,只有足夠多的用戶才能夠有下一代產(chǎn)品的改善,用戶會不斷地給出使用反饋和產(chǎn)品反饋,未來英特爾才可能根據(jù)這些信息不斷地改進(jìn)產(chǎn)品,提升性能和使用體驗。因此,只要有用戶、有市場,ARC系列就能夠持續(xù)存活,這樣一來,2022年的首批400萬片ARC獨立顯卡就顯得頗為重要了,這不但是英特爾給市場的信心,也是給自己未來發(fā)展奠定的基礎(chǔ)。
接下來,在擁有了Xe這樣的GPU架構(gòu)之后,英特爾在更多方面開始大展宏圖。比如面向數(shù)據(jù)中心的Arctic Sound-M,以及Xe-HPC等產(chǎn)品。這意味著英特爾開始進(jìn)入以GPU為主的計算市場,開始向英偉達(dá)的核心領(lǐng)域發(fā)起沖擊了。
和英偉達(dá)相比,英特爾也在本次發(fā)布會上更清晰地梳理了自己的優(yōu)勢。比如x86 CPU的資源、自家強大的制程支撐、各種高級封裝技術(shù)、各種內(nèi)存和10技術(shù)等,在這些諸多優(yōu)勢的加持下,再加上Xe架構(gòu)的相關(guān)產(chǎn)品,英特爾才有底氣說自己能夠在2026年進(jìn)入Zetta時代。相比之下,英偉達(dá)在GPU方面的確優(yōu)勢巨大,但是其余的部分包括CPU、先進(jìn)封裝、先進(jìn)工藝、存儲和10等,都需要業(yè)內(nèi)其他廠商的配合,這一點上英偉達(dá)面臨的風(fēng)險要更高一些。
從英特爾2022年的產(chǎn)業(yè)規(guī)劃來看,隨著首款高性能獨立顯卡上市,Xe架構(gòu)在計算市場逐漸鋪開,2022年將會是英特爾在加速計算和圖形市場開端的一年,這一年的走勢將決定英特爾未來數(shù)年如何面對這個市場和產(chǎn)業(yè)。