作為一種可編程邏輯器件,F(xiàn)PGA 在20 多年中已從電子設(shè)計的外圍器件逐漸演變?yōu)閿?shù)字系統(tǒng)的核心。隨著云計算、人工智能時代的到來,善長數(shù)據(jù)并行計算、更加靈活和低延遲的FPGA 將受到更多關(guān)注,F(xiàn)PGA 廠商也推出不同類型的解決方案加以應(yīng)對——異構(gòu)計算平臺化、IP 化,F(xiàn)PGA 正展現(xiàn)出更多新的發(fā)展趨勢。
云計算、人工智能的應(yīng)用發(fā)展,對芯片的計算力提出了更高要求,F(xiàn)PGA 可以同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,具備更大的靈活性。很多使用通用處理器或ASIC 難以實現(xiàn)的底層硬件控制操作,利用FPGA 可以很方便的實現(xiàn)。因此,近年來FPGA受到越來越多的關(guān)注和應(yīng)用。
“AI 推斷需求的指數(shù)級增長,需要特定架構(gòu)(DSA)以達(dá)到最大效率。然而,與AI 創(chuàng)新的速度相比,固定硬件的DSA 開發(fā)周期太過漫長?!辟愳`思細(xì)分核心市場副總裁Yousef Khalilollahi指出:“FPGA提供靈活應(yīng)變的平臺,支持可隨時根據(jù)最新AI 技術(shù)定制的DSA,而且無需坐等漫長硅片研發(fā)周期?!?/p>
微軟亞洲研究院異構(gòu)計算組副研究員張宸在此前舉辦的“第六屆中國FPGA 產(chǎn)業(yè)發(fā)展論壇”上也指出,這些年人工智能的崛起,依靠的是深度神經(jīng)網(wǎng)絡(luò)算法大型多層的網(wǎng)絡(luò)模型,典型的有循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)。這樣的模型一次推斷(inference)通常需要數(shù)十億甚至上百億次的運(yùn)算,而在線服務(wù)系統(tǒng)的響應(yīng)時間在毫秒量級。這就意味著需要每秒上萬億次(TFLOPS)甚至百萬億次的運(yùn)算性能,同時對器件的體積、功耗還有一定的約束。這使得人們期待的數(shù)據(jù)中心高性能計算硬件應(yīng)當(dāng)具備如下優(yōu)勢:低延遲、低開銷和規(guī)?;?。在數(shù)據(jù)中心,F(xiàn)PGA 相比GPU 的核心優(yōu)勢在于低延遲,使用FPGA 來加速的話,只需要微秒級的PCIe 延遲,微軟現(xiàn)在的FPGA 是作為一塊PCIe 加速卡。對通信密集型任務(wù),F(xiàn)PGA 相比CPU、GPU 的優(yōu)勢更大。
在此情況下,近年來,F(xiàn)PGA 的應(yīng)用領(lǐng)域正在不斷拓展,市場規(guī)模也不斷地擴(kuò)大。研調(diào)機(jī)構(gòu)Global Market Insights 的報告稱,2022年FPGA 規(guī)模有望超過99.8 億美元。根據(jù)Semico Research 預(yù)測數(shù)據(jù),僅在人工智能應(yīng)用中,F(xiàn)PGA 的市場規(guī)模將在未來4年內(nèi)增長3 倍,達(dá)到52 億美元。
面對拓展越來越大的應(yīng)用趨勢,各FPGA 廠商也在推出不同的解決方案。這些解決方案反應(yīng)了不同廠商面對新市場需求形成不同的發(fā)展策略,也對FPGA 的技術(shù)趨勢形成了不同影響。
去年,賽靈思在其2018 開發(fā)者大會(XDF)上發(fā)布了業(yè)界首款7nm 自適應(yīng)計算加速平臺(ACAP)產(chǎn)品Versal。ACAP 的核心是新一代的 FPGA 架構(gòu),并結(jié)合了分布式存儲器與硬件可編程DSP 模塊、一個多核SoC 以及一個或多個軟件可編程且同時又具備硬件靈活應(yīng)變性的計算引擎。從Versal ACAP 的推出可以看出,賽靈思正在試圖改變以往以FPGA 為單一核心的狀況,朝著異構(gòu)計算平臺化發(fā)展,希望以此將不同種類的算法分配到更合適的異構(gòu)引擎當(dāng)中。新平臺可以支持更多應(yīng)用,適應(yīng)不同的開發(fā)者。正如Yousef Khalilollahi 所言:“單獨(dú)一個計算體系結(jié)構(gòu),無法滿足當(dāng)今最流行的應(yīng)用所需要的性能和功耗要求。在后摩爾定律時代,異構(gòu)計算是唯一的發(fā)展之路。”
對于英特爾來說,對FPGA 的發(fā)展策略則是更多地整合多種處理器產(chǎn)品組合,面向云端提供綜合性計算解決方案。
在日前舉辦的“英特爾公司中國媒體紛享會”上,英特爾中國研究院院長宋繼強(qiáng)提出“超異構(gòu)計算”概念,其中就包括了在未來芯片架構(gòu)設(shè)計上進(jìn)行靈活性的組合部署,實現(xiàn)CPU、FPGA、GPU 等處理器的組合,顯示了英特爾將基于其在云計算上的強(qiáng)大實力,把服務(wù)器CPU 與FPGA 的加速功能進(jìn)行整合。FPGA 正越來越深入地嵌入到英特爾云端處理解決方案當(dāng)中。英特爾數(shù)據(jù)中心事業(yè)部副總裁Caroline Y Chan 也表示,隨著5G網(wǎng)絡(luò)的建設(shè),像是快速部署無線網(wǎng)絡(luò)、確保網(wǎng)絡(luò)性能、建置虛擬化環(huán)境等,都是必須完成的工作。而FPGA 的優(yōu)勢十分明顯,在實現(xiàn)網(wǎng)絡(luò)虛擬化加快當(dāng)中勢必會使用到它。另外,其可編程的特性也為網(wǎng)絡(luò)新增功能提供了更多靈活性與可擴(kuò)展性。
Achronix 公司近日發(fā)布的Speedster7t 代表了另一種發(fā)展趨勢,其力圖將FPGA 的可編程性與ASIC 的布線結(jié)構(gòu)和計算引擎相結(jié)合,通過對二維片上網(wǎng)絡(luò)(2D NoC),以及高密度全新機(jī)器學(xué)習(xí)處理器(MLP)模塊陣列等的集成,簡化用戶設(shè)計,以應(yīng)對人工智能機(jī)器學(xué)習(xí)應(yīng)用的需求。“Speedster7t系統(tǒng)將數(shù)學(xué)函數(shù)、存儲器和可編程性整合到機(jī)器學(xué)習(xí)處理器中,再結(jié)合交叉芯片、二維NoC 結(jié)構(gòu),可以確保整個器件中數(shù)據(jù)自由流動。而在人工智能機(jī)器學(xué)習(xí)應(yīng)用中,內(nèi)存帶寬就是一切,Speedster7t 在這方面可以提供令人印象深刻的性能指標(biāo)?!?Achronix Semiconductor 總裁兼首席執(zhí)行官Robert Blake 表示。
不同于CPU、GPU 等在移動時代快速實現(xiàn)IP 化的發(fā)展趨勢,嵌入式FPGA(eFPGA)一直沒有成為市場的主流。不過,隨著云計算、人工智能時代的到來,eFPGA 的市場接受度有望進(jìn)一步提升,成為FPGA 產(chǎn)品的主要發(fā)展趨勢之一。
對此,Robert Blake 指出,F(xiàn)PGA 是可以有效地實現(xiàn)IP 化。eFPGA 具有易用性,大大降低了使用門檻,可以快速滿足用戶多樣化需求,無論是系統(tǒng)級還是芯片級都可以支持。這在人工智能時代非常重要,特別是在邊緣側(cè)計算中受到歡迎。事實上,現(xiàn)在有很多用戶在尋問FPGA 的IP 問題。相信未來將有越來越多IP 化的FPGA 被應(yīng)用。
eFPGA 是指將一個或多個FPGA 以IP 的形式嵌入ASIC、ASSP 或SoC 等芯片中的發(fā)展模式。eFPGA 的特色之一是易用性,它降低了客戶集成FPGA 加速器的門檻??蛻敉ㄟ^定制其邏輯、Ram 和Dsp 資源需求,可以將多個IP 進(jìn)行組合,以便為特定的應(yīng)用創(chuàng)建優(yōu)化的可編程功能。這種發(fā)展模式在CPU 和GPU 等芯片中被大量使用,但在FPGA 上卻沒有得到推廣。
“eFPGA 是令人興奮的新工具,它使SoC 架構(gòu)師可以使他們的芯片更加靈活和可重新配置。” Robert Blake 表示。
(來源:電子信息產(chǎn)業(yè)網(wǎng))