英偉達(dá)2023年的營(yíng)業(yè)收入為609.22億美元,同比增長(zhǎng)125.85%;凈利潤(rùn)為297.60億美元,同比增長(zhǎng)581.32%,業(yè)績(jī)創(chuàng)出歷史新高。為了不失去中國(guó)市場(chǎng)與業(yè)績(jī)持續(xù)增長(zhǎng)的需要,英偉達(dá)為中國(guó)市場(chǎng)定制了三款“特供”芯片,分別為H20、L20、L2,且于近期開(kāi)始接受預(yù)定。
國(guó)內(nèi)方面,以景嘉微、海光信息、龍芯中科等為代表的GPU廠商業(yè)績(jī)并不樂(lè)觀,2023年僅有海光信息業(yè)績(jī)實(shí)現(xiàn)顯著的正向增長(zhǎng)。不過(guò),在此輪GPU全球競(jìng)爭(zhēng)中,國(guó)內(nèi)廠商似乎并沒(méi)有過(guò)于落后,從數(shù)據(jù)來(lái)看,華為昇騰910B與H20性能大體相當(dāng),在某些關(guān)鍵領(lǐng)域的FP32性能表現(xiàn)略優(yōu)于后者,海光信息深算二號(hào)性能相比上一代產(chǎn)品提升了近一倍,昆侖芯、摩爾線程等公司產(chǎn)品也在持續(xù)迭代中。
據(jù)業(yè)績(jī)預(yù)告,2023年,海光信息營(yíng)業(yè)收入為60.12億元,同比增長(zhǎng)17.30%;歸屬母公司所有者凈利潤(rùn)為12.62億元,同比增長(zhǎng)57.11%,其業(yè)績(jī)?cè)鲩L(zhǎng)遠(yuǎn)超國(guó)內(nèi)其他競(jìng)爭(zhēng)對(duì)手。
CPU是海光信息主要的收入與利潤(rùn)來(lái)源,因此,海光信息業(yè)績(jī)?cè)鲩L(zhǎng)的核心原因在于下游服務(wù)器需求旺盛。
據(jù)IDC數(shù)據(jù),中國(guó)服務(wù)器市場(chǎng)快速增長(zhǎng)。2022年,中國(guó)服務(wù)器市場(chǎng)規(guī)模為288億美元,2018-2022年CARG高達(dá)20.20%,而隨著東數(shù)西算項(xiàng)目的推進(jìn)以及國(guó)產(chǎn)AI大模型應(yīng)用的爆發(fā),國(guó)內(nèi)服務(wù)器需求將穩(wěn)步上升,預(yù)計(jì)2027年將達(dá)到454億美元。
需要指出的是,X86仍為全球服務(wù)器主流架構(gòu)。據(jù)IDC數(shù)據(jù),2022年,全球X86服務(wù)器市場(chǎng)規(guī)模達(dá)1109.55億美元,占服務(wù)器總市場(chǎng)的比重為87.50%。從中國(guó)市場(chǎng)來(lái)看,2023年第一季度出貨量中,X86架構(gòu)服務(wù)器出貨量占比高達(dá)92.40%。
而且,根據(jù)Mercury Research數(shù)據(jù),2021年第四季度,X86 CPU市場(chǎng)幾乎被海外巨頭壟斷,Intel占74%、AMD占比為26%,在中國(guó)市場(chǎng)亦是如此,X86 CPU芯片國(guó)產(chǎn)化率較低。
海光信息CPU產(chǎn)品可以實(shí)現(xiàn)上層應(yīng)用無(wú)縫切換,減少遷移成本,相對(duì)于ARM服務(wù)器遷移風(fēng)險(xiǎn)小,但在2020年,其產(chǎn)品出貨量?jī)H占國(guó)內(nèi)總體市場(chǎng)份額的3.75%。
幸運(yùn)的是,國(guó)內(nèi)信創(chuàng)產(chǎn)業(yè)的發(fā)展推動(dòng)了海光信息CPU產(chǎn)品出貨量的增長(zhǎng)。2022年9月,政府下發(fā)79號(hào)文,要求到2027年,央企、國(guó)企全面完成國(guó)產(chǎn)替代。
據(jù)東吳證券數(shù)據(jù),2022年,部分央企、國(guó)企服務(wù)器招標(biāo)國(guó)產(chǎn)化比例已經(jīng)超過(guò)了30%;而且,2023年,銀行、運(yùn)營(yíng)商等央企、國(guó)企還放出純國(guó)產(chǎn)服務(wù)器招標(biāo),其中海光信息和華為是行業(yè)信創(chuàng)服務(wù)器兩大主要供應(yīng)商。
除了國(guó)產(chǎn)替代的影響,規(guī)模效應(yīng)使得自研無(wú)形資產(chǎn)攤銷(xiāo)金額占營(yíng)業(yè)收入的比重下降也是促進(jìn)海光信息業(yè)績(jī)?cè)鲩L(zhǎng)的重要因素。
據(jù)財(cái)報(bào)數(shù)據(jù),海光信息一直保持高強(qiáng)度的研發(fā)投入。2021-2022年,公司研發(fā)支出資本化金額分別為8.40億元、6.54億元,占當(dāng)期研發(fā)投入的比重分別為53.02%、31.61%。
截至2023年上半年,海光信息賬面無(wú)形資產(chǎn)非專利技術(shù)期末余額為33.15億元,按照3-10的期限進(jìn)行攤銷(xiāo),當(dāng)期計(jì)提金額3.27億元,而隨著出貨量的增加,規(guī)模效應(yīng)顯現(xiàn),公司毛利率逐步上升,由2019年的37.31%增至2023年前三季度的60.63%。
根據(jù)中國(guó)通信院發(fā)布的《中國(guó)算力發(fā)展指數(shù)白皮書(shū)》數(shù)據(jù),2022年,全球智能算力約451E Flops(基于FP32計(jì)算),預(yù)計(jì)到2030年,全球智能算力規(guī)模將達(dá)到52.5Z Flops,全球智能算力快速增長(zhǎng)。
對(duì)于中國(guó)市場(chǎng),根據(jù)IDC和浪潮信息發(fā)布的《2023-2024人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》,2022年,中國(guó)智能算力規(guī)模為259.9E Flops(基于FP16計(jì)算),預(yù)計(jì)到2027年達(dá)到1117.4E Flops,2022-2027年CAGR約為33.90%。
具體至數(shù)值層面,Gartner研究顯示,2022年,全球AI芯片市場(chǎng)規(guī)模為442.20億美元,預(yù)計(jì)2027年將增至1149億美元。而在中國(guó)市場(chǎng),頭豹研究院數(shù)據(jù)顯示,2022年,中國(guó)AI芯片市場(chǎng)規(guī)模為954億元,預(yù)計(jì)到2025年達(dá)到1979億元。
需要指出的是,AI芯片可以分為GPU、FPGA、Asic,其中GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA、Asic則是針對(duì)人工智能需求特征的半定制和全定制芯片。根據(jù)TrendForce發(fā)布的數(shù)據(jù),英偉達(dá)GPU為AI服務(wù)器主流芯片,其市場(chǎng)占有率約為60%-70%;其次為云端廠商自主研發(fā)的Asic芯片,市場(chǎng)占有率約為20%左右。
另外,全球GPU市場(chǎng)呈現(xiàn)“一超一強(qiáng)”的競(jìng)爭(zhēng)格局。根據(jù)IDC數(shù)據(jù),2021年,英偉達(dá)在企業(yè)級(jí)GPU市場(chǎng)份額為91.40%,AMD市場(chǎng)占有率為8.50%。
更為重要的是,由于美國(guó)對(duì)于中國(guó)的制裁加劇,國(guó)內(nèi)企業(yè)很難獲得先進(jìn)的AI芯片,2023年10月17日,美國(guó)商務(wù)部宣布計(jì)劃限制向中國(guó)出售更先進(jìn)的A芯片,除了H100、A100、L40等產(chǎn)品外,新的政策還將將限制英偉達(dá)A800、H800芯片的出口。
為了不失去中國(guó)市場(chǎng)以及遵守美國(guó)的禁令,英偉達(dá)針對(duì)中國(guó)區(qū)開(kāi)發(fā)出改良版AI芯片,包括H20、L20以及L2,其中H20性能最強(qiáng),其采用中國(guó)臺(tái)灣地區(qū)的臺(tái)積電的CoWos封裝,理論上等于H100的20%綜合算力性能,另?yè)?jù)路透社消息,英偉達(dá)對(duì)H20中國(guó)渠道定價(jià)設(shè)定在1.20萬(wàn)-1.50萬(wàn)美元。
那么,英偉達(dá)真的可以憑借“閹割版”的H100在中國(guó)GPU市場(chǎng)實(shí)現(xiàn)降維打擊嗎?
答案是否定的,近年來(lái),中國(guó)頒布了一系列支持采用國(guó)產(chǎn)AI芯片的政策,例如北京頒布政策明確推動(dòng)國(guó)產(chǎn)人工智能芯片實(shí)現(xiàn)突破,上海市提出拓展國(guó)產(chǎn)芯片應(yīng)用,推廣國(guó)產(chǎn)算法框架。
與此同時(shí),以華為、海光信息、摩爾線程等為代表的GPU廠商也先后投入大量研發(fā)資金,其產(chǎn)品性能也持續(xù)迭代,甚至在部分領(lǐng)域已不弱于H20。
據(jù)國(guó)海證券研報(bào),在FP16精度下,H20算力為148 TFLOPS,F(xiàn)P32精度算力為44 TFLOPS,F(xiàn)P64精度算力為1 TFLOPS;華為昇騰910在FP16精度下算力為320 TFLOPS,昇騰910B算力為376 TFLOPS。更為重要的是,據(jù)IT之家消息,在某些關(guān)鍵領(lǐng)域的FP32精度下算力,英偉達(dá)H20表現(xiàn)不如華為昇騰910B,而且昇騰910B市場(chǎng)價(jià)格約為12萬(wàn)元左右。綜合來(lái)看,與華為昇騰910B相比,H20并沒(méi)有明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。
海光信息深算二號(hào)性能同樣表現(xiàn)不俗,其性能相比深算一號(hào)提升了一倍。
公開(kāi)信息顯示,深算一號(hào)FP16精度下算力為24.5 TFLOPS,F(xiàn)P32精度算力為11.5 TFLOPS,F(xiàn)P64精度算力為10.1 TFLOPS;三類精度下,深算二號(hào)的算力分別為49 TFLOPS、23 TFLOPS、10.2 TFLOPS。通過(guò)對(duì)比,海光深算二號(hào)在FP16與FP32精度下算力低于英偉達(dá)H20,但在高精度FP64的算力優(yōu)于H20。
值得一提的是,據(jù)招股說(shuō)明書(shū),海光深算一號(hào)售價(jià)為1.93萬(wàn)元,低于英偉達(dá)A100的5萬(wàn)元,依次推算,海光深算二號(hào)售價(jià)大概率低于英偉達(dá)的H20,主打高性價(jià)比。
對(duì)于GPU來(lái)說(shuō),產(chǎn)品性能是一個(gè)門(mén)檻,另一個(gè)重要門(mén)檻是易用性,這涉及到生態(tài)問(wèn)題,國(guó)外大廠經(jīng)過(guò)多年的發(fā)展,已經(jīng)形成了比較強(qiáng)的生態(tài)。
相對(duì)樂(lè)觀的是,國(guó)內(nèi)科技企業(yè)正在積極適配國(guó)產(chǎn)芯片。據(jù)路透社消息,百度為200臺(tái)服務(wù)器訂購(gòu)1600顆華為昇騰910B芯片。2023年11月8日,在世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)上,360集團(tuán)創(chuàng)始人周鴻祎表示,360將采購(gòu)華為1000片左右AI芯片,并與華為合作將AI框架移植到昇騰910B上。
2023年11月6日,寒武紀(jì)也對(duì)外表示,思元系列云端智能加速卡與百川智能旗下大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配,昆侖芯、摩爾線程等公司新品也持續(xù)迭代,國(guó)產(chǎn)GPU進(jìn)入高速發(fā)展階段。
當(dāng)然,國(guó)內(nèi)AI芯片廠商在發(fā)展的過(guò)程中也存在一些問(wèn)題,例如國(guó)產(chǎn)AI芯片多采用NPU架構(gòu),例如華為昇騰、寒武紀(jì)等,NPU架構(gòu)的優(yōu)點(diǎn)在于體積小、功耗低、平均性能強(qiáng),但其問(wèn)題在于前期投入成本高、不可編輯,且技術(shù)風(fēng)險(xiǎn)較大。