亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國大公司競逐GPU

        2023-07-04 11:57:43張家豪
        財(cái)經(jīng) 2023年13期
        關(guān)鍵詞:算力字節(jié)阿里

        張家豪

        從CPU到GPU,字節(jié)采購量的變化,也反映了如今大型科技公司的計(jì)算需求中,智能計(jì)算對(duì)通用計(jì)算的趕超。圖/視覺中國

        2022年下半年,生成式AI爆火的同時(shí),硅谷著名風(fēng)險(xiǎn)資本a16z走訪了數(shù)十家AI創(chuàng)業(yè)公司和大科技公司。其發(fā)現(xiàn),創(chuàng)業(yè)公司轉(zhuǎn)手就把80%-90%的早期融資款送給了云計(jì)算平臺(tái),以訓(xùn)練自己的模型。其估算,即便這些公司的產(chǎn)品成熟了,每年也得把10%-20%的營收送給云計(jì)算公司,相當(dāng)于一筆“AI稅”。

        這帶來了在云上提供模型能力和訓(xùn)練服務(wù),把算力租給其他客戶和創(chuàng)業(yè)公司的大市場。僅在國內(nèi),現(xiàn)在就至少有數(shù)十家創(chuàng)業(yè)公司和中小公司在自制復(fù)雜大語言模型,它們都得從云計(jì)算平臺(tái)租GPU(Graphics Processing Unit,圖形處理器)。據(jù)a16z測算,一個(gè)公司一年的AI運(yùn)算開支只有超過5000萬美元,才有足夠的規(guī)模效應(yīng)支撐自己批量采購GPU。

        據(jù)了解,今年春節(jié)后,擁有云計(jì)算業(yè)務(wù)的中國各互聯(lián)網(wǎng)大公司都向英偉達(dá)下了大單。字節(jié)今年向英偉達(dá)訂購了超過10億美元的GPU,另一家大公司的訂單也至少超過10億元人民幣。

        僅字節(jié)一家公司今年的訂單可能已接近英偉達(dá)去年在中國銷售的商用GPU總和。去年9月,美國政府發(fā)布對(duì)A100、H100(英偉達(dá)最新兩代數(shù)據(jù)中心商用GPU)的出口限制時(shí),英偉達(dá)曾回應(yīng)稱這可能影響去年四季度其在中國市場的4億美元(約合28億元人民幣)潛在銷售。以此推算,2022年全年英偉達(dá)數(shù)據(jù)中心GPU在中國的銷售額約為100億元人民幣。

        相比海外巨頭,中國大科技公司采購GPU更為急迫。過去兩年的降本增效中,一些云計(jì)算平臺(tái)減少了GPU采購,儲(chǔ)備不足。此外,誰也不敢保證,今天能買的高性能GPU,明天會(huì)不會(huì)就受到新的限制。

        從砍單到加購,同時(shí)內(nèi)部騰挪

        今年初之前,中國大型科技公司對(duì)GPU的需求還不溫不火。

        GPU在中國大型互聯(lián)網(wǎng)科技公司中主要有兩個(gè)用途:一是對(duì)內(nèi)支持業(yè)務(wù)和做一些前沿AI研究,二是把GPU放到云計(jì)算平臺(tái)上對(duì)外售賣。

        一名字節(jié)人士告訴《財(cái)經(jīng)》記者,2020年6月OpenAI發(fā)布GPT-3后,字節(jié)就曾訓(xùn)練了一個(gè)數(shù)十億參數(shù)的生成式語言大模型,當(dāng)時(shí)主要使用的GPU是A100前代產(chǎn)品V100。由于參數(shù)規(guī)模有限,這個(gè)模型生成能力一般,字節(jié)當(dāng)時(shí)看不到它的商業(yè)化可能性,“ROI(投資回報(bào)率)算不過來”,這次嘗試不了了之。

        阿里也曾在2018年-2019年積極采購GPU。一位阿里云人士稱,當(dāng)時(shí)阿里的采購量至少達(dá)到上萬塊規(guī)模,購買的型號(hào)主要是V100和英偉達(dá)更早前發(fā)布的T4。不過這批GPU中只有約十分之一給到了達(dá)摩院用作AI技術(shù)研發(fā)。2021年發(fā)布萬億參數(shù)大模型M6后,達(dá)摩院曾披露訓(xùn)練M6使用了480塊V100。

        阿里當(dāng)時(shí)購買的GPU,更多給到了阿里云用于對(duì)外租賃。但包括阿里云在內(nèi),一批中國云計(jì)算公司都高估了中國市場的AI需求。一位科技投資人稱,大模型熱潮之前,國內(nèi)主要云廠商上的GPU算力不是緊缺,而是愁賣,云廠商甚至得降價(jià)賣資源。去年阿里云先后降價(jià)六次,GPU租用價(jià)下降超兩成。

        在降本增效,追求“有質(zhì)量的增長”與利潤的背景下,據(jù)了解,阿里在2020年之后收縮了GPU采購規(guī)模,騰訊也在去年底砍單一批英偉達(dá)GPU。

        然而沒過多久后的2022年初,ChatGPT改變了所有人的看法,共識(shí)很快達(dá)成:大模型是不容錯(cuò)過的大機(jī)會(huì)。

        各公司創(chuàng)始人親自關(guān)注大模型進(jìn)展:字節(jié)跳動(dòng)創(chuàng)始人張一鳴開始看人工智能論文;阿里巴巴董事局主席張勇接手阿里云,在阿里云峰會(huì)發(fā)布阿里大模型進(jìn)展時(shí)稱,“所有行業(yè)、應(yīng)用、軟件、服務(wù),都值得基于大模型能力重做一遍”。

        一名字節(jié)人士稱,過去在字節(jié)內(nèi)部申請(qǐng)采購GPU時(shí),要說明投入產(chǎn)出比、業(yè)務(wù)優(yōu)先級(jí)和重要性。而現(xiàn)在大模型業(yè)務(wù)是公司戰(zhàn)略級(jí)別新業(yè)務(wù),暫時(shí)算不清ROI也必須投入。

        研發(fā)自己的通用大模型只是第一步,各公司的更大目標(biāo)是推出提供大模型能力的云服務(wù),這是真正可以匹配投入的大市場。

        微軟的云服務(wù)Azure在中國云計(jì)算市場本沒有太強(qiáng)存在感,入華十年來主要服務(wù)跨國公司的中國業(yè)務(wù)。但現(xiàn)在客戶得排隊(duì)等待,因?yàn)樗荗penAI商業(yè)化的唯一云代理商。

        阿里在4月的云峰會(huì)上再次強(qiáng)調(diào)MaaS(模型即服務(wù))是未來云計(jì)算趨勢(shì),在開放自研的通用基礎(chǔ)模型“通義千問”測試之外,還發(fā)布了一系列幫助客戶在云上訓(xùn)練、使用大模型的工具。不久后騰訊和字節(jié)火山引擎也先后發(fā)布自己的新版訓(xùn)練集群服務(wù)。騰訊稱用新一代集群訓(xùn)練萬億參數(shù)的混元大模型,時(shí)間可被壓縮到四天;字節(jié)稱它們的新集群支持萬卡級(jí)大模型訓(xùn)練,國內(nèi)數(shù)十家做大模型的企業(yè),多數(shù)已在使用火山引擎。

        所有這些平臺(tái)使用的要么是英偉達(dá)A100、H100GPU,要么是去年禁令后英偉達(dá)專門推出的減配版A800、H800,這兩款處理器帶寬分別是原版的約四分之三和約一半,避開了高性能GPU的限制標(biāo)準(zhǔn)。

        圍繞H800和A800,中國科技大公司開始了新一輪下單競爭。

        一名云廠商人士稱,字節(jié)、阿里等大公司主要是和英偉達(dá)原廠直接談采購,代理商和二手市場難以滿足它們的龐大需求。

        英偉達(dá)會(huì)按目錄價(jià),根據(jù)采購規(guī)模談一個(gè)折扣。據(jù)英偉達(dá)官網(wǎng),A100售價(jià)為1萬美元/塊(約7.1萬元人民幣),H100售價(jià)為3.6萬美元/塊(約25.7萬元人民幣);據(jù)了解,A800和H800售價(jià)略低于原版。

        中國公司能否搶到卡,更多是看商業(yè)關(guān)系,比如以往是不是英偉達(dá)的大客戶?!澳闶呛椭袊ミ_(dá)談,還是去美國找老黃(黃仁勛,英偉達(dá)創(chuàng)始人、CEO)直接談,都有差別?!币晃辉茝S商人士說。

        部分公司也會(huì)和英偉達(dá)進(jìn)行“業(yè)務(wù)合作”,在購買搶手的數(shù)據(jù)中心GPU時(shí),也購買其他產(chǎn)品,以爭取優(yōu)先供應(yīng)。這就像愛馬仕的配貨,如果你想買到熱門的包,往往也得搭配幾萬元的衣服、鞋履。

        綜合我們獲得的行業(yè)信息,字節(jié)今年的新下單動(dòng)作相對(duì)激進(jìn),超過10億美元級(jí)別。

        一位接近英偉達(dá)的人士稱,字節(jié)到貨和沒到貨的A100與H800總計(jì)有10萬塊。其中H800今年3月才開始投產(chǎn),這部分芯片應(yīng)來自今年的加購。據(jù)了解,以現(xiàn)在的排產(chǎn)進(jìn)度,部分H800要到今年底才能交貨。

        字節(jié)跳動(dòng)2017年開始建設(shè)自己的數(shù)據(jù)中心。曾經(jīng)的數(shù)據(jù)中心更依賴適應(yīng)所有計(jì)算的CPU,直到2020年,字節(jié)采購英特爾CPU的金額還高于英偉達(dá)GPU。字節(jié)采購量的變化,也反映了如今大型科技公司的計(jì)算需求中,智能計(jì)算對(duì)通用計(jì)算的趕超。

        據(jù)了解,某互聯(lián)網(wǎng)大廠今年至少已給英偉達(dá)下了萬卡級(jí)別訂單,按目錄價(jià)估算價(jià)值超10億元人民幣。

        騰訊則率先宣布已用上H800,騰訊云在今年3月發(fā)布的新版高性能計(jì)算服務(wù)中已使用了H800,并稱這是國內(nèi)首發(fā)。目前這一服務(wù)已對(duì)企業(yè)客戶開放測試申請(qǐng),這快于大部分中國公司的進(jìn)度。

        據(jù)了解,阿里云也在今年5月對(duì)內(nèi)提出把“智算戰(zhàn)役”作為今年的頭號(hào)戰(zhàn)役,并設(shè)立三大目標(biāo):機(jī)器規(guī)模、客戶規(guī)模和營收規(guī)模;其中機(jī)器規(guī)模的重要指標(biāo)就是GPU數(shù)量。

        新的GPU到貨前,各公司也在通過內(nèi)部騰挪,優(yōu)先支持大模型研發(fā)。

        能一次釋放較多資源的做法是砍掉一些沒那么重要,或短期看不到明確前景的方向?!按蠊居泻枚喟胨啦换畹臉I(yè)務(wù)占著資源?!币晃换ヂ?lián)網(wǎng)大公司AI從業(yè)者說。

        今年5月,阿里達(dá)摩院裁撤自動(dòng)駕駛實(shí)驗(yàn)室:300多名員工中,約三分之一劃歸菜鳥技術(shù)團(tuán)隊(duì),其余被裁,達(dá)摩院不再保留自動(dòng)駕駛業(yè)務(wù)。研發(fā)自動(dòng)駕駛也需要用高性能GPU做訓(xùn)練。這一調(diào)整可能與大模型無直接關(guān)系,但確實(shí)讓阿里獲得了一批“自由GPU”。

        字節(jié)和美團(tuán),則直接從給公司帶來廣告收入的商業(yè)化技術(shù)團(tuán)隊(duì)那里勻GPU。

        據(jù)《財(cái)經(jīng)》記者了解,今年春節(jié)后不久,字節(jié)把一批原計(jì)劃新增給字節(jié)商業(yè)化技術(shù)團(tuán)隊(duì)的A100勻給了TikTok產(chǎn)品技術(shù)負(fù)責(zé)人朱文佳。朱文佳正在領(lǐng)導(dǎo)字節(jié)大模型研發(fā)。而商業(yè)化技術(shù)團(tuán)隊(duì)是支持抖音廣告推薦算法的核心業(yè)務(wù)部門。

        美團(tuán)在今年一季度左右開始開發(fā)大模型。據(jù)了解,美團(tuán)不久前從多個(gè)部門調(diào)走了一批80G顯存頂配版A100,優(yōu)先供給大模型,讓這些部門改用配置更低的GPU。

        財(cái)力遠(yuǎn)不如大平臺(tái)充裕的B站對(duì)大模型也有規(guī)劃。據(jù)了解,B站此前已儲(chǔ)備了數(shù)百塊GPU。今年,B站一方面持續(xù)加購GPU,一方面也在協(xié)調(diào)各部門勻卡給大模型?!坝械牟块T給10塊,有的部門給20塊?!币晃唤咏麭站的人士稱。

        字節(jié)、美團(tuán)、B站等互聯(lián)網(wǎng)公司,原本支持搜索、推薦的技術(shù)部門一般會(huì)有一些GPU資源冗余,在不傷害原有業(yè)務(wù)的前提下,它們現(xiàn)在都在“把算力水分?jǐn)D出來”。

        不過這種拆東補(bǔ)西的做法能獲得的GPU數(shù)量有限,訓(xùn)練大模型所需的大頭GPU還是得靠各公司過去的積累和等待新GPU到貨。

        全世界都在搶算力

        對(duì)英偉達(dá)數(shù)據(jù)中心GPU的競賽也發(fā)生在全球范圍。不過海外巨頭大量購買GPU更早,采購量更大,近年的投資相對(duì)連續(xù)。

        2022年,Meta和甲骨文就已有對(duì)A100的大投入。Meta在去年1月與英偉達(dá)合作建成RSC超級(jí)計(jì)算集群,它包含1.6萬塊A100。同年11月,甲骨文宣布購買數(shù)萬塊A100和H100搭建新計(jì)算中心?,F(xiàn)在該計(jì)算中心已部署了超3.27萬塊A100,并陸續(xù)上線新的H100。

        微軟自從2019年第一次投資OpenAI以來,已為OpenAI提供數(shù)萬塊GPU。今年3月,微軟又宣布已幫助OpenAI建設(shè)了一個(gè)新計(jì)算中心,其中包括數(shù)萬塊A100。Google在今年5月推出了一個(gè)擁有2.6萬塊H100的計(jì)算集群Compute EngineA3,服務(wù)想自己訓(xùn)練大模型的公司。

        中國大公司現(xiàn)在的動(dòng)作和心態(tài)都比海外巨頭更急迫。以百度為例,它今年向英偉達(dá)新下的GPU訂單高達(dá)上萬塊。數(shù)量級(jí)與Google等公司相當(dāng),雖然百度的體量小得多,其去年?duì)I收為1236億元人民幣,只有Google的6%。

        據(jù)了解,字節(jié)、騰訊、阿里、百度這四家中國投入AI和云計(jì)算最多的科技公司,過去A100的積累都達(dá)到上萬塊。其中字節(jié)的A100絕對(duì)數(shù)最多。不算今年的新增訂單,字節(jié)A100和前代產(chǎn)品V100總數(shù)接近10萬塊。

        成長期公司中,商湯今年也宣稱,其“AI大裝置”計(jì)算集群中已總共部署了2.7萬塊GPU,其中有1萬塊A100。連看似和AI不搭邊的量化投資公司幻方之前也購買了1萬塊A100。

        僅看總數(shù),這些GPU供各公司訓(xùn)練大模型似乎綽綽有余——據(jù)英偉達(dá)官網(wǎng)案例,OpenAI訓(xùn)練1750億參數(shù)的GPT-3時(shí)用了1萬塊V100,訓(xùn)練時(shí)長未公開;英偉達(dá)測算,如果用A100來訓(xùn)練GPT-3,需要1024塊A100訓(xùn)練一個(gè)月,A100相比V100有4.3倍性能提升。但中國大公司過去采購的大量GPU要支撐現(xiàn)有業(yè)務(wù),或放在云計(jì)算平臺(tái)上售賣,并不能自由地用于大模型開發(fā)和對(duì)外支持客戶的大模型需求。

        這也解釋了中國AI從業(yè)者對(duì)算力資源估算的巨大差別。清華智能產(chǎn)業(yè)研究院院長張亞勤4月底參加清華論壇時(shí)說,“如果把中國的算力加1塊,相當(dāng)于50萬塊A100,訓(xùn)練五個(gè)模型沒問題?!盇I公司曠視科技CEO(首席執(zhí)行官)印奇接受《財(cái)新》采訪時(shí)則說:中國目前可用作大模型訓(xùn)練的A100總共只有約4萬塊。

        主要反映對(duì)芯片、服務(wù)器和數(shù)據(jù)中心等固定資產(chǎn)投資的資本開支,可以直觀說明中外大公司計(jì)算資源的數(shù)量級(jí)差距。

        最早開始測試類ChatGPT產(chǎn)品的百度,2020年以來的年資本開支在8億到20億美元之間,阿里在60億-80億美元之間,騰訊在70億-110億美元之間。同期,亞馬遜、Meta、Google、微軟這四家自建數(shù)據(jù)中心的美國科技公司的年資本開支最少均超過150億美元。

        疫情三年中,海外公司資本開支繼續(xù)上漲。亞馬遜去年的資本開支已來到580億美元,Meta、Google均為314億美元,微軟接近240億美元。中國公司的投資在2021年之后則在收縮。騰訊、百度去年的資本開支均同比下滑超25%。

        訓(xùn)練大模型的GPU已不算充足,各家中國公司如果真的要長期投入大模型,并賺到給其他模型需求“賣鏟子”的錢,未來還需要持續(xù)增加GPU資源。

        走得更快OpenAI已遇到了這一挑戰(zhàn)。5月中旬,OpenAI CEO Sam Altman在與一群開發(fā)者的小范圍交流中說,由于GPU不夠,OpenAI現(xiàn)在的API服務(wù)不夠穩(wěn)定,速度也不夠快,在有更多GPU前,GPT-4的多模態(tài)能力還無法拓展給每個(gè)用戶,他們近期也不準(zhǔn)備發(fā)布新的消費(fèi)級(jí)產(chǎn)品。技術(shù)咨詢機(jī)構(gòu)Trend Force今年6月發(fā)布報(bào)告稱,OpenAI需要約3萬塊A100來持續(xù)優(yōu)化和商業(yè)化Chat GPT。

        與OpenAI合作頗深的微軟也面臨類似情境:今年5月,有用戶吐槽New Bing回答速度變慢,微軟回應(yīng),這是因?yàn)镚PU補(bǔ)充速度跟不上用戶增長速度。嵌入了大模型能力的微軟Office 365 Copilot目前也沒有大規(guī)模開放,最新數(shù)字是有600多家企業(yè)在試用——Office 365的全球總用戶數(shù)接近3億。

        中國大公司如果不是僅把訓(xùn)練并發(fā)布一個(gè)大模型作為目標(biāo),而是真想用大模型創(chuàng)造服務(wù)更多用戶的產(chǎn)品,并進(jìn)一步支持其他客戶在云上訓(xùn)練更多大模型,就需要提前儲(chǔ)備更多GPU。

        為什么只能是那四款卡?

        在AI大模型訓(xùn)練上,現(xiàn)在A100、H100及其特供中國的減配版A800、H800找不到替代品。據(jù)量化對(duì)沖基金Khaveen Investments測算,英偉達(dá)數(shù)據(jù)中心GPU

        2022年市占率達(dá)88%,AMD和英特爾瓜分剩下的部分。

        2020年GTC大會(huì)上,黃仁勛攜A100第一次亮相。

        英偉達(dá)GPU目前的不可替代性,源自大模型的訓(xùn)練機(jī)制,其核心步驟是預(yù)訓(xùn)練(pre-training)和微調(diào)(fine-tuning),前者是打基座,相當(dāng)于接受通識(shí)教育至大學(xué)畢業(yè);后者則是針對(duì)具體場景和任務(wù)做優(yōu)化,以提升工作表現(xiàn)。

        預(yù)訓(xùn)練環(huán)節(jié)尤其消耗算力,它對(duì)單個(gè)GPU的性能和多卡間的數(shù)據(jù)傳輸能力有極高要求。

        現(xiàn)在只有A100、H100能提供預(yù)訓(xùn)練所需的計(jì)算效率,它們看起來昂貴,反倒是最低廉的選擇。今天AI還在商用早期,成本直接影響一個(gè)服務(wù)是否可用。

        過去的一些模型,如能識(shí)別貓是貓的VGG16,參數(shù)量只有1.3億,當(dāng)時(shí)一些公司會(huì)用玩游戲的RTX系列消費(fèi)級(jí)顯卡來跑AI模型。而兩年多前發(fā)布的GPT-3的參數(shù)規(guī)模已達(dá)到1750億。

        大模型的龐大計(jì)算需求下,用更多低性能GPU共同組成算力已行不通了。因?yàn)槭褂枚鄠€(gè)GPU訓(xùn)練時(shí),需要在芯片與芯片間傳輸數(shù)據(jù)、同步參數(shù)信息,這時(shí)部分GPU會(huì)閑置,無法一直飽和工作。所以單卡性能越低,使用的卡越多,算力損耗就越大。OpenAI用1萬塊V100訓(xùn)練GPT-3時(shí)的算力利用率不到50%。

        A100、H100則既有單卡高算力,又有提升卡間數(shù)據(jù)傳輸?shù)母邘?。A100的FP32(指用4字節(jié)進(jìn)行編碼存儲(chǔ)的計(jì)算)算力達(dá)到19.5TFLOPS(1TFLOPS即每秒進(jìn)行一萬億次浮點(diǎn)運(yùn)算),H100的FP32算力更高達(dá)134TFLOPS,是競品AMD MI250的約4倍。

        A100、H100還提供高效數(shù)據(jù)傳輸能力,盡可能減少算力閑置。英偉達(dá)的獨(dú)家秘籍是自2014年起陸續(xù)推出的NVLink、NVSwitch等通信協(xié)議技術(shù)。用在H100上的第四代NVLink可將同一服務(wù)器內(nèi)的GPU雙向通信帶寬提升至900GB/s(每秒傳輸900GB數(shù)據(jù)),是最新一代PCle(一種點(diǎn)對(duì)點(diǎn)高速串行傳輸標(biāo)準(zhǔn))的7倍多。

        去年美國商務(wù)部對(duì)GPU的出口規(guī)定也正是卡在算力和帶寬這兩條線上:算力上線為4800TOPS,帶寬上線為600GB/s。

        A800和H800算力和原版相當(dāng),但帶寬打折。A800的帶寬從A100的600GB/s

        降為400GB/s,H800的具體參數(shù)尚未公開,據(jù)媒體報(bào)道,它的帶寬只有H100(900GB/s)的約一半,執(zhí)行同樣的AI任務(wù)時(shí),H800會(huì)比H100多花10%-30%的時(shí)間。一名AI工程師推測,H800的訓(xùn)練效果可能還不如A100,但更貴。

        即使如此,A800和H800的性能依然超過其他大公司和創(chuàng)業(yè)公司的同類產(chǎn)品。受限于性能和更專用的架構(gòu),各公司推出的AI芯片或GPU芯片,現(xiàn)在主要用來做AI推理,難以勝任大模型預(yù)訓(xùn)練。簡單來說,AI訓(xùn)練是做出模型,AI推理是使用模型,訓(xùn)練對(duì)芯片性能要求更高。

        性能差距外,英偉達(dá)的更深護(hù)城河是軟件生態(tài)。

        早在2006年,英偉達(dá)就推出計(jì)算平臺(tái)CUDA,它是一個(gè)并行計(jì)算軟件引擎,開發(fā)者可使用CUDA更高效地進(jìn)行AI訓(xùn)練和推理,用好GPU算力。

        CUDA今天已成為AI基礎(chǔ)設(shè)施,主流的AI框架、庫、工具都以CUDA為基礎(chǔ)進(jìn)行開發(fā)。

        英偉達(dá)之外的GPU和AI芯片如要接入CUDA,需要自己提供適配軟件,但只有CUDA部分性能,更新迭代也更慢。PyTorch等AI框架正試圖打破CUDA的軟件生態(tài)壟斷,提供更多軟件能力以支持其他廠商的GPU,但這對(duì)開發(fā)者吸引力有限。

        一位AI從業(yè)者稱,他所在的公司曾接觸一家非英偉達(dá)GPU廠商,對(duì)方的芯片和服務(wù)報(bào)價(jià)比英偉達(dá)更低,也承諾提供更及時(shí)的服務(wù),但他們判斷,使用其他GPU的整體訓(xùn)練和開發(fā)成本會(huì)高于英偉達(dá),還得承擔(dān)結(jié)果的不確定性和花更多時(shí)間。

        “雖然A100價(jià)格貴,但其實(shí)用起來是最便宜的。”他說。對(duì)有意抓住大模型機(jī)會(huì)的大型科技公司和頭部創(chuàng)業(yè)公司來說,錢往往不是問題,時(shí)間才是更寶貴的資源。

        短期內(nèi)唯一影響英偉達(dá)數(shù)據(jù)中心GPU銷量的可能只有臺(tái)積電的產(chǎn)能。H100/800為4nm制程,A100/800為7nm制程,這四款芯片均由臺(tái)積電代工生產(chǎn)。據(jù)媒體報(bào)道,英偉達(dá)今年向臺(tái)積電新增了1萬塊數(shù)據(jù)中心GPU訂單,并下了超急件,生產(chǎn)時(shí)間最多可縮短50%。正常情況下,臺(tái)積電生產(chǎn)A100需要數(shù)月。目前的生產(chǎn)瓶頸主要在先進(jìn)封裝產(chǎn)能不夠,缺口達(dá)一至兩成,需要3個(gè)-6個(gè)月逐步提升。

        自從適用于并行計(jì)算的GPU被引入深度學(xué)習(xí),十多年來,AI發(fā)展的動(dòng)力就是硬件與軟件,GPU算力與模型和算法的交疊向前:模型發(fā)展拉動(dòng)算力需求;算力增長,又使原本難以企及的更大規(guī)模訓(xùn)練成為可能。

        在上一波以圖像識(shí)別為代表的深度學(xué)習(xí)熱潮中,中國AI軟件能力比肩全球最前沿水平;算力是目前的難點(diǎn)——設(shè)計(jì)與制造芯片需要更長的積累,涉及漫長供應(yīng)鏈和浩繁專利壁壘。

        大模型是模型與算法層的又一次大進(jìn)展,沒時(shí)間慢慢來了,想做大模型,或提供大模型云計(jì)算能力的公司必須盡快獲得足夠多的先進(jìn)算力。在這輪熱潮使第一批公司振奮或失望前,圍繞GPU的搶奪不會(huì)停止。

        猜你喜歡
        算力字節(jié)阿里
        多方求解智能時(shí)代算力挑戰(zhàn)
        這個(gè)第二不一般
        都市人(2023年11期)2024-01-12 05:55:06
        衛(wèi)星通信在算力網(wǎng)絡(luò)中的應(yīng)用研究
        中國電信董事長柯瑞文:算力成為數(shù)字經(jīng)濟(jì)的主要生產(chǎn)力
        No.8 字節(jié)跳動(dòng)將推出獨(dú)立出口電商APP
        云上阿里
        炎黃地理(2021年1期)2021-06-08 00:27:03
        辰辰帶你游阿里
        No.10 “字節(jié)跳動(dòng)手機(jī)”要來了?
        簡談MC7字節(jié)碼
        阿里戰(zhàn)略
        亚洲成在人网av天堂| 免费视频成人 国产精品网站 | 久久国产精品一区av瑜伽| 人妻少妇精品视频专区vr| 亚洲av无码一区二区三区网址| 久久午夜av一区二区三区| av中文字幕潮喷人妻系列| 男男受被攻做哭娇喘声视频| 亚洲精品一区二区| 亚洲美女影院| 蜜桃伦理一区二区三区| 日本一区二三区在线中文| 后入少妇免费在线观看| 国产精品成人av大片| 野花香社区在线视频观看播放| 337p日本欧洲亚洲大胆色噜噜| 在线观看免费日韩精品| 国产专区一线二线三线码| 日韩免费无码一区二区三区| 亚洲熟妇少妇任你躁在线观看 | 亚洲日韩av一区二区三区中文| 无码任你躁久久久久久久| 男女一边摸一边做爽爽的免费阅读| 欧美国产日产一区二区| 亚洲中文字幕乱码| 中文字幕日产人妻久久| 91久久精品一区二区喷水喷白浆| 成年人视频在线播放麻豆| 亚洲人妖女同在线播放| 精品精品国产三级av在线| 人妻少妇哀求别拔出来| 樱桃视频影院在线播放| 67194熟妇在线永久免费观看| 又污又爽又黄的网站| 国产精品露脸张开双腿| 精品午夜久久网成年网| 国产精品女视频一区二区| 熟女少妇av免费观看| 狼狼色丁香久久女婷婷综合| 日本中文字幕一区二区有码在线| 无码av天堂一区二区三区|