亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        挑戰(zhàn)壟斷者,擺脫英偉達

        2023-11-27 16:08:01朱秋雨
        南風窗 2023年24期
        關鍵詞:模型

        朱秋雨

        “這一定是很痛苦的……卻是不得不做的事。”在2023中國計算機大會上,談及國產AI算力是否應擺脫對國際的依賴,中科院計算所研究員崔慧敏說道。

        在場的專家都點了頭。

        那是在10月末的秋日沈陽。就在10天前,美國商務部工業(yè)和安全局(BIS)宣布重磅規(guī)定—對中國升級芯片出口管制。

        規(guī)則制定者之一,美國商務部負責出口管理的助理部長西亞·肯德勒曾明確放話:“中國已投入大量資源開發(fā)超級計算的能力,力爭到2030年成為世界人工智能的領先者。”“我們的行動將保護美國的國家安全和外交政策利益,同時發(fā)出明確的信息,美國的技術領先地位關乎價值觀和創(chuàng)新。”

        于是,10月17日,BIS的禁售令,將上述信號再度傳遞給中國。這則最嚴芯片出口令將于30天后生效,涵括三大方面:

        一是將向中國禁售高性能芯片的標準改為“性能密度”。這一標準將更多AI芯片列入禁止出口名單中,英偉達、AMD、英特爾的產品均在列。

        二是擴大了另外40多個國家出口的許可要求,以規(guī)避高性能AI芯片從海外其他地區(qū)輾轉到中國。

        最后是將13家中國公司添加到“實體清單”。其中有兩家國產GPU企業(yè),壁仞科技、摩爾線程。進入實體清單的公司,未來不得在臺積電等先進工廠生產芯片。

        一紙新規(guī)讓如火如荼的AI大模型元年氣氛愈發(fā)緊張。AI芯片領域,全球格局已經是“一家獨大”?;ㄆ煅芯糠治鰩熢诮衲?月預計,英偉達占據了AI 芯片市場“至少 90%”的份額。

        “脫鉤”風云中,被“卡脖子”的國產芯片盡早突破英偉達,是現(xiàn)今中國業(yè)界的共識。用國家超算計天津中心首席科學家孟祥飛在上述大會的話說:“這不是一個可選項,而是一個必選項?!?/p>

        問題是,有路嗎?怎么走?

        被禁以后

        無論從什么角度來說,英偉達高端芯片被禁,對多數(shù)中國AI創(chuàng)業(yè)者而言,都像被澆了一盆冷水。

        “現(xiàn)在拿到卡了就是大爺?!?0月,一位不愿具名的清華大學計算機教授在私下交流時說道。

        一切源于OpenAI率先開啟的“暴力美學”—大模型需要至少千億級參數(shù)歷練才能涌現(xiàn)智能。成本、計算速度和節(jié)能等因素,都催促著慢人一步的中國AI公司,使用最先進的AI芯片。

        如果按照部署位置分類,基于深度學習的AI芯片大致有兩類:一是部署在邊緣側的芯片。也就是位于產品終端,比如,在一輛自動駕駛汽車里。

        這些終端芯片基于訓練好的模型進行實時推理、決策,強調實時性。騰訊、Meta推出的自研芯片,都是推理類型。

        但當下更稀缺的,是技術門檻更高、部署在云端的芯片。它們的作用更基礎—訓練大模型,以期AI涌現(xiàn)出類似大學生的智能。

        上海通信技術中心前CEO、著有《AI芯片:前沿技術與創(chuàng)新未來》的張臣雄告訴南風窗,自2014年深度學習算法在全球人工智能越加火熱以后,美國廠商英偉達推出的GPU獲得了巨大市場空間。

        一切都是來自技術上的恰好契合:盡管深度學習算法擁有復雜的結構,但這些結構大部分的運算和處理都與一個東西有關—矩陣乘法。

        恰好,英偉達此前用于渲染圖像、游戲的GPU,尤其擅長矩陣和矩陣的乘法。張臣雄介紹,正是因為發(fā)現(xiàn)了GPU的這個特性,從此英偉達逐漸迭代產品,開發(fā)出多款適用于AI訓練的芯片。

        更重要的是,相比于通用型的芯片CPU(中央處理器),英偉達的GPU還完美契合了深度神經網絡(DNN)并行計算的特性。不同于CPU按順序進行計算,GPU有著大量并行架構的設計。這與DNN在訓練和推理過程要進行大量獨立的、同時進行的矩陣乘法的操作不謀而合。

        據南風窗統(tǒng)計,截至2023年11月,明確對外稱有訓練AI大模型能力的中國芯片公司在個位數(shù)。

        也因此,基于深度神經網絡的大模型,中國公司對GPU的需求達到了頂峰。上海某信息科技公司生態(tài)合作副總監(jiān)張迎告訴南風窗,從2023年上半年開始,英偉達高性能GPU已經在市面上極度短缺。他的公司早在6月訂購了十幾臺英偉達H800。

        “稀缺啊,半年了到現(xiàn)在還沒拿到貨?!睆堄f。

        緊張的AI芯片供應以2022年為分界線。為了 “遏制中國實現(xiàn)在人工智能和先進計算領域的突破”,美國政府明確實行全面的芯片限制。2022年8月9日,美國總統(tǒng)拜登簽署《2022年芯片與科學法案》,要求接受補貼的美國廠商未來10年不得擴大在中國大陸的投資。

        緊接著,8月31日,英偉達A100和H100、AMD MI250等AI芯片被禁銷往中國。

        一年后,10月17日,美國商務部再度頒布最嚴出口令。其中,市場主流的7種英偉達AI芯片,包括特供給中國的A800、H800,都將在1個月后禁止出口中國。

        禁運的AI芯片讓大模型創(chuàng)業(yè)大軍立刻感到“捉襟見肘”?!罢闵套C券”曾估算,長期來看,考慮國內5家頭部大模型廠商對標GPT-4模型的訓練需求,還額外需要13705臺A100、A800服務器。也就是對應近11萬張GPU。

        11月7日,在北京提供AI算力的云廠商楊加在行業(yè)群興奮宣布,手上有17臺A100服務器出售。“現(xiàn)貨?!彼麖娬{。

        這個在去年被美國列為禁止向中國出口的芯片,過往每張標價約1萬美元(合計7萬元)。中國市面上現(xiàn)在流行的A100,多為去年禁令前囤積,以非正規(guī)渠道流通。

        如今,在楊加這里,包含8張顯卡、散熱器等整機服務器部署下來,售價高達190萬元。至于更高性能的H100,整機價格已經達到270萬-330萬區(qū)間。

        “太夸張了。”幾個創(chuàng)業(yè)者聽到報價后感嘆。

        追趕的玩家

        大洋彼岸主動發(fā)起的“脫鉤”,讓中國AI企業(yè)和機構不得不面對赤裸的現(xiàn)實。抓緊提出以國產芯片和硬件為主的替代方案,成為唯一的選項。

        事實上,近年我國的AI芯片賽道并不冷門。除了老牌的A股上市公司,比如做AI推理芯片的寒武紀,服務于軍事用途起家的景嘉微以外,興起的AI芯片公司還有兩類。一類是以華為、百度、騰訊為代表的大廠隊,還有一類是在過去6年加入的創(chuàng)業(yè)公司。

        最新被BIS列入實體清單的中國公司摩爾線程、壁仞科技,便是兩家創(chuàng)立于2019年后的年輕公司。巧合的是,兩家公司創(chuàng)始人都有在美國芯片公司工作的背景,現(xiàn)在都將野心瞄準了制造高端GPU。

        其中,摩爾線程的速度為外界稱奇。成立僅3年的時間內,該公司宣布量產了蘇堤、春曉、曲院三顆全功能GPU芯片。它同時發(fā)布了MUSA元計算統(tǒng)一系統(tǒng)架構,包括統(tǒng)一的編程模型、軟件運行庫、指令集架構和芯片架構,在AI計算領域表現(xiàn)突出。

        百度孵化的昆侖芯也提出了一個不同于GPU、CPU的全新架構—XPU。據介紹,配備XPU的昆侖芯二代專為當前的AI場景設計。它不僅與文心一言及其他大模型適配,且有更多的AI加速單元,為大模型時代“高性價比的計算力產品”。

        但這是國產玩家的少數(shù)。

        據南風窗統(tǒng)計,截至2023年11月,明確對外稱有訓練AI大模型能力的中國芯片公司在個位數(shù)。其中包括大廠隊的華為昇騰,百度昆侖芯,以及創(chuàng)業(yè)公司天數(shù)智芯、燧原、摩爾線程、壁仞科技。

        更多數(shù)的AI芯片廠家,例如騰訊、寒武紀、地平線、沐曦、登臨等,選擇入局技術門檻更低的AI推理芯片。

        摩爾線程CEO張建中曾在受訪時解釋,造GPU芯片的難度很大,因為這是一個由短板決定的創(chuàng)新過程。

        人才、資金、技術、產業(yè)鏈環(huán)環(huán)相扣,缺一不可,“就像打游戲打通關一樣”。

        只是,即使暫時通關成為賽道的“王者”,還有更嚴峻的現(xiàn)實擺在面前。造出國產GPU是一回事,怎么讓企業(yè)替換已經在用的英偉達芯片,又是另一回事。

        一位南京某云服務廠商告訴南風窗,為了鼓勵使用國產芯片,許多由政府組建的超算中心會被要求購買一定份額的國產芯片?!半m然買了國產,但用終歸還是英偉達好用?!?/p>

        而據《財經十一人》報道,2023年6月,部分地方政府出資建設“數(shù)字經濟算力中心”時,曾向承建方提議,是否能采購一定數(shù)量國產AI芯片。但這家作為承建方的國資企業(yè)拒絕了,理由是,國產AI芯片相比英偉達的性能不足。

        張臣雄對南風窗分析,造出訓練AI的GPU之所以難度更高,最難的還是GPU集群之中的通信和控制。

        “把這么多的芯片連起來并行計算,那么如果沒有很好的設計,容易出現(xiàn)很多問題?!睆埑夹壅f。

        讓國產芯片在現(xiàn)實場景中跑起來后,將為后續(xù)迭代、完善技術提供豐富原料。此后,才會逐漸出現(xiàn)技術加速迭代的正向循環(huán)。

        這也是很多國內AI大模型企業(yè)仍不敢大量使用國產GPU的一大原因。穩(wěn)健、不出錯,看上去是一個基本的要求,背后卻需要成熟的軟硬件配套和反復迭代的技術。在創(chuàng)業(yè)進入“百模大戰(zhàn)”的極度緊張之際,有條件的公司都不希望將過多時間花在出錯和調試硬件問題上。

        華為昇思MindSpore系統(tǒng)架構師蘇騰博士也在公開場合透露,當下訓練GPU集群的一大關鍵—確保高度可用。

        “大家有參與過訓練大模型的話,都有體會,每個星期或者每隔兩三天,集群總要崩潰一次?!碧K騰說。因此,他的工作重點經常圍繞著提高大模型訓練過程的“可靠性”,以及“快速地將故障恢復”。

        突圍護城河之路

        好消息是,在使用國產硬件成為必選項的當下,有中國公司跑出來了。

        華為昇騰910系列是其中被認為性能最為全面,同時使用程度也最高的國產GPU??拼笥嶏w創(chuàng)始人劉慶峰曾在8月透露,訊飛大模型接上了國產硬件。

        “我特別高興地告訴大家,華為的GPU能力現(xiàn)在已經跟英偉達一樣,”劉慶峰說,“任正非高度重視,華為的三位董事到科大訊飛專班工作,現(xiàn)在已經把它做到了能對標英偉達的A100?!?/p>

        11月7日,據路透社爆料,早在美國宣布出口禁令前,百度就在8月訂購了總價值4.5億元的共計1600個華為昇騰910B。

        這顯然是國產芯片的一大勝利。

        讓國產芯片在現(xiàn)實場景中跑起來后,將為后續(xù)迭代、完善技術提供豐富原料。此后,才會逐漸出現(xiàn)技術加速迭代的正向循環(huán)。

        不過,業(yè)內人士都很清楚,這只是國產GPU進展的第一步。

        這時維持審慎,是因為芯片的能力不止來自硬件,同時是軟件能力的體現(xiàn)。

        英偉達過往20年的領先就在于此—這不是單純的硬件公司,而是由軟件定義的巨頭。

        回到1993年,英偉達成立的1990年代,市面上有70多家做圖形渲染的公司。

        轉機直到2006年出現(xiàn)。英偉達此后開發(fā)了一個名為CUDA的平臺。這個平臺首先由3000多個工程師合力編寫,接著,越來越多人加入。2023年,全球超過400萬開發(fā)者在CUDA生態(tài)里。

        張臣雄對南風窗解釋,CUDA最大的作用,是為GPU提供了整套編程模型和編程語言。

        更通俗地說,CUDA相當于一個編譯器?!俺绦騿T編了很多(軟件)程序,通過CUDA,能把它編譯成機器最底層的硬件語言,相當于中間翻譯?!?/p>

        有了這個編譯器和編程語言,軟件工程師能高效地調試硬件,而不用重新從底層硬件進行更新,大大提升了效率。

        CUDA的發(fā)明,讓英偉達驗證了俗語—“早起的鳥兒有蟲吃”。目前,世界上主流的深度學習框架都只與CUDA適配。就像蘋果系統(tǒng)內部的閉環(huán)生態(tài),贏家通吃的局面也在AI芯片領域存在。

        這也是當下中國AI芯片公司面臨的艱難抉擇:很多企業(yè)的代碼都是基于英偉達推出的運算平臺CUDA編程而寫的。如果要與英偉達完全脫鉤,換一個新的生態(tài),就意味著要做大量代碼性遷移及改變,工程量巨大得難以想象。

        逐漸打破被壟斷的生態(tài),成為國產芯片公司在日益“脫鉤”的背景下努力的方向。

        現(xiàn)在正處于國產芯片“被迫”獨立自主的關鍵期,這次,對我國而言更重要的是,走出長期的思維誤區(qū)?!耙欢ㄒ獢[脫follow(跟隨)的習慣?!?/blockquote>

        2023年,以華為與百度為首的大廠,相比于推薦自己的底座大模型,都將更多的力氣放在了建立開發(fā)者生態(tài)之中。

        蘇騰也在上述場合中提到了這一點。比起硬件上的發(fā)明,對華為來說,更難的在于迅速建立起生態(tài)。

        “現(xiàn)在國際上很多新的算法和優(yōu)化手段,總是在英偉達的GPU和CUDA上率先出現(xiàn)?!碧K騰透露。華為也會將CUDA的創(chuàng)新在昇騰的Mindspore上復現(xiàn),并基于此做一些創(chuàng)新。

        但是,他坦言,“我們自己所做的創(chuàng)新,相對于英偉達的整個生態(tài)來說,肯定是九牛一毛。”

        這背后,關乎發(fā)展時間,關乎人才,也關乎創(chuàng)新的環(huán)境。

        張臣雄分析,雖然起步慢,但中國的AI芯片“現(xiàn)在搞也來得及”。主要原因在于中國背靠巨大的市場。

        “可以合力建立一個開放的生態(tài)系統(tǒng),有很多家企業(yè)合起來做,使用開源的架構?!?/p>

        他同時認為,現(xiàn)在正處于國產芯片“被迫”獨立自主的關鍵期,這次,對我國而言更重要的是,走出長期的思維誤區(qū)。

        “一定要擺脫follow(跟隨)的習慣。”

        他告訴南風窗,從發(fā)展歷史回看,英偉達的GPU一開始并非用于AI,而是用于圖形、游戲渲染。也就是說,制造AI芯片,遠不止做出GPU這一個解法。

        模仿英偉達的產品未必等于可行,重要的是在研制AI芯片過程中找到前進的目標—滿足深度學習網絡的矩陣乘法和并行運算的需求。

        好消息是,回溯歷史的芯片之戰(zhàn),還有一個共同點:創(chuàng)新出現(xiàn)的一個重要動力,在于挑戰(zhàn)壟斷者。

        處于下位者的公司,往往有強動力奮起直追,改變壟斷者控制的游戲規(guī)則。這是ARM、AMD、蘋果等等巨頭在研制芯片的故事。

        這注定是充滿痛苦且有曲折的路。但一切正如美國經濟歷史學家克里斯·米勒在《芯片戰(zhàn)爭》所描述的那樣:“戰(zhàn)爭會改變我們,不要辜負這場戰(zhàn)爭?!?/p>

        (文中楊加為化名)

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        3D打印中的模型分割與打包
        99re免费在线视频| 色综合久久中文娱乐网| 久久精品噜噜噜成人| 伊人99re| 亚洲中文字幕人妻诱惑| 久久精品亚洲成在人线av乱码| 成人免费直播| 亚洲国产综合人成综合网站| 免费无码黄网站在线观看| 国产精品国产三级国产剧情| 国产专区一线二线三线码| 国产亚洲av片在线观看18女人 | 麻豆国产VA免费精品高清在线| 激情视频在线观看好大| 粗大的内捧猛烈进出少妇 | 国产丝袜美女一区二区三区| 在线观看av永久免费| 欧美国产伦久久久久久久| 中文国产乱码在线人妻一区二区| 免费无码av一区二区三区| 亚洲精品老司机在线观看| 亚洲综合精品在线观看中文字幕| 国产一区二区长腿丝袜高跟鞋| 岳好紧好湿夹太紧了好爽矜持 | 亚洲熟妇乱子伦在线| 亚洲中字永久一区二区三区| 成 人色 网 站 欧美大片在线观看| 波多野结衣乳巨码无在线| 国产目拍亚洲精品一区二区| 成人国产高清av一区二区三区| 日韩少妇内射免费播放18禁裸乳| 日产精品久久久久久久| 国产一区二区三区av免费观看| 精品视频在线观看日韩| 午夜成人鲁丝片午夜精品| 无码Av在线一区二区三区| 日本频道一区二区三区| 久久97久久97精品免视看| 手机看片久久国产免费| 日韩精品免费一区二区中文字幕 | 国产精品白浆免费观看|