亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        英偉達,被黃仁勛帶向何方?

        2022-05-30 15:34:52馬點秋
        看世界 2022年19期
        關(guān)鍵詞:算力架構(gòu)芯片

        馬點秋

        英偉達首席執(zhí)行官黃仁勛

        最近,百度推出的“AI作畫”首款產(chǎn)品文心·一格正式上線,掀起了一陣“你說我畫”的熱潮:用戶只要輸入一段文字,就能一鍵生成各式各樣瑰麗絢爛的畫作。

        不僅是“一鍵作詩”“一鍵作畫”,AI熱潮席卷之下,從“阿爾法狗”到L4級別的自動駕駛訓(xùn)練,乃至對新冠藥物的分子動力學(xué)模擬與病毒機制的分析,都離不開AI技術(shù)的助力。

        然而,美國芯片巨頭英偉達8月31日公告稱,其被美國政府要求,限制向中國出口用于加速AI訓(xùn)練任務(wù)的最新兩代旗艦GPU計算芯片—A100和H100。另一芯片巨頭AMD的數(shù)據(jù)中心級GPU—MI100與MI200,也同樣遭到限制。

        那么,AI加速芯片和GPU到底是什么,為何如此重要?

        英偉達帶動GPU發(fā)展

        GPU即圖形處理器,由英偉達在1999年發(fā)布GeForce 256時提出,一直沿用至今。對應(yīng)于CPU“中央處理器”的名稱,GPU的雛形“圖形加速卡”在上世紀80年代的雅達利2600游戲機上誕生之初,便是為了彌補CPU進行圖形處理時遇到的性能瓶頸而生。

        CPU的設(shè)計理念基于馮·諾依曼架構(gòu),經(jīng)過內(nèi)存讀取—轉(zhuǎn)譯—運算—輸出等步驟處理數(shù)據(jù),以低延遲為導(dǎo)向,專為串行處理而優(yōu)化。這樣的設(shè)計理念讓CPU中的核心數(shù)較少,且絕大多數(shù)的晶體管都用在了控制電路和高速緩存上,用來完成實際運算的晶體管只占少數(shù)。這就限制了其進行大規(guī)模并行計算的性能。

        而在3D圖形運算中,往往需要對模型的每一個頂點進行同樣的坐標(biāo)變換,或是對每一個頂點按照同樣的光照模型計算顏色值—這樣的運算雖然簡單,但需要計算的次數(shù)非常龐大,讓早期的單核CPU叫苦不迭,專為圖形計算進行優(yōu)化的GPU設(shè)計理念就此誕生。

        與CPU努力降低延遲不同,GPU以數(shù)據(jù)吞吐量為導(dǎo)向,由成千上萬個更小、更高效的“小核”構(gòu)成,專為處理并行任務(wù)而設(shè)計。形象地說,CPU的核心就像餐館里的“大廚”,負責(zé)各類復(fù)雜任務(wù)的處理和調(diào)配;而GPU的核心就像“小工”,以人海戰(zhàn)術(shù)高效處理各類簡單任務(wù)。兩者各司其職,構(gòu)成了如今高性能計算機的基礎(chǔ)。

        GPU的發(fā)展史,基本上就是英偉達的發(fā)家史。

        1993年,祖籍中國浙江、出生于寶島臺灣的黃仁勛剛及而立之年。他在斯坦福大學(xué)求學(xué)期間,為了追求喜歡的女孩,提出了30歲會成立自己公司的承諾。隨后女友變成了妻子,黃仁勛也如約在1993年8月與另外兩個伙伴共同創(chuàng)立了英偉達,并擔(dān)任CEO。

        CPU的核心就像餐館里的“大廚”,而GPU的核心就像“小工”,以人海戰(zhàn)術(shù)高效處理各類簡單任務(wù)。

        2021 ChinaJoyAMD展臺

        他不知道的是,這家公司的市值將在2022年初超越臺積電和三星,成為全球市值最高的半導(dǎo)體公司,相當(dāng)于4個英特爾或高通。而作為芯片公司中為數(shù)不多白手起家的企業(yè),英偉達的起步無疑是極為艱難的。黃仁勛在一次演講中說:“創(chuàng)立公司時,我清楚地記得當(dāng)時兜里只有200美元,而市場上當(dāng)時已有250個競爭對手。”

        碰壁后,迎合市場主流

        彼時,圖形顯示領(lǐng)域的大哥ATI(后來被AMD收購)已成立多年,而諸如3dfx等后起之秀也層出不窮。眾多風(fēng)投公司判斷,圖形顯示市場已基本飽和,再成立類似公司前景不明朗。

        然而,初出茅廬的英偉達潛心打磨兩年,還是推出了旗下第一款面向游戲主機的顯示芯片NV1。NV1集成了當(dāng)時最大最全的游戲方案,不僅同時支持2D、3D處理能力,甚至還集成了音頻處理功能,為當(dāng)時競爭趨近白熱化的游戲主機市場,帶來了“保姆級”一站式解決方案,理論上應(yīng)該成為某款傳奇游戲主機的心臟,來大放異彩。

        2022年世界人工智能大會

        一款成功的硬件產(chǎn)品,首先要符合市場主流的技術(shù)標(biāo)準和規(guī)范。

        然而,NV1為了用更少的計算量實現(xiàn)更光滑的3D效果,選擇了方形繪圖的渲染架構(gòu)。不巧的是,在NV1發(fā)布的同一年,微軟發(fā)布了沿用至今的DirectX API圖形標(biāo)準的前身—Direct3D,加上此前的OpenGL(用于渲染2D、3D矢量圖形的應(yīng)用程序編程接口)都采用了三角形繪圖渲染,這意味著NV1與業(yè)界的通用標(biāo)準完全無法兼容,導(dǎo)致銷量冷淡。

        “叫好不叫座”的NV1,讓英偉達出師不利,賬面資金一度僅夠公司維持運轉(zhuǎn)30天。“記住,公司距離倒閉只有30天?!边@也成為了黃仁勛激勵員工不能松懈的口頭禪。

        公司陷入絕境之時,好在位于日本的世嘉游戲公司看上了英偉達的技術(shù)實力,其采購了NV1芯片用于自家的土星游戲主機上,并隨后要求英偉達為其開發(fā)下一代游戲主機DC的顯示芯片。

        雖然這一合作再次因為英偉達堅持方形顯示理念而與世嘉產(chǎn)生分歧,最終導(dǎo)致NV2芯片流產(chǎn),但彼時財大氣粗的世嘉并未收回700萬美元的開發(fā)資金,這給了英偉達至關(guān)重要的一次機會。前兩次失敗的經(jīng)驗也讓英偉達意識到,一款成功的硬件產(chǎn)品,首先要符合市場主流的技術(shù)標(biāo)準和規(guī)范。

        接下來,英偉達在1997年推出的采用NV3芯片的riva128顯卡,便采用了三角形繪圖渲染,并支持Direct X和OpenGL等主流應(yīng)用編程接口(API),憑借極高的性價比贏得了市場的青睞。它隨后發(fā)布的TNT與TNT2,又以低廉的價格與更新的API,擊敗了當(dāng)時顯示領(lǐng)域巨頭3dfx旗下的Voodoo系列顯卡。

        終于,在1999年,英偉達以GeForce 256為名,發(fā)布了世界上第一款GPU,將原本依賴于CPU的3D計算完全轉(zhuǎn)移到顯卡上進行,并在之后的數(shù)年間開始了與ATI的爭霸之路,直至2006年,以ATI被AMD收購告終。

        雖然在這之后,AMD仍在延續(xù)ATI的Radeon顯卡產(chǎn)品線,但英偉達已經(jīng)坐穩(wěn)顯卡領(lǐng)域第一的寶座。

        “皮衣刀客”黃仁勛

        2006年,英偉達發(fā)布了通用并行計算架構(gòu),也就是大名鼎鼎的CUDA。其更是讓GPU除了計算3D模型外,具備了進行通用計算和編程的能力。

        同年發(fā)布的8800 GTX,堪稱英偉達最經(jīng)典的顯卡產(chǎn)品之一。其不僅引入了沿用至今的流處理器概念,而且采用的Tesla架構(gòu),更是成為了同年發(fā)售的首代AI加速卡C870的前綴,并在這之后沿用多年。

        自此,英偉達就在通用計算和CUDA編程軟件平臺上越走越遠,并在2013年的AI熱潮中脫穎而出,以強于同價位CPU數(shù)倍的模型訓(xùn)練速度,與優(yōu)秀的軟件適配,讓原本僅用于游戲和建模領(lǐng)域的顯示芯片,在人工智能的賽道上一往無前。

        縱觀英偉達旗下的產(chǎn)品線,可以看到其業(yè)務(wù)發(fā)展的清晰思路,如專注于游戲和個人消費領(lǐng)域的GeForce系列、專注于3D建模與渲染的Quadro系列,以及此次被限制出口的主角—專注于AI加速領(lǐng)域的Tesla系列。

        有趣的是,英偉達在2020年發(fā)布Tesla系列加速卡時,因為與著名電動車品牌特斯拉“撞名”,容易產(chǎn)生不必要的誤會,而放棄這一前綴,之后的產(chǎn)品僅以采用的架構(gòu)名稱縮寫+數(shù)字方式命名,如采用安培Ampere架構(gòu)的A100,和采用赫柏Hopper架構(gòu)的H100。

        GeForce與Quadro系列的最大區(qū)別,在于其提供的驅(qū)動程序不同。GeForce系列的驅(qū)動更注重游戲性能的優(yōu)化,Quadro系列則注重于對專業(yè)圖形設(shè)計與渲染軟件性能的優(yōu)化。兩者的硬件規(guī)格差距不大,更多的是軟件層面的區(qū)別。Tesla系列則不同。

        首先,GPU中對于計算機常用到的浮點計算,需要由不同類型的核心來完成,主要分為FP32單精度計算核心,與FP64雙精度計算核心。同時,還有FP16的“半精度”,與最近正在推行的FP8格式,以進一步簡化AI計算所需要的精度要求,來提升效率、降低能耗。

        世界上第一款GPU GeForce256

        即便如此,超高精度的FP64,仍是諸多科研工作中不能忽視的計算需求。畢竟在特定領(lǐng)域,如軍工、大氣和病毒結(jié)構(gòu)分析等對計算結(jié)果精度要求高的行業(yè),有時一兩位有效數(shù)字的差別,結(jié)果就可能謬以千里。而針對這些專業(yè)情況下所用到的計算需求,英偉達為Tesla系列芯片配備了大量的FP64計算單元。

        在A100的GA100核心中,F(xiàn)P64與FP32的比例為1比2,而這一數(shù)字在如今消費級旗艦3090ti搭載的GA102核心上,僅為1比64—游戲渲染和AI任務(wù)的區(qū)別一目了然。

        這也使得3090ti的FP32算力達到了45TFLOPS,但FP64僅有不到0.7TFLOPS。而A100的FP32算力雖然僅有19.5TFLOPS,但FP64算力則達到了恐怖的10TFLOPS,是3090ti的14.3倍。英偉達最近發(fā)布的下一代產(chǎn)品H100的FP64算力,甚至能達到30TFLOPS之多。

        這樣精準的“刀法”,在英偉達旗下的產(chǎn)品里屢見不鮮,又因為黃仁勛每次發(fā)布會上都身著一身黑色皮夾克,他也被游戲玩家授予了“皮衣刀客”的名號。

        市值跌去近六成

        英偉達在8月26日向美國證監(jiān)會提交的資料中提道:“未來峰值性能與芯片I/O性能等于或大于A100的任何英偉達產(chǎn)品,以及包含這些電路的任何系統(tǒng),都需要遵照新的許可要求?!?p>

        華為MDC810自動駕駛芯片

        英偉達Tesla系列芯片

        這樣精準的“刀法”,在英偉達旗下的產(chǎn)品里屢見不鮮。

        雖然兩天后英偉達發(fā)表聲明稱,可以在明年9月前繼續(xù)履行A100和H100的訂單,但受前一消息影響,其股價仍在5個交易日內(nèi)下跌了22%,再加上此前二季度財報低于預(yù)期帶來的波動,其市值已較去年最高點8300億美元跌去近六成。

        瘦死的駱駝比馬大。近年來國產(chǎn)GPU的研發(fā)工作頻頻被提上日程,如芯動科技發(fā)布的“風(fēng)華”系列GPU,也在市場上引起不小的轟動,但其距離以英偉達為代表的世界先進水平,仍有不小的差距。

        而在自動駕駛芯片領(lǐng)域,華為推出的MDC810,與“地平線”即將發(fā)布的征程6芯片,與英偉達的差距要小些。但英偉達智能駕駛芯片Orin的下一代產(chǎn)品Atlan,也憑借著1000Tops的int8算力(1TOPS代表處理器每秒鐘可進行1萬億次計算),來勢洶洶地面向市場。

        盡管在今年多輪下跌行情下,英偉達的市值已跌至3500億美元左右,但其市盈率仍高達46倍。這也從側(cè)面顯示出了這家公司的潛力,以及市場對于AI產(chǎn)業(yè)未來的巨大信心。明年即將年過六十的黃仁勛,會將這艘巨輪引向何方?讓我們拭目以待。

        責(zé)任編輯吳陽煜 wyy@nfcmag.com

        猜你喜歡
        算力架構(gòu)芯片
        多方求解智能時代算力挑戰(zhàn)
        新華月報(2024年7期)2024-04-08 02:10:56
        這個第二不一般
        都市人(2023年11期)2024-01-12 05:55:06
        衛(wèi)星通信在算力網(wǎng)絡(luò)中的應(yīng)用研究
        基于FPGA的RNN硬件加速架構(gòu)
        中國電信董事長柯瑞文:算力成為數(shù)字經(jīng)濟的主要生產(chǎn)力
        功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實踐
        汽車工程(2021年12期)2021-03-08 02:34:30
        LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實現(xiàn)
        芯片測試
        多通道采樣芯片ADS8556在光伏并網(wǎng)中的應(yīng)用
        一種基于FPGA+ARM架構(gòu)的μPMU實現(xiàn)
        国产精品女同久久久久电影院| 国产熟妇人妻精品一区二区动漫| 亚洲免费人成在线视频观看| 国产成人精品电影在线观看18 | 日本免费影片一区二区| 337p日本欧洲亚洲大胆色噜噜 | 91成人自拍国语对白| 少妇人妻陈艳和黑人教练| 性欧美暴力猛交69hd| 国产综合久久久久影院| 国产成人精品蜜芽视频| 亚洲岛国一区二区三区| 久久狠狠色噜噜狠狠狠狠97| 久久精品免视看国产成人| 亚洲 都市 校园 激情 另类| 欧美刺激午夜性久久久久久久| 国产AV无码无遮挡毛片| 国内国外日产一区二区| 日韩一区二区三区熟女| 国产片精品av在线观看夜色| 久久国产精品久久精品国产| 91美女片黄在线观看| 青青草精品在线免费观看| 亚洲国产系列一区二区| 国产成人精品a视频| 84pao强力打造免费视频34| 国产麻豆剧传媒精品国产av蜜桃| 日韩有码在线免费视频| 日本精品一区二区高清| 东北少妇不带套对白| 最新国产日韩AV线| 加勒比日本东京热1区| 国产中文字幕亚洲国产| 亚洲人成精品久久久久| 亚洲日韩中文字幕一区| 亚洲黄色性生活一级片| 中文字幕人妻精品一区| 男人边做边吃奶头视频| 国产在线手机视频| 2021年性爱喷水视频| 国产亚洲精品精品综合伦理|