亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        飛趁昆侖山上去,須臾化作一天云’走近百度昆侖Al處理器

        2020-01-19 13:15:40李實
        微型計算機 2020年23期
        關(guān)鍵詞:昆侖百度處理器

        李實

        對國內(nèi)的高科技企業(yè)而言,在集成電路產(chǎn)品上發(fā)力已經(jīng)不是什么新聞了。作為這類企業(yè)代表之一的百度,近年來也在自研處理器的道路上越走越快。2020年9月15日,“萬物智能——百度世界2020大會”上,百度宣布了昆侖1 Al處理器已經(jīng)量產(chǎn)的消息,那么這款名為昆侖1的Al處理器在性能和架構(gòu)上的情況究竟是怎么樣的呢?我們就和你一起來了解這些內(nèi)容。

        百度在云計算和人工智能方面有深入的研究,并持續(xù)進行較高的產(chǎn)業(yè)投入。2018年,百度宣布將研發(fā)自家首款A(yù)I芯片,代號“昆侖”。2019年12月,百度宣布選擇三星作為代工伙伴,準備量產(chǎn)昆侖芯片。在2020年的“百度世界2020”大會上,百度宣布昆侖1芯片已經(jīng)量產(chǎn),正在研發(fā)昆侖2芯片,其中昆侖1芯片已經(jīng)在百度搜索以及云計算用戶上部署了2萬片,預(yù)研的昆侖2芯片計劃采用7nm工藝,性能將達到昆侖1的3倍以上,計劃2021年上半年量產(chǎn)。一路走來,百度的昆侖芯片從紙面到實際,從0到2萬片,那么,百度昆侖芯片有哪些值得關(guān)注的地方呢?

        從Al開始百度研發(fā)AI芯片的開始

        百度在AI芯片方面的投入是從關(guān)注AI的多元化應(yīng)用和多元化場景開始的。百度認為在之前的大型機和小型機時代,人們可以用定制處理器解決問題。在個人電腦時代,x86是絕對的主流。在移動計算時代,ARM和x86在一定程度上和諧共存。但是現(xiàn)在的時代應(yīng)用場景更多、更為復(fù)雜,尤其是AI計算的出現(xiàn),需要大量的算力,而傳統(tǒng)的CPU和GPU完成AI類型的計算都存在效能或者速度上的問題。因此,在這種情況下,面對海量數(shù)據(jù)的AI計算,百度決定開發(fā)專門的AI通用處理器。

        回顧歷史來看的話,百度在201 0年甚至更早就切入了處理器研發(fā)領(lǐng)域。在2010年,百度推出了FPGA平臺上的AI芯片,計算能力為300GFLOPS,并在2011年小規(guī)模部署。2014年的時候,百度推出了計算效能為1TFLOPS的芯片并在2016年提升至2TFLOPS。

        百度為AI通用芯片的開發(fā)設(shè)定了三個目標,那就是面向主流市場、開拓新市場,同時盡可能支持更多的AI應(yīng)用程序和場景。這就意味著百度的AI通用處理器不光是一個芯片,還要提供相應(yīng)的軟件和編譯器等環(huán)境。百度認為這種通用AI芯片面臨的挑戰(zhàn)包括大量的內(nèi)存和計算的訪問模式需要支持,包括主流計算框架內(nèi)數(shù)千種不同的算法、混合了張量、矢量和標量的計算模式以及對內(nèi)存的順序和隨機訪問等。另外,一款長壽的AI通用處理器還要考慮到算法和應(yīng)用隨著時間快速變化,以及開發(fā)人員對硬件和軟件環(huán)境的熟悉程度等。

        鑒于此,百度也提出了一系列的解決方案,致力于提供一個通用的、具有靈活的、可編程性相當優(yōu)秀的同時也是高性能的AI處理器產(chǎn)品。

        昆侖K200芯片百度Al計算的一小步

        本次發(fā)布的昆侖芯片的型號分別是昆侖K100和昆侖K200,兩者架構(gòu)相同,但是前者K100性能和功耗等只有后者K200的一半,本文以百度昆侖K200為例進行介紹。百度昆侖K200整體架構(gòu)采用了百度之前研發(fā)的XPU架構(gòu),支持INT 4、INT 8、INT 16以及FP32、FP16等不同格式的數(shù)據(jù)計算。其計算性能在INT 8數(shù)據(jù)格式下?lián)碛?56TOPS,在INT/FP 16下縮減至64TOPS,在INT/FP32格式下縮減至16TOPS。另外,芯片通過HBM和2.5D封裝技術(shù)包含了16GB、512GB的本地存儲。制造工藝方面采用三星14nm工藝,TDP功耗為150W,外部接口支持PCle 4.0 x8規(guī)范。

        百度的XPU架構(gòu)也是AI計算業(yè)界的老面孔了,在2017年就已經(jīng)發(fā)布上線。不過當時百度和賽靈思一起合作,采用了FPGA的方式實現(xiàn)。百度當時選擇FPGA的原因主要是看中了FPGA本身的高效率和可編程性,百度宣稱XPU則關(guān)注計算密集型、基于規(guī)則的多樣化計算任務(wù),希望提高效率和性能,并帶來類似CPU的靈活性,因此FPGA是比較合適的平臺。

        在架構(gòu)設(shè)計方面,XPU采用的是眾多微核心、搭配定制邏輯以及可以根據(jù)應(yīng)用程序配置計算資源的方式。在一個XPU核心中,一個擁有多接口的內(nèi)存控制器( Multi-PortMC)位于處理器核心位置,周圍掛接了包括DDR4內(nèi)存、DMA總線在內(nèi)的各種數(shù)據(jù)存儲和傳輸設(shè)備,其主要計算單元是眾多微核心( Tiny Cores),另外還有可定制的邏輯單元(Customized logic)。眾多的微核心能夠?qū)崿F(xiàn)基于指令集的可編程性,并且沒有Os、緩存、域或者特定的ISA約束,能夠靈活的服務(wù)于各種不同的計算負荷。在定制邏輯方面,整個邏輯是硬件可重構(gòu)的,這也是FPGA的鮮明特性之一。此外,百度還提到XPU可以根據(jù)不同的計算任務(wù)對計算核心和邏輯核心的比例進行重新定義,這樣能夠在不同的任務(wù)中都獲得較高的效能。

        在XPU的微核心部分,百度將32個微核心定義為1個核心簇(Core Cluster),核心簇的數(shù)量多少取決于芯片的計算規(guī)模要求。每個核心簇通過雙向256bit的帶寬和多接口內(nèi)存控制器聯(lián)系。核心簇內(nèi),除了計算核心(被稱為Core)外,還包含了一個特殊功能加速單元和所有核心共享的32KB緩存。百度特別提到,32個計算核心的數(shù)據(jù)都已經(jīng)本地化并且多核心共享,這樣更加方便控制和布線。

        進一步深入每個計算核心也就是Core的話,百度宣稱Core采用了類似MIPS的指令設(shè)計,擁有4級流水線,分別是前端的BTH/Fetch/l_buf,以及decode Q、decode/RF后,進入issue Q,然后進入ALU/load/store進行計算或者存取處理,隨后交由WB Q進行結(jié)果處理。整個流水線級數(shù)短、延遲低。另外,每個Core還配備了16或者32KB的私有臨時緩存,用于暫存數(shù)據(jù),提高效能。

        在新的昆侖K200上,百度還是采用了之前在FPGA上使用成熟的XPU架構(gòu),但是將其升級到了XPU v2版本。百度宣稱XPU v2版本的設(shè)計思想和之前的產(chǎn)品是一致的,但是ASIC化后整體性能更為強大。百度還給出了一個簡單的架構(gòu)圖,下面本文簡單解析—下。

        XPU v2核心內(nèi)部包含計算單元、PCIe總線控制器、HMB控制器和相關(guān)連接總線。一個XPU v2核心內(nèi)部有2個計算單元,分別是Compute Unit 0和Compute Unit1。繼續(xù)深入的話,每個計算單元內(nèi)部包含了4個XPU-SDNN核心和4個XUP-Cluster核心,還有一個16MB緩存。所謂SDNN,是指“spacedisplacement neural network”,也就是空間位移神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)算法通常用于圖形圖像的查找,或者在一個大型圖像中查找關(guān)鍵內(nèi)容,由于其計算過程涉及空間上的位置改變,因此又被稱為空間位移神經(jīng)網(wǎng)絡(luò)。百度特別提到,XPU-SDNN可以進行軟件定義,針對張量和矢量計算而設(shè)計。另外則是XPU-Cluster,針對標量和矢量計算設(shè)計,采用的是常見的SIMD指令,每一個XPU-Cluster中擁有前文提到的16個微核心。在數(shù)據(jù)存儲方面,每個HBM控制器對應(yīng)1個計算單元,提供8GB的HBM存儲空間和256GB/s的數(shù)據(jù)帶寬。

        除了硬件架構(gòu)外,昆侖K200在軟件上也做出了一些優(yōu)化。昆侖K200支持不同的框架協(xié)議,包括Tensorflow、Pytorch、國產(chǎn)自主的Paddle Paddle等,還提供了名為XPU ClC++的編程語言,用于用戶操作編程并給出新的操作。另外,在庫文件方面,百度提供了專用于昆侖K200的深度學習庫,支持深度學習中常用的各種API等。在整個軟件架構(gòu)方面,百度給出的簡圖顯示,硬件之上百度設(shè)計了昆侖驅(qū)動,再向上則是昆侖runtime/complier文件,再向上則分為庫文件、用戶自用Kernel以及圖像編譯器,最頂層則是應(yīng)用程序、框架文件和開發(fā)人員界面等。

        目前,昆侖K200的軟件生態(tài)已經(jīng)有了一定的基礎(chǔ)。昆侖K200芯片目前能夠全面支持語音、圖像、NLP模型以及自定義模型等,即使是百度之外,也有了約10個客戶在使用或者部署,整體表現(xiàn)還是不錯的。性能比拼勝過英偉達T4

        最后則是喜聞樂見的性能對比測試。百度昆侖K200選擇的競爭對手是英偉達T4。根據(jù)百度的數(shù)據(jù)來看,昆侖K200在百度設(shè)定的測試場景下,均以較大幅度領(lǐng)先英偉達T4,包括專注于目標檢測算法的YoIoV3,以及常用于自然語言處理的BERT,還有用于搜索的真實引擎模型,以及用于目標檢測和像素級分割的Mask R-CNN等,可以說基本涵蓋了百度這類用戶在日常生活中所需要的AI操作。百度還宣稱,目前昆侖K200已經(jīng)在線上部署,只要用戶通過百度云申請就可以調(diào)用昆侖K200了。另外值得一提的是,2019年12月,百度宣布正在配合飛騰處理器進行產(chǎn)品適配,將配合飛騰處理器形成國內(nèi)自主可控的AI加速平臺,這也是國內(nèi)AI加速設(shè)備國產(chǎn)化方面比較重要的成就了。

        最后,本文依舊照例來對百度昆侖K200的產(chǎn)品進行一些總結(jié)。從整個昆侖K200的發(fā)展歷史、架構(gòu)設(shè)計以及百度對其性能的相關(guān)介紹來看,昆侖K200還是達到了百度之前確立的設(shè)計目標的,那就是成為一款通用的、具有靈活的、可編程性相當優(yōu)秀的同時也是高性能的AI處理器,其在百度各類測試和應(yīng)用中也體現(xiàn)出了比較好的效果。但是,昆侖K200還有巨大的改進空間和提升空間,比如相比英偉達最先進的A100,昆侖K200在工藝、規(guī)模、計算能力、計算功能、數(shù)據(jù)格式支持、軟件支持等方面差距還比較遠,尤其是對諸如目前流行的BF類型的數(shù)據(jù)格式、混合精度支持、對稀疏性計算的支持等,都尚未在這款產(chǎn)品中有所體現(xiàn)。當然作為一款2018年開始研發(fā)、2020年大規(guī)模量產(chǎn)的產(chǎn)品,又是企業(yè)首款A(yù)SIC類型的芯片來說,的確沒有必要太過苛責,但是我們依舊希望百度在下一代昆侖芯片中能夠做出更大的突破和更多的技術(shù)創(chuàng)新。根據(jù)百度的消息,下一代昆侖芯片將具有高速片間互聯(lián)功能,能夠大大降低數(shù)據(jù)傳輸延遲,并且還擁有從云推理、云計算到邊緣計算的多款細分型號,有望覆蓋更多、更大的市場,值得用戶和業(yè)界期待。

        猜你喜歡
        昆侖百度處理器
        《昆侖之境》
        我在南昌 你在哪
        心聲歌刊(2022年3期)2022-06-06 06:31:42
        跨越昆侖
        Robust adaptive UKF based on SVR for inertial based integrated navigation
        昆侖
        百度年度熱搜榜
        青年與社會(2018年2期)2018-01-25 15:37:06
        百度遭投行下調(diào)評級
        IT時代周刊(2015年8期)2015-11-11 05:50:22
        Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
        ADI推出新一代SigmaDSP處理器
        汽車零部件(2014年1期)2014-09-21 11:41:11
        百度“放衛(wèi)星”,有沒有可能?
        太空探索(2014年4期)2014-07-19 10:08:58
        国产国拍精品亚洲av在线观看 | 区二区三区玖玖玖| 欧美大成色www永久网站婷| 色婷婷久久综合中文久久蜜桃av| 亚洲国产欧美日韩一区二区| 国产高清在线精品一区αpp| 人妻中文字幕一区二区二区| av天堂一区二区三区精品| 91精品国产综合久久久密臀九色| 亚欧美日韩香蕉在线播放视频| 麻豆AⅤ无码不卡| 日本一区二区三区资源视频| 国产三级c片在线观看| 精品女厕偷拍视频一区二区区| 久久亚洲精品情侣| 欧美丰满熟妇aaaaa片| 久久精品国产屋| 91色综合久久熟女系列| 日本一区二区不卡精品| 欧美 日韩 人妻 高清 中文| 男人靠女人免费视频网站| 初尝黑人嗷嗷叫中文字幕| 亚洲中文字幕无码卡通动漫野外| 一区二区三区在线观看高清视频| 亚洲在线精品一区二区三区| 久久99精品久久久久久清纯| 大地资源在线观看官网第三页| 伊人久久成人成综合网222| 女同性恋亚洲一区二区| 亚洲国产综合久久天堂| 三年在线观看免费大全下载| 国产av成人精品播放| 亚洲三区av在线播放| 亚洲国产性夜夜综合另类| 亚洲av午夜福利精品一区二区| 永久无码在线观看| 91热久久免费频精品99| 日产一区二区三区免费看 | 国产a v无码专区亚洲av| 一区二区三区不卡免费av| 青草久久婷婷亚洲精品|