亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        GPU并行計(jì)算分析

        2017-04-05 11:34:54張澳博
        數(shù)字通信世界 2017年9期
        關(guān)鍵詞:線程指令運(yùn)算

        張澳博

        (鄭州外國(guó)語(yǔ)學(xué)校,鄭州 450000)

        GPU并行計(jì)算分析

        張澳博

        (鄭州外國(guó)語(yǔ)學(xué)校,鄭州 450000)

        本文通過(guò)闡述GPU的基本原理和發(fā)展歷程,對(duì)比CPU與GPU之間設(shè)計(jì)目的的不同,來(lái)說(shuō)明GPU在高并行度計(jì)算中的優(yōu)勢(shì),并介紹GPU的其他重要應(yīng)用,提出將來(lái)可能的發(fā)展前景。

        計(jì)算機(jī);并行計(jì)算;GPU

        1 GPU基本原理與發(fā)展歷程

        GPU取自Graphic Processing Unit的英文簡(jiǎn)寫(xiě),譯為圖形處理單元。顧名思義,GPU是用來(lái)專門(mén)處理圖形運(yùn)算的處理單元,并且最初GPU的產(chǎn)生是為了將部分3D圖形處理功能從CPU中分出來(lái),進(jìn)行硬件實(shí)現(xiàn),以達(dá)到加快3D圖形處理速度的目的。GPU的標(biāo)志性技術(shù)是將T&L(光影轉(zhuǎn)換)從CPU中分離出來(lái),用硬件來(lái)加以支持,T&L是3D渲染中的一個(gè)不可或缺的重要部分,其作用是做幾何處理,主要計(jì)算圖形的3D角度位置和處理動(dòng)態(tài)光線陰影效果。除此之外,GPU還包含其他重要技術(shù),例如立方環(huán)境材質(zhì)貼圖、紋理壓縮等等。

        之后,GPU在發(fā)展中引入了可編程的特性,能夠?qū)D形硬件的流水線作為流處理器來(lái)解釋,基于GPU的通用計(jì)算也開(kāi)始出現(xiàn),主要用于實(shí)現(xiàn)矩陣乘法運(yùn)算和數(shù)學(xué)擴(kuò)散方程求解。為了實(shí)現(xiàn)更復(fù)雜多變的圖形效果,除了依賴硬件T&L實(shí)現(xiàn)光影轉(zhuǎn)換,還要加強(qiáng)頂點(diǎn)和像素的運(yùn)算能力,因此又提出了頂點(diǎn)著色器和像素著色器的硬件邏輯實(shí)現(xiàn),用于支持可編程的頂點(diǎn)和像素,當(dāng)然,最初雖然引入了可編程特性,但是可編程性很弱,受到許多的硬件限制。不久以后,隨著可編程管線的出現(xiàn),GPU的可編程性能不斷加強(qiáng),GPU開(kāi)始朝著SIMD處理器方向發(fā)展,SIMD是Single Instruction Multiple Data的英文簡(jiǎn)稱,譯為單指令多數(shù)據(jù)流,主要特性是一條指令流可以同時(shí)處理多個(gè)數(shù)據(jù)流。此外,GPU的可編程性提高后,可編程浮點(diǎn)單元就變成GPU內(nèi)部的主要運(yùn)算力量。目前而言,面向GPU的統(tǒng)一計(jì)算架構(gòu)CUDA的出現(xiàn),使得GPU成為GPGPU(基于GPU的通用計(jì)算),只是它還保留最初被設(shè)計(jì)的專用圖像處理的功能。

        由于GPU在浮點(diǎn)計(jì)算能力上的突出表現(xiàn)滿足了深度學(xué)習(xí)在分類、卷積兩大主要活動(dòng)上的性能要求,并且達(dá)到了深度學(xué)習(xí)所需要的精準(zhǔn)度,使得大型神經(jīng)網(wǎng)絡(luò)能夠盡可能地發(fā)揮其作用,因此幾乎所有的深度學(xué)習(xí)計(jì)算平臺(tái)都采用了GPU用來(lái)加速。NVIDIA表示,深度學(xué)習(xí)需要很高的內(nèi)在并行度、大量的浮點(diǎn)計(jì)算能力以及矩陣預(yù)算,而GPU可以提供這些能力,并且在相同的精度下,相對(duì)傳統(tǒng)CPU的方式,擁有更快的處理速度、更少的服務(wù)器投入和更低的功耗。

        2 GPU與CPU

        GPU和CPU都是有很強(qiáng)運(yùn)算能力的芯片,且都能完成浮點(diǎn)運(yùn)算功能,它們之間在性能上表現(xiàn)出來(lái)的不同,主要來(lái)自于他們不同的設(shè)計(jì)目的。

        CPU被設(shè)計(jì)成為一個(gè)“通才”,它要兼顧指令和數(shù)值的并行運(yùn)算,大部分的晶體管用在了Cache(高速緩沖存儲(chǔ)器)和控制電路上,控制電路十分的復(fù)雜,內(nèi)部?jī)H有5%的ALU(算術(shù)邏輯單元,即運(yùn)算器);GPU則被設(shè)計(jì)成為一個(gè)以圖形類數(shù)值計(jì)算為核心的專注計(jì)算的“專才”,它對(duì)Cache需求不高,控制電路也較CPU簡(jiǎn)單許多,于是它大部分的晶體管用在了計(jì)算單元上,內(nèi)部有40%的ALU。因此,CPU的設(shè)計(jì)目的是指令執(zhí)行的高效率,它的核心部分重復(fù)的設(shè)計(jì)不多,是計(jì)算機(jī)中設(shè)計(jì)最復(fù)雜的芯片,實(shí)現(xiàn)了程序執(zhí)行時(shí)的指令相關(guān)性和數(shù)據(jù)相關(guān)性等等復(fù)雜邏輯;GPU的設(shè)計(jì)目的則是面向矩陣類型的數(shù)值計(jì)算,它擁有大量重復(fù)設(shè)計(jì)的計(jì)算單元,用于實(shí)現(xiàn)大規(guī)模同類型數(shù)據(jù)的密集計(jì)算,最典型的就是圖形數(shù)據(jù)的矩陣運(yùn)算,這類計(jì)算可分成獨(dú)立數(shù)值計(jì)算單元,并且數(shù)據(jù)之間沒(méi)有程序執(zhí)行那樣的邏輯關(guān)聯(lián)性。

        相比較于CPU的設(shè)計(jì),GPU在一些需要耗費(fèi)巨大運(yùn)算力的問(wèn)題處理上顯得優(yōu)勢(shì)明顯,主要特點(diǎn)有:

        ⊙ GPU的核心數(shù)量眾多,被稱為“眾核”,能夠進(jìn)行并行計(jì)算。雖然GPU單個(gè)的運(yùn)算核心相較于CPU的工作頻率低,但是GPU在總體的性能功耗比和性能芯片面積比上優(yōu)于CPU很多。

        ⊙ GPU能夠在一定程度上隱藏全局延遲。主要是通過(guò)大量并行線程之間的交織運(yùn)行來(lái)達(dá)到這樣的目的。

        ⊙ GPU在線程之間的切換上的開(kāi)銷遠(yuǎn)遠(yuǎn)低于CPU。

        神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,最重要的是訓(xùn)練速度,尤其是在深度學(xué)習(xí)中,它擁有的過(guò)多參數(shù)會(huì)耗費(fèi)大量的時(shí)間。而在神經(jīng)網(wǎng)絡(luò)中,大量的運(yùn)算是關(guān)于矩陣的運(yùn)算,這剛好與GPU的優(yōu)勢(shì)相重合,GPU本來(lái)設(shè)計(jì)的目的就是處理舉行類型的數(shù)值計(jì)算,所以GPU非常適合神經(jīng)網(wǎng)絡(luò)訓(xùn)練。

        3 GPU發(fā)展前景

        GPU在并行計(jì)算上的優(yōu)勢(shì)無(wú)可厚非,視頻編碼解碼、矩陣運(yùn)算、醫(yī)療應(yīng)用、生命科學(xué)等研究應(yīng)用,因?yàn)樾枰罅恐貜?fù)的數(shù)據(jù)集運(yùn)算以及密集的內(nèi)存存取,都需要GPU相較于CPU而言更強(qiáng)悍的計(jì)算能力。但是GPU并行運(yùn)算是有前提的,它所處理的問(wèn)題必須分成若干個(gè)可以并行執(zhí)行的部分。目前,很多問(wèn)題其實(shí)并不滿足這個(gè)前提,大多數(shù)情況是后一個(gè)執(zhí)行依賴著前一個(gè)執(zhí)行的結(jié)果,這樣的存在依賴情況下,只能串行運(yùn)行,不能并行運(yùn)行,這樣一來(lái),GPU顯得沒(méi)有用武之地。并且,GPU計(jì)算上的突出優(yōu)勢(shì)也僅僅體現(xiàn)在浮點(diǎn)運(yùn)算上,在整數(shù)運(yùn)算、邏輯運(yùn)算和控制運(yùn)算上,相較于CPU劣勢(shì)十分明顯。

        因此,GPU要有長(zhǎng)遠(yuǎn)的發(fā)展,以下幾個(gè)地方必須得到彌補(bǔ)。首先是分支預(yù)測(cè)能力,GPU需要擁有更好的分支能力,才能運(yùn)行更多復(fù)雜程序,更好地利用cache來(lái)掩蓋分支的延遲;其次是更大的緩存和Shared Memory,這種共享寄存器負(fù)責(zé)共享數(shù)據(jù)和臨時(shí)掛起線程,容量越大,線程跳轉(zhuǎn)和分支能力就越強(qiáng);線程粒度同樣重要,粒度越細(xì)能夠調(diào)用并行度來(lái)進(jìn)行指令延遲掩蓋的機(jī)會(huì)越大,性能衰減越小,而細(xì)化粒度對(duì)GPU的線程仲裁機(jī)制要求很大。

        GPU發(fā)展到今天,已經(jīng)突破了無(wú)數(shù)技術(shù)屏障,最初因圖形處理而誕生的硬件發(fā)展成為今天大規(guī)模并行計(jì)算領(lǐng)域的一顆新星。隨著智能終端對(duì)于圖像顯示的要求越來(lái)越高,GPU的性能也會(huì)隨之越來(lái)越優(yōu)化,也會(huì)被越來(lái)越多的大型計(jì)算機(jī)所采用。

        展望未來(lái),GPU的發(fā)展方向應(yīng)該是CPU+GPU的混合構(gòu)架模式,這樣使得CPU與GPU優(yōu)勢(shì)互補(bǔ),將擁有高性能、低能耗的特點(diǎn)。

        4 結(jié)束語(yǔ)

        CPU與GPU各有所長(zhǎng),CPU擅長(zhǎng)處理具有復(fù)雜計(jì)算步驟和復(fù)雜數(shù)據(jù)依賴的計(jì)算任務(wù),像操作系統(tǒng)、系統(tǒng)軟件和通用應(yīng)用程序這類擁有復(fù)雜指令調(diào)度、循環(huán)、分支、邏輯判斷以及執(zhí)行等的程序任務(wù)。它的并行優(yōu)勢(shì)是程序執(zhí)行層面的,程序邏輯的復(fù)雜度也限定了程序執(zhí)行的指令并行性,上百個(gè)并行程序執(zhí)行的線程基本看不到。GPU的眾核架構(gòu)非常適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行,它擅長(zhǎng)的是圖形類的或者是非圖形類的高度并行數(shù)值計(jì)算,GPU可以容納上千個(gè)沒(méi)有邏輯關(guān)系的數(shù)值計(jì)算線程,它的優(yōu)勢(shì)是無(wú)邏輯關(guān)系數(shù)據(jù)的并行計(jì)算,它在數(shù)值分析、金融分析以及像排序和MapReduce這樣的海量數(shù)據(jù)處理上應(yīng)用十分廣泛。

        因此,在一臺(tái)CPU+GPU的計(jì)算機(jī)系統(tǒng)中,CPU和GPU各司其職,除了圖形運(yùn)算,GPU主要集中在高效率低成本的高性能并行數(shù)值計(jì)算,協(xié)助CPU分擔(dān)這種類型的計(jì)算,提高整體系統(tǒng)的性能。

        [1] 盧風(fēng)順,宋君強(qiáng),銀???,張理論.CPU/GPU協(xié)同并行計(jì)算研究綜述[J].計(jì)算機(jī)科學(xué),2011,(03):5-9+46

        [2] 張朝暉,劉俊起,徐勤建.GPU并行計(jì)算技術(shù)分析與應(yīng)用[J].信息技術(shù),2009,(11):86-89

        [3] 姜曉麗,王偉,隋毅.GPU工作流程簡(jiǎn)介[J].科技創(chuàng)新導(dǎo)報(bào),2010,(24):46

        10.3969/J.ISSN.1672-7274.2017.09.014

        TP274文獻(xiàn)標(biāo)示碼:A

        1672-7274(2017)09-0039-02

        猜你喜歡
        線程指令運(yùn)算
        聽(tīng)我指令:大催眠術(shù)
        重視運(yùn)算與推理,解決數(shù)列求和題
        有趣的運(yùn)算
        ARINC661顯控指令快速驗(yàn)證方法
        LED照明產(chǎn)品歐盟ErP指令要求解讀
        “整式的乘法與因式分解”知識(shí)歸納
        淺談linux多線程協(xié)作
        撥云去“誤”學(xué)乘除運(yùn)算
        坐標(biāo)系旋轉(zhuǎn)指令數(shù)控編程應(yīng)用
        Linux線程實(shí)現(xiàn)技術(shù)研究
        青青草视频在线观看入口| 丰满多毛少妇做爰视频| 男人j进女人p免费视频| 国产区高清在线一区二区三区| 亚洲成人一区二区三区不卡| 东京热人妻系列无码专区| 精品亚洲成a人在线观看青青| 伊人精品无码AV一区二区三区| 黑人一区二区三区高清视频| 亚洲国产中文字幕在线视频综合| 婷婷久久香蕉五月综合加勒比| 国产一起色一起爱| 亚洲AV无码日韩一区二区乱| 国产黄色一区二区在线看| 99久久精品国产一区二区| 精品一区二区三区在线观看| 国产精品成人无码a 无码 | 成人日韩av不卡在线观看| 91精品福利一区二区三区| 国产av无码专区亚洲精品| 日本高清色倩视频在线观看 | 久久久调教亚洲| 亚洲精品98中文字幕| 玩弄丰满奶水的女邻居| 亚洲自拍另类制服在线| 国产在线精品亚洲视频在线| 中文字幕女优av在线| 久久久久亚洲精品中文字幕| 亚洲aⅴ无码日韩av无码网站| 美女福利视频网址导航| 国产精品久久久久久久久电影网| 精品欧洲av无码一区二区三区| 中出高潮了中文字幕| 男女深夜视频网站入口| 丁香美女社区| av中文字幕综合在线| 亚洲av国产精品色a变脸| 色综合久久久久综合体桃花网| 熟妇人妻无码中文字幕| 国产裸体AV久无码无遮挡| 国产精品一区二区av不卡|