亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        CUDA技術(shù)在GPU通用計算中的應(yīng)用

        2016-05-28 10:40:09王華龍
        科技與創(chuàng)新 2016年10期
        關(guān)鍵詞:存儲器

        王華龍

        摘 要:CUDA技術(shù)是由NVIDIA推出的通用并行計算架構(gòu),其中的GPU能夠解決復(fù)雜的計算問題。該架構(gòu)主要包含CUDA指令集架構(gòu)(ISA)和GPU內(nèi)部的并行計算引擎,所編寫的程序可以在支持CUDA的處理器上運行。

        關(guān)鍵詞:CUDA技術(shù);GPU處理器;并行計算引擎;存儲器

        中圖分類號:TP391.9 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.10.159

        1 實現(xiàn)CUDA技術(shù)的GPU結(jié)構(gòu)

        1.1 支持CUDA技術(shù)的GPU計算單元結(jié)構(gòu)

        支持CUDA技術(shù)的GPU處理器的強大運算能力來自芯片的SM(Streaming Multiprocessor),而Fermi處理器將每個SM包含的線程處理器增加到32個,線程處理器首次增加一級緩存結(jié)構(gòu)和二級緩存,它可以供所有的SM處理器使用。為了滿足通用計算的要求,擁有最新CUDA技術(shù)的Fermi處理器首次引入真正的緩存,每組SM擁有64 KB可配置內(nèi)存(64 KB×16=1 024 KB,共1 MB),具體可分為16 KB共享內(nèi)存和48 KB一級緩存,或者48 KB共享內(nèi)存和16 KB一級緩存。它可以靈活配置,以滿足不同任務(wù)的要求。Fermin處理器首次引入768 KB的共享二級緩存供16個SM共享使用。

        1.2 CUDA的存儲器結(jié)構(gòu)

        CUDA組織架構(gòu)主要包括紋理存儲器(Texture Memory)、本地存儲器(Local Memory)、全局存儲器(Global Memory)、常數(shù)存儲器(Consant Memory)、寄存器(Register)和共享存儲器(Shared Memory)。

        寄存器(Register)是GPU處理器芯片上的高速緩存,執(zhí)行單元從寄存器里存取數(shù)據(jù)和指令有著最低的存取延時和最快的執(zhí)行速度。

        在CUDA架構(gòu)中,寄存器的基本單元是寄存器文件(Register File),每個寄存器文件為4字節(jié)寬度。寄存器對提高程序的執(zhí)行效率有非常重要的作用。

        在執(zhí)行程序時,局部存儲器(Local Memory)只能被CUDA核心的執(zhí)行單元存取,而不能被同一個SM流處理器的其他CUDA核心使用,屬于CUDA核心專用存儲器。當每個CUDA核心的寄存器被相關(guān)程序使用完后,便使用局部存儲器存放程序的數(shù)據(jù)和指令。相對于寄存器來說,局部存儲器的存取延時增加了。

        共享存儲器(Shared Memory)也是GPU內(nèi)的高速存儲器。它可以被同一個Block中的多個線程共同訪問,并存取數(shù)據(jù)。這對實現(xiàn)稍微復(fù)雜的并行算法非常有用。在第一代和第二代CUDA架構(gòu)的GPU芯片中,每個SM流處理器的共享存儲器為16 Kbyte,被組織成16塊。在新一代Fermi架構(gòu)中,GPU芯片的共享存儲器與以往的GPU有很大的不同,不僅容量上有變化,配置也更加靈活,可以根據(jù)任務(wù)的需要配置為48 Kbyte或16 Kbyte。

        全局存儲器(Global Memory)是位于PCB電路板上的顯示存儲器,不論是CPU還是GPU,都可以方便地存取、訪問。整個GPU上每個SM流處理器中的線程都能訪問全局存儲器。全局存儲器是由多個顯存芯片組成的,它可以根據(jù)任務(wù)需要靈活搭配——增加容量或增加系統(tǒng)帶寬。由于全局存儲器與GPU并非集成在一起,所以,當GPU中的線程要從全局存儲器中讀取數(shù)據(jù)和存放結(jié)果時,要耗費較長的時間,有較大的存取時延,而且它沒有緩存機制。

        常數(shù)存儲器(Constant Memory)與全局存儲器一樣都位于顯存芯片中,但是,與全局存儲器不同的是,常數(shù)存儲器擁有緩存,可以加速該區(qū)域存儲器的訪問,而且每個SM流處理器擁有8 KB的常數(shù)存儲器,它是只讀的。

        2 NVCC編譯器

        NVCC編譯器是一種混合編譯環(huán)境。該編譯器主要用于分析目標程序中的代碼,將源程序代碼分為兩類,一類代碼由CPU執(zhí)行,另一類適合并行計算的代碼由GPU執(zhí)行。這樣做,可以讓CPU完成復(fù)雜的控制和管理任務(wù),由GPU完成高度并行的計算任務(wù)。

        3 CUDA

        CUDA可以提供CUFFT、CUBLAS和CUDPP 3個功能強大的函數(shù)庫,像C語言的常用庫函數(shù)一樣,提供高效的常用函數(shù)。CUFFT是一個利用GPU進行傅里葉變換的函數(shù)庫;CUBLAS是一個基本的矩陣與向量運算庫,它可以提供與BLAS庫相似的接口,并用于矩陣運算;CUDPP可以提供很多基本的常用并行操作函數(shù),以作為基本組件快速搭建并行數(shù)據(jù)處理平臺。

        參考文獻

        [1]趙勇.認知無線電的發(fā)展與應(yīng)用[J].電視技術(shù),2009,49(6):93-101.

        [2]王曉琴,黑勇.軟件無線電硬件體系結(jié)構(gòu)研究[J].科技技術(shù)與工程,2006,6(13):1820-1824.

        [3]張麗.虛擬無線電接收機的實現(xiàn)計算法研究[D].西安:西安電子科技大學,2007.

        [4]盧光軍,陸佩中.一種基于集群計算的軟件無線電接收系統(tǒng)實現(xiàn)[J].微電子學與計算機,2008,25(10):80-86.

        [5]李苗.虛擬無線電接收平臺開發(fā)和關(guān)鍵技術(shù)研究[D].西安:西安電子科技大學,2006.

        〔編輯:白潔〕

        猜你喜歡
        存儲器
        靜態(tài)隨機存儲器在軌自檢算法
        Xilinx新型FPGA將存儲器帶寬提升20倍
        任意2~k點存儲器結(jié)構(gòu)傅里葉處理器
        非易失性納米晶存儲器的研究
        構(gòu)建基于24XX系列存儲器通用函數(shù)庫的研究
        Altera演示FPGA中高性能DDR4存儲器數(shù)據(jù)速率
        高維固態(tài)量子存儲器研制成功
        存儲器——安格爾(墨西哥)▲
        基于Nand Flash的高速存儲器結(jié)構(gòu)設(shè)計
        Buffalo推出四硬盤網(wǎng)絡(luò)存儲器 主打Soho一族
        国产综合久久久久| 日韩精品免费在线视频一区| 男人的天堂一区二av| 伊人久久大香线蕉综合影院首页| 国精产品一区二区三区| 无码尹人久久相蕉无码| 最新四色米奇影视777在线看| 五月天激情综合网| 久久人妻av无码中文专区| 国产极品大秀在线性色| 免费国产在线精品一区 | 乱人伦人妻中文字幕无码| 国产在线一区观看| 久久免费精品视频老逼| 久久一二区女厕偷拍图| 精品日产卡一卡二卡国色天香| 亚洲一级黄色毛片| 精品人妻夜夜爽一区二区| 亚洲精品国产第一区二区| 熟女少妇在线视频播放| 乱伦一区二| 亚洲国产天堂av成人在线播放| 未满十八18禁止免费无码网站| 人妻丝袜无码国产一区| 久久亚洲日本免费高清一区 | 亚洲欧美日韩精品高清| 国产一区二区三区高清视频 | 精品欧美一区二区三区久久久| 亚洲v欧美v国产v在线观看| 无码人妻AⅤ一区 二区 三区| 精品无码人妻久久久一区二区三区| 国产精品自拍盗摄自拍| 日本阿v片在线播放免费| 少妇高潮喷水正在播放| av资源在线看免费观看| 久久综合亚洲鲁鲁五月天| 亚洲综合av永久无码精品一区二区 | 亚洲色成人网一二三区| 色综合久久人妻精品日韩| 在线观看特色大片免费视频| 久久婷婷国产剧情内射白浆|