亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        統(tǒng)一計算設(shè)備架構(gòu)技術(shù)的應(yīng)用研究進(jìn)展*

        2011-06-06 10:06:28許建平
        艦船電子工程 2011年12期

        許建平

        (海軍裝備研究院 北京 100161)

        1 引言

        隨著近年來計算機(jī)圖形處理單元(Graphic Processing Units,GPU)工藝的飛速發(fā)展,GPU的內(nèi)存帶寬、浮點(diǎn)運(yùn)算能力已大大超過了同期的通用處理器。2003年SIGGRAPH大會提出了GPGPU(General-purpose computing on GPU)的概念,GPU逐漸從由專用的固定功能單元組成的專用并行處理器向以通用計算資源為主,固定功能單元為輔的架構(gòu)轉(zhuǎn)變。這使得基于GPU的通用計算成為近幾年人們關(guān)注的一個研究熱點(diǎn)。

        計算統(tǒng)一設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)是NVIDIA公司于2007年推出的針對其G80核心以后的GPU的并行計算框架[1]。在CUDA架構(gòu)下,一個程序分為Host端和Device端。Host端是指在CPU上執(zhí)行的部份,而Device端則是在GPU上執(zhí)行。Device端的程序又稱為“Kernel”。CUDA程序經(jīng)過NVCC編譯器編譯后,一部分代碼被標(biāo)準(zhǔn)C/C++編譯器編譯后在CPU上執(zhí)行,另一部分則首先轉(zhuǎn)換成PTX代碼,然后才轉(zhuǎn)換成GPU指令。

        CUDA實際上只是程序和GPU硬件資源間的接口,代碼的執(zhí)行效率依賴于GPU的硬件資源。NVIDIA的GPU是由若干個紋理處理器集群(Texture Processor Cluster,TPC)組成。不同規(guī)格的GPU的TPC數(shù)量不同。每個TPC由一個紋理單元和兩個流式多處理器(Streaming multiprocessor,SM)組成。每個SM包括一個用于讀取、解碼和發(fā)射指令的前端和一個包括八個流處理器(Streaming Processor,SP)、兩個超級函數(shù)單元的后端組成。CUDA程序在GPU上執(zhí)行時,采用單指令多線程的執(zhí)行方式,在一個指令周期內(nèi)可以并行執(zhí)行上千個線程。圖1為CUDA程序執(zhí)行框架。

        圖1 CUDA程序執(zhí)行框架

        CUDA架構(gòu)下的內(nèi)存訪問模型如圖2所示。每個SM具有四種片內(nèi)存儲器:1)每個SP都有一組本地32位寄存器;2)共享內(nèi)存(Shared Memory),同一Block內(nèi)的線程共享同一片Shared Memory;3)只讀高速緩存(Constant Cache);4)只讀紋理高速緩存(Texture Cache),用于加速紋理內(nèi)存的讀取。本地內(nèi)存(Local Memory)和全局內(nèi)存(Global Memory)為設(shè)備內(nèi)存的讀寫區(qū)域,且無高速緩存。GPU利用大量并行化執(zhí)行的方式來隱藏內(nèi)存訪問的延遲。此外,還可以通過合并(coalesce)連續(xù)內(nèi)存訪問操作來加速全局內(nèi)存的操作。

        圖2 CUDA架構(gòu)下的內(nèi)存訪問模型

        由于GPU的通用特性和CUDA提供的方便的開發(fā)環(huán)境,CUDA技術(shù)已被廣泛用于科學(xué)計算、光線模擬等數(shù)據(jù)密集型應(yīng)用中。以下將對CUDA技術(shù)的應(yīng)用現(xiàn)狀進(jìn)行簡要的闡述。

        2 CUDA技術(shù)應(yīng)用現(xiàn)狀

        憑借GPU的強(qiáng)大并行計算能力以及CUDA的良好編程接口,CUDA在許多領(lǐng)域獲得了大量的應(yīng)用,用以代替CPU的串行計算模式。目前,CUDA的應(yīng)用主要集中在以下五個方面:圖形圖像處理、數(shù)學(xué)計算、物理學(xué)、生物醫(yī)學(xué)、通信。

        以下將對CUDA在這幾個方面的應(yīng)用情況分別進(jìn)行介紹。

        2.1 圖形圖像處理

        GPU最初專門用于圖形圖像處理,因此,CUDA用于圖形圖像處理加速是十分自然的。圖形圖像處理方面的應(yīng)用集中于光線追蹤和實時渲染方面。

        全局光照繪制由于其繪制的真實感,已大量應(yīng)用于電影制作、三維游戲等領(lǐng)域。不過,由于需要計算物體之間光的相互反射等間接光照效果,因而繪制速度較慢。其最大計算量來自可見性的判斷和最后間接光照的收集。Zhou等人利用CUDA技術(shù)實現(xiàn)快速的kD樹建立和遍歷,取得了比CPU快一個數(shù)量級的求解計算速度[2]。Wang等人利用kD樹結(jié)構(gòu)及自適應(yīng)的間接光照收集過程實現(xiàn)了交互的全局光照效果[3]。Ritschel等人將間接光照收集點(diǎn)離散后組織成層次點(diǎn)結(jié)構(gòu),并利用BRDF的重要性采樣和微繪制技術(shù)快速地收集間接光照[4]。Hughes等人提出了并行的無棧遍歷算法Kd-Jump用于快速等值面的光線追蹤算法。該算法無需全局內(nèi)存(棧),只需要少量只讀內(nèi)存保存矩陣,因而加快了遍歷效率[5]。

        國內(nèi)學(xué)者吳向陽等人提出基于形狀因子采樣的實時全局光照算法,在視點(diǎn)改變、光照改變和材質(zhì)改變的情況下,對靜態(tài)場景能獲得逼近真實的實時全局光照繪制[6]。史可鑒等人提出基于Shortstack-kD算法的雷達(dá)光線跟蹤方法,經(jīng)過GPU加速不僅能對不同種類的場景都能獲得明顯性能提升,還可以根據(jù)場景不同情況控制棧長度,以達(dá)到算法的最高性能和最大靈活性[7]。黃夢成等人提出基于CUDA渲染器的順序獨(dú)立透明現(xiàn)象的單遍高效繪制算法,采用CUDA語言實現(xiàn)了一個圖形流水管線系統(tǒng)[8],從而在單遍場景中實現(xiàn)了透明現(xiàn)象的高效繪制[9]。

        此外,CUDA還被用于視頻編解碼[10]、目標(biāo)特征提?。?1~12]等圖像處理應(yīng)用。

        2.2 數(shù)學(xué)計算

        數(shù)值計算方面的應(yīng)用主要是利用CUDA加速經(jīng)典數(shù)學(xué)理論問題的求解過程。典型應(yīng)用有:

        1)多重網(wǎng)格算法:Goddeke等人采用GPU加速多重網(wǎng)格算法中的循環(huán)約化三對角方程求解,獲得了1個數(shù)量級的加速效果[13]。

        2)粒子濾波:Chao等人實現(xiàn)了并行粒子濾波算法,對經(jīng)典的跟蹤算法測試結(jié)果顯示,該算法在CUDA上的執(zhí)行速度提高了5.73倍[14]。

        3)奇異值分解:Lahabar等人采用CUDA加速奇異值分解算法,相對于MATLAB中的算法提高了60倍,比Intel雙核處理器上的LAPACK算法提高了8倍[15]。

        4)模糊神經(jīng)網(wǎng)絡(luò):Juang等人提出了模糊神經(jīng)網(wǎng)絡(luò)的并行化算法,相對于CPU實現(xiàn)的速度提高了30倍[16]。

        5)NP問題求解:Islam等人提出了基于CUDA的高度可伸縮的SAT問題求解方法,求解速度相對于CPU提高了188倍,而且解的數(shù)量同GPU的內(nèi)核數(shù)量成線性關(guān)系[17]。

        6)密碼破解:周林等人利用CUDA技術(shù)加速M(fèi)Dx系列Hash算法的攻擊算法。以攻擊MD5的差分攻擊算法為例,利用多消息修改方法改進(jìn)了MD5隧道差分攻擊算法,通過減少分支判斷指令在CUDA上獲得了10倍的加速效果[18]。

        2.3 物理學(xué)

        CUDA在物理學(xué)上的應(yīng)用包括流體力學(xué)、電磁學(xué)、分子動力學(xué)、核物理等領(lǐng)域的加速。

        陳曦等人在大規(guī)模流體場景模擬過程中,提出一種基于平滑粒子流體力學(xué)(SPH)進(jìn)行流體場景模擬的算法,通過引入一種三維空間網(wǎng)格劃分算法和改進(jìn)的并行基數(shù)排序算法,從而實現(xiàn)實時的流體計算和模擬,并能模擬出豐富的細(xì)節(jié)效果[19]。三維磁流體力學(xué)數(shù)值模擬是研究日冕和太陽風(fēng)最常用的方法之一,其中日冕偏振亮度是進(jìn)行觀測對比的重要方法。江雯倩等人提出了日冕偏振亮度并行計算模型,利用CUDA技術(shù)達(dá)到了近實時模擬與觀測數(shù)據(jù)比對的計算要求[20]。

        時域有限差分(Finite-difference time domain,F(xiàn)DTD)被應(yīng)用于數(shù)值模擬中,不過其計算復(fù)雜度相當(dāng)大。Nagaoka等人采用GPU加速電磁仿真中的3DFDTD方法,為減少CPU與GPU間的數(shù)據(jù)交換延遲,所有內(nèi)存都在GPU中分配,該方法中能分配的內(nèi)存總量受GPU內(nèi)存總量限制,不適合于大規(guī)模仿真[21]。Webb等人建立了邊界丟失和情況下的3D-FDTD框架,在最新的FERMI處理器上獲得了80倍的加速效果[22]。Junkin則對適形FDTD框架進(jìn)行了加速[23]。

        分子動力學(xué)(molecular dynamics,MD)模擬的計算復(fù)雜度一直是制約該領(lǐng)域發(fā)展的瓶頸。目前,已有一些基于CUDA的 MD模擬實例[24~25]等,發(fā)揮GPU性能達(dá)到CPU單核性能的幾十到上百倍之間。但完全在GPU上進(jìn)行、并且采用大量GPU并行或針對多項系統(tǒng)的MD模擬研究則較少。中國科學(xué)院的陳飛國等人利用CUDA技術(shù)和MPI協(xié)議,實現(xiàn)了多相納微流動在GPU上的并行MD模擬,在主流的GPU上可發(fā)揮20~60倍于主流CPU的計算能力。不過,該方法目前只考慮了分子間的LJ勢,實際應(yīng)用中的庫倫力和化學(xué)鍵等仍然需要深入研究[26]。

        此外,Gorbunov等人利用GPU加速ALICE高級觸發(fā)系統(tǒng)中的重離子碰撞事件跟蹤,實現(xiàn)實時蒙特卡羅事件的跟蹤[27]。

        2.4 生物醫(yī)學(xué)

        隨著生物醫(yī)學(xué)工程領(lǐng)域研究的不斷深入和發(fā)展,該領(lǐng)域涉及到的運(yùn)算復(fù)雜也越來越高,不少學(xué)者逐漸將CUDA技術(shù)運(yùn)用到該領(lǐng)域。

        Li等人采用GPU集群系統(tǒng)來加速3D生物分子成像工具軟件EMAN。針對EMAN中的瓶頸過程—RTFAlign算法的特性,設(shè)計基于CUDA的滲透編程方法,實現(xiàn)內(nèi)存對齊訪問,并隱藏片外內(nèi)存訪問延遲。圖3以calcMCF函數(shù)為例說明滲透編程方法的實施過程[28]。Shi等人將CUDA技術(shù)用于加速高吞吐短測DNA序列片段的錯誤校正獲得了10~19倍的加速效果[29]。Zhuo等人采用CUDA技術(shù)加速交互式場補(bǔ)償MR圖像重建,獲得兩個數(shù)量級的加速效果,并保證了場補(bǔ)償精度[30]。Boyer等人采用CUDA加速白細(xì)胞的跟蹤與監(jiān)測,獲得了200倍的加速效果[31]。Espenshade等人采用GPU加速流式細(xì)胞術(shù)的分割算法,在Tesla處理器上分割速度提高了一到兩個數(shù)量級[32]。Liu等人對蛋白質(zhì)序列數(shù)據(jù)庫的瀏覽工具BLASTP進(jìn)行加速,獲得了10倍左右的加速度[33]。Chalkidis對生物通路中的混合函數(shù)Petri網(wǎng)模擬算法進(jìn)行CUDA加速,獲得了18倍的加速效果[34]。

        國內(nèi)學(xué)者林江等人利用CUDA加速Smith-Waterman算法以精確高效地進(jìn)行生物序列比對。該算法使用菱形數(shù)據(jù)布局以充分利用GPU的并行計算能力,在NVIDIA GeForce GTX 285顯卡上最高可獲得120倍以上的性能提升[35]。張繁等人搭建GPU集群系統(tǒng)來加速計算基于量子化學(xué)的蛋白質(zhì)分子場,提出并實現(xiàn)了集群系統(tǒng)結(jié)點(diǎn)中GPU和多核CPU協(xié)同計算的并行加速架構(gòu)優(yōu)化設(shè)計,在保持較高計算精度的前提下大大提高了系統(tǒng)的計算性能[36]。

        圖3 滲透編程實例

        2.5 通信

        CUDA在通信領(lǐng)域的應(yīng)用主要集中在雷達(dá)和衛(wèi)星信號處理上。

        Song等人采用CUDA框架加速衛(wèi)星圖像的信源信道解碼過程中的逆離散小波變換。在進(jìn)行水平變換時,將輸入信號通過對齊的方式從全局內(nèi)存預(yù)取至共享內(nèi)存中加速變換。在進(jìn)行垂直變換時,則先對輸入信號進(jìn)行矩陣轉(zhuǎn)置,然后按照水平變換的方式實現(xiàn)變換。該系統(tǒng)可以實現(xiàn)1024×1024的衛(wèi)星圖像90幀/秒的解碼[37]。Park等人將用GPU實現(xiàn)超寬帶(UWB)雷孔徑雷達(dá)的信號處理,提出并行異步脈沖重建算法,然后在NVIDIA的CUDA和ATI的Brook+平臺上分別實現(xiàn)該算法,結(jié)果表明前者的信號處理速度更好[38]。Chang等人在GPU上加速LDPC碼解碼器的log-SPA算法,同CPU上的單線程實現(xiàn)相比速度提高了270倍[39]。

        國內(nèi)學(xué)者程俊仁等人提出了一種由GPU完成信號搜索計算的快速實現(xiàn)方法。該方法以基于FFT的碼相位并行搜索算法為基礎(chǔ),通過CUDA編程實現(xiàn)了信號搜索在GPU上的并行計算。測試結(jié)果表明該方法的捕獲速度顯著提高,冷啟動條件下搜索全部32顆衛(wèi)星只需1.653秒,為GPS軟件接收機(jī)的實時化提供了重要保證[40]。

        除了以上領(lǐng)域,CUDA還在地震信號分析[41]、工業(yè)控制[42]、潛艇聲納信號處理[43]等領(lǐng)域獲得了一定的應(yīng)用。特別是美國GE公司推出的加固型6U OpenVPX單板計算機(jī)以及MotionDSP公司的IkenaISR無人機(jī)視頻采集軟件等產(chǎn)品在美軍裝備中的應(yīng)用,則更能體現(xiàn)CUDA架構(gòu)的計算性能優(yōu)勢。

        3 結(jié)語

        由于GPU的特點(diǎn)是處理密集型數(shù)據(jù)和并行數(shù)據(jù)計算,因此CUDA非常適合需要大規(guī)模并行計算的領(lǐng)域。同傳統(tǒng)的CPU的串行執(zhí)行方式相比,采用CUDA技術(shù)可以獲得幾倍到幾百倍的加速效果。隨著GPU的帶寬和處理能力不斷提高,CUDA必將在諸如軍事和航天等對于計算性能有著特殊要求的領(lǐng)域得到更為廣泛的應(yīng)用。另外,即便是CUDA技術(shù)已經(jīng)獲得應(yīng)用的領(lǐng)域,如光線追蹤、流體模擬等,目前的應(yīng)用主要針對簡單的場景和模型,如何將CUDA技術(shù)應(yīng)用于更復(fù)雜的場景或者模型仍然值得深入研究。

        [1]NVIDIA.NVIDIA CUDA Compute Unified Device Architecture-Programming Guide Version 1.1.USA,2007

        [2]K Zhou,Q Hou,R Wang,et al.Real-time KD-tree Construction on Graphics Hardware[J].ACM Trans on Graphics,2008,27(5):Article No.126

        [3]R Wang,R Wang,K Zhou,et al.An efficient GPU-based Approach for Interactive Global Illumination[C]//ACM SIGGRAPH,New York,ACM Press,2009:Article No.91

        [4]T Ritshcel,T Engelhardt,T Grosch,et al.Micro-rendering for Scalable,Parallel Final Gathering[C]//ACM SIGGRAPH,New York,ACM Press,2009:Article No.132

        [5]D Hughes,L Lim.Kd-Jump:a Path-Preserving Stackless Traversal for Faster Isosurface Raytracing on GPUs[J].IEEE Trans on Visualization and Computer Graphics,2009,15(6):1555~1562

        [6]吳向陽,柴學(xué)梁,王毅剛,等.利用形狀因子采樣的實時全局光照繪制[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2011,23(6):941~948

        [7]史可鑒,王斌,朱恬倩,等.GPU上的kD-tree雷達(dá)模擬加速[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):440~448

        [8]F Liu,M Huang,X Liu,et al.CUDA render:A Programmable Graphics Pipeline[C]//Proc.of the ACM SIGGRAPH Asia,2009

        [9]黃夢成,劉芳,劉學(xué)慧,等.基于CUDA渲染器的順序獨(dú)立透明現(xiàn)象的單遍高效繪制[J].軟件學(xué)報,2011,22(8):1927~1933

        [10]甘新標(biāo),沈立,王志英.基于CUDA的并行全搜索運(yùn)動估計算法[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):457~460

        [11]任化敏,張勇東,林守勛.GPU加速的基于增量式聚類的視頻拷貝檢測方法[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):449~456

        [12]J Kim,E Park,X Cui,et al.A Fast Feature Extraction in Object Recognition Using Parallel Processing on CPU and GPU[C]//Proc of IEEE SMC,2009,San Antonio,USA,2009:3842~3847

        [13]D Goddeke,R Strzodka.Cyclic Reduction Tridiagonal Solvers on GPUs Applied to Mixed-Precision Multigrid[J].IEEE Trans on Parallel and Distributed Systems,2011,22(1):22~32

        [14]M Chao,C Chu,C Chao,et al.Efficient Parallelized Particle Filtering Design on CUDA[C]//Proc of IEEE Workshop on Signal Processing Systems,2010,CA,USA,2010:299~304

        [15]S Lahabar,PJ Narayanan.Singular Value Decomposition on GPU using CUDA[C]//Proc of IEEE Int Sym on Parallel & Distributed Processing,2009,Rome,Italy

        [16]C Juang,T Chen,W Cheng.Speedup of Implementing Fuzzy Neural Networks With High-Dimensional Inputs Through Parallel Processing on Graphic Processing Units[J].IEEE Trans on Fuzzy Systems,2011,19(4):717~728

        [17]S Islam,R Tandon,S Singh,et al.A Highly Scalable Solution of an NP-Complete Problem using CUDA[C]//Proc of Int Sym on PARELEC,2011,Luton,UK,2011:93~98

        [18]Y Zhuo,X Wu,J Haldar,et al.Accelerating Iterative Field-compenstated MR Image Reconstruction on GPUs[C]//Proc of IEEE Int Sym on Biomedical Imaging,2010,Rotterdam,Netherlands,2010:820~823

        [19]陳曦,王章野,何戩,等.GPU中的流體場景實時模擬算法[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):396~405

        [20]江雯倩,鐘鼎坤,解張鵬,等.基于CPU/GPU的日冕偏振亮度并行計算模型[J].空間科學(xué)學(xué)報,2011,31(1):51~56

        [21]T Nagaoka,S Watanabe.A GPU-Based Calculation Using the Three-Dimensional FDTD Method for Electromagnetic Field Analysis[C]//Proc of IEEE EMBS Conference,2010,Buenos Aires,Argentina,2010:327~330

        [22]C Webb,S Bilbao.Computing Room Acoustics with CUDA-3DFDTD Schemes with Boundary Losses and Viscosity[C]//Proc of ICASSP,2011,Prague,Czech,2011:317~320

        [23]G Junkin.Conformal FDTD Modeling of Imperfect Conductors at Millimeter Wave Bands[J].IEEE Trans on Antennas and Propagation,2011,59(1):199~205

        [24]A Meel,A Arnold,D Frenkel,et al.Harvesting Graphics Power for MD Simulations[J].Mol Simul,2008,34(3):259~266

        [25]J Anderson,C Lorenz,A Travesset.General Purpose Molecular Dynamics Simulations Fully Implemented on Graphics Processing Units[J].Journal of Comput.Phys.,2008,227(10):5342~5359

        [26]陳飛國,葛蔚,李靜海.復(fù)雜多相流動分子動力學(xué)模擬在 GPU上的實現(xiàn)[J].中國科學(xué) B輯:化學(xué),2008,38(12):1120~1128

        [27]S Gorbunov,D Rohr,K Aamodt,et al.ALICE HLT High Speed Tracking on GPU[J].IEEE Trans on Nuclear.Science,2011,58(4):1845~185

        [28]X Li,G Tan,Z Guo.Accelerating EMAN on A GPU Cluster System[J].ACTA BIOPHYSICA SINICA,2010,26(7):600~605

        [29]H Shi,B Schmidt,W Liu,et al.Accelerating Error Correction in High-Throughput Short-Read DNA Sequencing Data with CUDA[C]//Proc of IEEE Int Sym on Parallel & Distributed Processing,2009,Rome,Italy

        [30]Y Zhuo,X Wu,J Haldar,et al.Accelerating Iterative Field-compenstated MR Image Reconstruction on GPUs[C]//Proc of IEEE Int Sym on Biomedical Imaging,2010,Rotterdam,Netherlands,2010:820~823

        [31]M Boyer,D Tarjan,S Acton,et al.Accelerating Leukocyte Tracking using CUDA:A Case Study in Leveraging Manycore Coprocessors [C]//Proc of IEEE Int Sym on Parallel and Distributed Processing,2009,Rome,Italy

        [32]J Espenshade,A Pangborn,J Cavenaugh.Accelerating Partition Algorithms for Flow Cytometry on GPUs[C]//Proc of IEEE Int Sym on Parallel and Distributed Processing with Applications,2009,Chengdu,China,2009:226~233

        [33]W Liu,B Schmidt, W Muller-Witting.CUDABLASTP:Accelerating BLASTP on CUDA-Enabled Graphics Hardware[J].IEEE/ACM Trans on Computational Biology and Bioinformatics,2011,8(6):1678~1685

        [34]G Chalkidis,M Nagasaki,S Miyano.High Performance Hybrid Functional Petri Net Simulations of Biological Pathway Models on CUDA[J].IEEE/ACM Trans on Computational Biology and Bioinformatics,2011,8(6):1545~1556

        [35]林江,唐敏,童若鋒.GPU加速的生物序列比對[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):420~427

        [36]張繁,王章野,姚建,等.應(yīng)用GPU集群加速計算蛋白質(zhì)分子場[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(3):412~419

        [37]C Song,Y Li,B Huang.A GPU-Accelerated Wavelet Decompression System with SPIHT and Reed-Solomon Decoding for Satellite Images[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2011,4(3):683~690

        [38]S Park,J Ross,D Shires,et al.Hybrid Core Acceleration of UWB SIRE Radar Signal Processing[J].IEEE Trans on Parallel and Distributed Systems,2011,22(1):46~57

        [39]C Chang,Y Chang,M Huang,et al.Accelerating Regular LDPC Code Decoders on GPUs[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2011,4(3):653~659

        [40]程俊仁,劉光斌,張博.基于CUDA的GPS信號快速捕獲[J].宇航學(xué)報,2010,31(10):2407~2410

        [41]張兵,趙改善,黃駿,等.地震疊前深度偏移在CUDA平臺上的實現(xiàn)[J].勘探地球物理進(jìn)展,2008,31(6):427~432

        [42]G Cena,M Cereia,S Scanzio,et al.A High-Performance CUDA-Based Computing Platform for Industrial Control Systems[C]//Proc of IEEE Int Sym on Industrial Electronics,2011,Gdansk,Poland,2011:1169~1174

        [43]李曉敏,侯朝煥,鄢社鋒.一種基于GPU的主動聲納帶寬信號處理實時系統(tǒng)[J].傳感技術(shù)學(xué)報,2011,24(9):1279~1284

        久久亚洲国产欧洲精品一| 亚洲av永久无码精品网站在线观看 | 88久久精品无码一区二区毛片| 久久天天爽夜夜摸| 蜜桃av一区在线观看| 亚洲精选自偷拍一区二| 精品免费久久久久久久| 亚洲精品你懂的在线观看| 亚洲成a人片在线观看中| 亚洲精品一区二区三区四区久久| 亚洲熟妇丰满多毛xxxx| 国产第一页屁屁影院| 国产女人体一区二区三区| 人妻在线有码中文字幕| 亚洲国产成人精品无码区在线秒播 | 国产91在线|亚洲| 日韩精品中文字幕第二页| 日本真人做爰免费视频120秒| 日本在线观看| 伊人色综合九久久天天蜜桃| 一本久久精品久久综合| 麻豆╳╳╳乱女另类| 亚洲免费黄色| 区三区久久精品水蜜桃av| 国产av一区二区三区性入口 | 日本三级片在线观看| 亚洲精品国产成人| 免费va国产高清不卡大片| 韩国日本一区二区在线| 国产熟妇另类久久久久| 亚洲激情成人| 少妇隔壁人妻中文字幕| 绝顶高潮合集videos| 免费看久久妇女高潮a| 色优网久久国产精品| 免费av日韩一区二区| 蜜桃视频无码区在线观看| 亚洲V在线激情| 久久久亚洲成年中文字幕| 色欲综合一区二区三区| 久久aⅴ无码一区二区三区|