亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

?

CUDA和OpenGL互操作的實(shí)現(xiàn)及分析*

2011-07-28 01:32:14劉進(jìn)鋒

網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2011年23期

關(guān)鍵詞：設(shè)置

劉進(jìn)鋒，郭雷

(西北工業(yè)大學(xué) 自動(dòng)化學(xué)院，陜西西安 710129)

1 CUDA與OpenGL概述

OpenGL是圖形硬件的軟件接口，它是在SGI等多家世界著名的計(jì)算機(jī)公司的倡導(dǎo)下，以SGI的GL三維圖形庫(kù)為基礎(chǔ)制定的一個(gè)通用、共享的、開(kāi)放式的、性能卓越的三維圖形標(biāo)準(zhǔn)。OpenGL在醫(yī)學(xué)成像、地理信息、石油勘探、氣候模擬以及娛樂(lè)動(dòng)畫(huà)上有著廣泛應(yīng)用，它已經(jīng)成為高性能圖形和交互式視景處理的工業(yè)標(biāo)準(zhǔn)。

OpenGL不是一種編程語(yǔ)言，而是一種 API(應(yīng)用程序編程接口)。程序員可以使用某種編程語(yǔ)言 (如C或C＋＋)編寫(xiě)繪圖軟件，其中調(diào)用了一個(gè)或多個(gè) OpenGL庫(kù)函數(shù)。作為一種API，OpenGL遵循C語(yǔ)言的調(diào)用約定。OpenGL開(kāi)發(fā)資料可參考文獻(xiàn)[1]和參考文獻(xiàn)[2]。

圖形處理器(GPU)原本是處理計(jì)算機(jī)圖形的專用設(shè)備，近十年來(lái)，由于高清晰度復(fù)雜圖形實(shí)時(shí)處理的需求，GPU發(fā)展成為高并行度、多線程、多核的處理器。目前，主流GPU的運(yùn)算能力已超過(guò)主流通用CPU，從發(fā)展趨勢(shì)上來(lái)看將來(lái)差距會(huì)越拉越大。為了合理地利用GPU資源，CUDA(統(tǒng)一計(jì)算設(shè)備架構(gòu))應(yīng)運(yùn)而生。CUDA是一種由NVIDIA推出的通用并行計(jì)算架構(gòu)[3]，該架構(gòu)使GPU能夠解決復(fù)雜的計(jì)算問(wèn)題，并且由于CUDA編程語(yǔ)言基于標(biāo)準(zhǔn)的C語(yǔ)言，從而大大提高了可編程性。

CUDA和OpenGL互操作的基本方式是使用CUDA生成數(shù)據(jù)，然后使用OpenGL在屏幕上繪制出數(shù)據(jù)所表示的圖形。兩者的結(jié)合可以通過(guò)兩種方式來(lái)實(shí)現(xiàn)：

(1)使用 OpenGL的 PBO(像素緩沖區(qū)對(duì)象)。在該方式下，CUDA直接生成像素?cái)?shù)據(jù)，OpenGL顯示這些像素；

(2)使用 OpenGL的 VBO(頂點(diǎn)緩沖區(qū)對(duì)象)。在該方式下，CUDA生成頂點(diǎn)網(wǎng)格數(shù)據(jù)，OpenGL可以根據(jù)需要繪制出平滑的表面圖或線框圖或一系列頂點(diǎn)。

這兩種方式的核心都是利用cudaGLMapBufferObject函數(shù)將OpenGL的緩沖區(qū)映射到CUDA的內(nèi)存空間上，這樣，程序員就可以充分利用CUDA的優(yōu)點(diǎn)寫(xiě)出性能高的程序在該內(nèi)存空間上生成數(shù)據(jù)，這些數(shù)據(jù)不需要傳送，OpenGL可以直接使用。如果不使用CUDA，這些數(shù)據(jù)需要由CPU來(lái)計(jì)算產(chǎn)生。一方面，CPU的計(jì)算速度通常比GPU慢；另一方面，這些數(shù)據(jù)需要傳送到GPU上以供OpenGL顯示使用。鑒于此，當(dāng)數(shù)據(jù)量很大時(shí)，CUDA和OpenGL的混合使用效果明顯。

2 CUDA和OpenGL互操作的過(guò)程[4]

CUDA和OpenGL互操作具體步驟如下：

(1)創(chuàng)建窗口及OpenGL運(yùn)行環(huán)境。

(2)設(shè)置OpenGL視口和坐標(biāo)系。要根據(jù)繪制的圖形是2D還是3D等具體情況設(shè)置。(1)和(2)是所有OpenGL程序必需的，這里也沒(méi)什么特殊之處，需要注意的是，后面的一些功能需要OpenGL 2.0及以上版本支持，所以在這里需要進(jìn)行版本檢查。

(3)創(chuàng)建CUDA環(huán)境?？梢允褂胏uGLCtxCreate或cudaGLSetGLDevice來(lái)設(shè)置CUDA環(huán)境。該設(shè)置一定要放在其他CUDA的API調(diào)用之前。

(4)產(chǎn)生一個(gè)或多個(gè)OpenGL緩沖區(qū)用以和CUDA共享。使用PBO和使用VBO差不多，只是有些函數(shù)調(diào)用參數(shù)不同。以下是具體過(guò)程。

//給該緩沖區(qū)分配數(shù)據(jù)，PBO方式下，parameter1設(shè)置為GL_PIXEL_UNPACK_BUFFER，parameter1設(shè)置為圖像的長(zhǎng)度*寬度*4。VBO方式下，parameter1設(shè)置為GL_ARRAY_BUFFER，parameter2設(shè)置為頂點(diǎn)數(shù)*16，因?yàn)槊總€(gè)頂點(diǎn)包含3個(gè)浮點(diǎn)坐標(biāo)(x，y，z)和4個(gè)顏色字節(jié)(RGBA)，這樣一個(gè)頂點(diǎn)包含16B

(5)用CUDA登記緩沖區(qū)。登記可以使用cuGLRegisterBufferObject或 cudaGLRegisterBufferObject，該命令告訴OpenGL和CUDA 驅(qū)動(dòng)程序該緩沖區(qū)為二者共同使用。

(6)將OpenGL緩沖區(qū)映射到CUDA內(nèi)存。可以使用cuGLMapBufferObject或 cudaGLMapBufferObject，它實(shí)際是將CUDA內(nèi)存的指針指向OpenGL的緩沖區(qū)，這樣如果只有一個(gè)GPU，就不需要數(shù)據(jù)傳遞。當(dāng)映射完成后，OpenGL不能再使用該緩沖區(qū)。

(7)使用CUDA往該映射的內(nèi)存寫(xiě)圖像數(shù)據(jù)。前面的準(zhǔn)備工作在這里真正發(fā)揮作用了，此時(shí)可以調(diào)用CUDA的kernel，像使用全局內(nèi)存一樣使用映射了的緩沖區(qū)，向其中寫(xiě)數(shù)據(jù)。

(8)取消OpenGL緩沖區(qū)映射。要等前面CUDA的活動(dòng)完成以后，使用 cuGLUnmapBufferObject或cudaGLUnmapBufferObject函數(shù)取消映射。

(9)前面的步驟完成以后就可以真正開(kāi)始繪圖了，OpenGL的PBO和VBO的繪圖方式不同，分別為以下兩個(gè)過(guò)程。

①如果只是繪制平面圖形，需要使用OpenGL的PBO及紋理。

glTexParameteri (GL_TEXTURE_2D，GL_TEXTURE_MAG_FILTER，GL_LINEAR)；//必須設(shè) 置濾波模式，GL_LINEAR 允許圖形伸縮時(shí)線性差值。如果不需要線性差值，可以用GL_TEXTURE_RECTANGLE_ARB代替GL_TEXTURE_2D以提高性能，同時(shí)在 glTexParameteri()調(diào)用里使用 GL_NEAREST替換GL_LINEAR

然后就可以指定4個(gè)角的紋理坐標(biāo)，繪制長(zhǎng)方形了。

②繪制3D場(chǎng)景，需要使用VBO。

//根據(jù)頂點(diǎn)數(shù)據(jù)繪圖，參數(shù)可以使用GL_LINES，GL_LINE_STRIP， GL_LINE_LOOP， GL_TRIANGLES，GL_TRIANGLE_STRIP， GL_TRIANGLE_FAN， GL_QUADS，GL_QUAD_STRIP，GL_POLYGON

(10)前后緩存區(qū)來(lái)回切換，實(shí)現(xiàn)動(dòng)畫(huà)顯示效果。調(diào)用SwapBuffers()，緩沖區(qū)切換通常會(huì)在垂直刷新間隙來(lái)處理，因此，可以在控制面板上關(guān)掉垂直同步，使得緩沖區(qū)切換立刻進(jìn)行。

3 CUDA和OpenGL互操作性能實(shí)例分析

3.1 測(cè)試實(shí)例

這是一個(gè)相對(duì)簡(jiǎn)單的實(shí)例，其主要功能是不斷地動(dòng)態(tài)改變一個(gè)紋理圖案中每個(gè)像素的顏色并顯示。該實(shí)例使用了OpenGL的PBO并利用了OpenGL與CUDA互操作方式，紋理圖案數(shù)據(jù)的生成主要由CUDA的kernel函數(shù)完成，完整程序及CUDA的kernel函數(shù)請(qǐng)參看參考文獻(xiàn)[5]。

如果不使用CUDA，整個(gè)程序結(jié)構(gòu)變化不大，主要差別是生成該紋理圖案的函數(shù)在CPU上運(yùn)行，因而該函數(shù)及其調(diào)用方式要重寫(xiě)，具體函數(shù)如下：

其中，參數(shù)pos表示像素?cái)?shù)組，width為圖像寬度，height為圖像高度，time是每次調(diào)用該函數(shù)時(shí)固定遞增的一個(gè)值。

3.2 測(cè)試結(jié)果

上述實(shí)例在兩種環(huán)境中做了實(shí)驗(yàn)，CUDA版本都是3.2。測(cè)試環(huán)境1的主要配置如下：CPU為Intel Core i3-M380，主頻為 2.53 GHz，GPU為 NVIDIA NVS 3100M，內(nèi)存為2 GB。測(cè)試環(huán)境2的主要配置如下：CPU是Intel Core2 duo E7400，主頻為 2.8 GHz，GPU 使用 GeForce 9800 GTX+，內(nèi)存為2GB。測(cè)試時(shí)，顯示設(shè)置的垂直同步要關(guān)閉。

測(cè)試時(shí)設(shè)置紋理圖像的長(zhǎng)和寬都是512，CUDA的線程塊為1 024，每個(gè)線程塊內(nèi)的線程數(shù)為256，在OpenGL的顯示回調(diào)函數(shù)里統(tǒng)計(jì)f/s(刷新率)，結(jié)果如表1所示。

從實(shí)驗(yàn)結(jié)果可以看出，CUDA與OpenGL結(jié)合的方式效果顯著，顯示速度比不使用CUDA提高了7~8倍。

CUDA是一種較新的方便使用GPU進(jìn)行通用計(jì)算的架構(gòu)，OpenGL是圖形處理的工業(yè)標(biāo)準(zhǔn)。兩者的互操作充分利用了GPU的特點(diǎn)，因而顯得非常自然和合理，實(shí)驗(yàn)驗(yàn)證了兩者配合使用的效果。該方式為高性能圖形圖像顯示及科學(xué)計(jì)算可視化提供了良好的模式架構(gòu)。

表1 兩種測(cè)試環(huán)境下使用和不使用CUDA的性能比較

[1]WRIGHTR S， LIPCHAK B， HAEMELN.OpenGL superbible(Fourth Edition)[M].Addison-Wesley，2007.

[2]AHN S H.The OpenGL tutorials[OL].[2011-09-01].http：//songho.ca/opengl/.

[3]NVIDIA Corporation.NVIDIA CUDA programming Guide Version 3.2[OL].Mar.2011，http：//developer.nvidia.com/cuda.

[4]STAM J.What every CUDA programmer needs to know about OpenGL[OL].[2011-09-01].http：//nvidia.fullviewmedia.com/GPU2009/1001-valley-1055.html.

[5]FARBER R.CUDA， supercomputing for the masses： Part 15[OL]. [2011-09-01].http：//www.drdobbs.com/architectureand-design/222600097.

猜你喜歡

中隊(duì)崗位該如何設(shè)置

少先隊(duì)活動(dòng)(2021年4期)2021-07-23 01:46:22

船舶防火結(jié)構(gòu)及設(shè)置的缺陷與整改

水上消防(2020年5期)2020-12-14 07:16:18

中外醫(yī)學(xué)專業(yè)與專科設(shè)置對(duì)比分析及啟示

中國(guó)畢業(yè)后醫(yī)學(xué)教育(2020年5期)2020-12-06 06:52:46

特殊場(chǎng)景下列控等級(jí)轉(zhuǎn)換的設(shè)置方案

鐵道通信信號(hào)(2019年7期)2019-10-08 08:38:02

7招教你手動(dòng)設(shè)置參數(shù)

攝影之友(影像視覺(jué))(2019年3期)2019-03-30 01:36:50

動(dòng)車段(所)股道有效長(zhǎng)設(shè)置研究

鐵道通信信號(hào)(2018年1期)2018-06-06 02:27:38

我國(guó)中小學(xué)將設(shè)置人工智能相關(guān)課程

玩具世界(2017年9期)2017-11-24 05:17:29

吃紙的妖怪

作文評(píng)點(diǎn)報(bào)·低幼版(2017年42期)2017-11-16 22:12:34

本刊欄目設(shè)置說(shuō)明

沈陽(yáng)醫(yī)學(xué)院學(xué)報(bào)(2015年1期)2015-12-27 13:44:40

中俄臨床醫(yī)學(xué)專業(yè)課程設(shè)置的比較與思考

醫(yī)學(xué)教育管理(2015年3期)2015-12-01 06:43:16

網(wǎng)絡(luò)安全與數(shù)據(jù)管理2011年23期

網(wǎng)絡(luò)安全與數(shù)據(jù)管理的其它文章: 基于CAN總線的破碎機(jī)控制系統(tǒng)設(shè)計(jì); 邁向信息化時(shí)代的女書(shū)保護(hù)與傳承; 基于灰色Verhulst的互聯(lián)網(wǎng)上網(wǎng)人數(shù)動(dòng)態(tài)預(yù)測(cè)模型*; 低功耗無(wú)線水表數(shù)據(jù)采集通信終端的設(shè)計(jì)和研究; 污水處理在線監(jiān)測(cè)系統(tǒng)研究; 基于模糊自整定PID開(kāi)關(guān)磁阻電機(jī)速度控制系統(tǒng)的建模與仿真研究

感谢您访问我们的网站，您可能还对以下资源感兴趣：

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

无码无在线观看| 亚洲色在线v中文字幕| 久久久久亚洲精品无码网址| 国产日韩欧美911在线观看| 国产精品一区二区黄色片| 懂色av一区二区三区尤物| 丰满少妇三级全黄| 久草视频国产| 成人女同av免费观看| 亚洲国产精品成人av网| 国产成人一区二区三区| 日韩精品中文字幕无码专区| 国产精品成人久久一区二区| 中文字幕精品人妻在线| 欧美性受xxxx狂喷水| 夜夜综合网| 少妇激情一区二区三区| 丰满人妻一区二区三区视频| 人人爽人人爽人人爽人人片av | 全免费a级毛片免费看| 亚洲av毛片在线播放| 少妇久久久久久被弄高潮| 免费人成无码大片在线观看 | 国产精品一区二区三密桃| 日本护士口爆吞精视频| 成人午夜福利视频镇东影视| 免费一区啪啪视频| 日韩精品视频中文字幕播放| 国产亚洲精品久久久久久国模美| 99久久国产综合精品麻豆| 2020最新国产激情| 扒开美女内裤舔出白水| 无码av无码天堂资源网| 成人片99久久精品国产桃花岛| 精品国内自产拍在线观看| 久久久一本精品99久久| 国产精品久久婷婷六月丁香| 大学生高潮无套内谢视频| 亚洲在AV极品无码天堂手机版 | av在线免费观看麻豆| 亚洲一区二区三区乱码在线中国|