亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于OpenCL的雙調排序算法的優(yōu)化

        2017-12-27 05:12:22楊朋霖周志陽
        數(shù)碼世界 2017年2期
        關鍵詞:雙調西北師范大學異構

        楊朋霖 周志陽

        西北師范大學計算機科學與工程學院

        基于OpenCL的雙調排序算法的優(yōu)化

        楊朋霖 周志陽

        西北師范大學計算機科學與工程學院

        雙調排序算法是一種排序網(wǎng)絡算法。隨著數(shù)據(jù)量的增大,雙調排序執(zhí)行時間急劇上升。為了提高雙調排序執(zhí)行效率降低計算時間,本文提出了一種改進的并行雙調排序算法,對算法進行并行化改進,使用本地內存以及優(yōu)化線程模型。分別使用E8400和GTS450運行雙調排序算法進行測試,改進的雙調排序算法的計算速度比原版提高了5.24倍。

        OpenCL GPU 雙調排序 KNN

        1 引言

        近年來,異構計算系統(tǒng)表現(xiàn)出了良好的并行計算性能,成為國內外高性能計算領域的熱點研究方向。OpenCL(Open Computing Language,開放計算語言)作為一種開放計算標準,為很多并行應用提供了支持。

        排序是科學計算或者工程應用中經(jīng)常使用,Garcia提出并行插入排序算法,文獻[1]提出了一種并行基數(shù)排序的算法,Garcia提出了基于CUDA并行排序算法,Nolan使用了基于CUDA的冒泡排序,Thanakulwarapas等人提出了一種改進通信時間的雙調排序,Thouti提出一種基于OpenCL版雙調排序算法,雙調排序有很好的表現(xiàn)。

        2 相關概念簡介

        2.1 OpenCL

        OpenCL是為異構平臺編寫程序的開放式、免費標準,也是一個通用的編程框架?,F(xiàn)在由Khronos Group管理,異構平臺可由CPU、GPU、DSP、FPGA或者其他類型的處理器與硬件加速器組成。OpenCL是第一個以通用為目的的異構計算平臺,支持市面上絕大多數(shù)的處理器,可以在Windows、Linux、Mac OS大多數(shù)的操作系統(tǒng)上運行。OpenCL的核函數(shù)基于C99,相對編程難度較低。

        2.2 雙調排序

        雙調排序是一種排序網(wǎng)絡算法,由Batcher提出,Batcher定理是指將任意長為2n的雙調序列B劃分為相等的兩半,ai與an+i比較,較小者放入Min集合,較大者放入Max集合。得到的Min和Max仍然是雙調序列。Min集合中的元素都不大于Max集合中的元素。可以將輸入的2n元素雙調序列首先通過洗牌比較操作得到一個MAX序列和一個MIN序列,然后通過兩個n階雙調歸并器處理就可以得到一個有序序列。

        3 并行雙調排序算法

        3.1 概述

        3.1.1 線程模型

        OpenCL將GPU的多個PE(Processing Element)封裝為一個CU(Compute Unit),多個workgroup可以并發(fā)運行在一個CU上,不同CU可以并行運行。每個workgroup中包含許多workitem,同一個workgroup中的workitem可以通信??梢栽诔绦蛑性O置workgroup的數(shù)量以及每個workgroup包含的workitem的數(shù)量,不同設置對程序效率有很大的影響。

        3.1.2 內存模型

        在Thouti的論文中雙調排序算法只使用了全局內存。在OpenCL程序中訪問全局內存的延時很長,可以使用本地內存提高效率。

        3.2 實驗結果分析

        本文使用英特爾E8400+英偉達GTS450為OpenCL計算設備,使用隨機生成數(shù)據(jù)為測試數(shù)據(jù)。本次實驗通過統(tǒng)一的timer.h記錄實驗的運行時間。

        優(yōu)化后雙調排序算法運行100次,計算平均運行時間,然后用數(shù)據(jù)數(shù)量除以平均時間算出每秒可以處理的任務量,經(jīng)過試驗可以看出使用本地內存后處理速度有了很大提升,速度提升到4.29倍,經(jīng)當每個workgroup包含256個workitem時,速度提升到5.24倍。

        4 結束語

        本文對并行雙調排序優(yōu)化。首先介紹了OpenCL現(xiàn)狀以及排序算法發(fā)展過程,闡述了雙調排序的原理以及瓶頸,進而提出優(yōu)化的雙調排序算法,通過在線程模型、內存模型兩個方面對KNN算法優(yōu)化。經(jīng)過實驗驗證對比,比原版本提高了5.24倍。

        [1]Raymond T. OpenCL異構并行編程實戰(zhàn)[M],第1版, 張立浩,譯. 北京:機械工業(yè)出版社,2015

        楊朋霖 ,1990—,男,山西翼城縣人,漢族,西北師范大學計算機科學與工程學院在讀碩士研究生,研究方向:GPU高性能計算。

        猜你喜歡
        雙調西北師范大學異構
        西北師范大學作品
        大眾文藝(2023年9期)2023-05-17 23:55:52
        西北師范大學美術學院作品選登
        試論同課異構之“同”與“異”
        從“心腦同治,腹背雙調”探析焦慮癥的推拿選穴思路
        西北師范大學美術學院作品選登
        西北師范大學美術學院作品選登
        雙調詞篇法例談
        中華詩詞(2020年5期)2020-12-14 07:44:50
        雙調 水仙子 天源豪生度假酒店(外四首)
        岷峨詩稿(2019年4期)2019-04-20 09:02:18
        【雙調·沉醉東風】舞東風
        老友(2017年9期)2017-02-07 22:57:38
        overlay SDN實現(xiàn)異構兼容的關鍵技術
        電信科學(2016年11期)2016-11-23 05:07:56
        亚洲国语对白在线观看| 亚洲 精品 综合 精品 自拍| 久久久久国产精品熟女影院| 国产农村三片免费网站| 精品免费看国产一区二区白浆| 少妇人妻系列中文在线| 日本不卡在线视频二区三区| 日本少妇浓毛bbwbbwbbw| 99国内精品久久久久久久| 男人j进女人p免费视频| 中文字幕精品永久在线| 中文字幕一区二三区麻豆| 红桃av一区二区三区在线无码av| 久久久无码人妻精品无码| 亚洲av无码一区二区乱子伦as | 午夜精品久视频在线观看| 中文字幕精品乱码一区| 久久96日本精品久久久| 男人扒开添女人下部免费视频| 午夜dj在线观看免费视频| 久久青草亚洲AV无码麻豆| 国产精品午夜高潮呻吟久久av| 超级乱淫片国语对白免费视频| 国产精品刮毛| 精品高潮呻吟99av无码视频| 亚洲妇女av一区二区| 久久综合另类激情人妖| 97久久久久人妻精品区一| 老色鬼永久精品网站| 精品国产午夜久久久久九九| 国产一区二区视频在线看| 亚洲国产精品无码久久一区二区| 国产中文欧美日韩在线| 久久精品国产亚洲婷婷| 中文字幕人成乱码中文| 久久伊人最新网址视频| 97在线观看视频| 欧美亚洲国产人妖系列视| 麻豆成人久久精品二区三区91| 蜜桃精品人妻一区二区三区| 大又大粗又爽又黄少妇毛片|