?
基于加速器系統(tǒng)的數(shù)據(jù)傳送集成與拓展方法研究
在有圖形處理單元(GPU)的高性能計(jì)算系統(tǒng)中,提高數(shù)據(jù)傳輸速度仍然是一個(gè)具有挑戰(zhàn)性的問題。廣泛使用的并行編程模式中的數(shù)據(jù)通信(如信息傳遞接口)僅限于傳輸存儲(chǔ)在CPU內(nèi)存空間中的數(shù)據(jù)。輔助存儲(chǔ)系統(tǒng),如GPU的存儲(chǔ)器,還沒有集成到數(shù)據(jù)傳輸框架中,因而無法提供應(yīng)用程序?qū)崿F(xiàn)端至端的數(shù)據(jù)傳輸。所介紹的加速器信息傳遞接口(MPI-ACC)是一種允許加速器系統(tǒng)中端對(duì)端數(shù)據(jù)傳輸?shù)募珊屯卣狗椒āPI-ACC通過將輔助存儲(chǔ)空間的數(shù)據(jù)集成到MPI,從而提高了工作效率和性能。MPIACC在運(yùn)行時(shí)能夠使系統(tǒng)得到幾個(gè)關(guān)鍵的性能優(yōu)化,包括數(shù)據(jù)傳輸?shù)牧魉€作業(yè)以及加速器和節(jié)點(diǎn)架構(gòu)的通信平衡。采用計(jì)算機(jī)統(tǒng)一架構(gòu)(CUDA)和開放式計(jì)算機(jī)語言(OpenCL)加速編程接口進(jìn)行MPI-ACC的擴(kuò)展設(shè)計(jì)。研究了MPI-ACC對(duì)通信性能的影響,并且評(píng)估了其在大規(guī)模流行病理仿真上的應(yīng)用。GPU到GPU的數(shù)據(jù)通信與手動(dòng)閉塞的方法相比,通信性能提高了20.25%。
Ashwin M. Aji et al. 2012 IEEE 14th International Conference on High Performance Computing and Communications.
編譯:張玉倫