亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于曙光CPU-DCU 架構(gòu)的市區(qū)噪聲地圖計(jì)算

        2023-04-19 06:37:40張?zhí)煊?/span>王祉涵
        關(guān)鍵詞:效率模型

        張?zhí)煊睿?李 楠, 王祉涵, 劉 斌, 馮 濤

        (北京工商大學(xué) 人工智能學(xué)院, 北京 100048)

        0 引 言

        隨著國(guó)內(nèi)工業(yè)化進(jìn)程的加快與城市交通路網(wǎng)的建設(shè),工廠與城市交通區(qū)域網(wǎng)絡(luò)越來(lái)越密集,導(dǎo)致周圍的聲環(huán)境質(zhì)量下降。 城市環(huán)境噪聲污染與人民群眾的生活息息相關(guān),一直是社會(huì)和學(xué)界關(guān)注的熱點(diǎn)問題。 近年來(lái)人們的環(huán)境保護(hù)意識(shí)普遍提高,對(duì)交通噪聲污染的投訴逐步占到環(huán)境訴訟事件的首位。噪聲不僅在心理上讓人們感覺不適,影響工作效率[1],其對(duì)身體健康的影響也是十分重大的:長(zhǎng)期的噪聲暴露對(duì)人的聽覺、心腦血管、視覺、消化、神經(jīng)功能等系統(tǒng)均會(huì)有不同程度的損害。 隨著《中華人民共和國(guó)噪聲污染防治法》的施行,以法律的形式對(duì)噪聲排放標(biāo)準(zhǔn)、噪聲污染源頭預(yù)防、加強(qiáng)噪聲污染防治信息公開等方面做出了明確規(guī)定,將為解決人民群眾身邊最直接、最突出的噪聲污染問題提供更有力的法治保障。 因此,提升城市聲環(huán)境質(zhì)量是保護(hù)人民利益的切實(shí)有效做法。

        由于環(huán)境噪聲的復(fù)雜性與多樣性的特征,為其治理帶來(lái)很大困難。 環(huán)境噪聲具有多方面的成因,包括不同噪聲源、車流量的大小、路況和建筑物疏密等等。 在噪聲評(píng)價(jià)與治理的過(guò)程中,實(shí)地監(jiān)測(cè)是獲得數(shù)據(jù)的主要方式,但有很多的局限性。 首先,例如車輛堵塞時(shí)頻繁鳴笛等異常噪聲事件往往具有突發(fā)性、且噪聲水平值較高的特點(diǎn),實(shí)地監(jiān)測(cè)這種固定感知調(diào)度會(huì)大概率丟失對(duì)異常事件噪聲的記錄。 更加重要的是,異常噪聲事件是生態(tài)環(huán)境污染和危害人類及動(dòng)、植物健康的主要因素。 以上原因?qū)е鹿潭ǜ兄{(diào)度采集的有效數(shù)據(jù)量較少,無(wú)法準(zhǔn)確表達(dá)噪聲水平。 其次,在環(huán)境方面,如室內(nèi)外溫度情況、雨水天氣、建筑物遮擋等因素,實(shí)地監(jiān)測(cè)受環(huán)境影響較大。 為了克服實(shí)地監(jiān)測(cè)噪聲的缺點(diǎn),國(guó)內(nèi)外開始重視研發(fā)環(huán)境噪聲地圖。 文獻(xiàn)[2]首先提出了一種預(yù)測(cè)與實(shí)際測(cè)量結(jié)合的方法,探討了自研軟件來(lái)代替商業(yè)軟件的可能性,指出自研軟件在成本和靈活性上的優(yōu)勢(shì),驗(yàn)證了采用自研噪聲地圖軟件同樣可以繪制較為精確的噪聲地圖。 文獻(xiàn)[3]研究了噪聲預(yù)測(cè)模型與地理信息系統(tǒng)(GIS)相結(jié)合的高速鐵路噪聲地圖繪制技術(shù),根據(jù)高速鐵路噪聲源的分布特征與線路結(jié)構(gòu)特征,優(yōu)化了高速鐵路多等效聲源預(yù)測(cè)模型和聲屏障插入損失計(jì)算方法,進(jìn)行離散節(jié)點(diǎn)的噪聲計(jì)算,并通過(guò)空間插值繪制連續(xù)的噪聲分布地圖,與實(shí)測(cè)結(jié)果對(duì)比誤差小于1 dB (A),驗(yàn)證了該高速鐵路噪聲地圖的準(zhǔn)確性和實(shí)用性。 文獻(xiàn)[4]在敘述當(dāng)前環(huán)境噪聲監(jiān)測(cè)技術(shù)和預(yù)測(cè)技術(shù)應(yīng)用現(xiàn)狀的基礎(chǔ)上,指出其在技術(shù)融合方面的需求和不足,并提出相應(yīng)的技術(shù)融合框架,來(lái)提升噪聲管理項(xiàng)目實(shí)施的效率和質(zhì)量。 此外,還討論了該框架涉及的關(guān)鍵技術(shù),包括環(huán)境噪聲監(jiān)測(cè)設(shè)備及其數(shù)據(jù)管理系統(tǒng)、環(huán)境噪聲預(yù)測(cè)模型、環(huán)境噪聲預(yù)測(cè)反演及修正、相干噪聲模型及噪聲地圖及其快速計(jì)算技術(shù),最后給出相關(guān)系統(tǒng)研發(fā)的噪聲地圖。 該噪聲地圖的實(shí)時(shí)渲染功能包括數(shù)據(jù)驅(qū)動(dòng)的三維建筑物和噪聲地圖渲染引擎,能夠根據(jù)GIS 數(shù)據(jù)自動(dòng)生成3D 建筑物模型,并能夠?qū)崿F(xiàn)二維和三維噪聲地圖的等值線、溫標(biāo)圖、差值等顯示方法。

        當(dāng)前制約國(guó)內(nèi)外噪聲地圖繪制實(shí)施的一個(gè)重要難題是如何在保證求解質(zhì)量的情況下提高求解效率。 一個(gè)大范圍的城市交通噪聲地圖預(yù)測(cè)項(xiàng)目可能涉及上千平方公里的范圍,預(yù)測(cè)點(diǎn)的數(shù)目更是達(dá)到了千萬(wàn)以上,求解過(guò)程將消耗大量的計(jì)算時(shí)間和計(jì)算資源。 另外,城市聲環(huán)境非常復(fù)雜,影響噪聲分布的各種因素處于高度變化狀態(tài)中,這對(duì)噪聲地圖的快速更新速度提出了很高的要求。 因此,傳統(tǒng)的單機(jī)計(jì)算不能滿足大規(guī)模噪聲地圖仿真計(jì)算的要求,有必要引入并行計(jì)算算法,在分布式的環(huán)境下利用多個(gè)計(jì)算節(jié)點(diǎn)對(duì)同一個(gè)噪聲地圖計(jì)算任務(wù)進(jìn)行求解。

        針對(duì)上述問題,通過(guò)對(duì)文獻(xiàn)[5]提出的GPUCPU 協(xié)作的分布式計(jì)算方法的改進(jìn),為提升環(huán)境噪聲管理效率、提升大規(guī)模環(huán)境噪聲地圖計(jì)算效率,提出了一種CPU-DCU 并行的噪聲地圖計(jì)算技術(shù),可以使用“曙光”超級(jí)計(jì)算平臺(tái)上的DCU 加速卡進(jìn)行內(nèi)核計(jì)算,該方法減少了計(jì)算機(jī)性能開銷,提高了并行計(jì)算的效率,并能夠生成高質(zhì)量的噪聲地圖結(jié)果,形成了大規(guī)模環(huán)境噪聲仿真計(jì)算求解器,高效地解決了因城市發(fā)展迅速、噪聲地圖更新頻繁、三維噪聲地圖需求強(qiáng)烈等對(duì)計(jì)算資源的利用產(chǎn)生的負(fù)面影響。

        1 大規(guī)模環(huán)境噪聲地圖求解

        1.1 求解流程

        大規(guī)模環(huán)境噪聲地圖求解流程如圖1 所示,主要分為3 步:噪聲計(jì)算數(shù)據(jù)建模、聲學(xué)計(jì)算和可視化。 對(duì)此擬做闡釋分述如下。

        圖1 噪聲地圖求解流程Fig. 1 Calculation process of noise map

        (1)噪聲數(shù)據(jù)建模。 噪聲地圖建立的首要任務(wù)是噪聲計(jì)算數(shù)據(jù)的建立:將GML 地理信息數(shù)據(jù)、噪聲監(jiān)測(cè)數(shù)據(jù)和氣象數(shù)據(jù)等多源異構(gòu)數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的噪聲計(jì)算數(shù)據(jù)。

        (2)聲學(xué)計(jì)算。 將噪聲計(jì)算數(shù)據(jù)上傳至“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)進(jìn)行數(shù)據(jù)管理,將計(jì)算數(shù)據(jù)由主機(jī)端傳入設(shè)備端,使用CPU 與DCU 加速卡進(jìn)行內(nèi)核計(jì)算,再將計(jì)算結(jié)果返回主機(jī)端。

        (3)可視化。 將計(jì)算完成后的結(jié)果文件下載到本地計(jì)算機(jī),使用可視化軟件將計(jì)算結(jié)果進(jìn)行可視化,形成噪聲地圖。

        1.2 預(yù)測(cè)模型

        為了解決環(huán)境噪聲實(shí)地監(jiān)測(cè)的問題,世界各國(guó)的學(xué)者與環(huán)保人員在環(huán)境噪聲方面進(jìn)行了大量的研究,其中噪聲預(yù)測(cè)是噪聲評(píng)價(jià)與噪聲治理的重要依據(jù),噪聲預(yù)測(cè)模型的建立尤為重要。 以英國(guó)的CRTN88[6]、德國(guó)的RLS90[7]與美國(guó)的FHWA[8]噪聲預(yù)測(cè)模型為主,各國(guó)相繼建立了相關(guān)噪聲預(yù)測(cè)模型[9-10]。 目前,對(duì)標(biāo)準(zhǔn)規(guī)范的軟件化解析比較多的是HARMONOISE標(biāo)準(zhǔn)[11-12]。 而ASJ Model-1998 標(biāo)準(zhǔn)對(duì)傳播模型的解釋更為細(xì)致[13]。 現(xiàn)如今,歐洲的CNOSSOS-EU 標(biāo)準(zhǔn)[14-16]已經(jīng)制定,對(duì)HARMONOISE 標(biāo)準(zhǔn)做了很多修改和簡(jiǎn)化,這對(duì)計(jì)算軟件的實(shí)現(xiàn)也起到了引導(dǎo)的作用。

        調(diào)查證明,國(guó)內(nèi)的交通噪聲預(yù)測(cè)模型研究起步較晚,并未形成通用的模型,因此本文求解器使用的預(yù)測(cè)模型遵循中華人民共和國(guó)環(huán)境保護(hù)部于2009年制定的《環(huán)境影響評(píng)價(jià)技術(shù)導(dǎo)則-聲環(huán)境(HJ2.4-2009)》中概述的程序。 在HJ2.4-2009 中,源排放模型和傳播模型主要依據(jù)ISO 9613-2 設(shè)計(jì)。 由于HJ2.4-2009 中沒有提供足夠的傳播路徑計(jì)算細(xì)節(jié),因此傳播路徑的實(shí)現(xiàn)方法遵循HARMONOISE 標(biāo)準(zhǔn)[17]。 上述求解器使用的傳播模型中,衰減項(xiàng)包含:幾何衰減、大氣效應(yīng)、地面效應(yīng)、屏障效應(yīng)和衰減合成。

        1.3 噪聲計(jì)算數(shù)據(jù)建模

        在工程應(yīng)用中,地理信息數(shù)據(jù)主要包括城市道路、鐵路和地面軌道交通的平面和立體分布、建筑物的高低落差與位置。 所用的建筑物信息和道路信息通過(guò)GIS 地理信息系統(tǒng)獲得,如圖2 所示,建筑物視為聲屏障,道路位置視為線聲源位置。 在進(jìn)行噪聲地圖計(jì)算之前,重新設(shè)計(jì)了文件儲(chǔ)存噪聲計(jì)算數(shù)據(jù)。

        圖2 3D 城市模型Fig. 2 3D city model

        噪聲計(jì)算數(shù)據(jù)如圖3 所示。 一個(gè)位置的數(shù)據(jù)包含氣象數(shù)據(jù)、噪聲監(jiān)測(cè)數(shù)據(jù)、交通監(jiān)測(cè)數(shù)據(jù)和GIS 數(shù)據(jù)等一系列多源頭、多維度、多尺度的數(shù)據(jù)。 以一個(gè)城市區(qū)域?yàn)槔?,噪聲?jì)算數(shù)據(jù)使用XML 文件儲(chǔ)存,包含GIS 數(shù)據(jù)、線聲源數(shù)據(jù)、建筑物數(shù)據(jù)和計(jì)算區(qū)域數(shù)據(jù)。 其中,GIS 數(shù)據(jù)包含線聲源、建筑物或計(jì)算區(qū)域的位置信息,每種數(shù)據(jù)均擁有各自的GIS 數(shù)據(jù);線聲源數(shù)據(jù)包含線聲源名稱、線聲源標(biāo)簽、線聲源種類、聲強(qiáng)、修正值、車流量和計(jì)算配置等信息;建筑物數(shù)據(jù)包含建筑物的標(biāo)簽、名稱和高度等信息;計(jì)算區(qū)域數(shù)據(jù)包含計(jì)算區(qū)域的名稱、標(biāo)簽和計(jì)算配置等信息。

        圖3 噪聲計(jì)算數(shù)據(jù)Fig. 3 Noise calculation data

        1.4 DCU 的算法優(yōu)化

        在大多數(shù)噪聲地圖的情況中,幾何數(shù)據(jù)不必要十分精確,目前的不少商業(yè)軟件中常使用簡(jiǎn)化多線段類型的方式減少幾何數(shù)據(jù)的細(xì)節(jié),從而提高計(jì)算效率。 為了應(yīng)對(duì)大規(guī)模環(huán)境噪聲地圖的解算需求,除了使用在商業(yè)軟件中常會(huì)見到的方法進(jìn)行DCU優(yōu)化外,還可以使用一種定向包圍盒的幾何簡(jiǎn)化方法。 文獻(xiàn)[5]比較了噪聲地圖計(jì)算中是否使用定向包圍盒簡(jiǎn)化建筑物對(duì)計(jì)算結(jié)果的影響。 研究發(fā)現(xiàn),在較大規(guī)模的噪聲地圖求解中使用該方法進(jìn)行幾何簡(jiǎn)化,計(jì)算速度提升3 倍,實(shí)驗(yàn)中91%的接收點(diǎn)計(jì)算結(jié)果誤差值小于1 dB,最大誤差小于3 dB,對(duì)較大規(guī)模噪聲地圖的宏觀求解誤差不會(huì)產(chǎn)生較大影響。定向包圍盒法如圖4 所示,該方法可以找到給定多邊形的最小包圍矩形,并將原有多邊形替換為最小包圍矩形。 為了節(jié)省DCU 的計(jì)算時(shí)間,在噪聲計(jì)算數(shù)據(jù)建模過(guò)程中使用該方法一次性地將幾何數(shù)據(jù)進(jìn)行簡(jiǎn)化,存儲(chǔ)在數(shù)據(jù)庫(kù)中,以便在新的計(jì)算任務(wù)中使用。

        圖4 定向包圍盒法Fig. 4 Oriented bounding box method

        1.5 CPU-DCU 并行的噪聲地圖計(jì)算方法

        CPU-DCU 并行計(jì)算是將系統(tǒng)中CPU 所在位置稱為主機(jī)端(Host),將DCU 所在位置稱為設(shè)備端(Device)。 主機(jī)端代碼使用C/C ++編寫,運(yùn)行在CPU 上;設(shè)備端代碼(核函數(shù))使用HIP-C 編寫,運(yùn)行在DCU 上。 典型的HIP 程序的執(zhí)行流程如下[18]:

        (1)分配Host 內(nèi)存,并進(jìn)行數(shù)據(jù)初始化。

        (2)分配Device 內(nèi)存,并從Host 將數(shù)據(jù)拷貝到Device 上。

        (3)調(diào)用HIP 的核函數(shù)在Device 上完成指定的運(yùn)算。

        (4)將Device 上的運(yùn)算結(jié)果拷貝到Host 上。

        (5)釋放Device 和Host 上分配的內(nèi)存。

        噪聲地圖具有天然的并行特性,即每個(gè)接收點(diǎn)的計(jì)算是獨(dú)立的,因此在多核平臺(tái)上計(jì)算不同的接收點(diǎn)時(shí)沒有信息交換,n個(gè)核心可以同時(shí)計(jì)算n個(gè)接收點(diǎn)。 在噪聲地圖計(jì)算中,考慮到CPU 和DCU之間的計(jì)算差異,預(yù)測(cè)模型中不同的衰減項(xiàng)在CPU和DCU 核心上計(jì)算時(shí)有不同的性能,例如幾何衰減中的浮點(diǎn)運(yùn)算。

        “曙光”超級(jí)計(jì)算機(jī)系統(tǒng)搭載的DCU 加速器相較于CPU 更擅長(zhǎng)處理大規(guī)模的密集計(jì)算,文章實(shí)驗(yàn)使用CPU-DCU 協(xié)作的方式進(jìn)行噪聲地圖解算,通過(guò)HIP-C 編寫核函數(shù),將適合DCU 解算的密集計(jì)算任務(wù)分配到DCU 加速器上運(yùn)行,將適合CPU 解算的邏輯運(yùn)算分配到CPU 端進(jìn)行。

        “曙光”超級(jí)計(jì)算機(jī)系統(tǒng)在單個(gè)計(jì)算集群節(jié)點(diǎn)上分配了4 塊DCU 加速卡,考慮到每次噪聲地圖計(jì)算中數(shù)據(jù)可能出現(xiàn)的大小不一,為了資源的高效分配,已有研究證明可將Device 端任務(wù)靈活劃分為n份(1 ≤n≤4) 并傳輸?shù)絥張DCU 加速卡上,合理利用節(jié)點(diǎn)上的計(jì)算資源,在提升運(yùn)算效率的前提下,保證了資源的合理分配。

        為了高效利用計(jì)算資源,噪聲地圖計(jì)算中的任務(wù)分配十分重要。 研究表明,文獻(xiàn)[5]提出的基于遺傳算法的噪聲地圖任務(wù)劃分方法和子任務(wù)調(diào)度方法可以顯著提高噪聲地圖計(jì)算的并行效率。

        定義1HH表示給定區(qū)域的計(jì)算規(guī)模,H的公式如下:

        其中,β是由硬件性能確定的系數(shù);系數(shù)γ和系數(shù)ε分別為建筑物和接收點(diǎn)的權(quán)重;δ為除屏障和反射外衰減項(xiàng)的計(jì)算比例權(quán)重系數(shù);Nerp表示計(jì)算區(qū)域中有效接收點(diǎn)的數(shù)量;Nbv表示幾何體頂點(diǎn)的總數(shù);Nps表示點(diǎn)源總數(shù);sa表示計(jì)算區(qū)域的擴(kuò)展區(qū)域。

        定義2Fdi子任務(wù)的DCU 適配度Fdi計(jì)算公式如下:

        其中,Hd表示所有子任務(wù)的DCU 計(jì)算規(guī)模,hdi表示區(qū)域i的DCU 計(jì)算規(guī)模,hdi =NerpNbvNps/sa。

        噪聲地圖計(jì)算流程如圖5 所示。 由圖5 可知,CPU-DCU 并行的噪聲地圖計(jì)算流程如下:

        圖5 噪聲地圖計(jì)算流程Fig. 5 Calculation process of noise mapping

        步驟1根據(jù)計(jì)算規(guī)模估計(jì)子任務(wù)的數(shù)量,計(jì)算分區(qū)的行數(shù)與列數(shù)。

        步驟2行劃分。 使用遺傳算法生成大小相同的行塊。

        步驟3列劃分。 進(jìn)一步使用遺傳算法將步驟2 得到的每個(gè)塊繼續(xù)劃分,生成計(jì)算任務(wù)劃分的最終結(jié)果。

        步驟4塊劃分。 將每一塊標(biāo)注計(jì)算規(guī)模與DCU 適配度,決定哪些塊將由DCU 計(jì)算,生成CPU子任務(wù)集和DCU 子任務(wù)集。

        步驟5子任務(wù)調(diào)度。 根據(jù)獲得的節(jié)點(diǎn)信息估計(jì)節(jié)點(diǎn)的計(jì)算能力,并根據(jù)節(jié)點(diǎn)的計(jì)算能力向節(jié)點(diǎn)分配相應(yīng)的匹配子任務(wù)。

        步驟6噪聲地圖結(jié)果整合。 從所有計(jì)算節(jié)點(diǎn)回收子任務(wù)結(jié)果,并整合為完整的噪聲地圖。

        2 實(shí)驗(yàn)分析

        2.1 實(shí)驗(yàn)環(huán)境

        文章實(shí)驗(yàn)是基于“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng),該計(jì)算集群為提供超高計(jì)算量需求,每個(gè)計(jì)算集群節(jié)點(diǎn)配置1 顆32 核心2.0 GHz 主頻的x86 處理器和4塊DCU 加速卡,每個(gè)節(jié)點(diǎn)配置8 根16 GB DDR4 2666 ECC REG 內(nèi)存,并配置2 套曙光Parastor300S并行存儲(chǔ)系統(tǒng),提供大容量數(shù)據(jù)存儲(chǔ)。 網(wǎng)絡(luò)通信方面,集群采用全線速、 無(wú)阻塞的200 Gb HDR Infiniband 專用計(jì)算網(wǎng)絡(luò),能極大提升計(jì)算的速度和擴(kuò)展性。 集群的作業(yè)管理系統(tǒng)為slurm,系統(tǒng)的具體硬件信息與軟件信息分別見表1、表2。

        表1 “曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)硬件信息Tab. 1 Hardware information of Sygon supercomputing platform system

        表2 “曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)軟件信息Tab. 2 Software information of Sygon supercomputing platform system

        2.2 正確性驗(yàn)證

        首先對(duì)CPU-DCU 并行的噪聲地圖計(jì)算方法進(jìn)行小規(guī)模數(shù)據(jù)的正確性驗(yàn)證。 正確性驗(yàn)證模型選用ISO/TR 17534-3 中的算例模型,分別使用CPU 與單DCU 加速卡對(duì)噪聲計(jì)算數(shù)據(jù)進(jìn)行噪聲地圖計(jì)算,算例模型參數(shù)分別見表3 與表4。 將解算出的結(jié)果與ISO/TR 17534-3 中標(biāo)準(zhǔn)結(jié)果進(jìn)行比較,解算結(jié)果見表5。 經(jīng)過(guò)對(duì)比發(fā)現(xiàn),CPU 與單DCU 加速卡兩者解算結(jié)果相同,與標(biāo)準(zhǔn)結(jié)果數(shù)值變化在±0.05 dB,通過(guò)正確性驗(yàn)證,并且單DCU 加速卡比CPU 加速達(dá)到261.33 倍。 正確性驗(yàn)證算例如圖6 所示。

        圖6 正確性驗(yàn)證Fig. 6 Correctness verification

        表3 聲源與接收點(diǎn)參數(shù)Tab. 3 Parameters of source and receiving m

        表4 建筑物參數(shù)Tab. 4 Parameters of buildings m

        表5 解算結(jié)果Tab. 5 Calculated results

        2.3 并行性能測(cè)試

        通過(guò)控制街區(qū)大小、網(wǎng)格劃分與計(jì)算層數(shù)的方式控制噪聲計(jì)算數(shù)據(jù)的規(guī)模,在“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)使用部分街區(qū)算例和完整街區(qū)算例的噪聲計(jì)算數(shù)據(jù)進(jìn)行并行性能測(cè)試。 部分街區(qū)分為算例1 與算例2,均將網(wǎng)格劃分為2×2 網(wǎng)格,每層間隔5 m,區(qū)別在于算例1 計(jì)算1 層高度,算例2 計(jì)算10 層高度。 完整街區(qū)分為算例3 與算例4:算例3 將網(wǎng)格劃分為10×10 網(wǎng)格,每層間隔5 m,計(jì)算10 層高度;算例4 將網(wǎng)格劃分為2×2 網(wǎng)格,每層間隔5 m,計(jì)算20 層高度。 算例參數(shù)見表6。

        表6 算例參數(shù)Tab. 6 Parameters of examples

        將上述算例分別在CPU、單DCU 加速卡、雙DCU 加速卡與4 張DCU 加速卡進(jìn)行并行性能測(cè)試,使用單DCU 加速卡稱為方法1,使用雙DCU 加速卡稱為方法2,使用4 張DCU 加速卡稱為方法3。 選用部分街區(qū)算例進(jìn)行CPU 與方法1 對(duì)比實(shí)驗(yàn),見表7。

        表7 算例1 與算例3 在CPU 與方法1 下的對(duì)比Tab. 7 Comparison between example 1 and example 3 using CPU and method 1

        由表7 結(jié)果可以看出,在計(jì)算算例1 時(shí),單DCU相比CPU 加速比為230.44,隨著計(jì)算規(guī)模的增大,在計(jì)算算例3 時(shí),單DCU 相比CPU 加速比達(dá)到了341.06。 綜上分析,在計(jì)算規(guī)模較小時(shí),加速比可以達(dá)到200 以上,已經(jīng)大幅提升了運(yùn)行效率,但并不能充分釋放DCU 的性能,無(wú)法充分利用并行資源,沒有達(dá)到最優(yōu)的性能。 隨著計(jì)算規(guī)模的擴(kuò)大,DCU 加速卡在大規(guī)模密集計(jì)算的并行優(yōu)勢(shì)逐漸體現(xiàn),加速比大幅度提升,將原本持續(xù)數(shù)天的CPU 計(jì)算時(shí)間縮減到17 min,極大地減少了計(jì)算機(jī)性能開銷,節(jié)省了計(jì)算資源。 實(shí)驗(yàn)結(jié)果表明,CPU-DCU 并行的噪聲地圖計(jì)算方法在“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)的單DCU 加速卡環(huán)境中,運(yùn)行速度顯著提升,在生成高質(zhì)量的噪聲地圖結(jié)果的前提下,計(jì)算速度提升200倍以上,并且隨著計(jì)算規(guī)模的擴(kuò)大,加速效果更加顯著。

        在實(shí)際應(yīng)用中,計(jì)算規(guī)模十分龐大,網(wǎng)格劃分更細(xì),計(jì)算層數(shù)更多,單DCU 的計(jì)算性能無(wú)法滿足大規(guī)模的環(huán)境噪聲地圖計(jì)算要求。 基于文章提出的并行方法可將Device 端任務(wù)靈活劃分為n份(1 ≤n≤4),并傳輸?shù)絥張DCU 加速卡上,使用單、雙DCU加速卡對(duì)規(guī)模更大、更復(fù)雜的算例2、算例3 以及算例4 進(jìn)行計(jì)算,測(cè)試結(jié)果見表8 和圖7。

        圖7 不同規(guī)模在方法1 與方法2 下的對(duì)比Fig. 7 Comparison of four calculation examples with different scales using method 1 and method 2

        由圖7 結(jié)果看出,在計(jì)算算例1 時(shí),雙DCU 加速卡的并行效率為97.1%,在計(jì)算算例2 時(shí),雙DCU加速卡的并行效率為97.3%,但是當(dāng)面對(duì)完整街區(qū)這種超大型噪聲地圖計(jì)算規(guī)模時(shí),雙DCU 加速卡的并行效率明顯提升,算例3 的并行效率達(dá)到99.5%,算例4 的并行效率達(dá)到99.3%,并行效率與噪聲地圖計(jì)算規(guī)模成正比。 造成這種結(jié)果的原因是隨著噪聲地圖計(jì)算規(guī)模的擴(kuò)大,并行計(jì)算中核函數(shù)內(nèi)的計(jì)算占比逐漸擴(kuò)大,并且超過(guò)使用hipMemcpy() 在設(shè)備端與主機(jī)端之間進(jìn)行傳輸?shù)恼急龋⑿行实玫斤@著提升。

        表9 是將算例4 分別在單DCU 加速卡與4 塊DCU 加速卡上進(jìn)行的計(jì)算結(jié)果的對(duì)比,并行效率為88.2%。 從表9 可以看出,4 塊DCU 加速卡的加速效果顯著提升,使用多DCU 加速卡取得了優(yōu)異的性能,加速效果與加速卡的數(shù)量成正比。

        表9 算例4 在方法1 與方法3 下的對(duì)比Tab. 9 Comparison of example 4 using method 1 and method 3

        實(shí)驗(yàn)結(jié)果證明了基于CPU-DCU 并行的噪聲地圖計(jì)算方法在“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)的多DCU加速卡上具有輸入輸出的可擴(kuò)展性,計(jì)算性能也有了大幅提升:單DCU 加速卡比單CPU 加速最多可達(dá)340 多倍,雙DCU 加速卡比單DCU 加速卡并行效率達(dá)到99%以上,4 塊DCU 加速卡比單DCU 加速卡并行效率達(dá)到88.2%,并對(duì)在“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)實(shí)現(xiàn)大規(guī)模環(huán)境噪聲地圖計(jì)算求解速度的提升與高質(zhì)量計(jì)算結(jié)果的生成具有重要意義。

        2.4 工程案例

        基于“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)的優(yōu)異性能,大規(guī)模的環(huán)境噪聲實(shí)際應(yīng)用的求解效率大幅提升,在2 個(gè)試驗(yàn)區(qū)進(jìn)行了實(shí)際應(yīng)用。 實(shí)驗(yàn)區(qū)域1 的噪聲地圖求解結(jié)果可視化如圖8 所示,實(shí)驗(yàn)區(qū)域2 的噪聲地圖求解結(jié)果可視化如圖9 所示。 為了方便研究人員對(duì)城市噪聲的多維度分析與細(xì)化分析,可視化包括求解區(qū)域、噪聲地圖求解結(jié)果、3 維網(wǎng)格劃分、x方向切片、y方向切片和噪聲等值面。

        圖8 實(shí)驗(yàn)區(qū)域1 的噪聲地圖可視化Fig. 8 Visualization of noise map in experimental area 1

        圖9 實(shí)驗(yàn)區(qū)域2 的噪聲地圖可視化Fig. 9 Visualization of noise map in experimental area 2

        3 結(jié)束語(yǔ)

        文章根據(jù)“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)的異構(gòu)架構(gòu),利用C/C++和HIP-C 語(yǔ)言實(shí)現(xiàn)了CPU-DCU 并行的噪聲地圖計(jì)算方法,利用DCU 的并發(fā)性提升了求解效率。 實(shí)驗(yàn)結(jié)果驗(yàn)證了上述方法的有效性。 同時(shí),實(shí)驗(yàn)結(jié)果也驗(yàn)證了噪聲地圖求解在“曙光”超級(jí)計(jì)算平臺(tái)系統(tǒng)上的可能性,擴(kuò)展了該平臺(tái)的科研生態(tài)領(lǐng)域。

        隨著《中華人民共和國(guó)噪聲污染防治法》的施行,將會(huì)出現(xiàn)一批新的官方計(jì)算標(biāo)準(zhǔn)、規(guī)范和評(píng)價(jià)標(biāo)準(zhǔn)(國(guó)標(biāo)和環(huán)評(píng)導(dǎo)則),求解算法需要通過(guò)迭代來(lái)適應(yīng)國(guó)家標(biāo)準(zhǔn)的變化;目前求解算法中還未引入規(guī)范的地形數(shù)據(jù)的屏障效應(yīng)影響和反射效應(yīng)影響,這主要是由于接入地形數(shù)據(jù)格式和計(jì)算方法沒有統(tǒng)一被認(rèn)可的標(biāo)準(zhǔn)造成的,后續(xù)隨著數(shù)據(jù)規(guī)范和計(jì)算方法的健全來(lái)逐步完善。

        猜你喜歡
        效率模型
        一半模型
        重要模型『一線三等角』
        提升朗讀教學(xué)效率的幾點(diǎn)思考
        甘肅教育(2020年14期)2020-09-11 07:57:42
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        跟蹤導(dǎo)練(一)2
        “錢”、“事”脫節(jié)效率低
        提高講解示范效率的幾點(diǎn)感受
        體育師友(2011年2期)2011-03-20 15:29:29
        国产在线无码制服丝袜无码| 综合无码一区二区三区四区五区| 一区二区三区国产在线网站视频| 国产自拍精品视频免费观看| 久久久精品人妻一区二区三区妖精| 人妻插b视频一区二区三区| 欧美婷婷六月丁香综合色| 国产永久免费高清在线观看视频| 女同舌吻互慰一区二区| 国产精品久久精品第一页| 亚洲精华国产精华液的福利| 欧美精品aaa久久久影院| 美利坚亚洲天堂日韩精品| 国产精品久久久久久妇女| 久久人人爽人人爽人人av| 国产妇女乱一性一交| 扒开女性毛茸茸的视频| 一本加勒比hezyo无码专区| 236宅宅理论片免费| 亚洲人成绝费网站色www| 精品少妇人妻av一区二区蜜桃| 国语自产偷拍在线观看| 粗了大了 整进去好爽视频| 国产粉嫩嫩00在线正在播放| 精品嫩模福利一区二区蜜臀| 日本阿v片在线播放免费| 亚洲久热无码av中文字幕| 亚洲每天色在线观看视频| 91久久国产香蕉视频| 免费1级做爰片1000部视频| 久草国产视频| 亚洲一区二区三区厕所偷拍| 伊人久久综合无码成人网| 末发育娇小性色xxxxx视频| 九九99久久精品在免费线97| 亚洲一区二区三区视频免费看| 亚洲综合色婷婷七月丁香| 日韩区在线| 丰满熟女人妻一区二区三区| 99久久精品免费看国产一区二区三区| 久久人妻少妇嫩草av蜜桃|