亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        汽車碰撞過程的計算負(fù)載均衡并行有限元技術(shù)

        2017-07-13 16:37:35張迎軍吳沈榮施欲亮涂金剛
        計算機輔助工程 2017年3期
        關(guān)鍵詞:處理單元分區(qū)有限元

        張迎軍++吳沈榮++施欲亮++涂金剛++李文平

        摘要: 為了在有限的計算資源下挖掘更高的汽車碰撞仿真計算效率,基于當(dāng)前普遍采用的并行處理區(qū)域分解算法,結(jié)合一個典型碰撞案例分析可知,汽車碰撞模型計算過程中的主要時間開銷與結(jié)構(gòu)大變形相關(guān).提出基于坐標(biāo)遞歸對分(Recursive Coordinate Bisection,RCB)的計算負(fù)載均衡區(qū)域分解算法,并將此法應(yīng)用于某整車碰撞仿真模型的3類典型工況.計算結(jié)果表明此法能將并行計算效率提高10%~24%.

        關(guān)鍵詞:

        汽車碰撞仿真; 并行計算; 區(qū)域分解; 計算負(fù)載均衡; 坐標(biāo)遞歸對分; 計算效率

        中圖分類號: U462

        文獻(xiàn)標(biāo)志碼: B

        0 引 言

        在汽車被動安全研究領(lǐng)域中,計算機仿真是經(jīng)濟、有效的方法.汽車整車碰撞過程仿真是典型的大變形條件下的大規(guī)模沖擊大變形計算,涉及高度的幾何非線性、材料非線性和邊界條件非線性等問題.為確保仿真計算結(jié)果有足夠的精度,汽車整車有限元模型的單元數(shù)量一般以百萬計,甚至達(dá)到千萬級別.[1]得益于計算機軟硬件的飛速發(fā)展,人們普遍采用大規(guī)模并行系統(tǒng)(Massively Parallel Processors,MPP)求解此類大規(guī)模動態(tài)非線性問題.因此,適合于MPP并行計算機的非線性有限元結(jié)構(gòu)分析的并行求解技術(shù)引起高度重視,其中,基于區(qū)域分解算法的并行有限元法是當(dāng)前并行計算最活躍的研究和應(yīng)用領(lǐng)域之一.[29]

        本文簡要介紹基于區(qū)域分解算法的并行有限元法,分析并行計算區(qū)域分解算法的主要時間開銷,提出基于坐標(biāo)遞歸對分(Recursive Coordinate Bisection,RCB)的負(fù)載均衡區(qū)域分解算法[1011],最后將此法應(yīng)用于某整車碰撞仿真模型,探討前部正面剛性墻碰撞、正面40%偏置碰撞以及可變形移動壁障側(cè)面碰撞等3種工況下提高并行計算效率的可能性.

        1 基于區(qū)域分解算法的并行計算技術(shù)

        1.1 基于區(qū)域分解的顯式并行有限元法

        汽車碰撞過程的計算機仿真一般采用顯式有限元求解,其基本流程[12]如下.

        在MPP平臺上實現(xiàn)以上計算流程.對于汽車碰撞這類大規(guī)模的仿真問題,目前最常采用的方法是區(qū)域分解算法.

        區(qū)域分解算法是將一個復(fù)雜大系統(tǒng),按照一定的規(guī)則,分解成與參加計算處理器的數(shù)目相等的子系統(tǒng),各處理器承擔(dān)各自子系統(tǒng)內(nèi)的計算負(fù)荷,并通過交互機制(例如MPI方式)進(jìn)行數(shù)據(jù)通信和數(shù)據(jù)交換.理論分析和實際計算[912]均已表明區(qū)域分解算法能夠為大規(guī)模問題提供高度并行的、可擴展的魯棒算法.

        1.2 并行計算區(qū)域分解算法的主要時間開銷

        對于某個計算模型,采用并行計算時,其執(zhí)行時間tP的計算公式[13]為

        式中:tPa為并行部分的執(zhí)行時間,通常為各個處理單元執(zhí)行并行部分所耗時間的最大值;ti/o為輸入/輸出所耗費的時間,輸入和輸出部分通常都由單機完成[9];tc為通信所耗費的時間,即通信開銷.

        加速比SP和并行效率η的計算公式分別定義為

        式中:ts為單個處理單元計算該模型所耗費的時間;N為并行計算時所用的處理單元總數(shù).

        在采用區(qū)域分解的并行計算中,需要預(yù)先給每個處理單元分配相應(yīng)的計算任務(wù).分析式(6)和(7)可知,要提高加速比和并行效率,就要設(shè)法減小并行部分的執(zhí)行時間tPa和通信開銷tc,

        式中:m為消息長度;n為處理器數(shù)目;t0(n)為啟動時間,取決于具體的硬件系統(tǒng);tc(n)為每字節(jié)通信時間,依賴于具體的計算平臺.

        因此,區(qū)域分解有以下3個原則[3,9]:

        (1)各個子系統(tǒng)的計算負(fù)載大致平衡,以減少并行部分的執(zhí)行時間tPa.

        (2)最大相鄰的處理單元數(shù)盡可能小,以減少通信次數(shù).

        (3)分子系統(tǒng)之間的邊界節(jié)點數(shù)量盡可能小,以減少單次通信量.

        區(qū)域分解的核心是靜態(tài)負(fù)載均衡問題,系統(tǒng)的分解優(yōu)劣關(guān)系到并行求解的效率.模擬過程中的動態(tài)負(fù)載(如接觸力)均衡則更是不可或缺,盡量使各處理單元有平衡的負(fù)載,才能實現(xiàn)高加速比和高并行效率的并行計算.

        RCB算法作為一種靜態(tài)負(fù)載均衡算法[810],可以使各個子系統(tǒng)的單元數(shù)量大致相等,其默認(rèn)子系統(tǒng)分解見圖1.由于該方法只考慮有限元模型的靜態(tài)幾何信息而未考慮模型在整個碰撞時域內(nèi)實際載荷的動態(tài)分布,對于汽車碰撞這類大規(guī)模沖擊大變形問題,默認(rèn)子系統(tǒng)分解方式不能有效保證各處理單元計算負(fù)載均衡,所以并不是最理想的區(qū)域分解方案.

        汽車碰撞模型計算過程中的時間開銷分布情況見表1.整個模型時耗的90%以上都花費在單元處理和接觸計算上,即第1.1節(jié)描述的第(2)和第(5)步.耗時多的計算都與結(jié)構(gòu)大變形有關(guān).

        為此,本文探討在保證各處理單元間單元數(shù)量平衡的基礎(chǔ)上,通過均勻分布大變形的區(qū)域分解方案實現(xiàn)各處理單元間的負(fù)載均衡,從而提高并行計算效率的可能性.

        2 基于RCB的負(fù)載均衡區(qū)域分解算法

        基于RCB,結(jié)合奇瑞汽車工程研究總院高性能計算服務(wù)器的共享內(nèi)存體系結(jié)構(gòu),設(shè)計負(fù)載均衡的區(qū)域分解算法(Computational Load Balance Based Domain Decomposition Algorithms,CLB),其基本原理[4,9]如下:

        (1)找出大變形定義中的所有單元及其相鄰單元;

        (2)根據(jù)參與計算的處理單元數(shù)目將大變形定義中的單元均分,并劃定區(qū)域邊界;

        (3)根據(jù)區(qū)域邊界進(jìn)行區(qū)域分解,復(fù)制區(qū)域邊界的節(jié)點,分布到對應(yīng)的區(qū)域中;

        (4)將模型中非大變形單元按照幾何坐標(biāo)分布到對應(yīng)區(qū)域中,直到滿足分割收斂條件,即子區(qū)域數(shù)與所用處理單元的數(shù)目相等;

        (5)輸出分區(qū)結(jié)果.

        根據(jù)以上原理,采用腳本語言pfile[14]和MPI消息傳遞函數(shù)庫開發(fā)大變形負(fù)載均衡分區(qū)程序,該程序可以讀入有限元網(wǎng)格,并進(jìn)行網(wǎng)格的初始化分區(qū),分區(qū)結(jié)果由顯式有限元求解器LSDYNA[1415]讀入,并將各分區(qū)一一分配給各處理單元進(jìn)行計算,從而實現(xiàn)汽車碰撞仿真問題的并行計算.

        3 實例應(yīng)用

        將CLB方法應(yīng)用于某整車碰撞仿真分析,該整車有限元模型見圖2,共計約93萬個單元,其詳細(xì)信息見表2.

        針對前部正面剛性墻碰撞、正面40%偏置碰撞以及可變形移動壁障側(cè)面碰撞等3種工況,設(shè)計不同的分區(qū)方案.

        3.1 前部正面剛性墻碰撞

        該整車有限元模型及其采用32個處理單元的分區(qū)結(jié)果見圖2,碰撞總時間為90 ms,計算迭代總步數(shù)為 100 001步,計算結(jié)果見圖3.

        3.2 正面40%偏置碰撞

        正面40%偏置碰撞工況下,該整車有限元模型及其采用32個處理單元的分區(qū)結(jié)果見圖5;碰撞總時間為120 ms,計算迭代總步數(shù)為133 334步,計算結(jié)果見圖6.

        默認(rèn)RCB分區(qū)方法和CLB方法在不同處理單元數(shù)目下的計算時耗、加速比及并行效率分見表4和圖7.同第3.1節(jié),正面40%偏置碰撞并行計算的效率分析以8個處理單元為基準(zhǔn).

        3.3 可變形移動壁障側(cè)面碰撞

        在可變形移動壁障側(cè)面碰撞工況下,該整車有

        限元模型及其采用32個處理單元的分區(qū)結(jié)果見圖8,碰撞總時間為80 ms,計算迭代總步數(shù)為步,計算結(jié)果見圖9.

        默認(rèn)RCB分區(qū)方法和CLB方法在不同處理單元數(shù)目下的計算時耗、加速比及并行效率分別見表5和圖10.同第3.1節(jié),可變形移動壁障側(cè)面碰撞并行計算的效率分析以8個處理單元為基準(zhǔn).

        4 結(jié)果分析

        對于整車碰撞3種工況下的并行仿真算例,由

        表3~5及圖4,7和10可知,隨著處理單元數(shù)目的增加,采用2種區(qū)域分解算法都能大幅減少計算時間.相對于默認(rèn)的RCB方法,基于CLB根據(jù)汽車碰撞各工況的特性設(shè)計的分區(qū)方法具有更好的并行計算表現(xiàn).

        相對于默認(rèn)的RCB方法,CLB分區(qū)方法能使總的計算時間減少10%~24%.

        5 結(jié) 論

        根據(jù)顯式有限元的計算主要是在單元中進(jìn)行,而且計算時間大多花在單元和接觸計算上的特點,考慮所用的高性能計算服務(wù)器的體系結(jié)構(gòu)、內(nèi)存大小和信息傳遞方式等,設(shè)計基于信息傳遞和負(fù)載均衡的動態(tài)顯式有限元的并行區(qū)域分解算法.算例計算結(jié)果表明,這種方法可以比軟件默認(rèn)的算法的加速比和并行效率更高,總的計算時間可以減少10%~24%.

        參考文獻(xiàn):

        [1] MACRI D, SANDAHL A, JERGEUS J, et al. Crash cae in the all new volvo XC90 and SPA platform[R]. Sweden: 6th BETA CAE International Conference, 2015.

        [2] ROH Y S. Scaling study of LSDYNA MPP on high performance servers[C]// Proceedings of 6th International LSDYNA Users Conference. Michigan, 2000: 2534.

        [3] 曹銀鋒, 李光耀, 鐘志華. 汽車碰撞過程并行有限元仿真技術(shù)[J]. 機械工程學(xué)報, 2005, 41(2): 153157. DOI: 10.3321/j.issn:05776686.2005.02.030.

        CAO Y F, LI G Y, ZHONG Z H. Parallel explicit finite element simulation of vehicle collision[J]. Chinest Journal of Mechnical Engineering, 2005, 41(2): 153157. DOI: 10.3321/j.issn:05776686.2005.02.030.

        [4] 亓文果, 金先龍, 張曉云. 沖擊接觸問題有限元仿真并行計算[J]. 沖擊與振動, 2006, 25(4): 6871. DOI: 10.3969/j.issn.10003835.2006.04.018.

        QI W G, JIN X L, ZHANG X Y. Study on parallel algorithm for finite element simulation of contactimpact problems[J]. Journal of Vibration and Shock, 2006, 25(4): 6871. DOI: 10.3969/j.issn.10003835.2006.04.018

        [5] 亓文果, 金先龍, 張曉云, 等. 汽車碰撞有限元仿真的并行計算及其性能研究[J]. 系統(tǒng)仿真學(xué)報, 2004, 16(11): 24282431. DOI: 10.3969/j.issn.1004731X.2004.11.016.

        QI W G, JIN X L, ZHANG X Y, et al. Finite element simulation and performance study of vehicle crash based on parallel computing[J].Journal of System Simulation, 2004, 16(11): 24282431. DOI: 10.3969/j.issn.1004731X.2004.11.016.

        [6] 陳向東. 輕軌車輛與斜拉橋動態(tài)耦合系統(tǒng)的數(shù)值模擬方法及應(yīng)用[D]. 上海: 上海交通大學(xué), 2009.

        [7] 杜新光. 軌道車輛——結(jié)構(gòu)動態(tài)耦合系統(tǒng)的數(shù)值模擬方法及應(yīng)用[D]. 上海: 上海交通大學(xué), 2010.

        [8] 郭毅之, 金先龍. 大型結(jié)構(gòu)動力響應(yīng)的區(qū)域分解并行計算技術(shù)[J]. 高性能計算發(fā)展與應(yīng)用, 2007(1): 3237.

        GUO Y Z, JIN X L. Domain decomposition parallel computing technology for Large scale structure dynamic response[J]. Development and Application of High Performance Computing, 2007(1): 3237.

        [9] 王福軍. 沖擊接觸問題有限元法并行計算及其工程應(yīng)用[D]. 北京: 清華大學(xué), 2000.

        [10] BERGER M, BOKHARI S. A partitioning strategy for nonuniform problems on multiprocessors[J]. IEEE Transaction on Computers, 1987, 36(50): 570580.

        [11] HENDRICKSON B, PLIMPTON S. Tinkertoy parallel programming: complicated applications from simple tools[C]// Proceedings of 10th SIAM parallel processing for scientific computing conference. SIAM: Philadephia, 2007

        [12] WU S R. A variational principle for dynamic contact with large deformation[J]. Computer Method in Applied Mechanics Engineering, 2009, 198(1): 20092015.

        [13] MUKADDES A M M, SHIOY R. Parallel performance of domain decomposition method on distributed computing environment[J]. International Journal of Engineering and Technology, 2010, 2(1): 2834.

        [14] LSDYNA keyword users manual[Z]. Livermore CA: Livermore Software Technology Corporation, 2016.

        [15] WANG J. Introduction to MPP version of LSDYNA[Z]. Livermore CA: Livermore Software Technology Corporation, 2011.

        (編輯 武曉英)

        猜你喜歡
        處理單元分區(qū)有限元
        上海實施“分區(qū)封控”
        不同生物鏈組合對黃河下游地區(qū)引黃水庫富營養(yǎng)化及藻類控制
        城市污水處理廠設(shè)備能耗及影響因素分析研究
        科技資訊(2021年10期)2021-07-28 04:04:53
        長填齡滲濾液MBR+NF組合工藝各處理單元的DOM化學(xué)多樣性
        一種高可用負(fù)載均衡網(wǎng)絡(luò)數(shù)據(jù)采集處理的方法及系統(tǒng)
        浪莎 分區(qū)而治
        基于SAGA聚類分析的無功電壓控制分區(qū)
        電測與儀表(2015年8期)2015-04-09 11:50:16
        基于多種群遺傳改進(jìn)FCM的無功/電壓控制分區(qū)
        電測與儀表(2015年7期)2015-04-09 11:40:16
        磨削淬硬殘余應(yīng)力的有限元分析
        基于SolidWorks的吸嘴支撐臂有限元分析
        高清少妇二区三区视频在线观看| 国产精品久久国产精品久久 | 少女韩国电视剧在线观看完整| 精品久久久久久无码人妻热| 国产午夜精品久久久久免费视| 国产免费破外女真实出血视频| 九九九影院| 资源在线观看视频一区二区| 日韩精品极品免费在线视频| 二区免费在线视频观看| 久久天堂av综合合色| 97人人模人人爽人人少妇 | 亚洲大尺度在线观看| 国产91在线精品福利| 亚洲国产成人精品激情| 亚洲性av少妇中文字幕| 蜜桃视频免费进入观看| 精品无码国产自产拍在线观看 | 亚洲国产一区二区三区在观看 | 好大好湿好硬顶到了好爽视频| 亚洲va中文字幕| 欧美亚洲国产另类在线观看| 亚洲日本一区二区在线观看| 亚洲av在线观看播放| 日本高清在线一区二区三区| 久久久亚洲欧洲日产国码αv| 亚洲国产人在线播放首页| 国产一区二区三区啪| 国产一级黄色av影片| 全亚洲最大的私人影剧院在线看| 爱情岛论坛亚洲永久入口口| 精品日韩欧美一区二区在线播放| 91福利视频免费| 中文字幕乱码琪琪一区| 又硬又粗进去好爽免费| 亚洲国产日韩精品一区二区三区| h国产视频| 无码制服丝袜中文字幕| 丰满少妇被啪啪到高潮迷轩| 亚洲av综合色区| 99精品视频69V精品视频|