亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        GM衛(wèi)星測高數(shù)據(jù)海面時變校正程序的I/O并行優(yōu)化研究

        2023-09-02 07:04:20徐方正梁建國
        關鍵詞:進程分配

        傅 游,徐方正,梁建國

        (山東科技大學 計算機科學與工程學院,山東 青島 266590)

        平均海平面(mean sea surface,MSS)是指相對于參考橢球在一定時間內的平均動態(tài)海面高,由平均海面地形和大地水準面兩部分相加得到[1]。MSS在研究地殼形變、大洋環(huán)流、海洋重力計算[2]、大地水準面起伏確定和地殼形變[3]等問題中得到廣泛應用,對地球科學和環(huán)境科學研究具有重要意義。

        建立MSS模型面臨的挑戰(zhàn)是在有限的時間跨度內實現(xiàn)對時間海面變化的最精確濾波,同時獲得最高的空間分辨率。通常結合來自精確重復任務(exact repeat mission,ERM)的數(shù)據(jù)與ERS-1、GEOSAT等早期的大地測量任務(geodetic mission,GM)測高數(shù)據(jù)實現(xiàn)[1]。校正GM數(shù)據(jù)中的海面時變信號時,需要讀取大量的衛(wèi)星軌跡數(shù)據(jù)文件[3],比如在構建日本海周邊區(qū)域的平均海平面模型中對GM數(shù)據(jù)進行海面時變校正時,共使用了5顆衛(wèi)星的GM衛(wèi)星測高數(shù)據(jù)及其對應的ERM測高數(shù)據(jù)[4]。以Crystat-2衛(wèi)星(2011.01.28—2019.12.12)為例,其GM衛(wèi)星測高數(shù)據(jù)包含112個周期,總共92 669個軌跡文件。生成結果的精度和分辨率要求越高,I/O的數(shù)據(jù)越多,計算耗時和I/O耗時越長,必須利用并行計算技術進行加速。并行計算已在衛(wèi)星數(shù)據(jù)處理領域發(fā)揮了重要作用[5-7]。在I/O性能優(yōu)化方面,Schenck等[8]提出將突發(fā)式數(shù)據(jù)緩存使用快速存儲介質作為緩沖區(qū),將進程之間由I/O引起的負載不平衡降到最低限度,同時加快I/O的整體速度;Thakur等[9]提出的ROMIO使用雙階段I/O調度算法優(yōu)化后的集中式I/O,盡可能對同一文件但不同數(shù)據(jù)段的多次訪問進行合并以減少訪問次數(shù);Behazad等[10]使用遺傳算法考慮影響I/O性能的各個參數(shù),再進行全局空間搜索,從而尋找最優(yōu)參數(shù)解;Chen等[11]使用遺傳算法對并行I/O性能進行自動調優(yōu);Guedes等[12]針對運行在基于容器的服務器虛擬化集群上的I/O密集型應用進行研究,在虛擬環(huán)境下提供緩存服務,在大規(guī)模集群的存儲文件系統(tǒng)中(如Lustre、通用并行文件系統(tǒng)和Panasas文件系統(tǒng)),將單個文件分為多個子文件存儲在多個數(shù)據(jù)服務器上,通過服務器的并發(fā)來提高I/O效率。這些方法在一定程度上確實能減少I/O耗時,但不同程序具有不同I/O特征,要取得更好的I/O優(yōu)化效果,必須針對具體程序進行分析,制訂具體優(yōu)化策略。

        在全球平均海面模型的建立過程中,在Yuan等[13]研究基礎上,開發(fā)了基于時空客觀分析法的GM衛(wèi)星測高數(shù)據(jù)海面時變校正的串行程序,完成了向高性能集群系統(tǒng)的移植。該串行程序讀取的多源衛(wèi)星總數(shù)據(jù)量約2 TB,輸出數(shù)據(jù)約500 GB,總讀取軌跡文件數(shù)約10 000萬個。在CPU為Intel i7-10875H、內存16 GB的個人電腦上需運行約3個月,嚴重影響研究進度。而在完成高性能集群系統(tǒng)移植后,程序計算時間大大減少,但I/O作為系統(tǒng)性能瓶頸的情況并未改善,影響了系統(tǒng)可擴展性。

        為了縮短I/O耗時,實現(xiàn)系統(tǒng)可擴展性,本研究從兩方面對GM衛(wèi)星測高數(shù)據(jù)海面時變校正程序I/O特征進行分析;為了提高I/O效率,提出按周期分配方案,并針對該方案可擴展性不佳、易導致負載不均衡的問題,提出一種合并再分配方案;使用消息傳遞接口(massage passing interface,MPI)文件視口函數(shù)對合并再分配算法進行優(yōu)化,進一步提高I/O效率。

        1 GM衛(wèi)星測高數(shù)據(jù)海面時變校正程序

        1.1 GM衛(wèi)星測高數(shù)據(jù)的海面時變校正程序計算過程

        以進行海面時變校正的GM衛(wèi)星測高數(shù)據(jù)在相同時間跨度的ERM測高數(shù)據(jù)為參考基準,先將ERM測高數(shù)據(jù)的海平面異常(sea level anomalies,SLA)與GM衛(wèi)星測高數(shù)據(jù)進行時空匹配,再進行海面時變校正,即可得到校正后的GM衛(wèi)星測高數(shù)據(jù)。采用時空客觀分析法進行GM衛(wèi)星測高數(shù)據(jù)海面時變校正的關鍵是如何選取與待校正GM衛(wèi)星測高數(shù)據(jù)在時間和空間相匹配的ERM測高數(shù)據(jù)并計算SLA。GM衛(wèi)星測高數(shù)據(jù)海面時變校正串行算法流程如圖1所示,圖中左側為ERM的SLA數(shù)據(jù)的篩選和計算過程,右側為GM衛(wèi)星測高數(shù)據(jù)的篩選和計算過程。

        圖1 串行算法流程圖

        1.2 GM衛(wèi)星測高數(shù)據(jù)的海面時變校正程序I/O特征分析

        在對原串行Fortran程序使用插樁法進行熱點檢測后,發(fā)現(xiàn)該串行程序讀寫文件耗時占比達80.44%,而數(shù)據(jù)計算部分僅占10.37%。若能優(yōu)化程序的I/O部分,則該程序的整體耗時會大幅減少。

        時空客觀分析法的特征是在考慮時空尺度的前提下,將沿測高軌跡的SLA數(shù)據(jù)格網化為規(guī)則的格網SLA,再對同時空范圍內的GM衛(wèi)星測高數(shù)據(jù)進行校正。GM和ERM衛(wèi)星測高數(shù)據(jù)文件結構的特點是包含多個周期文件夾且每個周期文件夾包含多個軌跡文件,文件目錄結構如圖2所示。

        圖2 衛(wèi)星測高數(shù)據(jù)文件目錄結構圖

        軌跡文件中以文本形式記錄衛(wèi)星測高數(shù)據(jù),GM衛(wèi)星測高數(shù)據(jù)和ERM衛(wèi)星測高數(shù)據(jù)文件內容結構分別如圖3、圖4所示。圖3和圖4中,每一行代表一個觀測點的信息,每一列代表一個屬性,其他信息篩除。GM衛(wèi)星測高數(shù)據(jù)的觀測點信息屬性包括觀測時刻、經度、緯度、動態(tài)海面高、大地水準面和平均動態(tài)海面高,其中大地水準面和平均動態(tài)海面高在本研究的海面時變校正中未被采用,但在后續(xù)海面高建模中采用,因此未去除。ERM衛(wèi)星測高數(shù)據(jù)包含時刻、經度、緯度和SLA。

        圖3 GM衛(wèi)星測高數(shù)據(jù)文件內容結構圖

        圖4 ERM衛(wèi)星測高數(shù)據(jù)文件內容結構圖

        GM衛(wèi)星測高數(shù)據(jù)海面時變校正程序I/O占比大的主要原因包括:①測高數(shù)據(jù)分布在數(shù)量繁多的軌跡文件中,如引言中提到的Crystat-2衛(wèi)星包含92 669個軌跡文件,而對應的同時期ERM軌跡文件83 058個,共計175 727個軌跡文件;②讀入GM衛(wèi)星測高數(shù)據(jù)和查找時空對應的SLA數(shù)據(jù)過程中,需要多次讀入不同文件,頻繁切換文件句柄,切換頻率約5 000次/s。每次完成一個觀測點的計算均需要寫入文件,每次寫入的數(shù)據(jù)量僅48字節(jié),輸出文件時需寫入約10 000次/s??梢奊M測高數(shù)據(jù)時空客觀分析法程序具有I/O密集型程序的特征,頻繁的I/O導致程序運行速度受限于I/O帶寬,無法充分發(fā)揮大規(guī)模集群中多核計算機性能。

        2 GM測高數(shù)據(jù)海面時變校正時空客觀分析法程序的I/O并行優(yōu)化

        2.1 按周期分配數(shù)據(jù)的并行方案

        為了將該程序移植到高性能集群系統(tǒng),實現(xiàn)多進程并行I/O,本研究提出一種按周期分配數(shù)據(jù)的并行方案。在該方案中,以一個周期的GM衛(wèi)星測高數(shù)據(jù)為最小任務分配粒度,即每個進程處理整數(shù)個周期的GM衛(wèi)星測高數(shù)據(jù),盡可能把所有數(shù)據(jù)按周期數(shù)平均分配給每個進程進行計算,兩兩進程之間分配到的周期數(shù)差最大為1。設n為總進程數(shù),T為總任務數(shù),進程i處理的任務數(shù)為ti,

        (1)

        式中:/為取商運算,%為取余運算。

        在多進程運行時發(fā)現(xiàn),各進程運行時間會有較大差異。以10個不完整周期(包含約100個軌跡文件)的GM衛(wèi)星測高數(shù)據(jù)為測試集,該方案并行程序分別開啟1到10個進程的運行時間與加速比如圖5所示,9進程時各進程運行時間如圖6所示。

        圖5 并行程序運行時間與加速比圖

        圖6 并行程序9進程時各進程運行時間

        由圖5可以看出,當進程數(shù)由5升至9時,運行時間基本保持不變;只有當進程數(shù)為1、2、5和10時,加速比與進程數(shù)接近。由圖6可以看出,0#進程的運行時間約為其他進程的2倍,產生了明顯的負載不均衡。由式(1)可知,當T不能被n整除時,分配給各個進程的任務數(shù)不均等,任務差為一個周期的GM衛(wèi)星測高數(shù)據(jù)校正任務。任務差越大,負載不均衡的情況越明顯。由于GM衛(wèi)星測高數(shù)據(jù)各周期的數(shù)據(jù)量不等,即使每個進程都分配相同數(shù)量的周期,實際的任務數(shù)據(jù)量差別也很大。除此之外,按周期分配方案的可擴展性不佳,能開啟的進程數(shù)不能大于周期數(shù)。

        2.2 合并再分配的并行方案

        由1.2節(jié)中的數(shù)據(jù)文件結構分析可知,若將行數(shù)據(jù)均勻地劃分給每個進程,需將所有文件的行數(shù)進行匯總,統(tǒng)計每個進程的行數(shù)。由于數(shù)據(jù)分布在多個軌跡文件中,在進行SLA數(shù)據(jù)匹配過程中依然存在頻繁切換文件的問題,出現(xiàn)同一個軌跡文件數(shù)據(jù)被分配給不同進程的情況,降低任務分配的效率。為避免此類問題的發(fā)生,本研究提出合并再分配的并行方案。在實際的任務計算中,最小計算任務單位是一個GM衛(wèi)星測高的觀測點數(shù)據(jù),即一行數(shù)據(jù),若能以行為進程分配最小任務單位,可大大提高負載均衡程度。

        合并再分配的并行方案將所有衛(wèi)星測高數(shù)據(jù)和軌跡文件匯總為如圖7所示的natt個屬性文件。圖7中,call_input表示的匯總文件總行數(shù),即各進程需要讀入的行數(shù)之和,ci_input表示進程i分到的衛(wèi)星測高數(shù)據(jù)行數(shù)。將衛(wèi)星測高數(shù)據(jù)匯總整合為數(shù)個文件,文件個數(shù)為需要測高數(shù)據(jù)中包含的屬性數(shù)(如時間、經度、緯度等),并按時間順序排序。ERM數(shù)據(jù)的匯總屬性文件除了圖4所示的4個屬性外,每行數(shù)據(jù)還需要加上該觀測點的周期號和軌跡號,以便于時空匹配。其中,

        圖7 合并再分配方案圖

        (2)

        設進程i在匯總文件開始讀數(shù)據(jù)的起始偏移量

        (3)

        各進程可以自行計算出ci_input和oi_input,無需通信。

        基于合并再分配方案的并行GM衛(wèi)星測高數(shù)據(jù)海面時變校正具體實現(xiàn)如算法1所示。

        算法1 基于合并再分配方案的并行GM衛(wèi)星測高數(shù)據(jù)海面時變校正算法輸入:GM衛(wèi)星測高數(shù)據(jù)gm_data,ERM衛(wèi)星的SLA數(shù)據(jù)sla_data輸出:校正后的GM測高數(shù)據(jù)result_data1: Begin2: MPI及其常用參數(shù)初始化,獲取進程號i,進程數(shù)n3: 多進程讀取sla_data的不同軌跡文件,并將其匯總為6個SLA屬性文件4: 多進程讀取gm_data,并將其匯總為6個GM屬性文件5: 根據(jù)i和n確定本進程讀取的gm_data在文件中的起始位置與長度6: 每個進程將本進程gm_data時間差在10天內的SLA數(shù)據(jù)讀入內存7: 前6號進程讀取sla_data并廣播給所有進程,存入6個SLA屬性數(shù)組8: end_line_gm_data←start_line_gm_data + my_gm_data_length9: for start_line_gm_data←my_gm_data_offset to end_line_gm_databy max_size do ∥每次循環(huán)取最多max_size 個觀測點的GM數(shù)據(jù),max_size為一次最多可讀取觀測點數(shù),自行設置10: block_gm_data←read_gm_data_to_array(start_line_gm_data,max_size,end_line_gm_data)∥將本次循環(huán)要校正的gm_data讀入內存11: for grid_gm_data in block_gm_data do ∥按順序從當前的block_gm_data中選取1°×1°格網內的gm_data12: grid_sla_data←choose_sla_data(my_sla_data) ∥ 篩選距離網格中心不超過1 000 km的sla數(shù)據(jù)13: grid_sla_data←filter_sla_data(grid_sla_data) ∥ 進行濾波和重采樣操作14: grid_result_data←objective_analysis(grid_sla_data,grid_gm_data)∥使用時空客觀分析法計算出校正后的GM衛(wèi)星測高數(shù)據(jù)15: block_result_data←add_result_data(block_result_data,grid_result_data)∥將當前格網的結果數(shù)據(jù)加入到當前周期結果數(shù)據(jù)16: end for17: write_block_result_data(block_result_data)∥將一個block的結果數(shù)據(jù)寫入磁盤18: end for19: 0#進程將所有block的結果文件匯總為一個文件并輸出20: End

        2.3 利用MPI文件視口函數(shù)實現(xiàn)I/O并行加速

        為了減少合并再分配時對文件匯總的耗時,利用MPI文件視口函數(shù)實現(xiàn)多進程I/O并行加速。MPI文件視口會給每一個進程定義一個獨立文件指針,讀寫位置由當前文件指針確定[14],各進程可以同時讀/寫一個文件,互不干擾。

        除了讀/寫的文件路徑之外,每個進程在讀/寫前還需要獲取自己在文件中進行讀/寫操作的偏移量和讀/寫的數(shù)據(jù)量。每個進程讀操作的數(shù)據(jù)量依據(jù)進程數(shù)平均分配,并行讀操作的文件起始偏移量可根據(jù)其進程號用式(3)計算得到。但是在并行寫操作時,輸出文件中的數(shù)據(jù)順序需要與進程順序保持一致,而每個進程寫入輸出文件的數(shù)據(jù)量并不相等,所以進程號大于0的進程進行寫操作時的偏移量需由上一個進程傳入。

        各進程偏移量通信流程如圖8所示。圖8中,ci_output為i號進程需要向輸出文件寫入的數(shù)據(jù)行數(shù),oi_output為i號進程在輸出文件中的起始偏移量,

        圖8 寫文件偏移量通信流程

        (4)

        所有進程的偏移量傳輸過程按進程號從小到大依序進行,在獲得其輸出文件的偏移量后,通過MPI文件視口輸出函數(shù)將結果數(shù)據(jù)并行寫入輸出文件。

        傳統(tǒng)的主從并行方案(以下簡稱傳統(tǒng)方案)中,往往只將計算任務并行化,輸入數(shù)據(jù)時需要由主進程讀文件并向從進程分發(fā)數(shù)據(jù);輸出數(shù)據(jù)時需要從進程向主進程發(fā)送數(shù)據(jù),再由主進程寫文件。并行I/O方法可避免主從進程間進行大量數(shù)據(jù)通信,理論上將讀/寫時間縮短為傳統(tǒng)方案的1/n。

        3 實驗測試

        3.1 實驗平臺

        實驗平臺為17臺多核計算機組成的集群系統(tǒng),其中16臺為計算節(jié)點,1臺為管理節(jié)點。計算節(jié)點的整體配置相同,均包含2個14核Intel Xeon Gold 6132處理器和96 GB的DDR4內存。因實驗平臺使用多處理器計算(multi-processor computing,MPC)技術,每個核心可開啟一個進程,可開最大進程數(shù)為16×28=448。實驗平臺軟件環(huán)境如表1所示。

        表1 實驗平臺軟件環(huán)境

        3.2 實驗數(shù)據(jù)集

        實驗數(shù)據(jù)集來源于AVISO(archiving,validation and interpretation of satellite oceanographic data)發(fā)布的沿測高軌跡的Level-2+(L2P)SLA數(shù)據(jù)產品(以下簡稱L2P)。L2P包含多個衛(wèi)星測高數(shù)據(jù),實驗使用其中的T/P、Jason-2和Cryosat-2測高衛(wèi)星數(shù)據(jù)集。L2P中每個測高衛(wèi)星均包含若干周期數(shù)據(jù),每個周期數(shù)據(jù)中又包含若干軌跡數(shù)據(jù),而每一個軌跡數(shù)據(jù)均包含了觀測時間、緯度、經度、衛(wèi)星軌道高度、衛(wèi)星到星下點距離、SLA、平均海面高、有效數(shù)據(jù)標志以及各項誤差改正項等。實驗數(shù)據(jù)集對于GM數(shù)據(jù),保留了觀測時刻、經度、緯度、動態(tài)海面高、大地水準面和平均動態(tài)海面高;對于ERM數(shù)據(jù),保留了觀測時刻、經度、緯度和SLA,將該數(shù)據(jù)集稱為大數(shù)據(jù)集。小數(shù)據(jù)量數(shù)據(jù)集系從L2P中按固定時間間隔抽選的文件得到。兩組數(shù)據(jù)集的具體信息如表2所示。

        表2 衛(wèi)星測高數(shù)據(jù)信息表

        3.3 實驗結果與分析

        1) 負載均衡度測試

        為了驗證合并再分配方案的負載均衡度的優(yōu)勢,使用小數(shù)據(jù)量數(shù)據(jù)集,收集了在單節(jié)點上開啟6~10進程時,按周期分配方案和合并再分配方案的各進程空閑時間之和,結果如圖9所示。

        圖9 多進程下不同并行方案進程空閑時間和

        由圖9可以看出,按周期分配方案的進程空閑時間之和,在6到9進程時隨著進程數(shù)的上升而增加,而在10進程時大幅降低。這是因為10進程時,周期數(shù)剛好能被進程數(shù)整除。而合并再分配方案的進程空閑時間在6到9進程時遠低于按周期分配方案,只有在10進程時相近,且隨著周期數(shù)上升幅度很小,可見合并再分配方案的負載均衡度優(yōu)于按周期分配方案。

        2) 兩種方案和I/O并行加速效果測試

        使用原版串行程序利用小數(shù)據(jù)量數(shù)據(jù)集進行實驗,耗時為1 027.89 s。

        為驗證兩種并行方案以及I/O并行加速的優(yōu)化效果,使用小數(shù)據(jù)集分別進行測試。小數(shù)據(jù)集包含10個周期,使用按周期分配方案時,若進程數(shù)超過10會出現(xiàn)閑置進程,故最大進程數(shù)不超過10。合并再分配方案中待匹配的ERM數(shù)據(jù)有6個屬性(時間、經度、緯度、SLA、所在周期、所在軌跡),每個進程讀入一個屬性,故進程數(shù)至少為6。測試結果如圖10所示。

        圖10 多進程下不同并行方案運行時間

        由圖10可以看出,對比串行程序,按周期分配方案在單進程時耗時更長,是因為啟用MPI需要耗時并且多了任務分配的步驟。6到9進程時,按周期分配方案的耗時基本不變,這是因為出現(xiàn)了任務分配不均,只分配到1個周期的進程需要等待2個周期的進程執(zhí)行結束。

        合并再分配方案在6和10進程時比按周期分配方案耗時更長,是因為分配任務的步驟更加復雜,當按周期分配方案中周期數(shù)可以被進程數(shù)整除或者余數(shù)很小時,按周期分配方案負載較為均衡,合并再分配方案的負載均衡優(yōu)勢沒有體現(xiàn)出來。當進程數(shù)為7到9時,按周期分配方案的負載產生了很大的不均衡,耗時大于合并再分配方案。同時,I/O并行加速對于按周期分配方案也有一定的加速效果,在6進程時加速最多,縮短耗時32.47 s,加速13.4%。

        3) 強、弱可擴展性測試

        為了驗證經I/O并行加速后的合并再分配方案的強、弱可擴展性,分別使用小數(shù)據(jù)量和大數(shù)據(jù)量數(shù)據(jù)集進行測試。

        許多并行計算平臺(例如高性能計算集群)能更高效地處理進程數(shù)為2的次方數(shù)的并行程序,這是因為此類平臺通常使用硬件結構來組織二叉樹或超立方體拓撲中的節(jié)點,使用2的次方數(shù)作為進程數(shù)允許進程自然映射到硬件拓撲中的節(jié)點,可以減少通信延遲并提高性能。因合并再分配方案的進程數(shù)不得小于6,故最小進程數(shù)設置為8。

        小數(shù)據(jù)量實驗組的加速效果如表3所示。表3中,加速比1由串行程序運行時間除以測試算例運行時間得到,加速比2由8進程并行程序運行時間除以測試算例運行時間得到,并行效率由加速比1除以進程數(shù)得到。由表3可知,運行時間在64進程時最短,為86.41 s,且加速比1為11.90,加速比2為1.91,但是并行效率最差,為0.19。并行效率在進程數(shù)為8時最高,為0.78。

        表3 小數(shù)據(jù)量實驗組加速效果

        小數(shù)據(jù)量實驗組中,在進程數(shù)達到16后,運行時間再無明顯縮減,并行效率隨著進程數(shù)的增加而減少。8進程到16進程加速比1和加速比2上升明顯,但是進程數(shù)繼續(xù)增加后,沒有明顯提升。原因是小數(shù)據(jù)量實驗組的數(shù)據(jù)量較小,符合Amdahl定律,小數(shù)據(jù)量實驗不具有良好的強可擴展性,難以體現(xiàn)出并行計算的優(yōu)勢。

        大數(shù)據(jù)實驗組中數(shù)據(jù)量大,最小進程數(shù)若設置太小會導致運行時間過長,并且可設置最大進程數(shù)為448,故設置并行運行的最小進程數(shù)為448的1/8,即56。表4為大數(shù)據(jù)量實驗組的加速效果,加速比由并行程序56進程運行時間除以測試算例運行時間得到。

        表4 大數(shù)據(jù)量實驗組加速效果

        由表4可知,運行時間隨著進程數(shù)的每次翻倍,加速比的增長速度也接近翻倍,在進程數(shù)為448時最短,為9 283.84 s,加速比也在此時達到最高7.21,并且加速比的上升速率沒有明顯降低,說明該算法具有良好的強可擴展性。

        分別以8和56為基準進程數(shù),進程數(shù)增加為8倍后,大數(shù)據(jù)量實驗組的加速比提升為小數(shù)據(jù)量實驗組的3.78倍,這主要是因為數(shù)據(jù)量擴大后合并再分配數(shù)據(jù)的耗時占比更小了,可見該并行方法的加速比在隨著數(shù)據(jù)量和進程數(shù)的增加而提升,也具有良好的弱可擴展性。

        4 結論

        本研究實現(xiàn)了時空客觀分析法對GM衛(wèi)星測高數(shù)據(jù)的海面時變校正的串行程序,分析了I/O密集型程序特性。使用按周期分配的并行方案對其進行并行化,提出合并再分配方案以保證負載均衡,并使用MPI文件視口函數(shù)進行I/O并行優(yōu)化。實驗結果表明:與按周期分配方案相比,合并再分配方案在多進程運行時耗時更少,并且在周期數(shù)不能被進程數(shù)整除時,負載均衡度更高,多進程可擴展性也更好;I/O并行加速可縮短合并再分配方案的運行時間;I/O并行加速后的合并再分配方案具有良好的強、弱可擴展性。后續(xù)工作可以進一步優(yōu)化程序的協(xié)方差矩陣計算步驟,減少計算環(huán)節(jié)耗時。

        猜你喜歡
        進程分配
        基于可行方向法的水下機器人推力分配
        應答器THR和TFFR分配及SIL等級探討
        債券市場對外開放的進程與展望
        中國外匯(2019年20期)2019-11-25 09:54:58
        遺產的分配
        一種分配十分不均的財富
        績效考核分配的實踐與思考
        我國高等教育改革進程與反思
        Linux僵死進程的產生與避免
        男女平等進程中出現(xiàn)的新矛盾和新問題
        俄羅斯的分配狀況
        中国人妻被两个老外三p| 加勒比精品久久一区二区三区 | 国产乱了真实在线观看| 久久人妻公开中文字幕| 成人国产精品一区二区网站| 日本一区二区三区在线| 国产一区二区视频免费| 国产av国片精品有毛| 大地资源在线播放观看mv | 成年人视频在线播放视频| 久久精品久99精品免费| 一区二区三区av波多野结衣| 国产日韩网站| 亚洲传媒av一区二区三区| 国产剧情一区二区三区在线| 插b内射18免费视频| 国产一区二区激情对白在线| 午夜无码亚| 日本伦理视频一区二区| 亚洲成av人片在线观看| 无码人妻精一区二区三区| 亚洲熟妇大图综合色区| 亚洲性日韩一区二区三区| 免费不卡在线观看av| 大地资源网最新在线播放 | 日韩有码中文字幕在线视频| 国产美女精品视频线免费播放软件 | 最近最新中文字幕| 欧美日韩一线| 国产成人精品久久二区二区91| 精品国产青草久久久久福利| 亚洲欧洲高潮| 日本精品久久中文字幕| 人人妻人人澡人人爽国产| 高中生粉嫩无套第一次| 国产精品制服一区二区| 国产精品高潮呻吟av久久黄| 无码av无码天堂资源网| 精品福利一区| 久久精品国产亚洲av麻豆床戏 | 国产让女高潮的av毛片|