亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        超級計算機作業(yè)管理系統(tǒng)概述

        2018-12-22 07:05:48張健國家超級計算天津中心
        數(shù)碼世界 2018年8期
        關(guān)鍵詞:進程作業(yè)用戶

        張健 國家超級計算天津中心

        1.引言

        超級計算機是通過高速互聯(lián)網(wǎng)絡(luò)連接并由多個獨立計算節(jié)點組成的超大型計算機。高速互聯(lián)網(wǎng)絡(luò)是計算節(jié)點之間發(fā)送和接收數(shù)據(jù)的通道。每個計算節(jié)點包含獨立的CPU、內(nèi)存和操作系統(tǒng),所有計算節(jié)點通過掛載分布式共享存儲的方式使用同一套存儲。超級計算機的這種結(jié)構(gòu),使得既可以滿足單機用戶的小規(guī)模串行任務(wù)需求,也可以滿足科研、企業(yè)用戶的大規(guī)模并行任務(wù)需求。在超級計算機上給用戶提供資源調(diào)度、作業(yè)管理、記賬分析等功能的軟件,就是作業(yè)管理系統(tǒng)。

        2.作業(yè)管理系統(tǒng)

        超級計算機上有成百上千的用戶,假設(shè)每個用戶提交十個作業(yè),那么作業(yè)的規(guī)模就會成千上萬,這些作業(yè)有串行的、有并行的,有交互式的、有批處理的,有計算密集型的、有I/O密集型的,這些作業(yè)都會對超級計算機的資源造成爭搶。所以,超級計算機需要一種管理軟件,用于對用戶的作業(yè)進行實時響應(yīng)、調(diào)度以及管理,同時,為了保障超級計算機的資源得到充分利用,還應(yīng)該具有作業(yè)監(jiān)控、作業(yè)記賬、作業(yè)統(tǒng)計和歷史作業(yè)查詢的功能,這個軟件就是作業(yè)管理系統(tǒng)。一個好的作業(yè)管理系統(tǒng)不僅要求保證計算集群有高的吞吐率、高的響應(yīng)速度,還應(yīng)提供調(diào)優(yōu)過的作業(yè)調(diào)度策略來提高用戶作業(yè)響應(yīng)速度和執(zhí)行時間。目前在超級計算機上使用較多的作業(yè)管理系統(tǒng)有Slurm、PBS和LSF。

        3. Slurm

        Slurm是LLNL等開發(fā)的一種開源作業(yè)管理系統(tǒng),主要功能包括支持細粒度資源選擇的資源分配、基于綜合優(yōu)先級的作業(yè)調(diào)度、提供快速加載大規(guī)模并行任務(wù)的加載命令、基于檢查點的自動作業(yè)容錯、節(jié)點空閑后自動降低功耗等。Slurm具有高效性、靈活性、可靠性、易用性、易管理型、安全性等主要特點。Slurm不僅對MPICH,Open MPI,BlueGene MPI等多種不同實現(xiàn)的MPI提供良好支持,還支持對圖形處理器(GPU)、集成眾核(Many Integrated Core,MIC)、網(wǎng)絡(luò)帶寬甚至內(nèi)存帶寬等“通用計算資源”的分配。

        Slurm主要由控制進程slurmctld、節(jié)點監(jiān)控進程slurmd、作業(yè)管理進程slurmstepd、記賬存儲進程slurmdbd和命令工具集組成。控制進程slurmctld和記賬存儲進程slurmdbd都部署在管理節(jié)點上面,其中slurmctld是Slurm的大腦,負責(zé)整個超級計算機的資源分配、作業(yè)調(diào)度和管理控制,而slurmdbd是用戶與控制進程訪問記賬數(shù)據(jù)庫的中間層,起到用戶認證與安全隔離作用。節(jié)點監(jiān)控進程slurmd是計算節(jié)點的守護進程,負責(zé)收集節(jié)點的資源狀態(tài)并向控制進程報告,同時,slurmd接收來自控制進程與用戶命令的請求,進行作業(yè)步任務(wù)加載、作業(yè)取消等。作業(yè)管理進程slurmstepd由slurmd在加載作業(yè)步任務(wù)或批處理作業(yè)時派生,負責(zé)提供本節(jié)點上相應(yīng)作業(yè)步的所有任務(wù)的啟動、I/O 轉(zhuǎn)發(fā)、信號傳遞、記賬信息收集等功能。

        4. PBS

        PBS全稱叫Portable Batch System,是由美國NASA的Ames研究中心開發(fā)的作業(yè)管理系統(tǒng)。PBS支持多種操作平臺,包括主流的Windows和LINUX平臺;支持批處理、交互式作業(yè)和串行、多種并行作業(yè),如MPI,PVM,HPF,MPL。PBS的特點包括支持多種作業(yè)調(diào)度方式、提供多種過程語言以便實現(xiàn)新的調(diào)度策略、通過用戶認證保證安全、故障自動探測和規(guī)避等。PBS主要有openPBS、Torque和PBS Pro三個版本:openPBS是較早開發(fā)的版本,無后續(xù)更新;Torque是開源的PBS版本;PBS Pro是商業(yè)版的PBS,提供企業(yè)范圍內(nèi)的作業(yè)調(diào)度。

        PBS由server、mom、scheduler模塊和命令工具集組成。server是管理模塊,負責(zé)用戶任務(wù)的管理、提交,保障整個作業(yè)管理系統(tǒng)的穩(wěn)定運行。mom是作業(yè)執(zhí)行模塊,也叫作業(yè)執(zhí)行器,是一個守護進程,負責(zé)將用戶提交的作業(yè)放入執(zhí)行隊列,并在作業(yè)運行后將作業(yè)的輸出返回給用戶,一個PBS系統(tǒng)可以存在多個不同mom,以通過不同的作業(yè)調(diào)度策略滿足不同用戶的需求。Scheduler是作業(yè)調(diào)度模塊,也叫作業(yè)調(diào)度器,負責(zé)調(diào)度執(zhí)行隊列中的作業(yè)應(yīng)該什么時候運行、在哪個計算節(jié)點運行、以什么方式運行,它可以和不同的mom通信并獲取執(zhí)行隊列狀態(tài),然后通過server驗證作業(yè)有效性,最后根據(jù)調(diào)度策略進行作業(yè)調(diào)度。PBS的命令工具集主要用于作業(yè)的提交、監(jiān)視、修改和刪除。

        5. LSF

        LSF全稱叫Load Sharing Facility,是由加拿大的Platform公司開發(fā)的一個分布式作業(yè)管理系統(tǒng)。同Slurm和PBS類似,LSF也支持批處理作業(yè)、交互作業(yè)、串行作業(yè)和多種并行作業(yè)。LSF能夠自動、安全地收集負載和資源信息,具有良好的容錯性,提供多種調(diào)度策略、進程遷移和斷點檢查功能[4]。

        LSF是松耦合結(jié)構(gòu),主要由LSF Base、LSF Batch、LSF Jobscheduler、LSF Multi-Cluster和LSF Analyzer這五個部分組成,其中LSF Base提供動態(tài)的負載管理和透明的資源訪問,LSF Batch提供異構(gòu)環(huán)境下的作業(yè)無縫調(diào)度處理,LSF Job-scheduler提供基于計算節(jié)點的由時間驅(qū)動的作業(yè)調(diào)度,LSF Multi-Cluster支持網(wǎng)絡(luò)連通的多臺超級計算機的資源共享,LSF Analyzer負責(zé)提供作業(yè)的全面數(shù)據(jù)分析,并生成記賬報告。LSF Base的功能主要通過守護進程LIM、RES、PIM和ELIM實現(xiàn),LSF Batch的功能主要通過守護進程MBATCHD、MBSCHD和SBATCHD實現(xiàn)。

        6.結(jié)束語

        本文對目前比較流行的三個作業(yè)管理系統(tǒng)Slurm、PBS和LSF進行了概述。通過作業(yè)管理系統(tǒng),超級計算機上用戶作業(yè)的調(diào)度、運行、統(tǒng)計和分析能到得到有效保障。在作業(yè)管理系統(tǒng)未來的發(fā)展中,將主要面臨兩個挑戰(zhàn):1、跨平臺的作業(yè)調(diào)度需求將會越來越大,作業(yè)管理系統(tǒng)需要提供功能更加強大的調(diào)度接口;2、隨著云計算、大數(shù)據(jù)和人工智能的發(fā)展,作業(yè)管理系統(tǒng)需要加強對云計算技術(shù)、大數(shù)據(jù)技術(shù)和人工智能技術(shù)的支持。

        猜你喜歡
        進程作業(yè)用戶
        快來寫作業(yè)
        債券市場對外開放的進程與展望
        中國外匯(2019年20期)2019-11-25 09:54:58
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        作業(yè)
        故事大王(2016年7期)2016-09-22 17:30:08
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        社會進程中的新聞學(xué)探尋
        我國高等教育改革進程與反思
        我想要自由
        毛片大全真人在线| 国产精品性色av麻豆| 手机在线看片| 久久精品人人做人人综合 | 久久亚洲伊人| 中文字幕av一区二区三区诱惑 | 久久久久亚洲av无码a片| 狠狠色噜噜狠狠狠狠米奇777| 免费网站看av片| av网站免费线看| 连续高潮喷水无码| 92自拍视频爽啪在线观看| 精品一二三四区中文字幕| 国产精品成人观看视频| 久久精品伊人无码二区| 亚洲中文高清乱码av中文| 免费a级毛片18禁网站免费| 一本一道av无码中文字幕| 国产精品高潮av有码久久| 精品不卡视频在线网址| 最新国产毛2卡3卡4卡| 无码人妻少妇色欲av一区二区| 丁香六月久久| 久久久亚洲av成人乱码| 先锋五月婷婷丁香草草| 波多野结衣亚洲一区二区三区 | 免费在线视频一区| 手机在线观看成年人视频| 精品亚洲a∨无码一区二区三区 | 亚洲av色香蕉一区二区三区老师| 亚洲av无码成人精品区在线观看| 手机AV片在线| 国产猛男猛女超爽免费av| 蜜桃视频在线看一区二区三区| 亚洲av永久无码国产精品久久| 日本视频一区二区三区免费观看 | 国产午夜精品一区二区三区不卡| 国产成人亚洲欧美三区综合| 亚洲av色在线播放一区| 精品久久久久久成人av| 中文字幕经典一区|