鄭 鴻
[摘要]設(shè)計(jì)一個(gè)網(wǎng)格資源管理器模型,并對(duì)其各組件的功能實(shí)現(xiàn)進(jìn)行介紹。
[關(guān)鍵詞]網(wǎng)格 GlobusToolkit4 資源管理器
中圖分類號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)0510015-01
一、引言
網(wǎng)格(Grid)是將分布在不同地理位置的計(jì)算資源,通過高速的互聯(lián)網(wǎng)組成充分共享的資源集成,從而提供一種高性能計(jì)算、管理及服務(wù)的資源能力。網(wǎng)格技術(shù)是繼Internet技術(shù)和Web技術(shù)之后的第三代互聯(lián)網(wǎng)技術(shù),它能夠最大限度的實(shí)現(xiàn)網(wǎng)絡(luò)資源共享和調(diào)度,給計(jì)算機(jī)用戶帶來最好的上網(wǎng)服務(wù)。網(wǎng)格是對(duì)互聯(lián)網(wǎng)技術(shù)的又一大進(jìn)步,是第三代互聯(lián)網(wǎng)大浪潮。
由于各種資源、管理機(jī)制、用戶和應(yīng)用程序間存在大規(guī)模的異構(gòu)性,使得網(wǎng)格的資源管理比分布式或集群計(jì)算環(huán)境下的資源管理更加復(fù)雜,因此建立適應(yīng)于網(wǎng)格環(huán)境的資源管理系統(tǒng)模型,研究其特征及功能,為具體實(shí)現(xiàn)網(wǎng)格資源管理系統(tǒng)是很有必要的。
二、網(wǎng)格資源管理器模型
網(wǎng)格資源管理是網(wǎng)格的重要組件,本文設(shè)計(jì)的網(wǎng)格資源管理器的結(jié)構(gòu)如圖1所示。該資源管理器采用層次式的結(jié)構(gòu),為用戶提供了資源發(fā)現(xiàn)、作業(yè)提交、作業(yè)管理和監(jiān)控等功能。整個(gè)調(diào)度模型由作業(yè)收集器、信息采集器、作業(yè)調(diào)度器、作業(yè)管理器、調(diào)度記錄器以及數(shù)據(jù)庫(kù)組成。
三、網(wǎng)格資源管理器功能描述
1.作業(yè)收集器
作業(yè)收集器是整個(gè)全局調(diào)度器面向用戶的接口。作業(yè)收集器負(fù)責(zé)收集用戶提供的作業(yè)名稱、位置,執(zhí)行程序所需的參數(shù),作業(yè)結(jié)果文件的名稱與路徑等信息。并存入作業(yè)信息數(shù)據(jù)庫(kù),為作業(yè)調(diào)度服務(wù)。
2.信息采集器
資源信息采集器主要是針對(duì)網(wǎng)格系統(tǒng)中的節(jié)點(diǎn)及節(jié)點(diǎn)信息進(jìn)行查詢。網(wǎng)格節(jié)點(diǎn)的信息由動(dòng)態(tài)信息和靜態(tài)信息組成。動(dòng)態(tài)信息按照一個(gè)固定的時(shí)間間隔采樣得到,比如CPU、內(nèi)存的利用率、作業(yè)隊(duì)列長(zhǎng)度等。由于動(dòng)態(tài)信息對(duì)網(wǎng)格資源調(diào)度起著重要的作用,因此需要保證動(dòng)態(tài)信息的實(shí)時(shí)性。靜態(tài)信息是不會(huì)隨時(shí)間變化的信息,比如內(nèi)存大小、硬件類型,操作系統(tǒng)等,這些信息在資源獲取時(shí)一次采樣得到。本文采用GlobusToolkit4中的信息服務(wù)組件MDS4實(shí)現(xiàn)了網(wǎng)格信息的收集和發(fā)布。
3.作業(yè)調(diào)度器
作業(yè)調(diào)度器負(fù)責(zé)具體資源的選擇,由作業(yè)調(diào)度、容錯(cuò)機(jī)制和反饋機(jī)制組成。作業(yè)調(diào)度功能是把等待執(zhí)行的作業(yè)從作業(yè)隊(duì)列中取出,然后組成等待隊(duì)列。然后根據(jù)調(diào)度策略選擇合適的資源節(jié)點(diǎn),生成調(diào)度結(jié)果。容錯(cuò)機(jī)制功能是當(dāng)作業(yè)運(yùn)行失敗后,調(diào)度器要進(jìn)行容錯(cuò)處理。當(dāng)運(yùn)行過程中監(jiān)控到某個(gè)節(jié)點(diǎn)失效時(shí),將該節(jié)點(diǎn)上的失敗作業(yè)重調(diào)度到另一節(jié)點(diǎn)上,保障網(wǎng)格系統(tǒng)全局的負(fù)載平衡。如果在一個(gè)有效期內(nèi)收不到某節(jié)點(diǎn)的狀態(tài)信息,也認(rèn)為該資源失效,把調(diào)度到該資源上的所有作業(yè)重新加入作業(yè)隊(duì)列。反饋機(jī)制功能是對(duì)于執(zhí)行完成的作業(yè),根據(jù)反饋的執(zhí)行時(shí)間信息,可以調(diào)整等待隊(duì)列中類似作業(yè)的時(shí)間信息。同時(shí),調(diào)度器還會(huì)把作業(yè)和作業(yè)分配時(shí)資源的信息記入數(shù)據(jù)庫(kù),為未來作業(yè)的調(diào)度提供依據(jù)。
4.作業(yè)管理器
作業(yè)管理器包括作業(yè)提交器和作業(yè)監(jiān)控器兩部分的功能。作業(yè)提交器的作用是對(duì)作業(yè)生成RSL文件,然后向具體的資源節(jié)點(diǎn)提交。同時(shí)提交器還要把調(diào)度信息記寫入調(diào)度日志中,當(dāng)作業(yè)完成后,提交器還負(fù)責(zé)結(jié)果的收集,無論作業(yè)成功或失敗都提供在線結(jié)果信息。作業(yè)監(jiān)控器的作用就是監(jiān)聽作業(yè)狀態(tài)信息,以便能及時(shí)對(duì)失敗的作業(yè)進(jìn)行容錯(cuò)處理。網(wǎng)格作業(yè)的基本狀態(tài)包括:Submitted,Pending,Running,Done,F(xiàn)ailed。作業(yè)狀態(tài)的轉(zhuǎn)換情況是一旦提交作業(yè),狀態(tài)將顯示為Pending,如果已經(jīng)開始執(zhí)行,則將作業(yè)從Pending表中刪除,而在Running表中添加該作業(yè),表示正在運(yùn)行。如果該作業(yè)的當(dāng)前狀態(tài)為Done或Failed時(shí),則將該作業(yè)Running表中刪除,同時(shí)更新網(wǎng)格作業(yè)信息,將作業(yè)狀態(tài)更新為相應(yīng)的狀態(tài)。
5.調(diào)度記錄器
調(diào)度記錄器的作用是用來記錄調(diào)度結(jié)果,保障調(diào)度執(zhí)行。包括調(diào)度標(biāo)識(shí)、作業(yè)標(biāo)識(shí)、資源標(biāo)識(shí)、作業(yè)描述、作業(yè)狀態(tài)、提交時(shí)間等方面。由于網(wǎng)格資源的動(dòng)態(tài)性和不穩(wěn)定性,會(huì)出現(xiàn)資源故障或退出的情況,如果通過資源監(jiān)控發(fā)現(xiàn)某個(gè)資源節(jié)點(diǎn)失效,那么作業(yè)調(diào)度器將根據(jù)調(diào)度日志生成重新生成RSL請(qǐng)求,產(chǎn)生調(diào)度結(jié)果。
四、小結(jié)
網(wǎng)格資源管理系統(tǒng)目前絕大多數(shù)的研究?jī)H僅是局限于理論或原型系統(tǒng),建立一個(gè)適應(yīng)于網(wǎng)格環(huán)境的資源管理系統(tǒng)模型,研究其特征及功能,為具體實(shí)現(xiàn)網(wǎng)格資源管理系統(tǒng)起到舉足輕重的作用。本文設(shè)計(jì)的網(wǎng)格資源管理器已經(jīng)應(yīng)用到信息處理和計(jì)算網(wǎng)格中去,并取得了一定的效果。下一步工作是在資源描述、容錯(cuò)處理等方面進(jìn)行研究,進(jìn)一步優(yōu)化和完善該資源管理器。
參考文獻(xiàn):
[1]田志民、趙劍、翟正利等,面向服務(wù)的網(wǎng)格資源管理模型研究[J].計(jì)算機(jī)應(yīng)用研究,2006,04:25-27.
[2]李培峰、朱巧明、支麗艷,面向信息服務(wù)的網(wǎng)格資源管理器的設(shè)計(jì)[J].計(jì)算機(jī)工程,2008,03:49-51.
[3]金海、陳剛、趙美平,容錯(cuò)計(jì)算網(wǎng)格作業(yè)調(diào)度模型的研究[J].計(jì)算機(jī)研究與發(fā)展,2004,08:1382-1388.
[4]林琳、唐闊、胡亮、范溯,遠(yuǎn)程調(diào)用方法及其在Globus Toolkit4中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2007,06:617-624
作者簡(jiǎn)介:
鄭鴻,男,廣東饒平人,廣東工業(yè)大學(xué)2009級(jí)軟件工程碩士班學(xué)員,研究方向:軟件工程、網(wǎng)絡(luò)技術(shù)。