摘要:通過論述P2P技術引出了網格(Grid)的概念,采用生活中電力資源的例子形象地解釋了網格技術這個新生事物,接著進一步探討了網格技術的起源與發(fā)展、體系結構、所面臨的問題以及網格(Grid)的發(fā)展現狀,最后通過分析P2P技術和網格技術的優(yōu)缺點,提出兩者相互融合的觀點。
關鍵詞:P2P;分布式計算;網格;虛擬組織;資源共享;協(xié)作;標準;優(yōu)質服務
中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2009)04-1018-02
Exploration from the P2P Technology to Grid Technology
YUAN Xiu-li
(Department of Computer Jining College,Qufu 2731155,China)
Abstract:This thesis puts forword the grid concept through the elaboration of P2P technology, then vividly explains this newly-emerged thing-grid technolody using the example of electric power resources in our life. After that it further explores the origin and development of grid technology; the architecture of grid; the problems it faces now and its present situation. Finally this thesis analyzes the advantages and disadvantages of the P2P technology and the grid technology, and proposed the fused viewpoint mutually.
Key words:P2P;distributed computing;grid;hypothesized organization;resource sharing;cooperation;sandard;high-quality service
現在使用P2P技術的軟件比比皆是, 例如我們所熟悉的電騾(eMule)、迅雷(Thunder) 、酷狗(KuGoo)、易載(ezpeer)等下載軟件。P2P技術究竟意味著什么呢?關于P2P技術的兩種解釋或許可以說明這個問題。
一種是在1對1的終端上進行數據交換的點對點(peer to peer),另一種是個人對個人(person to person)。這兩種沒有特別的區(qū)分,在技術類的書刊或雜志上,前者用得比較多,大眾化的網絡雜志上后者出現的比較多。不管哪一種,P2P就是客戶端之間直接交換信息的意思。
對等(P2P)計算是在Internet上實施分布式計算的新模式。在這種模式下,服務器與客戶端的界限消失了,網絡上的所有節(jié)點都可以“平等”共享其他節(jié)點的計算資源。IBM為對等(P2P)下了如下定義:對等系統(tǒng)由若干互聯協(xié)作的計算機構成,且至少具有如下特征之一:系統(tǒng)依存于邊緣化(非中央式服務器)設備的主動協(xié)作,每個成員直接從其他成員而不是從服務器的參與中受益;系統(tǒng)中成員同時扮演服務器與客戶機的角色;系統(tǒng)應用的用戶能夠意識到彼此的存在,構成一個虛擬或實際的群體。
現代的P2P技術具有非集中式、可擴展性、健壯性、高性能/價格比、隱私保護、負載均衡等優(yōu)點。
P2P 系統(tǒng)一般要構造一個非集中式的拓撲結構,在構造過程中需要解決系統(tǒng)中所包含的大量節(jié)點如何命名、組織以及確定節(jié)點的加入、離開方式、出錯恢復等問題。
最新的成果都是基于DHT(Distributed Hash Table)的分布式查找和路由算法,通過分布式哈希函數,將輸入的關鍵字惟一映射到某個節(jié)點上,然后通過某些路由算法同該節(jié)點建立連接。典型的這一類P2P網絡拓撲結構模型有網格(Grid)等案例。
網格(Grid)又稱網格計算(Grid Computing),在新世紀一開始就已經慢慢的流行起來。然而他就像1993年的web技術一樣,給人們的印象是模糊不清的。人們對他的狂熱,可能更是源于網格技術神話般的前景:2020年的某個星期六晚上,無聊的你走到了一個類似現在顯示器一樣的東西面前,把網格專用線插進了網格接口,你便開始了你的太空探索。你不需要擁有一個天文望遠鏡,你不需要任何天文和圖像處理軟件,甚至你根本沒有CPU,或者顯卡,但你仍然可以觀測太空,找到一個星球,判斷它的年齡。而這一切,都源于網格。那時的網格,就像現在的電網(electric power grid)一樣,讓所有計算資源,甚至設備硬件,都像(analogy)現在的電力資源一樣,即插即用。
1 網格(Grid)的概念
網格(Grid)至今為止沒有一個標準的定義,簡單的說,網格(Grid)是把整個互聯網整合成一臺巨大的超級計算機,實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享。
網格計算主要研究在分布、異構、自制的網絡資源環(huán)境上動態(tài)建構虛擬組織并實現跨自治域的資源共享與協(xié)同工作,資源的匯聚和共享是網格(Grid)最重要的特征,共享與協(xié)作是網格(Grid)的基本概念。
網格(Grid)被認為是繼傳統(tǒng)Internet、Web之后的第三次浪潮,通俗地說,Internet實現了計算機系統(tǒng)與網絡設施的互連,Web實現了網頁的聯通, 使得信息的共享與獲取不受時空限制,而網格(Grid)則試圖實現在全球Internet范圍按需共享與整合各種IT資源,除了通常的信息與設備資源共享外,計算資源、數據資源和服務資源的有效聚和與廣泛共享是網格(Grid)區(qū)分以往共享技術的本質特征,顯然,從WWW到Grid的發(fā)展導致了從信息共享到資源共享的飛躍。
2 網格(Grid)技術的起源與發(fā)展
網格(Grid)是在20世紀90年代中期為構建先進科學和工程分布式計算實施而引入的概念。
為什么叫網格(Grid)呢,這個詞是從電網(power grid)轉化過來的。就是說在網格的世界里,所有的計算機資源也像電力資源一樣,即插即用。 大家想當你在用電的時候,你只需要把插頭插入插座就可以了。你不需要了解電從何方來,電力在電網中有是怎么分配的。你什么都不用知道,你只要付給電力公司一筆錢,你就可以用電了。同樣的,網格也嘗試想實現這種模式。當人們想用計算資源的時候,只需要插入網格插口,然后付錢就可以了。
網格的發(fā)展經歷了三個階段,如圖1所示。
3 網格(Grid)體系結構
網格的體系結構用五層沙漏模型表示,它定義了每一層的運行機制、接口、模式和協(xié)議等,支持資源提供者和用戶之間通過協(xié)商建立資源共享關系。如圖2所示
基礎結構層(fabric):定義本地(共享)資源接口,包括計算資源、數據存儲資源、網絡資源、軟件模塊或者其他系統(tǒng)資源等。
連接層:(connectivity):定義基本的通信和認證協(xié)議,這些協(xié)議是針對專門的網格服務定義的。
資源層(resource):在連接層的通信和安全協(xié)議之上,該層定義了單個資源的共享操作協(xié)議,包括安全協(xié)商、初始化、監(jiān)測、控制、記賬和付費等。
匯聚層(collective):負責全局資源的管理和資源集之間的交互。
應用層(application):通過不同的協(xié)作和資源訪問協(xié)議使用網格資源。
GT2(Globus Toolkit 2.0)是上述五層體系結構的一個典型實現,它在異構系統(tǒng)互聯協(xié)議、資源管理和協(xié)同工作幾個層次上解決了一些關鍵問題,為用戶創(chuàng)建和部署虛擬組織和網格系統(tǒng)提供資源管理、信息服務、數據管理、文件傳輸和安全機制等基本服務。
4 網格技術所面臨的問題
虛擬組織是網格(Grid)的核心概念,它由資源共享規(guī)則和約束條件定義的一組個體和機構動態(tài)構成,虛擬組織的成員為了共享資源,需要按照這些規(guī)則和約束條件進行協(xié)商。如何將這些跨區(qū)域的擁護、組織、服務和異構資源映射到相應的虛擬組織,是網格計算面臨的基本問題之一。
迄今為止,網格計算還沒有正式的標準,但在核心技術上,相關機構與企業(yè)已達成一致:由美國Argonne國家實驗室與南加州大學信息科學學院(ISI)合作開發(fā)的Globus Toolkit已成為網格計算事實上的標準,包括Entropia、IBM、Microsoft、Compaq、Cray、SGI、Sun、Veridian、Fujitsu、Hitachi、NEC在內的12家計算機和軟件廠商已宣布將采用Globus Toolkit。作為一種開放架構和開放標準基礎設施,Globus Toolkit提供了構建網格應用所需的很多基本服務,如安全、資源發(fā)現、資源管理、數據訪問等。目前所有重大的網格項目都是基于Globus Tookit提供的協(xié)議與服務建設的。
除了標準以外,安全和可管理性、IT人才的缺乏也是網格技術亟待解決的一個問題??磥碓诰W格技術實現商業(yè)應用之前,還有很多的問題需要解決。
5 網格技術離我們有多遠
網格技術憑借其獨特的計算力聯合和分布式計算模式,在學科研究、企業(yè)信息處理、電子政務、個人娛樂方面擁有廣泛的應用前景。
現階段網格(Grid)主要用于解決復雜的計算問題,網格(Grid)最初也是為這個目的而發(fā)展起來的。很多研究項目(比如研究人類基因)需要大量的運算,這些都可以在網格上輕松完成。網格計算技術已經在物理學、地球科學、氣象科學和生物科學等科學研究領域得到應用。網格能夠為跨地域、跨學科的大型科學研究活動提供協(xié)同工作支撐環(huán)境。
有觀點認為,網格(Grid)進入實際應用離我們很遙遠,這一過程可能需要10~20年的時間。來自國內生物醫(yī)藥、航空航天制造、勞動與社會保障、國土資源、鐵路、政府等應用部門的專家與從事網格技術研究的專家從應用需求出發(fā)共同探討了我國網格研究的方向,認為我國一些應用部門正在做的事雖然所用的名詞不同,但是與網格技術的思路是一致的。網格(Grid)的應用可以從一些具體的應用做起,其中一些有較好應用基礎的應用項目,在兩三年之內就有可能取得成效。
在我國,已經完成的網格(Grid)研究項目主要有清華大學的先進計算基礎設施ACI(AdvancedComputational Infrastructure)和以中科院計算為主的國家高性能計算環(huán)境NHPCE(National High Performance Computing Environment)。
目前正在進行的網格(Grid)研究項目有:
863 計劃支持的“中國網格(China Grid)”建設,有多家單位參加。
“上海教育科研網格”,多所上海的大學參加。
“仿真網格”的研究,由航天二院和清華大學共同開展。
“織女星網格”,由中科院計算所領銜開發(fā)。
另外,全國還有幾十所大學和研究機構已經開展各種網格研究。
總之,在網格還沒成形的當今,任何組織和研究人員都可能會對網格計算有不同的定義。但是不管怎樣,網格發(fā)展的本質永不會變:
1)資源的共享:計算資源、存儲資源、數據資源、信息資源、知識資 源、專家資源
2)標準化,如web 的TCP/IP協(xié)議
3)優(yōu)質的服務(QoS):包括快速,安全,高輸出,異構性,容錯能力等等
我想,理解了上面這三點,你就真正懂得了什么是網格。
6 結束語
縱觀P2P技術和網格(Grid)技術,兩者的優(yōu)缺點總結如圖3。
基于網格和 P2P 系統(tǒng)提供的互補優(yōu)點,我們可以期望這兩種方法最終會殊途同歸,尤其是當網格(Grid)達到 “網格件” 的開發(fā)階段時,屆時這兩種技術都將成為一些公共工具。
參考文獻:
[1] 許駿.網格計算與e-Learning Grid:體系結構 關鍵技術 示范應用.北京:科學出版社,2005.
[2] 田口美帆.互聯網技術[M].費珍嵐 譯.科學出版社,2004.
[3] 王慶波.P2P計算技術所面臨的典型問題[M].2007.
[4] Matt Haynos.網格觀點: 網格計算 —— 下一代分布式計算[M].2007.