【摘 要】本文介紹了高可用性集群技術和故障轉移的概念、集群系統(tǒng)的硬件組成,并結合典型實例,分析了基于集群技術的故障轉移的原理。實踐證明,集群技術對于保障數(shù)據(jù)的安全具有重要的是意義。
【關鍵詞】集群技術 故障轉移 心跳信號
一、引言
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)以幾何級數(shù)的速度增加、爆發(fā)。對于數(shù)據(jù)中心而言,數(shù)據(jù)的安全問題成為不可忽視的重要問題。
集群技術的發(fā)展為數(shù)據(jù)中心的數(shù)據(jù)安全提供了重要的保障。
二、集群技術和故障轉移概述
集群技術就是將各種服務器、存儲陣列、交換機等硬件連接為一體,然后通過管理軟件對它們進行統(tǒng)一的管理、調(diào)度、資源分配,對外部的所有客戶端而言,集群就像是一臺高性能的計算機,可以承擔服務器的一切功能,比如數(shù)據(jù)庫服務器、Web服務器、查詢服務器等。集群的目的是為了數(shù)據(jù)和應用的安全,當集群內(nèi)部的一部分硬件出現(xiàn)故障的時候,在集群管理軟件的判斷、調(diào)度下,可以讓備用的冗余硬件自動地替換故障硬件,從而不至于影響整個系統(tǒng)的正常運行。
從用戶方的客戶端來看,集群系統(tǒng)是一個整體的系統(tǒng),客戶端不關心集群系統(tǒng)內(nèi)的具體結構,而只是關心集群系統(tǒng)能否給自己提供所需要的各種應用服務。集群系統(tǒng)如果能夠保證客戶端的應用是連續(xù)的并且具有持續(xù)可用的特性,比如7*24小時的不間斷的正常使用,就可以說具有高可用性。那么這樣的集群系統(tǒng)我們就可以稱為高可用性的集群系統(tǒng)。
三、基于集群技術的故障轉移的原理
集群由兩個或兩個以上的計算機系統(tǒng)組成且被管理為一體??蛻粼L問集群使用一個單一的主機名或IP地址,并且集群中的系統(tǒng)回答客戶端的請求。集群技術的目的是為了消除一些單點故障。任何時候數(shù)據(jù)的可用性是最重要的。當出現(xiàn)網(wǎng)卡故障、處理器故障、主板故障、電源故障、電纜故障、網(wǎng)絡故障等單點故障時可以利用集群技術來實現(xiàn)故障轉移。
故障轉移集群通常應用于共享存儲中,共享存儲通常存在于外部共享存儲總線(光纖通道,SCSI或ISCSI ),接入到共享存儲的管理,可以由集群服務軟件完成。集群服務軟件由不同的操作系統(tǒng)和集群應用程序來決定如何訪問共享存儲。圖1顯示了一個簡單的雙節(jié)點故障轉移集群。
圖1 雙節(jié)點故障轉移集群
在圖1中,兩個物理的計算機共享一個通用的存儲源。使用常見的共享存儲,使集群中的數(shù)據(jù)管理要容易得多。這是因為數(shù)據(jù)在一個中央位置,所以不必考慮數(shù)據(jù)在每個節(jié)點上的同步問題。通常情況下與共享存儲連接的硬件使用某種形式的內(nèi)置的冗余,如RAID。需要讀取、寫入數(shù)據(jù)和訪問高可用性的應用程序,故障轉移集群是一個合適的選擇。如果第一個節(jié)點故障被檢測到,第二個節(jié)點的虛擬服務器將通過集群軟件來接管整個系統(tǒng)的控制。故障轉移集群允許運行兩個或兩個以上的物理計算機上的一個或多個“虛擬服務器”。集群系統(tǒng)上運行的虛擬化的計算機通常被稱為虛擬服務器或虛擬主機。
圖1有一個連接標記的心跳信號。這種連接通常是通過以太網(wǎng)利用連接交叉線或一個串行接口連接在兩個節(jié)點上。對于較大的集群中,心跳信號通常是通過一個專用的交換機連接。心跳信號是集群節(jié)點之間使用用戶數(shù)據(jù)報協(xié)議(UDP)進行周期性的通信,以確定一個節(jié)點是否正在運行的技術手段。每個集群節(jié)點將監(jiān)聽所有其他節(jié)點的心跳。例如當節(jié)點1監(jiān)聽不到節(jié)點2的心跳信號時,就認為節(jié)點2出現(xiàn)故障,從而接管整個集群的控制。
四、集群系統(tǒng)的硬件組件
集群系統(tǒng)的硬件組件包括服務器組、網(wǎng)絡組和數(shù)據(jù)共享盤。如圖2所示。
圖2 集群系統(tǒng)的硬件組件
五、結束語
隨著服務器、存儲、網(wǎng)絡的虛擬化技術的發(fā)展,集群技術也必將會發(fā)生日新月異的變化,對于企業(yè)和單位的信息化建設來說,集群技術可以提高服務器的工作可靠性,降低總擁有成本,對于提升企業(yè)和單位的信息化管理水平具有重要的是意義。
參考文獻:
[1]連英姿.淺談網(wǎng)絡服務器的集群技術[J].科技信息:科學教研,2007(25).
[2]許柯,鄭明雪.基于WEB的大規(guī)模集群監(jiān)控系統(tǒng)設計[J].網(wǎng)絡安全技術與應用,2008,(9).
[3]齊超.高可用集群中的故障切換策略[A].中國企業(yè)自動化和信息化建設論壇暨中南六省區(qū)自動化學會學術年會專輯[C].2004.