袁敬實(shí) 陳琰 王蓓蓓
【摘要】? ? 隨著“互聯(lián)網(wǎng)+”戰(zhàn)略的推進(jìn),信息消費(fèi)正在加速滲透進(jìn)各行各業(yè)與千家萬戶,給社會(huì)發(fā)展與信息化建設(shè)帶來了巨大發(fā)展機(jī)遇和發(fā)展空間。在“互聯(lián)網(wǎng)+”實(shí)現(xiàn)過程中,我們將目光鎖定在大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等熱點(diǎn)應(yīng)用領(lǐng)域,這些領(lǐng)域與“互聯(lián)網(wǎng)+”的內(nèi)容實(shí)質(zhì)有很強(qiáng)相關(guān)性。也正是因?yàn)檫@樣,由于信息化所主導(dǎo)的新興業(yè)務(wù)領(lǐng)域才會(huì)有更好的發(fā)展空間,對(duì)“互聯(lián)網(wǎng)+”戰(zhàn)略的部署和實(shí)現(xiàn)也是一種很好的促進(jìn)。本文首先對(duì)分布式存儲(chǔ)和分布式存儲(chǔ)的特點(diǎn)進(jìn)行了簡要闡述;然后以POD方案和混合POD方案為例,對(duì)分布式存儲(chǔ)在大數(shù)據(jù)中心建設(shè)中的具體部署情況進(jìn)行了詳細(xì)分析和描述;最后從資源利用和管理能力等六個(gè)方面出發(fā),對(duì)云數(shù)據(jù)中心建設(shè)優(yōu)勢進(jìn)行了總結(jié)。
【關(guān)鍵詞】? ? 分布式存儲(chǔ)? ? 大數(shù)據(jù)? ? 建設(shè)策略
一、分布式存儲(chǔ)及其特點(diǎn)
1.1分布式存儲(chǔ)
分布式存儲(chǔ)的擴(kuò)展性更強(qiáng),其架構(gòu)能夠?qū)崿F(xiàn)跨設(shè)備數(shù)據(jù)分發(fā),同時(shí)能夠做到多個(gè)服務(wù)器間共享存儲(chǔ)負(fù)載。分布式存儲(chǔ)一般分為塊存儲(chǔ)、文件存儲(chǔ)和對(duì)象存儲(chǔ)。
1.1.1分布式塊存儲(chǔ)
在物理機(jī)與虛擬機(jī)應(yīng)用中,塊存儲(chǔ)可作為一種長期存儲(chǔ)設(shè)備來使用,對(duì)軟件導(dǎo)出和提供本地磁盤使用很有幫助。與此同時(shí),像備份和快照等多樣化高級(jí)服務(wù)也會(huì)被提供。
1.1.2分布式文件存儲(chǔ)
在“客戶端—服務(wù)器”模型的支持下,分布式文件系統(tǒng)設(shè)計(jì)更具實(shí)用性和現(xiàn)實(shí)意義。其功能在信息資源傳遞方式上表現(xiàn)出很強(qiáng)靈活性,比如基于物理設(shè)備進(jìn)行存儲(chǔ)的信息資源可在網(wǎng)絡(luò)環(huán)境支持下完成虛擬化存儲(chǔ),這樣便在客戶端層面極大節(jié)省了存儲(chǔ)空間,也降低了投入資金。
1.1.3分布式對(duì)象存儲(chǔ)
相比分布式塊存儲(chǔ)和分布式文件存儲(chǔ),分布式對(duì)象存儲(chǔ)要更復(fù)雜些,但所實(shí)現(xiàn)的功能更多,優(yōu)點(diǎn)也更加明顯,比如網(wǎng)絡(luò)附加存儲(chǔ)優(yōu)勢、存儲(chǔ)區(qū)域網(wǎng)絡(luò)優(yōu)勢等,均是分布式塊存儲(chǔ)和分布式文件存儲(chǔ)無法比擬的,這些與分布式對(duì)象存儲(chǔ)的結(jié)構(gòu)豐富性有直接關(guān)系。除了對(duì)象和對(duì)象存儲(chǔ)設(shè)備外,系統(tǒng)客戶端和元數(shù)據(jù)服務(wù)器在功能和優(yōu)勢實(shí)現(xiàn)過程中也發(fā)揮了重要作用,比如高安全性和可靠性。
1.2分布式存儲(chǔ)產(chǎn)品的主要特點(diǎn)
1.2.1高彈性和擴(kuò)展性
分布式存儲(chǔ)產(chǎn)品的高彈性和高擴(kuò)展性主要體現(xiàn)在應(yīng)用層面的負(fù)載均衡特性上,且每個(gè)硬件資源均具有這樣的特性。加之在多卷共享支持下,共享資源池功能也得到了最大限度發(fā)揮,使產(chǎn)品的高彈性特點(diǎn)得到了更好體現(xiàn)。而這一切均是在數(shù)據(jù)分片技術(shù)的支持來完成的,使數(shù)據(jù)能夠被均勻地分配到資源池中。
1.2.2高性能
分布式存儲(chǔ)通過動(dòng)態(tài)智能分區(qū)、靜態(tài)選盤算法以及 EC 算法,采用小 IO 聚合、大 IO 直通等技術(shù),在實(shí)現(xiàn)了業(yè)務(wù)均衡分布和保證了存儲(chǔ)高可靠的同時(shí),也保證了存儲(chǔ)的高性能。在使用 HDD 作為主存時(shí),采用分布式 SSD Cache 加速方案,將各個(gè) 存儲(chǔ)節(jié)點(diǎn)上的 SSD 組建成為一個(gè)共享的分布式 Cache 資源池,供所有的業(yè)務(wù)共同所 用,實(shí)現(xiàn) HDD 主存的性能加速。
1.2.3高可靠性
分布式存儲(chǔ)采用分布式集群管理方式,系統(tǒng)全冗余部署,無單點(diǎn)故障。支持 多副本和 EC(Erasure Coding)兩種數(shù)據(jù)冗余保護(hù)機(jī)制,支持設(shè)置靈活的數(shù)據(jù)可靠性策略,支持DIF、后臺(tái)數(shù)據(jù)一致性校驗(yàn)等數(shù)據(jù)完整性校驗(yàn)功能。
二、分布式存儲(chǔ)在大數(shù)據(jù)中心建設(shè)中的部署方案
基于分布式存儲(chǔ)的大數(shù)據(jù)中心建設(shè)中的部署方案,在硬件方面需要X86和架頂交換機(jī)或大型數(shù)據(jù)中心交換機(jī)做支持,在不同網(wǎng)絡(luò)機(jī)構(gòu)、網(wǎng)絡(luò)規(guī)模,以及不同的應(yīng)用需求下,對(duì)設(shè)備的應(yīng)用和組網(wǎng)方法也是有所區(qū)別的。
2.1存儲(chǔ)獨(dú)立POD方案
POD方案是指物理基礎(chǔ)設(shè)施資源池,該方案一般用在物理機(jī)房無法滿足和承載數(shù)據(jù)中心建設(shè)要求的情況下,方案應(yīng)用宗旨是將存儲(chǔ)與業(yè)務(wù)和管理服務(wù)器分開。當(dāng)前我們對(duì)“物理機(jī)房無法滿足和承載數(shù)據(jù)中心建設(shè)要求”的理解是,數(shù)據(jù)中心機(jī)房的服務(wù)器要達(dá)到千臺(tái)以上規(guī)模。
POD的劃分與建設(shè)主要依據(jù)業(yè)務(wù)內(nèi)容和屬性。假如平均每一個(gè)機(jī)柜放置10臺(tái)服務(wù)器,那么1500臺(tái)服務(wù)器就需要100多個(gè)機(jī)柜,按照業(yè)務(wù)內(nèi)容來進(jìn)行劃分,可能我們需要?jiǎng)澐殖?0-30個(gè)POD。圖1是具體POD組網(wǎng)結(jié)構(gòu)圖,假設(shè)數(shù)據(jù)中心的每臺(tái)服務(wù)器以2×10GE上聯(lián)一對(duì)TOR(接入交換機(jī))上,每臺(tái)TOR以4×40GE上聯(lián)匯聚層交換機(jī),并接入數(shù)據(jù)中心網(wǎng)絡(luò)。比如,在大數(shù)據(jù)計(jì)算節(jié)點(diǎn)每對(duì)接入交換機(jī)下掛載48臺(tái)服務(wù)器,那么從接入到匯聚就會(huì)采用1:3的收斂比。需要指出的是,無論是計(jì)算節(jié)點(diǎn)還是存儲(chǔ)節(jié)點(diǎn),又或是管理節(jié)點(diǎn),它們本身就是一個(gè)POD,有時(shí)獲取是多個(gè)POD,其主要任務(wù)是負(fù)責(zé)協(xié)調(diào)其它各個(gè)POD之間的業(yè)務(wù)互訪。
2.2采用混合POD組網(wǎng)方案
存儲(chǔ)獨(dú)立POD組網(wǎng)方案主要用來解決大型機(jī)房空間和資源利用率問題,而對(duì)于中小型機(jī)房來說,由于對(duì)空間和資源的要求并不是很高,所以采用存儲(chǔ)獨(dú)立POD方案難免會(huì)浪費(fèi)掉多余的空間和資源。在這樣的情況下,我們可以采用混合POD組網(wǎng)方案。圖2為混合POD組網(wǎng)結(jié)構(gòu)圖。
混合POD組網(wǎng)方案主要分兩種,一是按業(yè)務(wù)分區(qū)部署方案,二是機(jī)架混合部署方案。
2.2.1按業(yè)務(wù)分區(qū)部署方案
在空間部署方面,匯聚層交換機(jī)一般會(huì)被安置在機(jī)房物理中心位置,這樣便于其它設(shè)備連接。至于對(duì)交換機(jī)類型的選擇,主要還看具體業(yè)務(wù)需求。一般情況下,計(jì)算接入交換機(jī)、管理接入交換機(jī)、存儲(chǔ)接入交換機(jī)、IPMI管理交換機(jī)都會(huì)被置于機(jī)柜上層,一般在34U-38U這段距離之間,每個(gè)機(jī)柜所盛放的服務(wù)器數(shù)量需要控制在10-14臺(tái),并需要在同一個(gè)機(jī)柜部署相同業(yè)務(wù)的服務(wù)器。
2.2.2機(jī)架混合部署方案
前面所講,混合POD組網(wǎng)方案一般用于中小型機(jī)房建設(shè),但每個(gè)中小型機(jī)房的具體情況還是不同的,混合POD組網(wǎng)方案下的按業(yè)務(wù)分區(qū)部署方案多用于承載服務(wù)器數(shù)量較多的機(jī)房,而對(duì)于那些服務(wù)器數(shù)量少的機(jī)房來說,需要采用另一種方案,即機(jī)架混合部署方案。該方案與前一種方案相比,最大的不同就是計(jì)算和存儲(chǔ)共用一個(gè)交換機(jī)來協(xié)調(diào)業(yè)務(wù)之間互訪,而不是通過匯聚交換機(jī)來實(shí)現(xiàn)協(xié)調(diào)業(yè)務(wù)之間互訪。在此方案下,一個(gè)機(jī)柜既要承載計(jì)算服務(wù)器,也要容納存儲(chǔ)服務(wù)器,這樣做可以節(jié)省更多的空間資源,減少走線架線纜布放。
在同一個(gè)機(jī)柜中,計(jì)算接入交換機(jī)、管理接入交換機(jī)、存儲(chǔ)接入交換機(jī)和IPMI管理交換機(jī)的安置位置與按業(yè)務(wù)分區(qū)部署方案下的安置位置相同,但最頂層交換機(jī)位置不可超過40U。
三、與傳統(tǒng)IDC相比,云數(shù)據(jù)中心建設(shè)的優(yōu)勢
3.1充分利用資源
云數(shù)據(jù)中心建設(shè)優(yōu)勢主要體現(xiàn)在提高了資源使用效率,縮短了信息反映時(shí)間,提升了設(shè)備運(yùn)行維護(hù)質(zhì)量,簡化了信息管理流程,增強(qiáng)了IDC擴(kuò)展靈活性,以及降低了資源擴(kuò)充難度。這些內(nèi)容全部是云計(jì)算管理通過進(jìn)行動(dòng)態(tài)監(jiān)控、調(diào)度和部署虛擬化資源池中的各種資源來實(shí)現(xiàn)的。
3.2減少用戶初期投資與運(yùn)營成本
相比重構(gòu)購買符合應(yīng)用需求的硬件設(shè)備和軟件產(chǎn)品,根據(jù)用戶實(shí)際業(yè)務(wù)需求來調(diào)整租賃資源,對(duì)幫助用戶減少初期投資成本,以及運(yùn)營成本是十分有效的。特別需要強(qiáng)調(diào)的是,用戶可根據(jù)自身使用情況進(jìn)行付費(fèi),這一極具人性化的投資特征對(duì)于中小型企業(yè)及其自身發(fā)展來說無疑是十分有利的。
3.3直接滿足并實(shí)現(xiàn)了眾多IDC業(yè)務(wù)需求
云數(shù)據(jù)中心建設(shè)具有很強(qiáng)開放性,應(yīng)用平臺(tái)可將所有實(shí)際業(yè)務(wù)需求的相關(guān)內(nèi)容整個(gè)在一起提供了用戶。同時(shí),極具創(chuàng)新性的服務(wù)業(yè)實(shí)現(xiàn)了IDC業(yè)務(wù)服務(wù)的縱深發(fā)展。
3.4促進(jìn)IDC管理水平提高
規(guī)范化和規(guī)模化是云數(shù)據(jù)中心建設(shè)的主要特征,這一特征,或與之相關(guān)特征,對(duì)實(shí)現(xiàn)IDC自動(dòng)化管理,以及具有統(tǒng)一性的流程化管理有著重要幫助,直接促進(jìn)了IDC管理水平的提高。
3.5綠色成長
對(duì)云數(shù)據(jù)中心建設(shè)來說,綠色成長即指節(jié)能減排的實(shí)現(xiàn),以及對(duì)有限信息資源的高效利用。云數(shù)據(jù)中心的建設(shè)和應(yīng)用,將不斷推動(dòng)信息化環(huán)保事業(yè)的發(fā)展。
3.6業(yè)務(wù)多樣化的實(shí)現(xiàn)
業(yè)務(wù)多樣化只是相對(duì)而言,與傳統(tǒng)IDC相比,云計(jì)算支持下的IDC正在實(shí)現(xiàn)這一特征,這與移動(dòng)終端業(yè)務(wù)的支持有直接關(guān)系。
四、結(jié)束語
應(yīng)用分布式存儲(chǔ)技術(shù)于大數(shù)據(jù)中心建設(shè)中,需要我們能夠結(jié)合實(shí)際情、環(huán)境和需求還選擇合適的部署方案。建設(shè)空間和資源是當(dāng)前我們比較關(guān)注的兩方們問題,對(duì)于如何去解決這些問題,還需要我們能靈活運(yùn)用好相應(yīng)的技術(shù)和方案。希望本文的建議能給大家?guī)韼椭?/p>
參? 考? 文? 獻(xiàn)
[1]辛宇.網(wǎng)絡(luò)安全的分布式異構(gòu)存儲(chǔ)網(wǎng)絡(luò)安全技術(shù)分析[J].電子世界,2021(01):170-171.
[2]張恒均.分布式存儲(chǔ)——數(shù)據(jù)中心建設(shè)解決策略研究[J].數(shù)碼世界,2020(10):54-55.
[3]王晶晶.分布式存儲(chǔ)——大數(shù)據(jù)中心建設(shè)解決方案研究[J].電腦知識(shí)與技術(shù),2017,13(11):14-16.