陸小銘,曹維華,余勇昌
(中國電信股份有限公司廣東研究院 廣州 510630)
隨著云計算概念在國內(nèi)的興起,三大運營商先后提出了自己的云計算項目,如中國移動的“大云”計劃,其主要目標是為了滿足IT支撐系統(tǒng)發(fā)展和提供互聯(lián)網(wǎng)業(yè)務和服務的需要;中國聯(lián)通推出了“互聯(lián)云”的概念,其目的是要把網(wǎng)內(nèi)的IDC實現(xiàn)互聯(lián)和資源共享;中國電信則是聯(lián)合了在云存儲領域有成功經(jīng)驗的EMC,以Mozy為原型推出了“e云”云存儲業(yè)務。云存儲既可以為云計算提供存儲能力,也可以單獨成為一種服務。e云業(yè)務就是面向公眾客戶和企業(yè)客戶的定位于數(shù)據(jù)備份的云存儲業(yè)務。
云存儲業(yè)務是通過IP網(wǎng)絡為個人和企業(yè)提供服務的,所以,網(wǎng)絡質量對用戶的業(yè)務體驗有著直接的影響。電信運營商有必要分析在何種網(wǎng)絡環(huán)境下能實現(xiàn)較好的業(yè)務體驗,同時如何利用自己可控的網(wǎng)絡部署和優(yōu)化云存儲的組網(wǎng),從而實現(xiàn)用戶體驗的提升,促進云存儲業(yè)務的發(fā)展。
云存儲是在云計算概念上延伸和發(fā)展出來的一個新的概念,它是指通過集群應用、網(wǎng)格技術或分布式文件系統(tǒng)等功能,將網(wǎng)絡中大量各種不同類型的存儲設備通過應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務訪問功能的一個系統(tǒng)。從根本上來說,云存儲是一種實用型服務,它可以為眾多用戶提供一個通過網(wǎng)絡訪問的共享存儲池。從業(yè)務交付方式看,云存儲與SaaS服務有些類似,所不同的是云存儲所提供的是存儲管理和服務。云存儲池是可以靈活調(diào)整的,可以很輕松地擴展或根據(jù)客戶需求定制。
云存儲是存儲技術的集大成者,主要涉及了組織架構、數(shù)據(jù)優(yōu)化、安全管理等三大方面的技術范疇。
云存儲利用了現(xiàn)有的存儲虛擬化、集群存儲以及SAN+NAS等技術。從架構上看,云存儲可以借助存儲虛擬化技術構建龐大的存儲池,屏蔽底層存儲差異,從而對外提供一致的服務。目前,云存儲系統(tǒng)結構模型主要由存儲層、基礎管理層、應用接口層和訪問層等4層組成。
·存儲層:它是云存儲最基礎的部分。存儲設備可以是FC光纖通道存儲設備,可以是NAS和iSCSI等IP存儲設備,也可以是SCSI或SAS等DAS存儲設備。
·基礎管理層:基礎管理層通過集群、分布式文件系統(tǒng)和網(wǎng)格計算等技術,實現(xiàn)云存儲中多個存儲設備之間的協(xié)同工作,使多個存儲設備可以對外提供同一種服務,并提供更好的數(shù)據(jù)訪問性能。
·應用接口層:不同的云存儲運營單位可以根據(jù)實際業(yè)務類型,開發(fā)不同的應用服務接口,提供不同的應用服務。
·訪問層:任何一個授權用戶都可以通過標準的公用應用接口來登錄云存儲系統(tǒng),享受云存儲服務。云存儲運營單位不同,云存儲提供的訪問類型和訪問手段也不同。
云存儲同時需要具備重復數(shù)據(jù)刪除、壓縮和其他形式的數(shù)據(jù)優(yōu)化手段,在備份、歸檔和主存儲上減少現(xiàn)有數(shù)據(jù)的總容量,并且使數(shù)據(jù)也得到最大程度的優(yōu)化。
安全、基于策略的管理等也是云存儲應該具備的能力。云存儲應該能實現(xiàn)數(shù)據(jù)加密傳輸、冗余備份,并可以對免費用戶或付費用戶采用不同的存儲策略,從而實現(xiàn)服務的差異化,包括存儲速度、數(shù)據(jù)管理、存儲容量等。
根據(jù)用戶連接云存儲方式的不同,云存儲可以分為公有云存儲和私有云存儲。
如果用戶通過Internet連接到云存儲池,則屬于公有云存儲的概念。如亞馬遜的Simple Storage Service(S3,簡單存儲服務)、EMC的Mozy、中國電信的e云等。目前,公有云存儲業(yè)務還可以根據(jù)面向客戶的不同細分為以下兩類。
·面向企業(yè)用戶的公有云存儲業(yè)務:如亞馬遜的S3服務,其特點除了宣稱的可靠性、擴展性更好之外,最大的特點是面向開發(fā),并提供了豐富的接口,開發(fā)者可以把它當作一個在線存儲解決方案,而不僅僅是一個獨立的網(wǎng)絡應用,因此比較適合增值業(yè)務商向客戶提供互聯(lián)網(wǎng)增值業(yè)務(如視頻分享、在線游戲、SNS等)。該類業(yè)務一般會按存儲容量按月收費,同時還會根據(jù)傳輸數(shù)據(jù)量收取一定的帶寬使用費。
·面向公眾用戶的公有云存儲業(yè)務:如Mozy、Dropbox、e云等,該類業(yè)務以面向個人客戶為主,當然也會有專門針對企業(yè)級用戶的方案(主要是增加了管理、統(tǒng)計和分析功能),但其最大的特點是以數(shù)據(jù)的存儲備份為主,并不提供應用開發(fā)的接口。該類業(yè)務一般會向用戶提供一個免費的存儲額度,如果要增加容量則要收費,或者企業(yè)級應用也要收費。另外,還有一些應用,如納米盤、Mofile等,則是以文件分享為主,其共享文件在存儲池存儲的時間長短與下載次數(shù)有關,下載得越多,存儲時間越長。
如果用戶通過Intranet連接到云存儲池,則屬于私有云存儲的概念。私有云存儲通常建立在一家公司的防火墻后面,需要用到該公司所有或授權的硬件和軟件,所有的企業(yè)數(shù)據(jù)都保存在公司內(nèi)部并完全由內(nèi)部IT員工控制。目前,私有云存儲已經(jīng)有比較成熟的技術方案,如直接連接 存 儲 (direct access storage,DAS)、附 網(wǎng) 存 儲 (network attached storage,NAS)、存儲區(qū)域網(wǎng) (storage area network,SAN)等。
云存儲作為一項互聯(lián)網(wǎng)增值業(yè)務,可以由專門的增值業(yè)務商提供,也可以由電信運營商提供,相比較而言,電信運營商擁有很多先天的競爭條件以及無可比擬的資源優(yōu)勢。
·網(wǎng)絡資源優(yōu)勢:云存儲是依賴IP網(wǎng)絡存在的業(yè)務,IP網(wǎng)絡的質量是決定存儲速度的關鍵因素,目前,國內(nèi)絕大部分的網(wǎng)絡資源都由運營商掌控,因此,由運營商提供云存儲業(yè)務比較容易保證業(yè)務體驗。
·IDC資源優(yōu)勢:電信運營商還控制著大量的托管機房業(yè)務,這為運營商快速部署分片區(qū)的云存儲數(shù)據(jù)中心提供了極好的基礎。
·良好的用戶信任感:電信運營商作為老牌的企業(yè),用戶對其有比較好的信任感。
·牌照問題和內(nèi)容審計:云存儲可能會面臨業(yè)務牌照的問題,同時也存在“內(nèi)容審計”的潛在要求,電信運營商在這兩方面都有獨特的優(yōu)勢。
目前是云存儲的發(fā)展初期,云存儲還不能安全可靠地處理那些需要一直保持快速網(wǎng)絡連接的交易文件或數(shù)據(jù)庫,因此云存儲并不適宜參與到網(wǎng)絡交易過程。同時,對于數(shù)據(jù)分享功能,內(nèi)容難以管理和控制,將不可避免地遇到審計問題。因此建議云存儲業(yè)務定位于個人和公司的數(shù)據(jù)備份、歸檔和災難恢復,有條件嘗試數(shù)據(jù)分享功能(如只對企業(yè)內(nèi)用戶開通)。
對于企業(yè)用戶,可以結合MPLS VPN業(yè)務推動云存儲的發(fā)展。企業(yè)開通MPLS VPN業(yè)務的目的是為了方便地組織企業(yè)內(nèi)部網(wǎng)絡。但在開展MPLS VPN業(yè)務過程中發(fā)現(xiàn),對于地區(qū)跨度比較大的電路,由于分支機構距離總部的網(wǎng)絡時延比較大,如中美越洋電路的網(wǎng)絡時延甚至超過200 ms,此時數(shù)據(jù)傳輸?shù)乃俾示蜁恢本S持在一個較低的水平,導致用戶投訴不斷。對此,可以采用云存儲滿足企業(yè)用戶的數(shù)據(jù)存儲和傳輸問題。
對于公眾用戶,建議著眼于移動互聯(lián)網(wǎng)用戶,由于無線信道不可避免帶來的長時延、丟包以及資源的有限分配,云存儲的速度肯定不會很高,所以只適合備份少量的數(shù)據(jù),可以結合移動互聯(lián)網(wǎng)增值業(yè)務來推廣云存儲業(yè)務,如備份手機通信錄、日程計劃、照片、視頻等。
3.3.1 業(yè)務流量模型分析
在大多數(shù)的BS架構下的網(wǎng)絡應用,如HTTP、FTP、網(wǎng)絡視頻等都是以下行為主的非對稱模型,因此,作為電信服務的寬帶接入方式,都是按照此類模型設計的,如ADSL、EV-DO、WCDMA等。而云存儲應用作為一個特例,無論是在初始數(shù)據(jù)備份階段,還是在以后日常數(shù)據(jù)備份階段,都是以上行流量為主。
同時,由于云存儲業(yè)務注重數(shù)據(jù)的安全性和完整性,因此在數(shù)據(jù)的上傳和下載過程中,需要采用加密技術和校驗技術,這樣必然要求增加相應的數(shù)據(jù)包頭和校驗幀,從而增加了帶寬的消耗,在一定程度上影響數(shù)據(jù)備份速度。
以下對e云業(yè)務進行測試分析。測試方法是采用特定大小的文件進行備份,通過WireShark軟件抓包并分析。從分析結果得知,目前e云是由位于上海IDC機房的云存儲池提供的業(yè)務,對外只提供惟一一個地址,通過負載均衡技術將存儲任務分配到云存儲內(nèi)的若干臺磁盤服務器內(nèi)。
客戶端和存儲云之間采用TCP的傳輸層協(xié)議,所傳輸?shù)臄?shù)據(jù)采用了SSL加密。表1對備份文件大小和實際數(shù)據(jù)傳輸量進行了比較。
由此可見,由于采用了數(shù)據(jù)加密,數(shù)據(jù)包頭和校驗等需要額外的開銷,由此造成的備份過程中傳輸?shù)臄?shù)據(jù)流約為原始備份文件的1.4倍。
表1 備份文件大小和實際數(shù)據(jù)傳輸量的比較
3.3.2 云存儲速率測試及分析
在足夠的出口帶寬(155 Mbit/s)的情況下,選擇在不同網(wǎng)絡時延(不同的網(wǎng)絡時延取決于當時數(shù)據(jù)傳輸所經(jīng)的路徑)的情況下進行測試,測試結果如下。
如圖1所示,在雙向時延為26 ms,丟包率為10-3級別的網(wǎng)絡情況下,備份存儲10 MB大小的文件需要約12 s,平均速率約為8 Mbit/s。
如圖2所示,在雙向時延為75 ms,丟包率為10-3級別的網(wǎng)絡情況下,備份存儲10 MB大小的文件需要約25 s,平均速率約為4 Mbit/s。
以上情況可視作企業(yè)用戶采用e云業(yè)務時所可能遇到的情況,由此可見,e云業(yè)務作為典型的TCP應用,其傳輸速率和網(wǎng)絡時延、丟包率有著重要的關系,實際測試結果也比較符合TCP吞吐率的計算公式(見式(1)):
其中,TPT為吞吐量,MSS為最大段尺寸,RTT為往返傳輸時延,P為丟包率。
如圖3所示,如果采用EV-DO上網(wǎng)卡作為接入方式進行備份,由于無線資源的共享使用特性,備份存儲5 MB大小的文件需要長達700 s的時間,平均的存儲速率只有60 kbit/s。
以上是公眾用戶在使用e云業(yè)務的典型情況,由此可見,3G上網(wǎng)用戶受限于共享性質的無線接入帶寬,其應用速率更低,用戶的接入線路部分成為云存儲業(yè)務的瓶頸,ADSL用戶也會遇到同樣的問題。
云存儲是與IP網(wǎng)絡密切相關的業(yè)務,對于用戶而言,云存儲在使用上面臨的最大瓶頸就是數(shù)據(jù)備份速度問題,下面分析了影響云存儲業(yè)務的因素并提出了應對策略。
網(wǎng)絡可用性:直接影響云存儲業(yè)務的可用性。該問題主要取決于網(wǎng)絡的健壯性,現(xiàn)網(wǎng)主要通過設備和路由冗余實現(xiàn)。
用戶的接入帶寬:會影響存取數(shù)據(jù)的速度,影響業(yè)務體驗,取決于用戶采用的接入技術。從目前的情況看,公眾用戶大量采用ADSL和3G上網(wǎng)的方式,數(shù)據(jù)上行速度并不會很高,只能依靠提升用戶的接入速度解決。而對于租用專線的企業(yè)用戶,可以在業(yè)務路由器和云存儲IDC多開一條高速直通鏈路(如圖 4所示),確保企業(yè)用戶訪問云存儲的速度,而企業(yè)訪問Internet的速度還是按照所購買的帶寬來進行。
網(wǎng)絡時延和丟包率:這兩者會直接影響到存取數(shù)據(jù)的速度,建議RTT應低于50 ms,丟包率應低于0.1%。網(wǎng)絡時延一般和線路的傳輸距離相關,因此存儲云可以采用二級網(wǎng)絡結構(如圖 5所示),數(shù)據(jù)IDC可以分區(qū)部署,通過負載分擔和就近接入的方式把數(shù)據(jù)預存儲在本區(qū)的數(shù)據(jù)IDC,各個數(shù)據(jù)IDC通過MPLS VPN網(wǎng)絡實現(xiàn)互聯(lián),數(shù)據(jù)在完成本地備份之后,選擇在閑時進行數(shù)據(jù)的整合,包括冗余數(shù)據(jù)刪除、壓縮和磁盤整理等工作。
減少數(shù)據(jù)傳輸量也是提升業(yè)務體驗的重要手段,采用增量備份方式也可減少數(shù)據(jù)的重復傳輸,同時,在采用專用客戶端的情況下,可以在數(shù)據(jù)備份前做壓縮和加密,取代傳輸過程中的SSL加密,減少傳輸開銷。
在數(shù)據(jù)初始備份階段,受限于連接云的網(wǎng)絡連接能力,企業(yè)與云存儲之間GB、PB以上數(shù)量級數(shù)據(jù)的上傳就已經(jīng)是一個很大的挑戰(zhàn)。所以,在初次備份時,可以采用物理遷移的方法,也可以提供從云存儲節(jié)點到企業(yè)用戶的臨時專線連接,從而完成大量數(shù)據(jù)遷移到“云”里。在初始備份之后,日常數(shù)據(jù)的備份可以采用增量備份的方式,從而降低網(wǎng)絡帶寬壓力以及提高數(shù)據(jù)備份速度。
可靠的網(wǎng)絡和良好的部署方案是開展云存儲業(yè)務的重要保證。電信運營商同時擁有網(wǎng)絡和IDC資源,在開展云存儲業(yè)務中處于優(yōu)勢地位。在發(fā)展云存儲業(yè)務的時候,一方面要考慮存儲數(shù)據(jù)的壓縮和優(yōu)化,另一方面要考慮優(yōu)化網(wǎng)絡組織,從而實現(xiàn)較好的業(yè)務體驗,同時也需要面向不同的客戶為云存儲找準業(yè)務定位,結合主營業(yè)務去進行有針對性的推廣,才能取得應有的效果。
1 Jitendra Padhye,Victor Firoiuy,Don Towsley,et al.Modeling TCP throughput:a simple model and its empirical validation,www.sigcomm.org/sigcomm98/tp/paper25.pdf
2 馮翔.電信運營商的云計算戰(zhàn)略.通訊世界,2009(5)
3 李磊,王金倫,王薇等.電信運營商發(fā)展云計算的安全問題剖析.信息安全與通信保密,2009(10)
4 馮丹.網(wǎng)絡存儲關鍵技術的研究及進展.移動通信,2009(11)
5 鄧仲華,喻越.云環(huán)境下的信息服務等級協(xié)議研究.圖書與情報,2009(4)
6 陳康,鄭緯民.云計算:系統(tǒng)實例與研究現(xiàn)狀.軟件學報,2009(5)