咸彤
分布式存儲發(fā)展至今,市場上并沒有一個能夠被廣泛接受并引用的定義。
分布式存儲系統(tǒng)是將數(shù)據(jù)分散存儲在多臺獨(dú)立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲系統(tǒng)采用集中的存儲服務(wù)器存放所有數(shù)據(jù),存儲服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點(diǎn),不能滿足大規(guī)模存儲應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔(dān)存儲負(fù)荷,利用位置服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。
首先:分布式存儲系統(tǒng)是將數(shù)據(jù)分散存儲在多臺獨(dú)立的設(shè)備上,這里的“多臺獨(dú)立的設(shè)備”,不要理解成為磁盤或者SSD,可以理解為x86通用服務(wù)器、Power服務(wù)器等,也可以理解為專門設(shè)計(jì)和優(yōu)化的專用存儲設(shè)備。
其中,以x86通用服務(wù)器最為普遍。為了幫助用戶理解分布式存儲,百易存儲研究院建議用“存儲節(jié)點(diǎn)”來代替“多臺獨(dú)立的設(shè)備”,這里的存儲節(jié)點(diǎn),可以是x86服務(wù)器(或者稱為存儲服務(wù)器、服務(wù)器存儲)、Power服務(wù)器,也可以是專用存儲設(shè)備,甚至使用傳統(tǒng)陣列,其中,最為普遍的還是x86通用服務(wù)器,其市場較為成熟,非常容易獲得,產(chǎn)品性價比非常具有競爭力。
其次,“傳統(tǒng)的網(wǎng)絡(luò)存儲系統(tǒng)采用集中的存儲服務(wù)器存放所有數(shù)據(jù),存儲服務(wù)器成為系統(tǒng)性能的瓶頸”的表述中,網(wǎng)絡(luò)存儲系統(tǒng)的表述多用于與直連存儲(DAS)的區(qū)分,主要突出其能夠通過網(wǎng)絡(luò)被多個應(yīng)用系統(tǒng)共享,網(wǎng)絡(luò)存儲系統(tǒng)又可以劃分為:存儲區(qū)域網(wǎng)絡(luò)(SAN)和網(wǎng)絡(luò)連接存儲(NAS),是SAN、NAS兩種存儲系統(tǒng)的統(tǒng)稱。
這里所說的“存儲服務(wù)器”主要指的是陣列控制器(也稱為機(jī)頭)+盤陣的設(shè)計(jì)方式,以往多采用專用集成電路芯片(ASIC)設(shè)計(jì)控制器,經(jīng)歷了雙控到多控的變化,控制器與控制器之間采用專用網(wǎng)絡(luò)連接,控制器與磁盤之間通過專用后端網(wǎng)絡(luò)連接,從而實(shí)現(xiàn)了連接的全冗余架構(gòu)設(shè)計(jì),具有非常高的可靠性和穩(wěn)定性。也因?yàn)槿绱?,系統(tǒng)成本居高不下。
在系統(tǒng)的擴(kuò)展性上,可以通過盤陣中盤的數(shù)量進(jìn)行調(diào)節(jié),系統(tǒng)具有一定的彈性,所謂Scale Up,也就是縱向擴(kuò)展,但受制于機(jī)頭的性能,整個系統(tǒng)仍然存在性能天花板,用戶只能夠借助入門級存儲、中端存儲、高端存儲的升級來解決問題。根據(jù)以上的判斷和理解,百易存儲研究院認(rèn)為用傳統(tǒng)存儲、傳統(tǒng)陣列或者傳統(tǒng)磁盤陣列的表述更為便于理解。
最后,“在分布式網(wǎng)絡(luò)存儲系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔(dān)存儲負(fù)荷,利用位置服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展”的表述中,分布式網(wǎng)絡(luò)存儲系統(tǒng)就是我們要說的分布式存儲;可擴(kuò)展的系統(tǒng)架構(gòu)更多是指可以通過增加或者刪減存儲節(jié)點(diǎn)所帶來的橫向擴(kuò)展(Scale Out)的架構(gòu),存儲系統(tǒng)的性能可以隨著節(jié)點(diǎn)的增加或者減少呈現(xiàn)動態(tài)變化的特征。這里提到的“位置服務(wù)器更好地理解應(yīng)該是分布式存儲中的全局統(tǒng)一命名空間的元數(shù)據(jù)管理的部分。
通過上述分析,百易存儲研究院認(rèn)為有關(guān)分布式存儲的定義應(yīng)該關(guān)注幾個重要的特征:一是橫向擴(kuò)展,二是通過網(wǎng)絡(luò)連接的存儲節(jié)點(diǎn),以及軟件統(tǒng)一調(diào)度管理全局統(tǒng)一命名空間的存儲資源池,這應(yīng)該符合分布式存儲的發(fā)展規(guī)律。僅僅強(qiáng)調(diào)軟件定義,或者x86通用服務(wù)器;強(qiáng)調(diào)云的彈性管理的特點(diǎn),都不能夠完全準(zhǔn)確的描述分布式存儲系統(tǒng),也很難取得市場的廣泛共識。根據(jù)以上的判斷和理解,百易存儲研究院認(rèn)為用傳統(tǒng)存儲、傳統(tǒng)陣列或者傳統(tǒng)磁盤陣列的表述更為便于理解。
傳統(tǒng)存儲按照功能可以分為SAN和NAS,分別用于塊數(shù)據(jù)、文件數(shù)據(jù)的存儲支持。隨著技術(shù)的不斷發(fā)展和用戶需求的變化,也出現(xiàn)了統(tǒng)一存儲和融合存儲的需求,在存儲系統(tǒng)的設(shè)計(jì)上,也出現(xiàn)了軟件、硬件分離的設(shè)計(jì)需求。
對于新分布式存儲系統(tǒng)而言,最初設(shè)計(jì)需求就是替代傳統(tǒng)SAN存儲,并用ServerSAN以示區(qū)分。但是相比于傳統(tǒng)存儲的全冗余連接設(shè)計(jì),分布式存儲系統(tǒng)中的存儲節(jié)點(diǎn)可靠性相對不高,為此,分布式存儲系統(tǒng)通過多副本、糾刪碼的方式來提升系統(tǒng)的可靠性,為了提升這個存儲系統(tǒng)的性能,分布式存儲系統(tǒng)需要存儲節(jié)點(diǎn)配備SSD,充分利用SSD高IO的特性。
與此同時,分布式存儲橫向擴(kuò)展的特性,非常適用于海量數(shù)據(jù)存儲,特別是非結(jié)構(gòu)化的文件系統(tǒng)。一個分布式存儲系統(tǒng)往往同時滿足塊、文件、對象、大數(shù)據(jù),以及CIFS、NFS等的數(shù)據(jù)訪問需求。因此,分布式存儲很難按照SAN、NAS、對象進(jìn)行分類。
對于分布式存儲系統(tǒng),根據(jù)是否對外提供應(yīng)用計(jì)算能力,區(qū)分為分布式存儲和超融合。對于超融合系統(tǒng)而言,最主要的技術(shù)突破就體現(xiàn)在存儲上,也因?yàn)槿绱耍艜殉诤霞{入到分布式存儲的分類中。
在超融合的產(chǎn)品形態(tài)上,最初是以一體機(jī)的形態(tài)呈現(xiàn),但隨著市場的發(fā)展,超融合也提供純存儲的形態(tài),支持將超融合一體機(jī)作為單一存儲系統(tǒng)的場景。
分布式存儲、超融合也是相互滲透、融合發(fā)展的,并沒有嚴(yán)格意義上的形態(tài)區(qū)分,這一點(diǎn)應(yīng)該引起大家的重視。