王宏亮
對數(shù)據(jù)中心網(wǎng)絡來說,高可靠性是一項基本需求,路由交換設備中的所有功能特性都是建立于可靠性基礎之上的。一個缺乏高可靠性設計的網(wǎng)絡系統(tǒng),輕則使得維護工作量增加,重則帶來巨大的經(jīng)濟損失和政治影響。那么面對數(shù)據(jù)量飛漲和服務質(zhì)量要求不斷提升的現(xiàn)狀,數(shù)據(jù)中心級的網(wǎng)絡設備究竟應該具備怎樣的高可靠性?
要弄清楚網(wǎng)絡設備應該具備怎樣的高可靠性,我們首先要明確網(wǎng)絡的可靠性應該如何衡量。一個令人放心的網(wǎng)絡首先不能頻繁出現(xiàn)故障,IP承載網(wǎng)即使只出現(xiàn)很短時間的中斷,都會影響業(yè)務運營,特別是實時性強、對丟包和時延敏感的業(yè)務。我們一般用平均無故障時間和平均修復時間這兩個指標來考量網(wǎng)絡的可靠性。對于高性能網(wǎng)絡來說,一方面我們要提高網(wǎng)絡設備硬件和軟件本身的質(zhì)量;另一方面,我們要以最快的速度發(fā)現(xiàn)故障,并將系統(tǒng)快速從故障狀態(tài)中恢復出來,從而實現(xiàn)網(wǎng)絡高可靠性。
明確了網(wǎng)絡可靠性衡量標準,那么具體到網(wǎng)絡設備而言,究竟要朝哪些方向努力,才能得到更高的可靠性衡量值呢?通過多年的經(jīng)驗積累,H3C公司認為,在產(chǎn)品的開發(fā)和生產(chǎn)過程中,提高網(wǎng)絡設備的高可靠性,主要需要圍繞著以下四個方面來展開。首先是網(wǎng)絡架構的高可靠性,一個普通的二、三層網(wǎng)絡和一個虛擬化網(wǎng)絡架構相比,其整體的可靠性、可用性是有天壤之別的;其次是設備本身的高可靠性,主要是指網(wǎng)絡設備在系統(tǒng)設計和硬件架構上具備整體的高可靠能力;第三是設備所應用的軟件系統(tǒng)的可靠性;最后則是軟件維護的高可靠性,主要是指設備在軟件修復或者版本升級過程中,不會影響到設備的正常運行。
前文我們從理論上討論了提高網(wǎng)絡設備可靠性的方法,而最能證明這些理論的,就是高端網(wǎng)絡設備的實際表現(xiàn)。我們可以以主要針對數(shù)據(jù)中心核心應用的交換設備S12500為例,來實際感受一下網(wǎng)絡的可靠性可以達到何種程度。在不久前基于思博倫平臺所進行的性能測試中,S12500在二層單播、三層IPv4單播、三層IPv6單播、三層MPLS轉(zhuǎn)發(fā)等多種情況下,均實現(xiàn)了100%吞吐量和零丟包。這樣的測試成績可以保證設備在未來的數(shù)據(jù)中心網(wǎng)絡中放心應用。我們知道,在數(shù)據(jù)中心等核心網(wǎng)絡應用中,網(wǎng)絡設備面臨的數(shù)據(jù)壓力非常之大,在這種工作狀態(tài)下設備是否能夠“頂住壓力”,將是維持網(wǎng)絡正常狀態(tài)的關鍵因素。
由于許多行業(yè)的數(shù)據(jù)中心提供的都是1年365天每天24小時的不間斷服務,因此應該盡量消除設備與服務的臨時中斷,而對于網(wǎng)絡設備的可靠性也必然有著更高要求,目前業(yè)內(nèi)高端的網(wǎng)絡產(chǎn)品設計也都是瞄準了這一目標來完成的。
高可靠性并不僅僅是一個概念,它能夠給用戶帶來實實在在的商業(yè)價值。對于用戶來說,網(wǎng)絡的穩(wěn)定可用可以節(jié)省維護費用,提高企業(yè)的工作效率,節(jié)省企業(yè)的生產(chǎn)成本,增強企業(yè)競爭力,對用戶在快速變化的環(huán)境中取得成功來說都非常關鍵。在10G至100G網(wǎng)絡正逐漸成為核心網(wǎng)絡主流配置的趨勢下,進一步提升網(wǎng)絡的可靠性已是刻不容緩之事。相信在包括H3C在內(nèi)網(wǎng)絡設備商共同努力之下,網(wǎng)絡的可靠性也將“水漲船高”,邁入一個新的層次。