陳鳴飛,張學斌,羅海亮,孫麗玫,康科武
(中國移動通信集團設計院有限公司,北京100080)
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)分析、人工智能、云計算等信息技術的快速發(fā)展,以及傳統(tǒng)產業(yè)的數(shù)字化轉型,數(shù)據(jù)量呈現(xiàn)幾何級增長,全球數(shù)據(jù)總量預計將從2016 年的16.1ZB 增長到2025 年的163ZB(約合1.80×1014GB),10 年時間10 倍的增長,復合增長率為26%。作為新基建之一的數(shù)據(jù)中心建設項目,其概念不斷外延,相對于以前單指互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC),目前的數(shù)據(jù)中心以數(shù)據(jù)為基本管理對象,融合IDC、云計算、區(qū)塊鏈、人工智能等新技術于一身,成為集數(shù)據(jù)、算力、算法三大要素于一體的數(shù)據(jù)基礎設施。隨著云計算和大數(shù)據(jù)等技術的落地,IDC的發(fā)展由普通服務器機房向以數(shù)據(jù)管理為基本管理對象,集IDC、云計算、區(qū)塊鏈、人工智能等新技術的大型、超大型數(shù)據(jù)中心演進。大型、超大型數(shù)據(jù)中心對其基礎設施的可靠性也提出了越來越高的要求,高可靠性意味著將給數(shù)據(jù)中心擁有者帶來更多的商業(yè)機會。但如何全面、準確地評估一個數(shù)據(jù)中心基礎設施的可靠性和可用性一直是業(yè)內面臨的重大難題。本文利用多屬性決策中的AHP 法構建一套適用于數(shù)據(jù)中心基礎設施可靠性和可用性全面評價的認證體系。
目前,國內外已有多個協(xié)會、認證機構及企業(yè)對數(shù)據(jù)中心等級進行定義和劃分,詳見表1。其中,國外以Uptime Institute的Data Center Site Infrastructure Tier Standard[1]和美國電信產業(yè)協(xié)會TIA-942-A—2014《數(shù)據(jù)中心的電信基礎設施標準》[2]為主流的劃分依據(jù)。國內的數(shù)據(jù)中心等級劃分主要依據(jù)GB 50174—2017《數(shù)據(jù)中心設計規(guī)范》和GB/T 2887—2011《計算機場地通用規(guī)范》。同時,國內3 大運營商在其企業(yè)標準中根據(jù)自身的需求也提出了不同的分級模式。上述分級中,除了Uptime Institute 機構提出的分級用于數(shù)據(jù)中心基礎設施認證外,其他機構或標準的分級大多數(shù)從設計或者建設角度制定。
國外較為流行的認證等級由Uptime Institute 制定,國內則更多地采用國GB 50174—2017《數(shù)據(jù)中心設計規(guī)范》的等級作為目標認證等級[3]。而國內運營商在結合客戶需求的情況下制定了各自數(shù)據(jù)中心建設分級的企業(yè)標準,并以此作為內部認證評價的等級依據(jù)(見表1)。因此,對于數(shù)據(jù)中心場地基礎設施的認證而言,實施者首先需要明確認證對象所采用的目標認證等級。
表1 國內外數(shù)據(jù)中心等級的定義(或劃分)
GB/T 2900.13—2008《電工術語 可信性與服務質量》[6]規(guī)定,可靠性被定義為:產品在給定的條件下和給定的時間區(qū)間內完成規(guī)定功能的能力,在有些應用中對于可靠性采用適合的度量予以定量化并用概率表示,這一概率被稱為可靠度。因此,可靠性也被理解為是產品或系統(tǒng)在特定的時間和條件下無故障地執(zhí)行指定功能的能力或可能性。相應地,可用性則被定義為:在所要求的外部資源得到提供的情況下,產品或系統(tǒng)在給定的條件下,在給定的時刻或實際區(qū)間內處于能完成要求的功能狀態(tài)的能力。因此,可用性可被理解為,在某個考察時間,系統(tǒng)能夠正常運行的概率或時間占有率期望值,是產品或系統(tǒng)的可靠性、可維護性和維護支持性的綜合特性。
數(shù)據(jù)中心基礎設施認證是針對數(shù)據(jù)中心基礎設施可靠性和可用性的綜合評定,顯然認證指標體系應涵蓋所有與認證目標匹配的認證項和指標項。認證項可按現(xiàn)有國標、行標等標準對于數(shù)據(jù)中心技術要求歸類的維度進行定義和劃分,如可分為選址、給水排水、通信管網(wǎng)要求、環(huán)境要求、電子信息設備供電電源質量要求、建筑與結構、布線要求、空氣調節(jié)、電氣技術、智能化系統(tǒng)、消防等認證項目。每一個認證項目將包含數(shù)個或數(shù)十個與認證項直接相關的指標項。數(shù)據(jù)中心基礎設施的可靠性與可用性的保障情況依據(jù)不同的指標項有所區(qū)別。基于此,本文建立了認證項-指標項二層次的認證指標體系,并對于認證項中的指標進一步分為主控指標項和非主控指標項,見圖1。其中,主控項指標體系依據(jù)現(xiàn)有技術法規(guī)以及分散在國標、行標、地標里的強制性條款建立,屬于不可偏離項,即某一主控指標無法達到,意味著該數(shù)據(jù)中心基礎設施可靠性無法達到相應的認證等級要求。非主控指標體系依據(jù)現(xiàn)有國標、行標等推薦性條款和行業(yè)慣例做法等建立,屬于可偏離項,即部分非主控項偏離不影響該數(shù)據(jù)中心基礎設施的可靠性,但將在一定程度上影響其實用性。
圖1 數(shù)據(jù)中心基礎設施認證指標體系架構圖
在對特定認證等級的數(shù)據(jù)中心基礎設施認證中,所有主控指標不可偏離,需100%滿足。對于非主控指標,屬于可偏離項,適宜采用評分式認證。不同的非主控指標,對認證目標的影響存在不同程度的差異,因此,權重賦值也會不同。本文利用多屬性決策中的AHP 法(層次分析法),對非主控項目指標的評價體系進行理論構建。
AHP 法是美國運籌學家T.L.Saaty 教授提出的一種多方案或多目標定性與定量相結合的決策分析方法[7,8],層次模型見圖2。
圖2 AHP法層次模型
AHP 法的一般步驟依次為:建立層次結構模型、構造成對比較矩陣、一致性檢驗。結合非主控項的指標評價體系,建立本非主控項指標評價體系的層次結構模型見圖3。
圖3 結構層次模型
然后,通過數(shù)據(jù)中心基礎設施業(yè)內權威咨詢設計專家組成的論證會,兩兩比較確定標度的方式(見表2)可分別建立數(shù)據(jù)中心基礎設施認證項準則層的比較矩陣(見圖4)和評價指標層的比較矩陣(見圖5),其中指標層以“選址”認證項為例,具體包含評價指標C1、C2、……。
圖4 認證項準則層比較矩陣
圖5 指標項方案層比較矩陣
表2 層次分析法兩兩對比標度
通過計算,可分別得到認證項的特征值向量[見式(1)]和指標項的特征向量[見式(2)]:
式中,α、β、θ 為標準層權重;γ1、γ2為指標層權重。經(jīng)一致性驗證后,方可建立非主控項指標量化分值表,詳見表3。其中最后一列分值即為每一項評價指標的賦值。
表3 非主控項指標量化分值表
對于主控項指標而言,因其為不可偏離項,故要求必須100%滿足。因此,在具體實施的時候,采用先主控項檢查,待主控項檢查全部通過以后,再進入非主控項的評價,實施流程詳見圖6。基于上述理念,可以進一步建立主控項和非主控項目檢查評價表,見表4 和表5。
圖4 數(shù)據(jù)中心基礎設施認證實施流程示意
表4 主控項指標檢查表
表5 非主控項指標檢查表
對于非主控項指標而言,因其作為可偏離項,但偏離度不能過大,否則就失去了評價初衷,因此,對于非主控項指標的最大偏離度應該予以控制。評價實踐中,可通過實際調研和專家問卷等方式建立非主控項的最大偏離度,即應達到的最低評價分值,見表6。
表6 非主控項認證評價最低分值表
基于AHP 法通過兩兩比較確定標度的方式分別建立數(shù)據(jù)中心基礎設施認證項準則層的比較矩陣。本文征詢業(yè)內3 位知名專家對于準則層的指標在認證中的重要性進行兩兩比對,從而計算得到如表7 的準則層指標權重系數(shù)。
表7 準則層指標權重圖
在此基礎上,本文選用GB 50174—2017《數(shù)據(jù)中心設計規(guī)范》A 級數(shù)據(jù)中心評價指標作為示例,量化計算得到國標A級非主控項評價指標分值,見表8。
表8 國標A級非主控項指標分值
續(xù)表
本文提出了由主控項和非主控項相結合的數(shù)據(jù)中心基礎設施認證指標體系,在此基礎上利用AHP 法構建了一套適用于上述認證指標體系的綜合認證評價方法,并對GB 50174—2017《數(shù)據(jù)中心設計規(guī)范》中的A 級指標項進行了量化計算。運用本文的研究成果,可構建不同數(shù)據(jù)中心等級標準中的指標體系,為數(shù)據(jù)中心基礎設施的認證工作提供一套較為通用、科學、合理的評價方法。