王恩東 張 東 亓開(kāi)元
1 高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室 濟(jì)南 250101
2 浪潮電子信息產(chǎn)業(yè)股份有限公司 濟(jì)南 250101
現(xiàn)階段,互聯(lián)網(wǎng)應(yīng)用的需求引領(lǐng)全球數(shù)據(jù)中心的發(fā)展趨勢(shì),中國(guó)的互聯(lián)網(wǎng)規(guī)模已經(jīng)十分巨大。例如,截至2014年底,我國(guó)智能終端數(shù)量達(dá)到25億部,上網(wǎng)用戶(hù)數(shù)量超過(guò)6億人。在這樣數(shù)量龐大的終端設(shè)備背后,必須要有更大的內(nèi)容服務(wù)商提供服務(wù)。例如,阿里巴巴在“雙十一”的交易額比香港一個(gè)月的零售總額還要多,微信的活躍用戶(hù)數(shù)量比美國(guó)總?cè)丝谶€多。這些龐大的互聯(lián)網(wǎng)服務(wù)更需要規(guī)模龐大的數(shù)據(jù)中心來(lái)支撐。
與此同時(shí),金融、電信等傳統(tǒng)行業(yè)的信息化需求也持續(xù)攀升。例如,2014年底中國(guó)銀聯(lián)卡量約為40億張,電信用戶(hù)超過(guò)10億,智能電表的數(shù)量是美國(guó)的三倍。然而,我國(guó)傳統(tǒng)行業(yè)雖然信息化需求旺盛,總量上占有優(yōu)勢(shì),但是人均信息消費(fèi)和主要發(fā)達(dá)國(guó)家相比還有很大的差距,未來(lái)我國(guó)信息產(chǎn)業(yè)市場(chǎng)的增長(zhǎng)空間仍然非常巨大[1]。
從技術(shù)角度來(lái)看,支撐互聯(lián)網(wǎng)和傳統(tǒng)行業(yè)應(yīng)用需求的物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)等新興技術(shù)進(jìn)一步推動(dòng)了數(shù)據(jù)中心向集中化、規(guī)模化發(fā)展,給數(shù)據(jù)中心帶來(lái)了擴(kuò)展、效率、能耗、安全等諸多問(wèn)題和挑戰(zhàn)。
首先是擴(kuò)展性,單臺(tái)設(shè)備的擴(kuò)展性受設(shè)備內(nèi)部CPU互連性能、I/O擴(kuò)展能力的制約,數(shù)據(jù)中心的擴(kuò)展性則受網(wǎng)絡(luò)性能的制約。目前的數(shù)據(jù)中心普遍采用分布式架構(gòu),設(shè)備間的互連網(wǎng)絡(luò)帶寬遠(yuǎn)低于主板內(nèi)和設(shè)備內(nèi)的互連帶寬,并且網(wǎng)絡(luò)協(xié)議復(fù)雜、層次眾多,協(xié)議的轉(zhuǎn)換和處理占用了大量系統(tǒng)資源,使得業(yè)務(wù)系統(tǒng)擴(kuò)展性受到嚴(yán)重限制。
第二,目前大多數(shù)數(shù)據(jù)中心的服務(wù)器利用率低于30%,通過(guò)虛擬化能夠?qū)崿F(xiàn)計(jì)算資源在不同業(yè)務(wù)間的動(dòng)態(tài)調(diào)度,從而使得設(shè)備的利用率提升到60%左右。然而,當(dāng)前的虛擬化技術(shù)在設(shè)備間的資源調(diào)度開(kāi)銷(xiāo)很大,虛擬化遷移的時(shí)間延遲為分鐘級(jí),因此,設(shè)備間資源的共享程度非常有限。此外,傳統(tǒng)架構(gòu)中服務(wù)器、存儲(chǔ)等設(shè)備是分離的,各自的資源處于隔離狀態(tài),資源共享僅限于同類(lèi)設(shè)備。
第三,能耗是數(shù)據(jù)中心越來(lái)越突出的問(wèn)題。目前,雖然有很多技術(shù)可以將數(shù)據(jù)中心的PUE(Power Usage Effect)從2.0降到1.5,但非IT能耗依然突出。此外,IT設(shè)備在業(yè)務(wù)處理方面的效率低下常常被忽略,在關(guān)注PUE的同時(shí)還要重視IT設(shè)備能耗到性能的轉(zhuǎn)化率。例如,在相同的圖形處理能力下,通用CPU比專(zhuān)業(yè)化GPU的功耗大3倍;因此,提升CPU針對(duì)大規(guī)模應(yīng)用的性能,或者發(fā)展面向應(yīng)用的專(zhuān)用或可重構(gòu)計(jì)算單元,具有廣闊的空間。
最后,隨著規(guī)模的發(fā)展和云服務(wù)的普及,云數(shù)據(jù)中心所面臨的安全問(wèn)題更加嚴(yán)峻。首先,木馬、病毒、系統(tǒng)后門(mén)等傳統(tǒng)攻擊手段無(wú)時(shí)無(wú)刻不在威脅著數(shù)據(jù)的安全。其次,由于云數(shù)據(jù)中心敏感數(shù)據(jù)、關(guān)鍵業(yè)務(wù)高度集中,一旦出現(xiàn)安全問(wèn)題則很可能是全局性或社會(huì)問(wèn)題,會(huì)產(chǎn)生比以往更加嚴(yán)重的后果。
通過(guò)上面的問(wèn)題可以看出,隨著規(guī)模的不斷擴(kuò)大,傳統(tǒng)數(shù)據(jù)中心那種將服務(wù)器、存儲(chǔ)設(shè)備進(jìn)行簡(jiǎn)單堆積,以交換機(jī)連接、再輔以虛擬化軟件進(jìn)行資源簡(jiǎn)單調(diào)度和管理的方式已經(jīng)無(wú)法滿(mǎn)足需求,必須進(jìn)行各個(gè)層面技術(shù)的創(chuàng)新和數(shù)據(jù)中心架構(gòu)的變革。本文將這種適應(yīng)未來(lái)需求的全新的數(shù)據(jù)中心架構(gòu)定義為融合架構(gòu)。
融合架構(gòu)數(shù)據(jù)中心(Smart Data Center)的設(shè)計(jì)思想是通過(guò)硬件解耦實(shí)現(xiàn)資源的物理池化和動(dòng)態(tài)重構(gòu),通過(guò)軟件定義實(shí)現(xiàn)業(yè)務(wù)感知的按需資源組合與配置,滿(mǎn)足系統(tǒng)的彈性伸縮和超大規(guī)模的持續(xù)擴(kuò)展。
融合架構(gòu)是綜合發(fā)展傳統(tǒng)建設(shè)方案和新興技術(shù)路線(xiàn)而形成的全新數(shù)據(jù)中心架構(gòu)設(shè)計(jì)理念。此前,由眾多企業(yè)級(jí)廠(chǎng)商提出的混合架構(gòu)(Converged Architecture)[2]更多地強(qiáng)調(diào)數(shù)據(jù)中心不同模塊之間的直接集成或簡(jiǎn)單軟硬一體化部署,而不是從業(yè)務(wù)的視角出發(fā),對(duì)數(shù)據(jù)中心的硬件架構(gòu)進(jìn)行重新設(shè)計(jì),以更好地發(fā)揮軟件功能。而SDDC、SDN等軟件定義[3]概念的興起,又導(dǎo)致數(shù)據(jù)中心建設(shè)過(guò)度關(guān)注軟件發(fā)展,整個(gè)產(chǎn)業(yè)存在軟硬失衡的潛在風(fēng)險(xiǎn),必須要重新審視硬件重構(gòu)的價(jià)值。事實(shí)上,單靠軟件無(wú)法定義一切,硬件重構(gòu)是軟件定義的基礎(chǔ)和保障。例如,在虛擬化技術(shù)發(fā)展的初期,英特爾在芯片上增加了VT-x、VT-d等針對(duì)性的指令設(shè)計(jì),以更好地發(fā)揮虛擬化的特性。同樣,由互聯(lián)網(wǎng)企業(yè)主導(dǎo)的單純意義上的硬件重構(gòu)[4],因其站在行業(yè)特有規(guī)模和自主性的立場(chǎng)上強(qiáng)調(diào)硬件的高密度部署,缺乏從業(yè)務(wù)到資源的適配層軟件設(shè)計(jì),也僅適用于特定的生態(tài)系統(tǒng)和應(yīng)用場(chǎng)景。
也就是說(shuō),只靠軟件定義沒(méi)有硬件重構(gòu),虛擬化效率不高;只有硬件重構(gòu)沒(méi)有軟件定義,系統(tǒng)缺乏靈活性,使用復(fù)雜度高。在融合架構(gòu)中,硬件重構(gòu)和軟件定義是缺一不可、相輔相成的辯證統(tǒng)一關(guān)系,在硬件層將計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備中的同類(lèi)資源整合為資源池,各類(lèi)資源能夠任意重組,在軟件層智能地感知業(yè)務(wù)的資源需求,利用硬件的重構(gòu)能力動(dòng)態(tài)地分配和組合資源。
融合架構(gòu)可以從硬件和軟件層面演進(jìn)、分三個(gè)階段逐步發(fā)展(如表1所示)。
表1 融合架構(gòu)數(shù)據(jù)中心發(fā)展路線(xiàn)
第一階段,在硬件上實(shí)現(xiàn)散熱、電源、管理等非IT資源的集中化和模塊化,并利用軟件虛擬化技術(shù)實(shí)現(xiàn)計(jì)算、存儲(chǔ)等IT資源的池化和集中管理。這個(gè)階段的硬件形態(tài)可以視為“服務(wù)器即計(jì)算機(jī)”(Server as a Computer)。
第二階段,進(jìn)一步將非計(jì)算部分的存儲(chǔ)、網(wǎng)絡(luò)等I/O設(shè)備進(jìn)行池化,機(jī)柜內(nèi)采用硅光電等技術(shù)進(jìn)行高速互連,并以軟件定義的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)來(lái)滿(mǎn)足業(yè)務(wù)需求。也就是硬件上將整機(jī)柜當(dāng)作一臺(tái)計(jì)算機(jī)(Rack as a Computer)[5],并實(shí)現(xiàn)完全的軟件定義。
第三階段是最終將CPU、內(nèi)存等所有的IT資源完全池化,可以根據(jù)應(yīng)用需求智能地分配和組合資源,實(shí)現(xiàn)完全意義上業(yè)務(wù)驅(qū)動(dòng)的軟件定義數(shù)據(jù)中心。也就是將整個(gè)數(shù)據(jù)中心當(dāng)作一臺(tái)計(jì)算機(jī)(Data Center as a Computer)[6],并通過(guò)軟件實(shí)現(xiàn)業(yè)務(wù)驅(qū)動(dòng)和應(yīng)用感知。
融合架構(gòu)的實(shí)現(xiàn)需要以下一系列技術(shù)的支撐。
1) 硅光電技術(shù)[7]的應(yīng)用將加速硬件解耦化,為硬件重構(gòu)奠定基礎(chǔ)。硅光電技術(shù)相對(duì)于目前用于主板間和節(jié)點(diǎn)間通信的光纖技術(shù)有著更高的通信速率、更低的功耗、更高的部署密度和傳輸可靠性,特別適合芯片間的高速長(zhǎng)距離互連,其應(yīng)用將加速推動(dòng)硬件資源的解耦化,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)中心硬件資源的物理池化。這種物理池化與目前基于虛擬化的資源邏輯池化是有區(qū)別的。虛擬化技術(shù)主要是采用依靠軟件實(shí)現(xiàn)的分時(shí)復(fù)用模式,因而不可避免地引入系統(tǒng)的資源開(kāi)銷(xiāo);因此,當(dāng)硬件資源具備物理的解耦能力之后,通過(guò)基于軟件定義的資源邊界配置與組織模式,將會(huì)在很大程度上提升數(shù)據(jù)中心的總體能效。
2) 可重構(gòu)計(jì)算技術(shù)[8]的發(fā)展使得硬件面向軟件優(yōu)化成為可能。隨著3D晶體管工藝的推廣應(yīng)用,處理芯片內(nèi)部的晶體管資源更加豐富,可編程FPGA器件的性能和容量也都大幅提升,使得面向特定應(yīng)用重構(gòu)計(jì)算單元硬件邏輯成為可能??芍貥?gòu)處理器既保持了處理器的通用性,又具備專(zhuān)用硬件邏輯的高效率以及邏輯可重構(gòu)帶來(lái)的靈活性,實(shí)際上就是一種更細(xì)粒度的軟件定義的資源重構(gòu),將對(duì)數(shù)據(jù)中心整體效率帶來(lái)較大提升。
3) 高性能非易失性存儲(chǔ)[9]的突破性進(jìn)展將簡(jiǎn)化存儲(chǔ)層次結(jié)構(gòu),大幅提升系統(tǒng)性能。隨著半導(dǎo)體工藝技術(shù)的進(jìn)步,近幾年非易失性存儲(chǔ)器在性能和容量密度方面已經(jīng)取得較大進(jìn)展,將對(duì)計(jì)算機(jī)系統(tǒng)傳統(tǒng)的存儲(chǔ)層次結(jié)構(gòu)產(chǎn)生革命性的影響。內(nèi)存與外存合二為一,存儲(chǔ)層次架構(gòu)更加扁平化。扁平化將帶來(lái)更低的數(shù)據(jù)訪(fǎng)問(wèn)延遲、更高的訪(fǎng)問(wèn)帶寬,以及更大容量的存儲(chǔ)空間,支撐效率更高的“內(nèi)存計(jì)算”模式[10]。
4) 人工智能應(yīng)用于軟件定義,將支撐面向應(yīng)用優(yōu)化的數(shù)據(jù)中心基礎(chǔ)設(shè)施智能重構(gòu)。在數(shù)據(jù)中心系統(tǒng)軟件技術(shù)方面,關(guān)注重點(diǎn)將由目前的資源虛擬化,逐步轉(zhuǎn)向關(guān)注業(yè)務(wù)感知的軟件定義能力。目前,最新的方向是在數(shù)據(jù)中心資源管理中引入機(jī)器學(xué)習(xí)技術(shù),特別是在模式識(shí)別、音/視頻處理等領(lǐng)域廣泛應(yīng)用的深層網(wǎng)絡(luò)技術(shù)[11],建立業(yè)務(wù)感知的資源重構(gòu)決策系統(tǒng),賦予硬件基礎(chǔ)設(shè)施理解上層應(yīng)用需求和識(shí)別資源使用行為特征的能力,最終實(shí)現(xiàn)硬件平臺(tái)的智能重構(gòu)。
在經(jīng)歷了系統(tǒng)孤立建設(shè)、設(shè)備集中化和虛擬化階段后,互聯(lián)網(wǎng)、行業(yè)應(yīng)用的快速增長(zhǎng)及動(dòng)態(tài)變化對(duì)數(shù)據(jù)中心的持續(xù)擴(kuò)展、資源管理和應(yīng)用支撐能力帶來(lái)更大的需求。針對(duì)上述需求,基于融合架構(gòu)的技術(shù)路線(xiàn),目前已經(jīng)形成完整的數(shù)據(jù)中心基礎(chǔ)設(shè)施布局和路線(xiàn)圖,通過(guò)利用融合架構(gòu)基礎(chǔ)設(shè)施建立面向區(qū)域性公共服務(wù)以及金融、能源、電信、交通等行業(yè)的云數(shù)據(jù)中心,提供支撐文化教育、醫(yī)療衛(wèi)生、質(zhì)量監(jiān)督、電子政務(wù)、城市管理、科研等領(lǐng)域的云計(jì)算服務(wù),進(jìn)一步促進(jìn)政府、行業(yè)數(shù)據(jù)平臺(tái)和搜索、電子商務(wù)、社交等互聯(lián)網(wǎng)平臺(tái)的資源整合和升級(jí),支撐以數(shù)據(jù)即時(shí)感知、智能處理、按需服務(wù)為典型特征的重點(diǎn)行業(yè)大數(shù)據(jù)應(yīng)用創(chuàng)新,提升各行業(yè)信息化水平,降低服務(wù)信息化成本,促進(jìn)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。融合架構(gòu)數(shù)據(jù)中心基礎(chǔ)設(shè)施路線(xiàn)圖,如圖1所示。
圖1 融合架構(gòu)數(shù)據(jù)中心基礎(chǔ)設(shè)施路線(xiàn)圖
第一代融合架構(gòu)的基礎(chǔ)設(shè)施包括整機(jī)柜服務(wù)器、關(guān)鍵應(yīng)用主機(jī)、海量存儲(chǔ)和云海OS,這些基礎(chǔ)設(shè)施都已經(jīng)完成研發(fā)并得到實(shí)際應(yīng)用,取得了優(yōu)異的社會(huì)效益和經(jīng)濟(jì)效益。
第二代融合架構(gòu)的基礎(chǔ)設(shè)施包括正在研發(fā)和即將發(fā)布的下一代關(guān)鍵應(yīng)用主機(jī)、智能模塊化數(shù)據(jù)中心(Smart Modular Center)和云海OS G2。
第三代融合架構(gòu)基礎(chǔ)設(shè)施是面向未來(lái)云數(shù)據(jù)中心預(yù)研和規(guī)劃的形態(tài),包括基于融合架構(gòu)的數(shù)據(jù)中心(Smart Data Center)和云海OS G3。
下面來(lái)分別介紹這三代融合架構(gòu)數(shù)據(jù)中心的代表性基礎(chǔ)設(shè)施。
整機(jī)柜服務(wù)器SmartRack是第一代融合架構(gòu)基礎(chǔ)設(shè)施的典型代表。與傳統(tǒng)的服務(wù)器不同,通過(guò)計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)的模塊化以及散熱、供電、管理的集中化,SmartRack實(shí)現(xiàn)了硬件聚合并支持整機(jī)柜資源的統(tǒng)一管理和業(yè)務(wù)的自動(dòng)部署。在此基礎(chǔ)上,利用云海OS提供的資源虛擬化功能,SmartRack還具備軟件定義特征,將整機(jī)柜資源整合成計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)的資源池,對(duì)資源池進(jìn)行統(tǒng)一管理、動(dòng)態(tài)調(diào)度和靈活分配。
基于融合架構(gòu),還可以面向不同的業(yè)務(wù)場(chǎng)景進(jìn)行整機(jī)柜服務(wù)器的定制化設(shè)計(jì)。例如,面向深度學(xué)習(xí)、人工智能應(yīng)用的協(xié)調(diào)處理加速整機(jī)柜服務(wù)器;面向自然風(fēng)冷數(shù)據(jù)中心的高溫耐腐蝕整機(jī)柜服務(wù)器;面向大數(shù)據(jù)存儲(chǔ)、社交網(wǎng)站的冷存儲(chǔ)整機(jī)柜服務(wù)器;面向云計(jì)算、虛擬化應(yīng)用的高密度計(jì)算整機(jī)柜服務(wù)器;面向熱數(shù)據(jù)處理、搭載SSD硬盤(pán)的高性能存儲(chǔ)整機(jī)柜服務(wù)器。
目前,SmartRack在國(guó)內(nèi)市場(chǎng)占有率超過(guò)60%,與傳統(tǒng)服務(wù)器相比,其部署密度提高13.8%,功耗降低12%,總體擁有成本(Total Cost of Ownership,TCO)降低15%。以百度陽(yáng)泉數(shù)據(jù)中心為例,其一天就能完成4 500個(gè)節(jié)點(diǎn)的部署,部署效率是傳統(tǒng)服務(wù)器的10倍,創(chuàng)造了國(guó)內(nèi)服務(wù)器部署實(shí)施速度紀(jì)錄,更好地滿(mǎn)足了用戶(hù)業(yè)務(wù)的爆發(fā)式增長(zhǎng)。
當(dāng)前中國(guó)的銀行、電信等行業(yè)業(yè)務(wù)規(guī)模已經(jīng)是全球最大,其核心業(yè)務(wù)對(duì)關(guān)鍵應(yīng)用主機(jī)的要求也越來(lái)越高。K1是中國(guó)唯一自主研發(fā)的關(guān)鍵應(yīng)用主機(jī),打破了外國(guó)品牌在該領(lǐng)域的壟斷局面。通過(guò)采用全模塊化冗余設(shè)計(jì),基于物理分區(qū)、進(jìn)程冗余等多層次高可用技術(shù),K1可靠性達(dá)到99.9994%。同時(shí),為增強(qiáng)事務(wù)處理能力,K1最大支持32顆CPU、256個(gè)計(jì)算核心、8TB內(nèi)存。此外,通過(guò)建立國(guó)產(chǎn)主機(jī)系統(tǒng)產(chǎn)業(yè)聯(lián)盟,并全面支持DB2、Sybase、WebSphere等國(guó)際主流基礎(chǔ)軟件,形成完善的關(guān)鍵應(yīng)用主機(jī)生態(tài)環(huán)境。
K1已經(jīng)在政府、金融、能源等12大關(guān)鍵行業(yè)實(shí)現(xiàn)覆蓋。據(jù)IDC統(tǒng)計(jì),K1在2014年下半年首次進(jìn)入國(guó)內(nèi)高端UNIX服務(wù)器市場(chǎng)前三,占有率達(dá)到14%。以K1承載的中國(guó)建設(shè)銀行省級(jí)核心業(yè)務(wù)系統(tǒng)為例,該系統(tǒng)覆蓋數(shù)十個(gè)二級(jí)分行、數(shù)百個(gè)營(yíng)業(yè)網(wǎng)點(diǎn)、數(shù)千個(gè)柜員、數(shù)萬(wàn)臺(tái)終端,業(yè)務(wù)并發(fā)峰值每秒數(shù)千筆。相比之前的進(jìn)口設(shè)備,系統(tǒng)性能提升4倍,價(jià)格降低38%,TCO降低43%。截至目前,K1已經(jīng)穩(wěn)定運(yùn)行1 500余天,未出現(xiàn)任何計(jì)劃外停機(jī)。
針對(duì)當(dāng)前云數(shù)據(jù)中心面臨的安全威脅,融合架構(gòu)基于安全可信的主動(dòng)防御體系構(gòu)建完整的數(shù)據(jù)中心安全解決方案。該解決方案以可信服務(wù)器為根基,以操作系統(tǒng)安全加固軟件為支撐,采用自主可控的商用密碼算法,支持中國(guó)和國(guó)際可信計(jì)算體系,建立從服務(wù)器、虛擬化軟件、操作系統(tǒng)到應(yīng)用程序的軟硬件一體化信任鏈,保護(hù)服務(wù)器免遭針對(duì)BIOS、PCI卡、硬盤(pán)等固件的惡意代碼攻擊。
為驗(yàn)證云數(shù)據(jù)中心安全解決方案的有效性,通過(guò)“云數(shù)據(jù)中心滲透測(cè)試”模擬用戶(hù)真實(shí)環(huán)境,在網(wǎng)絡(luò)層、應(yīng)用層和系統(tǒng)層及時(shí)有效地發(fā)現(xiàn)并阻斷攻擊8萬(wàn)余次,驗(yàn)證了云數(shù)據(jù)中心安全解決方案在面臨各類(lèi)攻擊時(shí)的魯棒性和抗攻擊性。
第二代融合架構(gòu)最有代表性的是智能模塊化數(shù)據(jù)中心。傳統(tǒng)服務(wù)器架構(gòu)中,I/O是和CPU、內(nèi)存等資源緊耦合在一起的。在智能模塊化數(shù)據(jù)中心中,為實(shí)現(xiàn)I/O資源的集中和池化,計(jì)算和I/O模塊之間通過(guò)硅光電建立高速通道?;诠韫怆娂夹g(shù),單元模塊可提供400Gb/s的互連帶寬,與傳統(tǒng)的雙萬(wàn)兆互連相比提升了20倍,從而使I/O資源的池化成為可能。同時(shí),通過(guò)采用分布式交換架構(gòu),可以通過(guò)軟件定義實(shí)現(xiàn)靈活的網(wǎng)絡(luò)拓?fù)鋭澐?,快速?dòng)態(tài)地調(diào)整計(jì)算和I/O模塊之間的搭配,實(shí)現(xiàn)兩者之間的動(dòng)態(tài)組合,有效提升整個(gè)系統(tǒng)的擴(kuò)展性和靈活性,保證硬件重構(gòu)的實(shí)現(xiàn)。
借助I/O資源的動(dòng)態(tài)重構(gòu)能力,Smart Modular Center通過(guò)云海OS G2能夠?qū)崿F(xiàn)更靈活高效的軟件定義網(wǎng)絡(luò)和存儲(chǔ)?,F(xiàn)在一般意義上的軟件定義網(wǎng)絡(luò),實(shí)際上是在三層網(wǎng)絡(luò)上通過(guò)Overlay方式實(shí)現(xiàn)二層交換。在Smart Modular Center中,虛擬交換機(jī)的功能可以通過(guò)分布式交換網(wǎng)絡(luò)的網(wǎng)卡硬件實(shí)現(xiàn),按需構(gòu)建拓?fù)洹澐講Lan、定義QoS,為上層應(yīng)用提供高效可靠、安全隔離的網(wǎng)絡(luò)環(huán)境。同理,通過(guò)將存儲(chǔ)資源更靈活地分配各個(gè)計(jì)算節(jié)點(diǎn),支持NAS和SAN等多種訪(fǎng)問(wèn)接口,實(shí)現(xiàn)按照業(yè)務(wù)需求提供存儲(chǔ)資源。軟件定義網(wǎng)絡(luò)和存儲(chǔ),連同第一代中實(shí)現(xiàn)的軟件定義計(jì)算,就形成了完整的軟件定義數(shù)據(jù)中心。
通過(guò)硬件重構(gòu)和軟件定義,智能模塊化數(shù)據(jù)中心能夠更加靈活地調(diào)度資源滿(mǎn)足業(yè)務(wù)需要。例如,動(dòng)態(tài)重構(gòu)CPU、GPU資源滿(mǎn)足高性能應(yīng)用對(duì)計(jì)算能力的需要,重構(gòu)CPU和存儲(chǔ)資源形成存儲(chǔ)服務(wù)器集群,滿(mǎn)足大數(shù)據(jù)應(yīng)用對(duì)計(jì)算和存儲(chǔ)能力的需要。與傳統(tǒng)的“服務(wù)器+虛擬化”的技術(shù)相比,由于計(jì)算和存儲(chǔ)設(shè)備之間的界限被打破,系統(tǒng)效率和靈活性都有很大提升。
此外,為更好地支持內(nèi)存計(jì)算,Smart Modular Center提供64TB DRAM與384TB NVM的異構(gòu)混合內(nèi)存,輔以模塊間400Gb/s的高速互連,基本上可以滿(mǎn)足95%以上內(nèi)存計(jì)算系統(tǒng)的需求。
與前兩代相比,第三代融合架構(gòu)在硬件重構(gòu)和軟件定義上更進(jìn)一步。在I/O集中化的基礎(chǔ)上,進(jìn)一步解耦CPU和內(nèi)存形成集中的資源池,再輔以軟件定義的能力,可以將數(shù)千顆CPU、PB級(jí)內(nèi)存的計(jì)算機(jī)通過(guò)虛擬化軟件形成任意粒度大小的資源容器,其他低功耗器件、加速器件、I/O資源同樣可以池化和任意分配,形成各種規(guī)模和配置的計(jì)算機(jī)。同時(shí),配合應(yīng)用感知的資源分配技術(shù),將使數(shù)據(jù)中心的資源調(diào)度完全智能化、高效化。
第三代融合架構(gòu)基礎(chǔ)設(shè)施Smart Data Center將硬件資源清晰地組織成不同的功能區(qū),功能區(qū)在軟件定義的控制下形成不同的資源池來(lái)支撐云平臺(tái)和云應(yīng)用,如圖2所示。通過(guò)智能感知上層業(yè)務(wù)的類(lèi)型,數(shù)據(jù)中心自動(dòng)重構(gòu)適合的資源來(lái)為業(yè)務(wù)構(gòu)建最佳的運(yùn)行環(huán)境,讓?xiě)?yīng)用軟件與運(yùn)行環(huán)境之間的契合程度達(dá)到一個(gè)前所未有的水平。
圖2 第三代融合架構(gòu)數(shù)據(jù)中心
基于“兩個(gè)層面、三個(gè)階段”發(fā)展路線(xiàn)的融合架構(gòu)云數(shù)據(jù)中心基礎(chǔ)設(shè)施研發(fā)和應(yīng)用實(shí)踐表明,通過(guò)高效的內(nèi)部互連,數(shù)據(jù)中心可以實(shí)現(xiàn)硬件層面的重構(gòu)和虛擬化,效率可以比現(xiàn)在的軟件虛擬化提升一到兩個(gè)數(shù)量級(jí),從而使資源利用更加平衡,可擴(kuò)展性更強(qiáng);通過(guò)軟件定義計(jì)算、存儲(chǔ)和網(wǎng)絡(luò),數(shù)據(jù)中心能夠更加靈活地滿(mǎn)足不同業(yè)務(wù)的多樣性需求;通過(guò)使用各種新型器件,數(shù)據(jù)中心可以提高資源利用率、節(jié)約成本和降低能耗。融合架構(gòu)將促進(jìn)數(shù)據(jù)中心由資源驅(qū)動(dòng)型向業(yè)務(wù)驅(qū)動(dòng)型轉(zhuǎn)變,真正意義上實(shí)現(xiàn)開(kāi)放融合、安全高效、智能綠色和靈動(dòng)成長(zhǎng)。
參考文獻(xiàn)
[1]賽迪顧問(wèn).2013~2014年中國(guó)信息消費(fèi)市場(chǎng)研究年度報(bào)告[R].2014
[2]James Staten,Cristopher Voce,Galen Schreck,et al.Are Converged Infrastructures Good For IT?[R].2010
[3]趙小凡.對(duì)“軟件定義一切”的思考和理解[J].軟件和信息服務(wù),2014(1):16
[4]張廣彬,盤(pán)駿,曾智強(qiáng).數(shù)據(jù)中心2013:硬件重構(gòu)與軟件定義[R].2014
[5]張東,亓開(kāi)元,吳楠,等.云海大數(shù)據(jù)一體機(jī)體系結(jié)構(gòu)和關(guān)鍵技術(shù)[C]// 第二屆CCF大數(shù)據(jù)學(xué)術(shù)會(huì)議,2014
[6]Barroso L A ,H?lzle U.The datacenter as a computer: An introduction to the design of warehouse-scale machines[J].Synthesis lectures on computer architecture,2009,4(1): 1-108
[7]De Dobbelaere P. Silicon photonics technology platform for embedded and integrated optical interconnect systems[C]//The 18th Asia and South Pacific Design Automation Conference,2013:644-647
[8]Bobda C.Introduction to Reconfigurable Computing:Architectures[M].Springer,2007
[9]Ugo Russo,Andrea Redaelli,Roberto Bez.Non-Volatile Memory Technology Overview[C]// Workshop on Technology Architecture Inter-action.Saint-Malo,France,2010
[10]Zaharia M,Chowdhury N M,Franklin M,et al.Spark:Cluster competing with working sets[C]//The 2nd USENIX conference on Hot topics in cloud computing.Boston,MA,USA,2010:1-10
[11]Quoc V Le,Marc Aurelio Ranzato,Rajat Monga,et al.Building High-level Features Using Large Scale Unsupervised Learning[C]//The 29th International Conference on Machine Learning. Edinburgh,Scotland, UK,2012