周福斌,吳 澤,張 鑫
(中國人民解放軍66389部隊,河南 鄭州 450000)
數(shù)據(jù)中心具有可靠性高、可用性好、資源利用高效以及運維管理便捷等優(yōu)勢,大大提升了信息服務(wù)質(zhì)量效益,為人們應(yīng)用人工智能、大數(shù)據(jù)、區(qū)塊鏈以及物聯(lián)網(wǎng)等新興技術(shù)奠定了堅實的基礎(chǔ)。數(shù)據(jù)中心高速發(fā)展的同時,其能耗不斷增加。根據(jù)國家能源局調(diào)查數(shù)據(jù),2020年我國數(shù)據(jù)中心耗電量突破2 000億kW·h,創(chuàng)歷史新高,能耗占全國總用電量的2.7%。據(jù)專家估計,2025年我國數(shù)據(jù)中心耗電量將超過3 800億kW·h,將占全國總用電量的4.05%?;诖?,降低數(shù)據(jù)中心能耗,建設(shè)和改造綠色數(shù)據(jù)中心勢在必行[1,2]。
根據(jù)美國采暖制冷與空調(diào)工程師學會技術(shù)委員會的統(tǒng)計報告,數(shù)據(jù)中心各部分用電量主要集中在服務(wù)器、空調(diào)制冷、不間斷電源(Uninterruptible Power System,UPS)損耗、照明以及其他方面,占比分別達到46%、31%、8%、4%以及11%。
UPS作為數(shù)據(jù)中心機房的電源動力,發(fā)揮著至關(guān)重要的作用,工作時,整流器和逆變器都會產(chǎn)生功率損耗,從而造成一定的能源消耗。UPS的功率損耗和UPS效率有直接關(guān)系,UPS負載率與效率曲線如圖1所示。
圖1 UPS負載與效率曲線
由圖1可知,UPS的效率與負載率成正比關(guān)系,負載率越低,則效率越低,同時損耗就越高[3]。中小型數(shù)據(jù)中心普遍采用N+1臺UPS所組成的冗余供電系統(tǒng)來向IT設(shè)備供電,所有UPS處于并機運行狀態(tài)。從實際應(yīng)用情況看,普遍存在UPS負載率較低、UPS損耗較大的問題。例如,機房4臺負載容量為500 kV·A、12脈沖UPS并機運行,當實際容量只有500 kV·A時,此時4臺UPS并機工作時每臺UPS的負載率為25%,查詢負載效率曲線可知此時UPS的效率僅為85%,其余15%的電都變成了損耗。
數(shù)據(jù)中心冷卻系統(tǒng)是能源消耗的大戶,服務(wù)器、存儲、路由交換等IT設(shè)備運行會產(chǎn)生大量的熱量,如果冷卻系統(tǒng)發(fā)生故障且15 min內(nèi)得不到有效的解決,將面臨大量服務(wù)器宕機甚至燒毀的危險。數(shù)據(jù)中心冷卻一般分為水冷和風冷兩種方式,其中風冷系統(tǒng)因系統(tǒng)簡單、可靠性高以及投資低等優(yōu)點受到中小型數(shù)據(jù)中心的青睞,但普遍存在兩個問題,即降溫效率低和智能化程度偏低。大多數(shù)送風機房中,空調(diào)送風和服務(wù)器排風扇形成的氣流是垂直關(guān)系,難以保證空調(diào)送出的冷量有效進入服務(wù)器機柜,造成氣流組織不合理、降溫效率低且能源利用率不高[4]??諝庠谡麄€機房的大空間內(nèi)循環(huán),對不同發(fā)熱量的機柜和設(shè)備統(tǒng)一冷卻時,冷量分配不夠科學,智能化程度不高,尤其對新增的高密度機柜的冷卻效果不佳,導致局部機柜過熱,設(shè)備運行溫度較高,能耗增加。
IT設(shè)備能耗高主要表現(xiàn)在3個方面,具體如下。
(1)設(shè)備老舊導致能耗高。大部分老舊中小數(shù)據(jù)中心已經(jīng)運行近10年,當時采購安裝的計算設(shè)備、存儲設(shè)備以及網(wǎng)絡(luò)設(shè)備在設(shè)計生產(chǎn)過程中未考慮節(jié)能的問題,部分老舊設(shè)備在性能相同的情況下能耗要高出3~5倍。隨著節(jié)能理念的提出和人們對節(jié)能問題的普遍認知,計算設(shè)備、存儲設(shè)備以及網(wǎng)絡(luò)設(shè)備等的高能耗問題逐漸凸顯出來。
(2)設(shè)備資源利用率低導致能耗高。部分中小數(shù)據(jù)中心運維管理過程中存在各部門自管軟硬件的情況,臨時部署設(shè)備和系統(tǒng)、1臺服務(wù)器承載1套系統(tǒng)的情況普遍存在,有的設(shè)備長期CPU利用率只有20%左右,部分數(shù)據(jù)中心存在資源閑置情況,同時部分服務(wù)器只是周期性運行一些應(yīng)用,其余大部分時間處于閑置狀態(tài),且24 h不間斷運轉(zhuǎn),在資源利用效率低的同時,造成能耗居高不下。
(3)技術(shù)體制落后。中小數(shù)據(jù)中心普遍缺少虛擬化、云計算技術(shù)的應(yīng)用,沒有對設(shè)備運行負載情況和資源利用情況進行有效監(jiān)控,缺少按照時間、資源利用情況的靈活資源整合調(diào)配和設(shè)備按需休眠等節(jié)能策略,使得能效較低,能耗相對較高。
除以上因素之外,還有一些因素也會對數(shù)據(jù)中心能耗造成一定影響。
(1)照明能耗較大。部分中小型數(shù)據(jù)中心采用傳統(tǒng)的燈具照明和控制方式,燈具本身功率較高、能耗較大,同時傳統(tǒng)的手動控制方式無法達到人走燈滅的節(jié)能效果,導致照明能耗偏高。
(2)運維人員缺乏節(jié)能理念。部分中小型數(shù)據(jù)中心人員缺乏節(jié)能理念,機房進出隨意,每次進出造成多余熱量涌入機房,導致能耗增加。
(3)機房隔熱效果差。中小型數(shù)據(jù)中心普遍存在機房墻面隔熱效果不佳、門窗密閉性不良、墻壁和地板隔熱處理不好等情況,尤其對于南方夏季氣溫較高的地域,造成較大的能源損耗。
針對UPS損耗情況,可以采用UPS新技術(shù)進行改進和解決。
(1)應(yīng)用綠色休眠技術(shù)。針對UPS損耗較大的情況,在中小數(shù)據(jù)中心節(jié)能改造過程中可以將老舊的UPS系統(tǒng)替換為具有綠色休眠技術(shù)的UPS系統(tǒng),即在UPS低負載的情況下根據(jù)實時總負載情況自動計算應(yīng)投入運行的UPS數(shù)量,在保證N+1冗余供電情況下使多余的UPS自動進入休眠狀態(tài)。
(2)采用模塊化UPS。模塊化UPS具有可擴容、平均故障修復時間短以及能夠?qū)崿F(xiàn)N+X冗余功能等優(yōu)點,可以按照實際容量確定機房UPS模塊應(yīng)用的數(shù)量,從而提升UPS的運行效率,在保證數(shù)據(jù)中心安全運行的同時有效減少UPS損耗[5]。
針對大部分中小型數(shù)據(jù)中心采用上送風或者靜電地板下送風等冷卻方式導致部分機柜過熱、整體能耗持續(xù)較高的情況,可以進行冷卻系統(tǒng)節(jié)能改造。
2.2.1 精確送風技術(shù)
精確送風技術(shù)是一種全封閉冷風管道的送風方式,可以應(yīng)用于上送風和下送風等主流冷卻方式中,將空調(diào)機組送出的冷風經(jīng)過靜壓箱、送風管或風帽、調(diào)節(jié)閥以及支風管等裝置直接送入機柜內(nèi)[6]。其中,調(diào)節(jié)閥可以根據(jù)機柜內(nèi)溫度等參數(shù)智能調(diào)節(jié)每個機柜的送風量,實現(xiàn)精確送風,按需為IT設(shè)備提供冷量進行冷卻,在提高冷卻效果的同時節(jié)約能耗[7,8]。上送風空調(diào)的精確送風系統(tǒng)如圖2所示。
圖2 精確送風空調(diào)系統(tǒng)
精確送風技術(shù)能對傳統(tǒng)的風冷方式進行有效改進和優(yōu)化,通過隔離冷熱氣流達到精確送風的目的,能夠解決局部過熱、空調(diào)制冷效率低下等問題,實現(xiàn)節(jié)能減排的目標。
2.2.2 熱管背板空調(diào)技術(shù)
背板空調(diào)技術(shù)的原理是將冷空氣吸入機柜對設(shè)備進行降溫,吸熱后的空氣流向安裝在機柜背部的冷卻盤管,熱空氣與冷卻盤管進行熱交換,將熱量傳遞給換熱器內(nèi)的制冷劑,溫度降低后的冷空氣從背板吹出,從而完成機房空氣循環(huán)。熱管背板空調(diào)能夠大幅降低機房能耗,顯著提高綜合節(jié)能效率,能使電源使用效率(Power Usage Effectiveness,PUE)從2.2~2.4降低至1.5以下[9]。
針對IT設(shè)備能耗高的問題,可以采用以下3種方式進行節(jié)能改造。
(1)逐步優(yōu)化機房空間。對機房機架空間進行統(tǒng)一規(guī)劃,將現(xiàn)有計算設(shè)備、存儲設(shè)備以及網(wǎng)絡(luò)設(shè)備等進行分門別類,合理規(guī)劃機架空間并進行科學部署,逐步優(yōu)化機房布局和設(shè)備安裝方式,確保氣流運動通暢。
(2)逐步更新?lián)Q代設(shè)備。針對部分老舊、能耗較高的設(shè)備進行逐步更新?lián)Q代,將其替換為采用節(jié)能技術(shù)且能耗較低的節(jié)能設(shè)備,同時將占用空間較大、能源消耗較高的塔式服務(wù)器更換為刀片式服務(wù)器。
(3)加強高新技術(shù)應(yīng)用。注重應(yīng)用虛擬化和云計算等高新技術(shù),通過虛擬化建立計算、存儲、網(wǎng)絡(luò)等資源池并搭建云平臺,應(yīng)用容器和虛擬機按需調(diào)配資源,通過策略配置進行智能管理。在夜間大部分系統(tǒng)運行不頻繁或者不運行等資源利用較低的情況下,通過虛擬機自動遷移技術(shù)將系統(tǒng)集中運行到部分服務(wù)器的虛擬機上,從而使部分服務(wù)器自動進入休眠狀態(tài),在提高資源利用率的同時,大大降低設(shè)備能耗[10]。
針對其他因素對數(shù)據(jù)中心能耗造成的影響,可以采用以下3種方式進行節(jié)能改造。
(1)改造傳統(tǒng)照明系統(tǒng)。采用新型節(jié)能燈具代替能耗較高的傳統(tǒng)燈具,用聲控、光控等智能控制方式代替?zhèn)鹘y(tǒng)的手動控制方式,有效解決“長明燈”等問題,從技術(shù)手段上減少數(shù)據(jù)中心照明能耗。
(2)規(guī)范機房管理。制定和完善數(shù)據(jù)中心機房管理規(guī)定,細化機房進出流程,降低人員進出機房頻次,減少多余熱量涌入導致的制冷能耗增加情況。此外,制定節(jié)能效果與運維指標掛鉤機制,使節(jié)能理念深入人心,增強節(jié)能效果。
(3)做好隔熱處理。對機房墻體采用保溫、隔熱、防潮材料進行處理,同時將密閉和隔熱性不良的門窗更換為具有良好密閉性和隔熱性的門窗,并對地板和天花板等進行隔熱處理,減少熱交換,降低能耗。
數(shù)據(jù)中心能耗問題日益突出,中小型數(shù)據(jù)中心節(jié)能改造是大勢所趨。本文從UPS、冷卻系統(tǒng)以及IT設(shè)備等方面對中小型數(shù)據(jù)中心能耗較高的問題進行了分析,對其節(jié)能改造進行了探討和思考。通過綜合分析節(jié)能措施,從而推動數(shù)據(jù)中心的可持續(xù)發(fā)展。