傅一平
在這個由互聯(lián)網技術主導的世界中,數(shù)據(jù)中心是保持數(shù)字生態(tài)系統(tǒng)運轉的大腦。服務器機房負責處理、存儲和傳輸數(shù)據(jù),具有巨大的價值。
使所有數(shù)字系統(tǒng)運行的動力來自電力,數(shù)據(jù)中心管理人員對此非常清楚。除了管理服務器和其他IT設備外,電費和電力分配也是數(shù)據(jù)中心管理人員必須考慮的問題。鑒于化石燃料帶來的環(huán)境影響,很多企業(yè)考慮采用可再生能源產生的電力。隨著服務器技術的創(chuàng)新和專業(yè)化,許多企業(yè)選擇采用具有可擴展性的虛擬化技術或托管數(shù)據(jù)中心。
適當配置配電設施
與大多數(shù)技術領域一樣,數(shù)據(jù)中心需要對各種細節(jié)一絲不茍。如果無法詳細了解電源和設備功率,則估計電力需求可能會效率低下、成本高昂或難以管理。
從設備規(guī)格開始,數(shù)據(jù)中心管理人員需要了解服務器機房的電力容量,可以適當?shù)匕惭b電源設備并確定配電單元(PDU)的數(shù)量。PDU為多個機架或模塊提供分布式電源,適用于網絡連接、環(huán)境監(jiān)控和遠程訪問。
由于機架式服務器的電源需求可能會有所不同,因此必須為服務器配備合適的電源。服務器功能越強大,功率密度就越大。這意味著額外的電力和冷卻能力需要更多的電力容量。
更高的功率密度=電源和冷卻需求
功率密度這個術語描述了每個機架可以提供的功率,并擴展到整個數(shù)據(jù)中心的能力。在以往通常以kW/m2進行量化,而這個指標并沒有考慮機架和機柜增加的情況,因此現(xiàn)在采用的量化單位為kW/機架。
由于20世紀80年代對數(shù)據(jù)中心資源的需求較低,因此功率密度并不是優(yōu)先考慮的事項,每機架2~4kW被認為是高功率密度。如今,隨著數(shù)據(jù)中心規(guī)模的擴展和功能增加,每個機架功率最高可以達到20kW,平均值接近7kW。
隨著對數(shù)據(jù)中心的需求不斷增長,對高功率密度服務器機架的一個關鍵挑戰(zhàn)是冷卻和通風。為滿足這一需求采用的解決方案包括使用可再生能源的液體冷卻技術以及可持續(xù)的自然冷卻技術。
估計電力需求
從需求評估開始,管理人員可以估計現(xiàn)有和預測設備的電力需求,了解為關鍵負載供電、保持冷卻和通風等所需的足夠功率。
數(shù)據(jù)中心設備包括服務器、照明、環(huán)境控制、消防系統(tǒng)、安全警報、監(jiān)控攝像頭、傳感器、空氣、冷卻和通風系統(tǒng)等。
關鍵負載和冷卻系統(tǒng)的電力需求占到數(shù)據(jù)中心電力需求的86%,這也是評估服務器機房能耗的2個最重要的計算指標。而不間斷電源(UPS)對持續(xù)供電至關重要,當市電出現(xiàn)故障時可以提供電力保障。
能源效率
在考慮托管服務、云計算解決方案和合規(guī)性保證的容量時,需要考慮數(shù)據(jù)中心的能源效率。
2017年全球數(shù)據(jù)中心的功耗為416TW,占全球用電量的3%,而美國服務器機房的功耗為900TW。滿足這些巨大的需求促使全球主要的云計算提供商采用定制的服務器和芯片。
自從2005年以來,數(shù)據(jù)中心管理方面的進步極大地提高了能源效率。分析人士稱,在采用低功耗芯片和SSD硬盤之后,機房功耗下降了80%。
數(shù)據(jù)中心和主機托管供應商vXchnge公司分享了一些改善數(shù)據(jù)中心能耗的措施;
清理不必要的工作負載和設備來消除冷卻能力的依賴性;
確定更加節(jié)能的運行溫度并降低成本;
協(xié)調服務器容量和負載以實時滿足請求;
檢測并減少正在運行但沒有使用的僵尸服務器;
優(yōu)化或減少空間以減少冷卻成本;
建立更強大的供應商伙伴關系以實現(xiàn)互惠互利。
服務器機房需要持續(xù)充足的電力以及一定程度的可靠性和性能,以保持數(shù)據(jù)在線并可供高強度使用,采用可持續(xù)的可再生能能源可以減少整體能源負擔。
盡管數(shù)字信息服務在過去十年加速發(fā)展,但從2010年到2018年,全球數(shù)據(jù)中心能耗僅增長6%。
能源與環(huán)境智庫Energy Innovation公司指出了數(shù)據(jù)中心能耗沒有增長的3個因素:
提高IT設備(服務器和硬盤驅動器)的能源效率;
采用服務器虛擬化軟件,使多個應用程序可以集中在一臺服務器上運行;
計算實例遷移到可以提供超高效冷卻的云平臺或超大規(guī)模數(shù)據(jù)中心。
大多數(shù)分析師通常使用基于有限公開信息的方法來計算全球服務器機房功耗。雖然谷歌、蘋果和Facebook等一些數(shù)據(jù)中心運營商報告了此類數(shù)據(jù),但缺乏對全球數(shù)據(jù)中心行業(yè)的洞察力會導致估計值遠高于現(xiàn)實。相對于交通運輸、航空和能源等行業(yè)領域,數(shù)據(jù)中心行業(yè)的運行效率更高。
展望未來,人工智能和機器學習帶來的密集工作負載可能意味著未來幾年的數(shù)據(jù)中心效率將會降低。對高性能計算、存儲和冷卻技術以及節(jié)能電源的開發(fā)是解決這個難題的重要組成部分。
采用托管數(shù)據(jù)中心的注意事項
與建立內部部署數(shù)據(jù)中心相比,托管數(shù)據(jù)中心是一種共享的數(shù)據(jù)中心設施,用戶可以分擔成本,因此運營成本更低。雖然使用托管服務器的企業(yè)對其模塊的物理控制權較少,但托管數(shù)據(jù)中心服務商仍在繼續(xù)改進遠程控制功能。從家庭辦公室或工作場所,管理人員可以遠程管理服務器。
托管是一種可擴展的解決方案,可以解決內部部署數(shù)據(jù)中心的局限性,并提供更高級別的帶寬。托管數(shù)據(jù)中心往往更可靠,因為它們專注于服務器管理,例如數(shù)據(jù)備份和低延遲網絡選項。其額外的一個好處是提高物理安全性,托管數(shù)據(jù)中心通常配備閉路電視監(jiān)控、私人套房和消防系統(tǒng)等設施。
托管與公有云
基于云計算的解決方案可能會提供類似托管數(shù)據(jù)中心的服務,但其代價是對服務器、存儲和網絡元素外圍設備的控制較少。與大多數(shù)云計算產品一樣,企業(yè)只負責私有數(shù)據(jù)中心或托管中心所需的一小部分設置。雖然云計算帶來了更多的好處,但IT專業(yè)人員不能忽視公有云存在漏洞,而現(xiàn)在還有一些企業(yè)傾向于自己內部部署數(shù)據(jù)中心。