在柴靜《蒼穹之下》的結(jié)尾處,有一個《對抗霧霾,我為空氣做點事》的活動介紹,其中列出了大家能為減少霧霾而做出的簡單有效的各項活動。作為一名IT從業(yè)者,我們雖然不會直接造成霧霾,但和我們相關(guān)的各種服務(wù)器、網(wǎng)絡(luò)設(shè)備,包括整個數(shù)據(jù)中心,都在耗費著巨大的電量。節(jié)約能耗,就會減少煤炭或石油的燃燒,就相當(dāng)于我們?yōu)楝F(xiàn)在霧霾天的治理做出了貢獻。
能耗控制一直是數(shù)據(jù)中心建設(shè)過程中很重要的一項工作。對于大型數(shù)據(jù)中心運營商來說,巨額的電費已經(jīng)逐步超過了基礎(chǔ)設(shè)施投入,成為數(shù)據(jù)中心運營的第一大成本。為了達到這一目的,IT巨頭們?yōu)榇俗隽舜罅抗ぷ鳌<b箱式數(shù)據(jù)中心現(xiàn)在已經(jīng)開始流行,因為其集中性和封閉性,加上良好的散熱通道設(shè)計,可以令電力使用率大大提高。為了節(jié)能,有些公司甚至直接將數(shù)據(jù)中心建在了北極圈附近。合理的利用水冷也成為節(jié)能的一大利器。而對于我們大多數(shù)數(shù)據(jù)中心的使用者來說,這些技術(shù)無法直接使用。如何節(jié)約某臺服務(wù)器的電量,或者直接降低服務(wù)器的數(shù)量是降低能耗的重點。通過運維工程師的觀察監(jiān)測,我們可以發(fā)現(xiàn)那些沒有被充分利用的資源,然后通過更換低功耗服務(wù)器、數(shù)據(jù)遷移、虛擬化等技術(shù)來在不影響業(yè)務(wù)的情況下降低能耗。
通過運維工具如蟻巡運維平臺,可以對服務(wù)器、服務(wù)器組的長期運行狀況做出分析,通過數(shù)據(jù)來指導(dǎo)如何展開節(jié)能的工作。如果某臺服務(wù)器的CPU占用一直較低,則可以考慮將其更換為基于ATOM的低功耗服務(wù)器(在服務(wù)器的可靠性滿足需求的前提下)。如果一整批的服務(wù)器CPU都較低,或者CPU利用的高峰期是錯開的,在內(nèi)存和磁盤IO滿足的前提下可以考慮用虛擬化技術(shù)將這些服務(wù)器盡可能地合并。同時,通過監(jiān)測資源占用的變化趨勢,我們可以更有序地購買新的服務(wù)器,而不是盲目提前下單。
在運維的過程中,對管理者來說遇到的一個很大的難題就是如何評判各部門申請的服務(wù)器或其他IT設(shè)備是否被充分的地利用了起來。資源的需求者往往會為了更好的保障而申請超出需求的資源數(shù)量(如硬盤空間大小、CPU計算能力、內(nèi)存大小等)。這些在沒有良好的工具支撐前,很難做出良好的判斷。而通過蟻巡提供的數(shù)據(jù),可以精確得出在一段時間之內(nèi),某組服務(wù)器的磁盤空間占用是高還是低,從而得出資源是否有浪費的現(xiàn)象。
通過蟻巡運維平臺,可以直接查看服務(wù)器某項性能指標(biāo)在一年內(nèi)的資源變化情況。這對于了解什么時候需要更新硬件資源或者提前采取措施預(yù)防資源被耗盡有著很大的意義。例如,如圖1所示,我們可以通過硬盤空間使用率變化曲線,來判斷出幾個月后硬盤的空間會達到一個危險值,我們必須在這之前采取措施,如更換更大的硬盤或者將數(shù)據(jù)轉(zhuǎn)移到其他地方。
圖1 硬盤空間使用率變化曲線
在企業(yè)實施了虛擬化之后,對虛擬機的管理也存在著同樣的問題。通過蟻巡的界面,可以一眼看出來每臺物理機上的虛擬機資源占用和利用情況,從而了解到虛擬機在申請資源時,有沒有過高地提出自己的要求。例如,某臺虛擬機申請了8G的內(nèi)存,但實際內(nèi)存使用率只有不超過3%,說明該設(shè)備申請了之后基本處于閑置狀態(tài),沒有得到充分的利用。這時,就可以經(jīng)過協(xié)商會回收該資源。
綜上所述,通過蟻巡運維平臺這個良好的運維工具,我們可以在管理多臺服務(wù)器時,充分利用起已有的資源,不再有設(shè)備的閑置和浪費現(xiàn)象,從而更好地節(jié)約了能耗,也就達到了降低霧霾的效果。同時,節(jié)約的資源和設(shè)備也給管理者節(jié)省了大量的資金,達到了雙贏的局面。
地址:山東省濟南市高新區(qū)新濼大街1166號奧盛大廈1號樓27層
郵編:250101
電話:400-996-9796