郭泰
摘 要:虛擬機(jī)技術(shù)具有彈性大、靈活快速擴(kuò)展、降低運(yùn)維成本、自動(dòng)化資源監(jiān)控、多用戶環(huán)境等特點(diǎn)。因此需要我們對(duì)機(jī)房日常管理進(jìn)行有效控制,才能使整套的計(jì)算機(jī)系統(tǒng)長久無故障運(yùn)行。
關(guān)鍵詞: 運(yùn)維;虛擬機(jī);數(shù)據(jù)中心
基金項(xiàng)目:重慶市高等教育教學(xué)改革項(xiàng)目:“基于VMware的虛擬機(jī)環(huán)境在計(jì)算機(jī)教學(xué)中的應(yīng)用研究”,項(xiàng)目編號(hào):173306
現(xiàn)代信息中心已成為人們?nèi)粘I钪胁豢扇鄙俚牟糠?,因此信息中心機(jī)房設(shè)備的運(yùn)行正常與否就非常關(guān)鍵。在數(shù)據(jù)中心 生命周期中,數(shù)據(jù)中心運(yùn)維管理是數(shù)據(jù)中心生命周期中最后一個(gè)、也是歷時(shí)最長的一個(gè)階段。加強(qiáng)對(duì)云計(jì)算運(yùn)維管理的要點(diǎn)以及相應(yīng)改進(jìn)方面措施的研究與探討,以此不斷提高IT運(yùn)維質(zhì)量,實(shí)現(xiàn)高效的運(yùn)維管理。這就給運(yùn)維是否到位提出了嚴(yán)格要求。
1 運(yùn)維在機(jī)房中的地位
數(shù)據(jù)中心運(yùn)維管理是,為提供符合要求的信息系統(tǒng)服務(wù),而對(duì)與該信息系統(tǒng)服務(wù)有關(guān)的數(shù)據(jù)中心各項(xiàng)管理對(duì)象進(jìn)行系統(tǒng)地計(jì)劃、組織、協(xié)調(diào)與控制,是信息系統(tǒng)服務(wù)有關(guān)各項(xiàng)管理工作的總稱。數(shù)據(jù)中心 運(yùn)維管理主要肩負(fù)合規(guī)性、可用性、經(jīng)濟(jì)性、服務(wù)性等四大目標(biāo)。
在信息中心機(jī)房配備有運(yùn)維人員,但大都是“全才”的,即什么都管,尤其是對(duì)供電系統(tǒng)大都是由主機(jī)運(yùn)維的人員代管。當(dāng)電源系統(tǒng)出故障時(shí),此代管人員一問三不知,甚至連配電柜門都沒開過。這實(shí)際上就是把機(jī)房的運(yùn)維放在了一個(gè)次要的地位。
當(dāng)然也有的地方有所分工,看似重視,實(shí)際上也沒得到真正地重視。比如說機(jī)房設(shè)備長時(shí)間一直運(yùn)行正常,這時(shí)如果運(yùn)維人員提出要增添運(yùn)維方面的測(cè)量設(shè)備,有的領(lǐng)導(dǎo)就認(rèn)為多余,很難得到批準(zhǔn)。但他不知道機(jī)房設(shè)備所以長時(shí)間一直運(yùn)行正常,正是由于這些運(yùn)維人員的細(xì)心維護(hù)和努力保養(yǎng)所獲得的。并不是這些人員每天閑著無事可干,他們的這些工作一般是領(lǐng)導(dǎo)看不見的。比如同樣多款的UPS在同樣的環(huán)境條件下,在某衛(wèi)星地面站就極少出故障,而在同系統(tǒng)別的地方機(jī)房同一家同規(guī)格的機(jī)器就故障連連。原來是前者的運(yùn)維人員每天都在細(xì)心觀察和分析機(jī)器面板LCD上顯示的數(shù)據(jù),一旦發(fā)現(xiàn)異常苗頭及時(shí)采取措施;而后者只限于每天抄寫這些數(shù)據(jù)就算完成任務(wù),使異常苗頭不斷積累,以致于導(dǎo)致故障。比如斷路器在額定閉合狀態(tài)發(fā)現(xiàn)觸點(diǎn)處溫度高了,就要檢查是不是電流過大到超過額定值,如果不是就要檢查觸點(diǎn)接觸是否牢靠,是否需要再緊固一下。這樣一來,故障隱患就排除了。如果一直不管不問久而久之就會(huì)導(dǎo)致跳閘而使系統(tǒng)崩潰。這都是一些小的動(dòng)作,都是在巡查中順便做的事情。所以同是運(yùn)維人員在巡查,但前者在做事而后者只是走馬觀花。這就是數(shù)據(jù)中心可靠與不可靠的區(qū)別。
運(yùn)維人員就像幼兒園的保育員和老師。孩子交到幼兒園后,起主要作用的就是保育員和老師,這時(shí)保育員和老師就是主體。機(jī)器就好比是幼兒園的孩子,孩子是否健康成長,機(jī)器是否正常運(yùn)行,除去本身的健康(可靠性質(zhì)量)狀況外,那就是運(yùn)維人員的責(zé)任了。由于云計(jì)算的要求彈性、靈活快速擴(kuò)展、降低運(yùn)維成本、自動(dòng)化資源監(jiān)控、多租戶環(huán)境等特性,除基于ITIL(IT基礎(chǔ)設(shè)施庫)的常規(guī)數(shù)據(jù)中心運(yùn)維管理理念之外,以下運(yùn)維管理方面的內(nèi)容,需要我們加以重點(diǎn)關(guān)注。
2 虛擬技術(shù)數(shù)據(jù)中心運(yùn)維管理的要點(diǎn)
(1)理清虛擬技術(shù)數(shù)據(jù)中心 的運(yùn)維對(duì)象
數(shù)據(jù)中心的運(yùn)維管理指的是與數(shù)據(jù)中心信息服務(wù)相關(guān)的管理工作的總稱。虛擬技術(shù)數(shù)據(jù)中心運(yùn)維對(duì)象一般可分成5大類:
①機(jī)房環(huán)境基礎(chǔ)設(shè)施
這里主要指的是為保障數(shù)據(jù)中心 所管理的設(shè)備正常運(yùn)行所必需的網(wǎng)絡(luò)通信、供配電系統(tǒng)、環(huán)境系統(tǒng)、消防系統(tǒng)和安保系統(tǒng)等。這部分設(shè)備對(duì)于用戶來說幾乎是透明的,比如大多數(shù)用戶都不會(huì)忽略數(shù)據(jù)中心的供電和制冷。因?yàn)檫@類設(shè)備如果發(fā)生意外,對(duì)依托于該基礎(chǔ)設(shè)施的應(yīng)用來說是致命的。
②數(shù)據(jù)中心所應(yīng)用的各種設(shè)備
這些設(shè)備包括存儲(chǔ)、服務(wù)器、網(wǎng)絡(luò)設(shè)備和安全設(shè)備等硬件資源。這類設(shè)備在向用戶提供IT服務(wù)過程中提供了計(jì)算、存?zhèn)鬏敽屯ㄐ诺裙δ?,是IT服務(wù)最核心的部分。
③系統(tǒng)與數(shù)據(jù)
這部分包括操作系統(tǒng)、數(shù)據(jù)庫、中間環(huán)節(jié)和應(yīng)用程序等軟件資源,還有業(yè)務(wù)數(shù)據(jù)、配置文件、日志等各類數(shù)據(jù)。這類管理對(duì)象雖然不像前兩類管理對(duì)象那樣“看得見,摸得著”,但卻是IT服務(wù)的邏輯載體。
④管理工具
這部分包括基礎(chǔ)設(shè)施監(jiān)控軟件、IT監(jiān)控軟件、工作流管理平臺(tái)、報(bào)表平臺(tái)和短信平臺(tái)等。
這類管理對(duì)象是幫助管理主體更高效地管理數(shù)據(jù)中心內(nèi)各種管理對(duì)象的工作情況,并在管理活動(dòng)中承擔(dān)起部分管理功能的軟硬件設(shè)施。通過這些工具,可以直觀感受并考證數(shù)據(jù)中心如何管理好與其直接相關(guān)的資源,從而間接地提升了可用性與可靠性。
⑤人員管理
人員管理包括數(shù)據(jù)中心在內(nèi)的技術(shù)人員、運(yùn)維人員、管理人員以及提供服務(wù)的廠商人員的管理。
人員一方面作為管理的主體負(fù)責(zé)管理數(shù)據(jù)中心 的運(yùn)維對(duì)象,另一方面也作為管理的對(duì)象,支持IT的運(yùn)行。這類對(duì)象與其他運(yùn)維對(duì)象不同,具有很強(qiáng)的主觀能動(dòng)性,其管理的好壞將直接影響到整個(gè)運(yùn)維管理體系,而不僅僅是運(yùn)維對(duì)象本身。
(2)定義各運(yùn)維對(duì)象的運(yùn)維內(nèi)容
虛擬技術(shù)數(shù)據(jù)中心資源管理所涵蓋的范圍很廣,包括環(huán)境管理、網(wǎng)絡(luò)管理、設(shè)備管理、軟件管理、存儲(chǔ)介質(zhì)管理、防病毒管理、應(yīng)用管理、日常操作管理、用戶密碼管理和員工管理等。這就需要對(duì)每一個(gè)管理對(duì)象的日常維護(hù)工作內(nèi)容有一個(gè)明確的定義,定義操作內(nèi)容、維護(hù)頻度、對(duì)應(yīng)的責(zé)任人,要做到有章可循,責(zé)任人可追蹤。實(shí)現(xiàn)對(duì)整個(gè)系統(tǒng)全生命周期地追蹤管理。
(3)建立信息化的運(yùn)維管理平臺(tái)系統(tǒng)和IT服務(wù)管理系統(tǒng)
虛擬技術(shù)數(shù)據(jù)中心的運(yùn)維管理應(yīng)從數(shù)據(jù)中心的日常監(jiān)控入手,事件管理、變更管理、應(yīng)急預(yù)案管理和日常維護(hù)管理等方面全方位地進(jìn)行數(shù)據(jù)中心的日常監(jiān)控。實(shí)現(xiàn)提前發(fā)現(xiàn)問題、消除隱患,首先要有完整的、全方位實(shí)時(shí)有效的監(jiān)控系統(tǒng),并著重監(jiān)控?cái)?shù)據(jù)的記錄和技術(shù)分析。
數(shù)據(jù)中心的業(yè)務(wù)可以概括為:通過運(yùn)行系統(tǒng)來向客戶提供服務(wù)。沒有信息系統(tǒng)的支撐來運(yùn)行IT系統(tǒng)就如超市里仍然采用手工結(jié)賬一樣不能讓顧客滿意。信息化的數(shù)據(jù)中心運(yùn)維管理平臺(tái)系統(tǒng)包括如下方面:
①機(jī)房環(huán)境基礎(chǔ)設(shè)施監(jiān)控管理系統(tǒng);
②IT系統(tǒng)監(jiān)控管理系統(tǒng);
③IT服務(wù)管理系統(tǒng)。
結(jié)束語:數(shù)據(jù)中心作為信息與信息系統(tǒng)的物理載體,目前主要用于與IT相關(guān)的主機(jī)、網(wǎng)絡(luò)、存儲(chǔ)等設(shè)備和資源的存放、管理。只有運(yùn)維管理好一個(gè)數(shù)據(jù)中心,才能發(fā)揮數(shù)據(jù)中心的作用,使之能更好地為云計(jì)算提供強(qiáng)大的支持能力。通過有效實(shí)施云計(jì)算數(shù)據(jù)中心運(yùn)維管理,降低人員工作量的同時(shí)提高運(yùn)維人員工作效率,保障業(yè)務(wù)人員的工作效率,提高業(yè)務(wù)系統(tǒng)運(yùn)行狀況,進(jìn)而提高企業(yè)整體管理效益,同時(shí)提高客戶滿意度,實(shí)現(xiàn)云計(jì)算數(shù)據(jù)中心的價(jià)值最大化。
參考文獻(xiàn)
[1] 陸軍.虛擬機(jī)技術(shù)及其在計(jì)算機(jī)教學(xué)中的應(yīng)用[J].石家莊理工職業(yè)學(xué)院學(xué)術(shù)研究,2009,(4).
[2] 黎東蘭.利用虛擬機(jī)技術(shù)搭建計(jì)算機(jī)教學(xué)平臺(tái)的探索與實(shí)踐[J].時(shí)代教育,2010,(9).
[4] 梁誠等.Vmware“虛擬機(jī)”技術(shù)在計(jì)算機(jī)實(shí)踐教學(xué)中的應(yīng)用[J].電腦開發(fā)與應(yīng)用,2007,(8).