摘要:隨著信息化社會的發(fā)展,各單位對網(wǎng)絡計算機機房的管理與維護的意識逐漸加強,并且采取了適當?shù)拇胧?,以此促進對機房現(xiàn)代化的管理水準,隨之而來的機房管理與維護已成為單位工作的重要組成部分;包括對軟件系統(tǒng)及硬件系統(tǒng)之間的維護、加強科學人員合理的管理布局、充分利用現(xiàn)有的網(wǎng)絡資源實現(xiàn)對機房的全面整改。同時根據(jù)電子信息系統(tǒng)機房設計規(guī)范要求,單位機房的管理和維護也要盡量做到低碳環(huán)保,本文對機房的管理和維護措施進行重點探究,以促進低碳信息化社會單位機房的健康、可持續(xù)發(fā)展。
關鍵詞:標準 標準化 機房管理 維護
當今社會運轉,無不需要信息化,信息服務正在呈幾何級數(shù)增長,各單位對機房的要求也越來越高,如何能提供一個安全、穩(wěn)定、可擴展、易升級、節(jié)能環(huán)保的機房已經(jīng)顯得非常重要,這對于單位的發(fā)展,以至信息行業(yè)的發(fā)展而言,都是未來相當長一段時間內(nèi)的重中之重。目前單位面對傳統(tǒng)數(shù)據(jù)中心管理復雜、運維成本高居不下、難以適應業(yè)務發(fā)展需要等一系列問題,對數(shù)據(jù)中心建設熱情依舊,新建、擴建、改建項目都有不同程度增加,未來投資力度依然很大。就維護方面,首先,要對維護人員的組織架構和管理進行重新組織和規(guī)劃。將人員分成幾層,第一種對設備健康狀況簡單的維護。維護人員針對以前的數(shù)據(jù)中心設備進行一些簡單的操作維護和管理,專業(yè)化水平相對較低,無法進行更深入的管理。第二種是專業(yè)化程度相當于數(shù)據(jù)庫的專業(yè)人員。在以前沒有規(guī)?;托б婊埃瑢I(yè)似乎也沒那么強烈,專業(yè)化不足是其中一個挑戰(zhàn)。其次,由于數(shù)據(jù)中心的虛擬化和云化,單位亟需細分和提高維護人員的技術水平,以滿足在各種層次上都有專業(yè)技術人員做支撐的要求。為了確保市場要求,在高速增長的同時,不僅僅要培養(yǎng)大量的運營維護人員,還要在制度上對從業(yè)人員進行規(guī)范。參考各地機房的管理制度和經(jīng)驗,編寫完善機房管理制度規(guī)范。
1 硬件的維護與管理
在機房中,涉及到各種各樣的機房硬件設備,如果不能采取有效的維護措施,那么設備就無法發(fā)揮應有作用,單位的計算機正常運轉也無從談起。要嚴格管理,貫徹始終。機房設備的維護是項看得見、摸得著的實際工作,面對諸多因素和關系,必須“嚴”字當頭。機房管理內(nèi)容較多,從廣義說,硬件設備的購置或添加、各類軟件的選用、軟硬件故障檢修、用電的安全、網(wǎng)絡的連接及其技術、機房衛(wèi)生等都屬于機房的管理內(nèi)容。因此,機房管理人員要從嚴管理,在機房建立初期,讓管理人員參與到機房的建設當中,以熟悉機房的設備安裝與機器配置情況,便于在今后的使用過程中出現(xiàn)問題能夠及時準確判斷,迅速解決問題;在網(wǎng)絡機房使用中,一開始就要嚴格管理、嚴格要求,并使這種從嚴思想貫徹落實到管理工作的全過程和機房使用的始終。定期檢修,及時維護。機房有關設備也有老化、更新、修復等問題,除進行日常的檢修外,還應對機房設施存在的缺陷、設備的老化等問題定期檢修、更換或完善。堅持每年定期對機房檢修,進一步總結經(jīng)驗,完善機房管理制度。以下將對機房的維護與管理相關問題進行具體分析。
1.1 以機房標準為依據(jù)進行機房環(huán)境的維護
機房計算機的工作環(huán)境是否良好是訃算機能否正常進行工作的重要保證。所以需要對機房的環(huán)境進行嚴格的要求,無論是溫度、濕度以及空氣質(zhì)量等,還是整潔程度都必須按照標準執(zhí)行。預防機房內(nèi)高溫、高震動現(xiàn)象的發(fā)生。一般來說,機房內(nèi)溫度是有明確規(guī)定的,在正常開機狀態(tài)時環(huán)境溫度應該控制在10℃~25℃之間,而計算機在進行運轉時,環(huán)境溫度最好是在0~32℃之間。之所以要嚴格控制機房內(nèi)的溫度,是因為計算機在工作時如果周圍溫度過高,會致使計算機的的通風冷卻裝置無法及時進行散熱,會破壞計算機內(nèi)的零部件,導致計算機無法正常運轉。相反,如果機房環(huán)境的溫度過低,則達不到計算機正常運行需要的溫度環(huán)境,導致計算機內(nèi)部很多應用系統(tǒng)程序與內(nèi)含系統(tǒng)的應用啟動不能按照程序運行,進而導致計算機難以啟動或者計算機故障等眾多問題。
當然,機房內(nèi)不僅要時時刻刻控制好溫度,還要保持好適宜的濕度,正常的濕度范圍是在30%~80%之間??諝鉂穸冗^高,會使計算機內(nèi)部元件彼此之間的焊接點阻力增大,會致使很多電腦應用系統(tǒng)遭致破壞;空氣濕度過低,會使計算機工作時接觸的摩擦力增大,極易產(chǎn)生靜電反應,不利于計算機正常工作。
同溫度和濕度相比較,計算機工作環(huán)境機房的清潔與衛(wèi)生問題也需要引起足夠重視?;覊m對傳輸設備的影響也很大?;覊m會影響到一些器件的絕緣性和導電性,可能引發(fā)電路短路等安全事故。空氣中危害傳輸設備的懸浮污染物包括硫化物、氧化物、無機鹽、磷化物、農(nóng)藥、油煙、負離子、金屬離子等。這些肉眼難以發(fā)現(xiàn)的懸浮物質(zhì)進入機房的渠道多種多樣,很難做到完全將污染物阻擋在外。隨著時間的推移,污染物積少成多,最后就會對設備的正常運行產(chǎn)生影響。因此,機房的管理人員應該每月都對機房內(nèi)部進行清潔,嚴格控制人員出入,盡量減少進入機房人員穿著纖維類或其他容易產(chǎn)生靜電附著灰塵的服裝進入。更要經(jīng)常清潔設備的灰塵,保持設備內(nèi)外部的干凈。設備運行過程中會產(chǎn)生大量的熱能,因此必須保持有足夠的散熱空間,不要擺放過多的雜物。最好每天都要打掃機房,最少保證每周兩次,這樣才能保持機房的整潔。另外管理人員應該保證計算機在運行時主機和顯示器不能震動,這樣才能減少驅(qū)動器的磨損和硬盤的損壞,保證磁盤上的信息不會丟失。
1.2 機房設備及UPS配套備用電源的管理與維護
穩(wěn)定的電源電壓供應是延長計算機以及內(nèi)部元件壽命的關鍵,所以計算機機房應該要有穩(wěn)定的電源電壓供應。值得注意的是,突然的斷電也是減少計算機壽命的重要因素,會導致計算機內(nèi)的重要數(shù)據(jù)和信息丟失,影響計算機的正常運用。為防止突然斷電對人們造成的困擾,機房應該準備UPS及電力配套電源,以備不時之需。高品質(zhì)UPS的不間斷供電是電子信息系統(tǒng)機房正常運行的可靠保障,也是衡量一個機房好壞最直接的標準。目前機房電源設備正向智能化和高度集成化發(fā)展,為避免對其他電氣設備的正常工作造成影響,在進行機房一體化方案設計時,各動力設備要增強其電磁兼容性與電氣隔離性能。在一體化供電方案中,為能對各設備進行關聯(lián)控制,一方面要確保傳輸設備的持續(xù)供電;另一方面,也要確保各動力設備能夠兼容和通用地進行數(shù)據(jù)通信,構成一個數(shù)據(jù)協(xié)議的動力監(jiān)控網(wǎng)絡。同時,計算機本身的應用程序是有一定使用規(guī)律的,所以在使用時應該遵循計算機使用規(guī)律。例如在計算機進行開關機的時候,要按照正常的程序來操作,如果進行強制開關機,會減少計算機的使用壽命。而且短時間內(nèi)不能重復開關多次,速度要適中,不宜太快,這些都是影響計算機壽命的因素。其次,機房線路的連接也是重要問題之一。在購買電纜線的時候一定要注重質(zhì)量,通常的電器都有接地線,機房也不例外。機房布線應符合GB 50311《綜合布線系統(tǒng)工程設計規(guī)范》的規(guī)定。應當根據(jù)機房內(nèi)強電、弱電機柜的擺放位置預先規(guī)劃好,強、弱線纜最好分開布線。同時,為了日常的計算機維修,還應該配有人員進行基礎的計算機維修,機房內(nèi)備有一些常用的修理工具,如電筆、螺絲刀、刷子等。
另外,機房電源是維持整個機房正常運轉的重要保證。一定應做到周檢、月檢、季檢以及年檢?,F(xiàn)實中UPS電池組對于環(huán)境也存在著很高的要求,溫度應當處于15℃~25℃之間,濕度方面需要處于40%~60%范圍之間,并要定期將電池組放電,以此有效延長電池組整體使用壽命。同時按月記錄UPS的輸出、輸入電壓、頻率值及電流,電池組的電壓值,來進行查看數(shù)值變化有無呈現(xiàn)過大的情況,若是發(fā)現(xiàn)存在異常,及時對故障隱患作出科學化的處理。另外,UPS負載的功率應當以占據(jù)總輸出功率的50%~80%為最佳狀態(tài)。每周、每月、每季度和每年都應該做好UPS電源的續(xù)保購買和維護工作,由專業(yè)施工技術人員在固定的時間對設備做檢測并做好記錄,對于出現(xiàn)問題的設備要進行及時的維修或更換。
1.3 保障消防安全
消防安全是各項工作的重中之重。要時刻具有防火安全意識,備有緊急通道。安裝避雷設施或接地保護裝置,防止雷電入侵事故。加強對機房的監(jiān)控和管理,完善應急預案。要建立明確、完善的報警程序,建立相應的安全應急措施,保證在事故發(fā)生時能夠短時間內(nèi)得到有效處置。數(shù)據(jù)中心機房應采用氣體滅火系統(tǒng),并配備專用空氣呼吸器或氧氣呼吸器;機房設計與建設中,應充分避免火、煙、水等造成的隱患,可極大地提高消防的安全系數(shù)。樓道和機房內(nèi)要裝煙霧感應器和防火報警探測頭,如遇火情系統(tǒng)可于第一時間自行報警,并迅速啟動滅火系統(tǒng),及時排除火情。另外,為以防萬一,機房內(nèi)還應配備推車式和手提式滅火器。
2 軟件的管理和維護
軟件管理是計算機機房管理人員的主要任務,這是一項非常復雜和細致的工作,要及時安裝以及維護軟件系統(tǒng),防止病毒破壞。病毒入侵對計算機的危害是全面性的,會給計算機造成嚴重的威脅,因此需要采取必要的防御手段對病毒進行查殺。日常在購買計算機軟件時,一定要選擇正規(guī)正版的的軟件,不要貪圖便宜而購買盜版的軟件,盜版軟件攜帶的病毒會給計算機帶來不可估量的破壞作用。為保險起見,計算機內(nèi)部應該安裝殺毒軟件,對于很多由于下載或者使用時的惡意病毒進行掃描并查殺。對與計算機內(nèi)的數(shù)據(jù)信息要定期進行備份,將重要的資料都上傳到云盤上,以免數(shù)據(jù)丟失造成的不便。而且應該定期對文件夾進行掃描,及時發(fā)現(xiàn)病毒,保證文件夾內(nèi)容的真實完整。應該對垃圾進行系統(tǒng)清理,徹底清除干凈,拒絕病毒侵襲。除此之外,機房應該有專門的計算機維修人員,了解基礎的計算機病毒入侵問題,并及時對病毒進行根本性防治,以此來保護好計算機與計算機內(nèi)部系統(tǒng)的安全。例如,平時計算機運行速度慢、瀏覽器網(wǎng)頁打不開、系統(tǒng)硬盤空間莫名變大或變小等,這些現(xiàn)象都有可能導致計算機出現(xiàn)死機現(xiàn)象,因此需要及時進行病毒檢測,防止對計算機產(chǎn)生更嚴重的破壞作用。另外,還要做好系統(tǒng)還原來保護磁盤數(shù)據(jù)。
3 落實機房管理人員的紀律和制度
為了使機房管理更加系統(tǒng)化,提高單位機房計算機的利用率,單位針對機房的管理制定的各項制度主要包括:機房管理員的職責、計算機使用人員的職責、對機房環(huán)境衛(wèi)生的要求等。制度完成制定以后絕對不能將其束之高閣,當作掛在墻上的一紙空文,只是應付上級檢查,而必須在上級領導的指導監(jiān)督之下,積極貫徹落實既定方針和政策,加強機房管理。
機房管理工作并不像想象的那么簡單。機房管理是一項看得見摸得著的的實際工作,本人認為機房管理工作很重要并且很有挑戰(zhàn)性。為了杜絕大大小小的安全事故發(fā)生。建立和健全機房的各項規(guī)章制度是做好機房管理的關鍵。采取科學的管理手段,被證明是行之有效的。機房的管理和維護離不開人的參與,不論是日常的工作人員,還是管理和檢修的工作人員,都必須具備專業(yè)的素質(zhì)才可以保證設備的正常運行。所以,對機房內(nèi)的工作人員,要適時進行知識技能的培訓,把操作人員容易出現(xiàn)問題的地方記錄在案,然后建立起完善的設備故障處理記錄,這樣如果操作人員遇到問題就可以自己來解決,同時也減少了維護人員的工作量。
機房日常管理根據(jù)實際需要,必須以較為完善的《機房管理規(guī)定》《機房管理人員崗位職責》等規(guī)定和制度為依托,做到言必出,行必果。必須按照制度嚴格執(zhí)行,不能有絲毫怠慢。制度和規(guī)定對各個具體細節(jié)要有準確描述,以供參考執(zhí)行,明確職責分工,加大落實與監(jiān)督力度,落實機房管理責任制,強化其責任意識。
4 結語
計算機在應用過程中會存在一些維護和應用故障等,都需要采取各種措施加以解決。而機房作為計算機應用的主要場所,需要結合現(xiàn)實的情況加以正確使用,保證其發(fā)揮好應有的作用。機房是很復雜的,所以就需要機房內(nèi)的各系統(tǒng)之間相互配合、相互聯(lián)系,這樣才會對機房設備起到保護作用。機房的日常維護和管理,要根據(jù)實際情況來進行解決和應對,同時更要把好網(wǎng)絡機房的安全關,這也是機房能正常工作的一個基礎。我們要對網(wǎng)絡機房進行準確的安裝、合理的安排、有效的管理、及時的維護,這樣才能發(fā)揮出網(wǎng)絡機房所具有的真正作用。機房對電氣環(huán)境、空氣溫濕度、防塵、配套設備及消防安全等方面有著較為嚴格的要求。機房內(nèi)設備的正常運行也離不開工作人員的管理和維護。機房管理的重要環(huán)節(jié)是要機房管理人員不斷完善,進行修復提高,確保機房能夠安全、有序、穩(wěn)定地運行。