■ 陶明 鄔丹華 潘志安 陶波
我國目前正處于信息化建設(shè)高速發(fā)展的階段,在信息技術(shù)不斷發(fā)展和普及的今天,企業(yè)在信息化技術(shù)方面的應(yīng)用也越來越廣泛。對(duì)于信息系統(tǒng)運(yùn)行維護(hù)單位而言,機(jī)房是重要的資產(chǎn)。機(jī)房作為信息系統(tǒng)的物理環(huán)境支撐基礎(chǔ),也是信息化服務(wù)的載體。機(jī)房是否能夠安全和穩(wěn)定的運(yùn)行決定著現(xiàn)代化信息系統(tǒng)項(xiàng)目能否正常運(yùn)作。同時(shí),機(jī)房也影響著運(yùn)維單位對(duì)信息系統(tǒng)項(xiàng)目的保障能力和用戶的自身利益。因此,如何及時(shí)有效地對(duì)機(jī)房內(nèi)部信息設(shè)備的運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè)直接影響著信息系統(tǒng)的運(yùn)行情況。
大數(shù)據(jù)時(shí)代的到來,使得信息數(shù)據(jù)有了一個(gè)質(zhì)的飛躍。與此同時(shí),如此龐大數(shù)量的數(shù)據(jù)合理有效的管理使用成了各個(gè)企業(yè)面臨的難題。先進(jìn)技術(shù)的發(fā)展會(huì)推動(dòng)企業(yè)的管理方式進(jìn)行轉(zhuǎn)變。在這一“顛覆性”技術(shù)出現(xiàn)后,傳統(tǒng)意義上的機(jī)房運(yùn)維管理已經(jīng)不能適用于現(xiàn)代化企業(yè)管理。信息化技術(shù)作為新時(shí)代下的標(biāo)志性技術(shù)在企業(yè)管理中的優(yōu)勢(shì)越來越明顯?,F(xiàn)代化的機(jī)房管理很好地利用了信息化技術(shù)來助力,使得機(jī)房的運(yùn)維管理變得更自動(dòng)化。這一技術(shù)在機(jī)房中的應(yīng)用不僅能有效地保障機(jī)房穩(wěn)定安全的運(yùn)行,還能在一定程度上提高運(yùn)維管理的效率,降低機(jī)房的運(yùn)維管理成本。
我們知道,作為信息服務(wù)的支撐基礎(chǔ),數(shù)據(jù)機(jī)房是由很多的子系統(tǒng)組成的。各個(gè)子系統(tǒng)穩(wěn)定運(yùn)行依賴于眾多的IT 基礎(chǔ)設(shè)備,包括中間件、服務(wù)器、防火墻、數(shù)據(jù)庫、安全設(shè)備、網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)基礎(chǔ)線路等。隨著近幾年數(shù)據(jù)網(wǎng)絡(luò)機(jī)房規(guī)模和機(jī)房內(nèi)設(shè)備數(shù)量的不斷增加,運(yùn)維單位對(duì)機(jī)房中的設(shè)備的監(jiān)測(cè)管理已經(jīng)是一件不容忽視的事情。但是,當(dāng)前很多運(yùn)維單位對(duì)機(jī)房的運(yùn)維還是依靠傳統(tǒng)的方式,通過人工方式進(jìn)行查看。機(jī)房運(yùn)維管理人員通過制定值班制度,每天進(jìn)行排班管理,安排專人值班,不定時(shí)地對(duì)機(jī)房進(jìn)行巡查巡視,監(jiān)測(cè)UPS 電源情況。機(jī)房運(yùn)維人員從機(jī)房的基礎(chǔ)設(shè)備、服務(wù)器業(yè)務(wù)系統(tǒng)層和機(jī)房環(huán)境等不同的類別進(jìn)行維護(hù),但是工作量巨大且管理復(fù)雜和應(yīng)用環(huán)境復(fù)雜。在日常的巡檢中很難提前發(fā)現(xiàn)故障,只有當(dāng)故障爆發(fā)時(shí)才能發(fā)現(xiàn)并進(jìn)行故障排查和定位。雖然也能夠解決問題,但是傳統(tǒng)人工方式的被動(dòng)的運(yùn)維會(huì)在一定程度上影響系統(tǒng)的運(yùn)行。
傳統(tǒng)的模式進(jìn)行機(jī)房的運(yùn)維管理,一是會(huì)進(jìn)一步加重管理者的負(fù)擔(dān),并且很難及時(shí)地掌握機(jī)房內(nèi)設(shè)備情況,缺乏對(duì)事件發(fā)生的提前預(yù)知能力及風(fēng)險(xiǎn)的應(yīng)變能力,缺少對(duì)機(jī)房內(nèi)設(shè)備數(shù)據(jù)的有效分析和利用。二是傳統(tǒng)的“救火式”的運(yùn)維方式已經(jīng)無法滿足現(xiàn)代信息化機(jī)房的需要,不僅使得運(yùn)維人員終日忙于查找問題,無法提高運(yùn)維的質(zhì)量,也使得運(yùn)維單位對(duì)運(yùn)維服務(wù)的滿意度降低。三是在機(jī)房運(yùn)維成本中,近八成的成本支出是用于運(yùn)維人員的管理成本和培訓(xùn)成本,只有兩成是硬件設(shè)備和技術(shù)成本,使得運(yùn)維費(fèi)用過高。四是運(yùn)維的自動(dòng)化程度較低,導(dǎo)致信息管理部門在獲得大量的雜亂的信息警報(bào)時(shí)無法明確快速地尋找到問題根源,只能用手工方式進(jìn)行一一的比對(duì)檢查,大大地降低了運(yùn)維速度和質(zhì)量,也占用了很多資源,增加了運(yùn)維成本。五是運(yùn)維的集中程度較低。我國的IT 部門的機(jī)房硬件設(shè)備是由多家公司以大集中的形式采購集成的,每一家都有其對(duì)應(yīng)的運(yùn)維管理人員和開發(fā)人員,并對(duì)應(yīng)形成了運(yùn)維管理中心。在機(jī)房現(xiàn)場(chǎng)運(yùn)維中,出現(xiàn)故障問題,運(yùn)維單位不能進(jìn)行統(tǒng)一的指揮調(diào)度,只能由對(duì)應(yīng)公司的工程師進(jìn)行現(xiàn)場(chǎng)處理。這將導(dǎo)致在工程師的水平和事故處理問題的時(shí)間上很難進(jìn)行把控。六是機(jī)房管理中缺乏明確的運(yùn)維管理機(jī)制,出現(xiàn)故障時(shí)很難找到負(fù)責(zé)人,這就使得無法及時(shí)對(duì)問題進(jìn)行處理。因此,在機(jī)房運(yùn)維中利用信息化技術(shù)、大數(shù)據(jù)技術(shù)等對(duì)機(jī)房內(nèi)的設(shè)備設(shè)施進(jìn)行集中的管理調(diào)控是現(xiàn)代機(jī)房運(yùn)維管理的一個(gè)重要的問題,就是我們所說的IT 運(yùn)維。
信息化技術(shù)應(yīng)用于機(jī)房運(yùn)維就是我們說的自動(dòng)化運(yùn)維。自動(dòng)化機(jī)房運(yùn)維管理就是指通過信息化技術(shù),把日常機(jī)房運(yùn)維管理中的大量的重復(fù)冗余的工作,包括整個(gè)系統(tǒng)組織流程的變更、日常的機(jī)房設(shè)備檢查工作、機(jī)房環(huán)境監(jiān)控等,實(shí)現(xiàn)機(jī)房的主動(dòng)式運(yùn)維、平臺(tái)的智能調(diào)度、機(jī)房信息數(shù)據(jù)的感知,實(shí)現(xiàn)機(jī)房運(yùn)維的信息數(shù)據(jù)協(xié)調(diào)發(fā)展。有效地提高機(jī)房的供冷供熱系統(tǒng)的保障能力。IT 運(yùn)維自動(dòng)化可以把以前日常工作任務(wù)中基于手工操作的部分和組織流程等方面的變更轉(zhuǎn)變?yōu)榛谛畔⒒夹g(shù)的自動(dòng)化操作。通過建立知識(shí)庫的方式,主動(dòng)對(duì)機(jī)房設(shè)備及環(huán)境進(jìn)行監(jiān)測(cè),提前對(duì)事故預(yù)判、預(yù)測(cè)、預(yù)警和進(jìn)行事故信息處理。在突發(fā)事件發(fā)生時(shí),相關(guān)的監(jiān)控系統(tǒng)將會(huì)激發(fā)關(guān)聯(lián)系統(tǒng)并啟動(dòng)數(shù)據(jù)備份機(jī)制和故障響應(yīng)機(jī)制,將事故損失降到最小。IT 運(yùn)維可以定期地對(duì)機(jī)房內(nèi)設(shè)備、軟硬件和相關(guān)的依托網(wǎng)絡(luò)進(jìn)行日常的檢查,通過大數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行挖掘、收集、分析、處理,并與知識(shí)庫中的數(shù)據(jù)進(jìn)行比對(duì)后形成分析報(bào)告,供管理員查閱。
IDC 不僅具有主機(jī)運(yùn)行可靠和數(shù)據(jù)集中等傳統(tǒng)的數(shù)據(jù)中心具有的特點(diǎn),還有反應(yīng)迅速、能夠進(jìn)行7×24 小時(shí)的不間斷服務(wù)且訪問方式多樣的優(yōu)勢(shì)。IDC 的出現(xiàn)為信息化行業(yè)的建設(shè)開辟出了一條可持續(xù)發(fā)展的高效的道路。現(xiàn)在的IDC 機(jī)房可以給機(jī)房運(yùn)維服務(wù)提供良好的機(jī)房環(huán)境、龐大的數(shù)據(jù)存儲(chǔ)空間、安全的環(huán)境保證和優(yōu)秀的服務(wù)性能等等。簡單地說,IDC 作為提供機(jī)房運(yùn)行和維護(hù)環(huán)境的基礎(chǔ),可以有效地提高機(jī)房運(yùn)維的自動(dòng)化水平。
在機(jī)房的運(yùn)行維護(hù)和管理中存在著諸多分散的系統(tǒng),如網(wǎng)絡(luò)設(shè)備、管理系統(tǒng)、服務(wù)器、安全設(shè)備等等。這些設(shè)備相互獨(dú)立但又相互影響,單個(gè)的設(shè)備很難對(duì)所有設(shè)備進(jìn)行統(tǒng)一的監(jiān)控管理,這使得機(jī)房在運(yùn)維中容易形成監(jiān)控監(jiān)測(cè)的數(shù)據(jù)孤島。
機(jī)房運(yùn)維可視化利用虛擬現(xiàn)實(shí)技術(shù),在信息化技術(shù)的基礎(chǔ)上,生成一個(gè)有著感知能力的、逼真的機(jī)房環(huán)境。機(jī)房運(yùn)維管理人員和機(jī)房中的各種設(shè)備,管理系統(tǒng)等實(shí)現(xiàn)交互式操作,產(chǎn)生一種聲臨其境的交互式的、具有沉浸感的仿真場(chǎng)景。通過大數(shù)據(jù)技術(shù),及時(shí)準(zhǔn)確地收集匯總整理機(jī)房內(nèi)業(yè)務(wù)系統(tǒng)的運(yùn)行情況、各硬件設(shè)備的信息和對(duì)機(jī)房的實(shí)時(shí)環(huán)境監(jiān)測(cè),并且展現(xiàn)在虛擬環(huán)境中,使得機(jī)房的運(yùn)維工作從人工的被動(dòng)運(yùn)維模式轉(zhuǎn)向信息自動(dòng)化控制。
傳感器是一種通過電子芯片技術(shù)對(duì)機(jī)房內(nèi)部環(huán)境的溫度、甲醛、濕度等一些環(huán)境數(shù)據(jù)進(jìn)行采集,利用網(wǎng)絡(luò)技術(shù)進(jìn)行數(shù)據(jù)匯總的一種精密的儀器。通過傳感器技術(shù)匯總后的數(shù)據(jù)信息傳輸?shù)奖O(jiān)控室后呈現(xiàn)給管理員。機(jī)房運(yùn)維管理員通過得到的數(shù)據(jù)結(jié)果來利用干燥器、空調(diào)、加濕器等設(shè)備進(jìn)行機(jī)房溫度濕度等方面的調(diào)控,從而保證機(jī)房環(huán)境對(duì)機(jī)房設(shè)備和系統(tǒng)運(yùn)行環(huán)境的適宜。
傳感器網(wǎng)絡(luò)的構(gòu)建可以基于ZigBee 技術(shù)。ZigBee技術(shù)可以將傳感器采集到的機(jī)房數(shù)據(jù)信息以無介質(zhì)的形式傳輸?shù)絽R聚節(jié)點(diǎn)。匯聚節(jié)點(diǎn)收集信息,進(jìn)行匯總后利用光纖網(wǎng)絡(luò)傳輸至服務(wù)器端,服務(wù)器利用大數(shù)據(jù)分析技術(shù)對(duì)機(jī)房的環(huán)境狀況進(jìn)行分析。除此以外,服務(wù)器可以對(duì)所有數(shù)據(jù)信息進(jìn)行保存記錄,運(yùn)維管理人員可以隨時(shí)對(duì)數(shù)據(jù)信息進(jìn)行查看。通過傳感器技術(shù)的應(yīng)用,可以實(shí)現(xiàn)機(jī)房運(yùn)維控制的自動(dòng)化。
IT 運(yùn)維要實(shí)現(xiàn)高效自動(dòng)化的第一步就是要利用信息化技術(shù)建立自動(dòng)的管理和監(jiān)控平臺(tái)。利用監(jiān)控工具對(duì)機(jī)房硬件設(shè)備、軟件系統(tǒng)、機(jī)房環(huán)境等進(jìn)行實(shí)時(shí)的監(jiān)測(cè)來實(shí)現(xiàn)機(jī)房的集中管理和故障的實(shí)時(shí)處理。現(xiàn)代化信息技術(shù)大量應(yīng)用于機(jī)房的運(yùn)維中,使得機(jī)房的運(yùn)維管理越來越自動(dòng)化。自動(dòng)化的運(yùn)維可以實(shí)現(xiàn)機(jī)房故障的定點(diǎn)定位。如果機(jī)房出現(xiàn)故障問題,系統(tǒng)會(huì)及時(shí)準(zhǔn)確地通知相關(guān)的負(fù)責(zé)人,并顯示故障位置,縮短故障排查時(shí)間。所以說,將信息化技術(shù)更多地應(yīng)用于機(jī)房運(yùn)維中,可以大大降低機(jī)房運(yùn)維成本和人工,在一定程度上提高運(yùn)維服務(wù)水平和用戶的滿意度。