錢軍 刁志堅
摘 要:隨著國家中小企業(yè)信息化產(chǎn)業(yè)建設(shè)不斷的飛速發(fā)展,隨之帶來的就是中小企業(yè)用戶信息化建設(shè)的發(fā)展,用戶的網(wǎng)絡(luò)規(guī)模日益增長,網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜。因此,IT運維對于用戶尤為重要。到了今天,單一的網(wǎng)絡(luò)管理維護(hù)已經(jīng)無法滿足用戶對于信息化穩(wěn)定性的需要,整體的IT運維已經(jīng)取代了過去單一的網(wǎng)絡(luò)維護(hù),網(wǎng)管員的工作已經(jīng)升級到了IT管理者的層次。
關(guān)鍵詞:信息化建;中小企業(yè);網(wǎng)絡(luò)管理;IT運維
1 企業(yè)運維的主要難題
1.1 IDC服務(wù)商的選擇
服務(wù)器增多,就要找好的IDC運營商;不然會出現(xiàn)服務(wù)器裝錯、域名白名單取消、機柜的帶寬流量無法實時監(jiān)控、CDN效果不佳等問題。
1.2 服務(wù)器提供商和型號的選擇
例如出現(xiàn)DELL R410固件問題,每當(dāng)服務(wù)器高流量的時候,服務(wù)器網(wǎng)卡會自動斷流,需要手動重啟網(wǎng)卡,到最后也未能完全解決;之前還遇到過內(nèi)存,主板故障等問題,服務(wù)器的硬件一旦出現(xiàn)問題,就意味著停機檢修,服務(wù)自然要中斷。所以在服務(wù)器的選擇上也要慎重,而不是只考慮價格問題。
1.3 負(fù)載均衡和故障轉(zhuǎn)移
流量大了,或者業(yè)務(wù)重要性高,就要求最大可能提供服務(wù)器的高可用性和數(shù)據(jù)容災(zāi),自然要部署負(fù)載均衡和故障轉(zhuǎn)移;是采用硬件F5,cisco還是軟件lvs,keepalvie,heartbeat,nginx方式實現(xiàn),效果如何?都需要去考量。
1.4 運維團(tuán)隊和人才的培養(yǎng)
對于中小企業(yè)來講,IT運維人才的流失是比較可惜的,如何去留住一批優(yōu)秀的運維人才也是企業(yè)需要考慮的問題。其實不只運維,企業(yè)要想有長遠(yuǎn)的發(fā)展都應(yīng)當(dāng)想方設(shè)法留住人才,控制公司的人員流失率,要讓員工有歸屬感和榮譽感,而不是只有赤裸裸的雇傭關(guān)系;企業(yè)應(yīng)該著重培養(yǎng)一支高素質(zhì),高凝聚力的運維團(tuán)隊,而不是只當(dāng)運維是業(yè)務(wù)部門和程序部門間的夾心餅,里外不是人,這樣的環(huán)境和團(tuán)隊是留不住人才的。
2 企業(yè)運維人員的工作職責(zé)
2.1 保證服務(wù)器上正常的運行
怎么樣才能算正常的運行呢?論壇卡,服務(wù)器慢,網(wǎng)站打不開之類的問題,出問題的有可能是服務(wù)器,也可能是用戶端或者就是中間的網(wǎng)絡(luò)傳輸問題,在中國最典型的就是南北互通的問題,因為這種問題很難判斷,所以一般管理者會要求運維每年的故障時間不能超過一定的值,說7*24*365服務(wù)不間斷運行,但是總會有各種各樣的問題,無論你用了什么負(fù)載均衡,故障轉(zhuǎn)移技術(shù),服務(wù)臨時中斷也是避免不了的,運維的價值在于在縮短服務(wù)中斷后的MTTR時間,可見運維的壓力是很大的。
2.2 備份關(guān)鍵數(shù)據(jù),及時處理各種故障,保證服務(wù)器安全
備份是為了恢復(fù),一般想到或者用到備份的時候,都是出現(xiàn)麻煩的時候,所以平常工作中對備份一定要足夠的重視,尤其是數(shù)據(jù)庫,在某些時候,看起來多年前的備份可能會給你的恢復(fù)工作帶來意想不到的作用;服務(wù)器的安全部分又是復(fù)雜的概念,因為安全本身就是相對的,而且安全和性能,用戶體驗之間是成反比的,運維在很多時候都是犧牲安全來換取性能和更好的用戶體驗,等將來安全上出現(xiàn)問題的時候再調(diào)整。
2.3 及時調(diào)整服務(wù)器各項設(shè)定滿足業(yè)務(wù)需要
框架定了,服務(wù)器選了,一般是不會輕易改動的,但設(shè)置服務(wù)器的工作卻是每天都有的。程序有時需要部署個memcache,有時需要個中文分詞系統(tǒng),有時需要加個虛擬主機。運維人員在做這類工作的時候不能像應(yīng)付任務(wù)那樣,但求過關(guān)即可,否則日積月累下來,服務(wù)器會出現(xiàn)意想不到的情況。在處理這類工作上運維人員應(yīng)當(dāng)做到規(guī)范和文檔記錄,長期做下來,不但自己的運維專業(yè)水平會提高,對于后期的維護(hù)也會起到良性循環(huán)作用。
2.4 記錄服務(wù)器維護(hù)日志和技術(shù)文檔
這點都是在處理完問題后記錄下,方便加快日后處理同類問題的速度和效率;至于技術(shù)文檔,身為運維人員一定要認(rèn)真編寫,寫的很糟糕的文檔會給人誤導(dǎo)作用,internet上這類文章不在少數(shù),本身IT這個行業(yè)就是很浮躁的,如果不能靜下心來好好整理知識,總有一天會被淘汰的;對于過去整理的文檔要定期的去溫習(xí),有錯的要及時更正。
3 企業(yè)運維工具的選擇
隨著企業(yè)的業(yè)務(wù)對IT的依賴越來越多,企業(yè)的服務(wù)器的架構(gòu)規(guī)模不斷擴展,為了更有效率的執(zhí)行任務(wù),為了我們運維人員不再像流水線上的一名工人一樣不斷重復(fù)的做著同樣的工作,我們將會用一類工具,這類工具是可編程的,我們只是需要寫上一些代碼就可以幫我們自動完成所有的工作。很公司用的是瑞寧CAM,集中審計管控系統(tǒng),除了能完成自動化運維的工作,比如系統(tǒng)安裝、系統(tǒng)升級、批量修改密碼、主機名規(guī)范、終端資源監(jiān)控、批量配置管理、終端批量實時操控等等,還有事后審計回放的功能,對于事后總結(jié)自己的工作,查找錯誤點非常有幫助。此外常見的運維工具還有:ickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
[參考文獻(xiàn)]
[1]付資亮.K公司IT運維管理研究[D].華南理工大學(xué).2011年.
[2]王艷君.淺析IT運維的現(xiàn)狀與對策[J].中小企業(yè)管理與科技(下旬刊).2011年03期.
[3]唐琳,李偉.基于用戶體驗的“主動式”信息運維管理實踐[J].電力信息化.2013年03期.
[4]丁云成,王必榮,孫靜.基于ITIL的IT服務(wù)管理系統(tǒng)的應(yīng)用[J].電腦知識與技術(shù).2008年07期.