何平
摘 要:服務(wù)器作為ATS系統(tǒng)的核心設(shè)備,其包含硬件和軟件兩部分。正確的維護方法及使用安全策略,可以降低故障的發(fā)生機率,確保ATS系統(tǒng)的正常運行,為地鐵的行車指揮提供正確、及時的依據(jù)。
關(guān)鍵詞:服務(wù)器 LINUX 安全策略 維護
中圖分類號:S757.4+2 文獻標(biāo)識碼:A 文章編號:1674-098X(2015)07(a)-0055-02
1 研究背景及意義
ATS(列車自動監(jiān)控系統(tǒng))是ATC(列車運行自動控制系統(tǒng))的一個子系統(tǒng),擔(dān)負(fù)著全線列車運行的自動監(jiān)控任務(wù)。它是地鐵信號系統(tǒng)的指揮中心,負(fù)責(zé)監(jiān)視和控制線路中所有列車的運行狀態(tài)。特別是ATS系統(tǒng)的核心設(shè)備服務(wù)器,承載實現(xiàn)信號系統(tǒng)監(jiān)督和控制的各項功能軟件的運行,因而保證ATS系統(tǒng)服務(wù)器的正常工作顯得至關(guān)重要。
西安地鐵一號線的服務(wù)器主要設(shè)置在控制中心、正線三個信號一級設(shè)備集中站及場/段,由HP/IBM工業(yè)級服務(wù)器、北京通號A100分機構(gòu)成,均為熱備冗余設(shè)計,保障了ATS系統(tǒng)運行的安全性和穩(wěn)定性。所有服務(wù)器均采用基于LINUX操作系統(tǒng)下的軟件實現(xiàn)統(tǒng)一的功能。在日常維護工作中除去定期進行用戶訪問、除塵等常規(guī)性維護外,特別應(yīng)對服務(wù)器內(nèi)部硬件和軟件進行重點監(jiān)督檢查,掌握服務(wù)器的工作性能,排除設(shè)備日常維護的故障隱患。該文將結(jié)合西安地鐵一號線ATS子系統(tǒng)運營維護情況對運營期間的ATS服務(wù)器安全策略及維護進行討論。
2 安全策略管理
2.1 加強服務(wù)器設(shè)備輸入/輸出端口的安全管理
服務(wù)器設(shè)備與外界通訊的輸入/輸出端口包括光盤驅(qū)動器、USB接口、鍵盤和鼠標(biāo)等。在沒有授權(quán)的情況下使用這些設(shè)備會導(dǎo)致CPU使用率增加,系統(tǒng)內(nèi)存資源開銷增大,信息處理的實時性降低,從而導(dǎo)致系統(tǒng)性能下降。
ATS服務(wù)器具備設(shè)備分布分散的特點,日常運營中除控制中心外,其他地域服務(wù)器無法實現(xiàn)24小時監(jiān)控,特別是位于車站設(shè)備房內(nèi)的設(shè)備,進入人員混雜,僅靠維護人員巡視很難有效的實現(xiàn)對設(shè)備管理。若在沒有授權(quán)的情況下使用這些設(shè)備會導(dǎo)致系統(tǒng)資源被占用,尤其是接入的外置設(shè)備帶有病毒時,會導(dǎo)致病毒侵入、系統(tǒng)崩潰,甚至嚴(yán)重的威脅整個信號系統(tǒng)安全。故在設(shè)備交接期間,應(yīng)對設(shè)備不常用端口(例如一般站LOW機、維護工作站等)進行貼封,達到基礎(chǔ)安全把控作用。但該做法僅能在事后發(fā)現(xiàn)進行補救,不能有效的扼制事件的發(fā)生。最佳方式應(yīng)為通過對系統(tǒng)進行軟操作,關(guān)閉空閑端口、光驅(qū)等端口驅(qū)動,降低外部數(shù)據(jù)進入幾率,減小外部數(shù)據(jù)侵入風(fēng)險。
2.2 加強設(shè)備的性能檢測及時排除隱患
ATS系統(tǒng)服務(wù)器需要具有很高的實時數(shù)據(jù)采集和處理能力。在正常情況下,服務(wù)器是24小時不間斷工作的,隨著運行時間的不斷增加,會影響內(nèi)存的頁面調(diào)度和占用情況、網(wǎng)絡(luò)的工作狀態(tài)、CPU的使用率等方面的安全和穩(wěn)定。通過檢測系統(tǒng)資源狀態(tài)可以確認(rèn)系統(tǒng)的可用性,采取適當(dāng)?shù)木S護措施(如重啟、增加、更換高性能硬件等)來保證系統(tǒng)的健康、安全。
有時設(shè)備存在小故障時,系統(tǒng)也不一定會馬上停止工作(如機箱風(fēng)扇故障);另外設(shè)備的運行環(huán)境(溫度、濕度、煙塵),不間斷電源保障能力也非常重要。通過周期性的巡檢工作,可以及時地發(fā)現(xiàn)故障隱患。所以在加強設(shè)備性能檢測的同時應(yīng)加強設(shè)備的巡檢工作。
2.3 加強操作人員的口令安全管理,專人專用
ATS系統(tǒng)設(shè)備的使用者比較繁雜,難免有些內(nèi)部人員有意或者無意的執(zhí)行非法操作和使用禁用設(shè)備,造成病毒侵入或操作系統(tǒng)損壞的可能;所以有必要將用戶分為不同的安全等級,例如將ATS維護人員設(shè)為root超級用戶(擁有l(wèi)inux系統(tǒng)下所有操作權(quán)限),而操作人員設(shè)為受限用戶(根據(jù)需要給予linux系統(tǒng)部分操作權(quán)限)。通過對操作人員權(quán)限控制,只允許對ATS系統(tǒng)軟件進行操作,限制對系統(tǒng)的非法訪問和修改,可以有效地減少系統(tǒng)的出錯率。同時應(yīng)定期更改用戶密碼,防止因密碼泄漏,造成非相關(guān)人員登陸系統(tǒng)。
2.4 設(shè)備備份
設(shè)備備份需要在系統(tǒng)環(huán)境配置完成后進行一次備份及在每次軟件升級完成后進行一次備份,并在備份完成后進行測試。當(dāng)發(fā)生較大故障需要更換硬盤或重裝軟件時,可以直接進行替換。
一號線服務(wù)器在進行備份時需借用外界存貯設(shè)備及使用外來微型操作系統(tǒng),一般使用G4L軟件。所以要求在進行備份時要注意外接存儲設(shè)備及備份軟件的干凈,同時由于服務(wù)器系統(tǒng)數(shù)據(jù)量大,建議采用備件硬盤進行備份,在故障情況下可以直接進行更換,減小故障處理時間。
3 常規(guī)維護方法
3.1 定時重啟服務(wù)器
服務(wù)器在長時間運行過程中,會產(chǎn)生很多冗余的程序,占用內(nèi)存和CPU資源;另外會在系統(tǒng)的/home/s/sys、/tmp、/var,/home/logs目錄中產(chǎn)生一些臨時的信息文件(見圖3)。定期執(zhí)行服務(wù)器重啟可以激活清理臨時盤區(qū)的腳本,對系統(tǒng)的部分臨時文件進行清理,凈化硬盤空間,同時釋放更多的內(nèi)存和CPU資源。
3.2 硬盤空間檢查
當(dāng)硬盤根分區(qū)占用率在90%以上時,可能會造成計算機運行速度變慢,甚至不能正常啟動。因此需要在日常維護中時刻檢查硬盤空間的使用情況,可以通過df命令針對硬盤的可用空間、讀盤和存盤的速度進行檢查,在命令行窗口內(nèi)輸入df-k命令,查看服務(wù)器硬盤各分區(qū)的使用情況,若某一分區(qū)使用比率較大,還可以通過du命令找出分區(qū)中哪一個目錄占用了大量硬盤空間。如錄放的次數(shù)過多或時間過長,大量的記錄文件沒有及時清除,系統(tǒng)故障時產(chǎn)生的core文件過大等造成硬盤空間被占用,可以根據(jù)情況進行相應(yīng)清理或轉(zhuǎn)存。
3.3 進程監(jiān)督
服務(wù)器的操作系統(tǒng)和應(yīng)用軟件不管是在前臺還是在后臺運行,都會有相對應(yīng)的進程。作為系統(tǒng)維護人員,要想知道各服務(wù)器頻繁運行的進程名稱??梢杂胮s-lT命令顯示當(dāng)前終端正在運行的所有進程及其詳細(xì)狀態(tài)信息,監(jiān)督進程和系統(tǒng)資源的利用情況(見圖5)。在運行過程中有可能進程被終止了,會在系統(tǒng)信息文件中會產(chǎn)生相應(yīng)的報告(見圖6)。如果發(fā)現(xiàn)進程被終止,可以用命令“service進程名字start”,重新激活程序進程。
4 結(jié)語
ATS系統(tǒng)作為地鐵信號系統(tǒng)正常運行的指揮基礎(chǔ),作為其核心的服務(wù)器設(shè)備需要不間斷運行,進而對發(fā)生故障時的處理時效性及日常維護保養(yǎng)提出了更高的要求,服務(wù)器的硬件設(shè)計雖為熱備冗余,但仍存在一定風(fēng)險。所以需要在ATS系統(tǒng)服務(wù)器的安全策略及日常維護保養(yǎng)工作中采用正確的思路和方法,以便降低服務(wù)器發(fā)生故障的機率,提高運營維護效率。
參考文獻
[1] 余柏山.LINUX系統(tǒng)管理與網(wǎng)絡(luò)管理[M].清華大學(xué)出版社,2010.
[2] Wimor J.Solaris 8系統(tǒng)管理指南[M].宇塵翻譯組,譯.北京機械工業(yè)出版社,2002.