第一層展現層:通過虛擬IP或域名訪問硬件監(jiān)控系統,如果Portal1宕機,Portal1用戶會切換到Portal2上。
第二層數據采集層:每個采集器負責監(jiān)控一部分設備,當其中一個采集服務宕機,它的采集任務自動被其他采集服務接管。
第三層數據庫層:數據庫 支 持 MySQL、SQLServer、Oracle。數據庫集群采用其自身所支持的集群方式。
系統支持自動采集設備的部件級的硬件配置信息如圖1所示,解決了資產信息不能及時同步的問題。
對設備資產的位置、空間、能耗、責任人、IP等數據進行可視化管理。統一可視化展現機房空間、能源使用情況,設備的物理位置、運行狀態(tài)、設備視圖。
圖1 自動采集部件級資產數據
支持對IBM、HP、DELL、等廠家的服務器的硬件狀態(tài)監(jiān)測。通過SNMPTrap、Syslog等方式獲取各類服務器帶外支持的告警信息,監(jiān)控系統能在幾秒鐘的時間內獲取詳細的故障信息。通過服務器的管理口實現遠程開關機、重啟、單點登錄服務器操作系統功能、虛擬媒體功能??梢郧逦私庠O備故障率、維修率等信息。
通過Portal統一定義;“一鍵式”快速、批量的設置資源的監(jiān)控策略。對于相同類型的資源,可批量將其加入監(jiān)控策略,并且系統提供指標的默認值,不必一個一個去設定采集頻度、閾值等。對同一資源的相同組件也可采用不同的監(jiān)控策略??筛鶕O備的重要程度,設置不同的監(jiān)控頻度、閾值、事件級別、報警等,具備分級報警功能。
建立“知識庫”,通過檢索查詢自動關聯類似故障處理的記錄匹配,提供給管理人員類似事故的解決方案和處理過程等信息,提高管理人員對事故的分析過程,從而達到提高用戶“自助式服務”能力的目的。
通過將CloudSino OOBS項目實施,對不同品牌服務器、存儲、光纖交換機的統一監(jiān)控管理,客戶能在第一時間得到設備的運行狀態(tài),降低運營維護成本,控制風險,使IT監(jiān)管工作建立在統一科學的管理標準上,保證生產系統安全、平穩(wěn)運行。