田夏利,熊 瑩
(武漢理工大學(xué)華夏學(xué)院,湖北武漢430223)
本地網(wǎng)網(wǎng)優(yōu)性能實(shí)時(shí)監(jiān)控系統(tǒng)的構(gòu)建
田夏利,熊 瑩
(武漢理工大學(xué)華夏學(xué)院,湖北武漢430223)
提出了一個(gè)網(wǎng)絡(luò)優(yōu)化監(jiān)控中心的構(gòu)建方案,本系統(tǒng)采用現(xiàn)代計(jì)算機(jī)信息技術(shù)、先進(jìn)可靠的系統(tǒng)平臺(tái)和穩(wěn)定高效的應(yīng)用軟件,建立通訊功能強(qiáng)、操作界面直觀方便,集BSC監(jiān)控管理、基站監(jiān)控管理、小區(qū)監(jiān)控管理、故障告警統(tǒng)計(jì)、實(shí)時(shí)告警智能排障處理、自動(dòng)巡查檢測基站運(yùn)行狀況、自動(dòng)檢測小區(qū)性能狀態(tài)指標(biāo)、告警前轉(zhuǎn)、自動(dòng)故障派單等若干先進(jìn)功能于一體的現(xiàn)代化計(jì)算機(jī)局域網(wǎng)系統(tǒng).
網(wǎng)絡(luò)優(yōu)化;實(shí)時(shí)監(jiān)控;告警處理
武漢(移動(dòng))本地網(wǎng)網(wǎng)優(yōu)中心目前在網(wǎng)絡(luò)優(yōu)化方面?zhèn)戎赜趯υO(shè)備運(yùn)行情況和運(yùn)行性能的監(jiān)控,無法準(zhǔn)確反映客戶使用網(wǎng)絡(luò)通信時(shí)對網(wǎng)絡(luò)質(zhì)量的實(shí)際感知情況.目前主要采取手動(dòng)搜告警的方法對TCH掉話和擁塞進(jìn)行實(shí)時(shí)查看,對全網(wǎng)基站的性能監(jiān)控工作量極為巨大,人工監(jiān)控相對困難,有時(shí)甚至?xí)z漏一些重要的告警,所以我們需要實(shí)現(xiàn)網(wǎng)絡(luò)性能告警自動(dòng)化.即可以實(shí)時(shí)地對網(wǎng)絡(luò)的運(yùn)行狀態(tài)進(jìn)行監(jiān)視,對網(wǎng)絡(luò)優(yōu)化關(guān)鍵性能指標(biāo)的實(shí)時(shí)檢測和對特定事件的記錄,對超出門限值的指標(biāo)應(yīng)予告警等.
通過本系統(tǒng)建立武漢本地網(wǎng)網(wǎng)絡(luò)優(yōu)化監(jiān)控中心.系統(tǒng)的實(shí)時(shí)監(jiān)控模塊除監(jiān)控到小區(qū)級的用戶感知告警外,還為維護(hù)人員建立健全實(shí)時(shí)、準(zhǔn)確、實(shí)用、方便的符合武漢本地網(wǎng)特點(diǎn)的小區(qū)性能監(jiān)控、維護(hù)手段,把維護(hù)人員從繁重的重復(fù)勞動(dòng)中解放出來,把有限的精力投入到更高層次的網(wǎng)絡(luò)優(yōu)化工作中去.同時(shí),系統(tǒng)的各類統(tǒng)計(jì)報(bào)表模塊為各級領(lǐng)導(dǎo)提供網(wǎng)絡(luò)擴(kuò)容、網(wǎng)絡(luò)優(yōu)化、基站建設(shè)方面的決策支持.
系統(tǒng)總體框架——軟件模型
武漢本地網(wǎng)網(wǎng)優(yōu)性能監(jiān)控系統(tǒng)技術(shù)需求有如下特點(diǎn):適應(yīng)業(yè)務(wù)的變化、適應(yīng)網(wǎng)絡(luò)的變化、適應(yīng)應(yīng)用報(bào)表的變化、網(wǎng)絡(luò)資源的安全性、大容量數(shù)據(jù)存儲(chǔ)處理等.因此我們建議的系統(tǒng)軟件模型采用三層客戶機(jī)/應(yīng)用服務(wù)器/數(shù)據(jù)庫模式(C/AS/DS),同時(shí)引入數(shù)據(jù)倉庫技術(shù).系統(tǒng)總體框架如下圖所示:
采用三層C/AS/DS結(jié)構(gòu),形成了業(yè)務(wù)表現(xiàn)層、業(yè)務(wù)管理層、數(shù)據(jù)采集管理層三個(gè)層次,降低了數(shù)據(jù)庫服務(wù)器的負(fù)擔(dān);同時(shí)在業(yè)務(wù)管理層實(shí)現(xiàn)了用戶管理等業(yè)務(wù)功能,使得在業(yè)務(wù)變化時(shí),只需在本層調(diào)整相關(guān)構(gòu)件,大大提高了系統(tǒng)的可管理性、可擴(kuò)展性;三層C/AS/DS結(jié)構(gòu)在系統(tǒng)的安全性方面也較二層C/S結(jié)構(gòu)有重大的提高,使得對權(quán)限的管理從數(shù)據(jù)級的控制上升到業(yè)務(wù)功能級的控制;另外,三層C/AS/DS結(jié)構(gòu)更適合在分布式廣域網(wǎng)環(huán)境下運(yùn)行,便于以后系統(tǒng)的擴(kuò)展、升級.同時(shí)在業(yè)務(wù)邏輯層使用了多線程技術(shù)來提高系統(tǒng)的處理能力.
根據(jù)選用的軟件模型,系統(tǒng)采用嚴(yán)格的分層設(shè)計(jì)思想,構(gòu)建了網(wǎng)優(yōu)數(shù)據(jù)適配層、業(yè)務(wù)處理層以及上層應(yīng)用等三個(gè)邏輯層次,程序處理與邏輯處理分離技術(shù),每個(gè)邏輯層都有相應(yīng)的基礎(chǔ)模塊.
數(shù)據(jù)采集層主要通過多線程實(shí)時(shí)監(jiān)控硬件設(shè)備的使用狀態(tài),完成數(shù)據(jù)的動(dòng)態(tài)采集,業(yè)務(wù)邏輯層對數(shù)據(jù)通過映射、變形、匯總、分析、保存、轉(zhuǎn)發(fā)等提交到上一層,應(yīng)用層主要是對客戶前端發(fā)出的請求數(shù)據(jù)或業(yè)務(wù)邏輯層轉(zhuǎn)發(fā)數(shù)據(jù)進(jìn)行相應(yīng)的處理并呈現(xiàn).
在業(yè)務(wù)邏輯層的描述中,我們將業(yè)務(wù)邏輯和業(yè)務(wù)操作分離開來.所以在業(yè)務(wù)操作請求與具體的業(yè)務(wù)操作之間需要一個(gè)映射層,而且由于業(yè)務(wù)操作的分散性和數(shù)據(jù)格式的多樣性,該層還需要保障信息可靠傳遞和轉(zhuǎn)換不同數(shù)據(jù)格式的功能.
業(yè)務(wù)操作是業(yè)務(wù)邏輯的基礎(chǔ).業(yè)務(wù)操作層的作用是把業(yè)務(wù)請求轉(zhuǎn)化為一個(gè)個(gè)具體的數(shù)據(jù)操作.我們通過將業(yè)務(wù)中一個(gè)具體操作轉(zhuǎn)化為一個(gè)響應(yīng)的應(yīng)用邏輯,從而將業(yè)務(wù)操作的請求和數(shù)據(jù)源分離.
告警管理模塊
該模塊為系統(tǒng)核心模塊之一,包括告警采集、分析、入庫、發(fā)布、前轉(zhuǎn)等子模塊.該模塊普遍采用多線程技術(shù),各子模塊都由一組獨(dú)立的線程組成,系統(tǒng)自動(dòng)調(diào)整各線程組的線程數(shù)量,以使服務(wù)器達(dá)到最佳性能.各子模塊相互關(guān)系如下:
告警采集:采用多線程技術(shù)同時(shí)連接20個(gè)BSC,采集各類告警數(shù)據(jù),包括A1告警、A2告警、各類性能告警.接收線程收到數(shù)據(jù)后將實(shí)時(shí)反饋給服務(wù)器的告警分析線程,讓告警轉(zhuǎn)入后續(xù)處理過程.
告警分析:根據(jù)用戶定義的規(guī)則分析高進(jìn)采集線程反饋的數(shù)據(jù),產(chǎn)生其他模塊能夠理解的xml格式的告警信息,包括告警報(bào)告號(hào)、告警網(wǎng)元、告警基站、告警小區(qū)、告警級別、產(chǎn)生時(shí)間、告警標(biāo)題、告警正文等信息,如果是小區(qū)告警,系統(tǒng)還需分析出告警MO、ALARM SLOGAN等信息.同時(shí)該子模塊還維護(hù)各BSC的活躍告警列表,以減少對數(shù)據(jù)庫的直接操作,提升數(shù)據(jù)庫服務(wù)器的整體性能.告警分析完成后將轉(zhuǎn)入入庫、發(fā)布、前站等流程.
告警入庫:告警入庫線程組根據(jù)告警分析線程分析出的告警列表,將新產(chǎn)生的告警插入數(shù)據(jù)庫相關(guān)數(shù)據(jù)表中,當(dāng)告警消除時(shí)在數(shù)據(jù)庫中做相應(yīng)標(biāo)記并記錄消除時(shí)間.
告警發(fā)布:告警發(fā)布程序負(fù)責(zé)把分析過的告警數(shù)據(jù)發(fā)送到客戶端,由客戶端完成告警的顯示及聲光提示等功能.告警發(fā)布線程組的線程數(shù)量跟當(dāng)前聯(lián)機(jī)的客戶端數(shù)量一致,即一個(gè)線程管理一個(gè)監(jiān)控客戶端的告警發(fā)布.
告警前轉(zhuǎn):通過本系統(tǒng)的短信網(wǎng)關(guān)接口模塊,告警前轉(zhuǎn)模塊根據(jù)前轉(zhuǎn)規(guī)則配置將符合前轉(zhuǎn)條件的告警信息(一般為重大告警)發(fā)送到相應(yīng)的手機(jī)上,提醒維護(hù)人員及時(shí)處理.
網(wǎng)優(yōu)經(jīng)驗(yàn)管理模塊
系統(tǒng)提供網(wǎng)絡(luò)優(yōu)化經(jīng)驗(yàn)管理機(jī)制,用戶可針對各類告警填寫處理步驟及每個(gè)步驟的含義,一方面實(shí)現(xiàn)維護(hù)經(jīng)驗(yàn)的積累,另一方面,當(dāng)障礙發(fā)生時(shí)系統(tǒng)會(huì)搜索經(jīng)驗(yàn)庫,并作為建議恢復(fù)方法顯示在用戶操作界面中,供用戶參考.
命令代理模塊
系統(tǒng)提供命令代理機(jī)制,整個(gè)系統(tǒng)中只有服務(wù)器連接網(wǎng)元,保證所有命令都只從服務(wù)器發(fā)出,客戶端不直接向網(wǎng)元發(fā)送任何命令;同時(shí)服務(wù)器建立授權(quán)命令列表,提供命令審核機(jī)制,該審核機(jī)制只允許經(jīng)授權(quán)的、特定的、安全的、不對網(wǎng)元造成影響的命令通過,保證交換機(jī)的安全性;另外,當(dāng)有成批命令發(fā)往網(wǎng)元時(shí),系統(tǒng)提供暫緩執(zhí)行的保護(hù)機(jī)制,降低系統(tǒng)給網(wǎng)元帶來的負(fù)荷.系統(tǒng)還提供命令記錄、查詢機(jī)制,對發(fā)往網(wǎng)元的命令記錄詳細(xì)的日志,以備用戶事后查詢.
EOMS接口模塊
系統(tǒng)提供與EOMS系統(tǒng)的接口,并可根據(jù)用戶配置的規(guī)則生成故障工單自動(dòng)發(fā)送給相關(guān)部門或相關(guān)人員,無需人工干預(yù),規(guī)范了障礙處理流程,加快了障礙處理速度,減少維護(hù)人員工作量.
智能排障:系統(tǒng)提供智能化的、可配置的自動(dòng)排障機(jī)制:用戶可根據(jù)特定障礙的處理流程撰寫障礙處理腳本,當(dāng)告警發(fā)生時(shí)系統(tǒng)執(zhí)行相應(yīng)的腳本,向網(wǎng)元發(fā)送障礙恢復(fù)命令,自動(dòng)處理并恢復(fù)障礙,達(dá)到無需人工干預(yù)即自動(dòng)恢復(fù)障礙的目的,一方面減少了維護(hù)人員的工作量,另一方面極大的提高了障礙處理效率,縮短了障礙恢復(fù)時(shí)間.
系統(tǒng)自帶一定的處理腳本,經(jīng)培訓(xùn)后,用戶可以自行編制這種腳本,經(jīng)過不斷的積累,系統(tǒng)會(huì)變的越來越“聰明”、越來越人性化,需要人工處理的障礙會(huì)越來越少,維護(hù)人員的重復(fù)勞動(dòng)工作量也會(huì)越來越少.
TCH擁塞、掉話監(jiān)控模塊
系統(tǒng)根據(jù)用戶設(shè)定的采集頻率7×24小時(shí)自動(dòng)采集各小區(qū)的TCH擁塞、掉話數(shù)據(jù),記錄在數(shù)據(jù)庫中,并按用戶設(shè)定的門限值產(chǎn)生相應(yīng)告警發(fā)送到客戶端,通過GIS系統(tǒng)在客戶端進(jìn)行準(zhǔn)確的圖形化再現(xiàn);同時(shí)客戶端程序也提供列表化的呈現(xiàn)方式,將告警統(tǒng)一呈現(xiàn)在表格中,并提供簡捷實(shí)用的過濾方法方便用戶查看告警.系統(tǒng)每天自動(dòng)產(chǎn)生《TCH擁塞率超標(biāo)小區(qū)排名表》、《TCH可用率不足小區(qū)排名表》、《TCH掉話率超標(biāo)小區(qū)排名表》等報(bào)表,方便維護(hù)人員進(jìn)行網(wǎng)絡(luò)優(yōu)化.
話務(wù)量異常管理模塊
系統(tǒng)自動(dòng)保存30天每小時(shí)每小區(qū)的話務(wù)量,以上周同一時(shí)段的平均話務(wù)量為標(biāo)準(zhǔn),如果當(dāng)日該時(shí)段的話務(wù)量高于或低于該標(biāo)準(zhǔn)的40%則產(chǎn)生告警,時(shí)間以小時(shí)為單位.
本文闡述了一種擴(kuò)展性好、功能全面、運(yùn)行穩(wěn)定的網(wǎng)絡(luò)性能監(jiān)控系統(tǒng).提出了層次化、模塊化的系統(tǒng)設(shè)計(jì)模型,描述了各模塊的實(shí)現(xiàn)方法.通過開發(fā)實(shí)時(shí)監(jiān)控告警系統(tǒng)以后,起到對網(wǎng)絡(luò)系統(tǒng)的監(jiān)測和控制.隨著它的誕生,業(yè)務(wù)信息系統(tǒng)的運(yùn)行搭建了統(tǒng)一的管理平臺(tái),從而減少了人工維護(hù)的成本,提高了數(shù)據(jù)管理的效率,使業(yè)務(wù)得到了集中,技術(shù)風(fēng)險(xiǎn)的可控性提高.
〔1〕陳蕊.移動(dòng)通信機(jī)房設(shè)備故障集中監(jiān)控探討[J].科技探索,2011(10).
〔2〕劉進(jìn)軍,趙生慧,等.可擴(kuò)展的網(wǎng)絡(luò)性能監(jiān)控系統(tǒng)[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(10).
TN919.2
A
1673-260X(2013)09-0133-02
華夏學(xué)院科研基金資助項(xiàng)目“面向用戶的網(wǎng)絡(luò)性能實(shí)時(shí)告警系統(tǒng)”(HX 20120201),(湖北移動(dòng)通信有限責(zé)任公司武漢運(yùn)維中心“武漢本地網(wǎng)網(wǎng)優(yōu)性能監(jiān)控系統(tǒng)工程”,合同號(hào):ZHIYUAN 200506)