◆李維峰
?
淺析網(wǎng)絡(luò)管理中的性能管理
◆李維峰
(中國(guó)飛行試驗(yàn)研究院 陜西 710089)
隨著電信網(wǎng)絡(luò)變得越來(lái)越復(fù)雜,電信運(yùn)營(yíng)商面臨著巨大的運(yùn)營(yíng)問(wèn)題。電信管理網(wǎng)絡(luò)(TMN)是由國(guó)際電信聯(lián)盟——電信標(biāo)準(zhǔn)化部門(mén)(ITU-T)開(kāi)發(fā)的用于管理電信網(wǎng)絡(luò)和業(yè)務(wù)的框架。性能管理(PM)是ITU-T確定的五大核心管理功能之一。網(wǎng)絡(luò)管理系統(tǒng)(NMS)屬于TMN的網(wǎng)絡(luò)管理層。本文簡(jiǎn)要分析了PM原理和PM操作流程。提出了網(wǎng)絡(luò)管理系統(tǒng)中PM系統(tǒng)的體系結(jié)構(gòu),并分析了實(shí)現(xiàn)PM系統(tǒng)所面臨的挑戰(zhàn)和克服這些挑戰(zhàn)的方法。
電信管理網(wǎng)絡(luò)(TMN);網(wǎng)元管理系統(tǒng)(EMS);網(wǎng)絡(luò)管理系統(tǒng)(NMS);績(jī)效管理(PM);關(guān)鍵績(jī)效指標(biāo)(KPI)
TMN是由國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(mén)(ITU-T)開(kāi)發(fā)的用于管理電信網(wǎng)絡(luò)和服務(wù)的框架[1]?;赥MN參考模型,管理系統(tǒng)可以分為以下幾個(gè)層次來(lái)執(zhí)行特定的功能,并具有特定的范圍:
圖1 TMN參考模型的不同層次
圖1顯示了TMN參考模型的五個(gè)不同層。業(yè)務(wù)管理層(BML)負(fù)責(zé)實(shí)施組織內(nèi)的策略;服務(wù)管理層(SML)負(fù)責(zé)包括服務(wù)投訴處理、訂單處理和發(fā)票在內(nèi)的客戶(hù)合同方面的服務(wù),這些服務(wù)可以提供給客戶(hù)或可供潛在的新客戶(hù)使用;網(wǎng)絡(luò)管理層(NML)負(fù)責(zé)協(xié)調(diào)網(wǎng)絡(luò)的活動(dòng),管理網(wǎng)絡(luò)端到端連接所需的網(wǎng)絡(luò)元素之間的關(guān)系;元素管理層(EML)負(fù)責(zé)與位于小范圍內(nèi)的單個(gè)或少量網(wǎng)絡(luò)元件相關(guān)的功能;網(wǎng)絡(luò)元素層(NEL)代表電信設(shè)備(或電信設(shè)備的組/部分)。
ITU-T將管理分為五大管理功能領(lǐng)域,即:故障、配置、計(jì)費(fèi)、性能和安全(FCAPS)[2]。在TMN中引入的FCAPS管理概念的子集將在每個(gè)TMN層執(zhí)行[3]。故障管理是指檢測(cè)、隔離、修復(fù)和記錄在網(wǎng)絡(luò)內(nèi)發(fā)生的錯(cuò)誤。配置管理是維護(hù)關(guān)于網(wǎng)絡(luò)配置(硬件和軟件)的準(zhǔn)確信息以及控制與其正常操作相關(guān)的參數(shù)。計(jì)費(fèi)管理涉及用戶(hù)管理,以及資源和服務(wù)使用次序。性能管理嘗試最大限度地提高網(wǎng)絡(luò)性能。它與QoS、資源利用率、延遲、抖動(dòng)和丟包等參數(shù)密切相關(guān)。安全管理涉及網(wǎng)絡(luò)安全。
性能管理(PM)通過(guò)收集統(tǒng)計(jì)信息,維護(hù)和檢查歷史日志,確定系統(tǒng)性能,改變系統(tǒng)運(yùn)行模式來(lái)評(píng)估和報(bào)告網(wǎng)元的行為和有效性。理想的性能管理系統(tǒng)的主要功能是優(yōu)化網(wǎng)絡(luò)和應(yīng)用的使用,以提供一致和可預(yù)測(cè)的服務(wù)水平[4]。PM包括網(wǎng)絡(luò)和應(yīng)用程序流量的測(cè)量,以便在給定實(shí)例和定義的時(shí)間段內(nèi)提供一致的和可預(yù)測(cè)的服務(wù)級(jí)別。以提高性能和流量管理為目標(biāo),PM涉及對(duì)網(wǎng)絡(luò)、應(yīng)用程序、服務(wù)活動(dòng)以及設(shè)計(jì)和配置調(diào)整的監(jiān)視。網(wǎng)絡(luò)性能可能由于外部或內(nèi)部問(wèn)題而惡化,這可能會(huì)影響服務(wù)性能,可靠性、可用性以及最終的客戶(hù)體驗(yàn)。性能管理使您能夠提前發(fā)現(xiàn)惡化的趨勢(shì),并主動(dòng)解決潛在威脅,從而防止錯(cuò)誤發(fā)生。
PM系統(tǒng)的體系結(jié)構(gòu)如圖2所示,它具有以下幾個(gè)層次:數(shù)據(jù)收集和解析層、數(shù)據(jù)存儲(chǔ)和管理層、應(yīng)用程序?qū)?、表示層(用?hù)界面)。
性能管理的基礎(chǔ)是使用網(wǎng)絡(luò)特定的協(xié)議從網(wǎng)元收集數(shù)據(jù)。該協(xié)議可以是如圖2 中介代理所示的標(biāo)準(zhǔn)管理協(xié)議,如SNMP、FTP,也可以是各公司的專(zhuān)有協(xié)議。使用標(biāo)準(zhǔn)協(xié)議的優(yōu)勢(shì)是靈活,使得為協(xié)議實(shí)現(xiàn)的數(shù)據(jù)收集代理可以重新用于從支持相同協(xié)議的另一個(gè)網(wǎng)絡(luò)元素(Network Element,以下簡(jiǎn)稱(chēng)NE)收集數(shù)據(jù)。從NE 到EMS,測(cè)量工作的結(jié)果可以通過(guò)三種不同的方式轉(zhuǎn)發(fā):
(1)在NE 中執(zhí)行的測(cè)量任務(wù)產(chǎn)生的結(jié)果被發(fā)送到EMS。
(2)EMS 可以隨時(shí)檢索存儲(chǔ)在NE 中的報(bào)告。使用諸如FTP之類(lèi)的批量傳輸機(jī)制(即基于文件)。
(3)除了生成定期的計(jì)劃結(jié)果報(bào)告之外,還可以根據(jù)運(yùn)營(yíng)商定義的閾值發(fā)送測(cè)量結(jié)果。在實(shí)例化測(cè)量時(shí)設(shè)置閾值,并且在超過(guò)閾值時(shí)生成性能報(bào)警。
對(duì)于收集到的數(shù)據(jù)應(yīng)將其存儲(chǔ)在輸入文件中,并將這些文件重命名為統(tǒng)一的文件名,識(shí)別并丟棄損壞的文件。最后將正確的文件發(fā)送到解析器。處理后的文件可以按照將來(lái)數(shù)據(jù)重新加載的需要進(jìn)行存儲(chǔ)
在這一層中,使用基于標(biāo)準(zhǔn)DBMS的數(shù)據(jù)倉(cāng)庫(kù),該數(shù)據(jù)倉(cāng)庫(kù)針對(duì)VLDB分布式數(shù)據(jù)存儲(chǔ)進(jìn)行了優(yōu)化。驗(yàn)證和加載組件用于將解析的數(shù)據(jù)加載到數(shù)據(jù)存儲(chǔ)并驗(yàn)證數(shù)據(jù)間隔和數(shù)據(jù)重新加載,數(shù)據(jù)倉(cāng)庫(kù)中的存儲(chǔ)應(yīng)該隨網(wǎng)絡(luò)規(guī)模的擴(kuò)展而增加。數(shù)據(jù)存儲(chǔ)和管理應(yīng)該靈活的適應(yīng)網(wǎng)絡(luò)未來(lái)的發(fā)展及變化,并且使用支持?jǐn)?shù)據(jù)訪(fǎng)問(wèn)和修改的嵌入式編程語(yǔ)言。
收集和存儲(chǔ)數(shù)據(jù)的實(shí)際操作在這一層進(jìn)行。該層應(yīng)提供對(duì)數(shù)據(jù)庫(kù)的多線(xiàn)程訪(fǎng)問(wèn),以便進(jìn)行數(shù)據(jù)聚合、事件生成、關(guān)聯(lián)和分析,報(bào)告生成的并行處理。該層還負(fù)責(zé)存儲(chǔ)和共享生成的KPI和報(bào)告,它應(yīng)包括檢查閾值操作(即警報(bào)、通知等)的模塊,并執(zhí)行自動(dòng)健康檢查報(bào)告。
這一層負(fù)責(zé)提供一個(gè)基于網(wǎng)絡(luò)的用戶(hù)界面。它包含一個(gè)安全層,以確保生成的PM結(jié)果以?xún)x表板或是實(shí)時(shí)圖表的形式展現(xiàn)給用戶(hù)。除此之外,還應(yīng)提供將結(jié)果導(dǎo)出為.csv,.xml,.pdf文件格式的選項(xiàng)。此層可以提供兩個(gè)用戶(hù)界面:所有系統(tǒng)組件的管理UI和所有PM結(jié)果查看的用戶(hù)界面。 數(shù)據(jù)抽象層隱藏了應(yīng)用層聚合、報(bào)告、調(diào)度、健康檢查機(jī)制的復(fù)雜性,并將PM系統(tǒng)的結(jié)果以簡(jiǎn)化的方式呈現(xiàn)給系統(tǒng)用戶(hù)。
圖2 PM系統(tǒng)結(jié)構(gòu)圖
第一個(gè)巨大的挑戰(zhàn)是如何高效的管理,即收集、存儲(chǔ)、處理和匯總一段時(shí)間內(nèi)的大量性能測(cè)量數(shù)據(jù)。
第二大挑戰(zhàn)是處理沒(méi)有統(tǒng)一結(jié)構(gòu)或內(nèi)容的性能測(cè)量標(biāo)準(zhǔn)。由于各種NE類(lèi)型的性能測(cè)量不同,因?yàn)橹圃焐淘谄湓O(shè)備中使用不同的專(zhuān)有協(xié)議和數(shù)據(jù)結(jié)構(gòu)來(lái)衡量性能。
多個(gè)輪詢(xún)器、線(xiàn)程和探針可用于網(wǎng)絡(luò)數(shù)據(jù)收集。使用循環(huán)數(shù)據(jù)庫(kù)結(jié)構(gòu)的靈活的聚合規(guī)則可以用于記錄的聚合,記錄的定期輸出可以在平面文件中完成。逗號(hào)分隔值文件(CSV文件)在預(yù)定義的保留期限到期之后,記錄的永久刪除可以在用戶(hù)預(yù)定義的保留期限后自動(dòng)從數(shù)據(jù)庫(kù)中完成。輪詢(xún)器可用于主動(dòng)輪詢(xún)或收集計(jì)劃基礎(chǔ)的性能數(shù)據(jù),直接從設(shè)備獲取KPI。一個(gè)性能監(jiān)控應(yīng)用程序可以被線(xiàn)程化,不同的進(jìn)程可以被拆分,以允許多個(gè)CPU在一個(gè)進(jìn)程上工作。在收集性能測(cè)量時(shí),線(xiàn)程是非常有用的,可以使用多個(gè)線(xiàn)程同時(shí)執(zhí)行數(shù)據(jù)收集工作,因此可以快速完成。探測(cè)器是收集有關(guān)網(wǎng)絡(luò)活動(dòng)的數(shù)據(jù)的程序,在大型分布式網(wǎng)絡(luò)體系結(jié)構(gòu)中,探針給出了必要的機(jī)制來(lái)積累構(gòu)建網(wǎng)絡(luò)歷史和趨勢(shì)所必需的數(shù)據(jù)。任何數(shù)據(jù)庫(kù)中可以保存的數(shù)據(jù)量,特別是大型網(wǎng)絡(luò)的數(shù)據(jù)量是有限的。因此,在用戶(hù)預(yù)定的時(shí)間限制(例如1周)之后,需要匯總原始數(shù)據(jù)。
這可以通過(guò)在數(shù)據(jù)收集和解析層中設(shè)置一個(gè)轉(zhuǎn)換模塊來(lái)完成。收集器將收集的數(shù)據(jù)提供給轉(zhuǎn)換器,轉(zhuǎn)換器轉(zhuǎn)而轉(zhuǎn)換成PM系統(tǒng)所屬的NMS所了解的標(biāo)準(zhǔn)格式。因此,在將數(shù)據(jù)保存到數(shù)據(jù)庫(kù)之前,將其轉(zhuǎn)換為具有適當(dāng)結(jié)構(gòu)的標(biāo)準(zhǔn)格式。
本文介紹了PM原理,提出了網(wǎng)絡(luò)管理系統(tǒng)中PM系統(tǒng)的結(jié)構(gòu),分析了PM系統(tǒng)實(shí)施過(guò)程中面臨的挑戰(zhàn),并提出了克服這些挑戰(zhàn)的方法。
[1]M.3010 Principles for a Telecommunications Management Network,International Telecommunications Union,2000.
[2]M.3400 TMN management functions, International Telecommunications Union,2000.
[3]P.Goyal,FCAPS in the Business Services Fabric Model,In proceedings of WETICE 2009, 18thIEEE International Workshops on Enabling Technologies; Infrastructures for Collaborative Enterprises,2009.
[4]Cisco System,Performance Management Best Practices for Broadband Service Providers,June 2008. [Online].Available:Cisco Systems White Paper, http://www.cisco.com/c/en/us/products/collateral/services/high-availability/white_paper_c11-478096.html.