李 明,劉 濤,劉 喻
(中國電信股份有限公司徐州分公司,江蘇 徐州 221000)
隨著寬帶網絡技術的演進,用戶對大帶寬業(yè)務需求的增高,以OLT(optical line terminal,光線路終端)為核心的接入網設備大規(guī)模部署,全民進入高速互聯(lián)網時代。與傳統(tǒng)的承載單一寬帶業(yè)務的xDSL(x Digital Subscriber Line,各種數(shù)字用戶線路)以及小區(qū)LAN(局域網)接入網不同,OLT網絡承載全業(yè)務:語音、寬帶、IPTV(交互式網絡電視)如圖1所示。
據(jù)統(tǒng)計徐州本地網寬帶用戶約120萬,ITV用戶約23萬。本地網OLT在網設備1,374臺,設備類型主要有華為5680T、5800T,中興C300、烽火AN5516等。受OLT背板帶寬能力限制,平均每臺OLT的承載用戶數(shù)需要限制在4,000戶左右。
由于OLT設備集中度高,承載用戶數(shù)多,所以單臺設備故障影響的范圍就特別大,嚴重影響了用戶感知。
在2020年上半年省公司OLT脫網率通報中,徐州本地網脫網率呈上升態(tài)勢,6月竟高達5.82%(如圖2所示),遠超0.5%的指標。
圖2 本地網OLT設備脫網率
設備集中度的提升,業(yè)務集中度的提升以及用戶對使用體驗要求的提升,決定了 OLT設備的穩(wěn)定運行非常重要,所以應該盡最大可能地降低 OLT設備的脫網率。
我們對徐州本地網上半年的 OLT設備脫網障礙工單進行了匯總分析,據(jù)維護人員反饋障礙原因主要集中在光路類故障、電源類故障、主動性維護以及設備本身故障等方面。
圖3 光接入網拓撲
從圖3光接入的拓撲結構來看,城域網核心層的MSE(Multi-Service Edge,多業(yè)務邊緣路由器)和BRAS(Broadband Remote Access Server,寬帶接入服務器)設備用于承載用戶業(yè)務,相應的 OLT的設備管理地址也配置在核心層上。從 OLT至 BRAS間共有 2個傳輸環(huán)節(jié)會影響 OLT設備脫網,分別是 OLT設備至匯聚交換機間的傳輸、匯聚交換機至BRAS間的傳輸。徐州本地網大多數(shù) OLT設備的上聯(lián)都下沉到了同機房的匯聚交換機下面,所以匯聚交換機的上聯(lián)光路中斷會導致批量的 OLT脫網,影響業(yè)務范圍巨大。
另外研究發(fā)現(xiàn)也有上行光路未中斷,但是上行光路光功率不達標、上行端口光模塊異常,也有可能造成設備中斷。這一類可以歸并到光路障礙中。
市電停電、機房供電系統(tǒng)故障、蓄電池供電能力差等電源類故障,是導致 OLT脫網的第二大主要原因。全區(qū)機房按照承載業(yè)務的重要程度分為 A,B,C,D四類,機房供電系統(tǒng)原理如圖 4所示。
圖4 機房供電系統(tǒng)原理圖
引起電源類故障的原因主要有:
⊙市電供電質量不穩(wěn)定,線路過長,導致壓降過大電流增大,交流空開跳閘。
⊙ 5G等高耗能設備的上線,負載加大,導致電池放電的后備時間縮短。
⊙蓄電池老舊,性能下降,可靠性降低。
⊙維護人員發(fā)電不及時,導致電池耗盡,設備掉電。
人為主動性維護引起的 OLT設備脫網也是不容忽視的,主要包括 OLT設備割接、版本升級、上行鏈路調整擴容、批量修改用戶 VLAN(Virtual Local Area Network,虛擬局域網)資源以及更換設備管理地址等。
由于設備本身故障引起的脫網較少發(fā)生,但仍然存在。比如 OLT主控板故障,導致 OLT脫網;再比如OLT設備當上行板卡故障時,將造成 OLT設備脫網。還有機房環(huán)境惡劣:溫度過高或過低、濕度過大等原因引起的 OLT設備宕機等。
(1)加強光纜維護。對于光纜使用年限過長、接續(xù)次數(shù)過,而導致部分線路傳輸質量過差的光路及時調整更換;上行鏈路盡量采用波分鏈路承載。
(2)OLT實 現(xiàn) 雙 上 聯(lián) LACP(Link Aggregation Control Protocol,鏈路匯聚控制協(xié)議)鏈路保護:確保OLT、匯聚交換機開通雙上聯(lián)鏈路。雙上聯(lián)鏈路的定義為:物理雙路由和負載分擔。 OLT設備、匯聚交換機需要實現(xiàn)跨板多上行,MSE,BRAS需要實現(xiàn)跨板多下行。通過雙路由檢測系統(tǒng),對雙上聯(lián)光路路由段進行逐段核查,尤其對不同纜但重人井和重管道的路由段進行重新規(guī)劃和調整。
對OLT設備實行雙地址管理,采用不同的管理VLAN,將管理地址配置到匯聚交換機上聯(lián)的 2臺不同的 BRAS上,并且利用靜態(tài)路由的方式將管理地址和監(jiān)控系統(tǒng)打通,一條路由中斷,不影響對 OLT設備的管理。
(3)對全程光路光衰進行監(jiān)控,利用監(jiān)控程序對設備上聯(lián)端口進行全網掃描,對光衰不達標的進行整治,包括纖芯的調整、光模塊的替換、 ODF架灰塵清理、更換法蘭等。
(1)做好機房日常的后備電源維護工作,定期做放電測試,更換落后電池。蓄電池浮充電壓范圍53.52 V-54 V(2.23 V-2.25 V*24)。市電停電時,對直流電壓進行監(jiān)控,當?shù)陀陂T限值(A類機房 <51.5 V,B類機房 <50.5 V,C類機房 <49.5 V,D類機房<49 V)進行障礙工單派發(fā),及時通知維護人員發(fā)電。
(2)嚴格確保 OLT的雙路直流供電,保證單路電流小于熔絲額定電流值的二分之一。盡可能減少機房施工(設備加電下電等操作)影響 OLT的動力系統(tǒng)。如果開關電源有下電功能,盡量保證 OLT設備接在直流屏二次下電端如圖 5所示,在 OLT動力保障出現(xiàn)問題,搶修期間保證 OLT不掉電。
圖5 直流屏低電脫扣開關
(3)同電力部門做好溝通及時獲取停電信息,按區(qū)域配備移動發(fā)電機組用于應急發(fā)電。
(4)定期開展機房發(fā)電應急演練,加強維護人員技能培訓。
對光纜中繼優(yōu)化,設備版本升級、設備割接等人為操作加強管控,盡量避免 OLT雙上聯(lián)光路的同時調整,設備版本升級和割接盡量安排在夜間非忙時段,并及時通知用戶。減少因割接操作引起的 OLT脫網,同時對維護人員加強培訓,尤其是對新型技術和設備的學習和操作,定期進行應急演練。
由于設備故障有偶發(fā)性和不可控性的特點,需要關注和做好 OLT和上聯(lián)設備的主動性維護工作,主動巡檢發(fā)現(xiàn)隱患,盡量減少故障發(fā)生的可能性。做好新增設備上線前設計方案會審、上線中的隨工、上線后的驗收等環(huán)節(jié),加強備件的配置和管理,做到防患于未然。對機房環(huán)境進行檢查,減少機房環(huán)境對設備的影響,對偏遠、動力保障不足、雙物理路由不健全且環(huán)境較差的局點OLT設備進行撤并,將 OLT業(yè)務割接至附近條件更好的局點。
根據(jù)最近的一期巡檢報表系統(tǒng)統(tǒng)計,徐州本地網OLT雙上行合格率為 98.97%,出局光路同路由率 3.2%,但是雙電源合格率僅為 80.35%,上行同板卡達標率僅為65.47%。這些隱患還需要進一步處理。通過各種措施的實施,徐州本地網 11月份OLT設備脫網率已降至2.26%,其中,割接引起的OLT脫網幾乎占到脫網總數(shù)的一半(如圖6所示),雖然距離目標還有一段距離,但仍有很大的壓降空間。
圖6 OLT設備脫網率報表
目前的統(tǒng)計還是采用單管理地址驗證的方法,如果僅僅是管理地址不通,對于OLT多條上行的情況下,只是影響設備管理,不影響OLT設備承載的業(yè)務。如果給每條路由都配上管理地址,可以更精確的定位是否影響業(yè)務。