[閆飛 劉萱 毛宇 黃涌梅]
流氓ONU產(chǎn)生原因及解決方案
[閆飛 劉萱 毛宇 黃涌梅]
PON是光接入網(wǎng)的主流技術(shù),流氓ONU是PON網(wǎng)絡(luò)運營維護中的故障難點。文章提出了一種流氓ONU預(yù)防、監(jiān)測和隔離的系統(tǒng)解決方案,可以保證PON網(wǎng)絡(luò)業(yè)務(wù)穩(wěn)定、安全、高效地運行。
吉比特?zé)o源光網(wǎng)絡(luò) 光線路終端 光網(wǎng)絡(luò)單元 光功率監(jiān)測
閆飛
畢業(yè)于基輔國立航空大學(xué)計算機專業(yè),在北京郵電大學(xué)電子工程學(xué)院獲工程碩士學(xué)位,在中國電信集團長期從事傳輸、接入網(wǎng)的技術(shù)研究與網(wǎng)絡(luò)規(guī)劃工作。
劉萱
畢業(yè)于華中理工大學(xué)獲學(xué)士學(xué)位,在中國電信廣東分公司從事接入網(wǎng)規(guī)劃和建設(shè)工作。
毛宇
畢業(yè)于南京郵電學(xué)院獲碩士學(xué)位,在中國電信廣州研究院從事寬帶接入技術(shù)研究和規(guī)劃工作。
黃涌梅
畢業(yè)于重慶郵電學(xué)院,在中國電信廣州研究院從事寬帶接入技術(shù)研究和規(guī)劃工作。
2013年8月17日,中國國務(wù)院下發(fā)了《國務(wù)院關(guān)于印發(fā)“寬帶中國”戰(zhàn)略及實施方案的通知》(國發(fā)〔2013〕31號)將“寬帶戰(zhàn)略”上升為國家戰(zhàn)略。
按照“寬帶中國”戰(zhàn)略的要求,工信部領(lǐng)導(dǎo)電信、移動和聯(lián)通等大型通信運營商開展了“寬帶中國專項行動”,加大了銅纜接入網(wǎng)改造為光接入網(wǎng)的進度。根據(jù)工信部發(fā)布的《通信業(yè)經(jīng)濟運行情況》,到2015年9月底,中國光纖接入(FTTH/0)用戶突破1億戶大關(guān);到2016年1月,中國光纖接入FTTH/O用戶總數(shù)已達到1.2億戶,占寬帶用戶總數(shù)的比重達到58%。
光接入網(wǎng)以PON技術(shù)為主,具有全程無源、帶寬高、抗干擾性強等特點。隨著光接入網(wǎng)的規(guī)模和光用戶的增長,基于PON技術(shù)的光纖到戶網(wǎng)絡(luò)已經(jīng)成為運營商占比最大的接入網(wǎng)模式,光接入網(wǎng)的故障處理也成為運營商需要面對的重要課題,其中流氓ONU又是光接入網(wǎng)故障處理的難題之一。本文提出了一整套預(yù)防、檢測流氓ONU的解決方案。
PON網(wǎng)絡(luò)由局端設(shè)備(OLT)、光分配網(wǎng)(ODN)和光網(wǎng)絡(luò)終端(ONU)三部分組成。OLT的PON端口連接一根光纖至分光器(OBD)合路側(cè)端口,在從OBD的多個支路側(cè)端口使用一根光纖連接至ONU。為了能夠在一根光纖上承載多個用戶的業(yè)務(wù),PON系統(tǒng)采用了波分復(fù)用和時分復(fù)用技術(shù)。
在下行方向(OLT向ONU發(fā)送數(shù)據(jù)),PON系統(tǒng)采用1490nm的波長,通過廣播方式將所有數(shù)據(jù)發(fā)送給每個ONU,各ONU根據(jù)下行數(shù)據(jù)的標(biāo)識信息接收屬于自己的數(shù)據(jù),丟棄其他用戶的數(shù)據(jù);在上行方向(ONU向OLT發(fā)送數(shù)據(jù)),PON系統(tǒng)采用1310nm波長(與下行方向波長不同),通過時分復(fù)用方式在一根光纖中傳送多個ONU的上行業(yè)務(wù)。各ONU上行數(shù)據(jù)分時發(fā)送,每個ONU的發(fā)送時間與長度由OLT集中控制。
圖1 PON技術(shù)原理
ITU-T和IEEE在GPON、EPON的技術(shù)標(biāo)準(zhǔn)中制定了點到多點協(xié)議,采用了測距、時間窗口授權(quán)、光發(fā)射器突發(fā)發(fā)射和關(guān)斷等機制,防止多個ONU在發(fā)送數(shù)據(jù)出現(xiàn)沖突。OLT為每個ONU分配了可以發(fā)送上行數(shù)據(jù)的時間段,只有在該時間段內(nèi),指定的ONU才可以發(fā)送數(shù)據(jù)。
由于PON系統(tǒng)在上行方向采用時分復(fù)用技術(shù),所有ONU必須在OLT指定的時隙內(nèi)發(fā)光才能使PON系統(tǒng)正常工作;不在OLT指定的時間段內(nèi)發(fā)光的ONU,如長發(fā)光、亂發(fā)光的ONU將造成上行信號沖突,這類ONU統(tǒng)稱為流氓ONU。
根據(jù)流氓ONU的發(fā)光現(xiàn)象,又可以分為以下幾類:
(1)長發(fā)光ONU
上電后在任意時刻一直保持發(fā)送光信號的ONU。當(dāng)系統(tǒng)中存在長發(fā)光ONU時,故障現(xiàn)象為一個PON端口下僅有少量ONU可以正常注冊,或者多個ONU反復(fù)注冊。
圖2 長發(fā)光流氓ONU對正常ONU的影響
(2)不在規(guī)定時間段發(fā)光的ONU
這種流氓ONU發(fā)送上行數(shù)據(jù)仍然受OLT控制,但其發(fā)光時間與OLT指定的時間不一致。這種流氓ONU對系統(tǒng)的影響相對較小,不定時的影響同一個PON口下的其他ONU,導(dǎo)致其他用戶網(wǎng)速下降;流氓ONU自身的網(wǎng)速一直受影響。
圖3 不在規(guī)定時間段發(fā)光的光流氓ONU對正常ONU的影響
(3)占用其他ONU的ONU ID/LLID的流氓ONU
這種流氓ONU發(fā)送上行數(shù)據(jù)仍然受OLT控制,也與OLT指定的時間一致,但是會與同一個PON口下的其他ONU在同一個時間段內(nèi)發(fā)光。這種流氓ONU產(chǎn)生原因是(以EPON系統(tǒng)為例):OLT為每個ONU分配唯一的LLID。OLT通過GATE幀向每個LLID分配不同的上行時隙進行調(diào)度,避免沖突;OLT監(jiān)測ONU狀態(tài),當(dāng)OLT判斷某個ONU不在線時,回收LLID并分配給新上線ONU。在某些情況下原來的ONU a并不認為自己已經(jīng)下線,而OLT又把該LLID分配給了新上線的ONU b,在OLT向ONU b分配上行時隙時,ONU a會使用同樣的時隙發(fā)送上行數(shù)據(jù),a和b兩個ONU的上行業(yè)務(wù)沖突,導(dǎo)致ONU b無法正常發(fā)送上行業(yè)務(wù)。
圖4 ID沖突的流氓ONU對正常ONU的影響
這種流氓ONU只影響一個特定的正常ONU,導(dǎo)致一個用戶網(wǎng)速異常。
解決流氓ONU的思路主要有兩種:
3.1 通過對優(yōu)化ONU ID/LLID的分配機制來防止流氓ONU的產(chǎn)生
這種優(yōu)化機制主要針對第3類強占ONU ID/LLID的流氓ONU,防止系統(tǒng)中的ONU ID/LLID,其解決思路是將PON系統(tǒng)在分配ONU ID/LLID時,通過算法將ONU的ONU ID/LLID散列到ONU ID/LLID允許的范圍內(nèi),具體如下(以EPON系統(tǒng)為例):
(1)正常的EPON系統(tǒng)注冊過程:①OLT廣播GATE幀通知未注冊O(shè)NU開窗時間;②未注冊O(shè)NU發(fā)送REGISTER_REQ幀,其中包含ONU的MAC地址;③OLT給ONU分配LLID,并通過REGISTER幀通知該ONU,ONU確認完成注冊。
(2)一般來說,OLT會順序分配LLID,從OLT的空閑LLID中選擇最小的數(shù)值分配給新上線的ONU。如果這個LLID被類型3的流氓ONU使用,就會出現(xiàn)LLID沖突的情況。
(3)解決這種流氓ONU的思路是OLT不再順序分配LLID。比如:當(dāng)未注冊O(shè)NU發(fā)送的REGISTER_ REQ幀后,OLT獲取到ONU的MAC地址;OLT通過哈希算法計算出ONU的LLID值(比如采用除數(shù)取余法,LLID=ONU_MAC_Address MOD P(其中p=65536),如果計算出的LLID未被使用,則分配給該ONU;如果計算出的LLID已被使用,則二次探測法LLID LLID=ONU_ MAC_Address MOD P+1,重新計算一個LLID)。這樣可以避免數(shù)值小的LLID反復(fù)使用,將LLID值較隨機的分布在0~65535這一區(qū)間內(nèi),防止因ONU故障導(dǎo)致的LLID重復(fù)導(dǎo)致的上行數(shù)據(jù)沖突問題。
或者OLT建立一個ONU MAC地址、LLID、老化時間的地址表,當(dāng)某個ONU下線時,OLT并不馬上回收對應(yīng)的LLID,而是經(jīng)過一個老化周期后再回收進行重新分配。
表1 MAC地址與LLID對應(yīng)關(guān)系及老化時間
3.2 加強對流氓ONU的檢測,進行定位和隔離
通過網(wǎng)管對ONU光功率和誤碼進行監(jiān)測,來檢測系統(tǒng)中是否存在流氓ONU,并進行定位和隔離。具體方案如下(以EPON系統(tǒng)為例):
(1)在網(wǎng)管上建立ONU ID/LLID、OLT接收ONU的光功率、ONU上行幀的誤碼周期監(jiān)測任務(wù),并維護一張對應(yīng)關(guān)系表(此表格應(yīng)保存較長時間內(nèi)曾經(jīng)注冊過的ONU),判斷是否有流氓ONU產(chǎn)生。
表2 MAC地址與LLID對應(yīng)關(guān)系及誤碼表
多次比較連續(xù)兩個周期的數(shù)據(jù),每次比較的結(jié)果均出現(xiàn)以下現(xiàn)象時可以判斷ONU對應(yīng)的PON端口下可能存在流氓ONU:
① 如LLID、MAC地址無變化,某個或多個ONU的平均收光功率較上一周期有所提升,且BIP編碼錯誤值同步提升。
② 同一個PON口下多個ONU下線,未下線的ONU BIP編碼錯誤數(shù)量有所上升
(2)判斷流氓ONU類型進行定位
當(dāng)系統(tǒng)比較兩個周期的數(shù)據(jù),出現(xiàn)只有一個ONU的光功率增加且BIP編碼錯誤幀數(shù)上升時,可以判斷此時有強占LLID的流氓ONU存在。系統(tǒng)根據(jù)表格可以定位到被強占LLID的ONU,強制正常ONU下線,不回收這個LLID正常ONU再次上線時,OLT不會再將這個LLID分配給正常ONU;同時,OLT將該LLID的上下行帶寬均設(shè)定為最小值(64kbps),以此強制用戶手動重啟ONU。
當(dāng)網(wǎng)管系統(tǒng)判定某個PON口下存在流氓ONU時,可以通過以下步驟判定流氓ONU的類型:
① OLT發(fā)送PAUSE幀給所有ONU,僅保持ONU處于激活狀態(tài)但不發(fā)送任何數(shù)據(jù)。OLT在此時間段內(nèi)采集PON端口收到的發(fā)光功率,如果光功率不為0,則可以判斷此PON口下有長發(fā)光且不受OLT控制的流氓ONU存在。此類流氓ONU無法通過系統(tǒng)判斷來定位,應(yīng)向外線工作人員派工單,通過逐個拔纖的方式來定位并隔離流氓ONU;如果在步驟①中PON口收到的光功率為0,進入步驟②。
② OLT逐一關(guān)閉列表內(nèi)各ONU的光模塊,使其進入07狀態(tài)(緊急停止?fàn)顟B(tài))一段時間,如果此時故障仍然存在,則判斷該ONU不是流氓ONU,等待其回到02狀態(tài)(待機狀態(tài))并關(guān)閉下一個ONU的光模塊;如果關(guān)閉了某個ONU的光模塊后,PON系統(tǒng)工作正常,其他ONU可以正常注冊并應(yīng)答OLT的消息,則可判定被關(guān)閉光模塊的ONU為流氓ONU。此時,應(yīng)在網(wǎng)管上將次ONU的LOID設(shè)置為非法,阻止其正常注冊,并由外線人員為用戶更換新的ONU。
本文提出了一種預(yù)防、檢測和定位流氓ONU的系統(tǒng)解決方案,通過對PON系統(tǒng)ONU ID/LLID分配機制的優(yōu)化來防止強占ONU ID/LLID流氓ONU的產(chǎn)生;利用網(wǎng)管的光功率和誤碼監(jiān)測判斷流氓ONU的存在,并通過PON管理消息對流氓ONU進行定位和隔離。本文提出的解決方案可以應(yīng)用于PON網(wǎng)絡(luò)的建設(shè)和維護,從而保證PON系統(tǒng)承載的業(yè)務(wù)高效穩(wěn)定。
10.3969/j.issn.1006-6403.2016.11.013
(2016-08-18)