田家雨
(中國(guó)電信股份有限公司常熟分公司網(wǎng)絡(luò)維護(hù)中心,蘇州 215500)
本地光纖用戶規(guī)模龐大,涵蓋了寬帶、itv、語(yǔ)音等各類應(yīng)用。EPON網(wǎng)絡(luò)由三部分組成:OLT、ODN、ONU。OLT為局端設(shè)備,以華為設(shè)備為主;ODN為OLT到ONU之間的線路部分;ONU為用戶端設(shè)備,既俗稱的光貓。
為了承載更多的用戶,EPON采用了時(shí)分復(fù)用技術(shù)。下行方向,OLT通過(guò)廣播方式將數(shù)據(jù)包發(fā)送給所有ONU;上行方向,OLT給每個(gè)ONU分配唯一的llid,并通過(guò)GATE幀分配不同的時(shí)隙,ONU在自己的時(shí)隙發(fā)光,向OLT發(fā)送數(shù)據(jù)包。
案例1:同一光分下大部分ONU不起,查看注冊(cè)信息,ONU不停的反復(fù)注冊(cè),現(xiàn)場(chǎng)光分下收光,發(fā)現(xiàn)某根纖下ONU有發(fā)光,更換新ONU后障礙恢復(fù)。
案例2:同一光分下較多用戶寬帶、itv使用異常,OLT上查看CRC錯(cuò)誤幀增長(zhǎng)較快,用戶處ping包存在丟包現(xiàn)象,現(xiàn)場(chǎng)插拔光分下纖,當(dāng)拔下某根纖后錯(cuò)誤幀不再增長(zhǎng),ping包正常,更換后障礙恢復(fù)。
案例3:新裝ONU無(wú)法注冊(cè),關(guān)閉光分下任意一個(gè)ONU后能注冊(cè),但關(guān)閉的ONU打開(kāi)后無(wú)法注冊(cè),在OLT的diagnose模式下查看llid,存在UserReserve狀態(tài),更換該狀態(tài)對(duì)應(yīng)ONU后狀態(tài)全為InService,ONU能成功注冊(cè)。
上述典型案例結(jié)合時(shí)分復(fù)用技術(shù)理論,我們可以得出流氓ONU的特性:不是自己的時(shí)隙也在發(fā)光,上行方向與正常發(fā)光的ONU產(chǎn)生沖突,從而影響了其它ONU的性能;由于沖突的產(chǎn)生,OLT在同一時(shí)隙收到2個(gè)ONU發(fā)來(lái)的數(shù)據(jù)包,無(wú)法判斷是由誰(shuí)發(fā)出,丟棄了數(shù)據(jù)包,因此,流氓ONU也會(huì)導(dǎo)致錯(cuò)誤幀的存在。
整理更換下來(lái)的ONU終端,發(fā)現(xiàn)流氓ONU主要是以下兩種原因引起:(1)由于使用年限較長(zhǎng)導(dǎo)致光模塊產(chǎn)生異常或者軟件出現(xiàn)問(wèn)題;(2)部分質(zhì)量不過(guò)關(guān)的雜牌ONU。
根據(jù)ONU的發(fā)光情況,流氓ONU可以分為以下三種:
(1)長(zhǎng)發(fā)光ONU:任意時(shí)間都在發(fā)光的ONU,影響幾乎光分下所有ONU;
(2)不定時(shí)發(fā)光ONU:ONU在不屬于自己的時(shí)隙不規(guī)則發(fā)光,可以提前也可以延后,這類ONU比較常見(jiàn),只影響部分ONU,因此也是最難排查的;
(3)非法占用llid的ONU:在OLT上看該ONU已經(jīng)下線,OLT釋放llid,但是ONU由于自身異常,顯示仍然在線,占用的llid未釋放;新的ONU上線并被分配了該llid,兩個(gè)ONU在上行方向產(chǎn)生沖突,從而導(dǎo)致新ONU無(wú)法注冊(cè)。此類ONU屬于不定時(shí)發(fā)光ONU的特殊情況,也稱為“假在線”O(jiān)NU,只影響一個(gè)其他ONU,同樣難以排查。
流氓ONU處理過(guò)程分為三步:檢測(cè)、排查、解決。
檢測(cè)既確定存在流氓ONU,存在的前提為更換PON口光模塊、更換PON板均無(wú)效。由于流氓ONU影響的是同一個(gè)光分下的其它ONU,所以當(dāng)整個(gè)光分存在下列現(xiàn)象之一時(shí),一般認(rèn)為存在疑似流氓ONU:
(1)光分下大部分ONU不起,或者是頻繁的注冊(cè),上下線;
(2)光分下部分ONU使用異常,上網(wǎng)、itv卡頓、ping包丟包等情況;
(3)華為OLT診斷模式diagnose下,使用display statistics emac frameid/slotid portid命令查看,PON口存在CRC錯(cuò)誤幀,且增長(zhǎng)明顯(PON板型號(hào)為EPBD、EPBC時(shí)能夠使用);
(4)OLT使用display statistics ont-line-quality frameid/slotid portid ontid命令查看障礙用戶線路質(zhì)量,存在FCS錯(cuò)誤幀;
(5)新裝ONU1無(wú)法注冊(cè),關(guān)閉光分下任意ONU2后能注冊(cè),但是打開(kāi)ONU2后2無(wú)法注冊(cè);使用命令display ont version和display ont info,分別查詢PON口下ONU數(shù)量不相等。
雖然OLT設(shè)備帶有自檢及隔離流氓ONU功能,但經(jīng)過(guò)實(shí)踐發(fā)現(xiàn)經(jīng)常會(huì)將正常ONU隔離,所以排查以現(xiàn)場(chǎng)拔纖為主,OLT查看為輔;以障礙恢復(fù)為排查成功原則。由于光分有一級(jí)光分、二級(jí)光分兩種,所以排查時(shí)先插拔二級(jí)光分,再插拔一級(jí)光分。
(1)diagnose模式下使用display epon llid alloc-record current命令查看llid是否存在UserReserve狀態(tài),如果存在則拔下該狀態(tài)對(duì)應(yīng)的纖,否則進(jìn)入步驟3;
(2)如果拔纖后障礙恢復(fù),且UserReserve狀態(tài)不再存在,說(shuō)明該纖對(duì)應(yīng)ONU為流氓ONU,否則進(jìn)入下一步;
(3)光功率計(jì)在光分反向收光,如果有光則該處存在流氓ONU;
(4)如果存在二級(jí)光分,則先斷開(kāi)一半的二級(jí)光分,觀察障礙情況、CRC錯(cuò)誤幀及FCS錯(cuò)誤幀,如果恢復(fù)則說(shuō)明斷開(kāi)的二級(jí)光分中存在流氓ONU,依次還原并觀察直到找出流氓ONU所在的二級(jí)光分,進(jìn)行步驟5;如果障礙未恢復(fù),則繼續(xù)斷開(kāi)剩下二級(jí)光分的一半,以此類推直到障礙恢復(fù);
(5)斷開(kāi)一級(jí)或者經(jīng)步驟4確認(rèn)存在流氓ONU的二級(jí)光分上一半的纖,操作方法同上,直到找出流氓ONU所在的纖為止。
流氓ONU的解決根據(jù)排查的結(jié)果分為兩種情況:
(1)找出了流氓ONU所在的纖,更換纖所對(duì)應(yīng)的ONU;
(2)極少數(shù)情況插拔完整個(gè)光分仍未找出,可以更換具備保護(hù)功能的PON板EPSD型號(hào)應(yīng)急,該板對(duì)ONU發(fā)光時(shí)隙有限制,能將流氓ONU的影響范圍減??;待障礙恢復(fù)后,后續(xù)通過(guò)廠家研發(fā)使用內(nèi)部命令繼續(xù)排查。
流氓ONU故障是EPON網(wǎng)絡(luò)維護(hù)中面臨的一個(gè)難題,根據(jù)日常維護(hù)案例整理總結(jié)出的檢測(cè)、排查、解決手段能處理絕大多數(shù)此類障礙,且準(zhǔn)確率較高,但仍然存在低效的缺點(diǎn)。一方面,隨著各項(xiàng)技術(shù)的成熟,維護(hù)經(jīng)驗(yàn)的增長(zhǎng),解決流氓ONU的辦法相信會(huì)越來(lái)越多;另一方面,要根本上解決此類障礙,還需要加強(qiáng)對(duì)終端ONU的管理,避免老舊ONU在網(wǎng)使用,拒絕兼容性欠佳的雜牌ONU入網(wǎng)。
[1] 華為EPON技術(shù)指導(dǎo)書.