摘 要:目前全省已大規(guī)模部署IPTV業(yè)務(wù),隨之而來是IPTV故障逐漸增多。對于IPTV這種端到端的業(yè)務(wù),涉及多廠家,穿越多種網(wǎng)絡(luò)類型的業(yè)務(wù),如何保障業(yè)務(wù)質(zhì)量,如何快速定位故障原因?是當(dāng)前急需考慮的問題。本文將對1起IPTV業(yè)務(wù)出現(xiàn)卡頓和花屏的故障案例進行分析,并通過該案例總結(jié)梳理IPTV業(yè)務(wù)處理流程。
關(guān)鍵詞:IPTV;卡頓;花屏;ME60
中圖分類號:TN948.55 文獻標(biāo)識碼:A 文章編號:1004-7344(2018)18-0257-02
1 背景描述
隨著視屏業(yè)務(wù)的發(fā)展,用戶對IPTV網(wǎng)絡(luò)感知越來越敏感。影響IPTV視頻質(zhì)量的不僅僅是網(wǎng)絡(luò)質(zhì)量,IPTV平臺的視頻編解碼質(zhì)量,機頂盒、家庭終端等設(shè)備都可能會影響IPTV業(yè)務(wù)感知,對于IPTV業(yè)務(wù)出現(xiàn)卡頓和花屏感知類故障處理時,需要進行端到端的通盤考慮和定位,并對端到端所使用到的各類協(xié)議、涉及的設(shè)備功能以及實現(xiàn)等都要了解,才能夠快速、準(zhǔn)確地定位問題。
2 典型案例
(1)故障現(xiàn)象:ME60下采用DHCP方式接入的多個用戶,在晚上高峰期收看IPTV節(jié)目時出現(xiàn)卡屏。在同一終端使用PPPoE模式收看IPTV不卡屏,但使用DHCP模式收看IPTV卡屏??ㄆ脸霈F(xiàn)在晚上業(yè)務(wù)高峰期,白天業(yè)務(wù)輕載時沒有問題。卡屏問題終端集中在某ME60的1/0/3接口下。
(2)組網(wǎng)情況:常見IPTV端到端網(wǎng)絡(luò)拓?fù)淙缦?,本案例涉及到的設(shè)備路徑為:ME60→S9306→OLT→HG8245→STB。
(3)分析及處理:由于在高峰期才會出現(xiàn)卡屏,并且使用PPPoE方式的用戶沒有出現(xiàn)卡屏問題,可以初步推斷原因為,在IPoE方式下因高峰期某設(shè)備接口帶寬不足導(dǎo)致的丟包,且丟包的點應(yīng)該在ME60及以下設(shè)備,因此需要逐個排查MA5600T、S9306、ME60,以確認(rèn)丟包發(fā)生的段落。
①在MA5600T設(shè)備上排查。在MA5600T(OLT)上進行抓包,確認(rèn)丟包發(fā)生在MA5600T上游設(shè)備還是MA5600T及下游設(shè)備。在OLT上行口鏡像抓包,配置如下:
鏡像命令配置,將0/20/0的MACf8e8-11b3-86ef的報文鏡像到0/20/1,在0/20/1抓包。
將抓到的數(shù)據(jù)報文進行分析,發(fā)現(xiàn)有9.5%的報文丟包,說明在OLT上游就發(fā)生了丟包,需要繼續(xù)進行確認(rèn)。
②在S9306設(shè)備上排查。確認(rèn)丟包是發(fā)生在S9306上游設(shè)備還是S9306及其下游設(shè)備。在S9306上行接口(與ME60相連的接口)進行鏡像抓包,發(fā)現(xiàn)S9306上行存在丟包,說明丟包可能發(fā)生在ME60設(shè)備上。
③在ME60設(shè)備上排查。查看G1/0/3的接口信息,發(fā)現(xiàn)在ME60設(shè)備1/0/3接口晚上業(yè)務(wù)高峰期Output(下行方向)端口利用率超過80%,很可能是因為ME60設(shè)備1/0/3接口業(yè)務(wù)擁塞出方向丟包導(dǎo)致IPTV業(yè)務(wù)卡屏。
端口的上下行流量統(tǒng)計值(Input/Output bandwidth utilization80.57%)為統(tǒng)計平均值,由于業(yè)務(wù)本身流量是突發(fā)的,所以端口利用率超過80%時,實際業(yè)務(wù)峰值流量可能超過端口帶寬,出現(xiàn)丟包。
④對比兩種上線方式信息。分別查看PPPoE上線用戶詳細(xì)信息和DHCP上線用戶詳細(xì)信息,并進行差異對比。發(fā)現(xiàn)DHCP上線方式,沒有對用戶帶寬進行限制。PPPoE上線方式,由Radius對用戶帶寬進行了限制。
由上可以看出,ME60上DHCP方式用戶沒有限速,PPPOE方式用戶是存在限速的。經(jīng)詢問廠家得知:ME60設(shè)備內(nèi)部轉(zhuǎn)發(fā)時只能保證隊列的CIR保證帶寬不丟包,當(dāng)隊列超出該值時只會盡量轉(zhuǎn)發(fā),但不保證不丟包。當(dāng)端口出現(xiàn)擁塞,在流量突發(fā)高峰時總流量超過端口帶寬(1Gbit/s),用戶超過CIR保證帶寬的流量會被丟棄。(用戶帶寬限制中:CIR Committed Information Rate承諾信息速率,PIR Peak information rate標(biāo)峰值信息速率。)
(4)故障原因定位。對DHCP方式用戶如不配置帶寬進行限制,則用戶的默認(rèn)CIR值為128Kbit/s,PIR值為1Gbit/s,端口擁塞出現(xiàn)時,只能保證128Kbit/s的帶寬,部分報文被丟棄。PPP撥號用戶上線時,會根據(jù)用戶的帶寬情況如2Mbit/s、3Mbit/s或100Mbit/s來分配獨立CIR用戶隊列,能夠保證用戶CIR帶寬。
(5)解決方案。通過在ME60上的用戶域下配置用戶CIR保證帶寬,解決卡屏問題。
(6)處理建議及總結(jié)
本案例中,業(yè)務(wù)高峰時ME60端口的平均占用率已經(jīng)達到80%,應(yīng)及時對ME60端口進行擴容,避免突發(fā)流量超端口帶寬導(dǎo)致的丟包。如無法及時擴容,可根據(jù)現(xiàn)網(wǎng)實際業(yè)務(wù)發(fā)放方案,在ME60的用戶域下配置用戶CIR保證帶寬,可以在一定程度上避免此問題發(fā)生。現(xiàn)網(wǎng)中,要根據(jù)實際業(yè)務(wù)發(fā)放方法配置,如通過Radius下發(fā)用戶帶寬配置。
3 經(jīng)驗總結(jié)
對于IPTV常見故障,一般可分為通斷類故障和質(zhì)量類故障。通斷類故障現(xiàn)象明顯,排查較為容易。質(zhì)量類故障,故障頻次和范圍無規(guī)律,通常需要端到端的進行梳理排查故障。下面對質(zhì)量類故障進行重點歸納總結(jié)。
3.1 質(zhì)量類故障場景歸類
全部BTV業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但所有BTV均出現(xiàn)質(zhì)量問題,比如馬賽克,花屏等情況。
部分BTV業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但部分BTV頻道質(zhì)量差,部分BTV頻道質(zhì)量正常。
VOD業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但其觀看的VOD節(jié)目質(zhì)量差,比如馬賽克,花屏等。
操作體驗差指出現(xiàn)EPG顯示慢,頻道切換慢,VOD點播慢等操作體驗差的情況。
3.2 IPTV基本故障定位思路
在日常對IPTV業(yè)務(wù)的維護經(jīng)驗積累中發(fā)現(xiàn),單個的IPTV用戶故障原因多數(shù)是由于用戶側(cè)自身問題造成;如果可以確定為群障,那么一定會在上層網(wǎng)絡(luò)側(cè)有著共同的組網(wǎng)環(huán)境。所以IPTV的故障定位遵循的基本原則是:先定界再定位,先用戶側(cè)再網(wǎng)絡(luò)側(cè)。
(1)家庭網(wǎng)絡(luò)問題排查:排除基本家庭網(wǎng)絡(luò)問題、收集故障信息。首先對家庭網(wǎng)絡(luò)設(shè)備檢查如STB連接方式含端口協(xié)商模式和設(shè)備使用情況。再收集問題現(xiàn)象和相關(guān)信息,如對用戶高速上網(wǎng)時導(dǎo)致質(zhì)量差,可檢查接入設(shè)備QOS設(shè)置。
(2)根據(jù)問題范圍,分責(zé)定界:根據(jù)用戶故障發(fā)生的區(qū)域范圍(個體、區(qū)域、全網(wǎng)等)初步確定故障范圍。可使用SQM分支路徑方案輔助分析,同時可根據(jù)報障點分布進行分析。
(3)逐段分析排查:根據(jù)問題范圍,按照定位流程排查可能的故障點。如為個體問題,檢查接入帶寬配置、線路質(zhì)量;如為區(qū)域問題,檢查故障段路徑上各設(shè)備的性能、端口流量、QOS配置;如為全網(wǎng)問題:檢查IPTV平臺系統(tǒng)服務(wù)器性能、平臺網(wǎng)絡(luò)質(zhì)量、片源質(zhì)量。
(4)疑難問題抓包分析定位:疑難問題,通過抓包進行分析定位具體故障點。在初判的故障段上,逐點抓取視頻流報文進行分析;如遇無規(guī)律的質(zhì)量差問題,請廠家工程師配合在各相關(guān)節(jié)點進行監(jiān)控或者抓包,分析定位故障原因。
提示:由于IPTV的業(yè)務(wù)流向是從城域網(wǎng)的最末端一直到最上層的應(yīng)用端,且視頻類業(yè)務(wù)對網(wǎng)絡(luò)質(zhì)量的要求非常高,所以在條件允許的情況下,多多借助工具能夠有效的提升問題處理效率,比如STB一鍵式診斷工具、SQM質(zhì)量監(jiān)控平臺等。
參考文獻
[1]許永明,謝質(zhì)文,歐陽春.IPTV技術(shù)與應(yīng)用實踐.北京:電子工業(yè)出版社,2006.
[2]史林林.論IPTV技術(shù)及應(yīng)用.電子技術(shù)與軟件工程,2016,07.
[3]劉 璽.IPTV多終端視頻切換的研究與實現(xiàn)[D].成都:電子科技大學(xué),2013.
[4]王 鐘.支持“三屏融合”的IPTV系統(tǒng)研究[D].北京:北京郵電大學(xué),2014.
收稿日期:2018-5-22
作者簡介:趙 興(1978-),女,主要從事數(shù)據(jù)網(wǎng)絡(luò)維護工作。