摘 要:目前全省已大規(guī)模部署IPTV業(yè)務(wù),隨之而來(lái)是IPTV故障逐漸增多。對(duì)于IPTV這種端到端的業(yè)務(wù),涉及多廠家,穿越多種網(wǎng)絡(luò)類(lèi)型的業(yè)務(wù),如何保障業(yè)務(wù)質(zhì)量,如何快速定位故障原因?是當(dāng)前急需考慮的問(wèn)題。本文將對(duì)1起IPTV業(yè)務(wù)出現(xiàn)卡頓和花屏的故障案例進(jìn)行分析,并通過(guò)該案例總結(jié)梳理IPTV業(yè)務(wù)處理流程。
關(guān)鍵詞:IPTV;卡頓;花屏;ME60
中圖分類(lèi)號(hào):TN948.55 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-7344(2018)18-0257-02
1 背景描述
隨著視屏業(yè)務(wù)的發(fā)展,用戶對(duì)IPTV網(wǎng)絡(luò)感知越來(lái)越敏感。影響IPTV視頻質(zhì)量的不僅僅是網(wǎng)絡(luò)質(zhì)量,IPTV平臺(tái)的視頻編解碼質(zhì)量,機(jī)頂盒、家庭終端等設(shè)備都可能會(huì)影響IPTV業(yè)務(wù)感知,對(duì)于IPTV業(yè)務(wù)出現(xiàn)卡頓和花屏感知類(lèi)故障處理時(shí),需要進(jìn)行端到端的通盤(pán)考慮和定位,并對(duì)端到端所使用到的各類(lèi)協(xié)議、涉及的設(shè)備功能以及實(shí)現(xiàn)等都要了解,才能夠快速、準(zhǔn)確地定位問(wèn)題。
2 典型案例
(1)故障現(xiàn)象:ME60下采用DHCP方式接入的多個(gè)用戶,在晚上高峰期收看IPTV節(jié)目時(shí)出現(xiàn)卡屏。在同一終端使用PPPoE模式收看IPTV不卡屏,但使用DHCP模式收看IPTV卡屏??ㄆ脸霈F(xiàn)在晚上業(yè)務(wù)高峰期,白天業(yè)務(wù)輕載時(shí)沒(méi)有問(wèn)題??ㄆ羻?wèn)題終端集中在某ME60的1/0/3接口下。
(2)組網(wǎng)情況:常見(jiàn)IPTV端到端網(wǎng)絡(luò)拓?fù)淙缦?,本案例涉及到的設(shè)備路徑為:ME60→S9306→OLT→HG8245→STB。
(3)分析及處理:由于在高峰期才會(huì)出現(xiàn)卡屏,并且使用PPPoE方式的用戶沒(méi)有出現(xiàn)卡屏問(wèn)題,可以初步推斷原因?yàn)?,在IPoE方式下因高峰期某設(shè)備接口帶寬不足導(dǎo)致的丟包,且丟包的點(diǎn)應(yīng)該在ME60及以下設(shè)備,因此需要逐個(gè)排查MA5600T、S9306、ME60,以確認(rèn)丟包發(fā)生的段落。
①在MA5600T設(shè)備上排查。在MA5600T(OLT)上進(jìn)行抓包,確認(rèn)丟包發(fā)生在MA5600T上游設(shè)備還是MA5600T及下游設(shè)備。在OLT上行口鏡像抓包,配置如下:
鏡像命令配置,將0/20/0的MACf8e8-11b3-86ef的報(bào)文鏡像到0/20/1,在0/20/1抓包。
將抓到的數(shù)據(jù)報(bào)文進(jìn)行分析,發(fā)現(xiàn)有9.5%的報(bào)文丟包,說(shuō)明在OLT上游就發(fā)生了丟包,需要繼續(xù)進(jìn)行確認(rèn)。
②在S9306設(shè)備上排查。確認(rèn)丟包是發(fā)生在S9306上游設(shè)備還是S9306及其下游設(shè)備。在S9306上行接口(與ME60相連的接口)進(jìn)行鏡像抓包,發(fā)現(xiàn)S9306上行存在丟包,說(shuō)明丟包可能發(fā)生在ME60設(shè)備上。
③在ME60設(shè)備上排查。查看G1/0/3的接口信息,發(fā)現(xiàn)在ME60設(shè)備1/0/3接口晚上業(yè)務(wù)高峰期Output(下行方向)端口利用率超過(guò)80%,很可能是因?yàn)镸E60設(shè)備1/0/3接口業(yè)務(wù)擁塞出方向丟包導(dǎo)致IPTV業(yè)務(wù)卡屏。
端口的上下行流量統(tǒng)計(jì)值(Input/Output bandwidth utilization80.57%)為統(tǒng)計(jì)平均值,由于業(yè)務(wù)本身流量是突發(fā)的,所以端口利用率超過(guò)80%時(shí),實(shí)際業(yè)務(wù)峰值流量可能超過(guò)端口帶寬,出現(xiàn)丟包。
④對(duì)比兩種上線方式信息。分別查看PPPoE上線用戶詳細(xì)信息和DHCP上線用戶詳細(xì)信息,并進(jìn)行差異對(duì)比。發(fā)現(xiàn)DHCP上線方式,沒(méi)有對(duì)用戶帶寬進(jìn)行限制。PPPoE上線方式,由Radius對(duì)用戶帶寬進(jìn)行了限制。
由上可以看出,ME60上DHCP方式用戶沒(méi)有限速,PPPOE方式用戶是存在限速的。經(jīng)詢問(wèn)廠家得知:ME60設(shè)備內(nèi)部轉(zhuǎn)發(fā)時(shí)只能保證隊(duì)列的CIR保證帶寬不丟包,當(dāng)隊(duì)列超出該值時(shí)只會(huì)盡量轉(zhuǎn)發(fā),但不保證不丟包。當(dāng)端口出現(xiàn)擁塞,在流量突發(fā)高峰時(shí)總流量超過(guò)端口帶寬(1Gbit/s),用戶超過(guò)CIR保證帶寬的流量會(huì)被丟棄。(用戶帶寬限制中:CIR Committed Information Rate承諾信息速率,PIR Peak information rate標(biāo)峰值信息速率。)
(4)故障原因定位。對(duì)DHCP方式用戶如不配置帶寬進(jìn)行限制,則用戶的默認(rèn)CIR值為128Kbit/s,PIR值為1Gbit/s,端口擁塞出現(xiàn)時(shí),只能保證128Kbit/s的帶寬,部分報(bào)文被丟棄。PPP撥號(hào)用戶上線時(shí),會(huì)根據(jù)用戶的帶寬情況如2Mbit/s、3Mbit/s或100Mbit/s來(lái)分配獨(dú)立CIR用戶隊(duì)列,能夠保證用戶CIR帶寬。
(5)解決方案。通過(guò)在ME60上的用戶域下配置用戶CIR保證帶寬,解決卡屏問(wèn)題。
(6)處理建議及總結(jié)
本案例中,業(yè)務(wù)高峰時(shí)ME60端口的平均占用率已經(jīng)達(dá)到80%,應(yīng)及時(shí)對(duì)ME60端口進(jìn)行擴(kuò)容,避免突發(fā)流量超端口帶寬導(dǎo)致的丟包。如無(wú)法及時(shí)擴(kuò)容,可根據(jù)現(xiàn)網(wǎng)實(shí)際業(yè)務(wù)發(fā)放方案,在ME60的用戶域下配置用戶CIR保證帶寬,可以在一定程度上避免此問(wèn)題發(fā)生。現(xiàn)網(wǎng)中,要根據(jù)實(shí)際業(yè)務(wù)發(fā)放方法配置,如通過(guò)Radius下發(fā)用戶帶寬配置。
3 經(jīng)驗(yàn)總結(jié)
對(duì)于IPTV常見(jiàn)故障,一般可分為通斷類(lèi)故障和質(zhì)量類(lèi)故障。通斷類(lèi)故障現(xiàn)象明顯,排查較為容易。質(zhì)量類(lèi)故障,故障頻次和范圍無(wú)規(guī)律,通常需要端到端的進(jìn)行梳理排查故障。下面對(duì)質(zhì)量類(lèi)故障進(jìn)行重點(diǎn)歸納總結(jié)。
3.1 質(zhì)量類(lèi)故障場(chǎng)景歸類(lèi)
全部BTV業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但所有BTV均出現(xiàn)質(zhì)量問(wèn)題,比如馬賽克,花屏等情況。
部分BTV業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但部分BTV頻道質(zhì)量差,部分BTV頻道質(zhì)量正常。
VOD業(yè)務(wù)質(zhì)量差指客戶可以正常使用IPTV業(yè)務(wù),但其觀看的VOD節(jié)目質(zhì)量差,比如馬賽克,花屏等。
操作體驗(yàn)差指出現(xiàn)EPG顯示慢,頻道切換慢,VOD點(diǎn)播慢等操作體驗(yàn)差的情況。
3.2 IPTV基本故障定位思路
在日常對(duì)IPTV業(yè)務(wù)的維護(hù)經(jīng)驗(yàn)積累中發(fā)現(xiàn),單個(gè)的IPTV用戶故障原因多數(shù)是由于用戶側(cè)自身問(wèn)題造成;如果可以確定為群障,那么一定會(huì)在上層網(wǎng)絡(luò)側(cè)有著共同的組網(wǎng)環(huán)境。所以IPTV的故障定位遵循的基本原則是:先定界再定位,先用戶側(cè)再網(wǎng)絡(luò)側(cè)。
(1)家庭網(wǎng)絡(luò)問(wèn)題排查:排除基本家庭網(wǎng)絡(luò)問(wèn)題、收集故障信息。首先對(duì)家庭網(wǎng)絡(luò)設(shè)備檢查如STB連接方式含端口協(xié)商模式和設(shè)備使用情況。再收集問(wèn)題現(xiàn)象和相關(guān)信息,如對(duì)用戶高速上網(wǎng)時(shí)導(dǎo)致質(zhì)量差,可檢查接入設(shè)備QOS設(shè)置。
(2)根據(jù)問(wèn)題范圍,分責(zé)定界:根據(jù)用戶故障發(fā)生的區(qū)域范圍(個(gè)體、區(qū)域、全網(wǎng)等)初步確定故障范圍。可使用SQM分支路徑方案輔助分析,同時(shí)可根據(jù)報(bào)障點(diǎn)分布進(jìn)行分析。
(3)逐段分析排查:根據(jù)問(wèn)題范圍,按照定位流程排查可能的故障點(diǎn)。如為個(gè)體問(wèn)題,檢查接入帶寬配置、線路質(zhì)量;如為區(qū)域問(wèn)題,檢查故障段路徑上各設(shè)備的性能、端口流量、QOS配置;如為全網(wǎng)問(wèn)題:檢查IPTV平臺(tái)系統(tǒng)服務(wù)器性能、平臺(tái)網(wǎng)絡(luò)質(zhì)量、片源質(zhì)量。
(4)疑難問(wèn)題抓包分析定位:疑難問(wèn)題,通過(guò)抓包進(jìn)行分析定位具體故障點(diǎn)。在初判的故障段上,逐點(diǎn)抓取視頻流報(bào)文進(jìn)行分析;如遇無(wú)規(guī)律的質(zhì)量差問(wèn)題,請(qǐng)廠家工程師配合在各相關(guān)節(jié)點(diǎn)進(jìn)行監(jiān)控或者抓包,分析定位故障原因。
提示:由于IPTV的業(yè)務(wù)流向是從城域網(wǎng)的最末端一直到最上層的應(yīng)用端,且視頻類(lèi)業(yè)務(wù)對(duì)網(wǎng)絡(luò)質(zhì)量的要求非常高,所以在條件允許的情況下,多多借助工具能夠有效的提升問(wèn)題處理效率,比如STB一鍵式診斷工具、SQM質(zhì)量監(jiān)控平臺(tái)等。
參考文獻(xiàn)
[1]許永明,謝質(zhì)文,歐陽(yáng)春.IPTV技術(shù)與應(yīng)用實(shí)踐.北京:電子工業(yè)出版社,2006.
[2]史林林.論IPTV技術(shù)及應(yīng)用.電子技術(shù)與軟件工程,2016,07.
[3]劉 璽.IPTV多終端視頻切換的研究與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2013.
[4]王 鐘.支持“三屏融合”的IPTV系統(tǒng)研究[D].北京:北京郵電大學(xué),2014.
收稿日期:2018-5-22
作者簡(jiǎn)介:趙 興(1978-),女,主要從事數(shù)據(jù)網(wǎng)絡(luò)維護(hù)工作。