文英, 何長梟, 居天春
(中國移動通信集團廣西有限公司, 南寧 530022)
隨著手機上網(wǎng)用戶的增多,移動數(shù)據(jù)流量業(yè)務及話單增長迅猛。關(guān)于套餐使用量的提醒不及時等相關(guān)問題及投訴呈上漲趨勢。本文首先分析了目前流量閥值提醒短信下發(fā)的主要流程及存在的話單生成或采集不及時、離線話單占比高導致提醒時延偏大等相關(guān)問題,接著從監(jiān)控、系統(tǒng)處理等方面提出了一些優(yōu)化措施。優(yōu)化后數(shù)據(jù)表明,在線計費系統(tǒng)處理性能和在線計費話單占比得到了提升,較好地縮短了流量閥值提醒短信下發(fā)時延。
某通信運營商全流程提醒服務規(guī)范中套餐內(nèi)數(shù)據(jù)流量定量提醒定義:對客戶套餐內(nèi)數(shù)據(jù)流量業(yè)務,每賬期至少進行兩次用量提醒,即當實際使用量接近和到達套餐使用限量時進行提醒。此類提醒是由用戶使用話單中使用量觸發(fā),一般是通過短信下發(fā)提醒信息給客戶,又稱為流量閥值提醒或流量余量提醒。
相關(guān)提醒時延定義:提醒發(fā)布時延指提醒觸發(fā)具備條件至提醒發(fā)布并向客戶成功展示所需時間,包括計費生成時延、提醒生成時延、提醒下發(fā)時延。其中,計費生成時延:指客戶相應通信消費行為產(chǎn)生對應計費信息并傳送至支撐系統(tǒng)的時間間隔;提醒生成時延:支撐系統(tǒng)收到客戶計費信息,在生成提醒內(nèi)容后發(fā)布至下發(fā)平臺(如短信中心)的時間間隔;提醒下發(fā)時延:提醒下發(fā)平臺(如短信中心)收到提醒內(nèi)容并成功向客戶展示的時間間隔。
各類提醒發(fā)布時延和相關(guān)指標參考值如表1所示。
從表1可知,在線、離線情況下,閥值提醒短信的最大提醒生成時延參考值分別是5 min和10 min,全流程的發(fā)布最大時延分別是10 min和45 min。
根據(jù)上述定義,計費生成時延相當于是從話單結(jié)束至支撐系統(tǒng)收到客戶計費信息的時間間隔;提醒生成時延是從支撐系統(tǒng)收到客戶計費信息的時間開始計算。支撐系統(tǒng)收到客戶計費信息的時間,準確來說是采集話單或采集在線消息的時間,但目前計費系統(tǒng)中僅有話單文件的采集時間,對應話單量龐大,僅能通過手工統(tǒng)計單個及少量話單對應的采集時間,無法批量統(tǒng)計多個流量話單對應的采集時間。基于此情況,目前提醒生成時延有如下兩種統(tǒng)計口徑。
表1 提醒時延參考值和指標參考值
統(tǒng)計口徑1:考慮到一般情況下采集到批價處理耗時較短,而系統(tǒng)可提供批價時間,故從系統(tǒng)批價時間即生成閥值告警開始計算。
統(tǒng)計口徑2:是從話單結(jié)束時間開始計算,但離線情況下從話單結(jié)束至支撐系統(tǒng)實際采集和處理仍有一定耗時。
目前,移動數(shù)據(jù)流量業(yè)務閥值提醒短信下發(fā)的流程,涉及設備側(cè)、BOSS側(cè)計費、賬管、短信廳等系統(tǒng),包括話單生成、話單處理、閥值告警生成及處理、提醒短信生成及發(fā)送等多個環(huán)節(jié),整理如圖1所示。
(1)生成離線話單或根據(jù)在線會話消息生成在線話單:客戶開始使用移動數(shù)據(jù)流量業(yè)務、產(chǎn)生上網(wǎng)行為時,若是離線方式會在GGSN等設備側(cè)生成離線話單;若是在線方式,由在線計費系統(tǒng)根據(jù)會話消息生成在線話單。設備側(cè)數(shù)據(jù)流量話單按照每2 M流量(上下行流量之和)或每30 min(滿足任一條件)進行切割。
(2)生成閥值告警: BOSS系統(tǒng)計費程序會對話單進行批價處理,讀取用戶資料MDB(Memory Data Base,簡稱MDB)及免費資源MDB,根據(jù)使用量及產(chǎn)品閥值(如剩余10 M、0 M等),判斷是否觸發(fā)閥值告警,滿足則觸發(fā)閥值告警,從免費資源MDB中導出告警記錄至賬務數(shù)據(jù)庫流量提醒表中。
(3)處理閥值告警生成提醒短信:BOSS系統(tǒng)賬管程序會實時掃描賬務數(shù)據(jù)庫流量提醒表,多線程并發(fā)處理相應記錄,根據(jù)提醒模板、提醒規(guī)則、提醒內(nèi)容等拼接生成提醒短信,處理后寫歷史表。
(4)提醒短信提交至短信中心:BOSS系統(tǒng)短廳程序?qū)崟r掃描短信發(fā)表中提醒短信并提交網(wǎng)絡側(cè)短信中心,處理后寫短信發(fā)送歷史表。
(5)短信中心下發(fā)客戶:網(wǎng)絡側(cè)短信中心將BOSS提交的短信發(fā)送給用戶,成功發(fā)送則生成相應短信話單。
綜上,閥值提醒短信的下發(fā)涉及到話單生成、話單處理、閥值告警生成及處理、提醒短信生成及發(fā)送等4個主要環(huán)節(jié),各環(huán)節(jié)的時延長短會影響到客戶對流量提醒短信是否及時的感知。
基于此流程,結(jié)合日常維護和投訴處理相關(guān)情況,總結(jié)出目前系統(tǒng)中主要存在如下兩個問題,這些問題也是導致提醒不及時相關(guān)投訴居高不下的重要原因之一。
圖1 移動數(shù)據(jù)流量業(yè)務閥值提醒短信下發(fā)流程
(1)離線情況下因網(wǎng)絡斷連、網(wǎng)元異常、賬號密碼過期等情況造成話單采集不及時,影響到話單后續(xù)處理,導致閥值提醒不及時。
例如,2014年5月出現(xiàn)臨時網(wǎng)絡故障,設備側(cè)與BOSS側(cè)網(wǎng)絡斷聯(lián),導致BOSS側(cè)無法采集到設備側(cè)生成的話單,網(wǎng)絡恢復正常后才將積壓在設備側(cè)話單采集過來并進行后續(xù)處理,延遲最長達30余分鐘。
從BOSS側(cè)較難主動發(fā)現(xiàn)網(wǎng)元異常情況,而網(wǎng)絡連通性問題,易受設備側(cè)、BOSS側(cè)雙方影響,且存在較多不可控因素,如施工導致傳輸斷、網(wǎng)絡設備老化等,可優(yōu)化空間較小?;诖?,可以考慮從監(jiān)控網(wǎng)絡連通性、業(yè)務對應話單文件生成等情況來發(fā)現(xiàn)異常。
(2)離線話單占比高,導致整體提醒時延偏長。
以某市公司2014年5月一天全量非漫游移動數(shù)據(jù)流量話單為例,話單總數(shù)為2261萬條,在線話單數(shù)為1 399萬條,在線話單數(shù)占比61.87%,即離線話單占比超38%,占比較高?;诮y(tǒng)計口徑2時,在線情況下提醒短信平均時延已低于0.5 min,離線對應的提醒短信平均時延超過9 min。由此可見,離線話單占比較高,是導致整體(不區(qū)分在線、離線)提醒生成時延偏大的主要原因,需要提高在線話單占比。
針對問題1,從BOSS側(cè)主動監(jiān)控角度出發(fā),新增話單采集點連通性監(jiān)控、話單超時未生成及生成延遲的監(jiān)控,可降低網(wǎng)絡異常、網(wǎng)元異常等情況對話單采集的影響。
BOSS側(cè)計費主機是一般是通過FTP登錄采集點進行移動數(shù)據(jù)流量話單采集的。梳理采集進程中的采集配置,新增監(jiān)控腳本,根據(jù)采集點IP、采集賬號、密碼、話單文件源路徑等關(guān)鍵字段模擬計費主機FTP登錄,根據(jù)能否登錄、登錄后相應路徑話單文件數(shù)量等情況來判斷到對應采集點的網(wǎng)絡連通性,對異常情況進行告警,核查確認后通知設備側(cè)進行相應核查。
離線情況下的移動數(shù)據(jù)流量話單記錄是每達到2M流量(上下行流量之和)或每30 min(滿足任一條件)時,即生成一條話單記錄。根據(jù)這一生成規(guī)則,查看現(xiàn)網(wǎng)話單生成情況,白天業(yè)務量較大,正常情況下話單文件生成頻率是5~16個/ min;在夜間閑時,正常情況下話單文件生成頻率是個1~3個/ min。考慮BOSS側(cè)采集處理延時,共計設置18個移動數(shù)據(jù)流量話單采集進程的超時閥值為35 min,即正常情況下超過35 min未生成話單時進行告警。同時在解碼環(huán)節(jié),增加對話單延遲的相關(guān)監(jiān)控,如延遲超過24 h則進行告警。出現(xiàn)上述告警時,可能是設備側(cè)網(wǎng)絡異常、話單生成異常等導致,需進一步核查處理,確定后通知設備側(cè)進行相應核查。
針對問題2,通過分析在線用戶產(chǎn)生的異常離線話單,發(fā)現(xiàn)大量用戶在BOSS側(cè)和HLR側(cè)在線計費屬性存在不一致情況,導致在線用戶產(chǎn)生的在線話單走離線話單處理,導致提醒生成時延偏大。例如,前期遷入在線計費系統(tǒng)的1500萬用戶中,BOSS側(cè)與HLR側(cè)在線計費屬性一致數(shù)據(jù)約為1 100萬,BOSS側(cè)有、HLR側(cè)無在線計費屬性的用戶約400萬,BOSS側(cè)無、HLR側(cè)有在線計費屬性的用戶約14萬,差異的主要原因為從BOSS側(cè)批量遷入時部分資料發(fā)HLR失敗導致。
為確保BOSS側(cè)和HLR側(cè)用戶在線計費屬性一致,分步重新將各地市用戶遷入在線計費系統(tǒng),先從用戶量相對少的地市開始,每天遷入約20萬用戶,遷入后觀察在線計費話單情況,無異常后再繼續(xù)進行遷入。截至2014年10月,共計完成978萬用戶的遷入,占全區(qū)用戶的36%。
同時,統(tǒng)計分析BOSS側(cè)內(nèi)部數(shù)據(jù)一致性情況,比對營業(yè)側(cè)和賬管側(cè)在線計費屬性相關(guān)表,修復相關(guān)差異數(shù)據(jù),并進行用戶資料MDB初始化,確保MDB中數(shù)據(jù)與數(shù)據(jù)庫中數(shù)據(jù)一致,逐步建立BOSS側(cè)和HLR側(cè)在線計費用戶一致性比對機制。
此外,核查在線轉(zhuǎn)離線的異常話單時,發(fā)現(xiàn)存在INBOSS系統(tǒng)處理性能不足導致系統(tǒng)反算超時切離線的情況。針對此情況,對在線計費系統(tǒng)進行擴容,增加2臺主機后,共計在4臺主機上部署在線計費應用程序,并增加DCC代理與INBOSS的進程個數(shù),調(diào)整系統(tǒng)待應答時間。同時,針對4G流量話單,因4G網(wǎng)絡下速率較快,參照集團相關(guān)參數(shù)建議值,調(diào)整了在線計費流量片配額值,以減少不斷反算申請流量片的系統(tǒng)處理開銷以及話單量。通過上述一系列優(yōu)化工作,來提升在線計費系統(tǒng)處理能力,減少在線轉(zhuǎn)離線的異常情況。
優(yōu)化措施1涉及的相關(guān)監(jiān)控部署,已于2014年6月底已全部完成。截至10月,設備及平臺側(cè)賬號過期故障出現(xiàn)2次,話單生成異常(包括超時無文件生成、生成話單延遲)故障出現(xiàn)3次、設備斷連故障出現(xiàn)1次,共計出現(xiàn)6次。而通過采集點連通性、話單超時未生成情況的異常告警,均主動發(fā)現(xiàn)了上述6次故障,即做到100%主動發(fā)現(xiàn)此類設備及平臺側(cè)異常的故障,并及時通知設備、平臺側(cè)進行處理避免升級至更大故障,極大地降低了故障的相關(guān)影響,保障了話單采集及時性。優(yōu)化后,10月隨機抽樣數(shù)據(jù)顯示,在線話單占比由優(yōu)化前的61.87%提升至81.71%,即降低了離線話單占比。
實施優(yōu)化措施2之前,以全區(qū)客戶5月不同時間段的閥值流量提醒短信數(shù)據(jù)做統(tǒng)計分析,各環(huán)節(jié)時延情況如表2和表3所示。
備注:因各環(huán)節(jié)無唯一標識,BOSS側(cè)只能根據(jù)下發(fā)端口、客戶號碼對應短信下發(fā)時間、接收時間等來估算客戶接收提醒短信的情況,不能完全準確對應,故環(huán)節(jié)D為隨機抽樣數(shù)據(jù),總樣本數(shù)為200余萬條。
表2中,在線流量提醒閥值告警占比37.41%。不區(qū)分在線、離線時,基于統(tǒng)計口徑1、2的提醒生成時延分別是0.11 min和7.23 min,全流程提醒發(fā)布時延為7.47 min;96.35%的提醒短信下發(fā)時延(環(huán)節(jié)D)均小于提醒服務規(guī)范要求的4 min,平均時延為0.24 min。雖然各環(huán)節(jié)均滿足提醒服務規(guī)范要求的最大參考時延,但從客戶角度來看,提醒不夠及時,影響客戶感知。表3中,在線閥值提醒5 min及時率為99.5%,提醒較及時;離線閥值提醒5 min及時率和10 min及時率分別為40.8%和52.62%。不區(qū)分在線、離線時,整體閥值提醒的5 min及時率和10 min及時率僅為62.76%和70.16% ,時延較大。
表2 隨機抽樣數(shù)據(jù)-5月(優(yōu)化前)閥值流量提醒時延
表3 隨機抽樣數(shù)據(jù)-5月(優(yōu)化前)、10月(優(yōu)化后)閥值流量提醒時延分布
表4 隨機抽樣數(shù)據(jù)-10月(優(yōu)化后)閥值流量提醒時延
優(yōu)化后,以全區(qū)客戶10月不同時間段的閥值流量提醒短信數(shù)據(jù)做統(tǒng)計分析,各環(huán)節(jié)時延情況如表3和表4所示。
表4中,優(yōu)化后在線流量提醒閥值告警占比79.13%,較優(yōu)化前提升41.72 PP。不區(qū)分在線、離線時,基于統(tǒng)計口徑1、2的提醒生成時延分別是0.1 min和3.46 min,全流程提醒發(fā)布時延為3.68 min,提醒較及時,較優(yōu)化前縮短近一半。表3中,優(yōu)化后在線閥值提醒5 min及時率為99.97%,較優(yōu)化前提升0.47 PP;離線閥值提醒5 min及時率和10 min及時率分別為66.47%和75.41%,較優(yōu)化前分別提升25.67 PP和22.79 PP。不區(qū)分在線、離線時,整體閥值提醒的5 min及時率和10 min及時率分別為87.63%和91.50% ,較優(yōu)化前分別提升24.87 PP和21.34 PP。
在目前流量閥值提醒短信下發(fā)流程中,話單生成和采集的及時性極大地影響著后續(xù)閥值提醒短信下發(fā)的及時性。在線計費系統(tǒng)基于在線實時計費消息生成話單,可以較好地縮短話單生成時延,有利于及時下發(fā)閥值提醒短信,降低欠費風險,從而提升客戶使用感知和客戶滿意度。隨著流量業(yè)務向在線計費系統(tǒng)的逐步遷移,對在線計費系統(tǒng)的穩(wěn)健性和健壯性提出了更高要求。此外,在引導客戶了解閥值提醒短信服務、理解提醒短信存在合理時延的同時,可以考慮提供多種渠道的提醒服務來提升客戶感知,如實現(xiàn)頁面提醒、客戶端提醒等。