中國移動通信集團廣東有限公司東莞分公司 523129
摘要:本文通過對短消息的系統(tǒng)原理進行簡單闡述,描述短信信令出錯原因并結(jié)合相關(guān)案例,描述短消息故障處理的思路。
關(guān)鍵詞:短消息信令;MO;MT;取路由;出錯信息
一、短信系統(tǒng)概述
短消息中心是獨立于GSM網(wǎng)絡(luò)的一個業(yè)務(wù)處理系統(tǒng),主要功能是提交、存儲、轉(zhuǎn)發(fā)短消息,并完成與PSTN、ISDN、PSPDN等網(wǎng)絡(luò)的互通,以傳遞來自其它短消息實體SME(Short Message Entity,如:人工臺/自動臺等)的短消息。鑒于GSM網(wǎng)絡(luò)信令的復(fù)雜性、業(yè)務(wù)的多樣性,從業(yè)務(wù)表現(xiàn)出來的故障現(xiàn)象比較簡單(下發(fā)消息失敗),但原因很復(fù)雜。如果維護人員熟悉短消息系統(tǒng)結(jié)構(gòu),掌握信令規(guī)范和SMPP協(xié)議,從消息流程上可以逐段分析排除定位。
下圖簡單描述了短消息的業(yè)務(wù)流程。
二、短信信令錯誤原因
因種種原因,在短消息發(fā)送過程中,HLR和MSC都可能給網(wǎng)關(guān)返回出錯信息。這些出錯信息由GSM09.02協(xié)議規(guī)定。網(wǎng)關(guān)將這些出錯信息以及自身處理過程產(chǎn)生的錯誤傳遞給調(diào)度中心,調(diào)度中心將根據(jù)出錯信息和錯誤類型的設(shè)置決定短消息的重發(fā)或刪除。短信接通率是短消息系統(tǒng)的重要性能指標之一,優(yōu)化系統(tǒng)性能是我們努力的方向。深入分析這些出錯信息,有助于問題的準確定位。
如果短消息中心無法接收短消息,G/IW網(wǎng)關(guān)將給Servicing MSC返回錯誤。這些錯誤可能包括:
a)G/IW網(wǎng)關(guān)接收MAP_MO_FORWARD_SHORT_MESSAGE后,如果發(fā)現(xiàn)原語數(shù)據(jù)有無,將返回意外數(shù)據(jù)和數(shù)據(jù)丟失給MSC;
b)如果沒有標注SC,網(wǎng)關(guān)返回SM轉(zhuǎn)發(fā)失敗給MSC;
c)SC返回的錯誤,網(wǎng)關(guān)用SM轉(zhuǎn)發(fā)失敗帶診斷信息轉(zhuǎn)發(fā)給MSC;
d)如果網(wǎng)關(guān)無法將短消息傳遞到SC或傳遞過程因某種原因失敗,網(wǎng)關(guān)將給MSC返回系統(tǒng)錯誤。
MT失敗產(chǎn)生錯誤的原因可能來自于
1.網(wǎng)關(guān)發(fā)送路由請求后HLR可能返回的部分錯誤原因。
表1 取路由回應(yīng)過程中出錯信息
信令過程取路由回應(yīng)響應(yīng)者HLR
錯誤描述錯誤值出錯原因
systemFailure(系統(tǒng)故障)34網(wǎng)關(guān)向HLR發(fā)送MAP_SEND_ROUTING_INFO_FOR_SM請求后,會話異常終止或收到提供者錯誤
dataMissing(數(shù)據(jù)丟失)35原語中沒有提供必需的參數(shù)和數(shù)據(jù):上下文中需要的一個可選參數(shù)丟失
unexpectedDataValue(意外數(shù)據(jù))36原語中有關(guān)參數(shù)和數(shù)據(jù)的格式錯誤:在當前上下文中該參數(shù)數(shù)據(jù)類型正確但值錯誤或不應(yīng)包含該參數(shù)
facilityNotSupported(設(shè)備不支持)21移動用戶的位置登記表明,VPLMN的VLR/SGSN不支持MT短消息業(yè)務(wù)
2.網(wǎng)關(guān)取到路由后,向Servicing MSC發(fā)送短消息,MSC 可能返回的部分錯誤原因
表2 MT回應(yīng)過程中出錯信息
信令過程MT回應(yīng)響應(yīng)者MSC/VLR
錯誤描述錯誤值出錯原因
SystemFailure
(系統(tǒng)故障)341、MAP_PAGE或MAP_SEARCH_FOR_MOBILE_SUBSCRIBER確認消息返回錯誤:如果錯誤值為意外數(shù)據(jù)或未知位置數(shù)據(jù),VLR將其映射成系統(tǒng)故障,利用MAP_SEND_INFO_FOR_MT_SMS響應(yīng)將此錯誤發(fā)送給MSC,MSC轉(zhuǎn)發(fā)此錯誤。
2、MSC向VLR發(fā)送MAP_SEND_INFO_FOR_MT_SMS后,收到unknownSubscriber,MSC將其映射成系統(tǒng)故障。
3、MSC向VLR發(fā)送MAP_SEND_INFO_FOR_MT_SMS后,收到systemFailure。
4、MSC向VLR發(fā)送MAP_SEND_INFO_FOR_MT_SMS后,收到data missing 或 unexpected data value錯誤,MSC將其映射成系統(tǒng)故障。
5、MSC向VLR發(fā)送MAP_SEND_INFO_FOR_MT_SMS后,收到提供者錯誤或ABORT消息,MSC將其映射成系統(tǒng)故障。
6、MSC發(fā)送MAP_PROCESS_ACCESS_REQUEST失敗。
7、MSC向MS傳送短消息后,MS返回ABORT消息。
unexpectedDataValue(意外數(shù)據(jù))361、MAP_MT_FORWARD_SHORT_MESSAGE指示原語中有關(guān)參數(shù)和數(shù)據(jù)的格式錯誤,由MSC直接返回錯誤;
2、MSC收到目的地參考,但MAP_MT_FORWARD_SHORT_MESSAGE 指示的sm-RP-DA中沒有包括LMSI,由MSC直接返回錯誤;
3、目的地參考為空,但MAP_MT_FORWARD_SHORT_MESSAGE指示的sm-RP-DA中沒有包括IMSI,由MSC直接返回錯誤;
AbsentSubscriber
(缺席用戶)61、IMSI Detached Flag被設(shè)置為detached或LA Not Allowed Flag被設(shè)置為not allowed,VLR返回錯誤(含診斷信息'IMSI Detached'),MSC轉(zhuǎn)發(fā)此錯誤;
2、MAP_PAGE或MAP_SEARCH_FOR_MOBILE_SUBSCRIBER確認消息返回錯誤:如果錯誤值為缺席用戶,VLR利用MAP_SEND_INFO_FOR_MT_SMS響應(yīng)發(fā)送缺席用戶給MSC,MSC轉(zhuǎn)發(fā)此錯誤。
sm-DeliveryFailure(SM轉(zhuǎn)發(fā)失?。?21、如果MSC paging或search過程成功完成,但MS不具備MT能力MSC返回SM轉(zhuǎn)發(fā)失敗,并帶原因\"equipment not SM Equipped\"。
2、MSC向MS傳送短消息后,MS返回此錯誤??赡馨铝性蛑唬簠f(xié)議錯誤或內(nèi)存已滿。
3.MapServer提供的錯誤值及與協(xié)議錯誤值的映射
從上面可知,MO過程的出錯處理是網(wǎng)關(guān)向Servicing MSC發(fā)送出錯消息,從短消息中心角度出發(fā),這是一個輸出過程。而MT過程Servicing MSC和HLR有可能向網(wǎng)關(guān)發(fā)送出錯消息,這是一個輸入過程,我們正是需要利用輸入過程的這些出錯消息,判斷下發(fā)失敗的原因。
從調(diào)度中心維測臺可以看到的出錯消息(錯誤值)由MapServer提供,遠比上節(jié)羅列的錯誤消息多。處理思路如下:
1、在傳遞MSC、HLR返回錯誤的同時,出于詳細定位的目的,需要區(qū)分這些錯誤來自于HLR還是MSC,處在MT過程的哪個階段;
2、MT過程可能出現(xiàn)的狀態(tài)超時,一旦超時,會根據(jù)對端性質(zhì)將其定義為HLR無應(yīng)答或MSC無應(yīng)答。當然,可能還會與MT的某個狀態(tài)關(guān)聯(lián);
GSM09.02定義的Phase2、Phase2+各狀態(tài)的建議超時值如下:
狀態(tài)報告:3秒-10秒
發(fā)送路由請求:15秒-30秒
AlertSC:3秒-10秒
MT:1分鐘-10分鐘
MO:1分鐘-10分鐘
目前,MapServer對各狀態(tài)的缺省超時值均為60秒。
三、案例分析
案例1、主叫手機上顯示短消息發(fā)送失敗但被叫用戶卻能收到該短消息
問題現(xiàn)象:
在有些時候會出現(xiàn)這樣的情況,當某用戶發(fā)送短消息時手機上顯示“發(fā)送失敗”,但被叫手機用戶卻很快就收到該短消息。
原因分析:
本問題的關(guān)鍵在于短消息的發(fā)送是分MO和MT兩個過程。所謂MO過程,就是移動起始過程,是指短消息從手機發(fā)送到短消息中心,然后短消息中心再給主叫手機回送一條應(yīng)答消息的過程。而MT過程是指短消息中心將短消息發(fā)送到被叫手機的過程。
如果短消息中心給主叫手機回送的MO應(yīng)答消息因為各種原因沒有被轉(zhuǎn)發(fā)到主叫手機上,主叫手機就會顯示“短消息發(fā)送失敗”。而短消息中心不能知道主叫手機是否已收到應(yīng)答消息,在發(fā)送完應(yīng)答消息后,短消息中心會繼續(xù)MT過程,向被叫手機轉(zhuǎn)發(fā)該短消息。這時就會出現(xiàn)被叫手機已經(jīng)收到該短消息,但主叫手機卻顯示“短消息發(fā)送失敗”。
可能導(dǎo)致MO應(yīng)答消息沒有被轉(zhuǎn)發(fā)到主叫手機的原因有很多,一般來說有可能是短消息中心沒有正確配置MSC的GT碼,或短消息中心和MSC的數(shù)據(jù)配置得不一致,比如說MSC用DPC+GT的方式發(fā)送消息給短消息中心,而短消息中心用DPC+SSN的方式發(fā)送消息給MSC。
解決措施:
檢查MSC、短消息中心和各相關(guān)的STP的數(shù)據(jù),必要時用儀表跟蹤消息,找到?jīng)]有正確轉(zhuǎn)發(fā)MO應(yīng)答消息的設(shè)備。將數(shù)據(jù)配置正確后問題就會消失。
案例2、因HLR拒絕和MSC拒絕錯而失敗的短消息過多。
問題現(xiàn)象:
到了月底統(tǒng)計短消息呼通率時,有時會發(fā)現(xiàn),有大量的短消息的失敗原因是HLR拒絕或MSC拒絕。同時我們往往還能觀察到這樣一種情況,如果在呼叫高峰期發(fā)送短消息很容易出現(xiàn)HLR拒絕、MSC拒絕、HLR系統(tǒng)錯誤、MSC系統(tǒng)錯誤、MSC無應(yīng)答、HLR無應(yīng)答等錯誤。
問題分析:
在GSM協(xié)議中和短消息相關(guān)的消息屬于級別比較低的消息,當HLR或MSC出現(xiàn)處理能力不足的現(xiàn)象時,HLR或MSC會進行流量控制,丟棄一些級別比較低的消息,以確保高級別的消息如和呼叫、位置更新相關(guān)的消息能被正確處理。
HLR和MSC處理消息是按七號信令的分層結(jié)構(gòu)進行的,也就是說,HLR和MSC收到消息后首先將消息送到MTP層處理,然后再送到SCCP層處理,然后是TCAP層、MAP層。如果MTP層或SCCP出現(xiàn)處理能力不足的情況,HLR和MSC就不會給短消息中心回應(yīng)答消息,這時短消息中心就會出現(xiàn)HLR無應(yīng)答或MSC無應(yīng)答。
如果MTP層和SCCP層能夠順利地處理消息,而TCAP出現(xiàn)處理能力不足的現(xiàn)象,HLR和MSC就會給短消息中心回TC_ABORT消息,這時短消息中心就會出現(xiàn)HLR拒絕或MSC拒絕。
如果MTP層、SCCP層和TCAP層能夠順利地處理消息而MAP出現(xiàn)處理能力不足的現(xiàn)象,HLR和MSC就會給短消息中心回系統(tǒng)錯誤的應(yīng)答消息,這時短消息中心就會出現(xiàn)HLR系統(tǒng)錯誤或MSC系統(tǒng)錯誤。
解決措施:
優(yōu)化MSC、HLR的配置,提高出現(xiàn)問題的設(shè)備的處理能力。在短消息中心上將HLR拒絕、MSC拒絕、HLR系統(tǒng)錯誤、MSC系統(tǒng)錯誤等錯誤配置成嚴重錯誤或者臨時錯誤,重發(fā)時間間隔為0,避免對MSC及HLR造成更大的系統(tǒng)負荷。
作者簡介:
徐鐵成,中國移動通信集團廣東有限公司東莞分公司網(wǎng)絡(luò)管理中心。
參考文獻:
[1]《900/1800MHz TDMA數(shù)字蜂窩移動通信網(wǎng)短消息中心設(shè)備測試規(guī)范 第一分冊 點對點短消息業(yè)務(wù)部分》,信息產(chǎn)業(yè)部電信傳輸研究所,1999
[2]《Digital cellular telecommunications system(Phase 2+);Mobile Application Part(MAP)specification(GSM 09.02 version 6.2.0 Release 1997)),ETSI,1998-11
[3]《Eourpean digital cellular telecommunication system(Phase1)Mobile Application Part(MAP)Specification Recommendation GSM 09.02》,ETSI,1995