[文錦朝 張寶艷]
隨著5G 網(wǎng)絡的快速建設,5G 廣覆蓋已有很大的提升,通過全網(wǎng)VoNR 端到端分場景測試結(jié)果表明,5GC 核心網(wǎng)、無線網(wǎng)均已具備VoNR 開通條件。但在初始開通VoNR 功能后,VoNR 掉話率一直居高不下,如某地市VoNR 掉話率達到0.30%左右,遠高于VoLTE 掉話率的0.07%。本文結(jié)合VoNR 網(wǎng)絡架構(gòu)及各網(wǎng)元功能,從核心網(wǎng)、傳輸網(wǎng)、無線網(wǎng)及終端4 個維度9 個典型場景開展端到端掉話信令分析研究,對掉話根因進行定位,并制定對應的核心網(wǎng)數(shù)據(jù)核查、故障處理、鄰區(qū)優(yōu)化、PCI 規(guī)劃、參數(shù)調(diào)整等VoNR 掉話優(yōu)化方案,提升VoNR 的語音質(zhì)量,確保VoNR 與 VoLTE 同感同質(zhì)。
VoNR 是5G 網(wǎng)絡語音業(yè)務解決方案,是一種建立在IP 網(wǎng)絡之上的UE(User Equipmen,用戶設備)和IMS(IP Multimedia Subsystem,IP 多媒體子系統(tǒng))之間的語音會話,主被叫可以利用該技術(shù)在5G 網(wǎng)絡上實現(xiàn)語音業(yè)務。其核心業(yè)務控制網(wǎng)絡為IMS 網(wǎng)絡,配合NR-RAN(5G 接入網(wǎng))及5GC(5G 核心網(wǎng)),從而實現(xiàn)端到端的基于分組域的語音及視頻通信業(yè)務[1~4],EPS FB(Evolved Packet System Fallback,5G 網(wǎng)絡側(cè)語音回落)到VoNR 的網(wǎng)絡結(jié)構(gòu)演進如圖1 所示。
圖1 EPS FB 到VoNR 的網(wǎng)絡結(jié)構(gòu)演進圖
5G 網(wǎng)絡參照服務類型、時延和丟包率等標準,將具有不同特征的業(yè)務劃分成不同的5QI(5G Qos Identifier)承載類型,與VoNR 業(yè)務直接相關(guān)的承載包括5QI1、5QI2 和5QI5,其中5QI1 承載語音,5QI2 承載視頻,5QI5 承載用于建立VoNR 的SIP(Session Initiation Protocol)信令。
VoNR 作為5G 語音解決方案,相對于4G 語音解決方案VoLTE 有以下特點:
(1)空口由NR 基站承載語音業(yè)務,完全的5G 語音方案;
(2)新的語音編碼方案:EVS(Enhanced Voice Service)擴展音頻帶寬為50 Hz~ 16 kHz,支持人類聽覺的全帶寬。網(wǎng)絡部署初期,傳統(tǒng)4G 終端較多,EVS 采用AMR 兼容模式,網(wǎng)絡成熟期5G 終端滲透率提高后,5G終端之間采用EVS 提升語音質(zhì)量;
(3)3GPP R16 制定IVAS(immersive Voice and audio Services)語音編碼標準,支持更好的抗丟包能力。
主叫UE 和被叫UE 之間語音承載的建立和釋放流程[5]如圖2 所示。
圖2 VoNR 呼叫信令流程圖
VoNR 掉話率定義為,在VoNR 的過程中,終端通信過程中意外中斷的幾率,包括用戶僅語音通話時的意外中斷幾率;用戶視頻通話時,既無圖像也無語音的意外中斷幾率。
VoNR 掉話率=VoNR 始呼掉話次數(shù)+VoNR 終呼掉話次數(shù))/(VoNR 始呼應答次數(shù)+VoNR 終呼應答次數(shù))*100%
VoNR 主被叫掉話機制簡圖如圖3、4 所示。
圖4 VoNR 被叫掉話機制簡圖
3.1.1 VoNR 發(fā)起掉話對象分析
VoNR 掉話率是網(wǎng)絡保持能力的一個表征,在VoNR通話過程中,UE 主要與AMF(AuthenticationManagement Function,認證管理功能)、(R)AN 直接進行信令交互,如圖5 所示。
圖5 VoNR 網(wǎng)元拓撲圖
根據(jù)圖5 VoNR 網(wǎng)元拓撲圖分析,UE、AMF、(R)AN((Radio) Access Network,(無線)接入網(wǎng))為相互連接的網(wǎng)元,結(jié)合VoNR 的呼叫信令流程,因此直接發(fā)起掉話對象可能為UE(終端)、AMF、(R)AN 三個網(wǎng)元,間接發(fā)起掉話對象可能UPF(User Plane Function,用戶面功能)、SMF(Session Management Function,會話管理功能)、PCF、CSCF 等網(wǎng)元。
(1)AMF 釋放掉話:從圖5 分析得出,AMF 釋放掉話有兩種情況,一是AMF 直接通過N1 口下發(fā)釋放信令給UE(終端),即大概率為核心網(wǎng)問題導致的掉話;二是AMF 與(R)AN 有信令交互,并通過(R)AN 下發(fā)釋放給UE,則可能為核心網(wǎng)與(R)AN 側(cè)問題導致掉話,可通過N2 接口的異常釋放原因,結(jié)合信令流分析判斷發(fā)起掉話對象。
(2)(R)AN 釋放掉話:即接入網(wǎng)釋放,可能原因為基站直接釋放或核心網(wǎng)間接釋放。如果(R)AN 掉話可分為無線側(cè)掉話和傳輸側(cè)掉話;無線側(cè)掉話多為無線信號質(zhì)量無法維持無線鏈路導致(包含快衰、網(wǎng)內(nèi)切換失敗、網(wǎng)間切換失敗等原因)。
(3)UE(終端)釋放掉話:根據(jù)專家經(jīng)驗分析,此類掉話一般為終端電池耗盡、UE(終端)異常導致。
結(jié)合以上分析,本文主要通過核心網(wǎng)掉話、(R)AN 掉話(傳輸網(wǎng)和無線網(wǎng))、終端掉話4 個典型掉話場景進行詳細分析,明確掉話的根因,并制定針對性的優(yōu)化策略。
3.2.1 核心網(wǎng)掉話分析
核心網(wǎng)主要包含AMF、SMF、UPF、UDM、CSCF等網(wǎng)元組成[6],各網(wǎng)元的功能如表1。
表1 核心網(wǎng)網(wǎng)元
根據(jù)核心網(wǎng)網(wǎng)元功能的分析,結(jié)合N1,N2 口的信令分析核心網(wǎng)典型掉話場景主要有以下兩種。
(1)場景一:核心網(wǎng)deregister 異常釋放分析
①問題描述:用戶使用VoNR 撥打10086 開通或是取消某些業(yè)務時,UDM 在線觸發(fā)更新用戶個人簽約數(shù)據(jù),AMF 通知UE deregister 后重新register 入網(wǎng),從而出現(xiàn)掉話。
② 問題分析:用戶通話中,AS 向UDM 發(fā)送PUR 請求消息,請求更新指定用戶的透明數(shù)據(jù)或別名透明數(shù)據(jù),收到PUR 消息后UDM 直接在線激活后更新用戶個人profile,核心網(wǎng)AMF 知會UE 發(fā)起nas: deregister (2)釋放上下文,導致發(fā)生掉話。
③分析結(jié)論:用戶在線撥打10086,取消了相關(guān)業(yè)務,UDM 直接在線激活后更新用戶個人profile,核心網(wǎng)AMF 知會UE 發(fā)起nas: deregister (2)釋放上下文,從而出現(xiàn)ASR 掉話,判斷為核心網(wǎng)數(shù)據(jù)問題。
(2)場景二:核心網(wǎng)normal-release 異常釋放分析①問題描述:DT 測試過程發(fā)生VoNR 掉話,釋放原因為normal-release。
② 問 題 分 析:終 端A 觸 發(fā) 了VoNR 向VoLTE 切換,4G 基 站 收 到MME 下 發(fā) 的H0_REQ 消 息(攜 帶QCI6/5/1),在4G 側(cè)一直到收到MME 下發(fā)的ERAB_RLE 請求釋放QCI1 并結(jié)束通話;終端B 在異站發(fā)生了RRC 重建,隨后通過RRC Setup 流程初始化上下文建立成功5QI=6/5/1,但之后AMF 下發(fā)PDU MOD 刪除5QI=1的消息,判斷掉話發(fā)生在終端B 側(cè);
③分析結(jié)論:在此場景下,5GC 釋放已有的GBR 業(yè)務導致VoNR 的5QI 1 承載被釋放,從而引起VoNR 掉話,通過信令分析判斷為核心網(wǎng)數(shù)據(jù)問題。
3.2.2 (R)AN-傳輸?shù)粼挿治?/p>
(1)場景三:傳輸normal-release 異常釋放分析
①問題描述:VoNR 通話中切換到5G 基站時,基站給AMF 發(fā)送切換請求后AMF 給基站回復切換準備失敗導致掉話,攜帶Cause:ho-failure-in-target-5GC-ngran-nodeor-target-system (7)。
② 問題分析:從信令分析,業(yè)務小區(qū)向目標小區(qū)切換準備失敗。排查網(wǎng)管指標鄰區(qū)對,核實業(yè)務小區(qū)與目標基站對應3 個小區(qū)均存在多次切換失敗,核查切換失敗發(fā)生時間段目標小區(qū)對應站點存在gNodeB NG 控制面?zhèn)鬏斨袛喔婢?/p>
④ 分析結(jié)論:目標站點存在gNodeB NG 控制面?zhèn)鬏斨袛喔婢瘜е碌粼挕?/p>
3.2.3 RAN-無線掉話分析
RAN(無線接入網(wǎng)),是UE 手機與核心網(wǎng)之間通信連接的網(wǎng)絡。RAN 實時功能包括網(wǎng)絡調(diào)度、鏈路適配、功率控制、干擾協(xié)調(diào)、重傳、調(diào)制和編碼等。非實時功能包括小區(qū)選擇和切換、加密和多連接收斂等。RAN 是無線鏈路質(zhì)量管控的重要網(wǎng)絡,無線鏈路中的信號強度、資源調(diào)度,編碼調(diào)制與解調(diào)等某一方面出現(xiàn)問題,都可能導致無線鏈路中斷[6~10],從而影響到VoNR 掉話,在RAN網(wǎng)絡中,無線基站中BBU(Building Base band Unit,基帶處理單元)、RRU(Remote Radio Unit,射頻拉遠單元)、天饋系統(tǒng)等器件出現(xiàn)故障時,也有可能導致無線鏈路中斷。因此,無線側(cè)掉話主要無線層原因?qū)е碌漠惓a尫?、切換執(zhí)行失敗導致的異常釋放、小區(qū)故障導致的異常釋放等原因?qū)е?。無線側(cè)典型掉話場景有以下5 種。
(1)場景四:無線cell-not-available 異常釋放分析①問題描述:UE 突發(fā)異常釋放,釋放原因為無線側(cè)的cell-not-available。
② 問題分析:終端進入通話后基站給AMF 發(fā)送UEContextReleaseRequest 上下文釋放請求消息,攜帶原因值為cell-not-available (11),網(wǎng)絡側(cè)下發(fā)ASR 消息,終端收到BYE 后掉話,分析占用小區(qū)掉話時無故障告警,但存在去激活小區(qū)操作;
③分析結(jié)論:凌晨時段小區(qū)去激活導致在線用戶業(yè)務中斷,引發(fā)VoNR 掉話。
(2)場景五:無線ims-voice-eps-fallback-or-rat-fallbacktriggered 異常釋放分析
①問題描述:UE 在無線環(huán)境良好的情況下,切換過程中異常釋放,釋放原因為ims-voice-eps-fallback-or-ratfallback-triggered。
② 問題分析:終端通話過程中,業(yè)務小區(qū)向AMF 發(fā)起切換的路徑轉(zhuǎn)換,目標小區(qū)向網(wǎng)絡側(cè)AMF 發(fā) 送HandoverRequired,AMF 收 到 切 換 請 求 后回復HandoverPreparationFailure 消息中攜帶原因值radioNetwork: not-supported-5QI-value (34),之后重建到不支持VoNR 的小區(qū),回復UEContextReleaseRequest 攜帶ims-voice-eps-fallback-or-rat-fallback-triggered (36),核查網(wǎng)管VoNR 參數(shù)配置發(fā)現(xiàn)目標站點3 個小區(qū)均未開啟VoNR特性開關(guān)。
③分析結(jié)論:前期已針對全網(wǎng)NR 小區(qū)開啟VoNR 特性功能,修改時存在因站點斷連原因未能修改成功,導致出現(xiàn)VoNR 邊界從而發(fā)生掉話。
(3)場景六:無線deregister 異常釋放分析
①問題描述:5G-4G 切換失敗后,在4G Attach request 入 網(wǎng)(非5 切4G 的 目 標4G 小 區(qū)),隨 后UE在4G 發(fā)起ULR 請求更新UDM 中存儲的位置信息,UDM 檢測到ULR 消息中攜帶了Initial-Attach-Indicator,用 戶Attach 方 式 接 入4G 網(wǎng) 絡,AMF 給 基 站 發(fā) 送UEContextReleaseCommand(攜帶deregister)釋放上下文,ASR 掉話。
② 問題分析:分析發(fā)現(xiàn)60 次deregister 掉話中有近50 次存在VoNR 至VoLTE 切換失敗的話單記錄。抽取典型掉話碼流分析,5G 到4G 切換失敗后,在4G 側(cè)發(fā)起了attach 接入流程,接入的4G 小區(qū)與目標4G 不一致;話單中獲取到5G-4G 切換5G 源小區(qū)與目標小區(qū)距離近8km,且源站和目標站均沒有替換CGI,屬于超遠鄰區(qū);核查5G 源站附近,存在與目標小區(qū)同頻同PCI 小區(qū),基站最終根據(jù)鄰區(qū)列表指示向目標小區(qū)發(fā)起了切換,由于無法在附近同頻同PCI 小區(qū)隨機接入,導致5G-4G 切換失敗,鄰區(qū)PCI 混淆示意圖如圖6 所示。
圖6 鄰區(qū)PCI 混淆示意圖
③問題根因:5G 源小區(qū)沒有加UE 實際測量的4G 小區(qū)鄰區(qū)關(guān)系,5G 鄰區(qū)關(guān)系中存在與UE 實際測量小區(qū)同頻同PCI 的鄰區(qū),導致5G 到4G 切換失敗。
(4)場景七:無線normal-release 異常釋放分析
①問題描述:VIVO 終端廠家進行VoNR 切VoLTE測試時在切換前發(fā)生掉話。
② 問題分析:5 個掉話問題均是占用同一個小區(qū),往無5G覆蓋區(qū)域移動觸發(fā)VoNR至VoLTE互操作過程導致。從端到端平臺碼流分析現(xiàn)象均一致,都是基站向AMF 發(fā)送UEContextReleaseRequest(原因值為normal-release)上下文釋放請求后,核心側(cè)發(fā)起ASR 拆線消息,SBC 給UE 發(fā)BYE(攜帶503 承載不足原因值)導致掉話,基站向AMF 請求釋放UE 上下文請求原因為基站檢測到與UE之間鏈路異常,至此判斷是無線環(huán)境較差導致的掉話;后臺查看目標小區(qū)無告警;查看干擾情況,干擾值平均在-100 dBm 左右,干擾值最強時達-95 dBm 左右,小區(qū)存在強干擾導致高IBLER,高IBLER 導致基站與UE 間數(shù)據(jù)無法正常發(fā)送/接收,如圖7 所示。
圖7 干擾分布圖
查看源小區(qū)VoNR 切VoLTE 門限為-105 dBm,-105 dBm為5G 覆蓋邊緣,小區(qū)正常情況下UE 處于該電平時BLER 相對不高,導致邊緣用戶出現(xiàn)上下行失步問題。
③分析結(jié)論:問題中終端均是占用固定小區(qū)進行VoNR 切VoLTE 互操作業(yè)務測試,小區(qū)存在強干擾,導致處于覆蓋邊緣的測試終端與基站間鏈路異常出現(xiàn)上下行失步,基站側(cè)會不斷向UE 發(fā)包直到達到最大重傳次數(shù)后向AMF 發(fā)送UE 上下文釋放請求。
(5)場景八:無線redirection 異常釋放分析
①問題描述:測試中發(fā)現(xiàn)redirection 后,VoNR 掉話現(xiàn)象。
② 問題分析:測試過程重掉話,掉話期間在5G 發(fā)生RRC rle 釋放時RSRP-123 dBm 左右,無線環(huán)境差,查看對應號碼虛用戶跟蹤RRC RLE 消息中攜帶154810 頻點信息,重定向到154810 頻點后發(fā)生的掉話,由于地鐵沒有154810 頻點覆蓋,因此重定向后脫網(wǎng)到4G,占用4G 38950 小區(qū)RSRP 為-80 dBm 左右。
③分析結(jié)論:地鐵等高速移動場景5G 快衰,導致基站下發(fā)B1測控到終端上報測量報告期間信號快速由-110 dBm左右RSRP 陡降至-120 dBm 以下,滿足盲重定向門限后基站指示向700 M 基站執(zhí)行盲重定向,而地鐵小區(qū)沒有建設700 M 基站,因此導致脫網(wǎng)掉話。
3.2.4 終端掉話分析
(1)場景九:終端successful-handover 異常釋放分析
①問題描述:VoNR 用戶呼叫VoLTE 用戶,通話中,被叫VoLTE 用戶發(fā)invite 消息,掛起呼叫,SMF 給SGW發(fā)消息修改承載上行速率到3 kbit/s,終端回復修改失敗,核心網(wǎng)刪除承載。
② 問題分析:首尾兩次帶寬的申請與變更,都是由于終端側(cè)發(fā)起invite 請求時攜帶,核心側(cè)僅僅是根據(jù)申請的RTP 包的大小分配帶寬。5G 起呼時: 第一次位于5G 起呼時的帶寬申請訴求,主叫終端的RTP 會話帶寬需求是(AS:49 kbit/s、RS:612 bit/s、RR:1 837 bit/s),則RTP 會話帶寬需求則取整為52 kbit/s(即49 kbit/s+3 kbit/s),自然在最早時的QoS 上下行帶寬均為52 kbit/s。切換到4G 呼叫保持取消時: RTP 會話帶寬需求則取整為49 kbit/s,也就是呼叫保持取消階段的INVITE 消息只有49 kbit/s 的帶寬訴求,核心側(cè)AAR 消息申請,QCI1 建立的上下行帶寬均為49 kbit/s,驗證過其他各類終端(OPPO小米Realme)均無此類問題。
③分析結(jié)論:VoNR 呼叫VoLTE,被叫VoLTE 通話中發(fā)invite 消息,疑似callhold操作,被叫側(cè)INVITE 消息攜帶媒體方向為sendonly,SMF 更新承載要求上行帶寬修改為3 kbit/s,MME 給終端下方修改承載后,終端回復錯誤,修改失敗,后續(xù)刪除承載,導致掉話;懷疑帶寬修改異常導致終端回復修改失敗,最終原因可能需要終端確認。
通過典型場景端到端掉話分析問題,定界各維度掉話問題,分析日粒度各掉話錯誤占比,篩選典型的掉話錯誤碼,統(tǒng)計分析全網(wǎng)的掉話詳細記錄,鉆取錯誤碼碼流分析信令的流程解析,聚類組合各類網(wǎng)元接口,判定掉話出處,通過分析掉話主要歸屬原因包含核心網(wǎng)問題、傳輸網(wǎng)問題、無線網(wǎng)問題、終端問題四類問題,優(yōu)化思路如圖8 所示。
圖8 VoNR 典型場景端到端優(yōu)化思路圖
根據(jù)VoNR 典型掉話場景的端到端分析,根據(jù)掉話中異常釋放原因進行歸類,共梳理出6 中掉話類型,涉及到9 個場景,對應的優(yōu)化方法如表2 所示。
表2 VoNR 優(yōu)化方案總結(jié)
經(jīng)過9 種典型錯誤碼掉話針對性優(yōu)化解決,某地市VoNR 掉話率改善明顯,VoNR 掉話率由7 月峰值0.30%優(yōu)化降至11 月0.07%左右,VoNR 語音感知提升顯著,趨勢圖如圖9 所示。
圖9 掉話率趨勢圖
通過分析典型的掉話錯誤碼,聚類組合各類網(wǎng)元接口,定界到具體的網(wǎng)元(核心網(wǎng))、傳輸、終端、無線側(cè)、平臺實際問題出處,提高了優(yōu)化的精準度,經(jīng)過優(yōu)化調(diào)整,VoNR 掉話率基本和VoLTE 掉話率水平基本一致,趨勢圖如圖10 所示。
圖10 VoNR 與VoLTE 掉話率趨勢圖
通過典型場景VoNR 掉話的根因分析,無線側(cè)的后臺去激活操作、故障、PCI 規(guī)劃問題、VoNR 開關(guān)等問題與傳輸側(cè)的故障問題,屬于基礎(chǔ)優(yōu)化問題,可通過加強管理解決,核心網(wǎng)側(cè)的問題基本屬于版本與數(shù)據(jù)問題居多,終端問題需要聯(lián)合手機廠商共同解決。因此在VoNR 掉話的優(yōu)化中,需要做好基礎(chǔ)優(yōu)化工作,解決典型場景掉話問題,在后續(xù)的研究中,將持續(xù)對VoNR 其他問題進行分析,不停完善VoNR 的優(yōu)化手段。