趙煜 杜永剛
中國聯(lián)合網(wǎng)絡(luò)通信有限公司江蘇分公司
王者榮耀是騰訊開發(fā)的一款團(tuán)隊(duì)公平競技手游,以多玩家在線對戰(zhàn)為主,呈現(xiàn)競技性強(qiáng)的特點(diǎn),整個(gè)游戲?qū)r(shí)延極為敏感。隨著移動(dòng)電競的流行,LTE網(wǎng)絡(luò)下玩家數(shù)量無論是范圍的廣度還是區(qū)域的厚度均大幅增長,游戲時(shí)延增大、卡頓率上升等問題逐漸凸顯,用戶體驗(yàn)變差,游戲類投訴率呈上升趨勢,因此對該游戲模型的研究及卡頓優(yōu)化工作迫在眉睫。
本文對該手游模型、游戲用戶大數(shù)據(jù)進(jìn)行研究,分析出影響游戲卡頓的因素主要是時(shí)延指標(biāo),應(yīng)用三維度分析、三段一體化優(yōu)化等手段定位會(huì)影響時(shí)延。通過傳統(tǒng)基礎(chǔ)優(yōu)化結(jié)合6種新的解決方案,王者榮耀卡頓率得到明顯下降,游戲感知得到提升。
游戲分為登錄、游戲加載、游戲?qū)?zhàn)和社交4個(gè)模塊,通過分析及用戶投訴內(nèi)容發(fā)現(xiàn)卡頓主要集中在游戲?qū)?zhàn)階段。
游戲?qū)?zhàn)中進(jìn)行實(shí)時(shí)交互的服務(wù)器域名為awx.smoba.qq.com,該域名下包含多個(gè)位于上海的IP地址。
在實(shí)時(shí)對戰(zhàn)的過程中,客戶端與服務(wù)器間主要有兩個(gè)交互連接,一個(gè)為TCP連接,一個(gè)為UDP連接,通過UDP報(bào)文檢測時(shí)延。TCP連接用于心跳檢測,UDP連接用于游戲數(shù)據(jù)交互。
在游戲?qū)?zhàn)過程中,使用UDP進(jìn)行時(shí)延評估會(huì)比較困難,但是可以通過貫穿游戲始終的TCP心跳檢測包進(jìn)行時(shí)延評估。根據(jù)游戲模型分析心跳檢測TCP每3s一次,長度128byte。
分別在UE側(cè)、eNB側(cè)進(jìn)行用戶面數(shù)據(jù)抓包,根據(jù)TCP時(shí)間戳可以判斷空口往返時(shí)延及網(wǎng)絡(luò)側(cè)往返時(shí)延。在網(wǎng)絡(luò)環(huán)境穩(wěn)定的情況下,UE側(cè)往返時(shí)延約為70ms,其中網(wǎng)絡(luò)側(cè)時(shí)延37ms,空口時(shí)延33ms,利用抓包計(jì)算時(shí)延,如圖1所示。
圖1 游戲抓包計(jì)算時(shí)延
騰訊會(huì)對每局所有包的往返時(shí)間(Round-Trip Time,RTT)進(jìn) 行 抽 樣,分 別 統(tǒng) 計(jì) 區(qū) 間1 (<100ms)、區(qū) 間2 (100~200ms)、區(qū)間3(200~300ms)、區(qū)間4(300~460ms)、區(qū)間5(>460ms)的5個(gè)區(qū)間的包量,卡頓率計(jì)算公式為:
依據(jù)卡頓率高低,將游戲卡頓定義成5個(gè)卡頓等級,見表1。卡頓率高于15%計(jì)為嚴(yán)重卡頓局,此時(shí)用戶感知極差,需盡快優(yōu)化。
表1 卡頓等級及分級標(biāo)準(zhǔn)
王者榮耀用戶場景歸屬以學(xué)校最多,占比15.0%,主要分布在城區(qū)的學(xué)校,工業(yè)區(qū)占比7.9%。
王者榮耀用戶日均使用次數(shù)均值為4次,日均使用時(shí)長均值為72.7分鐘,王者榮耀用戶數(shù)與流量呈正相關(guān)性,游戲時(shí)間以中午12:00-13:00及晚上19:00-23:00為高峰期,終端RTT保持在35~45ms上下波動(dòng),可歸納為游戲時(shí)間性較為規(guī)律。
王者榮耀用戶年齡分布以18~23歲占比最高,為33.8%;以男性玩家為主,男性占比83%,女性占比17%;套餐用戶以騰訊大王卡最多,占比34.2%,其次為4G冰淇淋國內(nèi)不限量99元,占比3.5%。
蘋果手機(jī)占比最高,為35.21%,OPPO和VIVO緊隨其后,占比分別為20.23%和18.84%。
王者榮耀交互數(shù)據(jù)因端到端的網(wǎng)元多,涉及終端、管道和云服務(wù)器等多種復(fù)雜情況,我們通過三維度分析、端到端三段定位開展優(yōu)化,卡頓優(yōu)化分析思路見圖2。
圖2 卡頓優(yōu)化分析思路
時(shí)延剖析中,如何對時(shí)延問題進(jìn)行分段并定界成為優(yōu)化的關(guān)鍵。通過T1(通過QCI專用承載)、T21(創(chuàng)新空口優(yōu)化方案)和T22(通過IPPM方法定位傳輸問題)綜合評估游戲時(shí)延T0(騰訊主動(dòng)發(fā)布全國卡頓情況)。游戲時(shí)延計(jì)算公式如下:
時(shí)延通道結(jié)構(gòu)示意圖如圖3所示。
圖3 游戲時(shí)延通道結(jié)構(gòu)示意圖
移動(dòng)網(wǎng)絡(luò)覆蓋、上行干擾、容量、傳輸路由是影響游戲時(shí)延最大的因素,其他因素如終端RTT時(shí)延、服務(wù)器RTT時(shí)延影響較小。
(1)覆蓋對時(shí)延影響
隨著信號與干擾加噪聲比(Signal to Interference plus Noise Ratio,SINR)的惡化,時(shí)延陡增,當(dāng)SINR<-7dB時(shí)、時(shí)延>200ms。
隨著參考信號接收功率(Reference Signal Receiving Power,RSRP)的惡化,時(shí)延陡增,當(dāng)RSRP<-110dBm時(shí),時(shí)延>200ms。
(2)上行干擾對時(shí)延影響
隨著干擾增加,卡頓概率也隨之增加,上行干擾>-102dBm時(shí),卡頓嚴(yán)重。
(3)容量對時(shí)延影響
隨著用戶數(shù)增多,卡頓增加,忙時(shí)用戶數(shù)>200時(shí),卡頓嚴(yán)重。
隨著物理資源塊(Physical Resource Block,PRB)利用率增大,卡頓增加,下行PRB利用率>80%時(shí),卡頓嚴(yán)重。
隨著控制信道單元(Control Channel Element,CCE)利用率增大,卡頓增加,CCE利用率>80%時(shí),卡頓嚴(yán)重。
核心網(wǎng)無線分組業(yè)務(wù)網(wǎng)關(guān)(Gateway GPRS Support Node,GGSN)高負(fù)荷對時(shí)延影響大。(4)傳輸路由對時(shí)延影響
漫游用戶:進(jìn)行業(yè)務(wù)中,漫游用戶需要返回歸屬地,路由時(shí)延相對本地用戶要大,一般增加30~70ms。
不同地市的路由差異:不同地市eNB->SGW->服務(wù)器時(shí)延差異較大,eNB->SGW間時(shí)延可通過IPPM檢測傳輸優(yōu)化。
王者榮耀卡頓優(yōu)化圍繞兩大途徑進(jìn)行,一是使用傳統(tǒng)優(yōu)化手段夯實(shí)網(wǎng)絡(luò)基礎(chǔ),二是采取新思路新方法進(jìn)行難點(diǎn)攻堅(jiān)。通過兩者結(jié)合,一面發(fā)揮現(xiàn)有網(wǎng)絡(luò)傳統(tǒng)手段的優(yōu)勢,另一面進(jìn)行手段優(yōu)化創(chuàng)新,開拓新的感知優(yōu)化方式,最終王者榮耀卡頓率下降顯著,極大提高用戶游戲感知。
在現(xiàn)有網(wǎng)絡(luò)基礎(chǔ)上,通過傳統(tǒng)的優(yōu)化手段,提高空口傳輸時(shí)延。主要采用基礎(chǔ)覆蓋優(yōu)化、質(zhì)差小區(qū)處理、網(wǎng)絡(luò)結(jié)構(gòu)整治、PCI沖突優(yōu)化、負(fù)荷均衡和精準(zhǔn)擴(kuò)容、新站優(yōu)化、干擾處理和重疊覆蓋優(yōu)化等手段。
以南京和蘇州為例,截止到2019年12月底,通過加強(qiáng)深度覆蓋、扇區(qū)擴(kuò)容、干擾排查等優(yōu)化方式,共完成1184個(gè)王者榮耀嚴(yán)重卡頓小區(qū)的優(yōu)化工作。南京王者榮耀卡頓率由0.85%下降至0.48%,蘇州王者榮耀卡頓率由0.82%下降至0.59%,卡頓率改善明顯。
有些游戲卡頓小區(qū)通過傳統(tǒng)優(yōu)化手段無法解決問題,長期出現(xiàn)在卡頓小區(qū)清單中,對它們的優(yōu)化需要另辟蹊徑。
4.2.1 新優(yōu)化方法1:IPPM檢測識(shí)別傳輸質(zhì)差
IPPM檢測功能的核心是定位傳輸問題,開啟IPPM檢測/逐段Ping,定位傳輸故障點(diǎn)。主要包括2個(gè)功能:IPPM檢測和Ping測試。
(1)開啟IPPM檢測:查詢站點(diǎn)所有的IPPM會(huì)話,RTT抖動(dòng)。
(2)使用Ping測試:分段統(tǒng)計(jì)eNB、SGW、SP間時(shí)延及丟包情況。分為3個(gè)動(dòng)作:
① eNB Ping SGW:隔離LTE系統(tǒng)內(nèi)傳輸質(zhì)量;
② SGW Ping Server:隔離骨干網(wǎng)傳輸質(zhì)量;
③ UE Ping Server:通過eNB跟蹤分析eNB到SP間時(shí)延,分析eNB以上傳輸質(zhì)量。
案例:南通王者榮耀Ping時(shí)延過高問題。
通過Ping檢測,發(fā)現(xiàn)南通時(shí)延高于17ms以上的有180個(gè)網(wǎng)元,與傳輸網(wǎng)工程師共同排查原因后發(fā)現(xiàn),南京至南通有一條路由光纜長度1500km,如表2所示,需傳輸專業(yè)進(jìn)行傳輸路由改造。
表2 南京至南通傳輸路由表
4.2.2 新優(yōu)化方法2:特性參數(shù)優(yōu)化降低時(shí)延
關(guān)閉DRX:終端進(jìn)行游戲交互中,在開啟DRX狀態(tài)的情況下,可能導(dǎo)致數(shù)據(jù)包落入休眠期,造成時(shí)延增加。
降低SR周期:SR周期系統(tǒng)是自適應(yīng)配置,可以通過抬升低負(fù)載用戶數(shù)門限,以減少SR發(fā)送周期,縮短上行發(fā)送時(shí)延。
智能預(yù)調(diào)度:當(dāng)UE存在下行MAC SDU調(diào)度時(shí),eNB主動(dòng)周期發(fā)UL Grant調(diào)度UE,減少上行小包業(yè)務(wù)的時(shí)延。
負(fù)載均衡:通過和鄰區(qū)協(xié)商,負(fù)載很重的小區(qū)向較輕的鄰區(qū)進(jìn)行負(fù)載分擔(dān),達(dá)到相鄰小區(qū)之間的負(fù)載平衡。
節(jié)能開關(guān):負(fù)荷門限、RRC連接數(shù)低于設(shè)置門限時(shí)會(huì)導(dǎo)致啟動(dòng)通道、符號關(guān)斷,如果此時(shí)有用戶進(jìn)行業(yè)務(wù)會(huì)出現(xiàn)通道打開不及時(shí)的情況。
4.2.3 新優(yōu)化方法3:異頻測量與駐留策略優(yōu)化
(1)關(guān)閉異頻GAP測量
經(jīng)多次現(xiàn)場模擬測試復(fù)現(xiàn)游戲卡頓,發(fā)現(xiàn)當(dāng)終端觸發(fā)異頻GAP測量時(shí),會(huì)導(dǎo)致游戲卡頓,GAP測量過程如圖4所示,分析原因如下:
下行:異頻測量期間共有10ms時(shí)間是不調(diào)度的。
上行:GAP測量期間不會(huì)接收數(shù)據(jù),總共影響18ms。
圖4 GAP測量過程
案例:南京異頻GAP測量優(yōu)化案例。
測試點(diǎn)RSRP在-100dBm左右,修改異頻起測門限為-95dBm容易起GAP,關(guān)閉基于覆蓋的異頻切換開關(guān)。關(guān)閉后效果顯著,平均時(shí)延降低了20ms,最高時(shí)延由120ms降至96ms。
(2)異頻駐留策略優(yōu)化
利用FDD-LTE2100網(wǎng)的信道質(zhì)量優(yōu)、用戶速率高、資源負(fù)荷低等優(yōu)勢,更多地承載用戶,從而降低FDD-LTE1800網(wǎng)的卡頓小區(qū)數(shù)、或者卡頓小區(qū)的卡頓率,兩個(gè)頻段的對比見圖5。
案例:南京異頻駐留策略優(yōu)化案例。
圖5 頻段優(yōu)異點(diǎn)對比
調(diào)整全網(wǎng)異頻駐留策略,用戶空閑態(tài)時(shí)優(yōu)先選擇駐留FDD-LTE2100網(wǎng)小區(qū),當(dāng)FDD-LTE2100網(wǎng)小區(qū)用戶數(shù)均衡門限調(diào)到240,即盡可能將用戶駐留在FDD-LTE2100網(wǎng)上,通過異頻策略優(yōu)化,王者榮耀卡頓小區(qū)數(shù)明顯減少,效果如圖6所示。
圖6 南京異頻駐留策略優(yōu)化后卡頓小區(qū)數(shù)變化趨勢
4.2.4 新優(yōu)化方法4:QCI差異化調(diào)度保障
QCI3差異化用戶調(diào)度方案,通過UGW進(jìn)行業(yè)務(wù)識(shí)別(協(xié)議或IP方式),并在PCRF網(wǎng)元針對識(shí)別用戶下發(fā)QCI3承載;eNB針對QCI3的GBR業(yè)務(wù),做專用承載保障。
經(jīng)過驗(yàn)證,QCI3保障業(yè)務(wù)用戶相對于非保障業(yè)務(wù)用戶平均時(shí)延改善20~60ms(具體時(shí)延增益與保障用戶分布及數(shù)量相關(guān))。
4.2.5 新優(yōu)化方法5:增大最小保證速率
增大上下行最小保證速率,目前主要業(yè)務(wù)在QCI6上,上下行均默認(rèn)參數(shù)1kbit/s,該參數(shù)設(shè)置得越小,該QCI的業(yè)務(wù)得到保證的速率越小,反之該QCI的業(yè)務(wù)得到保證的速率越大。涉及參數(shù)如表3所示。
表3 最小保障速率參數(shù)修改表
參數(shù)修改后,卡頓率下降明顯,如表4所示。
表4 最小保障速率參數(shù)修改前后卡頓率變化情況
4.2.6 新優(yōu)化方法6:SC(Service Classification)方案
SC方案是在eNB側(cè)通過業(yè)務(wù)的流量模型來進(jìn)行業(yè)務(wù)識(shí)別,包括基于SC的業(yè)務(wù)識(shí)別和基于SC的加速保障用戶識(shí)別兩部分。eNB針對QCI6~QCI9的SC識(shí)別保障用戶做專載保障。
SC識(shí)別出空口加速用戶,進(jìn)而通過差異化調(diào)度改善時(shí)延,主要功能點(diǎn)如表5所示。
表5 SC優(yōu)化功能點(diǎn)
案例:鎮(zhèn)江高鐵嚴(yán)重卡頓小區(qū)優(yōu)化案例。
分三種場景,試驗(yàn)了SC功能時(shí)延改善效果,結(jié)果如表6所示。對鎮(zhèn)江高鐵小區(qū)按照表6的三種場景分類,在高負(fù)荷場景實(shí)施SC調(diào)度優(yōu)化,在中、低負(fù)荷場景實(shí)施SC資源優(yōu)化和SC誤碼優(yōu)化,優(yōu)化后王者榮耀高鐵小區(qū)嚴(yán)重卡頓小區(qū)數(shù)明顯下降。
表6 分場景SC優(yōu)化功能效果驗(yàn)證
通過對當(dāng)前熱門手游王者榮耀的感知指標(biāo)卡頓率的游戲模型、用戶大數(shù)據(jù)研究,在全面分析的基礎(chǔ)上形成清晰的指標(biāo)提升思路。對影響時(shí)延的4種因素進(jìn)行了分析,找到了2條提升用戶游戲感知的途徑,克服了交互數(shù)據(jù)端到端的網(wǎng)元多,涉及終端、管道和云服務(wù)器等多種復(fù)雜情況的困難。通過采取IPPM檢測識(shí)別傳輸質(zhì)差、優(yōu)化特性參數(shù)降低時(shí)延等6項(xiàng)舉措,有效地優(yōu)化了卡頓情況,降低了卡頓率。