程亮,楚穎超
CTCS-3級列控系統(tǒng)基于GSM-R無線通信系統(tǒng)實現(xiàn)列控車載設(shè)備(ATP)與無線閉塞中心(RBC)的信息交互,ATP/RBC設(shè)備的通信功能模塊包含了開放式系統(tǒng)互連參考模型的傳輸層、網(wǎng)絡(luò)層和數(shù)據(jù)鏈路層[1]。其中,數(shù)據(jù)鏈路層遵循HDLC協(xié)議,提供了幀同步、差錯控制、流量控制和鏈路管理功能,以保證GSM-R網(wǎng)絡(luò)傳遞信息的完整性及正確性?,F(xiàn)場發(fā)生的C3無線超時故障,部分情況是由設(shè)備故障引起,其他多為通信干擾或綜合因素導(dǎo)致,并最終反映到數(shù)據(jù)鏈路層的信息交互異常上。通過對數(shù)據(jù)鏈路層協(xié)議的理解深入,結(jié)合現(xiàn)場的實際運用,認(rèn)為數(shù)據(jù)鏈路層對FRMR幀的使用機制有改進空間,本文對此展開討論。
GSM-R無線通信系統(tǒng)中ATP/RBC設(shè)備數(shù)據(jù)鏈路層HDLC協(xié)議主要由ISO/IEC7776:1995定義,根據(jù)該協(xié)議4.3.9節(jié)內(nèi)容,FRMR幀由數(shù)據(jù)終端設(shè)備DTE(GSM-R無線通信系統(tǒng)中指ATP側(cè)設(shè)備)或數(shù)據(jù)通信設(shè)備DCE(GSM-R無線通信系統(tǒng)中指RBC側(cè)設(shè)備)通知對方通過重傳相同幀也無法恢復(fù)的差錯狀態(tài),即接收到了有效幀(CRC正確),但不符合協(xié)議約束(參考下面FRMR幀信息字段含義)。FRMR幀結(jié)構(gòu)見圖1。
圖1 FRMR幀結(jié)構(gòu)
FRMR幀信息字段含義[2]如下。
1)被拒絕幀控制字段是引起幀拒絕的幀的控制字段。當(dāng)被拒絕幀為無編號幀時,被拒絕幀的控制字段應(yīng)位于1~8b,而9~16b置0。
2)N(S)是發(fā)送FRMR的DTE/DCE的當(dāng)前發(fā)送狀態(tài)變量值(18b為低位)。
3)C/R置1表示被拒絕的幀為響應(yīng)幀,C/R置0表示被拒絕的幀為命令幀。
4)N(R)是發(fā)送FRMR的DTE/DCE的當(dāng)前接收狀態(tài)變量值(26b為低位)。
5)W置1表示接收到的且在1~16b送回的控制字段沒有定義或不能實現(xiàn)。
6)X置1表示接收到的且在1~16b送回的控制字段被認(rèn)為是無效的。該幀包含了不允許的信息字段,或是該幀是具有不正確長度的監(jiān)控幀,W與X同時置1。
7)Y置1表示所收到的信息字段超過了DTE/DCE的最大設(shè)定容量。
8)Z置1表示所接收到的且在1~16b內(nèi)送回的控制字段包含了無效的N(R)。
依據(jù)《CTCS-3級列控系統(tǒng)無線通信功能接口規(guī)范》(Q/CR 604—2017)8.2.2.7節(jié):FRMR幀接收端應(yīng)發(fā)送DISC進行響應(yīng),即在數(shù)據(jù)鏈路層直接觸發(fā)拆鏈行為,以便盡快建立新的連接以恢復(fù)通信[3]。
基于全路2020年9月—2021年2月C3無線超時故障導(dǎo)致系統(tǒng)降級統(tǒng)計,某型號ATP設(shè)備因FRMR幀導(dǎo)致的無線超時降級共計63件,其中FRMR幀Z=1、N(R)編號無效引起的較多,其他類型的FRMR幀均有發(fā)生,但占比較低。
小區(qū)切換階段,ATP側(cè)Igsm-r接口記錄ATP上行方向發(fā)送RR監(jiān)控幀,N(R)編號為109→110→111,ATP側(cè)Um接口記錄與Igsm-r接口記錄一致,但PRI接口記錄增加一條上行方向發(fā)送的RR監(jiān)控幀N(R)=110,如圖2所示,最終RBC接收到的N(R)編號為109→110→111→110,N(R)編號存在回退現(xiàn)象。因此,RBC發(fā)送FRMR幀(Z=1),該類型問題在現(xiàn)場最為突出。
圖2 FRMR幀(Z=1)示例
小區(qū)切換階段,PRI接口記錄RBC發(fā)送SREJ選擇性拒絕幀(原始信息:7E 03 0D 12 43 AA 7E,地址為03),要求ATP重傳N(S)=9的Ⅰ幀,如圖3所示。根據(jù)Q/CR604—2017 8.2.2.10節(jié),SREJ選擇性拒絕幀應(yīng)僅作為響應(yīng)幀發(fā)送。RBC發(fā)送響應(yīng)幀時,地址位應(yīng)為自身地址01而非ATP地址03,RBC發(fā)送的SREJ地址為03,會導(dǎo)致ATP參照命令幀格式識別控制字段時,判定控制字段為未定義,從而發(fā)送FRMR幀拒絕(W=1)。
圖3 FRMR幀(W=1)示例
參考ISO/IEC 7776標(biāo)準(zhǔn)5.1節(jié),數(shù)據(jù)幀地址位填充原則見表1。
表1 地址位填充原則
小區(qū)切換階段,PRI接口記錄RBC發(fā)送RR監(jiān)控幀(原始信息:7E 01 01 16 7F F0 7E,RR監(jiān)控幀固定長度7B),準(zhǔn)備接收N(S)=11的Ⅰ幀;但Igsm-r接口實際記錄信息為7E 01 01 16 07 7E,對應(yīng)長度變?yōu)?B,如圖4所示,RR幀長度不符合要求(數(shù)據(jù)通過了CRC校驗,即發(fā)生了CRC漏檢[4-7])。因此,ATP發(fā)送FRMR幀拒絕(W=1,X=1)。
圖4 FRMR幀(W=1,X=1)示例
小區(qū)切換階段,PRI接口記錄RBC發(fā)送N(S)=48的I幀(原始信息:7E 03 60 D2 01 80 85 90 E0 1A 47 0C 61 C0 1B 8E 1A C3 83 E5 1C 39 87 03 34 38 79 0E 05 8C 71 06 1C 17 A0 E2 2C 38 80 DA 7E,長度為41B,解析為Addr=3,N(S)=48,N(R)=105,P/F=0),ATP側(cè)Igsm-r接口實際記錄信息為:7E 03 60 D2 01 80 85 90 E0 1A 47 0C 61 C0 1B 8E 1A C3 83 E5 1C 40 04 02 84 30 84 10 E7 24 47 71 32 44 F2 25 96 0D 12 49 01 00 34 41 C4 98 70 65 63 40 B0 E2 A8 37 90 00 01 43 89 79 00 18 D3 05 95 AE 05 06 3B 03 88 FC 05 07 3E 9D 7E,長度為77B,如圖5所示,長度超過最大限制值(數(shù)據(jù)通過了CRC校驗)。因此,ATP發(fā)送FRMR幀拒絕(Y=1)。
圖5 FRMR幀(Y=1)示例
GSM-R無線通信鏈路涉及諸多環(huán)節(jié),考慮頻繁的小區(qū)切換、通信干擾等因素,在通信過程中不可避免地會出現(xiàn)數(shù)據(jù)幀丟失或出錯,在HDLC協(xié)議中可通過T1定時器及SREJ幀實現(xiàn)數(shù)據(jù)的重傳,以ATP側(cè)為例進行說明。
1)T1定時器機制。ATP發(fā)送I幀后,會啟用T1定時器(時間配置范圍0.8~2 s,實際運用中配置為2 s)。在T1定時器超時前,若接收到RBC的確認(rèn),如ATP無其他I幀需RBC確認(rèn),則停止T1定時器;如ATP尚有其他I幀未得到RBC確認(rèn),則復(fù)位T1定時器,繼續(xù)監(jiān)督已發(fā)的緊鄰I幀。如T1定時器超時,則ATP向RBC發(fā)送P=1的RR探尋幀,待接收到來自RBC的F=1的RR響應(yīng)幀后,根據(jù)N(R)編號,ATP重傳所有未確認(rèn)的I幀。如果T1定時器連續(xù)嘗試N2次(實際運用中配置為5次)后仍未恢復(fù),ATP執(zhí)行拆鏈行為。
2)SREJ幀使用機制。當(dāng)ATP從RBC接收到的信息幀N(S)編號不連續(xù)時,將向RBC發(fā)送SREJ幀,要求重傳中間缺失的信息幀。
1)ATP/RBC的傳輸層會對傳輸協(xié)議數(shù)據(jù)單元(TPDU)的包號、類型、參數(shù)等信息進行檢查,出現(xiàn)異常后傳輸層向?qū)Ψ桨l(fā)送差錯TPDU(ER),由對方發(fā)起拆鏈請求。
2)ATP/RBC的安全層會對安全協(xié)議數(shù)據(jù)單元(SaPDU)的長度、消息驗證碼(MAC)進行檢查,出現(xiàn)異常后安全層向?qū)Ψ桨l(fā)送DI信息觸發(fā)拆鏈。
3)ATP應(yīng)用層依據(jù)《CTCS-3級列控車載設(shè)備技術(shù)規(guī)范》(Q/CR 744—2020)對接收到的無線報文進行消息一致性檢查[8],當(dāng)檢測到異常時丟棄該消息;當(dāng)連續(xù)T_NVCONTACT(時間配置范圍10~20 s,當(dāng)前配置為20 s)未接收到RBC發(fā)送的無線消息時,ATP輸出最大常用制動,如底層連接尚未斷開,則安全層發(fā)送DI信息觸發(fā)拆鏈,并嘗試建立新的無線連接。
CTCS-3級無線通信系統(tǒng)可劃分為安全功能模塊(SFM)和通信功能模塊(CFM),SFM提供安全相關(guān)傳輸系統(tǒng)的功能,CFM提供基于GSM-R網(wǎng)絡(luò)的電路交換承載業(yè)務(wù)的通信功能[9]。如圖6所示,數(shù)據(jù)鏈路層歸屬于CFM模塊,對該層協(xié)議進行修改不涉及安全層、應(yīng)用層等上層安全功能模塊。
圖6 ATP/RBC之間協(xié)議棧
基于HDLC協(xié)議既有的糾錯處理機制和上層協(xié)議的防護,數(shù)據(jù)鏈路層當(dāng)前因FRMR幀拒絕機制觸發(fā)的直接拆鏈行為降低了系統(tǒng)可用性,建議改進如下:設(shè)置合適的閾值,當(dāng)數(shù)據(jù)鏈路層監(jiān)測到FRMR幀觸發(fā)時進行計數(shù),如計數(shù)值不大于閾值,ATP/RBC設(shè)備增加報警信息并記錄接收到的異常信息幀,但不使用該異常信息幀且不向?qū)Ψ桨l(fā)送FRMR幀觸發(fā)拆鏈,依靠T1定時器機制或發(fā)送SREJ幀重新獲取正常信息,通信恢復(fù)正常后復(fù)位計數(shù)值;如計數(shù)值超過閾值,則向?qū)Ψ桨l(fā)送FRMR幀觸發(fā)拆鏈。
作為中國國家鐵路集團有限公司重點整治問題之一的CTCS-3級列控系統(tǒng)無線超時問題,是一個系統(tǒng)性問題,涉及車載、通信、地面設(shè)備諸多環(huán)節(jié)。本文對由于數(shù)據(jù)鏈路層FRMR幀拒絕機制觸發(fā)拆鏈的場景進行了歸納,從HDLC協(xié)議的角度提出優(yōu)化建議,現(xiàn)已組織相關(guān)設(shè)備廠家進行研究,以期解決因FRMR幀拒絕引發(fā)的無線超時問題。