張振剛
摘 ?要: MIL?1394B總線在國內(nèi)外航空電子系統(tǒng)中應(yīng)用越來越廣泛,而MIL?1394B總線采用菊花鏈的物理層,單個節(jié)點的復(fù)位故障會導(dǎo)致整個網(wǎng)絡(luò)的復(fù)位擴散,使整個網(wǎng)絡(luò)不能正常通信。針對MIL?1394B總線在綜合化航空電子設(shè)備的應(yīng)用中故障難以隔離,提出一種通過先驗信息隔離故障的方法。首先分析復(fù)位故障的原理,從而結(jié)合MIL?1394B總線在航空電子系統(tǒng)中預(yù)先分配節(jié)點號的先驗信息,獲取、分析AS643總線的SELF?ID包建立鏈接的信用值機制,設(shè)計一種檢測信用值的方法,并改造節(jié)點的硬件設(shè)計,使節(jié)點鏈接的信用值低于閾值后可關(guān)閉錯誤鏈接,從而實現(xiàn)MIL?1394B的網(wǎng)絡(luò)故障檢測和隔離。該設(shè)計方法和機制通過實物系統(tǒng)進(jìn)行驗證,可用于高度綜合化的航空電子系統(tǒng)中。
關(guān)鍵詞: MIL?1394B總線; 航空電子系統(tǒng); 錯誤檢測; 故障隔離; 總線網(wǎng)絡(luò); 復(fù)位擴散
中圖分類號: TN915.04?34; TP336 ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)13?0015?04
Research and implementation of MIL?1394B bus fault isolation method
ZHANG Zhengang
(Southwest China Institute of Electronic Technology, Chengdu 610056, China)
Abstract: MIL?1394B bus is widely used in avionics system at home and abroad, but it adopts physical connecting mode of chrysanthemum chain, whose reset fault of a single node will lead to the reset diffusion of the whole network and the communication abnormality of whole network. Since the fault of MIL?1394B bus is difficult to isolate in integrated avionics device, a fault isolation method using prior information is proposed. The principle of reset fault is analyzed, and then the prior information of node number in avionics system is pre?assigned in combination with MIL?1394B bus to acquire and analyze SELF?ID packet of AS643 bus, and establish the mechanism of link credit value. A method of detecting credit value is designed, and the hardware design of node is reformed to close the error link while the credit value is lower than the threshold, which can realize the fault detection and isolation of MIL?1394B network. The designed method and mechanism were verified by a physical system, and can be used in highly?integrated avionics system.
Keywords: MIL?1394B bus; avionics system; fault detect; fault isolation; bus network; reset diffusion
0 ?引 ?言
航空電子系統(tǒng)已經(jīng)從傳統(tǒng)的聯(lián)合式架構(gòu)逐步演進(jìn)到先進(jìn)的綜合化架構(gòu)、高度綜合化架構(gòu)。隨著綜合化程度不斷提高以及機載傳感器技術(shù)的發(fā)展,航空電子系統(tǒng)對作為系統(tǒng)關(guān)鍵技術(shù)之一的機載總線網(wǎng)絡(luò)也提出了新的要求,早期的MIL?STD?1553B,ARINC429等總線技術(shù)已經(jīng)無法完全滿足高帶寬、低延遲和高確定性的應(yīng)用需求。很多新型商用總線在做了一定修改和限定后開始被應(yīng)用到軍用航空電子系統(tǒng),如美軍在F35的航空電子中采用一種基于1394總線改進(jìn)形成MIL?1394B總線。MIL?1394B總線網(wǎng)絡(luò)在1394總線的基礎(chǔ)上增加了應(yīng)用限定和改進(jìn),保留了1394總線即插即用、傳輸帶寬高等特點,又增加了時間確定性等特點,使其更適用于軍用航空領(lǐng)域[1]。
國內(nèi)也展開了MIL?1394B總線技術(shù)在航空電子系統(tǒng)中的研究和應(yīng)用,并給出幾種節(jié)點設(shè)計的解決方案和網(wǎng)絡(luò)實現(xiàn)方式[2?4]。然而,MIL?1394B總線采用菊花鏈的物理連接方式,節(jié)點和鏈路傳輸?shù)牟环€(wěn)定性將會影響整個網(wǎng)絡(luò)的傳輸過程,甚至導(dǎo)致機載設(shè)備的部分功能失效,文獻(xiàn)[5]提出增加網(wǎng)絡(luò)互聯(lián)復(fù)雜度,文獻(xiàn)[3]提出完全備份網(wǎng)絡(luò)的多余度網(wǎng)絡(luò)設(shè)計來解決高航空航天電子系統(tǒng)中高可靠性的需求。而隨著綜合航空電子技術(shù)的發(fā)展,以高度綜合化通信導(dǎo)航識別系統(tǒng)[6]為例,系統(tǒng)要求更小的體積、重量來實現(xiàn)原有的功能,并且不能降低可靠性。因此完全備份的方法已經(jīng)不能滿足此類設(shè)備的需求。
本文采用獲取1394總線原生的SELFID報文以及網(wǎng)絡(luò)物理連接的先驗信息,通過軟件自動探測、隔離不穩(wěn)定的節(jié)點及鏈路,使網(wǎng)絡(luò)中未失效的處理通道正常運行,最大化地提高設(shè)備的利用率,在保證可靠性的前提下,提升綜合化后的重量、體積等性能。
1 ?MIL?1394B總線特點
1.1 ?物理鏈路冗余
在IEEE?1394B?2002總線標(biāo)準(zhǔn)中,允許總線網(wǎng)絡(luò)中存在物理環(huán)路冗余。在MIL?1394B協(xié)議標(biāo)準(zhǔn)中利用該特性實現(xiàn)了第一級物理鏈路冗余,很多系統(tǒng)中利用該特性實現(xiàn)網(wǎng)絡(luò)冗余。
1.2 ?網(wǎng)絡(luò)集中運行控制管理
在MIL?1394B網(wǎng)絡(luò)協(xié)議中,網(wǎng)絡(luò)上的節(jié)點分為中央控制節(jié)點(CC node)和遠(yuǎn)程節(jié)點。中央控制節(jié)點負(fù)責(zé)下發(fā)時間基準(zhǔn),維護(hù)整個網(wǎng)絡(luò)的時隙同步。遠(yuǎn)程節(jié)點接收中央控制節(jié)點的時間信息,并按照分配好的時隙發(fā)送和接收消息,通過這種機制提高通信的時間確定性。在機載設(shè)備中,通常將中央控制節(jié)點作為網(wǎng)絡(luò)管理單元。
1.3 ?確定性的通道地址
MIL?1394B總線上的節(jié)點在初始化過程中實現(xiàn)通道號分配,總線網(wǎng)絡(luò)上的每個參與通信的節(jié)點通過分配通道號完成地址識別,實現(xiàn)通信傳輸。不同于1394B網(wǎng)絡(luò)依靠自標(biāo)識完成各個節(jié)點的識別,不同的識別過程各個節(jié)點的ID號存在不一致的可能性,而在航空電子系統(tǒng)中由于確定性的需求,MIL?1394B總線建立時同一節(jié)點的通道號是預(yù)先分配的,不會動態(tài)變化。默認(rèn)中央控制節(jié)點的通道號為0通道。
1.4 ?自標(biāo)識報文機制
總線上所有節(jié)點的物理層都會向網(wǎng)絡(luò)上發(fā)送自標(biāo)識報文SELFID,各個節(jié)點根據(jù)自標(biāo)識報文的內(nèi)容以及上報自標(biāo)識包的順序完成物理連接關(guān)系的識別,并建立樹狀拓?fù)浣Y(jié)構(gòu)。
2 ?故障隔離原理和方案
2.1 ?總線故障現(xiàn)象
由于MIL?1394B總線采用IEEE?1394B?2002總線的物理層,在新的總線節(jié)點接入時,通過向總線上發(fā)送BUS_RESET,使總線上的所有節(jié)點進(jìn)入總線初始化過程,初始化完成后進(jìn)入樹標(biāo)識過程,樹標(biāo)識過程完成后總線的初始化工作結(jié)束,才能進(jìn)行正常通信。該特性也導(dǎo)致總線上的各個節(jié)點如果不斷產(chǎn)生復(fù)位,將會影響整個網(wǎng)絡(luò)的正常通信。
如圖1所示,當(dāng)整個網(wǎng)絡(luò)中存在一個故障節(jié)點,且該節(jié)點的故障現(xiàn)象是不穩(wěn)定的連接,將使整個網(wǎng)絡(luò)處于反復(fù)的初始化過程,導(dǎo)致整個網(wǎng)絡(luò)的通信受到影響。同時,由于整個網(wǎng)絡(luò)的時間同步源也受到影響,整個網(wǎng)絡(luò)的時間基準(zhǔn)將會不斷重復(fù)建立和發(fā)布,MIL?1394B基于時間的確定性也會受到影響。為了區(qū)別一般可恢復(fù)的復(fù)位,定義這種復(fù)位形式為錯誤復(fù)位,顯然這種復(fù)位對總線網(wǎng)絡(luò)是有害的。
2.2 ?故障檢測、隔離方法
2.2.1 ?錯誤復(fù)位故障檢測、隔離原理
節(jié)點的大部分故障可以通過報文傳遞過程和報文內(nèi)容進(jìn)行隔離[7],然而不穩(wěn)定的連接和節(jié)點的反復(fù)復(fù)位引進(jìn)的故障失效,通過MIL?1394B網(wǎng)絡(luò)協(xié)議本身[8]和一般的狀態(tài)自檢信息無法檢測和隔離。但根據(jù)實際工程經(jīng)驗和節(jié)點的失效模型,為了解決此類問題,可以利用MIL?1394B總線網(wǎng)絡(luò)物理連接具有先驗信息的特點。而現(xiàn)有的MIL?1394B軟硬件實現(xiàn)[2?4]通常無法實現(xiàn)錯誤復(fù)位故障的檢測與隔離,通過對節(jié)點的軟硬件設(shè)計和網(wǎng)管程序的改進(jìn)可以實現(xiàn)。引入總線節(jié)點和連接的復(fù)位信用模式,判斷復(fù)位是正常復(fù)位或者是非正常復(fù)位,對總線網(wǎng)絡(luò)采取不同的處理方式,完成錯誤復(fù)位故障的檢測、隔離。
2.2.2 ?故障隔離硬件設(shè)計
如圖2所示,在改進(jìn)后的網(wǎng)絡(luò)實現(xiàn)中,不同于一般MIL?1394B的FPGA設(shè)計,RN節(jié)點和CC節(jié)點的邏輯設(shè)計不但要完成MIL?1394B協(xié)議解析,還增加了端口信用管理組件,每個節(jié)點都可以通過CC分發(fā)的配置信息記錄各自節(jié)點的端口信用度,并通過硬件設(shè)計的端口控制線實現(xiàn)端口的開/閉。在端口信用管理組件發(fā)現(xiàn)節(jié)點失效后也可以完成對物理層芯片的關(guān)閉。在物理層芯片關(guān)閉后該節(jié)點不會重新入網(wǎng)。
2.2.3 ?基于CC節(jié)點的故障隔離軟件設(shè)計
CC節(jié)點的網(wǎng)絡(luò)管理程序組成如圖3所示。
網(wǎng)絡(luò)管理程序各組成部分中,與本文的研究內(nèi)容相關(guān)的主要有邏輯拓?fù)渖山M件、邏輯樹拓?fù)涞怯泿旖M件、信用管理組件及物理拓?fù)淇刂平M件。邏輯拓?fù)渖山M件:根據(jù)系統(tǒng)中的網(wǎng)絡(luò)連接信息生成可能的所有拓?fù)?邏輯樹拓?fù)涞怯泿旖M件:將邏輯拓?fù)渖山M件中的邏輯樹形成登記并建庫;信用管理組件:計算并記錄各個邏輯拓?fù)涞男庞?物理拓?fù)淇刂平M件:根據(jù)邏輯拓?fù)涞男庞弥滇尫藕完P(guān)閉各物理鏈路。
2.2.4 ?故障隔離工作機制
CC節(jié)點根據(jù)建立的物理連接關(guān)系以及通道號的預(yù)先配置特性,完成所有可能實現(xiàn)的邏輯拓?fù)涞怯?,記為logicTree{[n]},其中,[n]的取值范圍為1到所有可能的最大數(shù)。logicTree中記錄了包括樹狀結(jié)構(gòu)下當(dāng)前邏輯連接對應(yīng)的節(jié)點間建立的物理端口連接,例如link.cc2R1=cc.a_R1.B,并記錄了當(dāng)前物理連接的信用值link.cc2R1.credit。
網(wǎng)絡(luò)啟動運行后,如出現(xiàn)錯誤復(fù)位故障的節(jié)點,導(dǎo)致總線復(fù)位次數(shù)過多,超過設(shè)置的閾值,關(guān)閉可復(fù)用的端口,形成唯一的logicTree,如果故障復(fù)位依然存在,CC節(jié)點上的網(wǎng)絡(luò)管理程序開始記錄每一次復(fù)位后的SELFID值以及SELFID上報的順序,根據(jù)logicTree的記錄判斷出每次復(fù)位節(jié)點的當(dāng)前網(wǎng)絡(luò)復(fù)位完成后的物理端口連接關(guān)系。由于不穩(wěn)定節(jié)點的連接在不同的復(fù)位后存在不能持續(xù)出現(xiàn)的現(xiàn)象,一旦某次復(fù)位初始化完成后,某個節(jié)點的連接未上線,就會被網(wǎng)絡(luò)管理程序減少記錄連接的信用值。隨著不穩(wěn)定的復(fù)位反復(fù)出現(xiàn),不穩(wěn)定的連接信用值不斷降低,當(dāng)該條連接的信用值降低到設(shè)計的規(guī)定值后,該條連接對應(yīng)的物理端口將會被網(wǎng)絡(luò)管理程序中的信用管理組件通知端口信用邏輯組件進(jìn)行關(guān)閉。關(guān)閉信用值較低的連接后,總線網(wǎng)絡(luò)開始在所有的可用物理連接上實現(xiàn)節(jié)點的通信,保證正常節(jié)點的通信。
3 ?測試與驗證
測試主要驗證發(fā)現(xiàn)、隔離錯誤復(fù)位故障的能力和整個過程的時間,依靠搭建原型驗證系統(tǒng),并在節(jié)點中通過向邏輯代碼發(fā)送復(fù)位指令摸擬注入錯誤復(fù)位故障。
圖4的測試驗證環(huán)境由兩個RN節(jié)點及其嵌入式主機、一個CC節(jié)點及其嵌入式主機和MIL?1394B總線分析儀組成??偩€分析儀可向主機上報統(tǒng)計總線上的復(fù)位數(shù)據(jù)和顯示拓?fù)湫畔ⅰ3涂偩€分析儀的連接外,驗證系統(tǒng)存在3條總線連接,分別為link.cc2R1,link.cc2R2,link.R12R2。link.cc2R1,link.cc2R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree1;link.cc2R1,link.R12R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree2;link.cc2R2,link.R12R2構(gòu)建的是網(wǎng)絡(luò)邏輯拓?fù)鋖ogicTree3。為了測試方法的有效性,在link.cc2R2的連接上不斷注入錯誤復(fù)位故障。各連接的信用初值設(shè)為11,設(shè)置總線閾值為10。
復(fù)位故障檢測數(shù)據(jù)如表1所示。從表1中的數(shù)據(jù)可以看出,當(dāng)注入復(fù)位故障次數(shù)超過一定的數(shù)值后,故障連接的信用降低為0,驗證系統(tǒng)將關(guān)閉存在故障連接的邏輯樹注冊,僅支持唯一的無故障連接logicTree2,整個網(wǎng)絡(luò)不再重復(fù)復(fù)位,可以進(jìn)行正常通信。
4 ?結(jié) ?論
針對現(xiàn)有的MIL?1394B總線拓?fù)渥R別機制主要是基于1394包的拓?fù)渥R別,雖然能夠在一定程度上解決系統(tǒng)設(shè)計和驗證工作,但并沒有充分利用MIL?1394B總線的信息,使系統(tǒng)在應(yīng)用此總線時存在難以識別具體故障節(jié)點的問題。本文提出的設(shè)計方法通過分析MIL?1394B協(xié)議的本身特性以及1394報文的原有信息,可確定上報各節(jié)點的邏輯連接關(guān)系并能自動檢測非穩(wěn)定故障節(jié)點,完成隔離故障節(jié)點并據(jù)此實現(xiàn)系統(tǒng)的重構(gòu)。在某型綜合化通信航空識別系統(tǒng)中應(yīng)用穩(wěn)定,支持了該系統(tǒng)的綜合化實現(xiàn)。同時,該技術(shù)可應(yīng)用于系統(tǒng)在線測試過程中,實現(xiàn)系統(tǒng)總線網(wǎng)絡(luò)的自檢等功能。
參考文獻(xiàn)
[1] IEEE Computer Society. IEEE?1394B interface requirements for military and aerospace vehicle applications SAE aerospace standard 5643 [S]. US: IEEE Computer Society, 2004.
[2] 趙彬,田澤,楊峰,等.基于AS5643協(xié)議的接口模塊設(shè)計與實現(xiàn)[J].計算機技術(shù)與發(fā)展,2013,23(8):100?102.
ZHAO Bin, TIAN Ze, YANG Feng, et al. Design and implementation of MIL?1394 module based on AS5643 protocol [J]. Computer technology and development, 2013, 23(8): 100?102.
[3] 趙彬,易寧寧,鄭斐,等.航電1394總線節(jié)點設(shè)計實現(xiàn)[J].電子技術(shù)應(yīng)用,2016,42(6):13?16.
ZHAO Bin, YI Ningning, ZHENG Fei, et al. Design and implementation of avionics 1394 node [J]. Application of electronic technique, 2016, 42(6): 13?16.
[4] 馬寧,王宣明,鄭斐.飛機管理系統(tǒng)1394總線AS5643協(xié)議的設(shè)計與實現(xiàn)[J].航空計算技術(shù),2013,43(6):122?124.
MA Ning, WANG Xuanming, ZHENG Fei. Design and implementation of vehicle management system 1394 bus AS5643 protocol [J]. Aeronautical computing technique, 2013, 43(6): 122?124.
[5] 周慶瑞,孫輝先.IEEE1394網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的可靠性研究[J].宇航學(xué)報,2008,29(4):1403?1408.
ZHOU Qingrui, SUN Huixian. Research on reliability of physical topology for IEEE 1394 [J]. Journal of astronautics, 2008, 29(4): 1403?1408.
[6] 何志強.綜合化航空電子系統(tǒng)發(fā)展歷程及重要支撐技術(shù)[J].電訊技術(shù),2004,44(4):1?5.
HE Zhiqiang. Development and important supporting technology of integrated avionics system [J]. Telecommunication engineering, 2004, 44(4): 1?5.
[7] 朱良,杜承烈.通用航空總線測試與分析軟件的設(shè)計和實現(xiàn)[J].微電子學(xué)與計算機,2007,24(7):125?127.
ZHU Liang, DU Chenglie. Design and realization of universal avionics bus testing and analysis software [J]. Microelectrnics & computer, 2007, 24(7): 125?127.
[8] BAI Haowei. Analysis of a SAE MIL?1394B based high speed avionics network architecture for space and defense applications [C]// 2007 IEEE Aerospace Conference. Big Sky: IEEE, 2007: 1344?1352.
[9] 辛永利,田澤,楊峰.機載UMS 系統(tǒng)二余度1394B總線網(wǎng)絡(luò)設(shè)計[J].計算機技術(shù)與發(fā)展,2015,25(3):197?201.
XIN Yongli, TIAN Ze, YANG Feng. Design of dual?redundancy 1394B bus network for airborne UMS [J]. Computer technology and development, 2015, 25(3): 197?201.