楊 凱
(中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京100081)
動車組運行故障圖像檢測設(shè)備(Trouble of moving EMU Detection System, TEDS)[1]利用圖像自動識別技術(shù)對其采集的動車組車體、轉(zhuǎn)向架等部位圖像進行異常狀態(tài)識別報警,是動車組運行安全監(jiān)控重要技術(shù)手段之一。然而,受制于圖像識別技術(shù)發(fā)展、設(shè)備運行工況等因素影響,當(dāng)前TEDS 自動識別仍然存在明顯的誤報率高、準(zhǔn)確率低的問題[2]。
目前,在不斷推進TEDS 故障識別能力,加快圖像自動識別技術(shù)研究的過程中,出現(xiàn)一些亟需解決的問題。首先,近年基于深度神經(jīng)網(wǎng)絡(luò)的方法極大地推動了圖像識別技術(shù)本身的發(fā)展,而將其應(yīng)用于TEDS 故障自動識別時,出現(xiàn)了訓(xùn)練數(shù)據(jù)不充足、特征數(shù)據(jù)不明確的問題,從而影響了識別模型的有效建立;同時,不同研究方向及方法產(chǎn)生的算法成果,在比較評價時也出現(xiàn)了沒有統(tǒng)一測試數(shù)據(jù),無法標(biāo)準(zhǔn)評判的情況。為此,研究TEDS 動車組故障圖像數(shù)據(jù)庫建立技術(shù),設(shè)計統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn),制定標(biāo)準(zhǔn)的數(shù)據(jù)格式及規(guī)則,實現(xiàn)TEDS動車組故障圖像數(shù)據(jù)的規(guī)范匯總與共享,具有重要的研究價值。
圖像數(shù)據(jù)庫建立及相關(guān)技術(shù)研究是圖像處理技術(shù)研究的重要基礎(chǔ),眾多圖像技術(shù)的跨越式發(fā)展均基于高效的圖像數(shù)據(jù)庫建立。2004 年德州大學(xué)奧斯丁分校的H. R. Sheikh 和 Z. Wang 等人建立了 LIVE[3]圖像數(shù)據(jù)庫,并基于此數(shù)據(jù)庫研究了圖像質(zhì)量評價技術(shù),提出了基于結(jié)構(gòu)相似性的SSIM[4]圖像質(zhì)量評價方法,突破了圖像研究學(xué)界使用多年的PSNR[5]評價局限;2009 年普林斯頓大學(xué)的J. Deng 和W. Dong 等人建立了ImageN-et[6]圖像數(shù)據(jù)庫,隨后幾年基于該數(shù)據(jù)庫的研究飛速發(fā)展,極大地促進了基于深度神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)研究,實現(xiàn)了部分領(lǐng)域機器識別趕超人類能力的飛躍[7]。TEDS 采集的動車組車體圖像有其自身特征屬性,在自動識別技術(shù)研究過程中不便直接利用現(xiàn)有通用的圖像數(shù)據(jù)庫開展,因此,建立具有統(tǒng)一標(biāo)準(zhǔn)的TEDS 動車組圖像數(shù)據(jù)庫對加快TEDS 故障自動識別技術(shù)研究發(fā)展,有效提高TEDS 故障自動識別算法能力,實現(xiàn)更為準(zhǔn)確的算法能力評價十分必要。
TEDS 動車組故障圖像數(shù)據(jù)庫的設(shè)計重點要解決動車組故障圖像訓(xùn)練數(shù)據(jù)不充分、試驗研究測試數(shù)據(jù)不足、研究算法成果評判標(biāo)準(zhǔn)及測試數(shù)據(jù)不統(tǒng)一的問題。為此,圖像數(shù)據(jù)庫設(shè)計為包括典型故障局部圖像庫、故障列車整車圖像庫兩大數(shù)據(jù)類型。其中,典型故障局部圖像庫主要包含TEDS 日常運用過程中人工發(fā)現(xiàn)的動車組典型故障局部截圖的原始采集圖像及相關(guān)描述數(shù)據(jù);故障列車整車圖像庫主要包含TEDS 模擬測試故障或真實發(fā)現(xiàn)故障所在的完整列車監(jiān)控圖像及相關(guān)描述數(shù)據(jù)。圖像數(shù)據(jù)庫總體架構(gòu)如圖1 所示。
圖1 圖像數(shù)據(jù)庫總體架構(gòu)圖
其中,典型故障局部圖像庫的數(shù)據(jù)通過TEDS 聯(lián)網(wǎng)監(jiān)控系統(tǒng)自動獲取。在日常運用過程中人工發(fā)現(xiàn)典型故障時,由聯(lián)網(wǎng)監(jiān)控系統(tǒng)向TEDS 探測站發(fā)送反查信息,由探測站將對應(yīng)位置的當(dāng)前故障位置局部原始圖、對應(yīng)位置歷史過車局部原始圖通過典型故障局部圖像數(shù)據(jù)接口(以下簡稱“故障截圖接口”)上傳至聯(lián)網(wǎng)監(jiān)控系統(tǒng)段級應(yīng)用平臺,由段級平臺匯總補充過車運行信息、故障詳情描述等信息,上報至聯(lián)網(wǎng)監(jiān)控系統(tǒng)國鐵集團平臺,并定期整理補充到TEDS 故障圖像數(shù)據(jù)庫中。
故障列車整車圖像庫數(shù)據(jù)的獲取方式包括TEDS聯(lián)網(wǎng)監(jiān)控系統(tǒng)自動獲取、人工離線采集兩種。在日常運用過程中人工發(fā)現(xiàn)典型故障時主要采取TEDS 聯(lián)網(wǎng)監(jiān)控系統(tǒng)自動獲取的方式,由聯(lián)網(wǎng)監(jiān)控系統(tǒng)向TEDS 探測站發(fā)送反查信息,由探測站將故障對應(yīng)的當(dāng)前過車整車監(jiān)控原始圖像數(shù)據(jù)(包括二維圖像、深度信息等)、歷史過車整車監(jiān)控原始圖像數(shù)據(jù)等通過故障列車整車圖像在線數(shù)據(jù)接口(以下簡稱“在線整車圖像接口”)上傳至聯(lián)網(wǎng)監(jiān)控系統(tǒng)段級應(yīng)用平臺,由段級平臺匯總補充過車運行信息、故障詳情描述等信息,上報至聯(lián)網(wǎng)監(jiān)控系統(tǒng)鐵總級平臺,并定期整理補充到TEDS 故障圖像數(shù)據(jù)庫中;在開展TEDS 模擬故障過車測試試驗后或日常運用過程中人工發(fā)現(xiàn)典型故障但無法通過系統(tǒng)自動獲取時采取人工離線采集的方式,由TEDS 設(shè)備管理單位將當(dāng)前過車整車監(jiān)控原始圖像數(shù)據(jù)(包括二維圖像、圖像深度信息等)、歷史過車整車監(jiān)控原始圖像數(shù)據(jù)等通過離線下載的方式從TEDS 探測站采集,在匯總補充過車運行信息、故障詳情描述等數(shù)據(jù)后,通過故障列車整車圖像離線數(shù)據(jù)接口(以下簡稱“離線整車圖像接口”)定期補充到TEDS 故障圖像數(shù)據(jù)庫中。
TEDS 動車組故障圖像數(shù)據(jù)庫通過數(shù)據(jù)共享接口提供對外數(shù)據(jù)共享,所有擁有數(shù)據(jù)使用權(quán)限的用戶,均可通過數(shù)據(jù)共享接口獲取數(shù)據(jù)。同時,基于TEDS 故障圖像數(shù)據(jù)庫建立的TEDS 自動識別技術(shù)測試平臺,可利用數(shù)據(jù)庫數(shù)據(jù)為各類自動識別技術(shù)算法提供算法測試、優(yōu)化驗證、算法比對等系統(tǒng)功能。
TEDS 動車組故障圖像數(shù)據(jù)庫數(shù)據(jù)的接入,主要通過對故障截圖接口、在線整車圖像接口、離線整車圖像接口傳輸數(shù)據(jù)來實現(xiàn)。為保證數(shù)據(jù)采集內(nèi)容的標(biāo)準(zhǔn)及格式的規(guī)范,制定了統(tǒng)一的數(shù)據(jù)接口規(guī)則。
2.1.1 接口存放規(guī)范
故障截圖接口建立于TEDS 段級平臺接口服務(wù)器上。下發(fā)報文及上傳圖像數(shù)據(jù)文件的存放目錄指定為%TEDS_MIS%\%DATAFILE%。其中,路徑通配符%TEDS_MIS%為探測站聯(lián)網(wǎng)時確定,路徑通配符%DATAFILE%用于下發(fā)命令的名稱為command,用于上傳故障圖的名稱為alarm。
2.1.2 下發(fā)反查報文規(guī)則
下發(fā)的反查報文格式設(shè)計如表1 所示。
2.1.3 上傳數(shù)據(jù)規(guī)則
TEDS 探測站獲取下發(fā)反查報文后,向接口服務(wù)器發(fā)送上傳圖像數(shù)據(jù)。其中,二維圖像的命名格式為:圖像唯一碼_圖像名稱.jpg,圖像深度信息按照二維圖像命名方式命名,擴展名為.bmp。圖像深度信息按8 位位圖方式填寫,并與二維圖像保持圖像內(nèi)容位置一致。
2.2.1 接口存放規(guī)范
在線整車圖像接口建立于TEDS 段級平臺接口服務(wù)器上。下發(fā)報文及上傳圖像數(shù)據(jù)文件的存放目錄指定為%TEDS_MIS%\%DATAFILE%。其中,路徑通配符%TEDS_MIS%為探測站聯(lián)網(wǎng)時確定,路徑通配符%DATAFILE%用于下發(fā)命令的名稱為command。上傳整車圖像的存放位置依據(jù)報文相關(guān)內(nèi)容確定。
2.2.2 下發(fā)反查報文規(guī)則
下發(fā)的反查報文格式設(shè)計如表2 所示。
2.2.3 上傳數(shù)據(jù)規(guī)則
TEDS 探測站獲取下發(fā)反查報文后,向接口服務(wù)器發(fā)送上傳圖像數(shù)據(jù)。上傳內(nèi)容包括報文指定列車的整車監(jiān)控原始二維圖像、圖像深度信息,該站歷史最近1、2 次(如果存在)的該車整車監(jiān)控原始二維圖像、圖像深度信息。上傳數(shù)據(jù)的文件編制規(guī)則設(shè)計如表3 所示。
TEDS 探測站將上述數(shù)據(jù)按統(tǒng)一規(guī)則組織并壓縮為“車組號_車型_過車時間.rar”文件,依據(jù)反查報文中“存儲位置”信息上傳至指定目錄。其中,車組號為定長4 位動車組車組號,車型為按標(biāo)準(zhǔn)大小寫編寫動車組車型號,過車時間為定長14 位的列車通過時間編碼。
表1 故障截圖接口反查報文格式表
離線整車圖像接口建立于TEDS 動車組故障圖像庫。由TEDS 設(shè)備管理單位將需上傳過車的整車(車輛)監(jiān)控原始圖像、三維圖像及數(shù)據(jù),同一探測站歷史最近1、2 次(如果存在)的該車整車監(jiān)控原始二維圖像、圖像深度信息,以及鄰近上1、2 探測站(如果存在)最近一次的該車整車監(jiān)控原始二維圖像、圖像深度信息,通過離線下載的方式從探測站采集,匯總補充過車運行信息、故障詳情描述等數(shù)據(jù)后,補充到TEDS 故障圖像數(shù)據(jù)庫中。
2.3.1 數(shù)據(jù)保存目錄
數(shù)據(jù)保存于“…車組號_車型號_過車時間檢車類型廠家名稱”下。其中,列車數(shù)據(jù)報文、故障報文保存在“…message”文件夾下,二維圖像、圖像深度信息保存在“…pic”文件夾下。
其中,“檢車類型”文件夾命名規(guī)則為:當(dāng)前列車00,同站歷史列車分別為01、02,鄰近探測站分別為X1、X2?!皬S家名稱”文件夾命名為TEDS 設(shè)備廠家名稱縮寫。
2.3.2 上傳數(shù)據(jù)規(guī)則
離線整車數(shù)據(jù)上報時,其列車數(shù)據(jù)報文、故障報文的上報規(guī)則與TEDS 聯(lián)網(wǎng)監(jiān)控系統(tǒng)數(shù)據(jù)接口規(guī)則[9]一致,其圖像監(jiān)控二維圖像、圖像深度信息的上報規(guī)則與在線整車圖像數(shù)據(jù)上傳文件規(guī)則一致。
所有擁有數(shù)據(jù)使用權(quán)限的用戶,均可按照權(quán)限約束從TEDS 動車組故障圖像數(shù)據(jù)庫的數(shù)據(jù)共享接口獲取數(shù)據(jù)。共享內(nèi)容主要包括列車及車輛信息、故障詳情、當(dāng)前列車監(jiān)控圖像及深度數(shù)據(jù)、歷史列車監(jiān)控圖像及深度數(shù)據(jù)等。其中,列車及車輛信息、故障詳情通過Webservice 方式獲?。ㄈ绫? 所示),圖像及深度數(shù)據(jù)通過共享文件鏈接的方式獲取。
根據(jù)設(shè)計的規(guī)則及方案,研發(fā)實現(xiàn)了TEDS 動車組故障圖像數(shù)據(jù)庫,并在TEDS 國鐵集團級監(jiān)控中心服務(wù)器上部署試運行。截至2019 年6 月底,數(shù)據(jù)庫已采集典型故障局部圖像數(shù)據(jù)24 407 例(如圖2 所示),故障列車整車圖像數(shù)據(jù)42 例(如圖3 所示),并仍在隨著TEDS 業(yè)務(wù)工作的開展保持?jǐn)?shù)據(jù)的持續(xù)采集。
基于已采集的典型故障數(shù)據(jù),試驗了動車組車側(cè)裙板卡扣的深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,并將訓(xùn)練結(jié)果用于裙板卡扣的目標(biāo)定位及異常檢測。相關(guān)算法于某鐵路局集團公司某動車所庫前TEDS 設(shè)備進行試點試驗,取得了92.3%的異常識別率(有效報警數(shù)/真實異常數(shù))及66.7%的報警準(zhǔn)確率(有效報警數(shù)/自動報警數(shù)),相較于TEDS 原有算法有明顯的識別能力提升。
表2 在線整車圖像接口反查報文格式表
表3 在線整車圖像數(shù)據(jù)上傳文件規(guī)則表
表4 Webservice 接口表
圖2 典型故障局部圖像數(shù)據(jù)示例圖
圖3 故障列車整車圖像數(shù)據(jù)示例圖
表5 裙板卡扣異常檢測統(tǒng)計表
基于數(shù)字圖像處理研究的基本規(guī)律,開展了TEDS故障自動識別技術(shù)的基礎(chǔ)性研究工作,研究了TEDS 動車組故障圖像數(shù)據(jù)庫建立技術(shù),設(shè)計了統(tǒng)一的數(shù)據(jù)采集規(guī)范,制定標(biāo)準(zhǔn)的數(shù)據(jù)格式及規(guī)則,實現(xiàn)了TEDS 動車組故障圖像數(shù)據(jù)庫的建立,有效推動了TEDS 自動識別技術(shù)的發(fā)展,為保障動車組運行安全奠定了良好的技術(shù)基礎(chǔ)。下一步,將在不斷清理優(yōu)化數(shù)據(jù)庫數(shù)據(jù)內(nèi)容的基礎(chǔ)上,針對動車組關(guān)鍵部位及部件開展基于深度學(xué)習(xí)的故障識別研究。