從建力 王 源 楊翠平 王 平 李成輝
(1.西南交通大學(xué)土木工程學(xué)院,成都,610031;2.西南交通大學(xué)高速鐵路線路工程教育部重點實驗室,成都,610031)
基于列車車體振動加速度來評估軌道平順狀態(tài)和車輛運行舒適性[1],對鐵路線路養(yǎng)護維修來說是一種便捷、有效的方法,但這類評估方法對車體加速度數(shù)據(jù)的體量需求巨大。為了適應(yīng)城市軌道交通、高速鐵路的軌道平順性評估,本文考慮借助智能手機作為感知終端[2],通過鐵路職工的智能手機所測量得到的加速度數(shù)據(jù),為鐵路線路養(yǎng)護提供重要的數(shù)據(jù)源。相對于精密加速度傳感器和添乘儀,使用手機測試車體振動響應(yīng)的主要優(yōu)點是不會影響行車安全和旅客乘車體驗,并且成本低、數(shù)據(jù)體量巨大。
該項工作面臨的主要問題是由于測試環(huán)境的復(fù)雜性、測量終端的流動性等原因?qū)е轮悄苁謾C所獲取的數(shù)據(jù)存在較強的誤差干擾,原因包括:(1)因手機后臺運行多種App導(dǎo)致手機采樣頻率不穩(wěn)定;(2)因乘客上下車和隨意走動引起的偶然干擾;(3)因手機內(nèi)置傳感器信噪比低引起的隨機誤差。因此必須經(jīng)過系統(tǒng)性的數(shù)據(jù)預(yù)處理才可發(fā)揮該類數(shù)據(jù)的價值。本文的主要工作即是針對智能手機測量數(shù)據(jù),研究其數(shù)據(jù)清洗方法,以增強該類數(shù)據(jù)的實用價值。
合理剔除測量數(shù)據(jù)異常值是各工程領(lǐng)域遇到的問題,對于不能確定總體分布類型的數(shù)據(jù),需做適當(dāng)?shù)臄?shù)據(jù)變換使數(shù)據(jù)正態(tài)化[3]。為發(fā)揮數(shù)據(jù)價值,需對數(shù)據(jù)進行清洗[4-8],其過程一般包括兩個方面:(1)異常值的識別定位,如設(shè)定閾值篩選異常值[9];(2)異常值的處理,如小波分析具有較好的信號降噪效果[10-11],中值濾波可剔除信號中較大誤差[12-13]。智能手機傳感數(shù)據(jù)可能的異常類型較多,而上述文獻中采用單一的異常值識別和處理方法,無法直接滿足手機檢測數(shù)據(jù)清洗需求,需要研究系統(tǒng)性的數(shù)據(jù)異常識別-分類處理框架。
基于此,本文基于統(tǒng)計方法,根據(jù)不同的異常值產(chǎn)生原因,首先提出數(shù)據(jù)異常值識別方法:P值篩選、一階變化率識別與小波分析3種方法相結(jié)合;進而提出對應(yīng)的數(shù)據(jù)異常處理方法:區(qū)段刪除、中值濾波、小波濾波3種處理方法相結(jié)合。實例分析表明,本文方法處理后的智能手機傳感數(shù)據(jù)具有較穩(wěn)定的時域、頻域特性,可為評估軌道平順狀態(tài)和列車運行品質(zhì)提供可靠的數(shù)據(jù)保障。
基于智能終端采集地鐵車輛振動加速度時,為使數(shù)據(jù)能夠服務(wù)于地鐵系統(tǒng),包括評價軌道平順狀態(tài)、車輛舒適性[14-16],需對手機檢測數(shù)據(jù)進行質(zhì)量分析。智能手機主要承擔(dān)數(shù)據(jù)采集任務(wù),添乘人員將檢測數(shù)據(jù)及時上傳至服務(wù)器,依靠服務(wù)器較大的存儲空間和較快的計算速度進行數(shù)據(jù)預(yù)處理工作,具體內(nèi)容包括:(1)因手機采樣頻率不穩(wěn)定,需基于檢測數(shù)據(jù)進行重采樣得到等時間間隔數(shù)據(jù)序列;(2)受測試環(huán)境變化及傳感器信噪比低等多種因素影響,手機檢測數(shù)據(jù)含有隨機誤差,需對數(shù)據(jù)異常值進行識別與分類;(3)針對數(shù)據(jù)異常值進行分類處理;(4)數(shù)據(jù)清洗后應(yīng)用分析。本文主要闡述前3部分,數(shù)據(jù)預(yù)處理流程如圖1所示。
圖1 數(shù)據(jù)預(yù)處理流程Fig.1 Data preprocessing process
因手機后臺同時運行多種應(yīng)用軟件引起手機采樣頻率不穩(wěn)定,其實際采樣頻率f在理論采樣頻率F上下變動,造成手機檢測數(shù)據(jù)并不是等間隔時間序列。本文采用線性插值法對手機檢測原生數(shù)據(jù)進行重新采樣,生成等間隔時間序列,采樣原理示意圖如圖2所示。
圖2 線性插值示意圖Fig.2 Linear interpolation diagrammatic sketch
等間隔時間序列計算公式如下
式中:yi'為原生數(shù)據(jù) i位 置插值后數(shù)值;xi,xi+1為原生數(shù)據(jù) i,i+1 位置數(shù)值;ti,ti+1為原生數(shù)據(jù) i,i+1位置數(shù)據(jù)采集時刻;ti'為理論采樣頻率F下i位置處數(shù)據(jù)采集時刻。
因手機檢測數(shù)據(jù)中的異常值是由多種原因引起的,本文基于P值篩選識別出的數(shù)據(jù)異常值定義為第一類異常值;基于檢測數(shù)據(jù)一階變化率并結(jié)合“3σ準(zhǔn)則”識別超出設(shè)定閾值的數(shù)據(jù)定義為第二類異常值;基于小波分析分解因傳感器信噪比低引起的隨機誤差定義為第三類異常值。上述異常值識別方法描述如下:
(1)P值篩選:設(shè)置數(shù)據(jù)始端至末端的移動窗口長度為N,通過設(shè)定閾值T并計算移動窗口中超出閾值T范圍的概率P,其公式如下
式中:n為窗口元素xi超出閾值T的個數(shù);N為移動窗口長度;P0為自定義概率常數(shù)。xi'為1時表示手機檢測數(shù)據(jù)屬于第一類異常值。
(2)一階變化率識別:根據(jù)手機檢測數(shù)據(jù)一階變化率并結(jié)合“3σ準(zhǔn)則”將超出閾值的一階變化率視為異常值。其一階變化率計算公式如下
式中:xi,xi+1為 i,i+1 位置的手機檢測數(shù)據(jù);ti,ti+1為相應(yīng)手機檢測數(shù)據(jù)時間;yi為 i位置處一階變化率值。
根據(jù)“3σ準(zhǔn)則”設(shè)置一階變化率超限閾值,其閾值范圍可表示為
式中:μ為一階變化率均值;σ為一階變化率標(biāo)準(zhǔn)差;yi為i位置一階變化率值;N1為數(shù)據(jù)一階變化率長度。
由于手機檢測數(shù)據(jù)受測試環(huán)境影響,手機檢測數(shù)據(jù)局部會發(fā)生突變,表現(xiàn)為一階變化率幅值超限。為了避免將幅值較大的手機檢測有效數(shù)據(jù)識別為異常值,當(dāng)手機檢測數(shù)據(jù)一階變化率滿足式(5)時,可保證手機檢測數(shù)據(jù)具有較高可信度(99.74%)。由式(8)識別一階變化率超限位置。
式中yi'為1時表示i位置處手機檢測數(shù)據(jù)為第二類異常值。
(3)因手機加速度傳感器信噪比低引起的隨機誤差,該類隨機誤差識別方法如下:根據(jù)手機采樣頻率F確定小波分解層數(shù)n,將手機檢測信號分解為低頻成分和細節(jié)成分,這里的細節(jié)成分包含因手機加速度傳感器信噪比低引起的成分。由于在時域分析中離散傅里葉變換沒有局部化能力,而小波分析可對時域信號局部信息進行分解,這里借鑒小波分析具有的局部化能力,對手機檢測數(shù)據(jù)局部波動較大位置進行多層分解。小波尺度a和平移t是基小波兩個重要參數(shù),這里選擇經(jīng)典小波尺度a=2,t為手機采樣間隔Δt??,便可得出小波分解過程中每層對應(yīng)的中心頻率fc,其計算公式如下
式中:F為手機標(biāo)準(zhǔn)采樣頻率;n為小波分解層數(shù)。
手機檢測數(shù)據(jù)可視為離散數(shù)據(jù)信號,且信號能量有限,即
式中:L2(R)為R上平方可積函數(shù)構(gòu)成的函數(shù)空間;Wx為信號能量且有限。
這里選擇基小波ψa,b(t)(a=2,b=Δt),將基小波經(jīng)過伸縮和平移后,就可以得到一個小波序列,即
將基小波ψ2,Δt(t)與手機檢測數(shù)據(jù)進行卷積實現(xiàn)分解
式中:xi為長度N的離散隨機信號;xi,ψ2,Δt為xi與 ψ2,Δt的內(nèi)積。
本文根據(jù)3種類型異常值的分布特征,確定了相對應(yīng)的異常值處理方法,具體如下:
(1)第一類異常值幅值波動較大,波動個數(shù)與窗口元素個數(shù)比例P超出設(shè)定閾值P0,且幅值遠遠超出車體正常振動加速度范圍,這是受明顯干擾因素影響的數(shù)據(jù),不能真實反映車體振動響應(yīng),采取區(qū)段刪除方法直接剔除。
(2)第二類異常值幅值波動較小,該類異常值含有車體振動響應(yīng)有效成份,可采取中值濾波方法濾除該類型異常值對車體振動響應(yīng)的影響,其原理描述如下:該方法需提前設(shè)置長度為N(奇數(shù))的移動窗口,以異常值所在位置為窗口中心位置,將窗口內(nèi)手機檢測數(shù)據(jù)按升序或降序重新排列,用產(chǎn)生的新序列數(shù)據(jù)的中值元素代替異常值,可表示為
式中:xi為移動窗口內(nèi)i位置對應(yīng)的元素;xi-(N-1)/2,xi+(N-1)/2為移動窗口兩端元素;median表示取移動窗口中值元素;xi'為窗口元素重新排序后的中值元素。
(3)本文采用小波濾波去除因手機加速度傳感器信噪比低引起的隨機誤差,其步驟為:首先選擇合適的小波函數(shù)進行分解計算;接著選擇半軟閾值函數(shù)對各個分解尺度下的細節(jié)成份進行閾值量化處理;最后將小波分解的最低層低頻系數(shù)和閾值量化處理后的各層細節(jié)成份進行重構(gòu),其基本原理數(shù)學(xué)描述如下。
半軟閾值函數(shù)
式中:sgn為階躍函數(shù);w為高頻系數(shù);I為兩數(shù)取?。籘1,T2為常數(shù),且 0<T1<T2。當(dāng) w>0,sgn=1;w=0,sgn=0;w<0,sgn=-1。
由小波重構(gòu)基本關(guān)系式Vn-1=Vn⊕Wn可知
式中:xn-1為第n-1層待重構(gòu)信號;xin為已完成小波重構(gòu)的第n層低頻系數(shù);di
n為已完成小波重構(gòu)的第n層高頻系數(shù);φni(t)為尺度函數(shù);ψni(t)為小波基函數(shù)。
本試驗測試路線為成都地鐵1號線火車北站至高新站,共12個車站,11個區(qū)段,將智能手機放置在相對穩(wěn)定的車廂地板上采集車體振動響應(yīng),依據(jù)文獻[14,16]確定手機安放位置,手機標(biāo)準(zhǔn)采樣頻率為100 Hz,手機檢測數(shù)據(jù)如圖 3(a)所示。
結(jié)合現(xiàn)場測試情況可知,因手機測試開始和結(jié)束時,測試人員觸碰手機點擊“啟動測試”和“關(guān)閉測試”,數(shù)據(jù)始端和末端出現(xiàn)較大波動;在測試過程中受乘客上下車和隨意走動影響,手機檢測數(shù)據(jù)局部出現(xiàn)較多“毛刺”,為觀察數(shù)據(jù)局部細節(jié),對260~500 s區(qū)間手機檢測數(shù)據(jù)進行局部放大,如圖3(b)所示。
手機標(biāo)準(zhǔn)采樣頻率100 Hz,對應(yīng)的標(biāo)準(zhǔn)采樣間隔為10 ms,但實際采樣間隔的統(tǒng)計結(jié)果顯示:智能手機采樣時間間隔在區(qū)間[0,11),[11,21)ms所占比例分別為51%和48%,其他占1%(剔除),如圖4所示。對手機原生數(shù)據(jù)采取線性插值法進行數(shù)據(jù)重采樣,可得均勻時間序列,如圖5所示。
圖4 手機采樣間隔區(qū)間統(tǒng)計結(jié)果Fig.4 Statistical results of phone sampling interval
圖5 手機檢測數(shù)據(jù)(插值后)Fig.5 Phone detection data(interpolation)
(1)根據(jù)上述異常值識別方法,首先基于P值篩選識別第一類異常值,設(shè)置了窗口長度N=100,手機橫向加速度閾值Tx=0.7 m/s2,縱向加速度閾值Ty=1.25 m/s2,垂向加速度閾值Tz=1.6 m/s2,P0取為10%,則手機第一類異常值位置如圖6中藍色區(qū)域(幅值為1位置)。
(2)依據(jù)“3σ準(zhǔn)則”識別手機檢測數(shù)據(jù)一階變化率超限位置,手機第二類異常值分布位置如圖6中紅色部分(幅值為0.5位置)。
(3)針對手機加速度傳感器信噪比低引起的隨機誤差,依據(jù)小波分析將手機檢測數(shù)據(jù)分解為低頻成份和細節(jié)成份,基于手機采樣頻率100 Hz和影響人體舒適度的頻率范圍0.5~80 Hz確定分解層數(shù)n=8,選擇尺度大小為2的Daubechies小波作為基小波,以手機垂向加速度為例,第7層、第8層細節(jié)成份幅值較小包含隨機誤差,其分解效果如圖7所示。
圖6 手機檢測數(shù)據(jù)異常值分布位置Fig.6 Distribution of abnormal value of mobile phone detection data
(1)根據(jù)第4節(jié)異常值處理方法,因手機檢測數(shù)據(jù)第一類異常值嚴(yán)重“失真”,采取區(qū)段刪除將手機檢測數(shù)據(jù)第一類異常值予以剔除,如圖8所示。
圖7 手機檢測數(shù)據(jù)小波分解Fig.7 Wavelet decomposition of mobile phone detection data
(2)針對手機檢測數(shù)據(jù)第二類異常值,其含有車體振動響應(yīng)有效成份,將識別出的第二類異常值采用中值濾波依次處理,設(shè)置移動窗口N=5,其濾除效果如圖9所示。
圖8 剔除第一類異常值后手機檢測數(shù)據(jù)Fig.8 Detection data after eliminating the first kind of abnormal value
圖9 剔除第二類異常值后手機檢測數(shù)據(jù)Fig.9 Detection data after eliminating the second kind of abnormal values
(3)根據(jù)第4節(jié)小波去噪原理,設(shè)置半軟閾值將細節(jié)成份進行閾值量化,將隨機誤差成份濾除而保留手機檢測數(shù)據(jù)有效成份,并將低頻成分和細節(jié)成份逐層卷積求和實現(xiàn)重構(gòu),其處理效果如圖10所示。
對比濾波前后手機檢測數(shù)據(jù)局部細節(jié),選取圖8,圖10中第一個運行區(qū)間[0,108]s手機檢測數(shù)據(jù),如圖11所示,經(jīng)中值濾波和小波濾波后,數(shù)據(jù)“毛刺”和隨機誤差被剔除。
圖10 小波分析濾波后手機檢測數(shù)據(jù)Fig.10 Mobile phone detection data after wavelet analysis filtering
圖11 小波分析濾波后局部手機數(shù)據(jù)對比Fig.11 Comparison of local mobile phone data after wavelet analysis filtering
因手機檢測數(shù)據(jù)異常值由多種原因引起,本文設(shè)置了相適應(yīng)的異常值識別方法,可準(zhǔn)確地識別出3種類型異常值的分布位置。同時為更好地濾除不同類型異常值,設(shè)置了相對應(yīng)的剔除方法,為正確評價軌道平順狀態(tài)和車輛運行舒適性提供數(shù)據(jù)保障。本文研究可得以下結(jié)論:
(1)通過設(shè)置移動窗口N=100,設(shè)置橫向、縱向、垂向加速度閾值,當(dāng)P>P0可定義為第一類異常值;將手機檢測數(shù)據(jù)一階變化率結(jié)合“3σ準(zhǔn)則”,若yi>μ+3σ或yi<μ-3σ可定義為第二類異常值;基于小波分析將手機檢測數(shù)據(jù)分解為低頻成份和細節(jié)成份,其中幅值較小的細節(jié)成份含有因傳感器信噪比低引起的隨機誤差。
(2)提出了3種異常值適應(yīng)性剔除方法:因手機受較大干擾引起第一類異常值,可予以剔除;因手機測試過程中偶然干擾引起第二類異常值,其含有車體振動有效成份,基于中值濾波濾除第二類異常值;因傳感器信噪比低引起的隨機誤差可基于小波濾除。
(3)可實現(xiàn)高頻次檢測車體振動響應(yīng),彌補軌檢車檢測周期較長的不足。