杜成飛
(西南交通大學(xué) 電氣工程學(xué)院,成都 611756)
保障工務(wù)作業(yè)人員的人身安全是鐵路運(yùn)輸管理的一項(xiàng)重要內(nèi)容[1],現(xiàn)有的人工監(jiān)控方式存在成本高、范圍小、易受環(huán)境因素影響等缺點(diǎn),由于工作失誤,人身安全事故的案例時有發(fā)生:(1)2010年5月22日14 時29 分,西昌工務(wù)段在成昆線九里~燕崗站間進(jìn)行補(bǔ)修作業(yè)時,2 名勞務(wù)工下道避車不及時,被通過的44116次貨運(yùn)列車碰撞死亡.(2)2014年5月13日4 時05 分,上海局杭州工務(wù)段在滬昆下行線衢州~后溪街站間進(jìn)行探傷作業(yè)時,3 名作業(yè)人員被反方向運(yùn)行的中鐵電化局運(yùn)管公司杭州維管段接觸網(wǎng)作業(yè)車撞上,造成2 人死亡,1 人重傷[2].隨著微電子、網(wǎng)絡(luò)及傳感器技術(shù)的不斷發(fā)展,人類行為狀態(tài)的實(shí)時連續(xù)捕獲與采集已經(jīng)非常便利,對這些行為數(shù)據(jù)進(jìn)行分析,有助于深入理解人的行為模式,在鐵路工務(wù)安全監(jiān)測領(lǐng)域具有應(yīng)用價值.
早期人員行為識別主要采用基于邏輯規(guī)則的方法,這種方法無法處理數(shù)據(jù)中包含的噪聲,模型構(gòu)建困難,識別能力較弱,因此現(xiàn)在大量行為識別研究工作采用機(jī)器學(xué)習(xí)的方法[3].機(jī)器學(xué)習(xí)是指通過計(jì)算機(jī)學(xué)習(xí)數(shù)據(jù)中的內(nèi)在規(guī)律性信息,獲得新的經(jīng)驗(yàn)和知識,以提高計(jì)算機(jī)的智能性,使計(jì)算機(jī)能夠像人那樣去決策.行為識別問題通常也看做機(jī)器學(xué)習(xí)中的分類問題,近年來主要的分類算法有決策樹(Decision Tree)、隨機(jī)森林(Random Forest)、K 最近鄰(K-Nearest Neighbor,KNN)、樸素貝葉斯(Na?ve Bayes)、支持向量機(jī)(Support Vector Machine,SVM)、邏輯回歸(Logistic Regression)、神經(jīng)網(wǎng)絡(luò)(Neural Networks)等.
根據(jù)應(yīng)用領(lǐng)域的不同,目前存在大量面向行為識別的方法,從行為監(jiān)測的角度分類,可以分為基于視覺的行為識別和基于傳感器的行為識別.
基于視覺的行為識別分為基于可見光波段的人體行為識別和基于紅外波段的人體行為識別兩種.由于可見光波段的人體行為數(shù)據(jù)易于獲取,基于該波段的人體行為識別研究開始較早,Zhang 等人[4]通過用光流表征運(yùn)動信息來定位感興趣區(qū)域,然后使用其方向梯度和光流直方圖來描述該區(qū)域,最后利用SVM 分類器對人體的各種動作類型進(jìn)行分類.Zhang 等人[5]利用基于SIFT 特征的ASIFT 進(jìn)行關(guān)鍵點(diǎn)軌跡表達(dá)以獲得關(guān)于人體行為動作的全局時空信息,再通過LDA 描述特征,最后由K-means 進(jìn)行分類以識別人體行為.Sowmya[6]使用BOF (Bag Of Features)算法,對建筑工人爬梯,砌磚,木工,繪畫和抹灰工作進(jìn)行了識別,準(zhǔn)確率為95%,該算法在KTH 數(shù)據(jù)集下的準(zhǔn)確率為96%.由于基于可見光波段的人體行為識別系統(tǒng)容易受到光照變換的影響,而且在弱光照環(huán)境下不能很好地進(jìn)行人體行為識別,同時還存在遮擋以及可能的隱私泄露等其他影響因素,因此近年來基于紅外波段的人體行為識別研究越來越受到學(xué)界的重視.Jiang 等人[7]首次將三維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于紅外人體行為識別.Liu 等人[8]提出了基于光流累計(jì)圖的全局時空信息特征表達(dá),實(shí)現(xiàn)了InfAR 數(shù)據(jù)集下79.25%的準(zhǔn)確率.
基于傳感器的行為識別方法由于不受場景、光線的限制,使用靈活,故在行為識別中得到了最為廣泛的應(yīng)用.Huang 等人[9]使用決策樹、隨機(jī)森林、SVM 等三種算法對生活中5 類行為進(jìn)行了分類識別,并研究了腰部不同佩戴位置對于識別率的影響.Ravì等人[10]提出了一種深度學(xué)習(xí)方法,它將從慣性傳感器數(shù)據(jù)中學(xué)到的特征與來自一組淺特征的補(bǔ)充信息相結(jié)合,實(shí)現(xiàn)了準(zhǔn)確和實(shí)時的行為分類.Cardoso 等人[11]為了解決靜態(tài)數(shù)據(jù)集下識別率較高,但在新輸入數(shù)據(jù)集下識別率較低的問題,提出了在線半監(jiān)督學(xué)習(xí),讓標(biāo)簽與非標(biāo)簽數(shù)據(jù)持續(xù)不斷地訓(xùn)練模型,提高了對新用戶行為的識別率.Khan 等人[12]通過單個三軸加速度傳感器對工人行為識別做了研究,實(shí)現(xiàn)了實(shí)采數(shù)據(jù)集下94%的準(zhǔn)確率,并證明傳感器佩戴于腰部位置識別效果是最好的.Ward 等人[13]模擬“木工車間”裝配任務(wù),通過在手臂兩個位置安裝傳感器和麥克風(fēng),對鋸切,錘擊,銼削,鉆孔,打磨,打磨,打開抽屜,擰緊螺絲,轉(zhuǎn)動螺絲刀等9 種動作做了研究,對于加速度值和聲音分別采用隱馬爾科夫模型(HMMS)和線性判別分析法(LDA),得出了在用戶依賴下98%,用戶無關(guān)下87%,用戶適應(yīng)下95%的識別準(zhǔn)確率.Mekruksavanich 等人[14]研究了辦公室久坐行為,使用智能手表中的加速度計(jì)和陀螺儀,通過WEKA 中的分類算法,得出了最高93.57%的識別率.
綜上來看,基于視覺的行為識別由于對光線、視角的要求較高,且不具備靈活便攜性,不適合鐵路工務(wù)場景下的行為識別,因此本文選擇基于加速度傳感器的方法,分析并模擬了7 種鐵路工務(wù)人員的常見行為,提取其時、頻域特征,最終通過WEKA 平臺完成了分類與測試,整體研究思路如圖1所示.
圖1 研究思路流程圖
本文選取鐵軌探傷工為代表,對其行為進(jìn)行研究.根據(jù)媒體資料[15],可以看出鐵路探傷工的動作頻率較低,種類也比較固定,主要分為以下七類:上道、下道、行走、跑步、下蹲、起立、站立,它們的特點(diǎn)如表1所示.
表1 探傷工人行為類型及特點(diǎn)
本文對人體行為數(shù)據(jù)進(jìn)行采集的傳感器模塊型號為BWT901CL,模塊集成了三軸加速度計(jì)、三軸陀螺儀、三軸地磁場傳感器,內(nèi)置電池和藍(lán)牙,可實(shí)時給上位機(jī)傳送測量的數(shù)據(jù).本文采集的是三軸加速度數(shù)據(jù).
文獻(xiàn)[16]通過研究大量文獻(xiàn),發(fā)現(xiàn)將加速度傳感器佩戴在人身體的腰部,比其它位置更穩(wěn)固,也更加能反映人整體的運(yùn)動情況.本文所研究的行為類型均為全身性行為,因此采用腰部固定的方式,如圖2所示.
圖2 傳感器BWT901CL 與佩戴方式
1.3.1 傾斜矯正
由于傳感器模塊在不同人體上固定的位置會略有偏差,為避免由此帶來的誤差,需要進(jìn)行坐標(biāo)系變換.如圖3所示,O-XYZ 為設(shè)備坐標(biāo)系,相對于設(shè)備的位置不變;O-X’Y’Z’為觀察坐標(biāo)系,其中OX’軸正方向?qū)?yīng)于人體前進(jìn)方向.
圖3 設(shè)備坐標(biāo)系與觀察坐標(biāo)系
設(shè)α1β1γ1α2β2γ2α3β3γ3 分別為觀察坐標(biāo)系的軸OX’ OY’ OZ’在設(shè)備坐標(biāo)系下與OX OY OZ 軸的夾角,根據(jù)坐標(biāo)轉(zhuǎn)換公式(1)即可將測量值(x y z)轉(zhuǎn)換為統(tǒng)一的觀察坐標(biāo)系下的值(x’ y’ z’).
1.3.2 去噪
傳感器采集到的運(yùn)動數(shù)據(jù)不僅包含了人體運(yùn)動產(chǎn)生的加速度,同時也不可避免的含有一些噪聲,主要有:傳感器的固有噪聲、傳感器在運(yùn)動中的晃動、重力加速度的影響產(chǎn)生的噪聲,為保證后面工作的順利進(jìn)行,需要對噪聲進(jìn)行消除[17].
本文采用移動均值濾波算法對數(shù)據(jù)進(jìn)行去噪處理.移動均值濾波算法是一種典型的線性濾波算法,對周期性噪聲干擾有良好的抑制作用.濾波所得的信號序列中第n個點(diǎn)的值yy(n),等于原始信號中第n個點(diǎn)y(n)及其相鄰M個點(diǎn)的均值,靠近頭尾部分的點(diǎn)在計(jì)算時,窗長依次減小,如公式(2)所示.
1.3.3 分割與標(biāo)記
由于后續(xù)步驟中需要提取特征值,而特征值一般都是基于統(tǒng)計(jì)量的,這意味著需要加窗處理,將采集到的連續(xù)信號序列分割成有限的數(shù)據(jù)集合.根據(jù)大量研究顯示,窗長度對于行為的識別是很重要的,它應(yīng)該至少能包括行為在一個周期內(nèi)的數(shù)據(jù)[18,19],具體的長度根據(jù)傳感器的采樣頻率以及行為周期大小決定,本文使用的是矩形窗.為避免錯誤標(biāo)記,窗口應(yīng)該保持一定的重疊,有研究[20,21]表明,50%的重疊率對于特征選擇來說是最佳的,這意味著每一個窗口內(nèi)有50%的數(shù)據(jù)和相鄰窗口中是一樣的.分割后的每個樣本中數(shù)據(jù)點(diǎn)個數(shù)即為窗長,每個樣本都給定一個標(biāo)簽,表示該樣本的行為類型.
直接使用來自于傳感器的數(shù)據(jù)通常是不可能的,因此可以采用提取特征值的方式,供機(jī)器學(xué)習(xí)使用,選擇合適的特征值是實(shí)現(xiàn)高效識別的保證.本文對X、Y、Z 三軸的數(shù)據(jù)分別在時域和頻域提取了以下7 種特征.其中N為窗口長度,Ai表示該樣本中的第i個值.
(1) 均值
均值mean的計(jì)算公式為式(3),反映了加速度值的平均大小.
(2) 標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差std的計(jì)算公式為式(4),反映了動作的波動程度.
(3) 最大值
max是窗口內(nèi)加速度數(shù)據(jù)的最大值,它代表了加速度值變化區(qū)間的上限.見式(5).
(4) 四分位距
四分位距IQR的計(jì)算公式為式(6),其中Q3和Q1表示將將整個窗口中的數(shù)據(jù)按升序排列并四等分之后,第三和第一個等分點(diǎn)處的數(shù)據(jù).IQR反映了窗口內(nèi)加速度值的分散程度,可以避免特殊值產(chǎn)生的干擾,對均值大小相近的行為有較好的區(qū)分效果.
(5) 任意兩軸的相關(guān)系數(shù)
任意兩軸的相關(guān)系數(shù)corr的計(jì)算公式為式(7),其中A和A’分別表示X、Y、Z 三軸中任意兩軸的數(shù)據(jù),反映了任意兩軸數(shù)據(jù)之間的線性相關(guān)程度.
(6) 偏度
峰度skewness的計(jì)算公式為式(8),反映了加速度波形的左右偏移程度.
(7) FFT 系數(shù)
通過快速傅里葉變換(FFT)將時域內(nèi)的加速度數(shù)值轉(zhuǎn)換到頻域范圍內(nèi),鐵路工務(wù)人員的動作頻率較低,因此只提取前三維系數(shù),對應(yīng)公式(9)中k=0,1,2 時計(jì)算的結(jié)果.
本文選取了4 種在行為識別研究中廣泛應(yīng)用的分類器進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn),分別是C4.5 決策樹、隨機(jī)森林、KNN、SVM.KNN 算法的優(yōu)勢在于分類思想簡單,且易于實(shí)現(xiàn)[17].C4.5 是一種較為成熟的決策樹算法,運(yùn)算速度快,分類結(jié)果直觀,實(shí)用性強(qiáng)[22].隨機(jī)森林是一種組合分類算法,通過在樹的生長過程中引入隨機(jī)性,降低了決策樹之間的相關(guān)度從而降低集成學(xué)習(xí)算法的泛化誤差[23].SVM 是基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小化原理的監(jiān)督學(xué)習(xí)算法,主要優(yōu)勢在于減小了學(xué)習(xí)機(jī)的復(fù)雜性和訓(xùn)練集的誤差并具有良好的泛化能力[14].
實(shí)驗(yàn)共采集了8 人的加速度數(shù)據(jù),性別男,年齡范圍20~28 歲,身高范圍1.6~1.8 m,體重范圍50~80 kg.
為了獲知坐標(biāo)系的變換矩陣,在采集每人的數(shù)據(jù)之前,需要按照表2的要求,完成向量k和向量i的測定,采集過程分別如圖4(a) 和(b) 所示,理論上k與i之間的夾角為90°,但實(shí)際測量中人體姿態(tài)很難保持絕對的標(biāo)準(zhǔn),因此夾角在87°~93°范圍內(nèi)的,都視為合理的值,向量j的計(jì)算公式為式(10).
圖4 向量k 與i 的測定
表2 坐標(biāo)系變換矩陣需要的采集量及要求
每人完成7 種動作,每種動作采集50 個樣本,實(shí)驗(yàn)是在與現(xiàn)場基本相同的條件下完成的,其中上道和下道的坡度符合鐵路路肩的坡度標(biāo)準(zhǔn),其余動作均在標(biāo)準(zhǔn)鐵軌下完成.如圖5所示,從左到右依次為下道、起立、跑步、下蹲、站立、上道、行走.
圖5 七種行為數(shù)據(jù)的采集
實(shí)驗(yàn)預(yù)處理階段主要的參數(shù)設(shè)置如表3所示,其中濾波器窗長是通過MATLAB 軟件對采集數(shù)據(jù)進(jìn)行濾波實(shí)驗(yàn)后,確定的一個能使波形平滑但又不過于失真的值.由于樣本采集到的動作完成時間最多不超過2 s,所以滑動窗口取128,即2.56 s,足夠包含至少一個動作,同時符合2 的倍數(shù)的要求,便于FFT 的計(jì)算.
表3 預(yù)處理階段主要參數(shù)設(shè)置
本文使用懷卡托大學(xué)的開源機(jī)器學(xué)習(xí)平臺WEKA,選擇J48、RandomForest、IBk 和LibSVM 四種分類器,首先根據(jù)網(wǎng)格搜索法GridSearch 找到最優(yōu)參數(shù),如表4所示,然后通過10 折交叉驗(yàn)證,具體做法是將帶有真實(shí)行為標(biāo)簽的加速度特征值集合分成10 份,輪流將每1 份作為測試集,其余9 份作為訓(xùn)練集,將得到10 次分類精度的平均值作為該方法的精度估計(jì)[22].表5給出了四種算法對于這7 種行為的平均識別準(zhǔn)確率,表6~表9中是各算法具體的分類混淆矩陣,行表示的是樣本的真實(shí)類型,列表示的是分類器預(yù)測的類型,例如表6第一行數(shù)據(jù)表示:240 個下道樣本中,有237 個被識別為下道,1 個被識別為跑步,1 個被識別為站立,以及1 個被識別為上道.
表4 分類器與參數(shù)設(shè)置
從表5所示的平均識別準(zhǔn)確率來看,四種算法對于特定的7 種動作均有較高的識別率,其中SVM 算法是表現(xiàn)最好的,而C4.5 決策樹算法相對最弱.
表5 四種算法的平均識別準(zhǔn)確率(%)
由表6可知,C4.5 決策樹算法建立的模型在分類時,對每一種類型的樣本均存在一定的錯誤分類.這主要是因?yàn)闆Q策樹的生長過程采用的是貪婪算法,如果不控制樹的生長,會很容易出現(xiàn)過擬合,為了解決這個問題,C4.5 算法包含了剪枝的功能,但是剪枝又會增加一定的錯誤率,因此是一種折中處理,最后得到的是一棵綜合指標(biāo)較優(yōu)的樹,這個結(jié)果是合理的.
表6 C4.5 決策樹的分類混淆矩陣
由表5、表7可知,隨機(jī)森林算法無論是總體平均識別率,還是對于各類型樣本的分類正確率,均優(yōu)于C4.5 決策樹.隨機(jī)森林通過隨機(jī)對訓(xùn)練樣本、特征值進(jìn)行自舉重采樣,并建立很多決策樹組成“森林”,最后讓多棵樹投票進(jìn)行決策,相較于決策樹算法,具有更好的泛化能力和分類表現(xiàn).
表7 隨機(jī)森林的分類混淆矩陣
由表8可知,KNN 算法在本次實(shí)驗(yàn)條件下具有很好的分類表現(xiàn),除了“起立”和“下蹲”兩種行為會出現(xiàn)混淆以外,其余行為均識別正確.但是,由于KNN 在進(jìn)行分類時,需要將新樣本與所有已知樣本進(jìn)行比較和排序,當(dāng)訓(xùn)練樣本數(shù)量較大時,計(jì)算量會很大,這是在推廣到實(shí)際應(yīng)用時應(yīng)該考慮到的因素.
表8 KNN 的分類混淆矩陣
表9展示了SVM 算法的分類結(jié)果,可見容易混淆的行為仍然是“起立”和“下蹲”.在實(shí)驗(yàn)過程中發(fā)現(xiàn),SVM 的表現(xiàn)主要受懲罰系數(shù)cost、gamma 系數(shù)、核函數(shù)的選擇以及樣本是否過歸一化的影響,表中給出的是經(jīng)過參數(shù)調(diào)優(yōu)和歸一化之后得到的最優(yōu)結(jié)果.
表9 SVM 的分類混淆矩陣
從4 個混淆矩陣來看,鐵路探傷工7 種主要行為中,“起立”和“下蹲”是最容易出現(xiàn)混淆的,原因主要是這兩類行為本身比較類似,現(xiàn)有特征值代表性還不夠,在今后的工作中應(yīng)該提取更加能反映二者特性的特征值或者進(jìn)一步擴(kuò)大數(shù)據(jù)集.本文研究的4 種算法對其余5 種行為的識別均較好,在實(shí)際的工程應(yīng)用中,可根據(jù)系統(tǒng)的架構(gòu)、軟硬件性能等具體情況,選取最合適的算法.
本文使用加速度傳感器,采集了模擬條件下鋼軌探傷工的7 種行為數(shù)據(jù),提取了27 維動作特征,通過對比C4.5 決策樹、隨機(jī)森林、KNN、SVM 四種分類算法采用10 折交叉驗(yàn)證得出的識別結(jié)果,SVM 算法的識別準(zhǔn)確率最高,為99.2%,在該數(shù)據(jù)集下有非常好的識別效果.該研究為消除鐵路現(xiàn)場作業(yè)人員的行為安全隱患具有一定工程應(yīng)用價值.