郭嘉強(qiáng) 黃敬 周武 時(shí)瑞浩 陳文慶
(廣州汽車集團(tuán)股份有限公司汽車工程研究院,廣州 511434)
輪胎壓力監(jiān)測(cè)系統(tǒng)(Tire Pressure Monitoring System,TPMS)[1]對(duì)胎壓和胎溫等進(jìn)行全天候?qū)崟r(shí)檢測(cè),并在滿足一定的時(shí)間要求和一定的閾值條件時(shí)發(fā)出報(bào)警。目前,該系統(tǒng)對(duì)輪胎的快速漏氣具備較好的判斷能力,但當(dāng)輪胎慢速漏氣發(fā)生時(shí),輪胎壓力下降至報(bào)警胎壓通常需要較長(zhǎng)時(shí)間,慢漏氣期間行駛不僅會(huì)加速輪胎磨損、容易引起爆胎,且影響車輛操縱穩(wěn)定性和行車安全,容易造成嚴(yán)重的交通事故[2]。因此,提前發(fā)現(xiàn)輪胎慢漏氣現(xiàn)象具有重要意義。
文獻(xiàn)[3]以某整車企業(yè)純電動(dòng)汽車的遠(yuǎn)程通信終端(Telematics BOX,TBOX)實(shí)時(shí)采集的輪胎時(shí)間序列數(shù)據(jù)為基礎(chǔ),經(jīng)過數(shù)據(jù)預(yù)處理、構(gòu)建派生字段,提出基于權(quán)重函數(shù)的輪胎慢漏氣預(yù)警算法,基于67 臺(tái)慢漏氣的車輛樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練和模型預(yù)測(cè),準(zhǔn)確率接近80%。但是,如何進(jìn)一步提高模型預(yù)測(cè)準(zhǔn)確率、縮短模型預(yù)測(cè)時(shí)間,需要進(jìn)一步研究。
本文基于TBOX 實(shí)時(shí)采集輪胎數(shù)據(jù),提出一種基于機(jī)器學(xué)習(xí)的輪胎慢漏氣實(shí)時(shí)預(yù)警方法,通過數(shù)據(jù)預(yù)處理、特征值構(gòu)建、數(shù)據(jù)樣本標(biāo)注、模型訓(xùn)練、模型評(píng)估、模型選優(yōu)、模型參數(shù)優(yōu)化和預(yù)測(cè)模型工程化等步驟[4],實(shí)現(xiàn)對(duì)車輛慢漏氣的實(shí)時(shí)預(yù)警,并通過對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行數(shù)據(jù)分析,驗(yàn)證深度學(xué)習(xí)模型的可行性和可靠性。
本文基于車聯(lián)網(wǎng)系統(tǒng)(由車載網(wǎng)絡(luò)終端、車聯(lián)網(wǎng)平臺(tái)、大數(shù)據(jù)平臺(tái)等組成),按照GB/T 32960—2016《電動(dòng)汽車遠(yuǎn)程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范》[5]的要求,將TPMS 的數(shù)據(jù)通過CAN 總線傳輸至TBOX,并經(jīng)移動(dòng)網(wǎng)絡(luò)以一定周期實(shí)時(shí)傳輸至由Hadoop 和Spark 等組成的企業(yè)大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)胎壓系統(tǒng)狀態(tài)、輪胎壓力、輪胎溫度、輪胎系統(tǒng)告警等TPMS 時(shí)間序列數(shù)據(jù)采集[6]。
為了提升模型的預(yù)測(cè)精度,需對(duì)采集到的數(shù)據(jù)進(jìn)行清洗,包含系統(tǒng)偶發(fā)故障時(shí)發(fā)出的無效值或異常值、車輛各輪胎胎壓完全相同等不可能的數(shù)據(jù)組合、補(bǔ)胎過程中胎壓監(jiān)測(cè)系統(tǒng)測(cè)得的胎壓數(shù)據(jù)、車端已識(shí)別的快漏氣等數(shù)據(jù)。采用滑動(dòng)窗口均值[7]對(duì)胎壓數(shù)據(jù)進(jìn)行均值濾波,以消除異常數(shù)據(jù),滑動(dòng)窗口大小為3幀數(shù)據(jù)。
輪胎內(nèi)氣體溫度對(duì)輪胎壓力有較大影響[8],數(shù)據(jù)建模前需消除溫度對(duì)胎壓變化的影響,根據(jù)理想氣體定律得出胎壓溫度補(bǔ)償模型,同時(shí)將不同溫度下的胎壓數(shù)據(jù)轉(zhuǎn)換為25 ℃時(shí)的等效胎壓。如圖1所示,通過胎壓溫度補(bǔ)償,可消除溫度影響,且如果輪胎并未漏氣,則補(bǔ)償壓力曲線會(huì)更為平滑。胎壓溫度補(bǔ)償計(jì)算過程如下:
圖1 溫度補(bǔ)償前、后胎壓對(duì)比
理想氣體定律為:
式中,P為溫度為T時(shí)采集的胎壓數(shù)據(jù);V為輪胎中空氣體積;N為輪胎中空氣的物質(zhì)的量;R為熱力學(xué)常數(shù);T為輪胎中空氣的絕對(duì)溫度。
假定由放氣引起的任何輪胎尺寸變化可忽略,且輪胎體積固定,則式(1)可改寫為:
式(2)右側(cè)的所有量為固定值,故壓力與溫度成正比。引入2 個(gè)新的量:補(bǔ)償胎壓壓力C和標(biāo)稱溫度T0,可建立以下關(guān)系:
選擇預(yù)設(shè)固定值,例如25 ℃作為標(biāo)稱溫度T0,則可將不同溫度下的胎壓數(shù)據(jù)轉(zhuǎn)換為25 ℃時(shí)的等效胎壓p:
式中,P0=100 kPa為大氣壓力;temp為胎溫。
由圖1 可以看出,受輪胎振動(dòng)或傳感器采集誤差等的影響,胎壓溫度補(bǔ)償后胎壓仍存在波動(dòng),通過大數(shù)據(jù)統(tǒng)計(jì)得出該波動(dòng)值的絕對(duì)值為PT=10 kPa。車輛停車休眠期間因無胎壓數(shù)據(jù)采集,當(dāng)此時(shí)間段內(nèi)胎壓變化值大于閾值PT,且停車重新起動(dòng)時(shí)車端胎壓無低壓預(yù)警時(shí),缺失數(shù)據(jù)需要按照等差數(shù)列方式進(jìn)行數(shù)據(jù)插值。
選取低壓報(bào)警車輛數(shù)據(jù),數(shù)據(jù)中可能包含快漏氣和慢漏氣,本文主要針對(duì)慢漏氣故障進(jìn)行預(yù)警,需要標(biāo)記慢漏氣故障數(shù)據(jù),同時(shí)剔除快速漏氣故障數(shù)據(jù)。
假設(shè)數(shù)據(jù)預(yù)處理后某輪胎慢漏氣片段時(shí)間序列數(shù)據(jù)集為[t0,p0],[t1,p1],…,[tn-1,pn-1],其中n為數(shù)據(jù)集樣本的數(shù)量,若滿足下面2個(gè)條件之一,則該次漏氣故障視為慢漏氣故障:
a. 第ti時(shí)刻與第ti-1時(shí)刻的胎壓變化率小于20 kPa/min(該閾值由各企業(yè)TPMS 軟件標(biāo)定得出)。
b.第ti時(shí)刻與第ti-1時(shí)刻時(shí)間差小于30 min;當(dāng)二者時(shí)間差大于30 min,且ti時(shí)刻胎壓不低于車端的胎壓低壓報(bào)警閾值(車輛休眠期間不回傳數(shù)據(jù),這期間胎壓降低到低壓報(bào)警閾值),則不視為慢速漏氣。
針對(duì)基于上述規(guī)則處理后的胎壓數(shù)據(jù),進(jìn)行慢漏氣數(shù)據(jù)片段標(biāo)注:自車輪胎胎壓互減,將任意一個(gè)差值的絕對(duì)值連續(xù)3次大于閾值PT的時(shí)刻作為車輛慢漏氣數(shù)據(jù)片段的起始點(diǎn),胎壓第一次低壓報(bào)警的前一時(shí)刻作為慢漏氣數(shù)據(jù)片段的終點(diǎn)。為了便于數(shù)據(jù)建模,車輛慢漏氣期間,每輛車分別只選取一個(gè)慢漏氣和一個(gè)正常輪胎數(shù)據(jù)片段,如圖2所示,右后輪胎標(biāo)記為慢漏氣輪胎,左后輪胎為正常輪胎,為了縮短模型預(yù)測(cè)時(shí)間,盡早預(yù)測(cè),截取的慢漏氣數(shù)據(jù)片段是起始點(diǎn)和終點(diǎn)之間的部分?jǐn)?shù)據(jù)片段。基于該方法從大數(shù)據(jù)平臺(tái)抽取1 000 臺(tái)發(fā)生過慢漏氣的車輛,將其數(shù)據(jù)標(biāo)注為數(shù)據(jù)樣本。
圖2 輪胎慢漏氣數(shù)據(jù)片段標(biāo)注示意
基于3.1 中數(shù)據(jù)預(yù)處理后輪胎慢漏氣片段n個(gè)時(shí)間序列數(shù)據(jù),進(jìn)行輪胎慢漏氣特征值計(jì)算。
3.2.1 胎壓累計(jì)變化量
用Δp表示該慢漏氣數(shù)據(jù)片段胎壓的累計(jì)變化量,采用慢漏氣數(shù)據(jù)片段終點(diǎn)前3 個(gè)數(shù)據(jù)和起始點(diǎn)連續(xù)采集3個(gè)胎壓數(shù)據(jù)的均值差計(jì)算:
3.2.2 胎壓變化率
用k表示慢漏氣數(shù)據(jù)片段曲線的斜率、b表示截距,di、Di分別表示誤差、誤差平方和,pˉ、tˉ為均值,采用最小二乘法擬合直線,通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配,使求得的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間誤差的平方和最小:
設(shè)擬合直線為:
設(shè)誤差為:
采用最小二乘法擬合直線:
對(duì)式(8)求偏導(dǎo),可得:
3.2.3 胎壓標(biāo)準(zhǔn)差
用標(biāo)準(zhǔn)差(Standard Deviation,STD)Dst反映慢漏氣數(shù)據(jù)片段胎壓偏離平均值的離散程度:
隨機(jī)森林(Random Forest,RF)算法是一種基于分類回歸樹(Classification and Regression Tree,CART)和引導(dǎo)聚集(Bootstrap aggregating,Bagging)方法的集成算法,能夠提供良好的預(yù)測(cè)性能[9]。研究表明,RF 算法具有較強(qiáng)的抗噪聲和過擬合能力[10]。因此從現(xiàn)有的機(jī)器學(xué)習(xí)算法訓(xùn)練模型邏輯回歸(Logistic Regression,LR)、RF、向量機(jī)(Support Vector Machine,SVM)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)等模型中選取RF 算法建立輪胎慢漏氣預(yù)測(cè)模型?;跇?biāo)注數(shù)據(jù)樣本和3.2 節(jié)部分特征值計(jì)算的數(shù)據(jù)集表示為:
式中,m為每個(gè)樣本的特征數(shù)量;Xi為特征值;yi為慢漏氣標(biāo)志符,yi=0 表示輪胎正常,yi=1 表示輪胎漏氣。
數(shù)據(jù)集示例如表1所示。
表1 數(shù)據(jù)集示例
將數(shù)據(jù)集按照7∶3的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集,1 000 臺(tái)車輛樣本數(shù)據(jù)劃分的訓(xùn)練集包括700 個(gè)漏氣片段和700 個(gè)正常片段,測(cè)試集包括300個(gè)漏氣片段和300個(gè)正常片段。
其中訓(xùn)練集SL記為:
式中,L為訓(xùn)練集的數(shù)量。
具體的RF算法如圖3所示,步驟如下:
圖3 RF模型算法框架
a.采用自舉法(Bootstrap)對(duì)訓(xùn)練集SL進(jìn)行隨機(jī)采樣,得到數(shù)量為K的子訓(xùn)練樣本集合{T1,T2,...,TK}和數(shù)量為K的測(cè)試樣本集合;
b.利用步驟a 得到的新的訓(xùn)練集分別建立多個(gè)分類決策樹模型M1、M2、……、MK;
c.將測(cè)試集代入訓(xùn)練好的決策樹模型中,得到K個(gè)分類結(jié)果分別為分類A、分類B……;
d.將所有決策樹的投票結(jié)果匯總,最多的類別作為RF模型的預(yù)測(cè)結(jié)果。
為了評(píng)估訓(xùn)練模型,引入混淆矩陣、準(zhǔn)確率、精確率、召回率、F1 分值、受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)等評(píng)價(jià)指標(biāo),將測(cè)試數(shù)據(jù)集(300個(gè)漏氣片段,300個(gè)正常片段)輸入訓(xùn)練好的模型進(jìn)行測(cè)試驗(yàn)證,結(jié)果如圖4和圖5所示。
圖4 RF模型訓(xùn)練指標(biāo)評(píng)估
RF 模型指標(biāo)評(píng)估結(jié)果中混淆矩陣真正例數(shù)量為300 個(gè),假正例數(shù)量為0,真負(fù)例數(shù)量為0,假負(fù)例數(shù)量為300 個(gè),預(yù)測(cè)全部正確;預(yù)測(cè)準(zhǔn)確率為100%,召回率為100%,F(xiàn)1 分值為1.00,查準(zhǔn)率為100%;正常的F1 分值為1;慢漏氣的F1 分值為1。以上指標(biāo)表明,選擇的RF模型表現(xiàn)較好。
由圖5 可以看出,ROC 曲線下面積(Area Under Curve,AUC)為1.00,選擇的RF模型表現(xiàn)良好。
首先利用隨機(jī)參數(shù)選擇模型確定模型參數(shù)的大致范圍,然后用交叉驗(yàn)證法與網(wǎng)格搜索法對(duì)模型算法進(jìn)行精確搜索[11],RF 模型需調(diào)優(yōu)超參數(shù)包含決策樹數(shù)量、決策樹最大深度、最小葉子節(jié)點(diǎn)樣本數(shù)量等,經(jīng)多輪優(yōu)化,最優(yōu)的模型參數(shù)為:決策樹數(shù)量為50 棵、樹最大深度為6 層、最小葉子節(jié)點(diǎn)樣本數(shù)量為15個(gè)等。選取其中一棵決策樹如圖6所示。
圖6 決策樹示例
將訓(xùn)練好的RF 模型部署到采用Spark、Kafka、Clickhouse、Redies 等組成的大數(shù)據(jù)計(jì)算集群,以便實(shí)現(xiàn)預(yù)測(cè)模型對(duì)車輛的實(shí)時(shí)預(yù)測(cè),具體步驟如圖7所示,大數(shù)據(jù)計(jì)算平臺(tái)基于新采集的車輛胎壓數(shù)據(jù)進(jìn)行數(shù)據(jù)異常值清洗、溫度補(bǔ)償、窗口函數(shù)過濾等數(shù)據(jù)預(yù)處理計(jì)算,然后自車輪胎胎壓兩兩相減篩選出任一胎壓差值絕對(duì)值連續(xù)N次大于閾值PT的車輛清單,判斷這些車輛是否已經(jīng)在緩存的車輛監(jiān)控清單中,如果不在清單中,新增慢漏氣數(shù)據(jù)片段起始時(shí)刻t0,并調(diào)用特征值計(jì)算,開始進(jìn)入模型預(yù)測(cè),輸出預(yù)測(cè)結(jié)果,同時(shí)新增車輛到車輛監(jiān)控清單中,周期循環(huán),直至pn+1-pn>PT時(shí),車輛退出慢漏氣監(jiān)控清單。當(dāng)模型連續(xù)N次預(yù)測(cè)輪胎慢漏氣時(shí),慢漏氣預(yù)警信息通過移動(dòng)網(wǎng)絡(luò)推送給用戶,及時(shí)提醒用戶檢查輪胎和進(jìn)行補(bǔ)胎操作。將輪胎慢漏氣模型預(yù)測(cè)結(jié)果輸入模型,利用數(shù)據(jù)閉環(huán)持續(xù)進(jìn)行模型訓(xùn)練,可以不斷提高模型的精度。
圖7 模型線上流程
從模型預(yù)測(cè)結(jié)果中隨機(jī)選取1 596 臺(tái)慢漏氣車輛,示例如表2所示。
表2 模型預(yù)測(cè)結(jié)果示例
以表2 中編號(hào)2 的車輛為例,車輛胎壓慢漏氣曲線如圖8 所示,9 月22 日6:26:14 時(shí)刻該車輛開始進(jìn)入預(yù)測(cè)模型,9 月23 日06:32:00 時(shí)刻模型預(yù)測(cè)為發(fā)生慢漏氣,持續(xù)時(shí)間為24.11 h,9 月29 日18:12:54車端發(fā)出胎壓過低告警,持續(xù)時(shí)間為179.78 h,模型預(yù)測(cè)平均比車端低壓告警時(shí)間提前了155.67 h。
圖8 車輛胎壓慢漏氣時(shí)序
針對(duì)模型預(yù)測(cè)慢漏氣的1 596 臺(tái)車輛,在模型預(yù)測(cè)成功后又發(fā)生輪胎低壓告警的車輛有1 565臺(tái),從這批車輛中隨機(jī)抽取200 臺(tái)車,經(jīng)過短信核實(shí),有198臺(tái)車發(fā)生了慢漏氣故障,綜合以上驗(yàn)證結(jié)果,訓(xùn)練模型預(yù)測(cè)準(zhǔn)確率達(dá)到98%以上。模型慢漏氣第一次預(yù)測(cè)時(shí)刻和車端第一次輪胎低壓報(bào)警數(shù)據(jù)對(duì)比分析如圖9 所示,汽車輪胎漏氣到模型成功預(yù)測(cè)時(shí)間均值接近34.7 h,模型成功預(yù)測(cè)時(shí)間比車端胎壓低壓告警時(shí)間平均提前了106.3 h。
圖9 輪胎慢漏氣時(shí)間對(duì)比
本文基于車聯(lián)網(wǎng)實(shí)時(shí)采集的胎壓系統(tǒng)數(shù)據(jù),提出一種基于機(jī)器學(xué)習(xí)的輪胎慢漏氣實(shí)時(shí)預(yù)警方法,首先對(duì)原始數(shù)據(jù)進(jìn)行異常數(shù)據(jù)清除、滑動(dòng)窗口均值濾波、溫度補(bǔ)償?shù)阮A(yù)處理,提高了模型精度,其次,采用單車輪胎胎壓自我比較法確定漏氣起始時(shí)刻進(jìn)行輪胎慢漏氣片段標(biāo)注,提高了標(biāo)注效率并過濾了正常車輛進(jìn)入計(jì)算模型,節(jié)約計(jì)算資源,最后構(gòu)建特征工程,選取RF機(jī)器學(xué)習(xí)算法進(jìn)行模型開發(fā)。
本文提出的機(jī)器學(xué)習(xí)算法根據(jù)車型TPMS 軟件標(biāo)定閾值(快漏氣閾值、低壓報(bào)警閾值等)不同選取輪胎慢漏氣數(shù)據(jù)樣本進(jìn)入車型輪胎慢漏氣預(yù)測(cè)模型算法訓(xùn)練,以便車型輪胎慢漏氣預(yù)測(cè)模型參數(shù)與車型TPMS 標(biāo)定值更好地適配;積累模型預(yù)測(cè)數(shù)據(jù)構(gòu)建數(shù)據(jù)閉環(huán)重新進(jìn)入模型訓(xùn)練,持續(xù)提高模型預(yù)測(cè)精度;模型算法車型驗(yàn)證準(zhǔn)確率接近98%,預(yù)測(cè)胎壓慢漏氣平均時(shí)間為34.7 h,比車端低壓告警平均時(shí)間提前了106.3 h。