王沛 陳勁杰
摘? 要:隨著我國經(jīng)濟的快速發(fā)展,從汽車大國到汽車強國的逐步轉變,汽車數(shù)量也急劇增加。本文針對輕型汽車實際道路行駛采集的數(shù)據(jù)(采樣頻率1Hz),處理為各個運動學片段,采用PCA結合K-means++聚類方法,對處理后數(shù)據(jù)樣本進行降維處理,分析其中主要特征成分,將各運動學片段依據(jù)綜合特征指標歸類,計算主要特征參數(shù),使用相關系數(shù)篩選典型特征片段。構建典型汽車行駛工況曲線。使用K-means聚類處理數(shù)據(jù)段,計算處理結果并分析與總體樣本特征偏差范圍,判斷工況曲線構建的合理性,是否符合世界WLTC工況標準。結合汽車標準行駛工況比較分析綜合特征指標差異。
關鍵詞:PCA;K-means++聚類;汽車標準行駛工況
中圖分類號:TP18? ? ?文獻標識碼:A
Abstract:With the rapid development of the Chinese economy,the number of cars has also increased dramatically,since the gradual transformation from a large automobile country to the car power.This paper focuses on the data collected from the actual road driving of the light vehicle (sampling frequency 1Hz),then processes the data into each kinematic segment.Using PCA combined with K-means++ clustering method,the processed data samples are subjected to dimensionality reduction processing.Then the main characteristic components are analyzed.Each kinematic segment is classified according to the comprehensive feature index.Then the main feature parameters are calculated.Lastly,the correlation feature is used to filter the typical feature segments.The typical vehicle driving condition curve is constructed.The K-means cluster is used to process the data segments.The processing results are calculated,and the deviation range from the overall sample characteristics is analyzed to determine the rationality of the construction of the working condition curve and whether it meets the world WLTC working condition standard.The characteristics and difference of the comprehensive characteristic indicators are compared and analyzed in combination with the standard driving conditions of the automobile.
Keywords:PCA;K-means++ clustering;automotive standard driving conditions
1? ?引言(Introduction)
在信息量丟失最小的前提下,主成分分析法可以將多個特征參數(shù)變量進行降維找出少數(shù)的幾個主成分。本文主要將PCA主成分分析和K-means算法結合,對處理后數(shù)據(jù)樣本進行降維處理[1],分析其中主要特征成分,將各運動學片段依據(jù)綜合特征指標歸類,計算主要特征參數(shù),使用相關系數(shù)篩選典型特征片段。構建典型汽車行駛工況曲線。對比傳統(tǒng)K-means和優(yōu)化后K-means++聚類處理數(shù)據(jù)段,計算處理結果并分析與總體樣本特征偏差范圍,判斷工況曲線構建的合理性。結合汽車標準行駛工況比較分析綜合特征指標差異。
2? ?總體設計路線(Overall design route)
所給數(shù)據(jù)是同一輛汽車在不同時間段的實際行駛數(shù)據(jù),數(shù)據(jù)量大約50萬條。根據(jù)相關研究文獻數(shù)據(jù),本文運用數(shù)學建模的方法進行篩選,使用插值方法、平滑處理方法(smooth函數(shù))、Excel過濾篩選功能進行數(shù)值預處理,由于主要研究的是工況曲線構建的合理性,所以對于以上的方法暫不贅述。之后對處理后的數(shù)據(jù)劃分為多個運動學片段,通過網(wǎng)上查找資料可知,將車輛從一個怠速開始到下一個怠速開始的運動定義為運動學片段,車輛的行程即可視為各種片段的組合。其中某些片段反映的交通狀況可能相同,不同的地理位置及時間和公路類型會出現(xiàn)相同的片段,有時高速公路上的片段可能和擁擠的城市中的片段完全一致[2]。將這些片段類型和交通狀況聯(lián)系起來,針對性地分析不同速度的運動形態(tài)。通過篩選數(shù)據(jù)中的怠速區(qū)間,對經(jīng)預處理后的數(shù)據(jù)進行后劃分成多個運動學片段,并結合汽車運動相關知識計算各運動學片段的運動參數(shù)指標。
5.2? ?工況驗證
將采集的行駛數(shù)據(jù)作為總體樣本數(shù)據(jù),選取平均速度V、加速段的平均加速度A減速段的平均加速度aa、怠速比例P、加速比例P。減速比例P15個特征參數(shù)作為判定準則,并基于K-means和融合優(yōu)化后的K-means++算法計算各特征參數(shù)向量[7],與構建的車輛行駛工況與總體樣本數(shù)據(jù)進行對比,各工況下的特征參數(shù)值,詳見表7。
經(jīng)過K-means和優(yōu)化后K-means++算法所計算的相關特征參數(shù)數(shù)據(jù)與整個樣本的總體樣本數(shù)據(jù)具有一定偏差,因此從中選擇一定的特征參數(shù)作為分析的指標,分別計算構建的道路行駛工況與道路行駛工況總樣本的相對誤差,根據(jù)所計算的結果來分析構建出的工況是否有效。誤差計算公式如下:
式中,——相對誤差;
——構建行駛工況特征參數(shù);
——總體樣本工況特征參數(shù)。
通過誤差計算公式計算出使用K-means和優(yōu)化后K-means++算法所計算的相關特征參數(shù)數(shù)據(jù)與整個樣本的總體樣本數(shù)據(jù)偏差,如圖5所示。
6? ?結論(Conclusion)
可見構建的行駛工況特性與總體樣本行駛工況特性有一定的偏差,但所取的五個特征參數(shù)能夠大部分反映行駛工況綜合特性,誤差率都控制在10%,屬于可接受范圍。使用K-means算法和優(yōu)化后K-means++進行比較,優(yōu)化后的K-means++算法在一定程度上相對于K-means聚類算法減小了與真實樣本數(shù)據(jù)的偏差值,計算結果更接近于總體樣本行駛工況。
在國際標準行駛工況中,我國直接采用歐洲的NEDC行駛工況,NEDC工況為基準所優(yōu)化標定的汽車,實際油耗與法規(guī)認證結果偏差越來越大,影響了政府的公信力(譬如對某型號汽車,該車標注的工信部油耗6.5升/100公里,用戶體驗實際油耗可能是8.5—10升/100公里)。另外,歐洲在多年的實踐中也發(fā)現(xiàn)NEDC工況的諸多不足,轉而采用世界輕型車測試循環(huán),但標準工況往常難以代表實際行駛工況。通過計算構建行駛工況與標準工況的偏差,可以分析了解各標準工況與實際行駛工況之間的差異。選取NEDC行駛工況和WLTC行駛工況進行比較,并選取工況時間、平均加速度、平均減速度、平均速度四個指標作為參考,如圖6所示。
由圖分析可知,測試工況時間介于兩種工況之間,基本符合世界WLTC工況標準,在平均速度特征指標上落后于NEDC和WLTC標準工況[8],在平均加、減速度上均大于兩種標準工況值,且特征指標偏差較大。因此,對于實際行駛情況有必要制定對應當?shù)貙钠囆旭偣r。
參考文獻(References)
[1] Chen Y,Lin Z,Zhao X,et al.Deep learning-based lassification of hyperspectral data[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014:18-26.
[2] Alisa Arunamata,Jesse Stringer,Sowmya Balasubramanian,et al.Cardiac Segmental Strain Analysis in Pediatric Left Ventricular Noncompaction Cardiomyopathy[J].Journal of the American Society of Echocardiography,2019(6):57-68.
[3] Ho,Sze-Hwee,Wong,Yiik-Diew,et al.DevelopingSingapore Driving Cycle for Passenger cars to estimate fuel consumption and vehicular emissions[J].Atmospheric Environment 2014,97:353-362.
[4] 姜平,石琴,陳無畏,等.基于小波分析的城市道路行駛工況構建的研究[J].汽車工程,2011(1):70-73.
[5] 梁聰,夏書銀,陳子忠.基于參考點的改進k近鄰分類算法[J].計算機工程,2019(02):167-178.
[6] 吳信東,嵇圣硙.MapReduce與Spark用于大數(shù)據(jù)分析之比較[J].軟件學報,2018(06):1770-1791.
[7] 祁力鈞,程一帆,程湞湞,等.基于M-K聚類法的果樹上下冠層體積比測算[J].農業(yè)機械學報,2018(05):45-49.
[8] 石則強,紀常偉,王偉,等.車輛燃料消耗量計算方法研究[J].車輛與動力技術,2010(04):19-24.
作者簡介:
王? 沛(1994-),男,碩士生.研究領域:人工智能.
陳勁杰(1969-),男,碩士,副教授.研究領域:智能機器人,機器學習.