段宇帥
(浙江理工大學(xué)信息學(xué)院,浙江杭州 310018)
汽車行駛工況[1](Driving Cycle)又稱車輛測試循環(huán),是描述汽車行駛速度—時間曲線,體現(xiàn)汽車道路行駛的運(yùn)動學(xué)特征,是汽車行業(yè)的一項重要的共性核心技術(shù),是車輛能耗測試方法和限值標(biāo)準(zhǔn)的基礎(chǔ),也是汽車整車和零部件參數(shù)的主要基準(zhǔn)。目前,發(fā)達(dá)國家的汽車技術(shù)采用NEDC(New European Driving Cycle)工況[2],如圖1 所示。近年來,我國的道路交通狀況、人口密度和城鎮(zhèn)化發(fā)生了很大變化,以NEDC 工況為基準(zhǔn)所優(yōu)化標(biāo)定的汽車已不能滿足需求,急需基于我國國情構(gòu)建新的城市汽車行駛工況,許多地方構(gòu)建了符合自己城市實際的汽車行駛工況。
汽車行駛工況曲線作為評價汽車的標(biāo)準(zhǔn),在評價燃油經(jīng)濟(jì)[3]和車輛設(shè)計[4]等方面得到廣泛研究,如基于馬爾可夫鏈和K-means 聚類構(gòu)建工況曲線[5];采用改進(jìn)的馬爾科夫蒙特卡羅方法構(gòu)建北京市的行駛工況圖[6];采用主成分分析和聚類方法構(gòu)建行駛工況[7-11]等;文獻(xiàn)[12]從怠速、加速、減速、勻速階段來判斷工況曲線的合理性,有一定局限性;文獻(xiàn)[13]利用主成分分析和FCM 聚類構(gòu)建了合肥市的行駛工況本文使用15種特征參數(shù)進(jìn)行更全面的描述。
Fig.1 European NEDC operating conditions圖1 歐洲NEDC工況
在前述研究基礎(chǔ)上,本文根據(jù)某城市輕型汽車實際道路行駛采集的數(shù)據(jù)(采樣頻率1Hz),基于主成分分析和Kmeans 聚類方法構(gòu)建汽車行駛工況曲線。首先對原數(shù)據(jù)集進(jìn)行不良數(shù)據(jù)的剔除,然后根據(jù)運(yùn)動學(xué)片段定義,利用平均加速度、怠速時間比、速度標(biāo)準(zhǔn)差等參數(shù)提取運(yùn)動學(xué)片段特征。利用主成分分析方法對特征參數(shù)矩陣進(jìn)行處理,得到3個主成分;之后用K-means 聚類對運(yùn)行學(xué)片段聚類,獲得3 類代表不同速度的片段,最終構(gòu)成汽車行駛工況曲線。為了驗證本文的汽車行駛工況曲線,使用相對誤差和絕對誤差分析總樣本和本文工況曲線,得到的結(jié)果誤差越小,證明曲線越合理。
運(yùn)動學(xué)片段[14]指汽車從怠速狀態(tài)初始階段到下一個怠速狀態(tài)初始階段之間的行車速度區(qū)間,如圖2 所示。從圖中可以看出一段運(yùn)動學(xué)片段包含怠速、加速、勻速和減速階段,這些階段包含汽車的各種行駛信息。
Fig.2 Kinematic segment definition圖2 運(yùn)動學(xué)片段定義
由于數(shù)據(jù)是采集設(shè)備直接記錄汽車行駛的原始數(shù)據(jù),所以會包含一些不良數(shù)據(jù),如數(shù)據(jù)中的時間不連續(xù)、汽車加、減速度異常、汽車長時間速度為零或低速狀態(tài)、怠速時間過長等。
根據(jù)不良數(shù)據(jù)問題設(shè)計了剔除算法,如圖3所示。
Fig.3 Flow of culling algorithm圖3 剔除算法流程
算法步驟如下:
輸入數(shù)據(jù);
處理怠速時間過長數(shù)據(jù)段;
處理不連續(xù)的數(shù)據(jù);
處理加、減速度異常的數(shù)據(jù);
輸出數(shù)據(jù)。
對采集的3 個數(shù)據(jù)集進(jìn)行運(yùn)動片段提取,應(yīng)用貪婪算法[15]直接篩選數(shù)據(jù),進(jìn)而獲取運(yùn)動學(xué)片段,見表2。
Table 2 Kinematic segment data表2 運(yùn)動片段數(shù)據(jù)
該算法求解步驟如下:
輸入數(shù)據(jù),分批處理數(shù)據(jù);
選取第一個速度零點;
判斷數(shù)據(jù)段是否符合運(yùn)動學(xué)片段條件;
獲取運(yùn)動學(xué)片段,選取下一個速度零點繼續(xù)搜尋;
輸出運(yùn)動學(xué)片段。
汽車的行駛過程可以看作大量運(yùn)動學(xué)片段的組合,對汽車運(yùn)動數(shù)據(jù)作預(yù)處理、獲取片段后,通過分析運(yùn)動學(xué)片段的運(yùn)動特征可得出車輛的運(yùn)動特征。對運(yùn)動學(xué)片段主要從運(yùn)行距離、最大速度、平均加減速度、加速度標(biāo)準(zhǔn)差等幾方面進(jìn)行特征分析,本文選用如表3 所示的15 個特征參數(shù)描述運(yùn)動學(xué)片段。處理汽車運(yùn)動數(shù)據(jù)1 578 個運(yùn)動學(xué)片段的15個參數(shù)值,如表4所示。
Table 3 15 feature parameter definitions表3 15個特征參數(shù)定義
Table 4 Kinematics fragment eigenvalue matrix表4 運(yùn)動學(xué)片段特征值矩陣
對1 578 個運(yùn)動學(xué)片段的特征參數(shù)進(jìn)行主成分分析。設(shè)n為運(yùn)動學(xué)片段數(shù)量,p為特征參數(shù)數(shù)量,則相應(yīng)的矩陣為:
稱A矩陣為原始數(shù)據(jù)矩陣。對原始矩陣進(jìn)行標(biāo)準(zhǔn)化,消除指標(biāo)間的差異性。
計算得到λ1,λ2,…,λp共計p個特征值,且λ1>λ2>… >λp>0,并可得到與之相對應(yīng)的特征向量u1,u2,…,up,將所有特征向量構(gòu)建成一個特征矩陣U:
每個主成分的貢獻(xiàn)率計算如下:
一般研究認(rèn)為主成分的累計貢獻(xiàn)率超過80%時,這部分主成分就包含了代表原指標(biāo)的絕大多數(shù)信息。本研究認(rèn)為當(dāng)貢獻(xiàn)率大于85%時即可代表原指標(biāo)。
由表5 可知,前3 個主成分的累積貢獻(xiàn)率之和已經(jīng)達(dá)到84.57%,并且這3 個主成分的特征值都大于1,因此,用前3 個主成分就能反映出15 個特征參數(shù)的大部分信息。同時由圖4(彩圖掃OSID 碼可見,下同)可以很明顯看出各個主成分特征值的整體變化趨勢,結(jié)合累計貢獻(xiàn)率可以看出應(yīng)當(dāng)選擇前3 個主成分。經(jīng)過主成分分析得到一個主成分載荷矩陣。某個參數(shù)在某個主成分上的載荷系數(shù)絕對值越大,越說明該參數(shù)與這個主成分的相關(guān)系數(shù)越大,越能反映主成分的信息量。載荷矩陣如表6 所示。第一主成分M1 主要反映加速時間、減速時間、路程、平均速度、最大速度、速度標(biāo)準(zhǔn)差、加速時間比;第二主成分M2 主要反映怠速時間比、加速度標(biāo)準(zhǔn)差、減速時間比;第3 主成分M3 主要反映勻速時間比、平均行駛速度、平均加速度、平均減速度。
Fig.4 Histogram of the contribution rate of principal components圖4 主成分貢獻(xiàn)率柱狀圖
Table 5 Principal component contribution rate表5 主成分貢獻(xiàn)率
Table 6 Component load matrix表6 主成分載荷矩陣
利用K-means 方法[17-18]對由主成分分析得到的3 個主成分得分矩陣進(jìn)行聚類。將運(yùn)動學(xué)片段分為3 類,如圖5所示,分別計算各類別的平均特征值,結(jié)果見表7。
第一類運(yùn)動學(xué)片段的平均速度和平均最大速度最低,怠速時間占總運(yùn)行時間比例處于中間位置,第一類為中速片段;第二類運(yùn)動學(xué)片段的平均速度和平均最大速度最高,怠速時間占總運(yùn)行時間比例最低,第二類為高速片段;第三類運(yùn)動學(xué)片段的平均速度和平均最大速度處于中間位置,怠速時間占總運(yùn)行時間比例最高,第三類為低速片段。
Fig.5 Kinematic fragment cluster圖5 運(yùn)動學(xué)片段聚類
Table 7 Average eigenvalue of each class表7 各類別的平均特征值
在每個聚類中選取與該類特征值相關(guān)系數(shù)最大的代表性運(yùn)動學(xué)片段構(gòu)建車輛的行駛工況。采用隨機(jī)選擇法[19]、最佳增量法[20]選取運(yùn)動學(xué)片段,一般工況時長約為1 200~1 300s,可通過各個類別時間在總體數(shù)據(jù)中所占的比例來確定最終擬合工況中所選取的片段數(shù)量。確定各類片段所需要的數(shù)量通過式(11)計算:
其中,ωa代表第a類片段所需要的數(shù)量;n表示第a類片段中所含運(yùn)動學(xué)片段的數(shù)量;tk表示第a類片段中第k條片段的長度;表示第a類片段的平均長度;N 表示總體中所有運(yùn)動學(xué)片段的個數(shù);ti表示總體中第i個運(yùn)動學(xué)片段的長度。
利用式(11)分別在各個類別中選取片段,構(gòu)建一條汽車行駛工況圖,如圖6所示。
Fig.6 Car driving cycle圖6 汽車行駛工況
在研究中一般利用相對誤差和絕對誤差來反映數(shù)據(jù)之間的差異,汽車行駛工況與采樣總體的15 個特征值的差距不大,多數(shù)特征值都比較相近。觀察表7 發(fā)現(xiàn),各參數(shù)值間的相對誤差較小。本文構(gòu)建的工況圖和原始數(shù)據(jù)差異較小,可以很好地反映汽車的行駛狀態(tài),即構(gòu)建的汽車行駛工況圖是合理的,如圖7所示。
Table 7 Driving cycle diagram error analysis表7 工況圖誤差分析
為了更好地構(gòu)建汽車行駛工況曲線,本文提出一種基于K-means 聚類的汽車行駛工況構(gòu)建。使用15 個特征參數(shù)進(jìn)行特征提取,采用主成分分析法進(jìn)行降維,利用Kmeans 聚類方法進(jìn)行分類,最終從各類別分別提取運(yùn)動學(xué)片段組成一條汽車行駛工況曲線。實驗證明本文使用的剔除算法有效剔除了不良數(shù)據(jù),適用于大數(shù)據(jù)處理。運(yùn)動學(xué)片段的獲取方法合理有效,精確性較高。本文不足之處是某些特征參數(shù)的絕對誤差較大,可在未來工作中縮減誤差。本文可為后續(xù)計算各個城市的汽車行駛工況曲線研究提供參考。
Fig.7 Car driving cycle and the overall sampling error curve圖7 汽車行駛工況與采樣總體誤差曲線