王震,宋志堯
(200093 上海市 上海理工大學(xué))
汽車行駛工況代表車輛在實際行駛時速度與時間的對應(yīng)函數(shù)關(guān)系。行駛工況作為一項重要的參考指標(biāo),影響著車輛在排放方面的測試標(biāo)準(zhǔn)以及汽車各項性能指標(biāo)[1]。近幾年,我國汽車保有量快速增長,道路交通狀況改變了很多,昔日以NEDC 工況為基準(zhǔn)所優(yōu)化標(biāo)定的汽車,實際油耗產(chǎn)生了越來越大的偏差[2]。由于地域不同,各個城市間的地理環(huán)境差異性較大,造成各個城市的交通發(fā)展情況不一[3],需要深入研究我國的實際道路的測試工況作為車輛測試與評價的重要依據(jù)[4]。
本文以某城市實際運行載荷數(shù)據(jù),對原始載荷數(shù)據(jù)中存在的異常數(shù)據(jù)進(jìn)行預(yù)處理并采用T4253H 平滑算法[5]對原始速度時間序列進(jìn)行濾波處理。通過片段劃分并構(gòu)造片段多維特征參數(shù),采用主成分分析方法實現(xiàn)參數(shù)降維,采用聚類效果評價方法確定聚類數(shù)目,之后利用K-means 聚類方法[6]將運行片段分為4 種工況,基于馬爾科夫鏈原理[7]確定工況間的順序關(guān)系,最終結(jié)合怠速時間特征與各工況總時間比例確定汽車行駛工況。
本文采集的某城市原始載荷數(shù)據(jù)共140 h,3 800 km,包含不同道路類型、不同駕駛習(xí)慣的載荷時間歷程。先對原始載荷歷程進(jìn)行平滑過渡處理,使得處理后的時間序列連續(xù),并且濾波后可以消除由于數(shù)據(jù)采集終端存在的零點漂移,即白噪聲造成一定的車速偏差,可以通過濾波處理后來降低數(shù)據(jù)誤差。
本文擬采用T4253H 濾波首先將數(shù)據(jù)按照跨度4,2,5,3 的順序進(jìn)行中心移動平均處理,對于原始數(shù)據(jù){fi}中的N 個非平穩(wěn)數(shù)據(jù){yi},認(rèn)定每隔4,2,5,3 個跨度的區(qū)間內(nèi)的數(shù)據(jù)都是平穩(wěn)的,其均值接近于常量。所以可以每隔4,2,5,3 的跨度取相鄰數(shù)據(jù)的均值,來表示每隔這么多個跨度的一個均值,通常用該均值表示數(shù)據(jù)的測量結(jié)果或信號數(shù)據(jù)。例如每隔5 個取一個均值的表達(dá)式為
同理,每隔4 個取值,即y4=1/4(y1+y2+y3+y4),以此類推,可得一般表達(dá)式為
式(2)中,k 可取4,2,5,3;i 取1,2,…,k。顯然,這樣所得到的{fk=yk},原始數(shù)據(jù)經(jīng)過處理之后會更加平滑且無異常數(shù)據(jù)。但實際上,不同的數(shù)據(jù)距離平滑數(shù)據(jù)的遠(yuǎn)近會產(chǎn)生不等權(quán)的情況,因此對于不同的復(fù)雜數(shù)據(jù),需要通過加權(quán)平均來表示平滑數(shù)據(jù),所以這里就把Hanning 作為權(quán)重再做移動平均處理。其一般算式為
式中:mi——權(quán)系數(shù),且;p,q——小于4,2,5,3 的任一正整數(shù)。由此可以對數(shù)據(jù)進(jìn)行平滑處理。
此外,還需要對原始數(shù)據(jù)中存在的異常數(shù)據(jù)進(jìn)行處理。對于異常加減速的數(shù)據(jù),如圖1 所示,此種異常加減速數(shù)據(jù)影響片段劃分,應(yīng)將異常數(shù)據(jù)剔除;對于怠速時間大于180 s 的片段,如圖2 所示,通過編程將最長怠速時間設(shè)置為180 s;由于設(shè)備異常出現(xiàn)無波動的數(shù)據(jù),如圖3 所示,速度時間歷程無波動可能由于設(shè)備異常,該片段會使汽車運動學(xué)片段失真且對工況構(gòu)建影響較大,對其進(jìn)行刪除處理;對于緩行片段,如圖4所示。最高車速小于5 km/h 的緩行片段視為怠速工況處理。
圖1 異常加減速數(shù)據(jù)Fig.1 Abnormal acceleration and deceleration data
圖2 長時間怠速數(shù)據(jù)Fig.2 Long-term idling data
圖3 異常無波動數(shù)據(jù)Fig.3 Abnormal no-fluctuation data
圖4 緩行片段數(shù)據(jù)Fig.4 Slow driving data
對預(yù)處理后的速度時間歷程進(jìn)行片段劃分。將速度從零開始,經(jīng)過加減速到零為止定義為運行段;將速度持續(xù)為零或最高速度低于5 km/h 的片段定義為怠速段;運動學(xué)片段是汽車從怠速狀態(tài)開始到下一個怠速狀態(tài)開始之間的車速區(qū)間。具體片段劃分示意圖如圖5 所示。最終通過編程將載荷數(shù)據(jù)劃分出2 517 個運動學(xué)片段。
圖5 片段劃分示意圖Fig.5 Schematic diagram of segmentation
汽車在實際道路上的行駛過程需要通過一些基本的特征參數(shù)來反映各個運動學(xué)片段的特征。本文結(jié)合汽車運行載荷數(shù)據(jù),對所有運行片段構(gòu)造如表1 中15 個特征參數(shù),并對所有運行片段計算出總體特征參數(shù)矩陣。其中,平均速度指包含怠速段的運動學(xué)片段的平均速度,平均行駛速度指不包含怠速段的運行段的平均速度。
表1 特征參數(shù)說明Tab.1 Characteristic parameter escription
設(shè)有n 個片段,每個片段有p 個特征參數(shù),記為X=(x1,x2,…,xp)。設(shè)隨機變量X 的均值為μ,協(xié)方差矩陣為∑。主成分是將p 個特征參數(shù)線性組合的問題。對X 進(jìn)行線性變換可以生成新的綜合指標(biāo)即主成分,記為y1,y2,…,yp。樣本數(shù)據(jù)可表示為
主成分分析的數(shù)學(xué)模型為
從相關(guān)性矩陣出發(fā)求解主成分,在對特征參數(shù)矩陣進(jìn)行降維處理之前,由于各特征參數(shù)的量綱不同,造成特征參數(shù)值得分散程度會有很大差異,從而影響分析結(jié)果,因此需要對特征參數(shù)矩陣做標(biāo)準(zhǔn)化處理。
主成分的目的是減少指標(biāo)的個數(shù),累積貢獻(xiàn)率達(dá)到80%以上。這樣的目的是保留大部分信息,同時減少指標(biāo)變量。根據(jù)總方差解釋(表2)提取前4 個主成分,累積貢獻(xiàn)率達(dá)到82.88%。
表2 總方差解釋Tab.2 Total variance explanation
根據(jù)因子載荷量與特征值的關(guān)系可以得出主成分系數(shù)矩陣。根據(jù)主成分系數(shù)矩陣乘以標(biāo)準(zhǔn)化后的特征參數(shù)矩陣即可得到主成分得分矩陣,如表3 所示。主成分得分矩陣可用于后續(xù)聚類分析。
表3 主成分得分矩陣Tab.3 Principal component score matrix
3.2.1 聚類數(shù)目確定
本文采用肘部法則(Elbow method)確定聚類數(shù)目(k 值)。肘部法則主要是隨著聚類數(shù)目k 值的增大,尋找損失函數(shù)的拐點,損失函數(shù)為各個類別畸變程度之和,也就是誤差平方和(Sum of squared errors,SSE)。
式中:Ci——第 i 個簇;p——Ci中的樣本點;mi——Ci的質(zhì)心;SSE——聚類效果的好壞。
當(dāng)聚類數(shù)目為2~6 時,計算出所有情況的誤差平方和,如圖6 所示。當(dāng)聚類數(shù)目為4 時出現(xiàn)拐點,說明聚類分為4 類較為合理。
圖6 誤差平方和計算結(jié)果Fig.6 Calculation results of sum of squared errors
3.2.2 聚類結(jié)果
將降維后的主成分得分矩陣進(jìn)行聚類分析,預(yù)先確定聚類數(shù)目之后,采用K-means 聚類算法將運行學(xué)片段進(jìn)行分類,基于前3 個主成分繪制出聚類云圖如圖7 所示。
圖7 聚類結(jié)果示意圖Fig.7 Schematic diagram of clustering results
聚類后第1 類包含526 個片段,第2 類包含637 個片段,第3 類包含460 個片段,第4 類包含894 個片段。并根據(jù)聚類后的結(jié)果,計算出每一類典型特征參數(shù)的平均值代表每類工況的參數(shù)特征,如表4 所示。
表4 聚類后各類均值特征參數(shù)Tab.4 Various types of mean feature parameters after clustering
聚類后的4 種工況特征值具有一定的差異性:類別3 屬于高速行駛片段;類別2 屬于中速行駛片段;類別1 與類別4 片段最高車速與行駛時間較為接近,但類別1 的怠速時間較長,類別4 怠速時間較短,行駛里程較高。可以認(rèn)為類別1 為擁堵道路片段,類別4 為暢通道路片段。
基于聚類后各類的結(jié)果,對每類工況所包含的時間與里程比例進(jìn)行統(tǒng)計分析,作為拼接片段的參考依據(jù)?;诘∷贂r間比例確定每類工況怠速時間,基于各類工況總時間比例確定出最終要拼接的各類的時間。聚類后四種工況的總時間比例及怠速時間比例如圖8、圖9 所示。
圖8 各工況總時間比例Fig.8 Proportion of total time under various working conditions
圖9 各工況怠速時間比例Fig.9 Proportion of idle time under various working conditions
將每類工況到各自聚類中心較近的幾個片段作為候選片段。由于通過K-means 聚類分析后,聚類中心處的片段與均值特征參數(shù)對應(yīng)的片段一致,因此,根據(jù)表4 各類工況的特征參數(shù)的平均值確定出每類工況的最優(yōu)片段。
本文采用馬爾科夫鏈原理確定各工況狀態(tài)轉(zhuǎn)移關(guān)系。馬爾可夫鏈?zhǔn)谴硪唤M離散隨機變量的集合。具體指對概率空間(Ω,F(xiàn),P)內(nèi)以一維可數(shù)集為指數(shù)集的隨機變量集合X={Xn:n>0},若隨機變量的取值都在可數(shù)集內(nèi):X=si,si∈S,且隨機變量的條件概率滿足如下關(guān)系:
則X 被稱為馬爾可夫鏈。對于一個靜態(tài)的馬爾可夫鏈,隨著馬爾可夫鏈的增長,整個模型事件分布保持不變。基于馬爾可夫鏈的這個性質(zhì),通過模型事件轉(zhuǎn)移矩陣構(gòu)建的行駛工況能夠代表整個原始數(shù)據(jù)的行駛工況,利用最大似然估計法來估計每類工況的轉(zhuǎn)移矩陣。
基于馬爾科夫鏈原理對4 類工況的拼接順序進(jìn)行確定。由于本文在數(shù)據(jù)預(yù)處理過程中將異常數(shù)據(jù)進(jìn)行剔除,并基于預(yù)處理后的數(shù)據(jù)進(jìn)行片段劃分,劃分的各片段之間依次連續(xù)?;诰垲惙治龅慕Y(jié)果,可以確定每個片段所屬的工況類別,從而構(gòu)成馬爾科夫鏈模型,而4 種工況類別構(gòu)成狀態(tài)空間,通過馬爾科夫鏈原理計算出各工況間的狀態(tài)轉(zhuǎn)移矩陣,如表5 所示。
表5 工況狀態(tài)轉(zhuǎn)移概率矩陣Tab.5 State transition probability matrix
從所有工況中隨機選取一個工況作為初始工況,基于狀態(tài)轉(zhuǎn)移概率分布構(gòu)造隨機數(shù),若該隨機數(shù)大于第r 工況下的轉(zhuǎn)移概率,小于第q 工況下的轉(zhuǎn)移概率,則下一個工況為第r 個工況,以此進(jìn)行工況拼接。由于隨機選取工況4 的概率最高,為35.5%,因此得出各工況拼接關(guān)系依次為工況4、工況1、工況2、工況3。最終結(jié)合各工況間時間比例關(guān)系構(gòu)建出汽車行駛工況,如圖10所示,總時間為1 280 s。
圖10 構(gòu)建的汽車行駛工況Fig.10 Constructed vehicle driving conditions
為驗證所構(gòu)建的行駛工況是否合理,需計算汽車行駛工況的特征參數(shù)與經(jīng)處理后數(shù)據(jù)源的特征參數(shù)之間的相對誤差。相對誤差計算公式如下:
式中:ε——相對誤差;xi——構(gòu)建的汽車行駛工況特征參數(shù)值;xj——經(jīng)處理后數(shù)據(jù)源的特征參數(shù)值。選取較為典型的特征參數(shù)并計算構(gòu)建好的行駛工況的特征值與預(yù)處理之后的特征值進(jìn)行對比。如圖11 所示,相對誤差基本上在10%以內(nèi),在合理范圍之內(nèi)。
圖11 行駛工況特征參數(shù)誤差對比Fig.11 Comparison of characteristic parameter errors in driving conditions
將原始預(yù)處理后的數(shù)據(jù)與構(gòu)建的汽車行駛工況進(jìn)行速度與加速度聯(lián)合分布概率差異對比,如圖12 所示。差異值基本在±2%之間,比較合理。
圖12 速度-加速度聯(lián)合分布概率差異值Fig.12 Probability difference value of joint velocity-acceleration distribution
對汽車實際道路行駛數(shù)據(jù)進(jìn)行了預(yù)處理,基于程序?qū)崿F(xiàn)運動學(xué)片段的自動劃分,并構(gòu)造表征片段的特征參數(shù),基于主成分原理實現(xiàn)參數(shù)降維,采用K-means 聚類方法將運動學(xué)片段分為4 類,且聚類效果良好。基于馬爾科夫鏈原理構(gòu)建各工況狀態(tài)轉(zhuǎn)移概率矩陣,結(jié)合工況時間比例關(guān)系構(gòu)建汽車行駛工況。
根據(jù)特征參數(shù)相對誤差檢驗及速度-加速度聯(lián)合分布概率差異值進(jìn)行對比,確定最終組合后的行駛工況,相對誤差在10%以內(nèi),速度-加速度聯(lián)合概率分布差異值在±2%以內(nèi),效果良好。