楊忱,劉淋磊
(陜西汽車集團(tuán)有限責(zé)任公司,陜西 西安 710021)
汽車行駛工況又稱車輛測試循環(huán),是描述典型車輛行駛的速度-時間曲線,用于確定車輛污染物排放量、燃油消耗量、新車型技術(shù)開發(fā)和評估以及測定交通控制的風(fēng)險等,是汽車工業(yè)一項(xiàng)共性的核心技術(shù)[1]。目前行業(yè)的工況構(gòu)建主要是針對城市工況,且采用的是從起步到停車作為一個工況片段進(jìn)行整個行駛工況的構(gòu)建,該方法比較適用于城市工況,針對重型卡車該方法構(gòu)建的工況往往有所偏差,進(jìn)行車輛燃油經(jīng)濟(jì)性模擬仿真與真實(shí)燃油消耗偏差較大。在數(shù)據(jù)處理中往往采用K-Means 聚類,該方法對初始聚類中心較為敏感,無法保證聚類結(jié)果的穩(wěn)定性。
為此,本文采用了300 輛重卡典型工況區(qū)域內(nèi)運(yùn)行數(shù)據(jù)作為研究對象,按速度區(qū)間、加減速工況劃分工況片段,針對初始聚類中心進(jìn)行優(yōu)化,并結(jié)合馬爾可夫原理進(jìn)行工況構(gòu)建,能夠更加客觀的表征區(qū)域工況。
數(shù)據(jù)是采用車載GPS 行車記錄儀采集,選取典型銷售區(qū)域的300 輛車進(jìn)行一個月的不間斷的后臺數(shù)據(jù)采集,路線運(yùn)行如圖1 所示,主要采集的是河南的日用工業(yè)品市場車輛的運(yùn)行數(shù)據(jù)。數(shù)據(jù)采集的頻率為1Hz,能夠采集發(fā)動機(jī)的轉(zhuǎn)速、扭矩、油門開度、進(jìn)氣壓力等參數(shù),通過電信網(wǎng)絡(luò)將數(shù)據(jù)傳輸至信息平臺,只要車輛行駛就會有數(shù)據(jù)傳輸,能夠保證采集數(shù)據(jù)的真實(shí)性和連續(xù)性。
圖1 車輛行駛路線
采集的數(shù)據(jù)中存在因路面激勵導(dǎo)致的車輛顛簸,會出現(xiàn)瞬時的加速度大于5m/s2的情況,不能真實(shí)的反應(yīng)實(shí)際的工況特點(diǎn),因此將加速度大于5m/s2的數(shù)據(jù)進(jìn)行剔除,能夠有效的保證工況構(gòu)建的合理性和準(zhǔn)確性。
K-Means 聚類方法能夠快速的實(shí)現(xiàn)數(shù)據(jù)的分析,但其缺點(diǎn)也很明顯,初始聚類中心選取的隨機(jī)性,會導(dǎo)致聚類結(jié)果偏差很大,聚類結(jié)果收斂性無法保障。本次針對該方法進(jìn)行優(yōu)化,以保證更為真實(shí)的聚類結(jié)果。
針對所有樣本數(shù)據(jù)進(jìn)行分類,形成不同的數(shù)據(jù)集合,來表示數(shù)據(jù)的關(guān)系和結(jié)構(gòu),這是K-Means聚類方法的最終目的。最初的中心點(diǎn)的選取是在數(shù)據(jù)庫中隨機(jī)抽選的,可能出現(xiàn)所選取的中心點(diǎn)偏離數(shù)據(jù)集合的高密度區(qū)。初始聚類中心的選取由隨機(jī)抽取變更為由基礎(chǔ)算法來選定,從數(shù)據(jù)集中隨機(jī)抽取K 個數(shù)據(jù)對象組成一個集合,重復(fù)隨機(jī)抽樣M 次,得到M 個點(diǎn)集:(x11,x12,…,x1n),(x21, x22,…,x2n),…,(xm1,xm2,…,xmn),然后進(jìn)行歐式距離計算并根據(jù)圖2 改進(jìn)后的方法進(jìn)行,最終選取聚類中心。
根據(jù)運(yùn)行工況集合X=(x1,x2,…,xm),從中的任意兩個不同的工況片段,計算兩工況xi與xj之間的歐氏距離:
同理,兩個聚類中心點(diǎn)ci=(ci1,,ci2,…,cin)和cj=(cj1,cj2,…,cjn)之間的歐氏距離為:
式中i=1,2,3,…,k-1;j=i+1,i+2,…,k
分別求出 M 組中的 k 個工況集的最小歐式距離min1(d(xi,xj)), min1(d(xi,xj)), …,min1(d(xi,xj)),以該組數(shù)據(jù)中與其他點(diǎn)距離最遠(yuǎn)的數(shù)據(jù)作為該組數(shù)據(jù)集的中心點(diǎn),進(jìn)而得到M 個不同工況的聚類中心,然后根據(jù)以下流程得到K 個不同的工況數(shù)據(jù)中心,按照此方法進(jìn)行工況數(shù)據(jù)的K-Means聚類,以保證聚類結(jié)果的可靠性和收斂性。
圖2 改進(jìn)K—Means 聚類算法中心點(diǎn)選取
我國目前多參照歐洲的工況進(jìn)行適應(yīng)性改進(jìn)[2],并且我國學(xué)者針對不同的城市建立了本地的工況[3~5],針對所采集的所有數(shù)據(jù),進(jìn)行匯總分析,按速度區(qū)間進(jìn)行劃分,重卡車輛較乘用車工況更加復(fù)雜,是國道和高速的綜合運(yùn)行。車速比較分散,不僅僅與道路性質(zhì)有關(guān),也和車流量有關(guān)。
圖3 車速分布占比
汽車行駛狀態(tài)定義[6]:怠速為發(fā)動機(jī)正在工作但車速為0 的運(yùn)行狀態(tài);加速為汽車加速度大于0.1 m/s2的連續(xù)過程;勻速為汽車加速度的絕對值小于0.1 m/s2,同時并不是駐車狀態(tài)的連續(xù)運(yùn)行過程;減速為汽車加速度絕對值大于0.1 m/s2的運(yùn)行過程。
從0Km/h 到100Km/h 對加速、減速等過程進(jìn)行劃分運(yùn)動學(xué)片段,不同行駛狀態(tài)形成數(shù)據(jù)集合,S1={1,2,3,…},本次選取最大加速度amax,最小加速度amin,平均加速度aaverage,平均車速vaverage來表征不同的數(shù)據(jù)片段。0Km/h 到100Km/h的數(shù)據(jù)片段共計n 個,就可以得到一個特征向量矩陣Xn×4。
圖4 0-10Km/h 部分加速工況片段
根據(jù)改進(jìn)后的聚類方法進(jìn)行不同速度區(qū)間段的運(yùn)動片段分類,最終將0Km/h 到100Km/h 的加速行駛狀態(tài),劃分為4類,其累計貢獻(xiàn)度超過85%,雖然有一定的信息損失,但對最終的結(jié)果影響較小[7]。
表1 聚類中心
馬爾可夫過程是一個隨機(jī)過程,那么不同的數(shù)據(jù)段組成一系列的事件,Ri,i=1,2,3…T 及相應(yīng)的狀態(tài)空間S={1,2,3,…},S 中每一項(xiàng)都只與前一項(xiàng)相關(guān)[7]。用聚類中心所代表的運(yùn)動學(xué)片段來替換整個工況中該類所有運(yùn)動學(xué)片段,這樣就能形成一個有時間順序的不同的運(yùn)動學(xué)片段集合,對所有的運(yùn)動學(xué)片段進(jìn)行編號,然后就形成了一個數(shù)據(jù)集合。根據(jù)貝葉斯公式能夠計算出一個有順序的概率集合,從而能夠計算出不同的運(yùn)動學(xué)片段所能夠轉(zhuǎn)移成為其它工況片段的概率。
以0Km/h 到10Km/h 的加速過程為例,其工況片段聚類結(jié)果為4 類,分別記為M11、M12、M13、M14,或者為10Km/h到20Km/h 的加速過程M2j,根據(jù)馬爾可夫原理就能夠計算出兩個加速過程的轉(zhuǎn)移概率。
M11事件轉(zhuǎn)移為M2j事件的概率P 可以表示為:
表2 M11后續(xù)工況片段出現(xiàn)的概率
則運(yùn)動學(xué)片段M11后面的工況最可能的是M22,以此類推完成M22運(yùn)動學(xué)片段后續(xù)的工況片段,進(jìn)而完成整個行駛工況的構(gòu)建。起始工況片段選取整個工況數(shù)據(jù)集中出現(xiàn)概率最高的片段,按照上述方法進(jìn)行合成,直到達(dá)到合理的長度為止。
表3 起始工況片段出現(xiàn)的概率
與原行駛工況相比,最大誤差為3.1%,可靠性較強(qiáng),能夠有助于簡化計算流程,并能夠針對我國區(qū)域跨度大的特點(diǎn),針對物流運(yùn)輸熱點(diǎn)路線進(jìn)行工況合成,有助于產(chǎn)品的精準(zhǔn)研發(fā)。
圖5 組合行駛工況
表4 主要參數(shù)對比
與原行駛工況相比,最大誤差為3.1%,與實(shí)際行駛工況進(jìn)行比對,百公里燃油誤差為1%,有助于更加真實(shí)的反應(yīng)車輛的實(shí)際運(yùn)行行駛工況。
基于企業(yè)數(shù)據(jù)平臺大數(shù)據(jù),分速度區(qū)間進(jìn)行運(yùn)動學(xué)片段劃分,采用運(yùn)動學(xué)片段來表征不同的行駛狀態(tài),并結(jié)合馬爾可夫原理完成轉(zhuǎn)移概率的計算,最終以特征工況完成典型工況的構(gòu)建。并通過實(shí)例驗(yàn)證了構(gòu)建工況的準(zhǔn)確性,也驗(yàn)證了該方法的可行性和精準(zhǔn)性。