林建新,劉博,趙霞,張蕾
(北京建筑大學(xué),a.土木與交通工程學(xué)院;b.電氣與信息工程學(xué)院,北京 100044)
汽車行駛工況[1]對(duì)車輛污染物排放研究和綠色低碳發(fā)展等方面具有重要的研究?jī)r(jià)值[2]。美國(guó)最早投身于汽車行駛工況的研究[3]。此后歐洲、日本等國(guó)家也逐漸開(kāi)展工況研究工作[4]。我國(guó)目前參考?xì)W洲工況數(shù)據(jù)制定相關(guān)法規(guī),而國(guó)內(nèi)道路條件、交通條件、甚至駕駛行為特征與國(guó)外差異較大,導(dǎo)致車輛實(shí)際行駛過(guò)程的平均速度、怠速時(shí)間比等特征參數(shù)與國(guó)外認(rèn)證標(biāo)準(zhǔn)差距較大。近年來(lái),國(guó)內(nèi)外對(duì)于行駛工況構(gòu)建的研究逐漸增多。李洋等[1]將聚類算法與馬爾科夫鏈相結(jié)合構(gòu)建行駛工況。ZHANG等[5]基于改進(jìn)馬爾科夫鏈構(gòu)建了電動(dòng)汽車行駛工況并通過(guò)工況測(cè)算了電車能源消耗。MAYAKUNTLA等[6]用“行程段”取代傳統(tǒng)的短行程基本單元構(gòu)建了新型的汽車行駛工況。NOURI等[7]提出基于空間特征的短行程分類法,結(jié)果表明,相比其他短行程法其構(gòu)建了更具代表性的工況。HE等[8]利用實(shí)時(shí)更新的交通信息重構(gòu)行駛工況,進(jìn)一步反映了實(shí)時(shí)交通運(yùn)行狀態(tài)。大部分研究采用基于降維-聚類的短行程分類法構(gòu)建行駛工況,但此類方法基于隨機(jī)選擇合成工況,導(dǎo)致構(gòu)建工況的隨機(jī)性較強(qiáng)、誤差不穩(wěn)定。為此,研究以實(shí)際采集機(jī)動(dòng)車行駛數(shù)據(jù)為數(shù)據(jù)源,通過(guò)降維和聚類劃分運(yùn)動(dòng)學(xué)片段庫(kù),在聚類中心一定距離內(nèi)隨機(jī)選取與拼接構(gòu)建工況集合,擇出與原始數(shù)據(jù)特征參數(shù)誤差最小的工況作為初步行駛工況,提出通過(guò)混合約束自編碼器對(duì)初步行駛工況進(jìn)行智能優(yōu)化的方法,減小了隨機(jī)性帶來(lái)的誤差不確定性,并對(duì)自編碼器的優(yōu)化策略進(jìn)行分析驗(yàn)證。
研究提出了基于混合約束自編碼器的機(jī)動(dòng)車行駛工況智能構(gòu)建方法,能夠用于多源數(shù)據(jù)的解析并構(gòu)建代表性的行駛工況。通過(guò)科學(xué)方法和智能科技技術(shù)推動(dòng)低碳發(fā)展,對(duì)碳達(dá)峰的機(jī)動(dòng)車碳排放預(yù)測(cè)具有重大的意義,為實(shí)現(xiàn)“雙碳”目標(biāo)作出積極貢獻(xiàn)。
通過(guò)行車記錄儀采集福州市某輛輕型汽車在實(shí)際城市路網(wǎng)上的行駛數(shù)據(jù),如圖1所示,行駛范圍是福州市內(nèi)不同等級(jí)、功能和區(qū)位的道路。數(shù)據(jù)包含同一車輛在14 個(gè)工作日及6 個(gè)非工作日的6:00-24:00 中不同時(shí)間段的行駛數(shù)據(jù),選取時(shí)段包含各個(gè)高峰與平峰時(shí)期。研究獲取了車輛在城市路網(wǎng)行駛過(guò)程中的時(shí)間、速度、發(fā)動(dòng)機(jī)轉(zhuǎn)速、經(jīng)度、緯度共5項(xiàng)指標(biāo),采樣間隔為1 s。
圖1 車輛全部行駛軌跡覆蓋圖Fig.1 Coverage map of all vehicle trajectories
數(shù)據(jù)采集過(guò)程中,由于采集設(shè)備本身或周圍環(huán)境導(dǎo)致信號(hào)較弱,造成數(shù)據(jù)異常或丟失。數(shù)據(jù)不恰當(dāng)處理,會(huì)嚴(yán)重降低數(shù)據(jù)質(zhì)量與可靠性。具體數(shù)據(jù)處理流程如圖2所示。
圖2 數(shù)據(jù)處理流程Fig.2 Flow chart of data processing
(1)缺失數(shù)據(jù)填充
對(duì)于缺失數(shù)據(jù)時(shí)間間隔大于3 s 的情況:如果間隔兩端車速全為0 km·h-1,視為分離片段;如果間隔左端速度不為0 km·h-1,則刪除左端數(shù)據(jù)直至速度為0 km·h-1;如果間隔右端速度不為0 km·h-1,則刪除右端數(shù)據(jù)直至為0 km·h-1;對(duì)于缺失數(shù)據(jù)間隔小于3 s 的情況,采用線性插值將不連續(xù)數(shù)據(jù)連接起來(lái)[9]。
研究認(rèn)為普通轎車0~100 km·h-1速度下加速度大于4 m·s-2或減速度大于7.5 m·s-2時(shí)為異常值[9]。通過(guò)異常點(diǎn)周圍數(shù)據(jù)進(jìn)行線性插值替代處理,如果處理后仍然存在加速度異常數(shù)據(jù),則說(shuō)明異常點(diǎn)周圍數(shù)據(jù)也為異常數(shù)據(jù),直接按照缺失數(shù)據(jù)處理。
(3)長(zhǎng)期怠速數(shù)據(jù)
對(duì)于長(zhǎng)期車速為0 km·h-1的數(shù)據(jù),如果發(fā)動(dòng)機(jī)轉(zhuǎn)速為0 r·min-1,表示發(fā)動(dòng)機(jī)處于熄火狀態(tài),則直接刪除數(shù)據(jù);如果發(fā)動(dòng)機(jī)轉(zhuǎn)速不為0 r·min-1,視為怠速狀態(tài)。將長(zhǎng)時(shí)間(超過(guò)180 s)低速行駛狀況(車速小于10 km·h-1)也視為怠速狀態(tài)。對(duì)搜索到連續(xù)怠速時(shí)間大于180 s 的工況,逐個(gè)刪除片段中連續(xù)為0 km·h-1的中間點(diǎn),直至怠速時(shí)長(zhǎng)為180 s用于工況的構(gòu)建。
目前分析海量車輛行駛數(shù)據(jù)主流方法是將全部的時(shí)間-速度數(shù)據(jù)劃分成若干個(gè)運(yùn)動(dòng)學(xué)片段。運(yùn)動(dòng)學(xué)片段指車輛從怠速狀態(tài)至相鄰下一個(gè)怠速狀態(tài)開(kāi)始的運(yùn)動(dòng)過(guò)程,通常包括怠速、加速、減速、勻速部分,由于車輛在不同的道路條件、交通環(huán)境下會(huì)展現(xiàn)出不同的行駛特征,導(dǎo)致運(yùn)動(dòng)學(xué)片段的速度分布呈多樣性,因此,研究通過(guò)隨機(jī)組合各類運(yùn)動(dòng)學(xué)片段描述車輛的行駛過(guò)程,將劃分的短時(shí)片段聚類,構(gòu)建符合實(shí)際情況的行駛工況。
研究將全部時(shí)間-速度數(shù)據(jù)劃分為多個(gè)“怠速-行駛-怠速”的運(yùn)動(dòng)學(xué)片段。由于數(shù)據(jù)采集終端的信號(hào)問(wèn)題,會(huì)出現(xiàn)車輛沒(méi)有從速度為0 km·h-1起步或者片段結(jié)束點(diǎn)速度不為0 km·h-1,將其視為錯(cuò)誤數(shù)據(jù)并直接刪除。通過(guò)對(duì)運(yùn)動(dòng)學(xué)片段的遴選,最終劃分運(yùn)動(dòng)學(xué)片段1445個(gè),總共數(shù)據(jù)量為198434條。
受道路交通狀況影響,運(yùn)動(dòng)學(xué)片段之間差異顯著。不同運(yùn)動(dòng)學(xué)片段反應(yīng)車輛不同的行駛狀態(tài),為更好地通過(guò)組合的運(yùn)動(dòng)學(xué)片段描述車輛的運(yùn)動(dòng)過(guò)程,選取合適的特征參數(shù)評(píng)價(jià)。在查閱相關(guān)文獻(xiàn)基礎(chǔ)上[1],選取14個(gè)特征參數(shù),如表1所示。
表1 特征參數(shù)Table 1 Characteristic parameters
計(jì)算各個(gè)運(yùn)動(dòng)學(xué)片段的14 個(gè)特征參數(shù),作為后續(xù)運(yùn)動(dòng)學(xué)片段分類的依據(jù),并為行駛工況的構(gòu)建提供評(píng)價(jià)標(biāo)準(zhǔn)。
根據(jù)以上初步的配合比(02號(hào))中水膠比和砂率按《水工混凝土試驗(yàn)規(guī)程》(SL352-2006)規(guī)定進(jìn)行調(diào)整,水膠比增減0.05、砂率相應(yīng)增減1%,得出01和03號(hào)調(diào)整后的配合比進(jìn)行試配,如表6共3個(gè)配合比進(jìn)行試配,表7為3組配合比試配后得出各項(xiàng)混凝土性能指標(biāo)。
為簡(jiǎn)化計(jì)算,通過(guò)主成分分析法對(duì)特征參數(shù)進(jìn)行降維,采用K-means 聚類法進(jìn)行運(yùn)動(dòng)學(xué)片段分類,取各聚類中心距離最近的30 個(gè)運(yùn)動(dòng)學(xué)片段進(jìn)行隨機(jī)組合,構(gòu)建工況集合,并選取誤差最小的工況作為構(gòu)建工況,如圖3所示。
圖3 機(jī)動(dòng)車行駛工況構(gòu)建流程Fig.3 Flow chart of construction of vehicle driving cycle
調(diào)用Python中的數(shù)據(jù)降維庫(kù),使用其中的PCA函數(shù)對(duì)標(biāo)準(zhǔn)化后的特征參數(shù)值進(jìn)行降維。設(shè)定超參數(shù)n_components 為0.9,即選取累計(jì)貢獻(xiàn)率達(dá)到90%的主成分,基本涵蓋全部信息。最終選取5 個(gè)主成分表征全部特征參數(shù)。因子載荷矩陣計(jì)算結(jié)果如表2所示,主成分1 表達(dá)了平均速度、最大速度、平均行駛速度、速度標(biāo)準(zhǔn)差、加速時(shí)間比和最小減速度;主成分2表達(dá)了怠速時(shí)間比、平均加、減速度和加、減速度標(biāo)準(zhǔn)差;主成分3 表達(dá)了減速時(shí)間比;主成分4表達(dá)了最大加速度;主成分5主要表達(dá)了加速時(shí)間比。
表2 運(yùn)動(dòng)學(xué)片段的因子載荷矩陣Table 2 Factor load matrix of kinematic segment
通過(guò)K-means 聚類算法將運(yùn)動(dòng)學(xué)片段分類。調(diào)用Python中的數(shù)據(jù)聚類庫(kù),使用K-Means函數(shù)對(duì)降維后的主成分進(jìn)行聚類處理,選取Calinskiharabaz分?jǐn)?shù)[10]作為評(píng)價(jià)指標(biāo),解決評(píng)估分類的合理性,分別計(jì)算不同分類下的Calinski-harabaz 分?jǐn)?shù)值,計(jì)算公式為
式中:m為樣本總量;k為分類的數(shù)量;Bk為簇間協(xié)方差矩陣;Wk為簇內(nèi)協(xié)方差矩陣;tr 為矩陣的跡。
s(k)分?jǐn)?shù)越大,類別內(nèi)部數(shù)據(jù)的協(xié)方差越小,聚類效果就越好。計(jì)算不同聚類數(shù)的s(k)值,如圖4所示,驗(yàn)證表明聚類數(shù)為3時(shí)最合理。
圖4 聚類數(shù)量折線圖Fig.4 Line chart of number of clusters
將1445個(gè)運(yùn)動(dòng)學(xué)片段劃分為3類,聚類結(jié)果如圖5所示。第1類、第2類和第3類運(yùn)動(dòng)學(xué)片段數(shù)分別為581、362和502個(gè)。計(jì)算各類運(yùn)動(dòng)學(xué)片段的特征參數(shù)值,結(jié)果如表3所示。從聚類結(jié)果來(lái)看,第1類圓形圖標(biāo)運(yùn)動(dòng)學(xué)片段平均速度最低,怠速時(shí)間比很高,平均加速度、減速度均較大,表征了較為擁堵的城市支路運(yùn)行模式;第2類矩形圖標(biāo)運(yùn)動(dòng)學(xué)片段平均速度和怠速時(shí)間比適中,表征了城市主干道的中速行駛特征;第3類三角形圖標(biāo)運(yùn)動(dòng)學(xué)片段平均速度最大,怠速時(shí)間比最小,表征了快速路的高速運(yùn)行特征。
圖5 全部運(yùn)動(dòng)學(xué)片段的聚類Fig.5 Clustering of all kinematic segments
表3 3類運(yùn)動(dòng)學(xué)片段的數(shù)據(jù)特征值Table 3 Data eigenvalues of three types of kinematic segments
(1)行駛工況合成
式中:Ni為構(gòu)建工況包含第i類運(yùn)動(dòng)學(xué)片段數(shù)量;Ti為第i類運(yùn)動(dòng)學(xué)片段總時(shí)間;Ts為全部運(yùn)動(dòng)學(xué)片段總時(shí)間;Dt為期望工況時(shí)長(zhǎng),已有研究表明行駛工況長(zhǎng)度取決于全部收集數(shù)據(jù)的短行程片段的平均長(zhǎng)度[7],考慮到本文短行程片段的平均長(zhǎng)度為137 s,最終設(shè)置期望工況時(shí)長(zhǎng)為1300 s;ti為第i類運(yùn)動(dòng)學(xué)片段平均時(shí)長(zhǎng)。
各類運(yùn)動(dòng)學(xué)片段總時(shí)間分別為105305,30474,62655 s,將1300 s 設(shè)定為工況時(shí)長(zhǎng)期望值,則各類運(yùn)動(dòng)學(xué)片段占行駛工況的時(shí)間分別為689,200,410 s,最終根據(jù)式(2)確定構(gòu)建工況包含第1 類、第2類和第3類運(yùn)動(dòng)學(xué)片段分別為4,2,3個(gè)。
將各類距離聚類中心最近的前30個(gè)運(yùn)動(dòng)學(xué)片段作為備選片段,根據(jù)各類片段數(shù)量要求隨機(jī)抽取備選片段合成行駛工況,篩選時(shí)長(zhǎng)在1200~1300 s內(nèi)的工況加入工況集合,創(chuàng)建大小為400的工況集合。由于數(shù)據(jù)采集車輛行駛過(guò)程中可能受到個(gè)別事件影響,導(dǎo)致構(gòu)建工況與原始數(shù)據(jù)間的最大速度和最大加、減速度誤差過(guò)大,綜合實(shí)際,考慮不適合作為構(gòu)建工況的評(píng)價(jià)指標(biāo),選取其余11 個(gè)特征參數(shù)構(gòu)建評(píng)價(jià)體系。取集合中與原始數(shù)據(jù)相對(duì)誤差最小的工況作為構(gòu)建工況。
(2)工況合成分析
如圖6所示,按照工況合成方法,構(gòu)建時(shí)間長(zhǎng)度為1275 s 的機(jī)動(dòng)車行駛工況(簡(jiǎn)稱工況1),與原始數(shù)據(jù)的平均相對(duì)誤差為2.97%。對(duì)比工況1與原始數(shù)據(jù)的特征參數(shù),如表4所示,加速度標(biāo)準(zhǔn)差和勻速時(shí)間比相對(duì)誤差分別為6.43%和5.82%,其余特征參數(shù)相對(duì)誤差均在5%以內(nèi)。
圖6 工況1時(shí)間速度曲線Fig.6 Time-speed curve of driving cycle 1
表4 特征參數(shù)對(duì)比分析表Table 4 Comparative analysis table of characteristic parameters
基于隨機(jī)選擇構(gòu)建行駛工況的方法易于理解,但是隨機(jī)性太強(qiáng),構(gòu)建工況誤差不穩(wěn)定。為此,研究通過(guò)添加約束條件的方式改進(jìn)自編碼器建立優(yōu)化模型。該模型將輸入工況作為學(xué)習(xí)目標(biāo),對(duì)輸出工況進(jìn)行表征學(xué)習(xí)并加以優(yōu)化,具體結(jié)構(gòu)[11]如圖7所示。
圖7 自編碼器圖示Fig.7 Diagram of autoencoder
為了縮小行駛工況與原始數(shù)據(jù)特征參數(shù)間的相對(duì)誤差,將行駛工況作為模型的輸入,即輸入3.4節(jié)中構(gòu)建工況的逐秒速度數(shù)據(jù),但其意義并不在于簡(jiǎn)單的重構(gòu)行駛工況,而是在重構(gòu)自身的同時(shí),加入新的損失函數(shù),使輸出行駛工況的相對(duì)誤差更小。如果僅將特征參數(shù)誤差作為損失函數(shù),會(huì)導(dǎo)致輸出工況不符合實(shí)際。因此將構(gòu)建工況作為輸入,設(shè)置兩個(gè)損失函數(shù):一是輸入與輸出之間的均方差;二是輸出工況與原始數(shù)據(jù)特征參數(shù)間的相對(duì)誤差。以此保證輸出工況縮小誤差的同時(shí)不脫離車輛實(shí)際運(yùn)行規(guī)律。
基于Python3.8 語(yǔ)言和Tensorflow2.0 平臺(tái)搭建自編碼器優(yōu)化模型,輸入與輸出的神經(jīng)元個(gè)數(shù)均為構(gòu)建工況的時(shí)間長(zhǎng)度。為了更好地學(xué)習(xí)到輸入數(shù)據(jù)的特征、簡(jiǎn)化計(jì)算復(fù)雜度,設(shè)置單個(gè)隱藏層、共1300 個(gè)神經(jīng)元,選取relu 函數(shù)作為激活函數(shù),選取SGD優(yōu)化器,學(xué)習(xí)率大小為3×10-5,損失函數(shù)為
式中:L為損失函數(shù);Eerror1為特征參數(shù)相對(duì)誤差;λ為Eerror1權(quán)重;Eerror2為輸入與輸出間的均方差。
計(jì)算Eerror1時(shí)包括11個(gè)特征參數(shù),λ和各個(gè)參數(shù)的權(quán)重均為可調(diào)節(jié)的超參數(shù),以優(yōu)化效果為目標(biāo)重復(fù)多次實(shí)驗(yàn)進(jìn)行調(diào)參,最終確定λ值為1.5,平均速度和平均行駛速度的權(quán)重均為200,平均加速度和平均減速度的權(quán)重均為100,其余參數(shù)權(quán)重均為1。
經(jīng)過(guò)150 次迭代,模型收斂。結(jié)果顯示,由于機(jī)器學(xué)習(xí)利用模型對(duì)數(shù)據(jù)進(jìn)行擬合,導(dǎo)致輸入工況速度為0 km·h-1的時(shí)段對(duì)應(yīng)輸出結(jié)果在0 km·h-1上下很小范圍內(nèi)波動(dòng),因此將輸出結(jié)果小于0.1 km·h-1的值近似取值為0 km·h-1。計(jì)算優(yōu)化結(jié)果的特征參數(shù)誤差,結(jié)果顯示平均誤差由2.97%縮小到2.39%。具體誤差如表5所示,加速度標(biāo)準(zhǔn)差誤差由6.43%降到5.14%,勻速時(shí)間比誤差由5.82%降到4.76%,但由于工況1參數(shù)平均誤差小,其余參數(shù)優(yōu)化效果并不顯著。
表5 優(yōu)化工況特征參數(shù)分析表Table 5 Characteristic parameter analysis table of optimized driving cycle
為再次驗(yàn)證模型優(yōu)化效果,在工況集合中隨機(jī)選取一個(gè)工況(簡(jiǎn)稱工況2)輸入自編碼器進(jìn)行優(yōu)化。工況2的時(shí)間-速度曲線如圖8所示,平均相對(duì)誤差為4.90%,具體參數(shù)取值及優(yōu)化效用如表6所示??傮w優(yōu)化效果明顯,平均優(yōu)化效用達(dá)到1.25%。由此可見(jiàn),當(dāng)構(gòu)建工況特征參數(shù)平均相對(duì)誤差較大時(shí),模型的優(yōu)化效果更好,說(shuō)明自編碼器可以很好地克服隨機(jī)選擇過(guò)程中誤差不確定性大的缺點(diǎn)。
表6 工況2的優(yōu)化結(jié)果Table 6 Optimization result of driving cycle 2
圖8 工況2的時(shí)間速度曲線Fig.8 Time-speed curve of driving cycle 2
為了直觀了解模型的優(yōu)化策略,可視化工況1、工況2優(yōu)化前后的差值圖,如圖9和圖10所示。由于工況1的平均行駛速度略低,因此模型通過(guò)提升車輛行駛狀態(tài)的運(yùn)行速度以縮小誤差,比較符合實(shí)際,證明了優(yōu)化模型的可行性。
圖9 工況1優(yōu)化前后差值圖Fig.9 Difference graph of optimized driving cycle 1 and driving cycle 1
圖10 工況2優(yōu)化前后差值圖Fig.10 Difference graph of optimized driving cycle 2 and driving cycle 2
工況2 的平均速度和平均行駛速度均高于原始數(shù)據(jù),如圖10所示,模型通過(guò)降低車輛行駛狀態(tài)的運(yùn)行速度以縮小誤差。且優(yōu)化幅度比工況1更大,說(shuō)明自編碼器模型的優(yōu)化策略更符合實(shí)際情況。
研究基于仿真數(shù)據(jù)強(qiáng)化學(xué)習(xí)的數(shù)據(jù)分析理論,通過(guò)對(duì)自編碼器的損失函數(shù)施加約束,提出混合約束自編碼器的工況智能優(yōu)化算法,構(gòu)建了采集數(shù)據(jù)預(yù)處理-短行程片段劃分-隨機(jī)選擇合成工況-自編碼優(yōu)化的系統(tǒng)性工況的智能方法。重點(diǎn)研究了不脫離車輛實(shí)際運(yùn)行規(guī)律,縮小特征參數(shù)值與原始數(shù)據(jù)誤差,最終將平均誤差由2.97%縮小到2.39%。分析了模型的優(yōu)化結(jié)果以及優(yōu)化策略,發(fā)現(xiàn)對(duì)于誤差較大的工況,優(yōu)化效用更高且優(yōu)化策略符合實(shí)際。解決了基于隨機(jī)組合構(gòu)建工況過(guò)程的誤差不穩(wěn)定、可靠性差的問(wèn)題。
驗(yàn)證了自編碼器優(yōu)化工況的可行性,并給出具體模型參數(shù)取值推薦。不同的駕駛行為和機(jī)動(dòng)車類型會(huì)展現(xiàn)出不同的工況特性,而本文獲取數(shù)據(jù)較為單一,同一輛車僅能代表單一駕駛行為、單一機(jī)動(dòng)車類型,因此未來(lái)可在加大數(shù)據(jù)量的條件下綜合考慮不同駕駛行為,開(kāi)展面向不同城市本地化機(jī)動(dòng)車行駛工況的構(gòu)建,并進(jìn)行不同機(jī)動(dòng)車類型的工況構(gòu)建研究,進(jìn)一步驗(yàn)證所提出方法的可行性。