謝燕芳,黎 飛,程 登,王興月,馮鈺杰
(上汽通用五菱汽車股份有限公司廣西汽車新四化重點(diǎn)實(shí)驗(yàn)室,廣西 柳州 545007)
隨著全球氣溫逐年上升和化石能源日益緊缺,各國(guó)對(duì)新能源汽車的關(guān)注和需求日漸增長(zhǎng)。截至2021年6月,全國(guó)汽車保有量達(dá)2.92億輛,其中新能源汽車603萬(wàn)輛,占汽車總量的2.06%。2021年上半年全國(guó)新注冊(cè)登記機(jī)動(dòng)車1 871萬(wàn)輛、新能源汽車110.3萬(wàn)輛,均創(chuàng)同期歷史新高。
電池續(xù)航和電池充電是用戶非常關(guān)注的兩個(gè)信息,電池續(xù)航能量讓用戶可以了解到車輛可以跑多遠(yuǎn),電池充電時(shí)間可以讓用戶了解多長(zhǎng)時(shí)間充滿,以更好地安排出行計(jì)劃。充電時(shí)間預(yù)測(cè)是根據(jù)用戶的車輛的充電大數(shù)據(jù),預(yù)測(cè)出車輛從充電時(shí)刻到充滿時(shí)刻的時(shí)長(zhǎng),并通過(guò)手機(jī)APP端實(shí)時(shí)告知用戶,讓用戶實(shí)時(shí)了解到車輛充滿的時(shí)長(zhǎng),以便于更好規(guī)劃出行,極大地提高了用戶用車的便利性。
在現(xiàn)有技術(shù)中,一般通過(guò)專家經(jīng)驗(yàn)預(yù)測(cè)電池的充電時(shí)間或者根據(jù)物理公式預(yù)測(cè)電池的充電時(shí)間[1]。根據(jù)經(jīng)驗(yàn)預(yù)測(cè)電池的充電時(shí)間即依據(jù)近3個(gè)月的充電情況去預(yù)測(cè)充電時(shí)間,先計(jì)算每次充電SOC平均充電時(shí)間,然后根據(jù)需要充滿的SOC乘以充電時(shí)間,公式如下:
根據(jù)物理公式預(yù)測(cè)電池的充電時(shí)間即依據(jù)充電過(guò)程的物理特征預(yù)測(cè)充電時(shí)間,即使用額定能量、充電電流、充電電壓和充電SOC值計(jì)算充電時(shí)間,公式如下:
但充電環(huán)境溫度、充電電網(wǎng)穩(wěn)定性、電池充電策略等因素會(huì)導(dǎo)致經(jīng)驗(yàn)預(yù)測(cè)和物理公式預(yù)測(cè)會(huì)有較大偏差。我們使用平均誤差和方差對(duì)專家經(jīng)驗(yàn)預(yù)測(cè)和物理公式預(yù)測(cè)效果進(jìn)行評(píng)估,其中:
專家經(jīng)驗(yàn)預(yù)測(cè)平均誤差值11.2 min,方差為4.9 min;公式預(yù)測(cè)平均誤差值13.6 min,方差為5.9 min??傮w預(yù)測(cè)效果并不理想,因此我們引入了機(jī)器學(xué)習(xí)的方法進(jìn)行電池充電預(yù)測(cè)。
本文抽取了100臺(tái)新能源汽車使用機(jī)器學(xué)習(xí)方法預(yù)測(cè)充電時(shí)長(zhǎng),為了評(píng)估模型的可行性,我們首先需要對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)探索;其次對(duì)數(shù)據(jù)進(jìn)行異常數(shù)據(jù)的預(yù)處理以利于提高機(jī)器學(xué)習(xí)結(jié)果的準(zhǔn)確率;第三,我們使用對(duì)清洗完成的數(shù)據(jù)進(jìn)行一次特征工程加工,產(chǎn)生模型需要輸出的特征參數(shù);最后將樣本分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于模型訓(xùn)練,測(cè)試集用于預(yù)測(cè)結(jié)果測(cè)試,結(jié)果評(píng)估仍按照平均誤差值和方差進(jìn)行評(píng)估。
車輛數(shù)為100臺(tái);數(shù)據(jù)時(shí)間為2020-07-01至2020-08-30、2020-12-01至2021-01-31;車輛位置:廣西、海南、山東、黑龍江、四川;研究目的為通過(guò)電池充電時(shí)間相關(guān)影響因素預(yù)測(cè)新能源汽車電池充電時(shí)間。
1)數(shù)據(jù)字段:容量提取和建模需要的特征字段在原始數(shù)據(jù)中都存在。
2)數(shù)據(jù)精度:除了SOC和充電電壓的精度偏低,其他的數(shù)據(jù)字段的精度都符合要求,如表1所示。
表1 數(shù)據(jù)字段精度說(shuō)明
3)數(shù)據(jù)質(zhì)量:時(shí)間數(shù)據(jù)質(zhì)量良好,重復(fù)時(shí)間數(shù)據(jù)很少,10 s間隔基本穩(wěn)定,如表2所示。充電數(shù)據(jù)質(zhì)量較好,充電次數(shù)較多,充電SOC跨度較大,利于模型訓(xùn)練;跳變數(shù)據(jù)少。
表2 數(shù)據(jù)字段質(zhì)量表
為了預(yù)測(cè)結(jié)果更精確,需要控制數(shù)據(jù)質(zhì)量,因而本文對(duì)收集的數(shù)據(jù)進(jìn)行了預(yù)處理。主要是對(duì)原始數(shù)據(jù)字段中的一些異常值、空值和跳變數(shù)據(jù)進(jìn)行處理,具體如下:
1)對(duì)數(shù)據(jù)進(jìn)行去重,對(duì)每個(gè)充電過(guò)程中的完全重復(fù)的數(shù)據(jù),都只會(huì)保留其中一條,其余數(shù)據(jù)刪除。
2)時(shí)間戳異常值處理,主要針對(duì)年、月、日、時(shí)、分、秒設(shè)定各自的取值范圍,比如月的取值范圍是1~12,日的取值范圍是1~31等,超出范圍的數(shù)據(jù)會(huì)整條被刪除。
3)按照時(shí)間順序?qū)?shù)據(jù)值進(jìn)行排序。
4)去除“臟”數(shù)據(jù),剔除超出數(shù)據(jù)范圍的數(shù)據(jù),并對(duì)其余的數(shù)據(jù)按照給定的范圍進(jìn)行數(shù)據(jù)篩選。
5)對(duì)缺失值(NAN)進(jìn)行處理,當(dāng)字段的缺失比例非常低時(shí)(如5%以內(nèi))利用線性插值法填補(bǔ)存在缺失的觀測(cè)數(shù)據(jù),當(dāng)某些變量的缺失比例非常高時(shí)(超過(guò)85%),直接刪除這些缺失變量。
6)對(duì)在時(shí)間上有跳變的數(shù)據(jù)進(jìn)行拼接。
3.4.1 充電時(shí)間預(yù)測(cè)流程圖(見(jiàn)圖1)
1)輸入原始數(shù)據(jù):輸入每臺(tái)車的原始數(shù)據(jù),車聯(lián)網(wǎng)顆粒度最小的數(shù)據(jù);
2)提取充電片段信息:以車號(hào)為索引篩選各車輛數(shù)據(jù),按照整車模式判斷條件提取充電片段的充電片段;
3)異常數(shù)據(jù)清洗:按照數(shù)據(jù)預(yù)處理的方法處理異常數(shù)據(jù);
4)充電數(shù)據(jù)特征計(jì)算:計(jì)算充電時(shí)間的特征值和電流平滑值;
5)訓(xùn)練集和測(cè)試切分:按照80%訓(xùn)練集和20%測(cè)試集計(jì)行切分?jǐn)?shù)據(jù);
6)充電時(shí)間預(yù)測(cè)模型建:使用隨機(jī)森林方法對(duì)測(cè)試集進(jìn)行訓(xùn)練,然后使用模型進(jìn)行測(cè)試;
7)結(jié)束:輸出結(jié)果。
3.4.2 充電時(shí)間預(yù)測(cè)說(shuō)明
對(duì)比了公式預(yù)測(cè)和隨機(jī)森林的方法,我們可以看到隨機(jī)森林準(zhǔn)確性和收斂性均有較好的表現(xiàn)。從圖2、圖3數(shù)據(jù)來(lái)看,粗線為對(duì)角線,細(xì)線為上下波動(dòng)15 min的線,使用公式計(jì)算會(huì)發(fā)現(xiàn)時(shí)間預(yù)測(cè)會(huì)總體偏小,且散點(diǎn)較多,離散度非常高。從隨機(jī)森林來(lái)看,波動(dòng)性相對(duì)較為穩(wěn)定,也較為收斂。
3.4.3 隨機(jī)森林結(jié)果指標(biāo)對(duì)比
從擬合優(yōu)度、|預(yù)測(cè)-實(shí)際|平均值、|預(yù)測(cè)-實(shí)際|標(biāo)準(zhǔn)差、|預(yù)測(cè)-實(shí)際|最大值各項(xiàng)指標(biāo)來(lái)看,隨機(jī)森林模型預(yù)測(cè)效果各項(xiàng)指標(biāo)表現(xiàn)良好,對(duì)充電時(shí)間預(yù)測(cè)準(zhǔn)確率提升較大,如下頁(yè)表3所示。
表3 隨機(jī)森林結(jié)果指標(biāo)對(duì)比表
從預(yù)測(cè)結(jié)果來(lái)看,引入了機(jī)器學(xué)習(xí)算法后充電時(shí)間預(yù)測(cè)準(zhǔn)確率可以滿足用戶對(duì)滿充時(shí)長(zhǎng)的了解,汽車廠家可以實(shí)時(shí)給用戶提供滿充時(shí)長(zhǎng)的查詢,讓用戶清晰明了地知道滿充需要花費(fèi)的時(shí)長(zhǎng),合理規(guī)劃充電和出行,提高用戶的滿意度。
但是隨機(jī)森林結(jié)果隨SOC增加偏差越大,特別是SOC接近100%的時(shí)間,因?yàn)殡姵爻潆姴呗缘牟煌瑫?huì)造成偏差越來(lái)越大。其次充電過(guò)程會(huì)有各類異常出行,會(huì)導(dǎo)致充電預(yù)測(cè)時(shí)間的波動(dòng),需要考慮更多的異常值處理,使用低通濾波處理掉一部分?jǐn)?shù)據(jù)后再進(jìn)行改進(jìn)。另外,因?yàn)殡姵氐牟町愋裕P偷恼{(diào)整需要不斷改進(jìn),需要加入更多的電池特性數(shù)字。因此,我們應(yīng)該在大量車輛驗(yàn)證后,對(duì)模型進(jìn)行不斷地優(yōu)化,在使用過(guò)程中不斷地調(diào)整模型,提高預(yù)測(cè)模型的準(zhǔn)確度,給用戶提供更為準(zhǔn)確的充電預(yù)測(cè)時(shí)間。