黎沖,王成輝,王高,魯宗虎,馬成智
(1. 國家能源集團新疆能源有限責任公司,新疆 烏魯木齊 831499;2. 新疆工業(yè)云大數據創(chuàng)新中心有限公司,新疆 烏魯木齊 830026)
鋰離子電池壽命是影響其在大規(guī)模儲能電站建設和電動汽車應用的關鍵因素[1]。而鋰離子電池壽命的重要表征之一就是其健康狀態(tài)(state of health,SOH)指標[2]??焖?、準確地估計出鋰離子電池/電池組的健康狀態(tài),將對反映電池剩余能量情況的荷電狀態(tài)(state of charge,SOC)估計[3]、電池管理系統(tǒng)(battery management system,BMS)均衡電池組電壓和風險預警方面具有重要意義[4]。
目前,圍繞鋰離子健康狀態(tài)的相關研究主要圍繞表征健康狀態(tài)的因子提取和估計算法2個方面。在描述鋰離子電池健康狀態(tài)的特征因子挖掘方面,國內外研究人員從不同測試工況下鋰電池充放電電流、電壓以及溫度等監(jiān)測量分析方面開展定量研究,文獻[5]在室溫1 C恒流充電條件下以電壓為[3.6 V,4.2 V]時段內電流積分作為鋰電池的健康因子,并通過擬合三階多項式反映健康因子與電容容量的對應關系,驗證其有效性;文獻[6]從恒流充電過程中[3.9 V,4.2 ]電池電壓時間間隔、特定時段電壓值和電流值構建了3種表示電池健康狀態(tài)的特征變量,由此建立了高斯過程回歸的鋰電池SOH估計技術;文獻[7-8]通過分段化鋰電池放電過程中的電壓曲線,利用等時間間隔電壓差值,構筑了電池健康狀態(tài)描述的因子向量;文獻[9]通過分析鋰電池充放電過程,形成14個不同時段電壓和溫度特征,通過分析特征間耦合關系,完成對不同特征變量影響的分析;文獻[10]以經典的容量增量分析方法(increment capacity analysis,ICA)為基礎,考慮噪聲影響,提出利用濾波過程平滑容量增量曲線,然后以相關性分析定義出表征電池SOH的強有力特征,進而實現了SOH的高精度估計。盡管圍繞鋰電池健康因子分析已有大量研究,但是對于溫度信息的特征挖掘較少,同時大部分特征變量是通過分析觀測直接人為給定,缺乏可解釋性說明和嚴謹的機理分析。另一方面,國內外研究人員在鋰離子電池健康狀態(tài)估計方法研究中,從鋰離子電池老化機理出發(fā),圍繞鋰離子電池測試實驗、衰退經驗、建模分析以及數據挖掘等方面開展了廣泛研究[11-12],相關方法研究主要從以下4個方面開展。(1)基于測試實驗的鋰離子電池SOH測定方法,技術人員從實驗角度建立標定鋰離子電池SOH的科學途徑[13];(2)基于衰退經驗模型的鋰離子電池SOH計算方法,研究者通過鋰離子電池老化過程合理假設衰退模型形式,并基于大量實驗結果,整定模型參數,完成鋰離子電池SOH計算[14];(3)基于狀態(tài)空間建模的鋰離子電池SOH估計方法,眾多學者充分考慮模型誤差、測量誤差對于SOH估計的影響,基于狀態(tài)估計理論開展鋰離子電池的SOH估計算法研究,如卡爾曼濾波以及改進濾波方法[15]、粒子濾波[16]等;(4)基于數據驅動的SOH估計技術,為了克服等效模型的人為假設影響,各國專家學者將大數據科學應用于鋰離子電池SOH估計實現之中,通過挖掘大量電池數據下的SOH變化規(guī)律,建立高性能的鋰離子電池SOH估計模型,如高斯過程回歸模型[17]、支持向量回歸機模型[18]以及神經網絡模型[19]等。由于無須提前假設電池衰退模型的先驗條件,降低人為主觀因素對電池SOH估計過程的影響,數據驅動方式下SOH估計技術已經成為當前相關研究的熱門課題。
在各國研究人員對基于數據驅動下鋰離子電池SOH估計技術的深入研究下,鋰離子電池數據有效性、健康狀態(tài)特征顯著性、估計模型準確性以及技術驗證途徑等問題成為決定該方向發(fā)展的核心。因此,本文從鋰離子電池健康狀態(tài)估計的實現流程下的數據來源、特征工程、估計模型以及驗證方式4個方面綜述近年來國內外鋰離子電池SOH的發(fā)展,通過詳細論述各部分的技術要點和對比各種方法的優(yōu)劣,系統(tǒng)地展示出基于數據驅動下鋰離子電池SOH估計技術的研究現狀,建設性地提出其瓶頸問題和解決手段,促進該方法的持續(xù)性發(fā)展和面向實際工程的深度應用。
為了深度分析鋰離子電池SOH估計的數據驅動方法,本文首先綜述鋰離子電池SOH的定義方式、數據來源和一般性實現流程。然后討論實現流程中各核心環(huán)節(jié)的已有方法與技術要點。
在長時間使用過程中,鋰離子電池內部活性物質減少、雜質增多、晶體結構變化等因素造成鋰離子電池性能下降,其中最直接的表現是實際容量顯著下降和電池內阻增大[20]。實際容量可以定義為標準放電條件下鋰離子電池充滿電后的放電容量。而從鋰離子電池循環(huán)壽命指標考慮,隨著鋰離子電池使用,其剩余的循環(huán)次數將不斷降低,也可以用于表征鋰離子電池應用過程中的健康狀態(tài)變化。因此,圍繞上述指標變化,可以從表示電池容量、內阻物理變量[21]以及表示剩余循環(huán)次數實驗測試變量3個角度,形成電池SOH定義公式,如圖1所示。圖中:SSOH為鋰電池健康狀態(tài);Qn、Rn分別為鋰離子電池標稱(出廠時)額定容量(A·h)和內阻(mΩ);Qa(t1)、Ra(t1) 分別為時刻t1鋰離子電池的實際容量(A·h)和內阻(mΩ);REOL為鋰離子電池壽命結束時的內阻(mΩ);NTOL為鋰離子電池標準測試條件下的循環(huán)使用次數;NEq為鋰離子電池使用過程的等效使用次數。
圖1 鋰離子電池健康狀態(tài)定義方式對比Fig. 1 Comparison of lithium-ion battery SOH definition methods
從圖1中可以看出:(1)以容量和電阻作為電池SOH計算指標的方法直接且計算簡單,但是在實際應用中難以在線實時估計,并且復雜電化學過程的不確定性和測量噪聲會對估計結果產生影響;(2)以循環(huán)使用壽命為指標,需要計算電池實際應用過程的等效循環(huán)次數,但是目前尚無準確可靠的等效計算方法,難以實現。因此,圍繞鋰離子電池SOH估計和預測的主要研究是以電池容量和內阻2種指標形式進行定義。值得注意的是,在部分實際應用中對于鋰離子電池SOH零點的標定不盡相同,例如在電動汽車鋰離子動力電池應用中,電池健康狀態(tài)為零(電池需要更換退役)的標定條件要求是實際容量為標稱容量的80%、實際內阻為出廠內阻的2倍[22]。
數據驅動下的鋰離子電池SOH估計技術是一種將數據科學應用于電池領域的遷移型技術,通過回歸模型或機器學習技術,建立電池衰退特征與電池SOH的關聯模型。因此,鋰離子電池SOH估計的應用過程基本保留了數據來源、數據清洗、數據特征工程、回歸模型設計以及性能驗證5個基本部分。圖2展示了上述各基本部分在鋰離子電池SOH估計應用中的組成、作用和方法。
圖2 數據驅動的鋰離子電池健康狀態(tài)估計結構Fig. 2 Structure of data-driven lithium-ion battery SOH assessment
從圖2可以看出:(1)基于數據驅動的鋰離子電池SOH估計技術是一個多個環(huán)節(jié)串聯的系統(tǒng)工程,各部分性能均將對估計結果產生不容忽視的影響;(2)鋰離子電池數據是相關研究的基礎,數據質量決定了鋰離子電池SOH估計技術的性能上限,而電池數據獲取方式和過程決定了SOH估計技術的應用范圍。因此,對鋰離子電池數據獲取方式和過程的分析是相關研究的前提。
值得注意的是:(1)因研究側重不同,部分文獻忽略了上述結構中的某些環(huán)節(jié);(2)部分環(huán)節(jié)可以嵌套,如異常數據檢測過程可以放在特征工程之中,利用特征向量的距離進行判斷。
在基于數據驅動的鋰離子電池SOH估計研究中,鋰離子電池數據一般來源于公開的數據集和自主設計的測試實驗。目前,應用廣泛的鋰離子電池測試實驗的公開數據如表1所示。
表1 鋰離子電池測試的公開數據集Table 1 Public datasets for lithium-ion battery testing
在應用公開數據集開展鋰離子電池SOH估計技術研究中,盡管研究人員可以省去大量的實驗時間,致力于提升估計性能算法。但是,電池型號、測試條件、數據規(guī)模等因素可能制約部分研究的深度探索。更重要的是不同類型、結構和封裝下的電池差異性極大,可能造成研究者所提出的估計出現技術偏差和無效問題。因此,部分研究仍需圍繞其研究技術要點,設計自主實驗過程和測試條件,進而保障相關技術的合理性。圖3為開展電池SOH估計技術研究的典型測試實驗的內容。
圖3 鋰離子電池健康狀態(tài)估計實驗內容Fig. 3 Experiment of lithium-ion battery SOH assessment
從圖3中可以看出:(1)用于鋰離子電池SOH估計的測試實驗是電池在不同影響因素下的充放電實驗,如溫度、充放電倍率以及放電深度等,主要可以分為電性能的循環(huán)壽命測試、熱性能的循環(huán)測試以及電池的性能測試;(2)在測試實驗過程中,電池充放電形式表現為恒流充放電、混合功率脈沖、多條件(充放電倍率/溫度)下的恒流充放電等;(3)測試實驗采集的電池信息主要涵蓋電池可用容量、交直流阻抗、電池溫度、充放電電流/電壓等,這些物理量的信息采集為后續(xù)電池的特征工程奠定了數據基礎。
在獲得鋰離子電池循環(huán)壽命測試下的電流、電壓、溫度、內阻以及可用容量等原始數據后,原始數據是高維的,包含了一系列冗余、雜亂信息,并且數據稀疏造成計算量大,若直接將測量數據用于建立鋰離子電池SOH估計模型,往往模型是低效的。在數據驅動下的鋰離子電池健康狀態(tài)估計中,特征工程是指研究者主動或者自動定義出一系列反映鋰離子電池健康狀態(tài)的工程化變量,從原始數據中主動或者自動挖掘、選擇出可以更好表征鋰離子電池健康狀態(tài)的特定工程化變量,用以提升模型的SOH估計性能。特征工程的主要研究內容和流程如圖4所示,主要包含特征提取、特征處理以及特征評估3個部分。(1)特征提取是指從所測量電池充放電數據中主觀或者客觀地定義出反映鋰離子電池SOH變化過程的影響變量;(2)特征處理是指在特征提取后,分析鋰離子電池數據樣本在各特征變量上的分布情況,精簡優(yōu)化特征變量,提升其對鋰離子電池SOH的表征能力;(3)特征評估是指分析特征變量反映鋰離子電池SOH值的有效性和重要度,指導特征提取和選擇過程。
圖4 用于鋰離子電池SOH估計的特征工程Fig. 4 Feature engineering for lithium-ion battery SOH assessment
從圖4中可以看出,用于鋰離子電池SOH估計特征工程是一套從反映SOH變化的特征定義到評估其有效性的系統(tǒng)工程,旨在構建更加簡練、有效的特征變量,合理反映出鋰離子電池SOH值。目前,在鋰離子SOH估計的特征工程研究中,研究人員主要致力于反映鋰離子電池SOH值的特征提取和特征處理2個方面研究。
在數據驅動下的鋰離子電池SOH估計技術中,估計模型的輸出作為因變量表示電池的SOH值,估計模型是用于描述輸入(自變量)和輸出(因變量)之間的關系。特征提取技術用于建立并計算估計模型輸出自變量的核心基礎。在關于鋰離子電池SOH估計的已有研究中,輸入特征可以大致分為2類。(1)可以計算SOH值的直接物理量,如在循環(huán)壽命測試過程中,每次充放電過程電池可用容量、內阻的測量值[30]。在假設電池SOH演變過程具有時序性的條件下,可以利用過去一段時間SOH值估計出當前SOH值,形成自回歸模型[31]。此類SOH估計技術的難點在于確定模型輸入變量數量,即用于估計當前SOH的歷史數據長度。(2)用于表征SOH值的間接物理量,如在循環(huán)壽命測試過程中,每次充放電過程電池的電壓、電流和溫度數據,通過挖掘相關物理量的演化,定義出SOH估計模型的輸入。相關研究中最具代表性且最廣泛應用的就是ICA方法,通過計算電池容量增量對電壓增量的比值變化反映電池SOH情況,其計算公式為[32]
式中:Q(t)、U(t)和I(t)分別為循環(huán)壽命測試過程中某次測試下不同時刻電池的放電容量、輸出電壓以及輸出電流。
根據ICA方法,繪制某電池不同SOH下放電過程的ICA曲線,如圖5所示。從圖中可以看出,隨著電池SOH下降,dQ/dU曲線中最大值點以及最大值對應的電壓值逐步下降(U1>U2>U3)。因此,可以應用dQ/dU曲線的最大值及其對應電壓變化表征不同SOH下的電池特性。
圖5 容量增量分析方法結果Fig. 5 Results of incremental capacity analysis
借鑒ICA方法過程,研究人員針對循環(huán)壽命實驗過程中的電壓、電流、溫度等數據進行分析,提出一系列反映鋰離子電池SOH變化的特征變量。如文獻[33]通過分析分段SOC區(qū)間的電壓偏移序列的均值、峰度、偏度等統(tǒng)計量,建立刻畫電池SOH變化的有效特征變量;文獻[34]發(fā)現隨著電池SOH降低,在相同擱置時間下,電池電壓降變化呈增長趨勢,可以作為描述電池SOH的間接物理量;文獻[35]通過系統(tǒng)分析ICA下峰高度、峰位置、峰面積、峰寬度和峰的左右斜率等信息變化,建立了描述電池老化的關鍵特征;文獻[36]從電池充電電流、電壓和溫度曲線中提取3類共12個健康特征,完成了鋰離子電池SOH和剩余壽命的聯合估計;文獻[37]定義電池放電過程的平均電壓和平均溫度作為電池外特征變量輸入至神經網絡模型,以獲得對電池SOH的準確估計。表2列舉并分析對比了多種鋰離子電池特征提取方法及優(yōu)缺點。
表2 鋰離子電池特征提取方法及優(yōu)缺點對比Table 2 Feature extraction method and comparison of advantages and disadvantages of lithium-ion battery
綜上可以看出,目前圍繞鋰離子電池特征提取技術的研究,主要是研究人員通過電池循環(huán)壽命實驗數據,有限地分析實驗過程中測量到的各類信號變化行為與電池SOH變化的關系,是一種從結果推原因的過程。在未來研究中應該從電池老化機理出發(fā),尋找由因至果的特征提取方法。
在提取鋰離子電池SOH的特征后,為了防止大量無效、冗余特征易造成過/欠擬合的現象,研究人員需要分析各個特征變量之間以及特征變量與SOH之間的相關性,選擇并構建最能表征電池SOH的緊致特征向量,作用于后續(xù)估計模型的輸入。目前,常用于分析鋰離子電池SOH特征選擇的方法主要有以下3種。(1)基于統(tǒng)計學相關系數方法[30];(2)基于灰色系統(tǒng)理論的關聯度分析方法[38];(3)用于特征空間降維的主成分分析方法[36],表3列舉并分析對比了鋰離子電池的部分特征選擇方法及優(yōu)缺點。
表3 鋰離子電池特征選擇方法及優(yōu)缺點對比Table 3 Feature selection methods and comparison of advantages and disadvantages of lithium-ion battery
(1)相關系數法。
相關系數是一類反映變量之間相關關系的統(tǒng)計指標,常用的相關系數有Pearson相關系數 ρp、Spearman相關性系數 ρs以及Kendall相關系數。在鋰離子電池SOH估計的研究中,主要是利用前2種相關系數衡量所提取特征與電池SOH的關系,實現對有效特征的選擇,其計算公式為[36]
基于上述公式,研究人員通過選擇相關系數絕對值大的特征,輸入至估計模型之中,完成鋰離子電池SOH的優(yōu)質估計。在2種相關系數對比中發(fā)現,在不滿足Pearson 相關系數對變量連續(xù)、符合正態(tài)分布且需具備線性關系的要求時,采用Spearman 相關系數更為合適。
(2)灰色關聯度分析法(GCA)。
灰色關聯度分析法是基于因素之間發(fā)展趨勢的相似性,挖掘出其關聯程度的一種有效方法。在鋰離子電池SOH估計應用中,特征變量應具備反映鋰離子電池在循環(huán)生命周期內變化趨勢的能力。所以,研究人員可以通過此方法分析出所提取特征是否有效地映射出電池的SOH值,具體實現步驟如圖6所示。
圖6 灰色關聯度分析法流程Fig. 6 Flow chart of grey correlation analysis
從圖6可以看出,該方法清晰簡單,但是主觀性較大,體現在分辨系數和關聯度強弱定義范圍。因為該方法側重于數據本身的趨勢變化,無須對數據分布規(guī)律假設的先驗信息,這是灰色關聯度分析法的重要優(yōu)勢。
(3)主成分分析法。
不同于相關系數法和灰色關聯度分析法挖掘特征變量與因變量電池SOH值的關系,主成分分析方法是一種簡化特征集、形成低緯度特征空間的降維技術,其宗旨在于去除線性相關的冗余變量。因此,主成分分析法可以在上述2種方法去除與鋰電池SOH關聯性小的無效特征后,進一步剔除冗余特征,提升鋰離子電池SOH估計的準確性。具體實現步驟如圖7所示。
圖7 主成分分析法流程Fig. 7 Flow chart of principal component analysis
從圖7可以看出,PCA法借助于正交變換過程,將原來描述鋰離子電池SOH的特征變量重新組合成一組新的、線性無關的綜合特征變量,可以有效減少冗余特征造成的維度爆炸問題,在有限、少量數據樣本情況下,其作用將更為顯著。
在形成表征鋰離子電池SOH的特征向量后,研究者著手于構建特征向量與電池SOH的回歸模型。在數據驅動技術下,已有鋰離子電池SOH回歸模型可以分為傳統(tǒng)基于統(tǒng)計分析的回歸模型,如自回歸滑動平均模型[39]、高斯過程回歸(GPR)模型[40]、貝葉斯回歸模型等[41],以及基于機器學習的回歸模型,應用廣泛的如支持向量回歸模型[42]和神經網絡類模型[43]。
基于統(tǒng)計分析的回歸模型是一類應用統(tǒng)計學理論或者方法設計電池特征變量與SOH映射關系的方法。在鋰離子電池SOH估計中應用廣泛的3種模型如下。
(1)基于時間序列分析的自回歸模型。
時間序列分析是一類解決時間序列預測問題的建模方法。在用于鋰離子電池SOH估計中[39],是將鋰離子電池過去一段時間SOH值作為輸入,在確定模型參數和系統(tǒng)階次后,建立出對當前鋰離子電池SOH估計的自回歸模型,常用的模型有自回歸滑動平均模型(ARMA)和差分整合移動平均自回歸(ARIMA)等。服從(p,q)階的ARMA模型計算公式為
式中:SSOH(t)、ε (t)分別為時刻t的鋰離子電池SOH值和誤差值;β0、αi、βj為模型參數;p、q分別為自回歸模型和移動平均模型階次,一般根據自相關和偏自相關系數的拖尾與截尾情況確定。
此類模型的優(yōu)勢在于模型參數少且容易確定,算法復雜度低,計算量小,對數據量的要求不大,比較適用于僅獲知鋰離子電池歷史SOH值的估計場景。但是此方法難以分析多種輸入特征間的隱含關系,導致估計結果的精度較低。
(2)高斯過程回歸模型。
GPR模型的優(yōu)勢在于可以實現鋰離子電池SOH的區(qū)間估計,估計精度高。但是需要人為假設鋰離子電池SOH滿足高斯分布,且模型參數較多,計算量和計算過程比較復雜。
支持向量回歸是一種基于統(tǒng)計理論和結構風險最小化原理的機器學習方法。該算法通過映射低維特征空間至高維空間,將非線性回歸問題轉化為線性回歸問題,通過有限數據計算出最佳模型參數,完成回歸模型設計,其映射過程與原理如圖8所示。
圖8 支持向量回歸技術原理Fig. 8 Schematic diagram of support vector regression technology
利用拉格朗日乘子法和對偶原理對上述問題求解,獲得模型參數w和b。而在低緯度特征空間下的非線性回歸時,可以利用核函數計算將其轉化成高維線性問題計算,在此不做贅述。作為一種較為成熟的機器學習方法,支持向量回歸模型已經成功應用于鋰離子電池SOH估計,如文獻[44]提出一種基于局部信息融合的支持向量回歸集成模型,以該模型為基回歸器,形成鋰離子電池SOH估計的一眾模型,提升估計的魯棒性;文獻[26]提出最小二乘環(huán)支持向量回歸模型估計鋰離子電池SOH,將原方法中不等式約束轉變?yōu)榈仁郊s束,提高了模型參數求解速度和估計精度;文獻[45-46]分別提出利用改進狼群算法和蟻獅算法等群智能優(yōu)化算法整定回歸模型參數,獲得了更為優(yōu)異的鋰離子電池SOH估計精度。
支持向量回歸模型的優(yōu)勢在于適用于鋰離子電池實驗測試困難的小樣本場景,規(guī)模模型的參數少導致計算量小且估計精度較高。但是支持向量回歸模型是核函數選擇沒有通用標準,需要不斷嘗試,在大數據樣本場景中,核函數映射的維度過高,導致計算量過大,變得不太適合使用。
神經網絡是一類通過多層級、多數量神經元以一定方式連接形成的、反映輸入至輸出映射關系的網絡模型。從理論上講,神經網絡可以擬合/回歸出任意函數形式,適用于多特征變量下復制的非線性系統(tǒng)建模,其經典的BP神經網絡結構如圖9所示,數學模型為
圖9 BP神經網絡結構Fig. 9 Back propagation neural network structure
應用神經網絡模型估計SOH的過程可以分為訓練和應用2個階段。在訓練階段,在已知大量特征向量數據和對應的鋰離子電池SOH的情況下,計算模型的權重系數等參數;在應用過程中,在已知模型參數后,基于當前測量所得特征向量,根據神經網絡模型估計出電池當前的SOH。以誤差反向傳播神經網絡為例,模型訓練過程如下:設損失函數為均方根誤差J如式(11)所示,根據鏈式法則計算權重系數和偏移系數的誤差反向傳播梯度如式(12)所示,迭代更新如式(13)所示,η表示學習率,反復迭代更新各權重矩陣和偏移矩陣參數,直至滿足停止條件。
在鋰離子電池SOH估計應用方面,研究人員除了靈活使用BP神經網絡外,為科學地分析電池數據場景、特征特點等因素,提出了適合于小樣本情況的Elman網絡應用[47]、提升神經網絡預測精度的徑向基神經網絡[48]以及提高非線性學習能力的自組織映射神經網絡[49]。除此之外,遵循數據固有特征的深度學習技術也逐步地應用于鋰離子電池SOH估計過程中,例如文獻[24]設計出一種改進時間卷積網絡捕獲時間序列特征與電池SOH 之間的因果關系;文獻[50]將注意力機制引入雙向門控循環(huán)單元神經網絡之中,實現對關鍵特征的權重分配,進而完成了鋰離子電池特征至SOH值的高精度映射;文獻[51]結合長短期記憶神經網絡與支持向量模型,彌補了傳統(tǒng)支持向量機對于時間序列描述的不足,提升了SOH預測性能;文獻[52]提出將LightGBM和CatBoost等集成學習方法融入長短期記憶網絡,建立了鋰電池實時SOH預測模型,準確地預測了電池SOH未來的性能衰退趨勢。
神經網絡模型的優(yōu)勢在于可以解決鋰離子電池特征向量至SOH的多樣、復雜、非線性映射關系,模型估計精度高,適應性好。但是神經網絡的模型參數眾多,高精度估計性能往往需要大量且全面的數據樣本,并且計算量大,比較依賴網絡結構和參數初始化位置。
綜上所述,基于數據驅動的鋰離子SOH估計技術方法眾多且日益成熟。表4從模型精度、算法復雜度、數據量需求和計算量4個方面對比了相關技術,可以看出不同的SOH估計方法特點鮮明,各具優(yōu)勢,適用于不同應用場景。
表4 鋰離子電池健康狀態(tài)估計模型性能對比Table 4 Performance comparison of SOH assessment models for lithium-ion batteries
在完成數據采集清晰、典型特征工程和基于數據驅動的鋰離子SOH估計模型后,需要充分驗證設計方法的有效性和可靠性。不適當的驗證方式無法形成對模型真實性能的準確認知。模型性能驗證方式直接決定了該方法模型的實際應用可行性。目前模型性能驗證方式主要有以下3種。(1)Holdout驗證,又稱留出法,將數據集換分為2兩個互斥集合,分別用于訓練和驗證;(2)k-fold交叉驗證,又稱循環(huán)估計,將數據集拆分為k個互斥集合,逐一作為驗證集(其余集合整體為訓練集),由k個驗證集的平均值評估模型性能;(3)自助法驗證,不同于上述2類方法直接拆分互斥集合,其通過有限次有放回的抽樣形成訓練集,未被抽到的數據為驗證集。3種模型性能檢驗方式和優(yōu)缺點如圖10和表5所示。
圖10 模型性能驗證的3種典型方式Fig. 10 Three typical verification approaches of model performance
表5 模型性能驗證的3種典型方式優(yōu)缺點對比Table 5 Comparison of the advantages and disadvantages of three typical verification approaches to model performance
在目前鋰離子電池SOH估計模型中,一般采用的都是Holdout驗證方式,為了提升模型有效性驗證水平,避免電池差異造成的影響,相關研究增加多種數據來源的獨立性實驗。例如,將所提模型應用于多個開源數據集驗證,或者在自主實驗數據驗證后,通過增加開源數據集驗證環(huán)節(jié),驗證所提方法的有效性。因此,在未來研究中,為了準確地反映鋰離子電池SOH估計技術水平,研究人員需要從單一數據集下構建多子集的驗證方式(k-fold交叉驗證或者自助法)和獨立實驗下形成多個實驗驗證集2個角度同步開展,提升鋰離子電池SOH估計模型的適用性認知水平。
在明確估計模型驗證方式后,為了量化對比鋰離子電池SOH的估計效果,研究人員定義了一系列評價指標,如表6所示。表中:分別為鋰離子電池驗證集內第i個樣本的真實SOH、估計SOH和平均SOH;N表示驗證集中樣本的數量。
表6 鋰離子電池健康狀態(tài)估計性能評價指標Table 6 Performance evaluation indexes of lithium-ion battery SOH assessment
從表6可以看出:(1)部分指標之間存在表征重疊,如EMS和ERMS、EA和EMA等,在模型性能驗證時需要避免選擇表征能力重疊的指標;(2)量化的評價指標可以分為絕對誤差和相對誤差2類,其中EA、EMA、EMS和ERMS為絕對誤差類,其他的為相對誤差類,在模型性能驗證時需要在每一類中選擇合適的指標準確反映模型優(yōu)劣;(3)在應用相同數據集(開源數據)的不同SOH估計方法比較中,絕對誤差可以反映估計誤差的量級,而在應用不同數據集的比較中,數據差異性造成絕對誤差的量級不一致,因此相對誤差更為適用。
本文圍繞鋰離子電池SOH估計的數據驅動技術全流程開展綜述性研究,表現為包含數據采集與清洗、特征工程、估計建模以及性能驗證的多環(huán)節(jié)串行系統(tǒng)性工程。結合本文研究內容,本領域的未來研究需要圍繞以下4個方向深度開展。
(1)數據可靠性。數據質量決定了健康狀態(tài)估計準確性的上限。合理設計鋰離子電池測試過程和完善數據預處理技術,將是基于數據驅動的電池健康狀態(tài)估計技術首要解決的關鍵問題。
(2)特征有效性。特征變量對電池健康狀態(tài)表現能力以及特征冗余問題是制約電池健康狀態(tài)估計性能的關鍵。從電池機理和數據本身2個方面,聯合挖掘出完備特征集合,將是提高健康狀態(tài)估計精度和泛化水平的有效途徑。
(3)模型準確性。數據驅動模型是直接產生健康狀態(tài)估計值的執(zhí)行器。持續(xù)優(yōu)化估計模型結構和參數,將是提高鋰離子電池狀態(tài)估計精度性和泛化能力的另一條關鍵路徑。
(4)驗證充分性?;跀祿寗拥匿囯x子健康狀態(tài)估計技術的驗證方式和指標是考核其應用能力的必要條件。構建充分科學的驗證途徑和全面的評價指標,將為相關技術的實際工程應用提供重要保障。