李文魁 邱宇 陳海江
(上海汽車集團股份有限公司技術(shù)中心,上海 201804)
主題詞:虛擬路譜 評價 高斯核函數(shù) 支持向量機
相比于傳統(tǒng)的傳感器式路譜采集,虛擬路譜具有成本低、周期短等優(yōu)勢,已經(jīng)廣泛用于汽車數(shù)據(jù)采集和疲勞耐久分析[1-4]。
路譜是臺架試驗和計算機仿真的輸入,為了確保試驗和仿真的準確度,路譜的準確度尤其重要[5],虛擬路譜與實車路譜的差異性評價也十分關(guān)鍵[6-7]。
路譜時域信號的評價方法主要分為主觀評價和客觀評價。主觀評價主要依靠工程師的經(jīng)驗進行判斷,或者根據(jù)行業(yè)內(nèi)建立的準則進行打分,這種方法需要有經(jīng)驗的工程師花費大量的時間。客觀評價的主要手段是對時域信號進行統(tǒng)計學分析[8],利用客觀統(tǒng)計量進行評價,這種方法的準確度不是很高,易出現(xiàn)統(tǒng)計量差異很大,但實際路譜差異在接受范圍內(nèi)的情況。
本文針對主、客觀評價的問題,利用監(jiān)督學習的思想,提出一種將主觀評價和客觀評價的優(yōu)點進行結(jié)合的虛擬路譜評價方法,將原始路譜信號和預測路譜信號客觀統(tǒng)計量差值的百分比作為特征數(shù)據(jù),以多位有經(jīng)驗工程師的主觀平均分作為標簽數(shù)據(jù),根據(jù)虛擬路譜和實際路譜的差異評分,并以此數(shù)據(jù)集為基礎(chǔ),利用支持向量機(Support Vector Machine,SVM)算法進行擬合[9],獲得虛擬路譜評分模型。
為了描述時域信號,本文基于統(tǒng)計值創(chuàng)建了最大值、最小值、均方根、極差、損傷、時域均方根誤差、頻域均方根誤差、標準差、方差、峰值因子、50%最大值以上的均方根誤差、50%最小值以下的均方根誤差、75%最大值以上的均方根誤差和75%最小值以下的均方根誤差共14個特征值。
為了方便比較,設(shè)特征值為:
式中,F(xiàn)OD、FPreD分別為原始信號和預測信號的統(tǒng)計值。
主觀評分與特征值的相關(guān)性關(guān)系到模型的準確性,本文對主觀評分的平均值和特征值的相關(guān)性進行分析,結(jié)果如圖1所示。
圖1 主觀評分與各特征值的相關(guān)性系數(shù)
由圖1 可以看出,均方根和標準差與主觀評分的相關(guān)性系數(shù)相等,原因是在時域信號均值為0 的情況下兩者是相等的,本文選用的時域信號經(jīng)過了均值歸零處理,所以兩者的相關(guān)性為1。因為路譜的損傷統(tǒng)計值可以直觀地反映測試零件在路譜激勵下的疲勞壽命累計速度,所以在評價虛擬路譜時會著重比較虛擬路譜與實際路譜的損傷值差異。通常,信號的大幅值部分對損傷的貢獻量較大,50%最大值以上的均方根誤差、50%最小值以下的均方根誤差、75%最大值以上的均方根誤差、75%最小值以下的均方根誤差等特征都是為了描述虛擬路譜與實際路譜損傷值的差異而創(chuàng)建的。同時,從圖1 中可以看出,損傷特征值的相關(guān)性較低,而損傷特征值在疲勞損傷容限分析中非常重要,也是工程師評估時域信號時的重要參考內(nèi)容,造成相關(guān)性較低的原因可能與不同信號幅值的數(shù)量級相差過大有關(guān)。
圖2 所示為對損傷特征值做不同處理后與主觀評分的相關(guān)性系數(shù),經(jīng)對數(shù)處理后,損傷特征值與主觀評分的相關(guān)性系數(shù)沒有明顯提升,反而出現(xiàn)了下降,這主要是損傷的數(shù)量級差別過大引起的,為了消除這一影響,選擇對時域信號進行處理。將實際路譜信號和虛擬路譜信號的數(shù)據(jù)點同時除以實際路譜信號的最大值進行歸一化,然后對歸一化的時域信號提取特征值,并對損傷特征值進行對數(shù)處理,發(fā)現(xiàn)只進行歸一化處理的相關(guān)性與未處理時相同,而歸一化處理并進行對數(shù)處理后,損傷特征相關(guān)性明顯提升。
圖2 不同處理方式下的損傷相關(guān)性對比
根據(jù)相關(guān)性系數(shù)的大小,本文選用最大值、最小值、均方根(RMS)、極差(Range)、損傷、時域均方根、頻域均方根、方差、50%最大值以上的均方根誤差、50%最小值以下的均方根誤差這11個特征值作為訓練特征。
由于數(shù)據(jù)集不是線性可分的,本文采用帶有高斯核函數(shù)(Radial Basis Function,RBF)的支持向量機作為擬合算法,并通過網(wǎng)格搜索法來尋找懲罰系數(shù)C和內(nèi)核系數(shù)σ的最優(yōu)組合,使得決定系數(shù)R2最大。首先,對訓練用的數(shù)據(jù)集進行預處理和數(shù)據(jù)分割。將上述信號的特征值和評分作為建模的數(shù)據(jù)集,對數(shù)據(jù)集的特征值進行標準化處理,處理成均值為0、方差為1 的特征值,將70%的數(shù)據(jù)集作為訓練數(shù)據(jù)集,其余30%的數(shù)據(jù)集作為驗證數(shù)據(jù)集。然后,將訓練數(shù)據(jù)集帶入算法進行訓練,并用R2作為模型的評價指標,由于模型的R2取決于模型的雙變量值,同時指定懲罰系數(shù)C和內(nèi)核系數(shù)σ的取值范圍,使用網(wǎng)格搜索的方法,尋找R2最優(yōu)的模型參數(shù)。為了增強模型的泛化能力,采用交叉驗證的方法進行訓練。最后,利用驗證數(shù)據(jù)集來驗證模型的精度,觀察其與訓練值差別是否過大。建模流程如圖3所示。
圖3 建模流程
模型質(zhì)量的評價指標決定系數(shù)R2定義為:
R2∈[0,1],越接近1說明擬合效果越好,可認為R2>0.6的模型可以使用,R2>0.8的模型擬合度較好[10]。
將路譜信號不加區(qū)分當作一個整體,處理好的客觀統(tǒng)計值作為數(shù)據(jù)集的特征,主觀評分作為標簽,采用帶有RBF 的支持向量機擬合模型,通過網(wǎng)格搜索尋找最優(yōu)的模型參數(shù),圖4所示為根據(jù)網(wǎng)格搜索的結(jié)果作出的等高線,為了尋找準確的全局最優(yōu)參數(shù),先大范圍搜索最優(yōu)參數(shù),然后根據(jù)搜索的圖形,在R2較高的區(qū)域再進行一次網(wǎng)格搜索。經(jīng)過2次網(wǎng)格搜索,模型在C=11.12、σ=2.51處,R2達到最大值0.77。
圖4 網(wǎng)格搜索結(jié)果
R2結(jié)果滿足精度的要求,但是在進一步對不同類型的信號分開打分時卻發(fā)現(xiàn)不同信號之間的R2差異較大,結(jié)果如表1 所示。其中加速度和應(yīng)變信號的R2較大,其他類型信號的R2較小低,說明這種數(shù)據(jù)信號不加區(qū)分的統(tǒng)一模型在單獨預測某一類信號時泛化能力較弱,產(chǎn)生了過擬合的現(xiàn)象。
表1 統(tǒng)一建模的R2結(jié)果
本文將采用的時域路譜信號分為5 種類型,如表2 所示,各類信號的單位和性質(zhì)不同,且信號的量級也存在較大差異,導致建立統(tǒng)一的預測模型在預測不同的信號類型時R2差異較大。故本文建立一種按照信號通道類型劃分的獨立預測模型,通過對比2 種建模方法的驗證結(jié)果決定最終的虛擬路譜評價方法。
表2 通道信息
5 種類型信號的模型參數(shù)與R2如表3 所示,并用建立的模型來預測新的數(shù)據(jù)集,比較模型預測評分與測試模型的預測效果。
表3 分開建模結(jié)果
圖5 所示為不同類型信號建模后模型打分與真實打分的分差分布情況,設(shè)差值不超過0.5分為優(yōu)秀,不超過1分的結(jié)果可以接受。
圖5 不同信號模型的分差分布
為了確定2 種建模方法的差異,比較2 類模型預測不同類型信號數(shù)據(jù)的R2,結(jié)果如表4所示。
表4 建模結(jié)果比較
從表4中可以看出,分開建模的R2除輪心力和應(yīng)變信號外,其余3種類型信號均比統(tǒng)一建模高??紤]到建模精度的優(yōu)勢,本文選用不同信號類型分開建立的模型作為虛擬路譜的評價模型。
隨機挑選1 000 個虛擬路譜,按照信號類型的不同進行分類,利用上述的模型進行打分,分差不超過0.5的比例對比結(jié)果如圖6 所示,預測得分的對比結(jié)果如圖7所示。
圖6 分差不超過0.5分的比例對比
圖7 模型評價效果
從圖6可以看出,對1 000個虛擬路譜打分時,與主觀評價結(jié)果差值不超過0.5分的比例與建模測試時基本一致,說明本文建立的模型擁有良好的泛化能力。從圖7 可以看出,模型具有良好的打分精度,本文所建立的虛擬路譜預測模型可以有效評價虛擬路譜與實際路譜間的差異,提高虛擬路譜評價的效率和準確性。
本文提出了一種基于高斯核函數(shù)的支持向量機算法的虛擬路譜評價模型。首先,從客觀統(tǒng)計值中提取時域信號的特征值,并將特征值與利用工程師主觀評分作為數(shù)據(jù)標簽相結(jié)合構(gòu)建數(shù)據(jù)集。之后,將數(shù)據(jù)集分割為訓練集和驗證集,將訓練集代入訓練算法中,利用網(wǎng)格搜索的方法來搜索模型的最優(yōu)參數(shù),并用驗證集來驗證模型的決定系數(shù)R2是否達到標準。最后,用建立好的模型對虛擬路譜進行評分,結(jié)果表明,本文所建立的模型能有效評價虛擬路譜與實際路譜之間的差異。
本文提出的虛擬路譜評價方法實際上是一種評價2條時域信號的方法,其利用場景不只局限于虛擬路譜評價,也可以評價臺架的路譜迭代精度等。