郭起捷
?
損失函數(shù)在預測診斷中的應用
郭起捷
(泛亞汽車技術(shù)中心有限公司,上海 201208)
預測診斷的核心是人工智能算法,現(xiàn)今較流行的就是機器學習。通常機器學習的算法的重點是對該算法包含的目標函數(shù)優(yōu)化的過程。而在分類或者回歸問題中,通常使用損失函數(shù)作為其目標函數(shù)。損失函數(shù)用來評價模型的預測值和真實值不一樣的程度,損失函數(shù)越好,通常模型的性能越好。在文中主要就預測診斷中損失函數(shù)的應用展開探討。
損失函數(shù);預測診斷;人工智能算法
損失函數(shù)又叫代價函數(shù),成本函數(shù),它將一個或者多個變量的值或事件直觀的映射到一個實數(shù)上,來表示與該事件相關(guān)的一些成本。我們使用損失函數(shù)來優(yōu)化問題就是尋求最小化損失函數(shù)的過程。目標函數(shù)可以是一個損失函數(shù),也可以是它的負值(在特定的領(lǐng)域中又稱為獎勵函數(shù),利潤函數(shù),效用函數(shù),適應度函數(shù)等),在這種情況下,它是最大化的。成本函數(shù)應用在很多領(lǐng)域,例如數(shù)學優(yōu)化,統(tǒng)計數(shù)據(jù),決策理論,機器學習以及計算神經(jīng)網(wǎng)絡(luò)等中。
車輛某個模塊或者部件的狀態(tài)一般可以把它簡單分成“健康”和“故障”兩類,所以我們選擇邏輯回歸模型來做狀態(tài)預測。因為邏輯回歸處理的其實就是分類的問題:把一個回歸輸出的連續(xù)結(jié)果映射成可以做簡單判斷的結(jié)果值,方便我們預測或判斷。換而言之,在面對這一類回歸揮著分類問題是,我們先建立代價函數(shù),然后通過優(yōu)化方法迭代求出最優(yōu)的模型參數(shù),最后測試驗證這個模型的好壞。整個過程分成3部分:
●構(gòu)建預測函數(shù)
●構(gòu)建損失函數(shù)
● 最優(yōu)化損失函數(shù)
接下來我們舉例討論電池能量控制模塊BECM,該模塊主要有模塊電壓,蓄電池組高/低分辨電流,蓄電池組終端電壓,蓄電池組冷卻液溫度等變量參數(shù),每個參數(shù)都有一個正常的范圍值,當超出這個范圍就可視作該模塊控制的蓄電池組出現(xiàn)問題或故障。為了簡化討論,我們選取兩個變量:終端電壓和冷卻液溫度,分別記作1,2,我們利用這兩個變量來構(gòu)建一個線性回歸模型(為了提高算法效率,我們把這個線性方程向量化,為截距0乘以系數(shù)o=1):
這是一個線性方程,我們需要利用Sigmoid函數(shù)把這個線性方程映射到我們需要的邏輯回歸模型上所以得到一個邏輯回歸目標函數(shù),就是預測函數(shù):
我們前面談到對數(shù)損失函數(shù)適合來解決邏輯回歸問題,針對全體樣本的損失函數(shù)則為:
合并邏輯回歸函數(shù),得到最終的損失函數(shù)為:
損失函數(shù)確定下來,我們根據(jù)實際采集的數(shù)據(jù)集(分別在模塊狀態(tài)健康時和發(fā)生該故障時采集的相關(guān)變量集合和與之對應的狀態(tài))來訓練這個分類器模型,求解得到期望損失最小的(回歸系數(shù)),這個邏輯回歸過程等價于求解:
通常我們使用梯度下降算法來最小化這個期望損失。
我們實車獲取100組電壓和溫度數(shù)據(jù)以及在這兩個參數(shù)對應的蓄電組的狀態(tài)-健康記為0,故障記為1。其中選取前90組用來訓練模型,后10組看用作測試數(shù)據(jù)。利用上面的求解算法得出回歸系數(shù)[7.26311 0.57834 -0.15613]。另外如果訓練不充分的話,反映在這里就會得出不同的回歸系數(shù)。
我們再把剩下的10組數(shù)據(jù)一組一組載入到回歸函數(shù)中分別得到這10組數(shù)據(jù)對應的狀態(tài)預測結(jié)果與真實的值比較,發(fā)現(xiàn)如果使用0-1的中位數(shù)0.5劃分的話,預測值和真實值完全一致,損失為0,分類效果相當?shù)暮谩8鶕?jù)公式,不同的回歸系數(shù)得出的預測值也不一樣,所以適當?shù)臄M合很重要,如果擬合的訓練數(shù)據(jù)太少,預測有可能偏差較大,造成的損失也大,反映在邏輯判斷上有可能出現(xiàn)相反的結(jié)果。但是擬合的訓練數(shù)據(jù)太大,就會過擬合,造成模型太復雜,預測能力會下降。
[1] 王蘊韜.人工智能算法梳理及解析[J].信息通信技術(shù),2018, 12(01): 63-68.
[2] 張旭濤,何楨.基于似無關(guān)回歸的多元穩(wěn)健損失函數(shù)方法[J].數(shù)理統(tǒng)計與管理,2017,36(05):802-809.
Application of Loss Function in Predictive Diagnosis
Guo Qijie
( Pan Asia Automotive Technology Centre Limited, Shanghai 201208 )
The core of prediction diagnosis is artificial intelligence algorithm, which is more popular today is machine learning. Usually the focus of the machine learning algorithm is the process of optimizing the objective function contained in the algorithm. In classification or regression problems, the loss function is usually used as its objective function. The loss function is used to evaluate the degree to which the predicted value of the model is different from the true value. The better the loss function, the better the performance of the model. In this paper, the application of loss function in predictive diagnosis is discussed.
loss function; Prediction diagnosis; Artificial intelligence algorithm
B
1671-7988(2018)18-282-02
U472
B
1671-7988(2018)18-282-02
CLC NO.: U472
郭起捷,就職于泛亞汽車技術(shù)中心有限公司。
10.16638/j.cnki.1671-7988.2018.18.098