李 婧,明廷鋒*,孫云嶺,田洪祥,盛晨興
1. 海軍工程大學(xué)動(dòng)力工程學(xué)院,湖北 武漢 430033 2. 武漢理工大學(xué)船舶動(dòng)力工程技術(shù)交通行業(yè)重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430063 3. 國家水運(yùn)安全工程技術(shù)研究中心可靠性工程研究所,湖北 武漢 430063
船舶柴油機(jī)潤滑油易受到冷卻液的污染,從而引起潤滑油老化、變質(zhì)及功能失效[1]。因此,在潤滑油使用過程中,針對潤滑油中冷卻液的污染問題,必須加以監(jiān)測,防止二次故障損失。冷卻液主要包含水、乙二醇及有機(jī)羧酸。目前可以用蒸餾法[2]和卡爾菲休滴定法[3]測量水分,間接反映冷卻液的污染。該方法一方面受到水分來源的影響,一般來說,常見的船舶柴油機(jī)潤滑油進(jìn)水來源是冷卻液,也存在進(jìn)海水或淡水的可能性。另一方面,柴油機(jī)工作時(shí),由于潤滑油溫度高,會(huì)揮發(fā)掉一部分水分。僅通過測量水分來表征冷卻液的污染是很不全面的。通過利用氣相色譜法[4]測量發(fā)動(dòng)機(jī)機(jī)油中的乙二醇。但由于測量時(shí)間長,體積大,操作比較復(fù)雜,不適合現(xiàn)場測量使用。傅里葉紅外(FT-IR)光譜法[5]可測量水和乙二醇濃度,但由于冷卻液中含一定量的水,如果測試污染油樣中水的含量過高,會(huì)使傅里葉紅外光譜儀中的分束器受潮而損傷。拉曼光譜在測試過程中,具有無需觸及試樣、儀器維護(hù)費(fèi)用低等特點(diǎn)[6],一條光譜數(shù)據(jù)隱藏了大量可分析的試樣信息,在定量分析和定性分析試樣濃度的領(lǐng)域獲得了廣泛應(yīng)用。
目前,人工神經(jīng)網(wǎng)絡(luò)和偏最小二乘法可以用于拉曼光譜分析[7]。阮華等[8]利用拉曼光譜,結(jié)合支持向量機(jī)的方法,建立汽油辛烷值的多元校正模型。徐薈迪等[9]利用馬氏距離判別方法和隨機(jī)森林判別的模式識(shí)別方法可以對具有相同拉曼峰的不同產(chǎn)地的軟玉進(jìn)行鑒別。本文使用長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM),分析柴油機(jī)冷卻液污染潤滑油的拉曼光譜數(shù)據(jù),并進(jìn)行冷卻液污染比例的定量檢測研究。
LSTM是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),其中一個(gè)關(guān)鍵性擴(kuò)展是使自循環(huán)的權(quán)重視上下文而定,而不是固定的[10]。本文給出一種基于LSTM神經(jīng)網(wǎng)絡(luò)的潤滑油冷卻液污染定量估計(jì)方法。算法分為3個(gè)部分,數(shù)據(jù)預(yù)處理、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、冷卻液濃度定量估計(jì),如圖1所示。光譜數(shù)據(jù)預(yù)處理包括數(shù)據(jù)采樣、擬合、離散點(diǎn)平均梯度估計(jì); 神經(jīng)網(wǎng)絡(luò)訓(xùn)練,包括模型結(jié)構(gòu)的選定、構(gòu)建訓(xùn)練樣本集、對神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練和測試; 冷卻液污染濃度定量估計(jì)包括原始光譜數(shù)據(jù)預(yù)處理及神經(jīng)網(wǎng)絡(luò)估計(jì)污染物濃度的檢測。
圖1 整體算法流程圖Fig.1 Overall algorithm flow chart
實(shí)驗(yàn)使用的拉曼光譜儀,型號(hào)為RamTracer,最大功率為330 mW。所檢測的光譜范圍為2 000~250 cm-1。光學(xué)分辨率小于6 cm-1。
實(shí)驗(yàn)柴油機(jī)潤滑油為殼牌喜力HX2,15W-40潤滑油,防凍冷卻液為Prestone 50/50。
油樣的配置方案為通過空白油樣,配制混入冷卻液質(zhì)量百分比濃度為2%,1.5%,1%,0.5%和0.25%的油樣,作為A組,編號(hào)分別為A1,A2,A3,A4和A5。空白油樣編號(hào)為A6。
選擇某型柴油機(jī)潤滑油的在用潤滑油,不含冷卻液的油樣,加入已知冷卻液,分別得到含0.2%和0.4%冷卻液污染的在用潤滑油,作為B組,編號(hào)分別為B1和B2。
拉曼光譜儀開機(jī)預(yù)熱30分鐘以后,進(jìn)行預(yù)先測試。將功率調(diào)節(jié)器調(diào)到合適位置以確保每次測量時(shí),在功率調(diào)節(jié)器固定不變的情況下能得到有效譜圖。功率調(diào)節(jié)器固定以后,進(jìn)行A組樣本的拉曼光譜測試,每組油樣測得拉曼光譜數(shù)據(jù)50個(gè),6組共300個(gè)數(shù)據(jù)。數(shù)據(jù)范圍為300~2 000 cm-1的拉曼光譜圖疊加如圖2所示。從拉曼光譜圖中難以看出冷卻液污染濃度與圖形之間的關(guān)系,因此必須建立污染度濃度與圖形之間的定量分析方法。
圖2 300個(gè)樣本的拉曼光譜數(shù)據(jù)Fig.2 Raman spectral data of 300 samples
以污染物為乙二醇作為研究對象,選取300~2 000 cm-1的數(shù)據(jù)作為原始的數(shù)據(jù),數(shù)據(jù)預(yù)處理算法流程:
(1) 在波段中進(jìn)行數(shù)據(jù)采樣,采樣間隔為1個(gè)波數(shù)單位,每組數(shù)據(jù)采樣得到n1個(gè)采樣點(diǎn)Wori,i=[woi,1,woi,2, …,woi,n1];
(2) 對wori,i進(jìn)行三次插值擬合,并對擬合后的曲線進(jìn)行采樣,采樣間隔為0.1,每組數(shù)據(jù)采樣得到n2個(gè)采樣點(diǎn)Wcub,i=[wci,1,wci,2,…,wci,n2];
(3) 求取各組數(shù)據(jù)wori,i中原始采樣點(diǎn)處的平均梯度Gradi=[gi,1,gi,2, …,gi,n3],每組數(shù)據(jù)得到n3個(gè)平均梯度點(diǎn),各點(diǎn)平均梯度計(jì)算公式為
(1)
選取拉曼光譜中300~2 000 cm-1段作為原始數(shù)據(jù),數(shù)據(jù)采樣間隔為1,進(jìn)行數(shù)據(jù)預(yù)處理后的梯度數(shù)據(jù)維度與原始數(shù)據(jù)一致。數(shù)據(jù)集樣本歸一化處理后,見表1所示。
表1 數(shù)據(jù)集樣本Table 1 Sample distribution of the dataset
共設(shè)計(jì)了4種神經(jīng)網(wǎng)絡(luò)模型用于污染物濃度的估計(jì),如圖3所示。
圖3(a)中模型為6層全連接層結(jié)構(gòu),該結(jié)構(gòu)用FCs(fully connected layers)表示。圖3(b)中模型在圖3(a)中模型的基礎(chǔ)上增加單層結(jié)構(gòu)的LSTM層,該結(jié)構(gòu)用LSTM-FCs-1表示。圖3(c)中模型含有兩個(gè)分支,LSTM分支和全連接分支構(gòu)成分支結(jié)構(gòu)。該結(jié)構(gòu)用LSTM-FCs-2表示。圖3(d)中模型在兩個(gè)分支結(jié)構(gòu)中的末端分別增加1個(gè)全連接層。該結(jié)構(gòu)用LSTM-FCs-3表示。
圖3 神經(jīng)網(wǎng)絡(luò)模型圖Fig.3 Neural network model diagram
從數(shù)據(jù)集中每個(gè)類別抽取其中80%的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練集中樣本,剩余20%作為測試集樣本。在模型的訓(xùn)練過程中,選用L1損失函數(shù); 訓(xùn)練策略選用隨機(jī)梯度下降法,batchsize取值為8,學(xué)習(xí)率更新策略選用step,初始學(xué)習(xí)率選擇為0.01,學(xué)習(xí)率更新間隔為每10次完全迭代,學(xué)習(xí)率衰減比例為0.1。
四個(gè)模型在數(shù)據(jù)集上最終測試結(jié)果對比見表2,前兩項(xiàng)平均誤差指標(biāo)分別為標(biāo)簽值下的平均誤差和濃度值下的平均誤差,標(biāo)簽值下的平均誤差度量為模型的輸出與樣本真實(shí)標(biāo)簽之間的差值,濃度值下的平均誤差度量為模型估計(jì)值換算至污染物實(shí)際濃度后與樣本實(shí)際濃度之間的差值,平均誤差越小表示污染物濃度估計(jì)預(yù)期準(zhǔn)確; 準(zhǔn)確率的統(tǒng)計(jì)依據(jù)為模型估計(jì)的單個(gè)樣本濃度值誤差小于0.05%,則判定為定量估計(jì)準(zhǔn)確。
表2 四個(gè)模型在數(shù)據(jù)集上測試結(jié)果對比Table 2 The test results of each model were compared on the data set
四個(gè)模型在數(shù)據(jù)集上的損失曲線如圖4所示。圖4(a)和(b)中分別為各模型在訓(xùn)練集、測試集上的損失與迭代次數(shù)的關(guān)系,隨著模型訓(xùn)練迭代次數(shù)的增加,各模型在數(shù)據(jù)集上的損失逐漸降低,最終均趨于穩(wěn)定,誤差越低,代表網(wǎng)絡(luò)模型的輸出結(jié)果越接近真實(shí)的標(biāo)簽值。根據(jù)損失曲線進(jìn)行對比不難發(fā)現(xiàn),LSTM-FCs-3模型在訓(xùn)練過程中的收斂速度最慢,且最終的平均損失最大。
圖4 損失曲線(a): 訓(xùn)練集上的損失曲線; (b): 測試集上的損失曲線Fig.4 Loss curve(a): Loss curve on training set; (b): Loss curve on the test set
四個(gè)模型在測試集上的準(zhǔn)確度如圖5所示。四個(gè)模型在測試集上的魯棒性測試如圖6所示。魯棒性測試會(huì)對測試集中每組樣本隨機(jī)抽取1%的波數(shù)數(shù)據(jù)上隨機(jī)添加不大于1%的噪聲,測試模型的抗擾動(dòng)能力。
圖5 測試集上的準(zhǔn)確率曲線Fig.5 The accuracy curve on the test set
結(jié)合圖5、圖6和表2分析,LSTM-FCs-2模型的估計(jì)最高準(zhǔn)確率達(dá)到98.3%,且該模型在訓(xùn)練集上的表現(xiàn)明顯優(yōu)于其他模型; 且在魯棒性測試中對測試集添加1%的隨機(jī)噪聲后進(jìn)行測試,LSTM-FCs-2模型最高準(zhǔn)確率仍能達(dá)到96.7%,魯棒性明顯優(yōu)于其他模型。
將B組的兩個(gè)已知冷卻液污染含量分別為0.2%和0.4%的在用油的拉曼光譜,輸入LSTM-FCs-2神經(jīng)網(wǎng)絡(luò)模型中檢測,分別得到冷卻液含量的估計(jì)值分別為0.19%和0.43%,相對誤差分別為5.0%和7.5%。
圖6 測試集上的魯棒性測試Fig.6 Robustness testing on test sets
(1)拉曼光譜是一種檢測柴油機(jī)潤滑油冷卻液污染的有效技術(shù),但是無法直接獲得拉曼光譜數(shù)據(jù)信息與潤滑油污染物濃度含量之間的對應(yīng)關(guān)系。
(2)通過對FCs,LSTM-FCs-1,LSTM-FCs-2和LSTM-FCs-3四種神經(jīng)網(wǎng)絡(luò)模型的實(shí)驗(yàn)計(jì)算結(jié)果對比,LSTM-FCs-2網(wǎng)絡(luò)模型對冷卻液污染濃度估計(jì)準(zhǔn)確率達(dá)到96.7%,魯棒性優(yōu)。因此,相對于其他三種網(wǎng)絡(luò)模型,LSTM-FCs-2網(wǎng)絡(luò)模型更適用于潤滑油冷卻液污染的拉曼光譜數(shù)據(jù)分析處理。通過對某在用潤滑油進(jìn)行冷卻液污染濃度檢測試驗(yàn),表明該方法魯棒性好,可適用于在用油冷卻液污染濃度的檢測。