歐陽愛國(guó), 唐天義, 周 鑫, 劉燕德
(華東交通大學(xué) 光機(jī)電技術(shù)及應(yīng)用研究所, 江西 南昌 330013)
?
最小二乘支持向量機(jī)結(jié)合中紅外光譜測(cè)定甲醇柴油甲醇含量
歐陽愛國(guó)*, 唐天義, 周 鑫, 劉燕德
(華東交通大學(xué) 光機(jī)電技術(shù)及應(yīng)用研究所, 江西 南昌 330013)
采用中紅外光譜法對(duì)甲醇柴油的甲醇含量進(jìn)行檢測(cè)分析。首先,對(duì)采集到的原始光譜進(jìn)行預(yù)處理(標(biāo)準(zhǔn)正則變換、多元散射校正、一階微分、二階微分、Savitzky-Goly平滑),采用偏最小二乘法和最小二乘支持向量機(jī)建立了甲醇柴油的甲醇含量預(yù)測(cè)模型,并比較了不同預(yù)處理方法對(duì)模型預(yù)測(cè)能力的影響。實(shí)驗(yàn)結(jié)果表明,LSSVM的建模效果最佳,其預(yù)測(cè)集相關(guān)系數(shù)R2為0.981 8,預(yù)測(cè)均方誤差RMSEP為1.3917%(體積比)。因此,中紅外光譜技術(shù)可用于甲醇柴油中甲醇含量的快速檢測(cè),且可以達(dá)到很好的效果。
中紅外光譜; 甲醇柴油; 偏最小二乘; 最小二乘支持向量機(jī)
汽車工業(yè)的快速發(fā)展使人們對(duì)石油的需求逐年增加,直接導(dǎo)致石油資源日益枯竭和環(huán)境惡化等問題,為解決這個(gè)問題,世界各國(guó)都在尋找石油燃料的替代品。沼氣、液化石油氣、天然氣、氫氣、二甲醚、醇類(甲醇、乙醇)、酯類(植物油、生物柴油)[1-2]等都可以作為內(nèi)燃機(jī)的替代燃料。目前,我國(guó)僅有天然氣、液化石油氣、二甲醚、甲醇較成功地應(yīng)用于柴油機(jī),但同時(shí)還需對(duì)發(fā)動(dòng)機(jī)進(jìn)行參數(shù)調(diào)整或改造[3]。其中甲醇柴油作為生物柴油的一種,是在柴油中加入一定比例的甲醇同時(shí)添加一定的助溶劑使甲醇與柴油均勻混合形成新型混合燃料。它可以代替純柴油使用,減小柴油使用量,同時(shí)也降低了我國(guó)對(duì)國(guó)外石油進(jìn)口的依賴程度。柴油中添加甲醇能夠有效減少氮氧化物、碳?xì)浠衔锏呐欧?,燃燒充分可以減少碳煙的形成。甲醇的沸點(diǎn)低于柴油沸點(diǎn),當(dāng)柴油表面燃燒時(shí),內(nèi)部的甲醇受熱并汽化,體積急劇膨脹,產(chǎn)生的巨大壓力使柴油油滴爆破,油滴進(jìn)一步變小,容易形成“二次霧化”,使柴油和空氣的接觸面積大幅度增加,提高了燃燒效率,達(dá)到節(jié)能的效果[4]。
金盼盼等[5]利用中紅外汽油分析儀,檢測(cè)了不同濃度甲醇汽油的RON辛烷值、MON辛烷值和抗爆性,比較了甲醇含量變化時(shí)的甲醇汽油辛烷值及抗爆性變化。覃旭松等[6]借助拉曼光譜技術(shù)分析了汽油辛烷值的檢測(cè)方法,同時(shí)結(jié)合小波變換和支持向量機(jī)(Support vector machine,SVM)等方法,顯著提高了模型的穩(wěn)健性和預(yù)測(cè)精度。目前,甲醇柴油中甲醇含量的光譜檢測(cè)國(guó)內(nèi)還鮮有報(bào)道。中紅外光譜檢測(cè)技術(shù)發(fā)展比較成熟,可以對(duì)固態(tài)、氣態(tài)或者液態(tài)的無機(jī)、有機(jī)、高分子化合物進(jìn)行檢測(cè),精度高,重復(fù)性好。本文主要應(yīng)用中紅外光譜技術(shù)測(cè)定甲醇柴油的甲醇含量,建立了偏最小二乘和最小二乘支持向量機(jī)模型,并比較了兩個(gè)模型的結(jié)果。
2.1 實(shí)驗(yàn)樣品
由于甲醇的親水性和柴油的親油性,甲醇和柴油是互不相溶的,兩者直接混合會(huì)出現(xiàn)明顯分層。因此,在配制甲醇柴油時(shí)需要添加助溶劑,且添加劑應(yīng)該具備親油和親水兩種性質(zhì)。常用助溶劑主要有以下幾類:植物油(脂肪酸類)、胺類、醇類等[7-8]。油酸是脂肪酸類的一種,其來源廣泛,大量存在于植物油脂中且價(jià)格低廉。油酸含有烴基和羧基,其密度、碳原子數(shù)均與柴油接近,能夠增強(qiáng)甲醇柴油的穩(wěn)定性。因此本實(shí)驗(yàn)選擇油酸作為助溶劑。
實(shí)驗(yàn)所用柴油是從學(xué)校附近某加油站購(gòu)買的中石化國(guó)四0#成品柴油,甲醇和油酸均采購(gòu)于江西贛儀科技有限公司。甲醇為實(shí)驗(yàn)用無水甲醇(純度>99.5%)。甲醇柴油配制時(shí)室溫始終控制在30 ℃左右,且油酸的加入量會(huì)隨甲醇含量、溫度等要求的不同而有所變動(dòng)。首先,通過移液槍將油酸和甲醇按大約1∶1的比例加入50 mL容量瓶形成變性甲醇。然后,加入柴油并滴定至50 mL,攪拌均勻,靜置得到淡黃色透明液體。按上述的比例和方法,分別配制了32種不同濃度的甲醇柴油溶液,甲醇的體積分?jǐn)?shù)為2%~25.8%,然后每個(gè)濃度分為3個(gè)樣品,共得到96個(gè)甲醇柴油樣品,所得32種甲醇柴油的體積分?jǐn)?shù)如表1所示。
表1 甲醇在32種甲醇柴油中的體積分?jǐn)?shù)
2.2 實(shí)驗(yàn)儀器
實(shí)驗(yàn)使用的紅外光譜儀是北京北分瑞利分析儀器(集團(tuán))公司生產(chǎn)的WQF-510A傅立葉變換紅外光譜儀,配備高性能的空冷高效球反射紅外光源、角鏡型邁克爾遜干涉儀系統(tǒng)和DTGS紅外探測(cè)器系統(tǒng)。使用上海恒平科學(xué)儀器有限公司生產(chǎn)的NDJ-5S旋轉(zhuǎn)粘度計(jì)(數(shù)字式)對(duì)甲醇柴油樣本進(jìn)行粘度測(cè)試。
2.3 光譜采集
WQF-510A傅立葉變換紅外光譜儀光譜測(cè)量范圍為7 800~350 cm-1,分辨率優(yōu)于0.85 cm-1,掃描時(shí)間設(shè)置為32 s。開機(jī)預(yù)熱30 min后,儀器方可使用。環(huán)境溫度控制在5~35 ℃之間,相對(duì)濕度控制在80%以下。采集時(shí),先將鏡片放在樣品架上,再用塑料吸管吸取甲醇柴油使之充滿整個(gè)鏡片表面,關(guān)緊儀器艙門,進(jìn)行光譜采集。每個(gè)濃度樣品制備3份,每份測(cè)3次,取平均光譜后用于后續(xù)數(shù)據(jù)處理。
2.4 數(shù)據(jù)分析
采用MainTOS光譜采集軟件來采集樣品的透過率光譜,再由“譜圖打印”專用程序進(jìn)行光譜與數(shù)據(jù)轉(zhuǎn)換處理, 使用Unscrambler (verion.10.1; CAMO AS, Trondheim, Norway)化學(xué)計(jì)量學(xué)分析軟件進(jìn)行預(yù)處理。本文所有程序均在MATLAB R2012a中編寫、運(yùn)行。
3.1 甲醇柴油的光譜圖及甲醇含量的統(tǒng)計(jì)分析
甲醇柴油的中紅外光譜如圖1所示,在1 250~1 800 cm-1以及2 500~3 250 cm-1范圍內(nèi),光譜與甲醇含量有較好的線性關(guān)系。甲醇特征峰出現(xiàn)在1 375,1 480,1 690 cm-1附近,這是由于甲醇柴油中甲基C—H的一級(jí)倍頻在1 695 cm-1處,合頻在1 360 cm-1和1 435 cm-1處,與甲醇含量具有一定的線性相關(guān)性;而在1 667~2 000 cm-1范圍內(nèi)的光譜數(shù)據(jù)與甲醇含量的線性相關(guān)性較差,這是由于柴油中烴類物質(zhì)的官能團(tuán)吸收峰重疊導(dǎo)致的。
3.2 偏最小二乘法模型的建立
為減小測(cè)量過程中儀器或溫度等因素的影響,本文主要采用以下幾種方法進(jìn)行預(yù)處理:標(biāo)準(zhǔn)歸一化(SNV)、多元散射校正(MSC)、一階微分(First Derivative)、二階微分(Second Derivative)、Savitzky-Goly平滑(SG)。偏最小二乘是光譜分析中最常用的建模方法,廣泛應(yīng)用于食用油、石化、食品及農(nóng)產(chǎn)品等領(lǐng)域[9-14]。本文用KS算法將96個(gè)樣本劃分為建模集和預(yù)測(cè)集,剔除3個(gè)異常樣本后,70個(gè)用于建模,23個(gè)用于驗(yàn)證,其統(tǒng)計(jì)結(jié)果如表2所示。將處理后的光譜作為模型的輸入變量,甲醇柴油的甲醇含量作為預(yù)測(cè)值,建立了甲醇柴油中甲醇含量的PLS模型,其結(jié)果如表3所示。從表3可以看出,不同預(yù)處理方法對(duì)模型的結(jié)果有影響。經(jīng)標(biāo)準(zhǔn)正則變換(SNV)預(yù)處理后建立的甲醇柴油中甲醇含量的PLS模型最優(yōu)。不同的因子數(shù)對(duì)模型有所影響,此時(shí),模型最佳主因子數(shù)為18。校正集相關(guān)系數(shù)為0.995 9,均方根誤差為0.4452%(體積比);預(yù)測(cè)集相關(guān)系數(shù)為0.962 6,預(yù)測(cè)均方根誤差為1.3599%(體積比)。模型的預(yù)測(cè)散點(diǎn)圖如圖2所示。
表2 甲醇柴油中甲醇含量的統(tǒng)計(jì)
表3 不同光譜預(yù)處理方法建模和預(yù)測(cè)結(jié)果
Fig.2 Scatter plots of the prediction of methanol content with PLS
3.3 最小二乘支持向量機(jī)模型的建立
最小二乘支持向量機(jī)是常見的非線性校正技術(shù),能夠從光譜數(shù)據(jù)中提取出非線性信息,使模型達(dá)到最佳的建模效果,本文將原始光譜經(jīng)過不同預(yù)處理方法(SNV、MSC、First derivative、Second
derivative、SG)后的光譜作為模型的輸入變量x,甲醇柴油的甲醇含量作為輸出變量y,用KS算法將96個(gè)樣本劃分為建模集和預(yù)測(cè)集,剔除3個(gè)異常樣本后,70個(gè)用于建模,23個(gè)用于驗(yàn)證,建立了甲醇柴油甲醇含量的LSSVM[15-17]模型。分別采用Lin函數(shù)和徑向基函數(shù)(RBF)作為模型的核函數(shù),比較兩者結(jié)果后,最終采用徑向基函數(shù)(RBF)作為核函數(shù)。該模型主要有兩個(gè)待定參數(shù):gamma(γ)和sig2(σ2),這兩個(gè)參數(shù)在很大程度上決定了模型的學(xué)習(xí)泛化能力和預(yù)測(cè)能力。每次運(yùn)行結(jié)果都有稍微的差別。不同預(yù)處理下建立的模型結(jié)果如表4所示,由表4可知,經(jīng)多元散射校正(MSC)預(yù)處理后建立的甲醇柴油中甲醇含量的LSSVM模型獲得了最優(yōu)的預(yù)測(cè)結(jié)果。該模型的兩個(gè)參數(shù)最佳組合為:γ=621.11,σ2=537.12。該模型對(duì)預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè)的相關(guān)系數(shù)為0.981 8,預(yù)測(cè)均方根誤差為1.3917%(體積比)。模型的散點(diǎn)圖如圖3所示。
表4 甲醇柴油中甲醇含量的LSSVM模型結(jié)果
Fig.3 Scatter plots of the prediction of methanol content with LSSVM
從表3、4中看出,經(jīng)標(biāo)準(zhǔn)歸一化(SNV)處理后的光譜數(shù)據(jù)建立的甲醇柴油中甲醇含量的偏最小二乘模型最優(yōu);經(jīng)多元散射校正(MSC)處理后的光譜數(shù)據(jù)建立的甲醇柴油中甲醇含量的最小二乘支持向量機(jī)模型最優(yōu)。且在相同預(yù)處理情況下(SNV、MSC、First derivative、Second derivative、SG)LSSVM模型的建模效果均優(yōu)于PLS模型。這說明在甲醇柴油的甲醇含量檢測(cè)方面,LSSVM是一種很有效的建模方法。
圖4和圖5分別為偏最小二乘模型和最小二乘的絕對(duì)殘差分布。LSSVM模型的殘差主要分布在-0.8%~1.1%之間,PLS模型的殘差主要分布在-1.75%~1.5%之間。比較兩圖可以看出,LSSVM模型殘差接近零線的點(diǎn)的個(gè)數(shù)較多,個(gè)別幾個(gè)偏離較大,說明模型的預(yù)測(cè)值更加接近其真實(shí)值;而PLS模型殘差偏離零線的點(diǎn)的個(gè)數(shù)較多,說明模型的預(yù)測(cè)值更加偏離其真實(shí)值。從絕對(duì)殘差分布這一點(diǎn)可以得出,LSSVM模型的擬合效果要優(yōu)于PLS模型。甲醇柴油是一種非線性檢測(cè)目標(biāo),甲醇柴油的中紅外光譜信息中含有更多的非線性信息。
Fig.4 Absolute residual distribution of predictions for PLS
Fig.5 Absolute residual distribution of predictions for LSSVM
本文應(yīng)用中紅外光譜技術(shù)結(jié)合線性(PLS)和非線性(LSSVM)校正技術(shù)實(shí)現(xiàn)了甲醇柴油中甲醇含量快速準(zhǔn)確的預(yù)測(cè),且光譜在MSC處理后建立的LSSVM模型取得了最優(yōu)的結(jié)果,模型預(yù)測(cè)集的相關(guān)系數(shù)R2為0.981 8,預(yù)測(cè)均方根誤差RMSEP為1.3917%。甲醇含量的預(yù)測(cè)精度比較令人滿意,表明應(yīng)用中紅外光譜技術(shù)和PLS/LSSVM快速無損檢測(cè)甲醇柴油的甲醇含量是可行的。本文雖然只是對(duì)甲醇柴油的甲醇含量這一個(gè)指標(biāo)進(jìn)行了檢測(cè),而甲醇柴油的密度、粘度、十六辛烷值等均沒有檢測(cè),但是為下一步研究甲醇柴油的密度、粘度、十六辛烷值這幾個(gè)指標(biāo)奠定了基礎(chǔ)。
[1] 徐文淵. 液化石油氣(LPG)、壓縮天然氣(CNG)、液化天然氣(LNG)作汽車燃料的現(xiàn)狀和發(fā)展 [J]. 石油與天然氣化工, 1995, 24(3):163-166.
XU W Y. The present situation and development of using LPG, CNG and LNG as motor fuels [J].Chem.Eng.OilGas, 1995, 24(3):163-166. (in Chinese)
[2] 何邦全,王建昕,閻小光. 柴油機(jī)含氧燃料的研究進(jìn)展 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2003, 34(1):134-138.
HE B Q, WANG J X, YAN X G. Review of the progress in oxygenated fuels for diesel engines [J].Trans.Chin.Soc.Agric.Mach., 2003, 34(1):134-138. (in Chinese)
[3] 洪斌,汪洋,朱永生,等. 高壓縮比甲醇發(fā)動(dòng)機(jī)的試驗(yàn)研究 [J]. 汽車工程, 2014, 36(11):1351-1354.
HONG B, WANG Y, ZHU Y S,etal.. An experimental study on a high compression ratio methanol engine [J].Autom.Eng., 2014, 36(11):1351-1354. (in Chinese)
[4] 曹建喜,董松祥,商紅巖,等. 甲醇柴油的研究進(jìn)展 [J]. 現(xiàn)代化工, 2010, 30(6):41-45.
CAO J X, DONG S X, SHANG H Y,etal.. Advances in methanol-diesel [J].Mod.Chem.Ind., 2010, 30(6):41-45. (in Chinese)
[5] 金盼盼,張騰,楊曉平,等. 甲醇汽油的中紅外法測(cè)定研究 [J]. 汽車科技, 2012(5):66-70.
JIN P P, ZHANG T, YANG X P,etal.. Mid-infrared analyzers for the determination of methanol fuels [J].Autom.Technol., 2012(5):66-70. (in Chinese)
[6] 覃旭松,戴連奎. 小波變換在Raman汽油辛烷值測(cè)定儀中的應(yīng)用 [J]. 化工自動(dòng)化及儀表, 2004, 31(5):65-68.
QIN X S, DAI L K. Application of wavelet transform in gasoline octane number analyzer using Raman spectroscopy [J].ControlInstrum.Chem.Ind., 2004, 31(5):65-68. (in Chinese)
[7] 古文英,史權(quán),彭勃,等. 乙醇柴油的研究現(xiàn)狀 [J]. 西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版), 2004, 19(6):57-62.
GU W Y, SHI Q, PENG B,etal.. Present situation of the researches on ethanol diesel oil [J].J.Xi’anShiyouUniv. (Nat.Sci.Ed.), 2004, 19(6):57-62. (in Chinese)
[8] 周慶輝,紀(jì)威,王冬冬. 利用生物柴油制取甲醇柴油微乳液及其熱力學(xué)分析 [J]. 拖拉機(jī)與農(nóng)用運(yùn)輸車, 2007, 34(2):18-19.
ZHOU Q H, JI W, WANG D D. Preparation and thermodynamic analysis on forming microemulsification system of methanol and diesel using biodiesel [J].Tract.FarmTransp., 2007, 34(2):18-19. (in Chinese)
[9] 王智宏,劉杰,陳曉超,等. 光譜數(shù)據(jù)對(duì)油頁巖含油率近紅外光譜分析PLS建模精度的影響 [J]. 光譜學(xué)與光譜分析, 2012, 32(10):2770-2774.
WANG Z H, LIU J, CHEN X C,etal.. Effect of near infrared spectrum on the precision of PLS model for oil yield from oil shale [J].Spectrosc.Spect.Anal., 2012, 32(10):2770-2774. (in Chinese)
[10] 陳云坪,馬偉,王秀,等. 基于PLS的土壤養(yǎng)分與小麥產(chǎn)量空間相關(guān)關(guān)系研究 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2012, 43(2):159-164.
CHEN Y P, MA W, WANG X,etal.. Relationship between soil nutrient and wheat yield based on PLS [J].Trans.Chin.Soci.Agric.Mach., 2012, 43(2):159-164. (in Chinese)
[11] 呂游,劉吉臻,楊婷婷,等. 基于PLS特征提取和LS-SVM結(jié)合的NOx排放特性建模 [J]. 儀器儀表學(xué)報(bào), 2013, 34(11):2418-2424.
LV Y, LIU J Z, YANG T T,etal.. NOxemission characteristic modeling based on feature extraction using PLS and LS-SVM [J].Chin.J.Scient.Instrum., 2013, 34(11):2418-2424. (in Chinese)
[12] 吳靜珠,徐云. 基于CARS-PLS的食用油脂肪酸近紅外定量分析模型優(yōu)化 [J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2011, 42(10):162-166.
WU J Z, XU Y. NIR quantitative model optimization of fatty acid in edible oil based on CARS-PLS [J].Trans.Chin.Soc.Agric.Mach., 2011, 42(10):162-166. (in Chinese)
[13] 吳靜珠,石瑞杰,陳巖,等. 基于PLS-LDA和拉曼光譜快速定性識(shí)別食用植物油 [J]. 食品工業(yè)科技, 2014, 35(6):55-58.
WU J Z, SHI R J, CHEN Y,etal.. Rapid qualitative identification method of edible vegetable oil based on PLS-LDA and Raman [J].Sci.Technol.FoodInd., 2014, 35(6):55-58. (in Chinese)
[14] 淡圖南,戴連奎. 基于PLS投影分析的光譜波段選擇方法 [J]. 光譜學(xué)與光譜分析, 2009, 29(2):351-354.
DAN T N, DAI L K. Spectral wavelength selection based on PLS projection analysis [J].Spectrosc.Spect.Anal., 2009, 29(2):351-354. (in Chinese)
[15] 劉燕德,周延睿. 基于GA-LSSVM的蘋果糖度近紅外光譜檢測(cè) [J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 41(7):229-234.
LIU Y D, ZHOU Y R. GA-LSSVM based near infrared spectroscopy detection of apple sugar content [J].J.NorthwestA&F(Nat.Sci.Ed.), 2013, 41(7):229-234. (in Chinese)
[16] 彭秀輝,黃常毅,劉飛,等. LSSVM模型下的近紅外光譜聯(lián)合區(qū)間波長(zhǎng)篩選方法 [J]. 光譜學(xué)與光譜分析, 2014, 34(3):668-672.
PENG X H, HUANG C Y, LIU F,etal.. Near infrared spectroscopy synergy interval wavelength selection method using the LSSVM model [J].Spectrosc.Spect.Anal., 2014, 34(3):668-672. (in Chinese)
[17] 伍鐵斌,朱紅求,孫備,等. PLS-LSSVM模型在鋅凈化中的應(yīng)用 [J]. 計(jì)算機(jī)工程, 2012, 38(10):212-214.
WU T B, ZHU H Q, SUN B,etal.. Application of PLS-LSSVM model in zinc purification [J].Comp.Eng., 2012, 38(10):212-214. (in Chinese)
歐陽愛國(guó)(1968-),男,江西南昌人,教授,1990年于江西農(nóng)業(yè)大學(xué)獲得學(xué)士學(xué)位,主要從事車輛性能檢測(cè)方面的研究。
E-mail: ouyangaiguo1968711@163.com
Methanol Content Determination in Methanol Diesel with Mid Infrared Spectroscopy Analysis Using Least Square Support Vector Machine
OUYANG Ai-guo*, TANG Tian-yi, ZHOU Xin, LIU Yan-de
(InstituteofOptics-Mechanics-ElectronicsTechnologyandApplication,EastChinaJiaotongUniversity,Nanchang330013,China)
*CorrespondingAuthor,E-mail:ouyangaiguo1968711@163.com
The mid-infrared spectroscopy was used to detect the content of methanol in the methanol diesel. Firstly, the collected original spectra were pre-processed by the standard normal transformation(SNV), multiple scatter correction (MSC), first derivative, second derivative and Savitzky-Goly smoothing methods. The quantitative model of methanol was established by partial least square method and least square support vector machine (SVM). The influence of different pre-processing methods on the model prediction capability was also investigated. The results show that LSSVM modeling is the optimal forecasting model with the prediction set correlation coefficientR2of 0.981 8 and the prediction mean square error (RMSEP) of 1.3917%(volume ratio). So, the mid infrared spectrum technology can be used for the rapid detection of methanol in the methanol diesel and achieve very good results.
MIRS; methanol diesel; PLS; LSSVM
1000-7032(2016)10-1253-06
2016-04-08;
2016-05-22
南方山地果園智能化管理技術(shù)與裝備協(xié)同創(chuàng)新中心(贛教高字[2014]60號(hào))資助項(xiàng)目
O657.33; TE626.9
A
10.3788/fgxb20163710.1253