李津蓉 俞柯
摘 ?要:針對(duì)甲醇汽油中甲醇成分含量的快速檢測(cè)問題,提出一種基于拉曼光譜信號(hào)和偏最小二乘算法相結(jié)合的快速檢測(cè)技術(shù)。實(shí)驗(yàn)在三種成分不同的基礎(chǔ)汽油中加入不同體積比例(2.5~80%)的甲醇溶液,利用PLS方法對(duì)隨機(jī)選擇的訓(xùn)練樣本集建立起拉曼光譜信號(hào)與甲醇成分濃度的回歸模型,經(jīng)過實(shí)驗(yàn)顯示,無論訓(xùn)練樣本如何選擇,回歸模型均可取得較高的預(yù)測(cè)精度,預(yù)測(cè)均方誤差(SEP)為在0.6%左右,復(fù)相關(guān)系數(shù)(R2)均大于0.98。
關(guān)鍵詞:甲醇汽油;拉曼光譜;定量分析;偏最小二乘算法
引言
甲醇汽油是由汽油、甲醇以及添加劑按照一定比例配制而成,它能夠代替MTBE來提高汽油的含氧量和辛烷值,使汽油燃燒更加充分,同時(shí)汽車排放的尾氣中的苯、一氧化碳等有毒物質(zhì)的含量也會(huì)明顯降低,因而是一種較為理想的替代型清潔能源。而甲醇的熱值約為汽油的一半,在不改動(dòng)汽車發(fā)動(dòng)機(jī)壓縮比的前提下,甲醇含量必須固定在一定范圍內(nèi),如果甲醇含量過低的話,會(huì)致使辛烷值太低從而損害發(fā)動(dòng)機(jī);如果過高,則會(huì)導(dǎo)致燃料熱值不夠,油量損耗增加,成本提高。所以,如何快速、準(zhǔn)確的檢測(cè)甲醇汽油中甲醇的含量對(duì)于甲醇汽油的油品質(zhì)量控制和檢驗(yàn)都有著極為重要的作用。
光譜分析技術(shù)具有無損、重復(fù)性好、周期短等優(yōu)點(diǎn),能夠快速地檢測(cè)出甲醇汽油中甲醇的含量。Heitor等采用高分辨率的傅立葉變換近紅外(FT-NIR)光譜儀對(duì)甲醇和乙醇汽油進(jìn)行分析,利用PLS算法建立乙醇和甲醇的定量分析模型,結(jié)果顯示,乙醇中的預(yù)測(cè)均方誤差為0.32%,甲醇中的預(yù)測(cè)均方誤差為0.28%。與近紅外光譜相比,拉曼光譜峰較尖銳,具有更明顯的成分特征性[1-3],尤其針對(duì)醇類汽油,在中紅外光譜中-C-H伸縮振動(dòng)為中等強(qiáng)度,其振動(dòng)容易被-O-H吸收干擾;而拉曼光譜的O-H峰很弱,對(duì)-C-H伸縮振動(dòng)的干擾小,因此,拉曼光譜信號(hào)更適合于建立甲醇的定量分析模型。偏最小二乘算法(Partial Least Squares,PLS)[是一種多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它結(jié)合和多元線性回歸和主成分回歸的優(yōu)點(diǎn),能夠同時(shí)提取自變量矩陣和應(yīng)變量矩陣中的信息,進(jìn)行有效的降維處理,有效處理自變量之間的復(fù)共線關(guān)系問題,并且使提取的主成分對(duì)于因變量具有最強(qiáng)的解釋能力,提高了數(shù)據(jù)處理結(jié)果的可靠性,因此在諸多領(lǐng)域得到了廣泛的應(yīng)用[4]。文章針對(duì)甲醇汽油的快速分析問題,將PLS算法應(yīng)用于甲醇汽油的拉曼光譜信號(hào),建立了甲醇含量的定量校正模型。實(shí)驗(yàn)表明,拉曼光譜與甲醇含量具有很好的線性相關(guān)度,采用拉曼光譜能夠建立快速的、魯棒的校正模型。
1 PLS算法簡(jiǎn)介
偏最小二乘算法是在建模過程中同時(shí)考慮自變量和因變量中有效信息的線性回歸方法,它在光譜數(shù)據(jù)矩陣分解的過程中利用了待測(cè)組分的屬性信息,使得顯著包含待測(cè)屬性特征的光譜區(qū)有更大的權(quán)重。偏最小二乘法首先將自變量矩陣X和因變量Y矩陣分別進(jìn)行正交化分解,得到各自的載荷矩陣(P與Q)和得分矩陣(T與U),接著分別提取主成分T1和U1,然后實(shí)施X和Y對(duì)T1的回歸,接著檢驗(yàn)?zāi)P途仁欠駶M足我們的要求,當(dāng)滿足時(shí),算法停止,當(dāng)不滿足時(shí),矩陣X和矩陣Y被T1解釋后的殘余信息進(jìn)行第二輪成分的提取,如此往復(fù),直至滿足模型精度要求。
相比于其他線性建模方法,偏最小二乘法有其獨(dú)特的優(yōu)勢(shì):
(1)PLS算法所建立模型的預(yù)測(cè)殘差的平方和較小,能夠具有較高的預(yù)測(cè)穩(wěn)定性。
(2)能夠很好的消除一些無用的信息以及噪聲的干擾,解決存在的共線性問題。
(3)輸入的光譜數(shù)據(jù)矩陣進(jìn)行正交化分解和主成分的提取,使得回歸的主成分對(duì)待測(cè)物質(zhì)的成分具有最強(qiáng)的解釋能力。
(4)偏最小二乘法能夠高效提取信息,對(duì)于復(fù)雜的分析體系非常適用。
偏最小二乘法結(jié)合了主成分回歸法和多元線性回歸的優(yōu)勢(shì),其模型較為簡(jiǎn)單,能有效對(duì)數(shù)據(jù)進(jìn)行降維,且使得回歸的主成分對(duì)因變量具有最強(qiáng)解釋能力,已經(jīng)被廣泛的應(yīng)用于光譜分析的領(lǐng)域中。
2 實(shí)驗(yàn)部分
2.1 實(shí)驗(yàn)數(shù)據(jù)與預(yù)處理
本實(shí)驗(yàn)中采用了來自于三個(gè)不同煉化廠的基礎(chǔ)油樣本,它們的摻雜比例以及成分都存在著較大差異。我們用純度為99.9%的甲醇以不同的體積融入每種基礎(chǔ)汽油中,一共得到27個(gè)混合汽油樣本,甲醇的體積比例范圍為2.5%~80%。測(cè)量3個(gè)純甲醇溶液、基礎(chǔ)汽油以及27個(gè)混合汽油樣本的拉曼光譜。光譜測(cè)量?jī)x采用美國(guó)海洋公司的Maya 2000 Pro拉曼光譜測(cè)量?jī)x,選擇合適的激發(fā)光(785nm)和波數(shù)范圍(600~1800cm-1)。對(duì)每一個(gè)樣本的拉曼光譜積分時(shí)間為3s,采樣三次,取其平均值作為測(cè)量光譜。
利用拉曼光譜儀測(cè)量得到的原始光譜中不僅包含了與樣本有關(guān)的信息,還包含了各種噪聲信號(hào)干擾。其中主要噪聲來自于熒光背景的干擾,消除熒光背景的干擾,對(duì)于后續(xù)利用PLS算法進(jìn)行線性模型的建立非常的關(guān)鍵。為了對(duì)拉曼光譜中的熒光背景進(jìn)行有效扣除,文章采用了文獻(xiàn)所提出的迭代加權(quán)最小二乘基線校正算法。此外為了能夠消除儀器參數(shù)對(duì)光譜強(qiáng)度的影響,對(duì)混合汽油光譜進(jìn)行飽和烴歸一化。
2.2 回歸模型建立及實(shí)驗(yàn)結(jié)果分析
從27個(gè)樣本數(shù)據(jù)中,隨機(jī)選取15個(gè)樣本作為訓(xùn)練集合,基于PLS算法建立汽油中甲醇含量的回歸模型,采用“留一法”選擇PLS算法中的主因子數(shù),主因子數(shù)選擇為5,利用剩余12個(gè)樣本檢測(cè)回歸模型的準(zhǔn)確性,為了進(jìn)一步對(duì)回歸模型的魯棒性進(jìn)行評(píng)測(cè),將以上實(shí)驗(yàn)重復(fù)10次,每次實(shí)驗(yàn)中隨機(jī)選擇訓(xùn)練樣本,并通過預(yù)測(cè)均方誤差(Standard Error of Prediction,SEP)及其對(duì)應(yīng)的復(fù)相關(guān)系數(shù)R2對(duì)實(shí)驗(yàn)結(jié)果的準(zhǔn)確性進(jìn)行評(píng)定,y(k)和yp(k)分別表示第k個(gè)樣本中甲醇含量的實(shí)際值和模型預(yù)測(cè)值,np表示樣本總數(shù)。10次實(shí)驗(yàn)所建立的回歸模型的評(píng)價(jià)指標(biāo)。可以看出,當(dāng)訓(xùn)練樣本集合發(fā)生變化時(shí),基于PLS算法所建立的回歸模型的準(zhǔn)確性基本保持不變,且均在較高的精度范圍之內(nèi),這是由拉曼光譜強(qiáng)度與成分濃度的內(nèi)在線性相關(guān)性所決定的。因此,基于拉曼光譜可實(shí)現(xiàn)對(duì)汽油中的甲醇濃度的快速準(zhǔn)確測(cè)定。
3 結(jié)束語
基于拉曼光譜化學(xué)成分定量分析方法利用了拉曼光譜強(qiáng)度與成分濃度的線性關(guān)系,與目前應(yīng)用較廣泛的近紅外測(cè)量方法相比,拉曼光譜信號(hào)具有信號(hào)特征顯著、抗干擾能力強(qiáng)等優(yōu)點(diǎn)。PLS算法是一種目前在光譜分析領(lǐng)域普遍應(yīng)用的線性建模技術(shù),具有所需訓(xùn)練樣本數(shù)量少,模型精確度高等特點(diǎn)。將PLS算法與拉曼光譜信號(hào)相結(jié)合可實(shí)現(xiàn)對(duì)汽油中甲醇成分的精確定量分析,這種技術(shù)為甲醇汽油的在線質(zhì)量監(jiān)控,油品檢測(cè)監(jiān)督等提供了方便快速的解決方案。
參考文獻(xiàn)
[1]王志彥,何書美,張倩,等,拉曼光譜法測(cè)定煤化工產(chǎn)品粗苯中苯、甲苯、二甲苯的含量[J].現(xiàn)代化工,2014,34(1):169-171.
[2]劉燕德,靳曇曇,拉曼光譜技術(shù)在農(nóng)產(chǎn)品質(zhì)量安全檢測(cè)中的應(yīng)用[J].光譜學(xué)與光譜分析,2015,35(9):2567-2572.
[3]安巖,劉英,孫強(qiáng),等,便攜式拉曼光譜儀的光學(xué)系統(tǒng)設(shè)計(jì)與研制[J].2013,33(3):1-7.
[4]翟福麗,黃軼群,王錫昌,等.應(yīng)用表面增強(qiáng)拉曼光譜技術(shù)快速檢測(cè)尿樣中的β-興奮劑[J].分析化學(xué),2012,40(5):718-723.