萬(wàn)順寬, 呂 波, 張洪明*, 何 梁, 符 佳, 計(jì)華健, 王福地, 賓 斌, 李義超
1. 中國(guó)科學(xué)院合肥物質(zhì)科學(xué)研究院等離子體物理研究所, 安徽 合肥 230031 2. 中國(guó)科學(xué)技術(shù)大學(xué), 安徽 合肥 230026 3. 南華大學(xué)核科學(xué)與技術(shù)學(xué)院, 湖南 衡陽(yáng) 421001
近紅外(near infrared, NIR)光譜分析技術(shù)[1-3]具有方便、 快速、 高效、 結(jié)果準(zhǔn)確, 不破壞樣品, 不消耗化學(xué)試劑和不污染環(huán)境等優(yōu)點(diǎn), 受到越來(lái)越多的關(guān)注。 便攜式NIR光譜儀無(wú)法配備溫控模塊, 環(huán)境溫度的差異會(huì)對(duì)樣品的吸收或反射光譜產(chǎn)生較大影響, 因此必須要建立包含環(huán)境溫度修正項(xiàng)的預(yù)測(cè)模型, 以降低環(huán)境溫度的差異造成檢測(cè)結(jié)果的誤差。 目前, 國(guó)內(nèi)外已經(jīng)開(kāi)展了一些關(guān)于近紅外光譜的溫度修正研究。 孫彥華等利用自主研制的手持式近紅外光譜儀采集玉米樣品的近紅外光譜, 研究樣品溫度變化對(duì)模型預(yù)測(cè)結(jié)果的影響, 可以實(shí)現(xiàn)樣品的快速無(wú)損檢測(cè)[4]。 Thamasopinkul等基于近紅外光譜儀(Spectra-StarTM 2500, Unity Scientific, Milford, MA, USA) 利用標(biāo)準(zhǔn)正態(tài)變量變換的擬最小二乘回歸建立了三種恒溫(25, 35和45 ℃)校正模型, 并建立了具有溫度補(bǔ)償?shù)男UP湍M了蜂蜜的近紅外光譜受樣品溫度變化的影響[5]。
上述研究是針對(duì)不同種類(lèi)的含水分樣品開(kāi)展了溫度修正模型研究, 而特種柴油中的水含量可以忽略, 目前環(huán)境溫度差異對(duì)無(wú)水柴油的檢測(cè)結(jié)果的影響尚不明確, 阻礙了利用近紅外分析方法對(duì)特種柴油進(jìn)行現(xiàn)場(chǎng)快檢應(yīng)用的發(fā)展[6]。 柴油的凝點(diǎn)是柴油的重要指標(biāo)之一, 對(duì)貯存, 運(yùn)輸和使用都有重要影響。 柴油的凝點(diǎn)與其結(jié)構(gòu)組成有著密切關(guān)系, 鏈羥結(jié)構(gòu)對(duì)柴油的凝點(diǎn)貢獻(xiàn)起著決定性作用, 近紅外光譜在分析C—H結(jié)構(gòu)方面有著獨(dú)特的優(yōu)勢(shì)[7]。 因此基于便攜式近紅外光譜儀對(duì)無(wú)水的特種柴油開(kāi)展溫度修正模型的研究, 通過(guò)引入溫度修正項(xiàng), 得到了修正后的預(yù)測(cè)模型, 結(jié)果表明該模型可以有效降低環(huán)境溫度對(duì)預(yù)測(cè)結(jié)果的影響。
首先在室溫T0=25 ℃條件下測(cè)量了特種柴油樣品的光譜, 并采用偏最小二乘(PLS)[8-10]建立了該柴油的凝點(diǎn)預(yù)測(cè)模型[11]
c=b0+b1A1+b2A2+…+bnAn
(1)
式(1)中,A1—An是樣品各個(gè)波長(zhǎng)處的吸光度,b0—bn為不同波長(zhǎng)處光強(qiáng)的權(quán)重系數(shù),c為樣品的理化指標(biāo), 在本研究中c為柴油樣品的凝點(diǎn)值。
在各環(huán)境溫度條件下(-10, 0, 10, 20, 30, 40和50 ℃)測(cè)量了樣品的吸收光譜, 再將這些溫度條件下的光譜數(shù)據(jù)帶入25 ℃條件下的預(yù)測(cè)模型, 以分析環(huán)境溫度(TE)差異對(duì)預(yù)測(cè)結(jié)果帶來(lái)的影響
Δc(TE)=c(TE-T0)-c0
(2)
其中,c(TE)為利用TE環(huán)境溫度下測(cè)量光譜數(shù)據(jù)得到凝點(diǎn)預(yù)測(cè)值,c0為采用國(guó)標(biāo)方法(GB/T510)得到的柴油凝點(diǎn)標(biāo)準(zhǔn)值。
利用偏最小二乘法將每個(gè)環(huán)境溫度下預(yù)測(cè)結(jié)果與標(biāo)準(zhǔn)值之間的差異對(duì)環(huán)境溫度TE進(jìn)行一次函數(shù)擬合, 得到
Δc=f1(TE-T0)
(3)
其中,f1為環(huán)境溫度TE變化對(duì)預(yù)測(cè)結(jié)果產(chǎn)生的修正項(xiàng)系數(shù), 以修正環(huán)境溫度差異帶來(lái)的測(cè)量誤差,T0為25 ℃。
最后得到了帶有溫度修正項(xiàng)的預(yù)測(cè)模型
cm=b0+b1A1+b2A2+…+bnAn+f1(TE-T0)
(4)
式(4)中,cm修正模型得到的柴油樣品凝點(diǎn)修正值。
采用遼寧方圓國(guó)家標(biāo)準(zhǔn)樣品油有限公司提供的特種無(wú)水柴油樣品, 樣品凝點(diǎn)值分別為-54.0, -48.0, -44.0, -36.0, -33.0, -28.0, -24.0, -16.0, -12.0, -8.0和-3.0 ℃共計(jì)50種柴油, 每個(gè)凝點(diǎn)值同時(shí)包括數(shù)個(gè)其他指標(biāo)不同的樣品。 所有樣品的凝點(diǎn)均采用國(guó)標(biāo)方法GB/T510進(jìn)行測(cè)定。
使用基于德州儀器(Texas Instruments Inc)DMD芯片的透射式近紅外光譜儀[12], 掃描模式可通過(guò)控制界面設(shè)置, 為列掃描模式, 波長(zhǎng)數(shù)據(jù)點(diǎn)設(shè)置為228個(gè), 通過(guò)6次掃描取平均值。
實(shí)驗(yàn)步驟: (1) 將恒溫箱調(diào)整至25 ℃, 等待30 min后, 把按照1—50編號(hào)的比色皿(光程10 mm)依次放入光譜儀樣品池, 待溫度恒定后進(jìn)行空比色皿的參考光譜采集; 然后將柴油樣品按照1—50進(jìn)行標(biāo)號(hào), 并依次裝入對(duì)應(yīng)編號(hào)的石英比色皿中, 將盛有柴油樣品的比色皿依次放入光譜儀樣品池, 在箱內(nèi)溫度恒定后依次進(jìn)行數(shù)據(jù)采集。 考慮此款光譜儀在900~950和1 650~1 700 nm波長(zhǎng)范圍內(nèi)的測(cè)量誤差較大, 本實(shí)驗(yàn)僅采用950~1 650 nm波長(zhǎng)范圍內(nèi)的光譜數(shù)據(jù)如圖1(a), 采集到的波長(zhǎng)點(diǎn)數(shù)由原來(lái)的228減少到197。 (2) 將恒溫箱溫度分別設(shè)定為-10, 0, 10, 20, 30, 40和50 ℃, 然后依次重復(fù)上面的測(cè)量步驟, 即可得到不同溫度條件下柴油樣品的吸收光譜數(shù)據(jù)。
圖1 溫度環(huán)境為25 ℃條件下柴油樣品的(a)原始吸收光譜和(b)預(yù)處理后的吸收光譜數(shù)據(jù)
利用在25 ℃條件下測(cè)量的吸收光譜數(shù)據(jù)建立了柴油凝點(diǎn)的預(yù)測(cè)模型。 首先對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理[13], 預(yù)處理方法包含了歸一化, 標(biāo)準(zhǔn)正態(tài)化和差分二階求導(dǎo), 以降低噪聲對(duì)最終結(jié)果的干擾。 預(yù)處理后的光譜數(shù)據(jù)如圖1(b)所示, 由圖中可以看出柴油在950~1 650 nm波長(zhǎng)范圍內(nèi)有兩組主要的吸收譜帶, 即1 100~1 260 nm范圍內(nèi)的二級(jí)倍頻吸收以及1 300~1 500 nm范圍內(nèi)的合頻吸收。 對(duì)各級(jí)倍頻或合頻, 主要有三種基團(tuán)的典型吸收, 即芳環(huán)中C—H、 甲基C—H、 和亞甲基C—H吸收。 因?yàn)榇瞬裼蜆悠窞闊o(wú)水柴油, 譜線中無(wú)水吸收峰。
根據(jù)馬氏距離法[14], 計(jì)算出50種樣本的馬氏距離, 剔除馬氏距離較大的點(diǎn), 為了避免對(duì)查找出的異常樣本產(chǎn)生誤判, 將實(shí)際并非異常那個(gè)點(diǎn)的樣本判定為異常點(diǎn), 需要對(duì)查找的樣本可以進(jìn)行二次檢驗(yàn), 最后剔除了異常點(diǎn)4個(gè), 將剩下46個(gè)樣品的光譜數(shù)據(jù)分成校正集和獨(dú)立驗(yàn)證集兩個(gè)數(shù)據(jù)集合, 校正集與獨(dú)立驗(yàn)證集分別包含37個(gè)和9個(gè)樣品的光譜數(shù)據(jù), 其中9個(gè)獨(dú)立驗(yàn)證集分別隨機(jī)選擇9個(gè)凝點(diǎn)不同的樣品數(shù)據(jù)。 利用偏最小二乘法基于校正集數(shù)據(jù)建立凝點(diǎn)值的預(yù)測(cè)模型, 并將獨(dú)立驗(yàn)證集數(shù)據(jù)代入模型, 以計(jì)算獨(dú)立驗(yàn)證集的殘差RMSEP, 可以計(jì)算出RMSEP隨模型維度的變化關(guān)系[15], 如圖2(a)所示, 在p=9條件下(p為PLS的主因子數(shù)), RMSEP取得最小值0.100 3。 因此, 在本模型中選擇維度p=9來(lái)建立預(yù)測(cè)模型。 模型預(yù)測(cè)值與凝點(diǎn)國(guó)標(biāo)測(cè)量值間的關(guān)系如圖2(b)所示。
圖2 (a)校正集殘差(RMSEC)和檢驗(yàn)集殘差(RMSEP)隨PLS維數(shù)的變化關(guān)系; (b)環(huán)境溫度為25 ℃條件下柴油樣品凝點(diǎn)值的預(yù)測(cè)曲線
依次將另外7個(gè)環(huán)境溫度條件下測(cè)量到的光譜數(shù)據(jù)在相同的馬氏距離異常點(diǎn)剔除法和預(yù)處理之后代入上述模型進(jìn)行凝點(diǎn)值預(yù)測(cè)。 圖3(a)給出了Δc隨環(huán)境溫度TE的變化關(guān)系。 可以發(fā)現(xiàn)預(yù)測(cè)偏差Δc隨TE的上升而有明顯的線性上升趨勢(shì)。 根據(jù)式(3), 利用最小二乘法對(duì)圖中數(shù)據(jù)進(jìn)行擬合, 可以得到凝點(diǎn)值誤測(cè)偏差Δc隨TE-T0的一次擬合系數(shù)f1=-0.019 8。 再根據(jù)式(4)即可得到基于溫度修正模型的預(yù)測(cè)值
cm=3.521 8+3.405 5A1-6.124 4A2+…-
12.787 1A197-0.019 8(TE-25)
(6)
其中TE為環(huán)境溫度;cm為修正模型得到的柴油樣品凝點(diǎn)修正值。
圖3(b)給出了基于溫度修正模型的凝點(diǎn)值預(yù)測(cè)偏差, 可以發(fā)現(xiàn)由環(huán)境溫度變化趨勢(shì)產(chǎn)生的整體上升趨勢(shì)得到消除, 顯著降低了環(huán)境溫度變化對(duì)預(yù)測(cè)結(jié)果產(chǎn)生的影響。
圖3 基于(a)無(wú)溫度修正模型和(b)溫度修正模型的凝點(diǎn)預(yù)測(cè)值偏差對(duì)比
根據(jù)前面溫度修正做馬氏距離法剔除異常點(diǎn)時(shí), 10 ℃下所用的46個(gè)樣本, 分別給出了環(huán)境溫度為10 ℃條件下溫度修正前后的凝點(diǎn)值預(yù)測(cè)模型的預(yù)測(cè)值與國(guó)標(biāo)法測(cè)量值之間的關(guān)系如圖4(a)和(b), 可以明顯觀測(cè)到溫度修正后的樣品凝點(diǎn)值更向國(guó)標(biāo)法所測(cè)量得凝點(diǎn)值收斂, 說(shuō)明溫度修正后的凝點(diǎn)值更精確, 預(yù)測(cè)值偏差得到明顯改善。
圖4 基于(a)無(wú)溫度修正模型和(b)溫度修正模型對(duì)環(huán)境溫度為10 ℃條件下柴油凝點(diǎn)的預(yù)測(cè)值對(duì)比
為了證明溫度修正后的效果, 在所有樣品中隨機(jī)抽出一個(gè)樣本, 凝點(diǎn)為-54.0 ℃, 此樣品在不同溫度下的溫度修正前后的變化關(guān)系如圖5所示, 可以看出在經(jīng)過(guò)溫度修正后, 樣品的預(yù)測(cè)凝點(diǎn)值受溫度影響的效果明顯減少。 數(shù)據(jù)測(cè)量時(shí)已經(jīng)將空比色皿和光譜儀的溫飄作為參考光扣除了, 光譜儀的影響可以排除。 近紅外模型的好壞可以由兩個(gè)參數(shù)相關(guān)系數(shù)和殘差來(lái)證明, 檢驗(yàn)集的相關(guān)系數(shù)越大, 殘差越小, 模型越好。 表1給出了多個(gè)環(huán)境溫度條件下的預(yù)測(cè)集殘差RMSEP與相關(guān)系數(shù)r在密度修正前后的數(shù)值對(duì)比, 在經(jīng)過(guò)溫度修正后預(yù)測(cè)集相關(guān)系數(shù)相對(duì)增大, 預(yù)測(cè)集殘差相對(duì)減小, 由此證明溫度修正方法對(duì)溫度引起的預(yù)測(cè)偏差起到了消除作用。r數(shù)值相對(duì)偏小的原因可能是由于在實(shí)驗(yàn)時(shí)開(kāi)關(guān)恒溫箱箱門(mén)更換樣品過(guò)程中箱內(nèi)溫度急劇變化導(dǎo)致比色皿表面起霧引入的一些誤差。 總體結(jié)果顯示出了此溫度修正方法對(duì)溫度引起的預(yù)測(cè)偏差的消除作用。
圖5 不同溫度下凝點(diǎn)值為-54.0 ℃的樣品在溫度修正前后的對(duì)比
利用基于DMD的便攜近紅外光譜儀采集了不同環(huán)境溫度條件下的柴油油品樣品在的近紅外波段的吸收光譜, 研究了樣品溫度變化對(duì)模型預(yù)測(cè)結(jié)果的影響。 通過(guò)分析發(fā)現(xiàn)樣品吸光度光譜與溫度之間存在線性關(guān)系, 在環(huán)境溫度高于建立模型的環(huán)境溫度時(shí), 模型的預(yù)測(cè)偏差高于實(shí)際值。 利用這一關(guān)系提出了溫度修正模型, 并通過(guò)試驗(yàn)結(jié)果證明該溫度修正方法可以對(duì)光譜進(jìn)行修正, 利用修正后的光譜代入已建立好的模型預(yù)測(cè)結(jié)果有了很大的改善。 最后使用10 ℃下46個(gè)樣本對(duì)溫度修正理論進(jìn)行了檢驗(yàn), 均方根誤差分別為~14.6和~8.8。 本研究顯示基于此溫度修正模型, 可以顯著降低建模過(guò)程的工作量, 在25 ℃條件下建立預(yù)測(cè)模型后將此溫度修正項(xiàng)帶入模型即可用于在其他環(huán)境溫度條件下進(jìn)行柴油凝點(diǎn)值預(yù)測(cè), 而不需要在其他多個(gè)溫度條件下分別建立預(yù)測(cè)模型。 此方法顯著提高了建模效率和便攜式近紅外光譜快速檢測(cè)的溫度適應(yīng)性。