孫曉榮, 王賦騰, 劉翠玲, 張 穎, 付新鑫
目前常用的小麥粉水分含量測(cè)定方法均為有損檢測(cè),存在操作繁瑣、耗時(shí)長(zhǎng)、測(cè)定時(shí)間不易掌控、易受外界因素干擾等缺點(diǎn),無(wú)法滿足小麥粉行業(yè)快速、準(zhǔn)確的檢測(cè)要求[1,2]。
近紅外光譜分析技術(shù)是近年來(lái)快速發(fā)展的一種快速無(wú)損檢測(cè)技術(shù),該技術(shù)結(jié)合化學(xué)計(jì)量學(xué)和計(jì)算機(jī)高速處理技術(shù)的特點(diǎn),具有快速、高效、取樣簡(jiǎn)單、無(wú)污染等優(yōu)點(diǎn),已經(jīng)廣泛應(yīng)用于多個(gè)檢測(cè)領(lǐng)域[3,4]。隨著近紅外在線檢測(cè)技術(shù)的飛速發(fā)展,近紅外光譜儀也變得越來(lái)越精細(xì)靈巧。MicroNir—2200近紅外光譜儀將光源、檢測(cè)器、分光系統(tǒng)集中于一個(gè)微型探頭中,具有體積小、易攜帶、操作簡(jiǎn)便、易控制、測(cè)量時(shí)間短等優(yōu)點(diǎn),能更實(shí)時(shí)準(zhǔn)確掃描樣品光譜,檢測(cè)過程省時(shí)簡(jiǎn)便[5]。
本文采用MicroNir—2200采集小麥粉近紅外光譜數(shù)據(jù),采用建模軟件Unscramble 9.7建立了小麥粉水分含量近紅外偏最小二乘(partial least square,PLS)校正模型,并利用內(nèi)部交叉驗(yàn)證和外部預(yù)測(cè)集驗(yàn)證了模型的預(yù)測(cè)精度。
1)面粉樣品169個(gè),來(lái)源于北京古船食品有限公司。
2)MicroNir—2200,檢測(cè)波長(zhǎng)范圍為1 150~2 150 nm,光譜采樣間隔8.1 nm,共125個(gè)波長(zhǎng)點(diǎn)。
1)化學(xué)值測(cè)定
按照直接干燥法(GB 5009.3—2010)測(cè)定水分含量[6]。原理為利用食品中水分的物理性質(zhì),在101.3 kPa,101~105 ℃下采用揮發(fā)方法測(cè)定樣品中干燥后所減失的重量,同時(shí)測(cè)定吸濕水、部分結(jié)晶水和此條件下能揮發(fā)的物質(zhì)的重量,通過干燥前后的稱量數(shù)值計(jì)算出水分的含量。
2)近紅外光譜采集
面粉樣品裝于密封的樣品袋,打開MicroNir—2200近紅外光譜儀光源,待儀器溫度達(dá)到穩(wěn)定工作溫度(37~37.8 ℃)后開始掃描樣品。掃描光譜時(shí)參數(shù)設(shè)置為單次積分時(shí)間5 100 μs,積分次數(shù)100次,光譜掃描間隔為1 s。光譜掃描時(shí)將探頭緊貼在光滑的樣品袋表面,連續(xù)掃描5次,每次掃描的不同位置。
3)光譜數(shù)據(jù)處理
對(duì)每個(gè)樣品多次掃描的光譜求取平均值得到最終建模樣品光譜集;采用樣本選擇方法SPXY算法將樣品光譜劃分為建模集和預(yù)測(cè)集,選取20個(gè)樣品作為預(yù)測(cè)集。
建立近紅外光譜定量模型時(shí),選取的建模集樣品應(yīng)具有代表性,組分濃度在整個(gè)范圍內(nèi)盡可能分布均勻,建模集組分濃度變化范圍應(yīng)包括預(yù)測(cè)集組分濃度變化范圍[7]。實(shí)驗(yàn)選取的樣品水分的濃度范圍為12.9 %~14.9 %,平均濃度為14.1 %,相對(duì)標(biāo)準(zhǔn)差為0.38,滿足建立近紅外光譜定量預(yù)測(cè)模型的基本要求。
建模集光譜圖如圖1所示。近紅外光譜的吸收譜帶主要為有機(jī)分子含氫基團(tuán)(C—H,N—H,O—H等)伸縮振動(dòng)的各級(jí)倍頻以及合頻形成。從圖1中可以看出小麥粉的近紅外光譜中含有豐富的化學(xué)官能團(tuán)信息,幾乎能反映有機(jī)物的所有含氫基團(tuán)的信息,能夠反映出分子的結(jié)構(gòu)和組成狀態(tài),因此,可通過近紅外光譜對(duì)有機(jī)物樣本進(jìn)行定量分析[8]。
圖1 小麥粉樣品近紅外光譜
2.3.1 最佳預(yù)處理方法
對(duì)比研究了不同預(yù)處理方法對(duì)預(yù)測(cè)模型效果的影響,如表1,并最終得到實(shí)驗(yàn)最佳預(yù)測(cè)模型。
表1 不同預(yù)處理方法建立小麥粉水分含量近紅外預(yù)測(cè)模型
實(shí)驗(yàn)選取主成分?jǐn)?shù)、決定系數(shù)(R-square)、校正均方根誤差(root mean square error of calibration,RMSEC)、交叉驗(yàn)證均方根誤差(root mean square error of cross verification,RMSECV)、預(yù)測(cè)均方根誤差(root mean square error of prediction,RMSEP)5個(gè)參數(shù)綜合評(píng)價(jià)模型的性能。其中R-square表示實(shí)際值和預(yù)測(cè)值之間的關(guān)系;RMSECV為確定維數(shù)和最優(yōu)校正模型主要依據(jù),其值越小模型越精確;RMSEP用于驗(yàn)證模型的精度,數(shù)值越小說(shuō)明模型外部預(yù)測(cè)能力越高;RMSEC,RMSECV,RMSEP三者具有一定的數(shù)值大小關(guān)系,RMSEC一定小于RMSECV,但兩者不應(yīng)差異太大,否則說(shuō)明選取的樣品代表性不好或者表示模型信息提取不充分[9~11]。綜合分析表1中的數(shù)據(jù)可知:當(dāng)采用一階導(dǎo)數(shù)和Savitsky-Golay(S-G)濾波平滑對(duì)光譜進(jìn)行預(yù)處理時(shí)所建模型效果最好,與其他模型相比其RMSECV最小,說(shuō)明模型精度最高,RMSECV略高于RMSEC且RMSEP略高于RMSECV,說(shuō)明模型所選建模集和預(yù)測(cè)集具有代表性,模型擬合度高,R-square較高說(shuō)明預(yù)測(cè)值與真實(shí)值比較接近;其主因子數(shù)為5,決定系數(shù)為0.929,校正均方根誤差為0.111,交叉驗(yàn)證均方根誤差為0.126,預(yù)測(cè)均方根誤差為0.154。圖2為原始光譜采用一階導(dǎo)數(shù)和S-G平滑濾波后的光譜。
圖2 光譜經(jīng)過一階導(dǎo)數(shù)和S-G濾波平滑后光譜
2.3.2 近紅外校正模型的分析和驗(yàn)證
實(shí)驗(yàn)采用unscramble 軟件建立近紅外PLS校正模型,同時(shí)采用交叉驗(yàn)證法和外部預(yù)測(cè)集評(píng)價(jià)模型的性能。由一階導(dǎo)+S-G(7 points)建立模型,如圖3~圖6。其中圖3為主成分分析散點(diǎn)圖,代表選取建模樣本集是否合適,大部分樣本點(diǎn)應(yīng)接近坐標(biāo)軸且均勻分布。圖3中X軸表示樣本與第一主成分的相關(guān)系數(shù),Y軸表示樣本與第二主成分的相關(guān)系數(shù),各個(gè)點(diǎn)的位置代表各樣本的主成分綜合得分大小,得分點(diǎn)與某一坐標(biāo)軸越接近說(shuō)明與相應(yīng)的主成分越相關(guān);圖3中長(zhǎng)軸為X軸,說(shuō)明第一主成分反映出原始數(shù)據(jù)較多的信息??芍獙?shí)驗(yàn)選取樣本較合適,但有小部分點(diǎn)遠(yuǎn)離坐標(biāo)軸,此類點(diǎn)在一定情況下可當(dāng)作異常點(diǎn)剔除,但剔除前應(yīng)綜合考慮此類點(diǎn)是否具有代表性或唯一性,避免誤刪。圖4為所建模型的回歸系數(shù),代表所測(cè)光譜的各個(gè)波長(zhǎng)區(qū)間光譜信息與小麥粉中水分含量的相關(guān)性,可以確定波長(zhǎng)區(qū)間與小麥粉水分含量的信息相關(guān)度,為信息的進(jìn)一步篩選提供了依據(jù)。圖4中縱坐標(biāo)數(shù)值代表因變量相關(guān)性大小,因變量Y大于0說(shuō)明此區(qū)間信息與水分成正相關(guān),區(qū)間內(nèi)蘊(yùn)含大量與水分正相關(guān)的信息。從圖4可知1 190~1 250 nm波長(zhǎng)區(qū)間光譜信息與水分呈正相關(guān),而1 640~1 690 nm波長(zhǎng)區(qū)間光譜信息與水分呈負(fù)相關(guān)。圖5為剩余驗(yàn)證方差,表示因變量Y的方差與主因子數(shù)的關(guān)系,預(yù)測(cè)方差的基本趨勢(shì)隨主因子數(shù)的增加而減少,一般情況下,剩余方差曲線趨于平緩的第一個(gè)因子數(shù)與模型最佳主因子數(shù)相等,從圖5中可看出,模型最佳主因子數(shù)為5。圖6為近紅外校正模型真實(shí)值和內(nèi)部交叉驗(yàn)證預(yù)測(cè)值散點(diǎn)圖,由圖6可以樣本的真實(shí)值和內(nèi)部校正預(yù)測(cè)值很接近,決定系數(shù)較高,校正均方根誤差和交叉驗(yàn)證均方根誤差較小,說(shuō)明模型的內(nèi)部預(yù)測(cè)效果好。
模型建立后,利用外部校驗(yàn)的方法驗(yàn)證前述最優(yōu)校正模型的性能,預(yù)測(cè)樣品集數(shù)目為20,預(yù)測(cè)均方根誤差為0.154,偏差為0.017,表明:最優(yōu)校正模型擬合度好,預(yù)測(cè)誤差小,能很好地預(yù)測(cè)未知小麥粉樣本的水分含量。
圖3 主成分分析
圖4 回歸系數(shù)
圖5 剩余驗(yàn)證方差
圖6 小麥粉水分含量近紅外校正模型
2.3.3 實(shí)驗(yàn)結(jié)果分析
由表1可知實(shí)驗(yàn)評(píng)定的最佳預(yù)處理方法為一階導(dǎo)數(shù)結(jié)合S-G濾波平滑的方式,說(shuō)明MicroNir—2200長(zhǎng)時(shí)間工作會(huì)產(chǎn)生一定的基線平移現(xiàn)象,而且光譜采集時(shí)產(chǎn)生了一定的噪聲。從表1的數(shù)據(jù)可知,大部分的預(yù)測(cè)模型內(nèi)部驗(yàn)證結(jié)果和外部驗(yàn)證結(jié)果基本一致,即RMSEP略大于RMSECV,但是采用多元散射校正+一階導(dǎo)+S-G濾波平滑或多元散射校正+基線+矢量歸一化預(yù)處理方法時(shí),所建模型RMSEP遠(yuǎn)大于RMSECV,預(yù)測(cè)效果很差,可能的原因是建模采用的預(yù)處理方法過多,過多的預(yù)處理方法導(dǎo)致了信號(hào)的缺失,再進(jìn)行外部預(yù)測(cè)時(shí)反而預(yù)測(cè)效果很差。
本實(shí)驗(yàn)采用MicroNir—2200掃描小麥粉樣品的近紅外光譜,采用Unscramble軟件建立基于偏最小二乘法的小麥粉水分含量近紅外光譜校正模型。結(jié)果表明:所建小麥粉水分含量近紅外模型具有較好的準(zhǔn)確性和穩(wěn)定性,可應(yīng)用于小麥粉水分含量的快速檢測(cè)及質(zhì)量控制,結(jié)果準(zhǔn)確可靠,該研究為下一步建立小麥粉的在線快速檢測(cè)水分含量提供扎實(shí)的理論研究基礎(chǔ)和分析模型。
后續(xù)研究應(yīng)加入更多不同品種的小麥粉以及增強(qiáng)樣本的代表性,選取實(shí)驗(yàn)樣本時(shí)應(yīng)盡可能在整個(gè)濃度范圍內(nèi)均勻分布,提高實(shí)驗(yàn)操作精度以達(dá)到同時(shí)提高模型的穩(wěn)健性和適用范圍。
參考文獻(xiàn):
[1] 閆李慧,王金水,金華麗,等.基于近紅外光譜技術(shù)的面粉水分無(wú)損檢測(cè)模型的建立[J].現(xiàn)代食品科技,2011,27(2):235-238.
[2] 吳靜珠,劉 倩,陳 巖,等.基于近紅外與高光譜技術(shù)的小麥種子多指標(biāo)檢測(cè)方法[J].傳感器與微系統(tǒng),2016,35(7):42-44.
[3] 耿 姝,陳 勇,金 葉,等.基于近紅外技術(shù)的金銀花藥材多指標(biāo)成分快速檢測(cè)[J].中國(guó)現(xiàn)代應(yīng)用藥學(xué),2016,33(2):144-150.
[4] 張玉華,孟 一,張應(yīng)龍,等.近紅外光譜技術(shù)在食品安全領(lǐng)域應(yīng)用研究進(jìn)展[J].食品科技,2012(10):283-286.
[5] 馮 幫,陳 斌,顏 輝.便攜式近紅外光譜檢測(cè)系統(tǒng)的開發(fā)[J].現(xiàn)代儀器與醫(yī)療,2014(2):12-16.
[6] 國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).GB 5009.3—2010食品中水分的測(cè)定[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2010.
[7] 金華麗,卞 科.近紅外光譜法檢測(cè)小麥粉中的水分含量[J].中國(guó)糧油學(xué)報(bào),2010,25(8):109-112.
[8] 劉翠玲,胡玉君,孫曉榮,等.基于近紅外光譜技術(shù)的小麥粉灰分含量檢測(cè)方法研究[J].糧油食品科技,2015,23(6):76-79.
[9] 周照艷,岳 勇,王 濤,等.PLS因子數(shù)對(duì)定量模型性能穩(wěn)定性的影響分析[J].計(jì)算機(jī)工程與設(shè)計(jì),2014(5):1788-1791.
[10] 吳靜珠,吳勝男,劉翠玲,等.近紅外和高光譜技術(shù)用于小麥籽粒蛋白含量預(yù)測(cè)探索[J].傳感器與微系統(tǒng),2013,32(2):60-62.
[11] 王寧寧,申兵輝,關(guān)建軍,等.近紅外光譜分析技術(shù)識(shí)別奶粉中淀粉摻假的研究[J].光譜學(xué)與光譜分析,2015,35(8):141-146.