王賦騰,孫曉榮,劉翠玲,徐瑩瑩,尹唯佳
(北京工商大學計算機與信息工程學院,食品安全大數(shù)據(jù)技術(shù)北京市重點實驗室,北京 100048)
?
光譜預處理對便攜式近紅外光譜儀快速檢測小麥粉灰分含量的影響
王賦騰,孫曉榮*,劉翠玲,徐瑩瑩,尹唯佳
(北京工商大學計算機與信息工程學院,食品安全大數(shù)據(jù)技術(shù)北京市重點實驗室,北京 100048)
便攜式近紅外光譜儀,偏最小二乘,灰分,矢量歸一化,Savitsky-Golay卷積平滑法
小麥粉是人們?nèi)粘I钪谐R姷闹魇吃现?富含各種人體所需的營養(yǎng)物質(zhì)和微量元素,是國家作為加強國民攝取鐵、鋅、維生素A等多種營養(yǎng)元素的主要載體。小麥粉中灰分含量的高低會直接影響小麥粉的內(nèi)在品質(zhì)和使用性能,從而間接影響面制食品的加工方式和口感,因此小麥粉灰分含量是衡量小麥粉品質(zhì)的客觀因素之一,也是國標規(guī)定重要檢測指標之一[1]。目前國家已經(jīng)出臺了基于近紅外光譜定量分析小麥粉中灰分含量的相關(guān)規(guī)定[2],明確了檢測過程中的精度要求,但是目前針對小麥粉灰分近紅外定量分析模型大多停留在驗證模型的可行性與可靠性[3-4],模型實際應用效果并不理想,模型的測量精度和穩(wěn)健性不能達到國家規(guī)定的相關(guān)標準。所以大多小麥粉生產(chǎn)工廠依舊采用傳統(tǒng)國標法對小麥粉灰分含量進行檢測,傳統(tǒng)的方法具有耗時多、操作繁瑣,損壞樣本等缺點,面對不斷增長的小麥粉產(chǎn)量,不論是對工廠還是檢驗機構(gòu),灰分含量的檢測工作都是一個極大的考驗,因此提高小麥粉定量檢測過程中模型的預測精度和穩(wěn)健性顯得尤為重要,而如何運用合適的預處理方法處理光譜信息正是提高模型性能重要的一環(huán)[5-7]。
在實驗過程中使用光譜儀器采集光譜時往往伴隨著除自身信息以外的噪聲以及無關(guān)變量,如雜散光、儀器工作狀態(tài)漸變、樣本背景等,為了削弱這些不良因素,保證光譜信息與所測值之間具有很好的相關(guān)性,提高所建模型的性能,運用適合的預處理方法對光譜信息進行處理顯得十分關(guān)鍵[8-10]。而光譜預處理一直是光譜分析技術(shù)的關(guān)鍵步驟,已經(jīng)應用于很多領(lǐng)域的研究而且效果顯著。吳靜珠等采取人為在小麥樣本光譜中添加白噪聲的方法,比較了常見的光譜預處理方法對建模的影響,得到光譜預處理方法可以有效的去除噪聲從而有效的提高模型質(zhì)量的結(jié)論,但預處理方法的組合方式還有待進一步探討[11]。本實驗采用MicroNir-2200便攜式微型近紅外光譜儀采集隨機選取的125個小麥粉樣本的近紅外光譜信息,建立小麥粉灰分含量近紅外校正模型。實驗結(jié)合樣本特性和預處理方法功能,探討了基線校正(Baseline)、矢量歸一化(Normalize)、Savitsky-Golay卷積平滑法、導數(shù)、標準正態(tài)變量變換(SNV)以及多元散射校正(MSC)這六種預處理方法及其組合方式對建模的影響。
1.1 材料與儀器
小麥粉 隨機選取同一時間段125個樣本作為建模樣本,隨機其他不同時間段的74個樣本作為重復性實驗樣本,來源于古船食品有限公司。
MicroNir-2200便攜式微型近紅外光譜儀 美國捷迪訊通訊有限公司。
1.2 實驗方法
1.2.1 近紅外光譜采集及分析 將小麥粉樣本裝于密封的樣本袋中,靜置一定時間待儀器溫度穩(wěn)定在工作溫度時掃描樣本(37~37.8 ℃)。掃描波長范圍為1150~2150 nm,光譜采樣間隔8.1 nm,共125個波長點。掃描光譜時單次積分時間5100 μs,積分次數(shù)100次,每條光譜采集時間1 s;光譜掃描時將探頭緊貼在光滑的樣本袋表面,在樣本袋不同的位置掃描5條光譜,然后求取平均光譜作為實驗建模的原始光譜。
在Matlab 2014b中采用SPXY算法按照4∶1的比例將原始光譜劃分為建模集和預測集,建模樣本灰分的濃度范圍為0.46%~1.00%,平均濃度范圍為0.61%,標準差為0.126。建模集樣本濃度范圍包含預測集樣本濃度范圍。由于樣本集是隨機選取得到的,因此整個樣本集濃度范圍分布不夠均衡,但基本滿足實驗需求。
另采取重復性實驗驗證模型的穩(wěn)健性,實驗隨機選取實驗室近期用Micro Nir-2200便攜式近紅外光譜儀掃描的74個小麥粉樣本光譜作為重復性實驗預測集,樣本灰分濃度范圍為0.46%~0.85%,在模型的預測范圍內(nèi)。
1.2.2 灰分含量化學值的測定 采用GB 5505-2008國標法測定小麥粉灰分含量的化學值。將乙酸鎂乙醇溶液加入到小麥粉樣品中,將樣品放到干鍋中進行(800±25) ℃高溫灼燒至樣品完全灰化,通過稱重對比測得樣品中灰分的含量[12]。
1.2.3 模型的建立 利用Unscramble9.7軟件,采用不同預處理方法對原始光譜進行處理,再采用內(nèi)部交叉驗證方法建立PLS模型。通過對比各模型的性能參數(shù),分析不同預處理方法對建模的影響,得出實驗最佳預處理模型。
2.1 最佳預處理方法的確定及分析
表1 不同預處理方法建立小麥粉灰分含量近紅外定量分析模型Table 1 Quantitative analytical models of ash content in flour after different spectrum preprocessing methods
實驗首先對比了單獨采取MSC、SNV、S-G濾波平滑等預處理方法與無預處理方法所建模型的性能。由表1可知,相較于無預處理方法建立的模型,經(jīng)過MSC、SNV、S-G這三種方法處理光譜后所建模型的決定系數(shù)更大,各均方根誤差明顯降低,模型的擬合精度和預測精度都有較大的提高。經(jīng)過Noamalize處理后所建模型的校正決定系數(shù)增大,交叉驗證決定系數(shù)減少,內(nèi)部均方根誤差減少,外部預測誤差基本沒變,模型的擬合精度有了一定的提升,預測精度并未提高。而使用Baseline、1st兩種方法處理光譜后所建模型的交叉驗證決定系數(shù)下降,外部預測誤差增大,模型的預測精度有所下降,可能的原因是Micronir-2200近紅外光譜儀在一定時間內(nèi)工作狀態(tài)較穩(wěn)定(1 h左右),并不存在明顯的基線漂移現(xiàn)象,而在Baseline和1st預處理過程中放大了噪聲干擾,因此導致模型性能下降。綜合對比上述7種模型的性能可得出實驗中存在的影響因素主要有噪聲干擾和散射干擾,樣本分布不夠均衡對建模同樣有一定的影響。
2.2 模型的建立及分析
圖1 樣本集原始光譜圖Fig.1 The original spectrum of samples
圖1是原始光譜,圖2是經(jīng)過Normalize和S-G濾波平滑組合預處理后光譜圖。與圖1相比,圖2的光譜的吸收峰位置不變,但整個光譜簇更加集中,5個S-G濾波平滑點將光譜的首尾兩端四個光譜數(shù)據(jù)分量被置0。通過對比最佳校正模型和無預處理模型的性能,可知經(jīng)過Normalize+S-G(5 point)處理后噪聲干擾對建模的影響明顯降低了,樣本分布不均對建模所造成的影響同樣降低了許多。實驗最佳校正模型圖如圖3所示,圖3中絕大多數(shù)樣本點都非常接近擬合直線,說明模型擬合度好,但從圖3中樣本的分布情況可以看出建模樣本灰分含量高的樣本較少,樣本的整體分布不夠均衡,對建模效果造成了一定的影響。圖3中右下角顯示的是模型采用的預處理組合和最佳主因子數(shù),在Unscramble軟件中,最佳主因子數(shù)由剩余驗證方差決定。圖4是實驗最佳校正模型的剩余驗證方差圖,代表剩余驗證方差的曲線隨著主因子數(shù)的增加其變化越趨于平緩,最終基本保持不變,在圖4中,主因子數(shù)為12對應的曲線的斜率基本為0,因此認定最佳主因子數(shù)為12。
圖2 經(jīng)Normalize+S-G(5 point)處理后光譜圖Fig.2 The spectrum of samples with Normalize+S-G(5 point)
圖3 實驗最佳模型Fig.3 The best model in experiment
圖4 最佳校正模型剩余驗證方差Fig.4 The spectrum of residual validation variance of the best model
2.3 重復性實驗
實驗進一步設計了重復性實驗,其中無預處理模型的重復性實驗結(jié)果如圖5所示;最佳預處理模型的結(jié)果如圖6所示。由圖5、圖6可知無預處理模型的重復性實驗預測均方根誤差為0.096,擬合曲線斜率為0.816,最佳預處理模型的重復性實驗預測均方根誤差為0.086,擬合曲線斜率為0.977,兩個模型重復性實驗的預測誤差都在國標接受范圍內(nèi)[19],模型的穩(wěn)健性滿足要求,最佳組處理模型的穩(wěn)健性更好。對比兩圖可以明顯看出圖6中各個樣本點更加接近于擬合曲線,擬合度更好,預測效果更好。
圖5 無預處理模型的重復性實驗預測結(jié)果Fig.5 The result of replication experiment in the model without preprocessing method
圖6 最佳校正模型的重復性實驗預測結(jié)果Fig.6 The result of replication experiment in the best model
實驗以小麥粉灰分含量的定量分析模型為研究對象,分析了不同預處理方法對建模的影響,用外部預測和重復性實驗檢驗了模型的預測精度和穩(wěn)健性。實驗的最佳預處理方法是Normalize和S-G濾波平滑組合方法,使用最佳預處理方法對光譜進行處理后使用交叉驗證方法建立的PLS模型的決定系數(shù)為0.947和0.896,預測均方根誤差為0.026,模型的擬合精度和預測精確度都很高。而無預處理模型的決定系數(shù)為0.873和0.832,預測均方根誤差為0.056;對比兩者的整體性能,可知合適的預處理方法能很好的提高建模效果,是建模關(guān)鍵的一步,也是小麥粉品質(zhì)在線檢測提高模型精度和穩(wěn)健性的重要環(huán)節(jié),為實現(xiàn)小麥粉品質(zhì)的在線檢測奠定了基礎(chǔ)。
[1]許合金,張百赟,吳丹,等.不同因素對面粉品質(zhì)的影響[J].飼料與畜牧:新飼料,2015(5):34-37.
[2]閆李慧. 基于近紅外光譜技術(shù)的面粉品質(zhì)研究[D]. 鄭州:河南工業(yè)大學,2012:1-90.
[3]竇穎,孫曉榮,劉翠玲,等.基于模擬退火算法優(yōu)化波長的面粉品質(zhì)檢測[J].食品科學,2016,37(12):208-211.
[4]金華麗,王金水.近紅外光譜法檢測小麥粉中灰分含量的研究[J].河南工業(yè)大學學報(自然科學版),2010,31(1):14-17.
[5]蔣衍恩.如何使用近紅外儀實現(xiàn)小麥粉生產(chǎn)的過程控制[J].現(xiàn)代小麥粉工業(yè),2010,24(6):18-20.
[6]李樹高.小麥粉灰分含量對面制品的影響[J].糧食與食品工業(yè),2008,15(5):11.
[7]王偉明,董大明,鄭文剛,等.梨果糖濃度近紅外漫反射光譜檢測的預處理方法研究[J].光譜學與光譜分析,2013,33(2):359-362.
[8]尼珍,胡昌勤,馮芳.近紅外光譜分析中光譜預處理方法的作用及其發(fā)展[J].藥物分析雜志,2008(5):824-829.
[9]孫曉榮,劉翠玲,吳靜珠,等.基于近紅外光譜無損快速檢測小麥粉品質(zhì)的研究[J].北京工商大學學報(自然科學版),2011,29(4):68-70.
[10]金華麗,卞科.近紅外光譜法檢測小麥粉中的水分含量[J].中國糧油學報,2010,25(8):109-112.
[11]吳靜珠,李慧,王克棟,等.光譜預處理在農(nóng)產(chǎn)品近紅外模型優(yōu)化中的應用研究[J].農(nóng)機化研究,2011(3):178-181.
[12]中國國家標準化管理委員會.GB/T 5505-2008 糧油檢驗灰分測定法[S].北京:中國標準出版社,2008.
[13]徐一茹,劉翠玲,孫曉榮,等.基于近紅外和中紅外光譜技術(shù)的小麥粉品質(zhì)檢測及摻雜鑒別方法[J].食品科學,2014,12:128-132.
[14]李河,林勤保,郭捷,等.近紅外光譜技術(shù)及其在液態(tài)食品上應用的研究進展[J].食品工業(yè)科技,2013,34(11):376-383.
[15]Daiki Ono,Takeshi Bamba,Yuichi Oku,et al. Application of Fourier transform near-infrared spectroscopy to optimizationof green tea steaming process conditions[J]. Journal of Bioscience and Bioengineering,2011,112(3):247-251.
[16]FGuy,SPrache,AThomas,et al.Prediction of lamb meat fatty acid composition using near-infrared reflectance spectroscopy(NIRS)[J].Food Chemistry,2011,127(3):1280-1286.
[17]金偉,趙紅霞,高芝.基于PLS建模在近紅外光譜分析中的應用展望[J].現(xiàn)代農(nóng)業(yè)科學,2008(11):10-11.
[18]周照艷,岳勇,王濤,等.PLS因子數(shù)對定量模型性能穩(wěn)定性的影響分析[J].計算機工程與設計,2014(5):1788-1791.
[19]國家標準化管理委員會.GB 5009.4-2010食品中灰分的測定[S].北京:中國標準出版社,2010.
Effect of spectrum preprocessing methods on the rapid detection of ash content in flour by the portable NIR spectrometer
WANG Fu-teng,SUN Xiao-rong*,LIU Cui-ling,XU Ying-ying,YIN Wei-jia
(Beijing Key Laboratory of Big Data Technology for Food Safety,School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China)
the portable NIR spectrometer;the partial least squares analysis;ash;normalize;Savitsky-Golay
2016-10-14
王賦騰(1993-),男,碩士,研究方向:智能檢測與建模,E-mail:wft1993wft@163.com。
*通訊作者:孫曉榮(1976-),女,博士,副教授,研究方向:智能測量技術(shù)與數(shù)據(jù)處理、系統(tǒng)建模與仿真方法研究、智能控制方法,E-mail:sxrchy@sohu.com。
北京市教委科研計劃重點項目(KZ201310011012);北京市教委科技創(chuàng)新平臺建設項(PXM_2012_014213_000023);北京市自然科學基金項目(4142012);北京市優(yōu)秀人才資助項目(2012D005003000007)。
TS211.7
A
1002-0306(2017)10-0055-05
10.13386/j.issn1002-0306.2017.10.003