黃 蕾,韋紫玉
(1.崇左市糧油質(zhì)量監(jiān)督檢測(cè)中心,廣西 崇左 532200;2.廣西科技大學(xué)經(jīng)濟(jì)與管理學(xué)院,廣西 柳州 545006)
大米作為我國(guó)主糧之一,在日常飲食中占據(jù)重要的地位。在大米收購(gòu)、貯藏、加工過程中,其水分含量是一項(xiàng)不可或缺的檢測(cè)指標(biāo)[1]。傳統(tǒng)大米水分含量多采用GB 5009.3—2016《食品安全國(guó)家標(biāo)準(zhǔn)食品中水分的測(cè)定》[2]中的直接干燥法,但該方法操作過于繁瑣、耗時(shí)長(zhǎng),導(dǎo)致大米的水分含量檢測(cè)效率低。因此,開展大米水分含量快速無損檢測(cè)方法的研究具有重要的意義。
近紅外光譜 (Near Infrared Spectrometry,NIRS)分析技術(shù)以其簡(jiǎn)單準(zhǔn)確、快速高效、綠色無損等優(yōu)點(diǎn)廣泛應(yīng)用于食品、醫(yī)藥、化工、材料等領(lǐng)域[3-4]。目前,近紅外光譜技術(shù)在大米品質(zhì)檢測(cè)中的應(yīng)用已有諸多報(bào)道,孫永海等人[5]利用近紅外漫反射技術(shù)采集了吉林大米樣品的光譜數(shù)據(jù),并建立了基于BP 神經(jīng)網(wǎng)絡(luò)的定量模型,準(zhǔn)確率達(dá)到了96.67%。李路等人[6]采用近紅外光譜技術(shù)對(duì)海南大米樣品的蛋白質(zhì)、脂肪、總糖、含水量進(jìn)行檢測(cè),實(shí)現(xiàn)了快速檢測(cè)大米主要營(yíng)養(yǎng)成分的功能。苗雪雪等人[7]采集了湖南大米樣品的光譜數(shù)據(jù)后,建立了移動(dòng)窗口偏最小二乘(NMPLS) 大米水分定量模型,實(shí)現(xiàn)了大米水分含量的快速測(cè)定。路輝等人[8]利用近紅外光譜技術(shù)對(duì)江蘇大米樣品的直鏈淀粉、蛋白質(zhì)、脂肪、水分含量進(jìn)行了檢測(cè),建立了偏最小二乘定量模型,實(shí)現(xiàn)了多品質(zhì)指標(biāo)的快速檢測(cè)。然而,目前國(guó)內(nèi)采用近紅外光譜技術(shù)檢測(cè)大米品質(zhì)的研究所用樣品大多產(chǎn)地單一,而我國(guó)大米產(chǎn)地分布廣泛,各地區(qū)大米成分存在差異,導(dǎo)致所建立的水分含量近紅外定量模型普適性較差。
因此,收集來自不同地區(qū)的大米樣品,結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)其近紅外光譜數(shù)據(jù)和水分含量進(jìn)行分析處理,建立大米水分含量預(yù)測(cè)模型,并優(yōu)選多種預(yù)處理方法和建模方法,旨在實(shí)現(xiàn)基于近紅外漫反射光譜技術(shù)對(duì)多個(gè)產(chǎn)地的大米水分含量的快速無損檢測(cè)。
大米樣品:收集不同地區(qū)的大米樣本共120 個(gè),分別來自江蘇?。?0 個(gè))、廣東?。?0 個(gè))、遼寧?。?0 個(gè))、湖北省 (20 個(gè)) 和海南省 (20 個(gè)),樣品編號(hào)、分裝后保存于實(shí)驗(yàn)室陰涼處。
S450 型近紅外光譜分析儀,上海棱光技術(shù)有限公司產(chǎn)品;電熱恒溫干燥箱,紹興市蘇珀儀器有限公司產(chǎn)品;高速多功能粉碎機(jī),永康市鉑歐五金制品有限公司產(chǎn)品;電子天平,上海市菁海儀器有限公司產(chǎn)品。
將大米樣品置于實(shí)驗(yàn)室陰涼處24 h,每個(gè)樣品選取150 g 左右置于粉碎機(jī)粉碎后裝袋備用。選用K-S(Kennard-Stone) 方法劃分樣品集合,按照7∶3 的比例劃分校正集和預(yù)測(cè)集,最終選取84 個(gè)樣品作為建立模型的校正集,剩余的36 個(gè)樣品作為驗(yàn)證模型的預(yù)測(cè)集。
1.3.1 大米水分含量檢測(cè)
按照GB 5009.3—2016 中的直接干燥法檢測(cè)大米樣品的水分含量,具體操作流程為稱取5 g(精確至0.001 g) 樣品放在干燥皿中,置于101~105 ℃干燥箱中烘干4~6 h 至恒質(zhì)量,取出后置于干燥器中干燥0.5 h,再次對(duì)樣品進(jìn)行稱量,計(jì)算得出水分含量。
1.3.2 光譜數(shù)據(jù)采集
S450 型近紅外光譜分析儀的工作波長(zhǎng)范圍為900~2 500 nm,選取全波段進(jìn)行光譜數(shù)據(jù)采集。在室溫條件下,稱取50 g 樣品裝入樣品池后進(jìn)行光譜采集,設(shè)置分辨率12 nm,采樣間隔1 nm,掃描時(shí)每次樣品旋轉(zhuǎn)120°,每個(gè)樣品均重復(fù)采集3 次,取平均光譜作為該樣品的最終測(cè)量光譜,以減少因裝樣不均勻造成的誤差。
1.3.3 近紅外建模方法
(1) 光譜預(yù)處理。預(yù)處理方法可以有效消除光譜采集過程中由于環(huán)境、背景等因素產(chǎn)生的噪聲信息,提高預(yù)測(cè)模型的穩(wěn)定性[9]。使用Matlab 軟件對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,包括Savitzky-Golay 平滑(SGF)、矢量歸一化(Standard Normal Variate transformation,SNV) 結(jié)合一階導(dǎo)數(shù)、歸一化、多元散射校正(Multiplicative Scatter Correction,MSC) 和二階導(dǎo)數(shù)等方法,旨在篩選出最優(yōu)的光譜預(yù)處理方法。
(2) 模型建立。分別利用偏最小二乘回歸(Partial Least Square Regression,PLSR) 和主成分回歸(Principal Component Regression,PCR) 建立預(yù)測(cè)模型,將5種預(yù)處理方法分別與2種建模方法兩兩結(jié)合,構(gòu)成10種不同建模路徑,按照評(píng)價(jià)指標(biāo)選擇出最優(yōu)建模方法。
采用多個(gè)指標(biāo)對(duì)建立的模型進(jìn)行評(píng)價(jià),以校正集相關(guān)系數(shù)(Rc)、預(yù)測(cè)集相關(guān)系數(shù)(Rp)、校正均方根標(biāo)準(zhǔn)差(RMSEC)、預(yù)測(cè)均方根標(biāo)準(zhǔn)差(RMSEP)為評(píng)價(jià)指標(biāo)。當(dāng)相關(guān)系數(shù)R 越接近1,均方根標(biāo)準(zhǔn)差越小,說明模型的性能越優(yōu)異。
采用直接干燥法檢測(cè)的大米樣品水分含量。
大米水分含量統(tǒng)計(jì)表1。
表1 大米水分含量統(tǒng)計(jì)
由表1 可知,樣本整體的水分含量范圍為13.09%~20.93%,范圍分布較廣,基本涵蓋大米水分含量的變化范圍。校正集大米樣品的水分含量范圍為13.09%~20.93%,預(yù)測(cè)集大米樣品的水分含量范圍為13.14%~20.55%,驗(yàn)證集是校正集的子集,能夠更好地對(duì)定量模型進(jìn)行驗(yàn)證。
不同產(chǎn)地大米水分含量分布散點(diǎn)見圖1。
圖1 不同產(chǎn)地大米水分含量分布散點(diǎn)
由圖1 可知,江蘇、湖北、廣東、海南4 個(gè)地方的樣品水分含量差異性較小,而東北大米的水分含量較高,可能是由于地理因素,但較好的數(shù)據(jù)區(qū)分度會(huì)提高定量模型的預(yù)測(cè)性能。
近紅外光譜主要是由于分子振動(dòng)的非諧振型使分子振動(dòng)從基態(tài)向高能級(jí)躍遷時(shí)產(chǎn)生[10]。
樣本的原始近紅外光譜圖見圖2。
圖2 樣本的原始近紅外光譜圖
由圖2 可知,不同樣本在相同波長(zhǎng)的吸光度存在一定的差異,可能是由于樣品內(nèi)部化學(xué)成分含量不同。水分子由O-H 鍵構(gòu)成,而游離O-H 鍵的組合頻產(chǎn)生的吸收峰出現(xiàn)在波長(zhǎng)1 950~1 980 nm,一級(jí)倍頻產(chǎn)生的吸收峰出現(xiàn)在波長(zhǎng)1 440~1 480 nm。其他吸收峰主要是C-H 鍵、N-H 鍵的振動(dòng)伸縮和彎曲伸縮產(chǎn)生的[11],不再進(jìn)行具體分析。
以不同產(chǎn)地大米樣品的平均光譜為代表,觀察光譜數(shù)據(jù)的差異。
不同產(chǎn)地大米樣品平均光譜對(duì)比圖見圖3。
圖3 不同產(chǎn)地大米樣品平均光譜對(duì)比圖
由圖3 可知,光譜數(shù)據(jù)存在差異性,但光譜差異非常小且總體趨勢(shì)相似,因此選擇不同地區(qū)大米樣品光譜數(shù)據(jù)建立的定量預(yù)測(cè)模型具有普遍適用性。
按照試驗(yàn)設(shè)計(jì)中預(yù)處理方法和建模方法對(duì)光譜數(shù)據(jù)進(jìn)行分析處理。
大米水分近紅外光譜模型性能對(duì)比見表2。
由表2 可知,PCR 法建立的模型預(yù)測(cè)精度均高于PLSR 法建立的模型,是由于PCR 能有效去除噪聲信息,提高了模型預(yù)測(cè)性能[12]。其中,MSC 結(jié)合PCR 法建立的模型預(yù)測(cè)效果最好,此時(shí)模型的Rc和RMSEC分別為 0.948 8,0.004 8,Rp和 RMSEP分別為0.936 2,0.006 5,這是由于MSC 能夠消除因顆粒分布不均勻、顆粒大小不同產(chǎn)生的散射影響。
表2 大米水分近紅外光譜模型性能對(duì)比
MSC 預(yù)處理后的光譜圖見圖4。
由圖4 可知,光譜在1 470,1 960 nm 處的O-H鍵吸收峰非常明顯。
圖4 MSC 預(yù)處理后的光譜圖
2.4.1 內(nèi)部交叉驗(yàn)證
使用校正集的樣本數(shù)據(jù)進(jìn)行內(nèi)部交叉驗(yàn)證。
校正集樣品的水分含量預(yù)測(cè)散點(diǎn)圖見圖5。
圖5 校正集樣品的水分含量預(yù)測(cè)散點(diǎn)圖
由圖5 可知,校正交叉驗(yàn)證相關(guān)系數(shù)R 為0.948 8,交互驗(yàn)證均方根標(biāo)準(zhǔn)差(RMSEPCV) 為0.006 9,預(yù)測(cè)效果較好。從圖5 也可看出,校正集數(shù)據(jù)點(diǎn)均勻地分布在擬合方程兩側(cè),擬合程度比較高。
2.4.2 外部樣本驗(yàn)證
為了驗(yàn)證預(yù)測(cè)模型的準(zhǔn)確性和可靠性,使用預(yù)測(cè)集樣本數(shù)據(jù)對(duì)已建立的校正集模型進(jìn)行評(píng)價(jià)。結(jié)果表明,預(yù)測(cè)集相關(guān)系數(shù)為0.936 2,RMSEP 為0.006 5,而校正集的RMSEC 為0.005 8,2 個(gè)指標(biāo)都比較小且僅相差0.000 7,說明預(yù)測(cè)模型準(zhǔn)確可靠,能夠應(yīng)用在大米水分含量的檢測(cè)中。
預(yù)測(cè)集樣品的水分含量預(yù)測(cè)散點(diǎn)圖見圖6。
由圖6 可知,模型預(yù)測(cè)結(jié)果的的平均相對(duì)誤差為3.385 3%,平均絕對(duì)誤差為0.54%,表明定量預(yù)測(cè)模型的性能良好。
圖6 預(yù)測(cè)集樣品的水分含量預(yù)測(cè)散點(diǎn)圖
收集來自各5 個(gè)地區(qū)具有代表性的大米樣品,采集近紅外光譜數(shù)據(jù)并測(cè)定水分含量。使用多種預(yù)處理方法和建模方法建立大米水分預(yù)測(cè)模型并優(yōu)化,比較各模型的預(yù)測(cè)效果,選擇最優(yōu)預(yù)處理和建模方法。結(jié)果表明,經(jīng)MSC 預(yù)處理的PCR 模型預(yù)測(cè)性能最佳,校正集與預(yù)測(cè)集相關(guān)系數(shù)分別為0.948 8,0.9362;RMSEC 和 RMSEP分別為 0.004 8,0.006 5,能夠應(yīng)用于大米水分含量的檢測(cè)中。
在前人研究的基礎(chǔ)上,選擇了不同地區(qū)的大米樣品,擴(kuò)大了模型應(yīng)用范圍,實(shí)現(xiàn)了基于近紅外光譜技術(shù)對(duì)不同產(chǎn)地的大米水分含量的快速無損檢測(cè),提高預(yù)測(cè)模型的穩(wěn)定性和抗干擾能力,為各地區(qū)大米水分的無損檢測(cè)提供了參考。