王欣卉,宋雪健
(黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,黑龍江大慶 163319)
近年來,發(fā)展最快的綠色分析技術(shù)之一近紅外光譜技術(shù)(Near Infrared Reflectance Spectroscopy,NIRS) 以其快速、便捷、無破壞性等優(yōu)點(diǎn)在諸多行業(yè)中被廣泛使用[1-2]。在近紅外光譜區(qū)內(nèi)(780~2 526 nm) 隱藏著豐富的主體化學(xué)鍵的光學(xué)信息和含氫基團(tuán),如O-H、C-H、P-H 和N-H 等,由于物質(zhì)分子中原子團(tuán)的能級(jí)躍遷,引發(fā)近紅外光以非諧振性振動(dòng)而產(chǎn)生的倍頻和合頻光譜吸收區(qū)域,進(jìn)而得到不同的近紅外光譜數(shù)據(jù)[3-4]。近紅外光譜圖像會(huì)隨著物質(zhì)中分子間、分子內(nèi)構(gòu)造與成分含量的變化而改變,這樣使每種物質(zhì)具有穩(wěn)定、獨(dú)特的光譜特點(diǎn)。但是,其光譜會(huì)出現(xiàn)譜帶疊覆等因素的干擾,穩(wěn)定性、精度、靈敏度會(huì)大幅下降,因此通過與化學(xué)計(jì)量學(xué)、數(shù)學(xué)進(jìn)行結(jié)合,對(duì)原始光譜進(jìn)行處理可以改善這一問題。
化學(xué)計(jì)量學(xué)包括線性回歸方法(主成分回歸法、偏最小二乘法、多元線性回歸法) 和非線性回歸方法(ANN)[5],其中偏最小二乘法應(yīng)用較為廣泛。Das Bappa 等人[6]研究發(fā)現(xiàn)在多元模型中,偏最小二乘回歸法對(duì)水稻作物葉片含水量的預(yù)測(cè)效果最好(訓(xùn)練和驗(yàn)證的RPD 分別為6.33 和4.06)。路輝等人[7]利用近紅外光譜技術(shù)對(duì)有粳米、糯米和秈米的90 個(gè)大米品種的營(yíng)養(yǎng)成分進(jìn)行檢測(cè),研究表明大米直鏈淀粉、蛋白質(zhì)、脂肪、水分含量的近紅外光譜檢測(cè)模型檢測(cè)精度較高。王朝輝等人[8]利用近紅外光譜技術(shù)結(jié)合偏最小二乘法對(duì)來自松原的368 個(gè)大米樣品進(jìn)行品種鑒別研究,結(jié)果表明5 個(gè)大米品種的正確識(shí)別率為100%。
采用近紅外光譜技術(shù)結(jié)合偏最小二乘法對(duì)不同年份的大米進(jìn)行檢測(cè)鑒別,旨在為了快速高效地鑒別出不同年份的大米。
試驗(yàn)于2019 年、2018 年、2017 年在水稻成熟后,在黑龍江省方正縣采用5 點(diǎn)隨機(jī)取樣法進(jìn)行采樣,其中各年份的樣品均為50 份,總計(jì)150 份。
FC2K 型礱谷機(jī),日本大竹制作所產(chǎn)品;VP-32型實(shí)驗(yàn)?zāi)朊讬C(jī),日本山本公司產(chǎn)品;FW100 型高速萬能粉碎機(jī),天津泰斯特儀器有限公司產(chǎn)品;TENSORⅡ型傅里葉變換近紅外光譜儀,德國(guó)布魯克(北京) 科技有限公司產(chǎn)品。
1.3.1 大米樣品的前處理
為控制變量,將采集的稻谷進(jìn)行統(tǒng)一的加工處理,經(jīng)過晾曬、脫離、礱谷、碾米及粉碎,過100 目篩,備用。
1.3.2 樣品的分類
分別隨機(jī)將3 類樣品的2/3 作為建模集合,1/3作為驗(yàn)證集合。
樣品分類見表1。
表1 樣品分類/個(gè)
1.3.3 大米原始光譜的采集
在環(huán)境溫度為25±1 ℃,相對(duì)濕度為20%~30%的條件下,取100 g 大米于樣杯中,置于近紅外光譜儀進(jìn)行光譜采集,掃描64 次,取平均值,分辨率8 cm-1,波數(shù)范圍為12 000~4 000 cm-1。
1.3.4 檢測(cè)模型的建立與驗(yàn)證
(1) 定量分析模型的建立。將2019 年的樣品賦值為1,2018 年的樣品賦值為0,2017 年的樣品賦值為-1,對(duì)原始光譜的預(yù)處理方式有矢量歸一化、減去一條直線、多元散射矯正、一階導(dǎo)數(shù)+ 平滑(5,9,13,17,21,25,下同)、一階導(dǎo)數(shù)+ 矢量歸一化+ 平滑、一階導(dǎo)數(shù)+ 減去一條直線+ 平滑、一階導(dǎo)數(shù)+多元散射矯正+平滑、消除常數(shù)偏移量、最小-最大歸一化、內(nèi)部標(biāo)準(zhǔn),化學(xué)計(jì)量學(xué)的方法為偏最小二乘法,其中根據(jù)均方根標(biāo)準(zhǔn)誤差(Root Mean Square Error of Cross Validation,RMSECV) 越小建模效果越好,定向系數(shù)R2越大越好。
式中:Ai——大米樣品比例的實(shí)際值;
Bi——近紅外光譜法的預(yù)測(cè)值;
n——校正集樣品數(shù)。
(2) 模型的驗(yàn)證。利用OPUS 7.5 軟件的定量分析模塊進(jìn)行測(cè)定。
大米樣品的原始光譜圖見圖1。
圖1 大米樣品的原始光譜圖
由圖1 可知,波數(shù)在8 696~8 000 cm-1范圍內(nèi)的8 333 cm-1吸收峰是-CH 鍵二級(jí)倍頻引起的。由-NH2的不對(duì)稱振動(dòng)所引起的7 000~6 500 cm-1處的吸收峰。在5 500~5 000 cm-1范圍內(nèi)的5 166 cm-1處吸收峰主要是糖類及蛋白等大分子中-NH 鍵、-CH鍵、-OH 鍵及C=O 鍵的合頻吸收區(qū)間[9-10]。
在采集原始大米樣品光譜圖時(shí),會(huì)受到高頻率的噪聲、基線漂移、散射及樣品分布不均勻的因素影響,導(dǎo)致檢測(cè)精度下降,因此需要對(duì)原始光譜進(jìn)行預(yù)處理。為了使全波長(zhǎng)(1 2000~4 000 cm-1) 范圍內(nèi)采集的信息較為全面地利用,試驗(yàn)采用在全波長(zhǎng)范圍內(nèi)建模。
不同預(yù)處理方式對(duì)定量分析模型的影響見表2。
由表2 可知,在全波長(zhǎng)范圍內(nèi)采用一階導(dǎo)數(shù)+5點(diǎn)平滑的預(yù)處理方式結(jié)合偏最小二乘法建立的定量分析模型效果較好,其RMSECV 為0.087,R2為98.85,維數(shù)為7。
表2 不同預(yù)處理方式對(duì)定量分析模型的影響
大米的預(yù)測(cè)值與真實(shí)值相關(guān)圖見圖2,定量分析模型的RMSECV 與維數(shù)相關(guān)圖見圖3。
圖2 大米的預(yù)測(cè)值與真實(shí)值相關(guān)圖
圖3 定量分析模型的RMSECV 與維數(shù)相關(guān)圖
以大米樣品的預(yù)測(cè)值在1±0.5 的區(qū)間內(nèi)為2019年的大米,以此類推。由表3 可知,定量分析模型對(duì)2019 年和2018 年的大米樣品進(jìn)行驗(yàn)證的正確率高達(dá)100%,對(duì)2017 年大米樣品的正確鑒別率為94.1%。
驗(yàn)證結(jié)果見表3。
表3 驗(yàn)證結(jié)果
采用近紅外光譜技術(shù)對(duì)2019—2017 年的150 份大米進(jìn)行鑒別研究。結(jié)果表明,在全波長(zhǎng)范圍內(nèi)采用偏最小二乘法結(jié)合一階導(dǎo)數(shù)+5 點(diǎn)平滑的預(yù)處理方式建立的模型效果較高,對(duì)2019 年和2018 年大米樣品的正確鑒別率高達(dá)100%,對(duì)2017 年大米樣品的正確鑒別率為94.1%。因此,采用近紅外光譜技術(shù)可以實(shí)現(xiàn)對(duì)大米新陳度的快速檢測(cè)研究。