陳明明,邱彥超,宋妍,楊斯琪,左鋒,2,錢(qián)麗麗,2,3
(1.黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,大慶 163319;2.國(guó)家雜糧工程技術(shù)研究中心;3.黑龍江省農(nóng)產(chǎn)品加工與質(zhì)量安全重點(diǎn)實(shí)驗(yàn)室)
隨著科技發(fā)展的突飛猛進(jìn),農(nóng)產(chǎn)品溯源技術(shù)也得到了不斷的發(fā)展與完善,逐步形成了技術(shù)體系。多種多樣的農(nóng)產(chǎn)品產(chǎn)地溯源技術(shù)為我國(guó)的食品安全及農(nóng)產(chǎn)品溯源做出了重要貢獻(xiàn)[1]。目前,礦物元素指紋分析技術(shù)[2-3]、電子鼻指紋圖譜技術(shù)[4-5]、電子舌指紋圖譜技術(shù)[6]、DNA 指紋圖譜技術(shù)[7-8]等被廣泛應(yīng)用于產(chǎn)地真實(shí)性溯源的研究中,并取得了一定的進(jìn)展,但是這些方法存在檢測(cè)過(guò)程繁瑣、設(shè)備昂貴、周期長(zhǎng)等缺點(diǎn),無(wú)法實(shí)現(xiàn)農(nóng)產(chǎn)品產(chǎn)地的快速鑒別。近紅外光譜技術(shù)是一種有效的產(chǎn)地溯源技術(shù)。近紅外光譜檢測(cè)樣品時(shí),具有無(wú)損[6]、快速、高效和成本較低,不破壞樣品等優(yōu)點(diǎn),其原理是利用近紅外光譜區(qū)有機(jī)分子中含氫基團(tuán)(O—H、N—H、C—H)振動(dòng)的合頻和各級(jí)倍頻的吸收區(qū)相一致,通過(guò)掃描樣品的近紅外光譜可得到樣品中有機(jī)分子含氫基團(tuán)的特征信息[9],不同地域農(nóng)產(chǎn)品所表征的特征信息不同,已有研究報(bào)道近紅外光譜技術(shù)對(duì)羊肉[10]、雞肉[11]、牛肉[12]等肉類(lèi)及小麥[13]、茶葉[14-15]、草莓[16]、玉米[17]、枸杞[18]等農(nóng)產(chǎn)品的產(chǎn)地溯源初步研究可行。
近紅外光譜技術(shù)雖具有以上各種優(yōu)點(diǎn),但其原始光譜常常包含很多無(wú)用的信息,例如高頻隨機(jī)噪聲、基線漂移等,嚴(yán)重影響光譜數(shù)據(jù)分析,導(dǎo)致建立的分析模型穩(wěn)定性較差,很難進(jìn)行再次優(yōu)化[19]。因此,在對(duì)原始光譜數(shù)據(jù)分析之前,需要對(duì)原始光譜進(jìn)行預(yù)處理。余梅等[20]通過(guò)對(duì)不同產(chǎn)地陳皮進(jìn)行5 種近紅外光譜(MSC、SNV、一階導(dǎo)數(shù)、第二階導(dǎo)數(shù)、連續(xù)小波變換)預(yù)處理,實(shí)現(xiàn)了對(duì)不同產(chǎn)地陳皮的無(wú)損檢測(cè)。李尚科等[21]通過(guò)5 種不同光譜預(yù)處理方法(MSC、SNV、一階求導(dǎo)數(shù)、二階求導(dǎo)數(shù)與連續(xù)小波變換光譜)對(duì)3 類(lèi)132 個(gè)豆?jié){粉實(shí)現(xiàn)了鑒別。以上研究結(jié)果表明,光譜預(yù)處理在近紅外光譜分析中發(fā)揮著重要作用。
除不同光譜預(yù)處理方法影響判別準(zhǔn)確率外,選擇合適化學(xué)計(jì)量學(xué)方法也可以提高判別準(zhǔn)確率。夏珍珍等[22]通過(guò)對(duì)不同產(chǎn)地香菇的近紅外原始光譜預(yù)處理,結(jié)合偏最小二乘判別分析法對(duì)吉林省、湖北省、福建省的識(shí)別正確率分別為96.7%、95.6%和100%。陳璐等[23]基于近紅外光譜技術(shù)對(duì)501 份不同產(chǎn)地的金銀花進(jìn)行了產(chǎn)地判別,采用二階導(dǎo)數(shù)和SNV 預(yù)處理,建立偏最小二乘判別(PLS-DA)模型,模型的判別率達(dá)到100%。以上研究表明,不同預(yù)處理近紅外光譜結(jié)合化學(xué)計(jì)量學(xué)方法可以用于農(nóng)產(chǎn)品溯源,是農(nóng)產(chǎn)品產(chǎn)地溯源的有效方法。
因此,為建立綠豆近紅外指紋圖譜,結(jié)合化學(xué)計(jì)量學(xué)進(jìn)行分析與評(píng)價(jià),實(shí)現(xiàn)對(duì)不同產(chǎn)地綠豆的快速鑒別。研究以黑龍江省杜爾伯特蒙古族自治縣、吉林省白城市、黑龍江省泰來(lái)縣、山東省泗水縣4 個(gè)地區(qū)的地理標(biāo)志綠豆為研究對(duì)象,對(duì)不同產(chǎn)地綠豆近紅外光譜進(jìn)行主成分分析,分別采用一階導(dǎo)數(shù)+9 點(diǎn)平滑、二階導(dǎo)數(shù)+9 點(diǎn)平滑、標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射矯正(MSC)、矢量歸一化+MSC 5 種光譜預(yù)處理方法,建立偏最小二乘判別模型(PLS-DA),分析不同預(yù)處理方法對(duì)模型穩(wěn)定性的影響。由此得出,近紅外光譜技術(shù)可以用于綠豆產(chǎn)地判別,也為準(zhǔn)確可靠地判別地理標(biāo)志綠豆提供技術(shù)理論依據(jù)。
TENSOR 傅立葉近紅外光譜儀,SMART-N 超純水機(jī),CT193CyclotecTM 旋風(fēng)粉碎磨,DGG-9023A 電熱恒溫鼓風(fēng)干燥箱,TB-4002 電子天平,NEO-6M-0-001 GPS。
1.2.1 樣品采集
地理標(biāo)志綠豆樣品分別采自黑龍江省杜爾伯特蒙古族自治縣(杜爾伯特)、吉林省白城市(白城)、黑龍江省泰來(lái)縣(泰來(lái))、山東省泗水縣(泗水)共120個(gè)樣品,依據(jù)代表性采樣原則,樣品種植面積大小進(jìn)行采樣點(diǎn)設(shè)置,每個(gè)采樣地塊在對(duì)角線進(jìn)行5 個(gè)點(diǎn)重復(fù),采樣地點(diǎn)按照東、西、南、北、中5 個(gè)區(qū)域設(shè)計(jì),對(duì)樣品進(jìn)行隨機(jī)性采集,在每個(gè)設(shè)置的采樣點(diǎn)按照不同的方向和位置采集1~3 kg 豆莢,并記錄采樣地點(diǎn)、品種、經(jīng)度、緯度、土質(zhì)等信息。所用樣本具體信息見(jiàn)表1。
表1 樣品信息表Table 1 Sample information
1.2.2 樣品預(yù)處理方法
將采集回來(lái)的綠豆莢按照地區(qū)編號(hào),在無(wú)揚(yáng)塵、整潔、透光的晾曬場(chǎng)地進(jìn)行晾曬,按照編號(hào)同一地區(qū)同批次人工破碎豆莢,去除殼皮、灰塵小石粒等雜質(zhì),得到完整的綠豆籽粒。用超純水對(duì)前處理后的綠豆籽粒進(jìn)行流動(dòng)水清洗,38 ℃烘干至水分含量在14%以下,再進(jìn)行旋風(fēng)磨粉碎處理,過(guò)60 目尼龍篩,得到綠豆粉樣本,放入密封袋4 ℃保存,所有樣本采用統(tǒng)一處理方式。
1.2.3 近紅外光譜采集方法
將TENSOR 傅立葉近紅外光譜儀預(yù)熱30 min,利用OPUS 7.5 軟件對(duì)綠豆樣品進(jìn)行掃描,通過(guò)檢查信號(hào)、保存峰位,掃描背景單通道光譜(每間隔1 h 掃描一次),測(cè)量樣品單通道光譜等操作,來(lái)消除外界信息的干擾,提高采集數(shù)據(jù)的精度。根據(jù)文獻(xiàn)[24-26],將50~100 g 的綠豆樣品粉末置于旋轉(zhuǎn)樣品杯中進(jìn)行近紅外光譜掃描,儀器掃描范圍12 000~4 000 cm-1,儀器頻率64 次,分辨率8 cm-1,所在室溫25 ℃,空氣濕度45%,掃描過(guò)程中為避免兩個(gè)樣品間的交叉污染,每次掃描后擦凈樣品杯。每個(gè)樣品掃描前均掃描背景,以消除其他外界環(huán)境干擾。每個(gè)樣品掃描3次,取平均光譜為最終光譜。
采用Unscramb10.4 對(duì)近紅外光譜數(shù)據(jù)進(jìn)行光譜預(yù)處理、主成分分析、偏最小二乘判別分析。在光譜數(shù)據(jù)處理時(shí)常用的預(yù)處理方法很多,常用的預(yù)處理方法有標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、矢量歸一化,導(dǎo)數(shù)處理等,對(duì)原始光譜進(jìn)行矢量歸一化的目的是為了減弱消除測(cè)量過(guò)程中光程變化對(duì)原始光譜產(chǎn)生的一些影響[27]。多元散射校正(MSC)是光譜數(shù)據(jù)預(yù)處理常用算法之一,多元散射校正可用來(lái)消除樣本間的基線平移和漂移現(xiàn)象,增強(qiáng)光譜的特異性[28]。試驗(yàn)結(jié)合樣品結(jié)構(gòu)體系和參考文獻(xiàn)[21],以一階導(dǎo)數(shù)+9 點(diǎn)平滑、二階導(dǎo)數(shù)+9 點(diǎn)平滑、SNV、MSC、矢量歸一化+MSC 5 種預(yù)處理后的建模集光譜和未經(jīng)處理的光譜建立預(yù)測(cè)模型,分析5 種預(yù)處理方法及未預(yù)處理光譜所建立模型的穩(wěn)定性。
模型預(yù)測(cè)正確率計(jì)算公式如下:
2.1.1 近紅外光譜預(yù)處理
由于不同產(chǎn)地來(lái)源綠豆樣品原始圖譜混雜在一起,用肉眼難以分辨。原始光譜圖中不僅含有不同產(chǎn)地特征結(jié)構(gòu)信息,還包含著一些無(wú)關(guān)信息和噪聲。這些無(wú)用的信息和噪聲可能是由于在操作過(guò)程中會(huì)存在很多行為,如人為操作不當(dāng),儀器誤差等都會(huì)對(duì)光譜產(chǎn)生影響,樣品的近紅外光譜信號(hào)也會(huì)受到雜散光、噪聲、基線漂移等因素影響,以致最后分析結(jié)果不理想[29],因此在運(yùn)用近紅外光譜判別模型進(jìn)行分析之前,需要對(duì)原始近紅外光譜圖進(jìn)行預(yù)處理,以提高模型準(zhǔn)確性和可靠性。常用的預(yù)處理方法有標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、矢量歸一化、導(dǎo)數(shù)處理等。
以5 種預(yù)處理后的建模集光譜數(shù)據(jù)和未經(jīng)處理的原始光譜數(shù)據(jù)建立偏最小二乘判別模型,以模型的R2值和RMSEC 值來(lái)確定所建立模型的穩(wěn)定性和可用性。一個(gè)模型的好壞、可用度、可靠性等是根據(jù)模型的R2(相關(guān)系數(shù))和RMSEC(校正均方根誤差)來(lái)決定[30]。5 種預(yù)處理建立模型的R2和RMSEC 值如表2 所示,對(duì)比不同處理方法建立模型的R2值和RMSEC 值得出,采用矢量歸一化+MSC 近紅外光譜預(yù)處理方法時(shí)R2為0.991,RMSEC 為0.105,建立的模型最穩(wěn)定,因此采用矢量歸一化+MSC 近紅外光譜預(yù)處理建立偏最小二乘判別模型對(duì)不同來(lái)源綠豆進(jìn)行產(chǎn)地溯源分析。矢量歸一化+MSC 預(yù)處理近紅外光譜如圖1 所示。
圖1 矢量歸一化+MSC 預(yù)處理近紅外光譜圖Fig.1 Moderate normalization+MSC pretreatment spectrogram
表2 不同預(yù)處理方法對(duì)模型準(zhǔn)確度的影響Table 2 Influence of different pretreatment methods on model accuracy
2.1.2 主成分分析法提取特征光譜數(shù)據(jù)
近紅外光譜產(chǎn)地溯源模型建立所用到的波長(zhǎng)對(duì)產(chǎn)地判別率有很大的影響,提取具有產(chǎn)地特征性波長(zhǎng)或波段,不僅可以簡(jiǎn)化模型計(jì)算量,還能夠顯著提高模型判別效果。通過(guò)對(duì)4 個(gè)產(chǎn)地共120 個(gè)綠豆樣本掃描,得到原始近紅外光譜圖(圖2),采用Unscrambler10.4 軟件對(duì)不同產(chǎn)地的綠豆樣品近紅外光譜數(shù)據(jù)進(jìn)行可視化轉(zhuǎn)換,通過(guò)主成分分析法對(duì)經(jīng)過(guò)預(yù)處理后的近紅外光譜進(jìn)行特征波長(zhǎng)提取,各主成分解釋方差結(jié)果如圖3 所示,由主成分得分作圖,結(jié)果如圖4 所示。
圖2 不同產(chǎn)地綠豆近紅外原始光譜圖Fig.2 Near-infrared original spectrogram of mung bean from different origins
圖3 不同產(chǎn)地綠豆主成分解釋方差圖Fig.3 Principal component interpretation variance diagram of mung bean from different origins
圖4 不同產(chǎn)地綠豆近紅外主成分得分圖Fig.4 Near-infrared principal component score of mung bean from different origins
主成分分析是一種無(wú)監(jiān)督識(shí)別模式,在分析之前不用對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)。由圖3 可知,前3 個(gè)主成分包含了不同產(chǎn)地綠豆大部分近紅外光譜信息,可以作為提取近紅外光譜產(chǎn)地特征指紋。由圖4 可知,主成分1 貢獻(xiàn)率為52.44%,主成分2 貢獻(xiàn)率為30.16%,主成分3 貢獻(xiàn)率為9.57%,前3 個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到92.17%。同時(shí),可直觀地表達(dá)白城、杜爾伯特、泰來(lái)、泗水產(chǎn)地樣品可在不同的空間分布,說(shuō)明利用提取到的近紅外光譜產(chǎn)地特征指紋對(duì)不同產(chǎn)地綠豆初步進(jìn)行識(shí)別可行。
由4 個(gè)產(chǎn)地綠豆近紅外光譜主成分分析結(jié)果可知,利用近紅外光譜技術(shù)可以對(duì)綠豆不同產(chǎn)地區(qū)分,進(jìn)一步探究近紅外光譜技術(shù)對(duì)不同產(chǎn)地綠豆的溯源效果?;诮t外光譜數(shù)據(jù),采用偏最小二乘法建立判別模型,對(duì)不同產(chǎn)地綠豆進(jìn)行定量產(chǎn)地判別分析。
2.2.1 不同產(chǎn)地樣品的選取與劃分
選取4 個(gè)產(chǎn)地的120 個(gè)樣品參與偏最小二乘判別分析,將120 個(gè)樣品劃分為建模集和驗(yàn)證集,選擇2/3 的樣品作為建模集,建立模型;選擇1/3 的樣品作為驗(yàn)證集,用于檢驗(yàn)建立模型的準(zhǔn)確性和有效性。共得到建模集樣品80 個(gè),驗(yàn)證集樣品40 個(gè)。具體信息如表3 所示。
表3 樣品建模集與驗(yàn)證集劃分表Table 3 Partition table of sample modeling set and verification set
2.2.2 模型的建立與驗(yàn)證
將建模集光譜數(shù)據(jù)經(jīng)矢量歸一化+MSC 預(yù)處理后,導(dǎo)入U(xiǎn)nscrambler 10.4 軟件中,根據(jù)實(shí)際樣本類(lèi)別,對(duì)建模集樣本進(jìn)行產(chǎn)地賦值,即白城樣本賦值為1,杜爾伯特樣本為2,泰來(lái)樣本為3,泗水樣本為4,運(yùn)行軟件建立偏最小二乘判別分析模型,模型建立后,把同樣經(jīng)矢量歸一化+MSC 預(yù)處理后的驗(yàn)證集數(shù)據(jù)導(dǎo)入建立好的模型進(jìn)行驗(yàn)證,在軟件操作過(guò)程中,偏最小二乘判別分析模型的方法閾值設(shè)置為0.5,即真實(shí)值-預(yù)測(cè)值≤0.5 為模型判別正確,反之判錯(cuò),預(yù)測(cè)結(jié)果如表4 所示。
表4 不同產(chǎn)地綠豆近紅外光譜溯源模型預(yù)測(cè)結(jié)果Table 4 Forecast results of spectral models in different producing areas of mung bean
偏最小二乘法判別分析是一種多變量統(tǒng)計(jì)分析方法。通過(guò)預(yù)測(cè)結(jié)果可得出有36 個(gè)樣品被模型正確識(shí)別,4 個(gè)樣品被模型錯(cuò)誤識(shí)別,由此計(jì)算得出模型對(duì)不同產(chǎn)地綠豆的整體預(yù)測(cè)率為90%。對(duì)白城、杜爾伯特、泰來(lái)、泗水的判別率分別為100%、80%、80%和100%,對(duì)4 個(gè)產(chǎn)地的預(yù)測(cè)結(jié)果達(dá)到80%以上。因此,近紅外光譜分析技術(shù)用于不同綠豆產(chǎn)地溯源研究可行。
研究建立了綠豆近紅外指紋圖譜,結(jié)合化學(xué)計(jì)量學(xué)進(jìn)行分析與評(píng)價(jià)。通過(guò)對(duì)不同產(chǎn)地綠豆近紅外光譜進(jìn)行主成分分析,前3 個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到92.17%,說(shuō)明前3 個(gè)主成分包含了不同產(chǎn)地綠豆大部分近紅外光譜信息,篩選到與產(chǎn)地相關(guān)的近紅外光譜溯源指紋,由主成分得分作圖可以得出,4 個(gè)產(chǎn)地綠豆樣品分布在不同的區(qū)域,被明顯區(qū)分。通過(guò)對(duì)比5 種預(yù)處理方法建立偏最小二乘判別模型的R2值和RMSEC 值,得出采用矢量歸一化+MSC 預(yù)處理方法建立的偏最小二乘判別模型最穩(wěn)定,對(duì)綠豆產(chǎn)地判別率為90%。因此,近紅外光譜技術(shù)可以用于綠豆產(chǎn)地判別,基本實(shí)現(xiàn)了4 個(gè)產(chǎn)地樣品區(qū)分,但模型整體判別準(zhǔn)確率尚未達(dá)到95%以上,有待進(jìn)一步提高。今后還應(yīng)探索更多的近紅外光譜預(yù)處理方法對(duì)模型穩(wěn)定性的影響,以提高近紅外光譜技術(shù)在農(nóng)產(chǎn)品產(chǎn)地溯源中判別準(zhǔn)確率。
黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào)2024年1期