劉秀英, 李亞娟, 胡佳鳳, 劉晨洲, 吳姍薇
(1.河南科技大學(xué)農(nóng)學(xué)院, 河南 洛陽(yáng) 471023; 2.洛陽(yáng)市微生物與綠色發(fā)展重點(diǎn)實(shí)驗(yàn)室, 河南 洛陽(yáng) 471023; 3.洛陽(yáng)市植物營(yíng)養(yǎng)與環(huán)境生態(tài)重點(diǎn)實(shí)驗(yàn)室, 河南 洛陽(yáng) 471023)
油用牡丹種子的出油率較高,且牡丹籽油富含人體需要的氨基酸、維生素、不飽和脂肪酸(含量高達(dá)92%以上)等多種成分,其中“植物腦黃金”α-亞麻酸占42%左右[1-2],所以油用牡丹成為了一種新興的高端木本油料作物,對(duì)促進(jìn)我國(guó)糧油生產(chǎn)、保障國(guó)家糧油安全具有重要意義。油用牡丹種子的水分含量是衡量種子品質(zhì)的重要指標(biāo)之一,也是影響牡丹籽油品質(zhì)的重要指標(biāo),因而在銷售、儲(chǔ)存及加工過程中快速、準(zhǔn)確測(cè)量油用牡丹種子水分含量非常重要。而傳統(tǒng)測(cè)定種子水分含量的方法主要是室內(nèi)烘干稱重法,該方法雖然測(cè)定結(jié)果準(zhǔn)確,但相對(duì)比較繁瑣,測(cè)定時(shí)間較長(zhǎng)。其他的直接或間接水分含量測(cè)定方法也較多,但都存在某些方面的缺點(diǎn),具有不同的適用范圍[3-4]。研究表明,油脂類種子含有不飽和脂肪酸,在研磨、剪切、加熱過程中容易氧化,因而較多方法和儀器并不適合進(jìn)行油脂類種子水分含量測(cè)定。
近紅外光譜分析技術(shù)(Near infrared reflectance spectroscopy,NIRS)是20世紀(jì)80年代發(fā)展起來的一項(xiàng)物理檢測(cè)技術(shù),它能夠利用有機(jī)化學(xué)物質(zhì)中的化學(xué)健在近紅外光譜區(qū)的光學(xué)吸收特性,快速估測(cè)樣品中一種或幾種化學(xué)成分的含量。與傳統(tǒng)分析方法相比,該技術(shù)具有檢測(cè)速度快、非破壞性、低成本、操作簡(jiǎn)單、無損樣品等特點(diǎn),尤其適用于農(nóng)產(chǎn)品品質(zhì)分析和食品品質(zhì)檢測(cè)領(lǐng)域[5]。已有研究表明,近紅外光譜技術(shù)能成功地進(jìn)行農(nóng)作物及食品的蛋白質(zhì)含量[6-9]、纖維素含量[10-11]、蔗糖含量[12]、直鏈淀粉含量[13-14]、油含量[15-18]等成分的確定。該技術(shù)也非常適合測(cè)量水分含量,因?yàn)樵诮t外光譜區(qū),水的—OH基團(tuán)泛音和組合帶非常明顯[5]。近年來,已有一些國(guó)內(nèi)外學(xué)者開展了近紅外光譜技術(shù)估算種子水分含量的潛力研究。楊傳得等[19]應(yīng)用近紅外光譜技術(shù)結(jié)合偏最小二乘方法建立了鮮食大花生種子含水量的預(yù)測(cè)模型,結(jié)果表明,含水量模型具有較好的預(yù)測(cè)準(zhǔn)確性。劉潔等[20]利用近紅外光譜技術(shù)對(duì)完整帶殼板栗果和去殼板栗仁進(jìn)行含水率的無損檢測(cè),并比較了不同預(yù)處理方法對(duì)預(yù)測(cè)結(jié)果的影響。Mutlu等[21]利用近紅外光譜結(jié)合人工神經(jīng)網(wǎng)絡(luò)對(duì)小麥粉末的多個(gè)品質(zhì)參數(shù)進(jìn)行預(yù)測(cè),其中水分預(yù)測(cè)的決定相關(guān)系數(shù)(R2)為0.92。王雪等[22]結(jié)合近紅外光譜技術(shù)與偏最小二乘回歸,建立了灌漿期玉米籽粒水分小樣本定量分析模型(Bootstrap-SPXY-PLS),結(jié)果表明模型有穩(wěn)定的預(yù)測(cè)能力。Sundaram等[5]開展了近紅外光譜技術(shù)確定不同地區(qū)的帶皮花生水分含量的研究,結(jié)果表明,建立的近紅外光譜模型能夠成功地進(jìn)行花生水分含量的預(yù)測(cè)。朱潔等[23]利用高光譜成像技術(shù)結(jié)合偏最小二乘回歸進(jìn)行了單粒小麥籽水分含量的預(yù)測(cè),并獲得整盤單粒小麥籽的水分分布圖。但是,Moghaddam等[24]采用400~1 100 nm波段范圍經(jīng)過不同預(yù)處理的吸收光譜,結(jié)合偏最小二乘回歸方法建立烘烤的開心果果仁水分含量及紋理特征的預(yù)測(cè)研究表明,水分含量的預(yù)測(cè)效果并不太好。以上研究表明,近紅外光譜技術(shù)定量估測(cè)種子水分含量時(shí),估測(cè)精度受種子樣本量的大小、水分含量的多少、形狀、尺寸或堅(jiān)硬外殼等影響較大,還與構(gòu)建模型的方法密不可分,因而對(duì)于不同品種種子水分含量的近紅外光譜快速估測(cè)值得進(jìn)一步研究。據(jù)所查資料可知,至今很少見到近紅外光譜法估測(cè)油用牡丹種子水分含量的相關(guān)報(bào)道。
本研究擬用不同時(shí)間、不同產(chǎn)地、不同品種的油用牡丹種子為研究對(duì)象,采用近紅外光譜技術(shù)進(jìn)行油用牡丹種子水分含量無損檢測(cè)方法的研究,并比較不同光譜預(yù)處理方法對(duì)油用牡丹種子水分含量估算精度的影響,從而提高油用牡丹種子水分反演精度,為促進(jìn)我國(guó)牡丹產(chǎn)業(yè)發(fā)展及糧油生產(chǎn)、保障國(guó)家糧油安全提供理論依據(jù)和技術(shù)支持。
為了使樣本具有代表性,本研究收集了2016年及2017年不同產(chǎn)地的鳳丹和紫斑兩個(gè)油用牡丹品種的156份種子,產(chǎn)地包括:安徽安慶、毫州、銅陵;河南洛陽(yáng);山東曹縣、吏口、平陰;四川德陽(yáng)、眉山、資陽(yáng)。油用牡丹種子進(jìn)行自然風(fēng)干,然后通過調(diào)節(jié)烘干的時(shí)間,形成不同的水分梯度,樣本含水量范圍為0.22%~5.77%,含水量相對(duì)較低。
樣本光譜采用美國(guó)Spectra Vista公司于2013年推出的高性能地物光譜儀(SVC HR-1024 i便攜式光譜儀)測(cè)定,該儀器光譜范圍350~2 500 nm,其中350~1 000 nm 光譜分辨率小于等于3.5 nm,1 000~1 850 nm光譜分辨率小于等于9.5 nm,1 850~2 500 nm光譜分辨率小于等于9.5 nm。光譜數(shù)據(jù)處理及多變量分析主要采用光譜儀自帶軟件(SVC HR-1024 i)及Unscramble軟件,作圖采用Origin Pro 9.1軟件。
含水量測(cè)定 種子含水量測(cè)定采用常壓烘箱干燥法,依照GB/T 5009.3-2003標(biāo)準(zhǔn)進(jìn)行。
光譜數(shù)據(jù)采集。開機(jī)預(yù)熱儀器30 min,將油用牡丹種子樣本依次放置在光譜儀樣品盤中,從4個(gè)方向?qū)悠愤M(jìn)行掃描,每個(gè)方向掃描3次,每個(gè)樣品總共掃描12次,去掉異常線后取平均值作為該樣品的光譜值。
首先利用SVC HR-1024 i軟件進(jìn)行光譜數(shù)據(jù)的合并(SIG File Merge)及重采樣(Resample Spectral Data),將近紅外波段(900~2 500 nm)重采樣至10 nm。然后在Unscrambler 9.7(CAMO ASA,Trondheim, Norway)軟件分別采用標(biāo)準(zhǔn)化處理(Normalize,Nor)、乘積分散校正法(Multiplicative Scatter Correction,MSC)、標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換法(Standard Normal Variate,SNV)進(jìn)行處理,然后結(jié)合一階導(dǎo)數(shù)(First Derivative,FD)對(duì)吸收光譜(Absorption spectra,AS)及預(yù)處理光譜數(shù)據(jù)進(jìn)行進(jìn)一步處理。最后根據(jù)估算模型的校正及驗(yàn)證效果確定最佳數(shù)據(jù)預(yù)處理方法及最佳估算模型。
圖1為油用牡丹種子的近紅外光譜吸收光譜圖。分析圖1可知,油用牡丹種子的近紅外光譜圖中出現(xiàn)很強(qiáng)烈的吸收,形成多個(gè)明顯的吸收峰,主要是由于種子樣品中含有C—H、O—H、N—H等含氫基團(tuán)。圖1(a)為部分隨機(jī)選擇的油用牡丹種子的近紅外吸收光譜圖,從圖中可知,樣品的近紅外吸收光譜具有相似的變化趨勢(shì),在1 200、1 450、1 940 nm附近有強(qiáng)烈吸收峰,且不同的樣品吸收峰強(qiáng)度及位置存在差異,根據(jù)前人研究可知,1 450 nm和1 940 nm附近的吸收峰是水分的強(qiáng)吸收引起的。圖1(b)為不同含水量油用牡丹種子的近紅外吸收光譜圖,從圖中可見不同含水量樣品的近紅外吸收光譜的吸收峰存在差異,隨含水量增加吸收峰有增大的趨勢(shì),并且吸收峰有朝長(zhǎng)波方向偏移的趨勢(shì),其原因主要是由于樣品間含水量不同,造成吸收強(qiáng)度存在差異,從而說明油用牡丹種子近紅外吸收光譜可以作為定量分析樣品水分含量的依據(jù)。
首先通過視覺判斷,剔除4組光譜或水分含量異常的樣本值。然后通過主成分分析檢測(cè)異常值或離群值。第一、第二兩個(gè)主成分的得分圖提供了顯示數(shù)據(jù)之間關(guān)系的二維圖,數(shù)據(jù)點(diǎn)位于95%置信橢圓(Hoteling T 2)之外的被考慮作為強(qiáng)的離群值,從而考慮從數(shù)據(jù)矩陣中剔除。對(duì)樣本光譜進(jìn)行主成分分析后得到第一、第二主成分得分圖,從中可以看出18、85、86、43號(hào)樣本處于95%置信橢圓之外,因而被剔除,最終余下148組樣本被用于校正模型建立和驗(yàn)證。根據(jù)水分含量進(jìn)行排序,間隔取1/3作為驗(yàn)證集,樣本數(shù)為49組;2/3作為校正集,樣本數(shù)為99組。校正集的水分含量范圍為0.22%~4.89%,驗(yàn)證集的水分含量范圍為0.42%~4.75%。
2.3.1水分含量PLSR估算模型的建立
注:a為部分樣品近紅外吸收光譜圖;b為不同含水量樣品近紅外吸收光譜圖。
表1 不同光譜預(yù)處理方法獲得的油用牡丹種子水分含量PLSR模型參數(shù)
2.3.2水分含量PLSR估算模型的驗(yàn)證
表2 PLSR模型的檢驗(yàn)結(jié)果
已有研究表明,參考值和預(yù)測(cè)值之間的擬合線斜率越接近于1,截距越接近于0,預(yù)測(cè)效果就越好[27-28]。圖2展示了參考值和近紅外水分預(yù)測(cè)值之間的關(guān)系。從圖2可知,所有模型的預(yù)測(cè)值與參考值之間的相關(guān)性都比較好,相關(guān)系數(shù)R2均大于0.94,說明所有模型的預(yù)測(cè)效果都比較好。進(jìn)一步比較各參數(shù)可知,由標(biāo)準(zhǔn)化吸收光譜建立的PLSR模型預(yù)測(cè)的水分含量與參考值之間的擬合線斜率為0.964, 與理想值1最接近,截距為0.138,與理想值0最接近,而且R2最大,為0.97,說明由標(biāo)準(zhǔn)化(NOR)吸收光譜建立的PLSR模型是最佳的估算模型,預(yù)測(cè)效果最好。
通過分析油用牡丹種子的近紅外吸收光譜可知,所有樣品的近紅外吸收光譜形狀相似,并且具有相同的變化趨勢(shì),隨著種子水分含量增加,種子的近紅外吸收光譜值整體增大;種子水分含量的特征吸收波段位于1 450 nm和1 940 nm附近,并且隨水分含量增加特征波段位置具有朝長(zhǎng)波方向偏移的趨勢(shì),這與前人研究結(jié)論一致[10,24]。水分特征波段位置的確定可以為水分速測(cè)儀的波段選擇提供依據(jù)。
本研究采用近紅外吸收光譜及經(jīng)預(yù)處理的吸收光譜,結(jié)合PLSR方法建立了油用牡丹種子近紅外光譜水分含量估算模型,模型的預(yù)測(cè)R2大于等于0.94,RPD值大于3.96,結(jié)果表明PLSR方法建立的估算模型效果均較好,預(yù)測(cè)精度較高,而且比較穩(wěn)定,因此均可用于油用牡丹種子水分含量精確估算。其它研究者采用近紅外光譜結(jié)合PLSR方法建立花生、板栗水分含量估算模型時(shí),同樣預(yù)測(cè)精度較高[19-20],說明近紅外光譜結(jié)合PLSR方法是建立種子水分含量估算模型的較好方法。但是,Moghaddam等[24]采用波段范圍400~1 100 nm的吸收光譜建立烘烤的開心果果仁水分含量校正模型時(shí),其預(yù)測(cè)效果并不太好。其原因可能有兩個(gè):一是烘烤的開心果果仁的含水量較低,僅0.5%~2.26%,二是在400~1 100 nm范圍內(nèi)僅960 nm附近為水分的弱吸收峰,而水分強(qiáng)吸收波段主要位于1400、1 900、2 100 nm附近。
建模前對(duì)吸收光譜進(jìn)行了不同的預(yù)處理,從建立的校正模型及模型驗(yàn)證的參數(shù)來看,標(biāo)準(zhǔn)化處理(NOR)光譜的建立校正模型預(yù)測(cè)結(jié)果最優(yōu)。而其他學(xué)者對(duì)不同品種種子樣本的預(yù)處理光譜建模時(shí),最佳預(yù)處理方法并不完全相同[5,19,24]。分析原因可能是不同品種種子樣本由于其顆粒大小、表面形態(tài)和內(nèi)部結(jié)構(gòu)不同,從而對(duì)采集的光譜會(huì)產(chǎn)生不同的影響,因此針對(duì)不同品種種子樣本的光譜需要采取不同的預(yù)處理方法才能提高估算模型的精度。另外,對(duì)不同預(yù)處理方法處理的光譜進(jìn)一步進(jìn)行一階導(dǎo)數(shù)處理,并沒有明顯改善模型的預(yù)測(cè)精度。Sundaram等[5]在應(yīng)用近紅外光譜確定帶皮花生水分含量時(shí),一階導(dǎo)數(shù)處理改善了Virginia花生的預(yù)測(cè)精度;而對(duì)Valencia花生的預(yù)測(cè)精度沒有提高。究其原因可能是樣本光譜的形狀依賴于光的散射,這種散射受樣本顆粒大小及樣本表面的反射特性影響,因此對(duì)于不同種子樣本其光譜反射特性不同,或者經(jīng)其它預(yù)處理后有的樣本光譜可能不存在基線漂移或者基線漂移很小,所以一階導(dǎo)數(shù)處理的效果并不明顯。本研究表明不同預(yù)處理光譜建立的水分估算模型中以標(biāo)準(zhǔn)化處理(NOR)的光譜建立的模型精度最高,說明該模型是進(jìn)行油用牡丹種子水分含量估算的最佳模型,能滿足精度要求較高時(shí)油用牡丹種子水分含量的質(zhì)量控制與評(píng)價(jià),而標(biāo)準(zhǔn)化處理是油用牡丹種子樣本光譜的最佳預(yù)處理方法。本研究所采用的油用牡丹種子樣本水分含量范圍為0.22%~5.77%,范圍相對(duì)較窄,水分含量較低,因此下一步需要在擴(kuò)大樣本的水分含量范圍的基礎(chǔ)上進(jìn)行進(jìn)一步的研究,以便擴(kuò)大模型的適用范圍。
圖2 近紅外預(yù)測(cè)值與參考值的比較