呂晨菲,楊靜慧,通信作者,劉艷軍,楊仁杰,張超,吳楠
(1.天津農(nóng)學(xué)院 a.園藝園林學(xué)院,b.工程技術(shù)學(xué)院,天津 300384; 2.天津天獅學(xué)院,天津 301700)
紅提即紅地球葡萄,屬歐亞種,原產(chǎn)美國,因其果粒大、不脫粒、果肉硬脆、品質(zhì)優(yōu)、耐貯運(yùn)、可周年供應(yīng)等優(yōu)點(diǎn),成為鮮食葡萄品種中最珍貴且最具有商業(yè)價值的品種之一,發(fā)展前景廣闊[1]。研究發(fā)現(xiàn),紅提果實(shí)品質(zhì)和風(fēng)味會因產(chǎn)地的生態(tài)環(huán)境不同而呈現(xiàn)顯著差異[2]。而較大的市場價格差異造成了鮮果商品的產(chǎn)地仿冒現(xiàn)象,不利于優(yōu)質(zhì)果品產(chǎn)地的生產(chǎn)發(fā)展。研究建立高效的紅提果實(shí)產(chǎn)地識別技術(shù),對促進(jìn)栽培區(qū)域布局優(yōu)化、優(yōu)質(zhì)生產(chǎn)、名特優(yōu)產(chǎn)地品牌保護(hù)等都具有重要的實(shí)踐意義。
近紅外光譜技術(shù)檢測速度快、無損傷、無污染、操作簡單[3-9],已成為農(nóng)產(chǎn)品品種定性鑒別的一個重要手段,已經(jīng)成功應(yīng)用于蘋果[10]、臍橙[11]、山楂[12]、石榴[13]、沙棘[14]、枸杞[15]等農(nóng)產(chǎn)品的產(chǎn)地識別。但基于NIRS與PLS-DA的紅提產(chǎn)地鑒別研究還未見報道。
試驗(yàn)樣品是從超市購置的美國紅提、秘魯紅提、國產(chǎn)紅提(新疆紅提),所有樣品經(jīng)過篩選,每個品種選留45個,共135個,并對樣品進(jìn)行編號。每個樣品大小均勻,無明顯損傷,清洗干凈并擦干,放置在待測的實(shí)驗(yàn)室環(huán)境中平衡24 h。
試驗(yàn)采用美國PerkinElmer公司的傅里葉變換近紅外光譜儀,漫反射采集附件為積分球。光譜儀開機(jī)預(yù)熱15 min,扣除背景后,在近紅外波段4 000~12 000 cm-1逐個采集樣品光譜(從紅提的赤道部位等距依次采集3次漫反射光譜,取平均值),采集間隔為2 cm-1,掃描次數(shù)為64次,光譜分辨率8 cm-1。共采集135張紅提近紅外原始光譜圖,如圖1所示。
圖1 3種紅提的原始光譜圖
采用 K-S(Kennard-Stone)方法對樣品集進(jìn)行劃分,從美國紅提、秘魯紅提、國產(chǎn)紅提樣品中選擇了具有代表性的90個樣品光譜進(jìn)行建模,其余45個樣品作為驗(yàn)證集,用于分類模型驗(yàn)證。
采用課題組編寫的偏最小二乘算法 Matlab代碼,來建立紅提產(chǎn)地判別模型。PLS-DA模型建立方法:基于PLS回歸方法,利用校正集樣品的自變量矩陣X和分類變量Y建立回歸模型,根據(jù)待分類樣本的 PLS預(yù)測值判斷樣本所屬類別。PLS-DA模型判別過程:(1)建立校正集樣品的分類變量;(2)分類變量與光譜數(shù)據(jù)的PLS分析,建立分類變量與光譜數(shù)據(jù)間的PLS模型;(3)根據(jù)校正集建立的分類變量和光譜特征的 PLS模型,計算驗(yàn)證集的分類變量值(ypretict)。
具體判別標(biāo)準(zhǔn)為:將3種紅提,即美國紅提、秘魯紅提、國產(chǎn)紅提的分類變量分別賦值為1,2,3;①當(dāng) 0.5<ypretict<1.5,判定樣品屬于第一類,美國紅提;②1.5<ypretict<2.5,判定樣品屬于第二類,秘魯紅提;③2.5<ypretict<3.5,判定樣品屬于第三類,國產(chǎn)紅提。
運(yùn)用Matlab和 Unscrambler軟件進(jìn)行數(shù)據(jù)處理。利用Origin進(jìn)行圖像處理。
圖 2是美國紅提、秘魯紅提和國產(chǎn)紅提在4 000~12 000 cm-1近紅外范圍扣除背景后的漫反射光譜圖。由圖2可知,整個光譜范圍內(nèi)3個產(chǎn)地的紅提樣品光譜形狀,譜峰位置幾乎相同,不能直觀的根據(jù)圖譜看出3類樣品的區(qū)別。
圖2 不同產(chǎn)地紅提的近紅外漫反射光譜圖
對上述 3類紅提采用主成分分析(PCA)法進(jìn)行聚類。圖3為原始光譜數(shù)據(jù)進(jìn)行主成分分解,保留前3個主成分的樣品散點(diǎn)分布圖。由圖3可知,不同產(chǎn)地樣品的界限不明顯,有多處重疊現(xiàn)象,無法直觀地進(jìn)行品種判別。為了準(zhǔn)確地判別3類紅提的產(chǎn)地,需要利用監(jiān)督性判別方法來進(jìn)一步區(qū)分。
圖3 保留前3個主成分的樣品散點(diǎn)分布圖
在4 000~12 000 cm-1光譜范圍內(nèi)對校正集樣品進(jìn)行PLS回歸并進(jìn)行內(nèi)部交叉驗(yàn)證,采用交互驗(yàn)證的均方根誤差(RMSECV)來選擇模型的最佳主成分?jǐn)?shù)。圖4為交互驗(yàn)證的均方根誤差隨主成分?jǐn)?shù)變化的散點(diǎn)折線圖,由圖 4可知,當(dāng)主成分為 6時,模型的 RMSECV不再顯著降低,因此確定PLS-DA 模型的主成分?jǐn)?shù)為6,建立判別模型。
圖4 主成分的均方根誤差(RMSECV)曲線
采用課題組編寫的偏最小二乘算法 Matlab代碼,對4 000~12 000 cm-1波段內(nèi)采用K-S法挑選出的90個校正集樣品數(shù)據(jù)進(jìn)行建模和內(nèi)部檢測。由圖5可知,模型校正集內(nèi)部預(yù)測結(jié)果準(zhǔn)確無誤,3類樣品均得到正確識別,判別正確率100%,所建模型具有良好的自我預(yù)測能力,模型的實(shí)際預(yù)測能力還需要通過外部驗(yàn)證集檢驗(yàn)做進(jìn)一步的驗(yàn)證。
利用K-S法挑選出的45個樣品作為驗(yàn)證集,對所建立的分類模型進(jìn)行驗(yàn)證集預(yù)測。由圖6可知,模型驗(yàn)證集外部預(yù)測結(jié)果準(zhǔn)確無誤,3類樣品均得到正確識別,判別正確率100%。利用PLS-DA建立的3種產(chǎn)地紅提的分類模型具有較高的預(yù)測準(zhǔn)確度和預(yù)測穩(wěn)定性。
圖5 校正集樣本的PLS-DA預(yù)測結(jié)果
圖6 驗(yàn)證集樣本的PLS-DA預(yù)測結(jié)果
利用傅里葉變換近紅外光譜儀測出美國紅提、秘魯紅提和國產(chǎn)紅提的近紅外光譜,通過PLS-DA算法在Matlab中建立判別模型。此方法可有效判別出3種產(chǎn)地紅提品種,該研究為果品產(chǎn)地的無損定性鑒別提供了一定的理論基礎(chǔ)。