李光輝,任亞梅,*,任小林,趙 玉,李 帥,蘇晉文,劉 朵
(1.西北農(nóng)林科技大學(xué)食品科學(xué)與工程學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué)園藝學(xué)院,陜西 楊凌 712100)
蘋果品種及損傷蘋果的FT-NIR鑒別研究
李光輝1,任亞梅1,*,任小林2,趙 玉1,李 帥1,蘇晉文1,劉 朵1
(1.西北農(nóng)林科技大學(xué)食品科學(xué)與工程學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué)園藝學(xué)院,陜西 楊凌 712100)
用傅里葉近紅外光譜技術(shù)(FT-NIR)對(duì)不同品種的蘋果以及損傷嘎啦和完好嘎啦進(jìn)行快速、無損檢測,比較不同判別方法對(duì)所建立的區(qū)分蘋果品種及蘋果損傷模型的影響。結(jié)果表明:損傷嘎啦和完好嘎啦的近紅外圖譜經(jīng)小波分析預(yù)處理后,用12000~4000cm-1波數(shù)范圍的前5個(gè)主成分分別結(jié)合多層感知神經(jīng)網(wǎng)絡(luò)、徑向基神經(jīng)網(wǎng)絡(luò)、Fisher判別3種方法所建立的判別模型對(duì)未知樣本的正確判別率分別為97.8%、87.2%和84.8%,基于權(quán)重法用多元線性回歸(MLR)所選擇的特征波長所建立的Fisher判別模型對(duì)未知樣本的正確判別率為89.1%;用偏最小二乘判別(PLS-DA)所建立的判別模型對(duì)未知樣本的正確判別率為100%,由于PLS-DA模型對(duì)訓(xùn)練集和驗(yàn)證集的正確判別率均為100%,因此PLS-DA模型優(yōu)于其他模型。不同品種蘋果的光譜經(jīng)平滑預(yù)處理后,用全波數(shù)范圍12000~4000cm-1的前6個(gè)主成分所建立的判別模型優(yōu)于經(jīng)驗(yàn)波數(shù)范圍8000~4500cm-1所建立的判別模型,其較優(yōu)模型對(duì)建模集和驗(yàn)證集的正確判別率分別為90.9%和92.1%。近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)可以快速、無損鑒別蘋果是否有損傷以及不同品種的蘋果。
蘋果;近紅外技術(shù);神經(jīng)網(wǎng)絡(luò);偏最小二乘判別;Fisher判別
我國是蘋果生產(chǎn)大國,栽培蘋果品種繁多;不同的蘋果品種,其口感、品質(zhì)和大小等差異較大,隨著蘋果采后商品化處理和加工技術(shù)的發(fā)展,蘋果分級(jí)將越來越重要,其中重要方面為不同品種蘋果鑒別和損傷蘋果識(shí)別。因此,研究一種簡單、方便、快速識(shí)別蘋果品種以及損傷蘋果的方法對(duì)實(shí)際生產(chǎn)將具有重要的意義。
目前,近紅外光譜無損檢測技術(shù)在蘋果方面的定量分析有糖度[1-2]、病害果[3-4]和酸度[5]等,定性分析有蘋果品種[6]鑒別和損傷蘋果[7-9]識(shí)別等。但是,近紅外技術(shù)對(duì)蘋果品種和損傷蘋果的鑒別研究仍不夠成熟,表現(xiàn)為建模方法單一,未有區(qū)別蘋果的品種和損傷蘋果的建模方法比較。本研究用傅里葉近紅外技術(shù)(fourier transform near infrared spectroscopy,F(xiàn)T-NIR)無損檢測不同品種的蘋果以及損傷嘎啦和完好嘎啦,比較不同判別分析方法對(duì)所建立的區(qū)分不同品種蘋果模型以及蘋果是否有損傷模型的影響,為近紅外光譜技術(shù)無損鑒別損傷蘋果以及蘋果品種提供理論基礎(chǔ)。
1.1 材料
供試材料‘嘎啦’、‘紅星’和‘喬納金’于2010年9月7日采自陜西省永壽縣。選取成熟度一致、無病蟲害、無機(jī)械損傷和個(gè)體大小在100~350g之間的果實(shí)為試驗(yàn)材料,其中嘎啦230個(gè),紅星和喬納金各120個(gè)。
1.2 蘋果損傷方法
取嘎啦110個(gè),逐個(gè)將蘋果拿在手中,果實(shí)赤道垂直手心,手心向下,使蘋果自然的從0.90m高度落到水泥地面,果實(shí)赤道處觸地,當(dāng)果實(shí)落地反彈時(shí)將果實(shí)接住,避免二次損傷。
1.3 光譜采集
果實(shí)損傷的第2天將完好嘎啦、紅星和喬納金以及損傷的嘎啦蘋果從冷庫(0℃±1℃,RH 85%~90%)中取出,放置24h,使蘋果整體溫度與室溫(25℃±1℃)一致;在每個(gè)蘋果上編上號(hào)碼并在果實(shí)赤道處標(biāo)記等距離的3個(gè)光譜采集點(diǎn)(損傷嘎啦的光譜采集點(diǎn)其中一個(gè)為損傷部位)。然后,用MPA型傅里葉變換近紅外光譜儀(德國Bruker光學(xué)儀器公司)采集完好和損傷蘋果的近紅外光譜;光譜采集時(shí)的儀器參數(shù)為:固定光纖探頭,分辨率為8cm-1,掃描次數(shù)為64,波長范圍12000~4000cm-1;然后平均每個(gè)果實(shí)的3個(gè)點(diǎn)的近紅外圖譜,得到每個(gè)樣本的代表光譜。
2.1 損傷嘎啦的鑒別
2.1.1 損傷嘎啦和完好嘎啦的近紅外圖譜分析
由圖1可知,完好嘎啦和損傷嘎啦的近紅外光譜曲線形狀基本相似,曲線在5300、5708、7186、7501、8752、10495cm-1等波數(shù)處出現(xiàn)峰值,完好嘎啦和損傷嘎啦的光譜交叉重合,因此很難直接從光譜曲線中區(qū)分嘎啦蘋果是否有損傷。
圖1 損傷嘎啦和完好嘎啦的近紅外光譜圖Fig.1 NIR spectra of non-bruised and bruised Gala apples
2.1.2 基于主成分分析的損傷嘎啦的鑒別
主成分分析的目的是把多個(gè)指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo);用主成分分析處理近紅外圖譜,解決了圖譜重疊而無法分析的問題。用OPUS 5.5軟件將230個(gè)嘎啦蘋果的圖譜在12000~4000cm-1范圍的吸光度導(dǎo)出,放入Excel中形成230×2074數(shù)據(jù)矩陣,然后用Matlab 2010對(duì)數(shù)據(jù)矩陣進(jìn)行小波分析(db5小波、5尺度)預(yù)處理,最后用SPSS 19.0對(duì)預(yù)處理后的數(shù)據(jù)矩陣進(jìn)行主成分分析。由主成分分析結(jié)果可知,主成分1(X1)、主成分2(X2)、主成分3(X3)、主成分4(X4)、主成分5(X5)的累計(jì)貢獻(xiàn)率分別為77.612%、97.815%、99.472%、99.793%、99.882%,前5個(gè)主成分的累計(jì)貢獻(xiàn)率已達(dá)99.882%,因此前5個(gè)主成分可以代表小波分析預(yù)處理后光譜的主要信息,使數(shù)據(jù)矩陣從230×2074減少到230×5。
2.1.2.1 多層感知器(multilayer perceptron,MLP)神經(jīng)網(wǎng)絡(luò)
(1) 模型參數(shù)的確定
神經(jīng)網(wǎng)絡(luò)模型由3部分組成即輸入層、隱含層和輸出層。隱含層的激活函數(shù)有S型(Sigmoid)函數(shù)和雙曲正切函數(shù),輸出層的激活函數(shù)有Softmax函數(shù)、恒等函數(shù)、S型函數(shù)和雙曲正切函數(shù);在建模過程中需要確定神經(jīng)網(wǎng)絡(luò)模型的隱含層激活函數(shù)、隱含層數(shù)和輸出層的激活函數(shù)。本研究建立3層MLP神經(jīng)網(wǎng)絡(luò)模型,因此隱含層為1層,由于提取的前5個(gè)主成分可以代表光譜的主要信息,故神經(jīng)網(wǎng)絡(luò)的輸入層為5,隱含層單位數(shù)由軟件計(jì)算確定,輸出層節(jié)點(diǎn)數(shù)為2,即“1”代表正常嘎啦蘋果,“2”代表損傷嘎啦蘋果。經(jīng)SPSS 19.0計(jì)算,得出的最佳模型參數(shù)為:隱含層激活函數(shù)為雙曲正切函數(shù),隱含層單位數(shù)為2和輸出層的激活函數(shù)為Softmax函數(shù)。
(2) MLP神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集和檢驗(yàn)集的判別
據(jù)(1)確定的模型參數(shù),建立MLP神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練集(184個(gè))和檢驗(yàn)集(46個(gè))判別結(jié)果見表1??梢娝⒌腗LP神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集和檢驗(yàn)集的正確判別率分別為95.1%和97.8%,說明主成分分析結(jié)合MLP神經(jīng)網(wǎng)絡(luò)對(duì)損傷嘎啦蘋果的鑒別可行。
表1 MLP神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集和檢驗(yàn)集的判別結(jié)果Table 1 Discrimination results obtained for the training and validation sets using the MLP neural network model
2.1.2.2 徑向基函數(shù)(radical basis function,RBF)神經(jīng)網(wǎng)絡(luò)
(1) 模型參數(shù)的確定
本研究建立3層RBF神經(jīng)網(wǎng)絡(luò)模型,以提取的前5個(gè)主成分為神經(jīng)網(wǎng)絡(luò)的輸入層,隱含層為1層,由軟件計(jì)算確定隱含層單位數(shù),輸出層節(jié)點(diǎn)數(shù)為2(即“1”代表正常嘎啦,“2”代表損傷嘎啦)。經(jīng)SPSS 19.0計(jì)算,得出的最佳模型參數(shù)為:隱含層激活函數(shù)為Softmax函數(shù),隱含層單位數(shù)為10及輸出層的激活函數(shù)為恒等函數(shù)。(2) RBF神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集與檢驗(yàn)集的判別
據(jù)(1)確定的模型參數(shù),建立RBF神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練集(191個(gè))和檢驗(yàn)集(39個(gè))的判別結(jié)果見表2??梢娝⒌腞BF神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集和檢驗(yàn)集的正確判別率分別為91.6%和87.2%,低于MLP神經(jīng)網(wǎng)絡(luò),尤其是模型對(duì)驗(yàn)證集中損傷嘎啦的判別率僅為80.0%,判別率較低,因此,主成分分析結(jié)合RBF神經(jīng)網(wǎng)絡(luò)對(duì)損傷嘎啦的識(shí)別有待進(jìn)一步研究。
表2 RBF神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練集和檢驗(yàn)集的判別結(jié)果Table 2 Discrimination results obtained for the training and validation sets using the RBF neural network model
2.1.2.3 Fisher判別
用SPSS 19.0建立Fisher判別模型[10-11],以提取的前5個(gè)主成分為自變量,對(duì)于訓(xùn)練集的184個(gè)樣本,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量。通過軟件計(jì)算,得到Fisher判別函數(shù)為:正常嘎啦Y1=-0.043X1+0.083X2-0.0040X3+0.074X4-0.088X5- 1.656;損傷嘎啦Y2=0.047X1-0.091X2+0.044X3-0.081X4+0.096X5-1.839。所得判別函數(shù)對(duì)訓(xùn)練集(184個(gè))和檢驗(yàn)集(46個(gè))的判別結(jié)果見表3。
表3 Fisher判別模型對(duì)訓(xùn)練集和驗(yàn)證集的判別結(jié)果Table 3 Discrimination results obtained for the training and validation sets using the Fisher linear discriminant analysis model established based on principal component analysis
由表3可見,所建立的Fisher判別模型對(duì)訓(xùn)練集和檢驗(yàn)集的正確判別率分別為92.9%和84.8%,低于MLP神經(jīng)網(wǎng)絡(luò);原因是模型對(duì)建模集和驗(yàn)證集中損傷嘎啦的判別率較低,分別為88.6%和72.7%,因此,主成分分析結(jié)合Fisher判別對(duì)損傷嘎啦蘋果的鑒別有待于進(jìn)一步的研究。
2.1.3 基于指紋圖譜的損傷蘋果的鑒別
嘎啦蘋果的近紅外圖譜,經(jīng)小波分析預(yù)處理后,隨機(jī)將光譜分為建模集(184個(gè))和驗(yàn)證集(46個(gè));將全波數(shù)范圍12000~4000cm-1分為3個(gè)區(qū)間即波數(shù)范圍Ⅰ:12000~7000cm-1、波數(shù)范圍Ⅱ:7000~5208cm-1和波數(shù)范圍Ⅲ:5208~4000cm-1[12]。各波數(shù)范圍的權(quán)重分析和數(shù)學(xué)模型的建立均在SPSS 19.0完成。
對(duì)于波數(shù)范圍Ⅰ:12000~7000cm-1,用權(quán)重法選取的波長為10120cm-1,以此波長為自變量,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量進(jìn)行MLR回歸分析,其模型的相關(guān)系數(shù)R為0.714。表明:所建立的區(qū)分損傷蘋果的模型效果較好,可用于區(qū)分蘋果是否損傷。
對(duì)于波數(shù)范圍Ⅱ:7000~5208cm-1,用權(quán)重法選取的2個(gè)波長分別為6479.15cm-1和6425.586cm-1,以這2個(gè)波長為自變量,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量進(jìn)行MLR回歸分析,其模型的相關(guān)系數(shù)R為0.743,相關(guān)性較好,可用于區(qū)分蘋果是否有損傷。
對(duì)于波數(shù)范圍Ⅲ:5208~4000cm-1,用權(quán)重法選取4個(gè)波長分別為4231.887、4242.015、4223.46cm-1和4258.18cm-1,以這4個(gè)波長為自變量,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量進(jìn)行回歸分析,其模型的相關(guān)系數(shù)R為0.809,相關(guān)性較好,可用于區(qū)分蘋果是否損傷。
將上述選取的7個(gè)波長作為自變量,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量,用逐步回歸法剔除無用波長,選出信息較豐富的波長。經(jīng)軟件多次計(jì)算,選出有用的波長為3個(gè),分別為10120、6479.15cm-1和4231.887cm-1,此時(shí)MLR模型的相關(guān)系數(shù)R為0.870。以這3個(gè)波長為自變量,“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦)為因變量,在SPSS 19.0中進(jìn)行Fisher判別,所得判別函數(shù)為:正常嘎啦Y3=50.457X1+337.746X2-26.955X3-201.858;損傷嘎啦Y4=174.032X1+322.056X2-42.573X3-220.838。
判別函數(shù)對(duì)訓(xùn)練集和驗(yàn)證集的判別結(jié)果見表4??梢娪脵?quán)重法基于MLR所選擇的波長建立的Fisher判別模型對(duì)訓(xùn)練集和檢驗(yàn)集的正確判別率分別為92.4%和89.1%,低于MLP神經(jīng)網(wǎng)絡(luò),其主要原因是所建立的模型對(duì)損傷嘎啦的正確判別率較低,因此,基于權(quán)重法用MLR所選擇的特征波長建立的Fisher判別模型對(duì)損傷嘎啦的識(shí)別有待于進(jìn)一步的研究。
表4 Fisher判別對(duì)訓(xùn)練集和驗(yàn)證集的判別結(jié)果Table 4 Discrimination results obtained for the training and validation sets using the Fisher linear discriminant analysis model established based on fingerprinting analysis
2.1.4 蘋果有無損傷的PLS判別
PLS-DA是一種基于PLS回歸的一種判別方法,需先將光譜數(shù)據(jù)與分類變量進(jìn)行線性回歸,然后判別,其基本思想是首先建立訓(xùn)練集樣本的分類變量,然后用PLS法建立分類變量與光譜數(shù)據(jù)間的回歸模型,最后根據(jù)訓(xùn)練集與分類變量的PLS-DA模型,計(jì)算驗(yàn)證集的分類變量Yp,根據(jù)Yp和偏差判定樣本屬于哪一類[13]。
用OPUS 5.5建立PLS-DA模型,其中分類變量為“1”和“2”(“1”代表正常嘎啦,“2”代表損傷嘎啦),通過軟件自身優(yōu)化,在原始光譜、波數(shù)范圍為11995.4~7498.1cm-1和6101.9~5446.2cm-1、主成分為5時(shí)所建立的PLS-DA判別模型效果較好,其預(yù)測時(shí)的相關(guān)系數(shù)R2和RMSEE分別為91.76%和0.153,驗(yàn)證時(shí)的R2和EMSECV分別為85.85%和0.18,此時(shí)模型對(duì)訓(xùn)練集和驗(yàn)證集的正確判別率均為100%。PLS-DA模型對(duì)驗(yàn)證集的判別結(jié)果見表5。
表5 PLS-DA模型對(duì)驗(yàn)證集的判別結(jié)果Table 5 Discrimination results obtained for the validation set using the PLS-DA model
2.2 蘋果品種的識(shí)別
2.2.1 不同品種蘋果的近紅外圖譜分析
在采集樣本的光譜時(shí),由于樣本的均勻程度、儀器以及環(huán)境等因素的影響,圖譜易出現(xiàn)噪音和基線漂移等現(xiàn)象,因此,在建模分析時(shí),就需要對(duì)蘋果的近紅外光譜進(jìn)行預(yù)處理。本研究選取平滑(9點(diǎn))對(duì)光譜進(jìn)行預(yù)處理(圖2),平滑能較好的將圖譜的噪音濾除,消除了基線的偏移,減少了外界因素對(duì)光譜的影響。
圖2 經(jīng)平滑預(yù)處理后的3個(gè)品種蘋果的近紅外圖譜Fig.2 Smoothed NIR spectra of non-bruised and bruised Gala apples
由圖2可知,3個(gè)品種蘋果的近紅外圖譜經(jīng)平滑9點(diǎn)預(yù)處理后在11076.20、8313.76、7000、6888.60cm-1和51620cm-1等波峰或波谷處有明顯的差異,這些差異為鑒定蘋果不同的品種提供了理論基礎(chǔ)。
2.2.2 主成分分析
首先,通過OPUS 5.5將完好嘎啦、紅星、喬納金各120個(gè)近紅外光譜進(jìn)行平滑(9點(diǎn))預(yù)處理;然后,將平滑預(yù)處理后的吸光度導(dǎo)出,并保存到Excel中;最后,分別選取全波數(shù)范圍12000~4000cm-1和經(jīng)驗(yàn)波數(shù)范圍8000~4500cm-1的吸光度在SPSS 19.0軟件中進(jìn)行主成分分析。
表6可知,全波數(shù)范圍12000~4000cm-1的前6個(gè)主成分累計(jì)貢獻(xiàn)率已達(dá)99.91%,并且前6個(gè)主成分的特征根都大于1和經(jīng)驗(yàn)波數(shù)范圍8000~4500cm-1的前4個(gè)主成分累計(jì)貢獻(xiàn)率已達(dá)99.89%,并且前4個(gè)主成分的特征根都大于1,因此,全波數(shù)范圍12000~4000cm-1的主要信息可以用這前6個(gè)主成分表示,經(jīng)驗(yàn)波數(shù)范圍8000~4500cm-1的主要信息可以前4個(gè)主成分表示。
表6 不同波數(shù)范圍的主成分累積貢獻(xiàn)率Table6 Discriminant analysis results of testing samples predicted by PLS-DA model
2.2.2.1 用12000~4000cm-1波數(shù)范圍內(nèi)提取的前6個(gè)主成分建立多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)模型
(1) 模型參數(shù)的確定
本研究建立3層MLP神經(jīng)網(wǎng)絡(luò)模型即輸入層-隱含層-輸出層,由于提取的前6個(gè)主成分可以代表光譜的主要信息,故MLP神經(jīng)網(wǎng)絡(luò)的輸入層為6,隱含層為1層,輸出層節(jié)點(diǎn)數(shù)為3(即蘋果不同品種的名義變量,“1”代表嘎啦,“2”代表紅星,“3”喬納金),隱含層單位數(shù)、隱含層和輸出層函數(shù)由軟件確定。經(jīng)SPSS19.0軟件多次計(jì)算,得出的最佳模型為隱含層激活函數(shù)為雙曲正切函數(shù),隱含層單位數(shù)為4和輸出層的激活函數(shù)為Softmax函數(shù)。
(2) MLP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練結(jié)果與檢驗(yàn)結(jié)果
根據(jù)(1)的參數(shù),建立MLP 神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練集(284個(gè))和檢驗(yàn)集(76個(gè))的判別結(jié)果如表7??梢娔P蛯?duì)訓(xùn)練集樣本的總的正確識(shí)別率為90.8%,其中第1類(嘎啦)樣本的正確識(shí)別率最高,達(dá)到96.6%;第3類(喬納金)的正確識(shí)別率良好,為90.9%。驗(yàn)證集樣本總的識(shí)別率為92.1%,其中第1類(嘎啦)樣本的正確識(shí)別率最高,為93.9%。因此,利用全波段光譜的主成分結(jié)合MLP神經(jīng)網(wǎng)絡(luò)可以區(qū)分不同品種的蘋果。
表7 12000~4000cm-1波數(shù)范圍內(nèi)MLP神經(jīng)網(wǎng)絡(luò)模型對(duì)360個(gè)樣品的識(shí)別結(jié)果Table 7 Recognition results obtained for 360 samples using the MLP neural network model based on the first six principal components in the range of 12000-4000 cm-1
2.2.2.2 用8000~4500cm-1波數(shù)范圍內(nèi)提取的前4個(gè)主成分建立多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)模型
(1) 模型參數(shù)的確定
本研究建立3層MLP神經(jīng)網(wǎng)絡(luò)模型即輸入層-隱含層-輸出層,因此隱含層為1層;由于提取的前4個(gè)主成分可以代表光譜的主要信息,故MLP神經(jīng)網(wǎng)絡(luò)的輸入層為4,輸出層節(jié)點(diǎn)數(shù)為3(即蘋果不同品種的名義變量,“1”代表嘎啦,“2”代表紅星,“3”喬納金),隱含層單位數(shù)和隱含層、輸出層函數(shù)由軟件確定。經(jīng)SPSS19.0軟件多次計(jì)算,得出的最佳模型為隱含層激活函數(shù)為雙曲正切函數(shù),隱含層單位數(shù)為3和輸出層的激活函數(shù)為Softmax函數(shù)。
(2) 模型對(duì)訓(xùn)練集和檢驗(yàn)集的判別結(jié)果
根據(jù)(1)的參數(shù),建立MLP 神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練集(284個(gè))、檢驗(yàn)集(76個(gè))判別結(jié)果見表8??梢娪?xùn)練集樣本中第1類(紅星)樣本的正確識(shí)別率最高,為82.4%;第2類(紅星)正確率識(shí)別率最差,為76.5%,不符合檢測的基本要求。訓(xùn)練集和驗(yàn)證集樣本的總的正確識(shí)別率分別為79.2%和75%,因此,利用8000~4500cm-1波數(shù)范圍的主成分結(jié)合MLP神經(jīng)網(wǎng)絡(luò)對(duì)蘋果品種的識(shí)別有待于進(jìn)一步的研究。
表8 8000~4500cm-1波數(shù)范圍內(nèi)MLP神經(jīng)網(wǎng)絡(luò)模型對(duì)360個(gè)樣品的識(shí)別結(jié)果Table 8 Recognition results obtained for 360 samples using the MLP neural network model based on the first four principal components in the range of 8000-4500 cm-1
3.1 完好嘎啦和損傷嘎啦的近紅外圖譜預(yù)處理后,用全波段光譜的主成分分別結(jié)合MLP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、Fisher判別,以及偏最小二乘判別等建模方法,建立了區(qū)分嘎啦蘋果有無損傷的5個(gè)判別模型,結(jié)果為:近紅外圖譜經(jīng)小波分析預(yù)處理后,用12000~4000cm-1波數(shù)范圍的前5個(gè)主成分分別結(jié)合MLP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、Fisher判別3種方法所建立的判別模型對(duì)未知樣本的正確判別率分別為97.8%、87.2%和84.8%,基于權(quán)重法用MLR所選擇的特征波長所建立的Fisher判別模型對(duì)未知樣本的正確判別率為89.1%;用PLS-DA判別法所建立的判別模型對(duì)未知樣本的正確判別率為100%,由于PLS-DA模型對(duì)訓(xùn)練集和驗(yàn)證集的正確判別率都為100%,因此PLS-DA模型優(yōu)于其他模型。表明近紅外技術(shù)結(jié)合化學(xué)計(jì)量學(xué)可以快速、無損鑒別嘎啦蘋果是否有損傷。
3.2 用8000~4500cm-1和12000~4000cm-1兩個(gè)波數(shù)范圍的近紅外光譜提取的主成分分別結(jié)合MLP 神經(jīng)網(wǎng)絡(luò)建立了區(qū)分蘋果品種的2個(gè)判別分析模型。結(jié)果表明:用全波數(shù)范圍12000~4000cm-1的主成分所建立的模型優(yōu)于經(jīng)驗(yàn)波數(shù)范圍8000~4500cm-1建立的判別模型,其對(duì)建模集和驗(yàn)證集的正確判別率分別為90.9%和92.1%,說明:全波段的前6個(gè)主成分才能完整代表這3個(gè)蘋果品種的特征,用全波段的主成分結(jié)合MLP神經(jīng)網(wǎng)絡(luò)可以區(qū)分不同品種的蘋果。
[1] 周麗萍, 胡耀華, 陳達(dá), 等. 蘋果可溶性固形物含量的檢測方法-基于可見光近紅外光譜技術(shù)[J]. 農(nóng)機(jī)化研究, 2009(4): 104-107.
[2] 王加華, 韓東海. 便攜式近紅外水果糖度分析模型簡化研究術(shù)[J]. 食品安全質(zhì)量檢測技術(shù), 2009, 1(1): 32-38.
[3] 韓東海, 劉新鑫, 趙麗麗, 等. 蘋果水心病的光學(xué)無損檢測[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2004, 35(5): 143-146.
[4] 韓東海, 劉新鑫, 魯超, 等. 蘋果內(nèi)部褐變的光學(xué)無損傷檢測研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào), 2006, 37(6): 86-88.
[5] 應(yīng)義斌, 劉燕德, 傅霞萍. 蘋果有效酸度的近紅外漫反射無損檢測[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2004, 35(6): 124-126
[6] 何勇, 李曉麗. 用近紅外光譜鑒別楊梅品種的研究[J]. 紅外與毫米波學(xué)報(bào), 2006, 25(3): 192-194.
[7] XING Juan, BRAVO C, MOSHOU D, et al. Bruise detection on “Golden Delicious” apples by VIS/NIR spectroscopy[J]. Computers and Electronics in Agriculture, 2006, 52(1/2): 11-20.
[8] XING Juan, SAEYS W, De BAERDEMAEKER J. Combination of chemometric tools and image processing for bruise detection on apples[J]. Computers and Electronics in Agriculture, 2007, 56(1): 1-13.
[9] 韓東海, 劉新鑫, 趙麗麗, 等. 受損蘋果顏色和組織的近紅外光譜特性[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2003, 34(6): 112-115.
[10] 李亮. 近紅外光譜技術(shù)在原料奶摻假快速檢測及新鮮度檢測中的應(yīng)用研究[D]. 楊凌: 西北農(nóng)林科技大學(xué), 2010.
[11] 唐啟義, 馮明光. DPS數(shù)據(jù)處理系統(tǒng)-實(shí)驗(yàn)設(shè)計(jì)、統(tǒng)計(jì)分析及模型的優(yōu)化[M]. 北京: 科學(xué)出版社, 2006.
[12] 李桂峰, 趙國建, 劉興華, 等. 蘋果質(zhì)地品質(zhì)近紅外無損檢測和指紋分析[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2008, 24(6): 189-173.
[13] 李劍鋒. 基于近紅外光譜漫反射技術(shù)檢測雞蛋新鮮度的研究[D]. 武漢: 華中農(nóng)業(yè)大學(xué), 2009.
Discrimination and Identification of Bruised Apples and Apple Varieties by FT-NIR
LI Guang-hui1,REN Ya-mei1,*,REN Xiao-lin2,ZHAO Yu1,LI Shuai1,SU Jin-wen1,LIU Duo1(1. College of Food Science and Engineering, Northwest A & F University, Yangling 712100, China;2. College of Horticulture, Northwest A & F University, Yangling 712100, China)
Near-infrared (NIR) spectroscopy was applied to rapidly and non-destructively distinguish between bruised and intact apples and identify different apple varieties. Besides, the effect of different discrimination methods on the distinguishing and identification models obtained was investigated. The results indicated that discrimination models were developed based on the first five principal components in the range from 12000 cm-1to 4000 cm-1from the NIR spectra of bruised and intact apples subjected to wavelet pretreatment using three different discrimination methods, multilayer perceptron (MLP) neural network,radial basis function (RBF) neural network and Fisher line discriminant analysis (Fisher-DA) with discrimination accuracy rates of 97.8%, 87.2% and 84.8%, respectively for unknown samples. The Fisher linear discriminant analysis model established based on multiple linear regression and the loading weights showed a discrimination accuracy rate of 89.1% compared with 100% for the model established using partial least squares discriminant analysis (PLS-DA). The discrimination accuracy rates of the PLSDA model for the training and validation sets were both 100%, and therefore the PLS-DA model was superior to others. A better discrimination model was established based on the first six principal components of the NIR spectra of different apple varieties subjected to smoothing pretreatment in the full wavelength range of 12000-4000 cm-1than in the empirical range of 8000-4500 cm-1with discrimination accuracy rates of 90.9% and 92.1% for the predication and validation sets, respectively. In conclusion, the combination of NIR and chemometrics can provide a rapid and non-destructive approach to discriminate whether apples are bruised and identify different apple varieties.
apple;NIR spectroscopy;artificial neural network;PLS-DA;Fisher-DA
S123;TS255.3
A
1002-6630(2012)16-0251-06
2011-07-03
國家蘋果產(chǎn)業(yè)技術(shù)體系專項(xiàng)(NYCYTX-08-05-02)
李光輝(1985—),男,碩士研究生,研究方向?yàn)楣哔A藏、加工和無損檢測。E-mail:hnlgh1228@163.com
*通信作者:任亞梅(1970—),女,副教授,博士,研究方向?yàn)楣呱罴庸ず唾A藏。E-mail:yameiren@yahoo.com