鄭 劍,周 竹,仲山民,曾松偉(1.浙江農(nóng)林大學農(nóng)業(yè)與食品科學學院,浙江臨安311300;2.浙江農(nóng)林大學浙江省農(nóng)產(chǎn)品品質(zhì)改良技術(shù)研究重點實驗室,浙江臨安311300;3.浙江農(nóng)林大學信息工程學院,浙江臨安311300;4.浙江農(nóng)林大學浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點實驗室,浙江臨安311300;5.浙江農(nóng)林大學智慧農(nóng)林業(yè)研究中心,浙江臨安311300)
?
基于近紅外光譜與隨機青蛙算法的褐變板栗識別
鄭劍1,2,周竹3,4,5,仲山民1,2,曾松偉3,4,5
(1.浙江農(nóng)林大學農(nóng)業(yè)與食品科學學院,浙江臨安311300;2.浙江農(nóng)林大學浙江省農(nóng)產(chǎn)品品質(zhì)改良技術(shù)研究重點實驗室,浙江臨安311300;3.浙江農(nóng)林大學信息工程學院,浙江臨安311300;4.浙江農(nóng)林大學浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點實驗室,浙江臨安311300;5.浙江農(nóng)林大學智慧農(nóng)林業(yè)研究中心,浙江臨安311300)
摘要:為了實現(xiàn)板栗Castanea mollissima的快速自動分選,研究了基于近紅外光譜技術(shù)的褐變板栗無損檢測方法。首先采用AntarisⅡ傅里葉變換近紅外光譜儀獲取70個正常板栗和110個褐變板栗的近紅外光譜(1 000.00~2500.00 nm),比較了不同光譜預(yù)處理方法對褐變板栗識別的影響,隨后采用一種新的變量選擇方法即隨機青蛙算法(Random Frog)提取與板栗褐變相關(guān)的特征波長變量,最后基于特征波長建立和比較了褐變板栗識別的偏最小二乘-線性判別分析模型(PLS-LDA)和最小二乘-支持向量機(LS-SVM)模型。結(jié)果顯示:經(jīng)標準正態(tài)變量變換(SNV)預(yù)處理和隨機青蛙算法優(yōu)選的23個特征波長所建LS-SVM模型的性能最優(yōu),該模型對測試集的敏感性、特異性和識別正確率分別為0.92,1.00和95.00%。隨機青蛙算法可以有效篩選重要的特征變量,不僅能簡化模型,而且可以提高識別準確率和識別速度。圖4表3參22
關(guān)鍵詞:經(jīng)濟林學;近紅外光譜;褐變;隨機青蛙算法;最小二乘-支持向量機;偏最小二乘-線性判別分析;板栗
板栗Castanea mollissima味道香甜,營養(yǎng)豐富,是良好的營養(yǎng)保健品。然而,板栗在儲藏和加工過程中常常會發(fā)生果肉褐變,嚴重影響產(chǎn)品的品質(zhì)、風味和營養(yǎng)成分,降低了產(chǎn)品的經(jīng)濟價值。因此,快速準確檢測褐變板栗對于板栗的儲藏與深加工具有重要的意義。近紅外光譜技術(shù)(NIRS)可利用近紅外光譜區(qū)域(780~2 500 nm)的全譜或部分波段光譜對被測物進行定量或定性分析。因其快速、無損等優(yōu)點,在肉類[1-2]、果蔬[3-6]等農(nóng)產(chǎn)品品質(zhì)檢測中得到了廣泛的研究。在板栗品質(zhì)檢測方面,周竹等[7-9]、Moscetti等[10-11]研究了帶殼霉變、蟲害板栗的近紅外光譜定性檢測方法;劉潔等[12-13]、傅誼等[14]建立了板栗中水分、蛋白質(zhì)等含量的近紅外光譜模型。以上研究為板栗褐變的近紅外光譜檢測奠定了基礎(chǔ)。然而,近紅外光譜通常包含1 000.00~2 000.00 nm多個波長點的光譜數(shù)據(jù),利用全波段數(shù)據(jù)建模分析時,光譜中的大量冗余信息會使建模計算工作量大,時間花費長。此外,由于變量間的強相關(guān)性,并非所有波長都能提供有用信息。周竹等[7-8]前期采用傅里葉變換、主成分分析等方法提取少數(shù)特征量建立了霉變板栗識別模型,但傅里葉系數(shù)、主成分得分均難以直觀表征正常、褐變板栗光譜。已有的研究表明:對波長變量進行優(yōu)選,一方面可以剔除不相關(guān)變量,在簡化模型的同時,還可提高模型的預(yù)測精度以及穩(wěn)健性[15];另一方面可以根據(jù)獲取的特征波長設(shè)計便攜式在線檢測儀器,從而有效降低成本。本研究提出采用近紅外光譜技術(shù)檢測褐變板栗,擬采用一種最新的變量提取算法——隨機青蛙算法(Random-Frog,RF)尋找區(qū)分褐變板栗與正常板栗的有效光譜波長,并采用線性建模方法偏最小二乘-線性判別分析(partial least squares-linear discriminant analysis,PLS-LDA)和非線性判別方法最小二乘-支持向量機(least squares-support vector machine,LS-SVM)建立褐變板栗識別模型,且與全波段所建模型進行比較,以期確定最優(yōu)的板栗褐變檢測方法與模型,為褐變板栗的快速準確識別提供方法與技術(shù)支撐。
1.1試驗材料
供試板栗品種為浙江省主栽品種毛板紅,產(chǎn)自浙江省麗水市,購于農(nóng)貿(mào)批發(fā)市場。剔除蟲害板栗,選取大小均勻的板栗仁,將其標號放置在4~6℃冷庫中2個月,隨后取出在室溫下放置10 d,至部分板栗仁內(nèi)部出現(xiàn)不同程度的褐變,選取供實驗板栗仁180個。
1.2試驗儀器
采用AntarisⅡ傅里葉變換近紅外光譜儀(Thermo Scientific Co.,美國)對板栗果仁進行光譜采集。該儀器使用InGaAs檢測器,內(nèi)置參比背景,光源為25 W鹵素燈(儀器標配)。通過漫反射式積分球附件進行光譜采集。光譜掃描范圍設(shè)置為1 000.00~2 500.00 nm,掃描次數(shù)為32次,分辨率為8.0 cm-1。選擇栗仁平整的面作為光譜采集面[8,11],平面中心以及4個方位上等距的區(qū)域作為光譜采樣點。采集5個·樣本-1標記部位的光譜,并將其平均光譜作為該樣品的原始光譜。
1.3栗仁褐變評價
光譜采集完成后,在平行采集面8.0 mm的位置切開板栗,以判斷是否褐變及褐變程度。將板栗剖面置于A4打印紙上,采用Canon 5D3數(shù)碼相機(分辨率5 184×3 456)對被切剖面拍照,拍照時使剖面正對鏡頭。圖片通過ENVI 4.7(Research System Inc.,美國)選擇感興趣區(qū)域進行處理,計算褐變面積比(褐變面積占整個剖面面積的比例)。
1.4特征波段選擇方法
采用隨機青蛙算法(random-frog)進行特征波長選擇。隨機青蛙算法是一種最新的變量選擇方法,由LI等[16]提出并用于疾病的基因表達數(shù)據(jù)分析。該方法是一種類似于可逆跳轉(zhuǎn)馬爾科夫鏈蒙特卡洛(reversible jump Markov chain Monte Carlo, RJMCMC)的算法,通過在模型空間中模擬一條服從穩(wěn)態(tài)分布的馬爾科夫鏈,來計算每個變量的被選概率,從而用于評價變量的重要性[16]。本研究中,將隨機青蛙算法與PLS-LDA算法相結(jié)合,探尋褐變板栗識別的特征波段,其具體步驟為[17]:1)初始化參數(shù):n為迭代次數(shù),設(shè)為10 000;q為初始變量集v0的變量個數(shù),為1~1 557任意數(shù),默認值為2;θ為正態(tài)分布方差控制因子,默認值為0.3;ω為比例因子,用于控制候選變量個數(shù),默認值為3;η是否接受建模結(jié)果差于v0的新變量集V*的概率上界,默認值為0.1。2)隨機選擇包含q個變量的初始變量集合為v0,并定義包含所有1 557個變量的集合為v。3)從均值為q,標準偏差為θq的正態(tài)分布中產(chǎn)生隨機數(shù)并就近圓整為q*,分情況構(gòu)造一個含有q*個變量的候選變量子集v*:①若q*=q,則v*= v;②若q*<q,先用變量集v0建立PLS-LDA模型,得到各變量回歸系數(shù),然后將回歸系數(shù)絕對值最小的q-q*個變量從v0中去掉,則剩余的q*個變量構(gòu)成v*;③若q*>q,先從v-v0中隨機選擇ω(q*-q)個變量,構(gòu)成新變量集t,然后將t與v0組合建立PLS-LDA模型,得到每個變量的回歸系數(shù),隨后將回歸系數(shù)絕對值最大的q*個變量挑選出來構(gòu)成v*。4)v*確定后,要決定是否接受v*。分別計算用v0和v*建立PLS-LDA模型的預(yù)測誤差,記為e0和e*。若e*≤e0,接受v*并令v1=v*;否則,以ηErr0/Err*的概率接受v*且令v1=v*。用v1代替v0,返回2)進行下一次迭代,直到完成n次迭代。5)n次迭代后,得到n個變量子集。變量i的被選頻次記為ni,依公式計算該變量的選擇概率Pi:
式(1)中:i=1,2,…,1 557。變量對模型越重要,其被選概率越大,因此,可將所有變量的被選概率排序,選出概率較大的一些變量作為特征波長。
1.5建模方法
采用PLS-LDA和LSSVM建立栗仁褐變識別模型。PLS-LDA是偏最小二乘法與線性判別分析方法的有效結(jié)合,該方法先利用PLS算法對光譜矩陣和類別屬性進行分解,得到光譜矩陣的得分向量,然后將得分向量與類別屬性做線性判別分析,建立判別模型[18]。如利用n個PLS得分向量建立PLS-LDA模型,則其判別方程為:
式(2)中:s=[s1,s2,…,sn]為PLS得分向量,α1,α2,…,αn是判別系數(shù),c為常數(shù)。
在PLS-LDA建模過程中,采用蒙特卡洛交互檢驗[19]來確定最優(yōu)主成分數(shù)。蒙特卡洛交互檢驗的取樣比率為0.75,模擬次數(shù)為2 000。LS-SVM是對經(jīng)典支持向量機(SVM)的一種改進,該方法采用最小二乘線性系統(tǒng)作為損失函數(shù),以求解一組線性方程代替經(jīng)典SVM中較為復雜的2次規(guī)劃問題,從而降低了計算復雜性,具有學習速度快,泛化性好等特點[20]。該方法用非線性映射將輸入?yún)?shù)映射到高維特征空間,在此空間構(gòu)造最優(yōu)決策函數(shù),并基于結(jié)構(gòu)風險最小化原則確定決策函數(shù)參數(shù)[21]。該方法中的核函數(shù)是高維特征空間的內(nèi)積,只要滿足Mercer條件的函數(shù)均可作為核函數(shù),其常用的4個核函數(shù)中,徑向基核函數(shù)(RBF)應(yīng)用最廣泛,故該文采用RBF核函數(shù)作為LS-SVM分類器的核函數(shù),并以留一交叉驗證法結(jié)合網(wǎng)格搜索(grid search)策略來確定懲罰因子c以及RBF核函數(shù)參數(shù)g。
1.6模型評價
模型的評價指標為敏感性、特異性、預(yù)測總正確率。其定義如式(3)~式(5)所示。
式(3)~式(5)中:tP,tN,fP,fN分別表示真陽性、真陰性、假陽性和假陰性。試驗中規(guī)定陽性和陰性分別代表褐變板栗和正常板栗。敏感性、特異性以及總正確率越高,說明所建模型性能越好。
所有程序均在Matlab 2010a(The MathWorks Inc.,美國)上運行實現(xiàn)。
2.1栗仁褐變的評價結(jié)果
試驗共使用板栗樣本180個。表1給出了試樣的形態(tài)學參數(shù)。從表1中可以看出:試樣的各項形態(tài)學指標均在正常的分布范圍內(nèi),具有一定的代表性。通過切剖觀察,最終確認110個樣本褐變,褐變面積比例范圍為0.16%~49.43%。圖1為典型樣本的剖面圖。圖2為110個褐變樣本的褐變程度分布。從圖1和圖2中可以看出:試驗中包含了不同褐變程度的樣本且褐變程度范圍較廣,因此,試樣的光譜數(shù)據(jù)具有很強的代表性。將所有褐變樣本依據(jù)褐變面積比梯度以2∶1比例進行劃分,而正常栗仁樣本則以2∶1比例隨機劃分,最終組成校正集的正常、褐變樣本數(shù)分別為47個和73個,組成測試集的正常、褐變樣本數(shù)分別為23個和37個。
表1 樣本的形態(tài)學參數(shù)描述Table 1 Morphological properties of the samples
圖1 板栗樣本Figure 1 Chestnut samples
圖2 栗仁褐變樣本的褐變程度分布圖Figure 2 Histogram of brown chestnut in various degrees
圖3 栗仁原始光譜Figure 3 Spectra of peeled chestnut
2.2栗仁的光譜分析
圖3為正常栗仁和不同程度褐變栗仁的原始光譜。從圖3中可以看出:栗仁光譜在1 200.00,1 450.00和1 940.00 nm處均有明顯的吸收峰,在1 780.00 nm處略有波峰。在栗仁譜圖中,1 200.00 nm左右區(qū)域為甲基和亞甲基中C—H鍵二級倍頻的特征吸收譜帶,1 450.00 nm附近區(qū)域包含了水分和糖分中O—H基團伸縮振動的一級倍頻信息,1 940.00 nm為水分中O—H鍵伸縮振動和彎曲振動的組合頻帶特征譜帶,1 780.00 nm則分別反映了糖分中C—H鍵的一級倍頻和蛋白質(zhì)中N—H鍵的組合頻信息[22]。從圖3中還可以看出:不同褐變程度的板栗的原始光譜圖趨勢基本相似,沒有太大的差別,即隨著褐變程度的增加,吸收峰高沒有呈現(xiàn)出規(guī)律性的變化,難以從圖譜的表面提取褐變果仁的特征指紋。因此,需要進一步結(jié)合化學計量學方法對光譜進行分析處理,以便建立板栗果仁褐變的鑒別模型。
2.3光譜預(yù)處理方法的確定
受儀器、樣品以及光譜采集環(huán)境等因素的影響,近紅外光譜中常出現(xiàn)噪聲、譜圖基線漂移和平移等現(xiàn)象,為了消除上述因素的影響,應(yīng)對原始光譜(none)進行預(yù)處理。采用標準正態(tài)變量變換(SNV),去趨勢變換(detrend),一階導數(shù)(FD),二階導數(shù)(SD),多元散射校正(MSC)等方法對原始光譜進行預(yù)處理并采用PLS-LDA建立判別模型,結(jié)果如表2所示。由表2可知:SNV預(yù)處理建立的PLS-LDA模型最優(yōu),該模型對校正集、測試集的敏感性分別為0.90以及0.92,均明顯高于一階導數(shù)、二階導數(shù),多元散射校正等光譜預(yù)處理方法的模型;對校正集的特異性均為1.00,也高于一階導數(shù)、二階導數(shù),多元散射校正等光譜預(yù)處理方法的模型;對校正集、測試集樣本識別的準確率分別為94.13%和95.00%,高于其他幾種光譜預(yù)處理方法。這表明SNV預(yù)處理有利于減弱因受儀器、樣品以及光譜采集環(huán)境等因素引起的噪聲干擾,可以增強模型的預(yù)測能力和穩(wěn)健性。因此,在下文均采用SNV處理后的光譜進行分析。
表2 不同光譜預(yù)處理下全波段PLS-LDA模型的結(jié)果Table 2 Classification results based on PLS-LDA with different preprocessing methods and full wavelengths
2.4特征波長的選擇
采用隨機青蛙算法(random-frog)對全波段光譜進行特征變量選擇。由于隨機青蛙算法是基于蒙特卡洛(MC)思想,每次運行的結(jié)果略有差異。為了減少隨機因素的影響,需多次運行,并對結(jié)果進行統(tǒng)計。該研究共運行隨機青蛙算法100次,以100次運行結(jié)果的平均值作為最終特征波長選擇的依據(jù),其結(jié)果如圖4所示。由圖4可知:大部分變量的被選擇概率都比較小,只有小部分變量的概率比較大。將所有變量的被選概率進行排序,以0.1為閾值,選擇出概率最大的前23個變量作為特征波長,依次為1 078.06,1 028.45,1 029.68,1 081.21,1 077.61,1 183.90,1 029.27,1 020.36,1 080.76,1 145.20,1 183.36,1 124.34,1 119.97,1 032.96,1 121.42,1 032.96,1 098.62,1 028.05,1 162.66,1 120.94,1 145.71和1 182.82 nm,如圖3所示。在1 020.00~1 200.00 nm波段范圍內(nèi),1 020.00 nm附近為蛋白質(zhì)中N—H鍵伸縮振動的一級倍頻帶,1 030.00,1 060.00 nm附近為胺類中N—H鍵伸縮振動的二級倍頻帶,1 080.00 nm為芳香烴中C—H,C—C鍵伸縮振動的一級倍頻帶,1 143.00nm為芳烴中C—H鍵伸縮振動的二級倍頻帶,1 152.00,1 195.00 nm為甲基中C—H鍵伸縮振動的二級倍頻帶[22]。與板栗果仁褐變直接相關(guān)的物質(zhì)主要是有機物酚、酸、醌、蛋白質(zhì)、氨基酸等。這些物質(zhì)都與C—H鍵、N—H鍵以及O—H鍵相關(guān)。因此,所選特征波長可以反映板栗栗仁褐變特性。從圖3中還可以看出:所選特征波段避開了水分的強吸收峰,減少了水分因素對栗仁褐變識別的干擾。
圖4 100次隨機青蛙算法的平均概率Figure 4 Selection probability of each wavelength averaged over 100 runs of random-frog algorithm
2.5模型的建立與比較
將得到的23個特征波長(effective wavelengths, EWs)下的光譜數(shù)據(jù)作為輸入,分別采用PLS-LDA以及LS-SVM建立褐變板栗的識別模型。表3給出了采用23個特征波長的光譜數(shù)據(jù)所建模型的結(jié)果。為了突出特征波長所建模型的優(yōu)越性,表3還給出了采用全波段(full wavelengths, FWs)光譜所建模型的結(jié)果。從表3中可以看出:23個特征波長數(shù)據(jù)所建EWs-PLS-LDA模型對校正集的敏感性(0.92)高于FWs -PLS-LDA模型的同類指標(0.90),但特異性(0.98)低于FWs-PLS-LDA模型的同類指標(1.00),識別正確率相同,均為94.17%;當模型用于測試集數(shù)據(jù)時,EWs-PLS-LDA模型的敏感性(0.89)低于FWs-PLSLDA模型的同類指標(0.92),識別正確率也降低為93.33%。FWs-PLS-LDA模型使用1 557個變量,模型的主因子數(shù)為16,遠多于特征波段模型的23個變量和9個主因子數(shù),模型較為復雜。23個特征波長數(shù)據(jù)所建EWs-LS-SVM模型,無論是校正集還是測試集,其敏感性(0.92/0.92),特異性(1.00/1.00),識別正確率(95.00%/95.00%)均高于FWs-LS-SVM模型的同類指標。該模型與FWs-PLS-LDA模型相比,對校正集的預(yù)測結(jié)果更優(yōu)。相比于EWs-PLS-LDA模型,EWs-LS-SVM模型結(jié)果略優(yōu),原因可能是PLSLDA只能處理栗仁光譜中的線性相關(guān)關(guān)系,而LS-SVM則可以利用低維數(shù)據(jù)中的非線性特性,從而獲得較優(yōu)的預(yù)測結(jié)果。
表3 不同建模方法的結(jié)果Table 3 Results for different methods
表3還給出了不同建模方法建模和預(yù)測所用時間(模型建立環(huán)境:inter(R)core(TM)i5-3210 CPU@2.5 GHz RAM 4.00 GB Windows 7旗艦版64 Bit)。從表3中可以看出:不管是PLS-LDA方法還是LS-SVM方法,采用23個特征波長建模時間以及預(yù)測時間都要短于全波段模型的相應(yīng)時間,其中,23個波段光譜數(shù)據(jù)所建EWs-LS-SVM模型時間、預(yù)測時間最短,僅為3.09和9.55 ms。綜上所述,通過隨機青蛙算法進行特征波長選擇,并且采用LS-SVM建立褐變板栗的識別模型,不僅降低了模型的復雜度,而且提高了識別準確率和識別速度。
上述結(jié)果表明:應(yīng)用近紅外光譜技術(shù)結(jié)合化學計量學方法可以快速準確的對褐變板栗進行識別,為板栗儲藏、深加工等環(huán)節(jié)中板栗品質(zhì)的快速無損檢測提供了重要的參考,可進一步研究不同品種,不同產(chǎn)地等條件下的板栗樣本,從而提高模型的穩(wěn)定性和適用性,以便在實際應(yīng)用中取得滿意的結(jié)果。
采用近紅外光譜技術(shù)對褐變板栗栗仁進行快速無損檢測。確定最優(yōu)的光譜預(yù)處理方法為標準正態(tài)變量變換(SNV),運用隨機青蛙算法提取代表光譜有效信息的23個特征波長,并作為輸入變量建立褐變栗仁識別PLS-LDA和LS-SVM模型。23個特征波長所建LS-SVM模型性能最優(yōu),校正集和測試集的敏感性、特異性和識別正確率相同,分別為0.92,1.00和95.00%。研究結(jié)果表明:采用隨機青蛙算法提取特征波長并采用非線性的LS-SVM方法建立栗仁褐變檢測模型是可行的,不僅能簡化模型,提高識別速度,而且能夠提高識別準確率。
[1]黃濤,李小昱,彭毅,等.基于近紅外光譜的淡水魚新鮮度在線檢測方法研究[J].光譜學與光譜分析,2014,34(10):2732 - 2736.HUANG Tao, LI Xiaoyu, PENG Yi, et al.Freshwater fish freshness on-line detection method based on near-infrared spectroscopy[J].Spectrosc Spectral Anal, 2014, 34(10): 2732 - 2736.
[2]湯修映,牛力釗,徐楊,等.基于可見/近紅外光譜技術(shù)的牛肉含水率無損檢測[J].農(nóng)業(yè)工程學報,2013,29 (11):248 - 254.TANG Xiuying, NIU Lizhao, XU Yang, et al.Nondestructive determination of water content in beef using visible/nearinfrared spectroscopy[J].Trans Chin Soc Agric Eng, 2013, 29(11): 248 - 254.
[3]LI Guanghui, REN Yamei, REN Xiaolin, et al.Non-destructive measurement of fracturability and chewiness of apple by FT-NIRS[J].J Food Sci Tech, 2015, 52(1): 258 - 266.
[4]LIU Cong, YANG S X, DENG Lie.Determination of internal qualities of Newhall navel oranges based on NIR spectroscopy using machine learning[J].J Food Eng, 2015, 161: 16 - 23.
[5]RADY A M, GUYER D E.Evaluation of sugar content in potatoes using NIR reflectance and wavelength selection techniques[J].Postharv Biol Technol, 2015, 103: 17 - 26.
[6]介鄧飛,謝麗娟,饒秀勤,等.近紅外光譜變量篩選提高西瓜糖度預(yù)測模型精度[J].農(nóng)業(yè)工程學報,2013,29 (12):264 - 270.JIE Dengfei, XIE Lijuan, RAO Xiuqin, et al.Improving accuracy of prediction model for soluble solids content of watermelon by variable selection based on near-infrared spectroscopy[J].Trans Chin Soc Agric Eng, 2013, 29(12): 264 - 270.
[7]周竹,李小昱,李培武,等.基于GA-LSSVM和近紅外傅里葉變換的霉變板栗識別[J].農(nóng)業(yè)工程學報,2011,27(3):331 - 335.ZHOU Zhu,LI Xiaoyu, LI Peiwu, et al.Near-infrared spectral detection of moldy chestnut based on GA-LSSVM and FFT[J].Trans Chin Soc Agric Eng, 2009, 25(8): 131 - 135.
[8]周竹,劉潔,李小昱,等.霉變板栗的近紅外光譜和神經(jīng)網(wǎng)絡(luò)方法判別[J].農(nóng)業(yè)機械學報,2009,40(增刊1):109 - 112.ZHOU Zhu, LIU Jie, LI Xiaoyu, et al.Discrimination of moldy Chinese chestnut based on artificial neural network and near infrared spectra[J].Trans Chin Soc Agric Mach, 2009, 40(supp 1): 109 - 112.
[9]LIU Jie, LI Xiaoyu, LI Peiwu, et al.Nondestructive detection of moldy chestnut based on near infrared spectroscopy [J].Afr J Agric Res, 2010, 5(23): 3213 - 3218.
[10]MOSCETTI R, HAFF R P, SARANWONG S, et al.Nondestructive detection of insect infested chestnuts based on NIR Spectroscopy[J].Postharvest Biol Technol, 2014, 87: 88 - 94.
[11]MOSCETTI R, MONARCA D, CECCHINI M, et al.Detection of mold-damaged chestnuts by near-infrared spectroscopy[J].Postharvest Biol Technol, 2014, 93: 83 - 90.
[12]劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測方法[J].農(nóng)業(yè)工程學報,2010,26(2):338 -341.LIU Jie, LI Xiaoyu, LI Peiwu, et al.Determination of moisture in chestnuts using near infrared spectroscopy[J].Trans Chin Soc Agric Eng, 2010, 26(2): 338 - 341.
[13]LIU Jie, LI Xiaoyu, WANG Wei, et al.Measurement of protein content in chestnuts using near infrared spectroscopy [J].J Chem Pharm Res, 2014, 6(6): 938 - 941.
[14]傅誼,張擁軍,陳華才,等.基于偏最小二乘法的板栗近紅外光譜分析模型的建立[J].食品科技,2012,37 (5):42 - 45.FU Yi,ZHANG Yongjun,CHEN Huacai,et al.Establishment of NIR models for components determination in fresh chestnu[J].Food Sci Technol, 2012, 37(5): 42 - 45.
[15]褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長選擇方法進展與應(yīng)用[J].化學進展,2004,16 (4):528 - 542.CHU Xiaoli, YUAN Hongfu, LU Wanzhen.Progress and application of spectral data pretreatment and wavelength se-lection methods in NIR analytical technique[J].Progr Chem, 2004, 16(4): 528 - 542.
[16]LI Hongdong, XU Qingsong, LIANG Yizeng, et al.Random Frog: An efficient reversible jump Markov Chain Monte Carlo-like approach for variable selection with applications to gene selection and disease classification[J].Anal Chim Acta, 2012, 740: 20 - 26.
[17]李洪東.廣義灰色分析體系建模的基本問題及其模型集群分析研究[D].長沙:中南大學,2012.LI Hongdong.Fundamental Problems of Generalized Grey Analytical Systems and Their Research of Model Population Analysis[D].Changsha: Central South University, 2012.
[18]周竹,李小昱,高海龍,等.漫反射和透射光譜檢測馬鈴薯黑心病的比較[J].農(nóng)業(yè)工程學報,2012,28 (11):237 - 242.ZHOU Zhu, LI Xiaoyu, GAO Hailong, et al.Comparison of diffuse reflection and transmission mode of visible/near infrared spectroscopy for detecting black heart of potato[J].Trans Chin Soc Agric Eng, 2012, 28(11): 237 - 242.
[19]LI Hongdong, LIANG Yizeng, XU Qingsong, et al.Model population analysis for variable selection[J].J Chemometr, 2010, 24(7/8): 418 - 423.
[20]SUYKENS J A K, de BRABANTER J, LUKAS L, et al.Weighted least squares support vector machines: robustness and sparse approximation[J].Neurocomputing, 2002, 48(1/4): 85 - 105.
[21]顧燕萍,趙文杰,吳占松.最小二乘支持向量機的算法研究[J].清華大學學報:自然科學版,2010,50(7):1063 - 1066.GU Yanping, ZHAO Wenjie, WU Zhansong.Least squares support vector machine algorithm[J].J Tsinghua Univ Sci & Tech, 2010, 50(7): 1063 - 1066.
[22]嚴衍祿.近紅外光譜分析基礎(chǔ)與應(yīng)用[M].北京:中國輕工業(yè)出版社,2005:31 - 39.
Chestnut browning detected with near-infrared spectroscopy and a random-frog algorithm
ZHENG Jian1,2, ZHOU Zhu3,4,5, ZHONG Shanmin1,2, ZENG Songwei3,4,5
(1.School of Agriculture and Food Science, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 2.The Key Laboratory for Quality Improvement of Agricultural Products of Zhejiang Province, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 3.School of Information Engineering, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 4.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 5.Research Center for Smart Agriculture and Forestry, Zhejiang A & F University, Lin’an 311300, Zhejiang, China)
Abstract:To develop a calibration model for rapid, accurate and nondestructive detection of chestnut browning with peeled chestnut Castanea mollissima by using near infrared spectroscopy technology.Seventy normal chestnuts and 110 browning chestnuts were prepared, and their diffuse reflectance spectrums were collected in the wavelength range from 1 000.00 to 2 500.00 nm.Spectral pretreatment methods, including standard normal variate(SNV), multiplication scattering correction(MSC), first derivative(FD), second derivative(SD), and detrend, were used and compared first.Then random-frog algorithm was applied to select effective wavelengths (EWs)from the SNV pretreated spectrum.Afterward, a partial least squares-linear discriminant analysis(PLSLDA)and a least squares-support vector machine(LS-SVM)model were established to classify the browningbook=323,ebook=144chestnuts based on EWs, and the results were compared based on sensitivity, specificity and accuracy.For the validation set, the sensitivity, specificity and accuracy obtained by EWs-LS-SVM were 0.92, 1.00 and 95.00%, respectively.The results were better than those of full-PLS-LDA model,full-LS-SVM model and EWs-PLSLDA model.Also, the random-frog algorithm effectively selected important wavelengths and simplified the discrimination model improving precision and recognition speed.The overall results demonstrate that random-frog algorithm is a powerful tool to select the efficient variables, and EWs-LS-SVM is excellent for the spectral calibration.[Ch, 4 fig.3 tab.22 ref.]
Key words:cash forestry; NIR spectroscopy; browning; random-frog algorithm; least squares-support vector machines; partial least squares-linear discriminant analysis; chestnut
作者簡介:鄭劍,講師,博士研究生,從事農(nóng)產(chǎn)品儲藏加工與品質(zhì)檢測研究。E-mail:zhengjian622@126.com。通信作者:周竹,講師,博士,從事智能化檢測與控制技術(shù)研究。E-mail:zhouzhu@zafu.edu.cn
基金項目:浙江省自然科學基金資助項目(Y3110450,LQ13F050006);浙江農(nóng)林大學科研發(fā)展基金資助項目(2008FR053,2012FR085);浙江省木本糧油產(chǎn)業(yè)科技創(chuàng)新團隊項目(2011R50030-2)
收稿日期:2015-04-16;修回日期:2015-09-07
doi:10.11833/j.issn.2095-0756.2016.02.019
中圖分類號:S123; S664.2
文獻標志碼:A
文章編號:2095-0756(2016)02-0322-08