秦 楷,陳 剛,張劍一, ,傅霞萍*
1.浙江理工大學(xué)機械與自動控制學(xué)院,浙江 杭州 310018 2.德菲洛(杭州)科技有限公司,浙江 杭州 310014
蘋果富含礦物質(zhì)、維生素、多酚及黃酮類等營養(yǎng)物質(zhì),營養(yǎng)價值高,口味酸甜,是很受消費者喜愛的一種水果。蘋果種植過程中會出現(xiàn)很多病癥,霉心病(又稱心腐病)就是其中一種,該病由多種病原菌引起,病菌主要通過花萼傳播危害果實健康,在發(fā)病初期會在蘋果心室附近出現(xiàn)褐色斑點,惡化后會變成白色或粉色霉?fàn)钗?,較為嚴重的會導(dǎo)致心室腐爛并逐步向外擴散[1]。感染霉心病的蘋果一般是不能食用的,因此在銷售蘋果前需要剔除病果。傳統(tǒng)的霉心病判別方法往往結(jié)合經(jīng)驗進行破壞性抽樣,費時費力且準(zhǔn)確率低不適合當(dāng)前水果生產(chǎn)銷售的實際。尋找一種水果內(nèi)部病變的無損檢測方法以及建立水果內(nèi)部品質(zhì)快速、準(zhǔn)確的智能分選線符合目前市場需求,近年來行業(yè)內(nèi)越來越多的企業(yè)已經(jīng)陸續(xù)開始做多品類、大規(guī)模、針對內(nèi)在品質(zhì)的水果分級。
可見近紅外光譜分析技術(shù)是一項高效、低成本、無污染的無損檢測技術(shù),已經(jīng)廣泛應(yīng)用于農(nóng)業(yè)、食品業(yè)、醫(yī)藥業(yè)及礦業(yè)等各行各業(yè)。近年來,國內(nèi)外不少學(xué)者也利用可見近紅外光譜分析技術(shù)開展水果病害的快速無損檢測研究,其中涉及內(nèi)部病變檢測的如:Khatiwada等[2]利用該技術(shù)對在大氣中儲藏的蘋果內(nèi)部褐變病癥進行了預(yù)測,采用LDA,PLS-DA,SVM和邏輯回歸4種判別方法,結(jié)果顯示PLS-DA效果最佳;Shenderey等[3]在現(xiàn)有的微型光譜分析儀的基礎(chǔ)上,研制了一套適合于在線近紅外光譜測量的儀器,采用偏最小二乘回歸(PLSR)方法在線檢測蘋果霉心?。籗un等[4]利用可見近紅外光譜在600~904 nm范圍內(nèi),通過相關(guān)分析選取兩個特征波段用于判別褐心梨;Mogollonca等[5]采用偏最小二乘和支持向量機方法建立了定性和定量模型,預(yù)測“Cripps Pink”蘋果內(nèi)部是否褐變及褐變面積;Zhou等[6]提出了一種基于透光光譜的蘋果霉變快速無損檢測方法, 采用人工神經(jīng)網(wǎng)絡(luò)(ANN)和SVM兩種分類算法建立模型,利用遺傳算法(GA)對模型參數(shù)進行優(yōu)化,判定蘋果核是否霉變;采用透射光譜區(qū)分霉心病健康果和病果時果徑會對預(yù)測結(jié)果產(chǎn)生影響,為解決這一問題,Tian等[7]提出了一種基于果實大小的光譜校正方法,通過計算透射光在蘋果內(nèi)部的消光系數(shù)對透射譜進行了修正,從而得到更好的判別效果。Hu等[8]通過連續(xù)投影算法(SPA)選擇出區(qū)分健康蘋果和霉心病蘋果的最佳波長,將提取的波長作為反向傳播人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)的輸入建立判別模型。
在上述研究基礎(chǔ)上,本研究針對蘋果在線檢測中不同擺放姿態(tài)對光譜采集的影響,開展了果實姿態(tài)對霉心病檢測的影響分析,通過采用不同算法建立多種判別模型進行對比分析,實現(xiàn)蘋果霉心病光譜在線檢測的擺放姿態(tài)及建模方法優(yōu)化。
樣品是產(chǎn)自中國陜西省洛川縣的紅富士蘋果,在洛川當(dāng)?shù)剡x購后快遞運往實驗室。剔除有明顯外部損傷的果實后,最終選出96個蘋果樣品用于本次檢測。測量所有樣品外觀參數(shù)后用標(biāo)簽標(biāo)注,放置在實驗室內(nèi)等待第二天的檢測。
采用帶暗箱的傳送裝置,將蘋果樣本置于托盤上方,由傳送帶輸送至檢測位置,鹵素光源(12 V,100 W)布置在傳送帶兩側(cè),透射光由下方的檢測探頭收集,與之連接的光纖將信號傳輸至微型可見近紅外光譜儀(QE65Pro,Ocean Insight,F(xiàn)L,USA),整個檢測單元置于暗箱中以避免環(huán)境光影響,暗箱兩側(cè)留有樣品進出口。光譜儀通過USB數(shù)據(jù)線連接電腦,使用SpectraSuite軟件(Ocean Insight,F(xiàn)L,USA)查看和存儲光譜。為考察蘋果樣品擺放姿態(tài)對檢測結(jié)果的影響,每個樣品采集4次光譜,分別對應(yīng)4種擺放姿態(tài):豎放柄朝上、豎放柄朝下、橫放柄朝輸送方向和橫放柄垂直輸送方向。96個樣品對應(yīng)4種擺放姿態(tài)共獲得384條光譜。
光譜采集完成后,將蘋果沿果柄蒂軸對半切開觀察心室是否霉變(如圖1所示),將健康果歸于1類、霉心病果歸于2類。基于獲取的光譜及有損檢測獲得的霉心病果判據(jù),開展蘋果霉心病的判別分析,取2/3樣本作為校正集、1/3樣本作為預(yù)測集。采用線性判別分析[9]、馬氏距離判別[10]、偏最小二乘判別[11-12]、K近鄰法[13]、極限學(xué)習(xí)機[14]和支持向量機[15]對4種擺放姿態(tài)分別建立判別模型并對比判別效果(以判別準(zhǔn)確率為指標(biāo))。數(shù)據(jù)分析主要采用MATLAB(R2016a,The MathWorks,Natick,MA,USA)軟件開展。
圖1 健康果(左)和霉心病果(右)心室對比示意圖
經(jīng)統(tǒng)計,96個樣品中包含78個健康果和18個霉心病果。樣品外部參數(shù)指標(biāo)如表1所示。
表1 健康果和霉心病果的外觀參數(shù)統(tǒng)計
基于所采集的全部樣品4種擺放姿態(tài)的透射光譜,分別計算健康果和霉心病果4種擺放姿態(tài)的平均透射光譜,結(jié)果如圖2所示,可以發(fā)現(xiàn)在400~600 nm 間存在較高的噪聲,而900 nm之后樣品的透射率幾乎為零,因此選取600~900 nm的透射光譜進行分析。4種擺放姿態(tài)的健康果的平均透射光譜在600~900 nm波段內(nèi)整體都高于病果的平均透射光譜,尤其是在710 nm附近健康果的透射光譜峰值明顯高于病果,可能是因為病果果實內(nèi)部霉變組織的吸收較大所致。
圖2 健康果和病果4種擺放姿態(tài)下的平均透射光譜
基于600~900 nm的透射光譜信息,結(jié)合主成分分析提取的主成分(PCs)建立的LDA,MD和KNN三種判別模型,其中KNN算法中k=7,表示對于一個需要預(yù)測的輸入向量x,我們只需要在訓(xùn)練數(shù)據(jù)集中尋找7個與x最近的向量的集合,然后把x的類別預(yù)測為這7個樣本中類別數(shù)最多的那一類。表2顯示三種判別模型提取的主成分數(shù)以及訓(xùn)練集和預(yù)測集的判別效果,4種擺放姿態(tài)的LDA判別模型預(yù)測集的判別準(zhǔn)確率最高的是豎放柄朝上擺放為90.63%,有3個健康果被誤判為病果,整體來看LDA模型豎放柄朝上擺放和豎放柄朝下擺放的判別效果明顯優(yōu)于橫放柄朝輸送方向和橫放柄垂直輸送方向擺放時的效果;MD模型4種擺放姿態(tài)的判別效果差別不大,預(yù)測集判別準(zhǔn)確率都達到87.50%,雖然MD模型對健康果沒有產(chǎn)生誤判但其對病果的識別效果較差;KNN模型中預(yù)測集的判別準(zhǔn)確率最高的是豎放柄朝下的90.63%,相對判別效果較差的橫放柄朝輸送方向擺放和橫放柄垂直輸送方向擺放的預(yù)測集判別準(zhǔn)確率也可達到80%以上。
表2 基于4種擺放姿態(tài)透射光譜(600~900 nm)提取主成分后的線性判別分析(LDA)、馬氏距離(MD)和K近鄰法(KNN)三種判別模型結(jié)果的比較
通過對LDA,MD和KNN三種判別模型的比較,從表2中各項數(shù)據(jù)可以看出LDA模型和KNN模型豎放柄朝上擺放和豎放柄朝下擺放的判別效果相比其他兩種擺放姿態(tài)都更好,在三種判別模型中效果最佳的是LDA模型的豎放柄朝上擺放。
對600~900 nm的透射光譜進行中心化預(yù)處理后建立的PLS-DA模型結(jié)果如表3所示,當(dāng)蘋果豎放柄朝上擺放和豎放柄朝下擺放檢測時預(yù)測集的判別準(zhǔn)確率最高為93.75%,蘋果橫放柄垂直輸送方向進行檢測所建立的判別模型效果相對其他三種擺放姿態(tài)較差。
表3 基于4種擺放姿態(tài)透射光譜(600~900 nm)的偏最小二乘判別分析(PLS-DA)結(jié)果
600~900 nm的透射光譜經(jīng)歸一化處理后,使用ELM和SVM兩種機器學(xué)習(xí)算法建立的判別模型結(jié)果如表4所示,對于ELM模型選用sigmoid函數(shù)為極限學(xué)習(xí)機的激活函數(shù)并設(shè)置隱含層神經(jīng)元個數(shù)為20,當(dāng)蘋果豎放柄朝上、橫放柄朝輸送方向和橫放柄垂直輸送方向的預(yù)測集判別準(zhǔn)確率都為90.63%,有2個病果和1個健康果被錯判,其余三種擺放姿態(tài)的預(yù)測集的判別準(zhǔn)確率也都高于85%;建立SVM模型時利用交叉驗證的方法獲得最優(yōu)的懲罰參數(shù)c和核函數(shù)的參數(shù)g,通過表4可知,果柄朝上擺放時預(yù)測集判別準(zhǔn)確率最高為96.88%,預(yù)測集只有1個病果被錯判。
表4 基于4種擺放姿態(tài)透射光譜(600~900 nm)的極限學(xué)習(xí)機(ELM)和支持向量機(SVM)兩種判別模型的比較
通過對上述6種判別模型預(yù)測集判別效果的匯總結(jié)果如圖3所示,LDA和SVM模型的4種擺放姿態(tài)的預(yù)測集判別率最佳的是豎放柄朝上擺放,MD和ELM模型的4種擺放姿態(tài)的判別效果接近,KNN模型除了橫放柄朝輸送方向擺放時判別效果較差其余3種擺放姿態(tài)的預(yù)測集判別率都超過87%,PLS-DA模型的最佳擺放姿態(tài)為豎放柄朝上擺放和豎放柄朝下擺放,整體來看豎放柄朝上擺放在不同的判別模型中都有不錯的判別效果,這可能與在線檢測裝置中光源和檢測探頭的位置布置有關(guān)。
圖3 預(yù)測集的6種判別模型效果(a)及病果錯判為健康果個數(shù)(b)對比圖
從建模方法來看PLS-DA的判別效果優(yōu)于其他方法,其中PLS-DA模型的豎放柄朝上和豎放柄朝下的判別準(zhǔn)確率都為93.75%,通過6種判別模型預(yù)測集病果錯判為健康果個數(shù)結(jié)果對比,PLS-DA判別模型的豎放柄朝上的擺放姿態(tài)沒有誤判果,可以很好的識別出預(yù)測集中所有的病果。
蘋果霉心病PLS-DA判別模型的變量投影重要性指標(biāo)(VIP)得分值分布如圖4所示,在710 nm附近得分值達到峰值,因此進一步選擇690~720 nm作為特征波段建立PLS-DA判別模型,由表5所示結(jié)果可知,豎放柄朝上和豎放柄朝下時預(yù)測集的判別準(zhǔn)確率為93.75%。4種擺放姿態(tài)在690~720 nm波段范圍的預(yù)測集判別準(zhǔn)確率均大于80%,這為采用LED燈代替鹵素?zé)魴z測蘋果霉心病的可行性提供了依據(jù)。
圖4 PLS-DA判別模型不同波長的VIP得分值分布
表5 基于4種擺放姿態(tài)透射光譜(690~720 nm)的偏最小二乘判別分析(PLS-DA)結(jié)果
基于600~900 nm波段4種擺放姿態(tài)的透射光譜提取主成分后建立的LDA,MD和KNN判別模型都有著不錯的判別效果,其中LDA模型對應(yīng)豎放柄朝上擺放姿態(tài)的預(yù)測集判別準(zhǔn)確率最佳為90.63%,LDA和KNN模型豎放柄朝上和豎放柄朝下的判別效果都優(yōu)于橫放柄朝輸送方向和橫放柄垂直輸送方向?;?00~900 nm建立的PLS-DA判別模型4種擺放姿態(tài)的預(yù)測集判別準(zhǔn)確率都大于80%,并且豎放柄朝上和豎放柄朝下的判別準(zhǔn)確率都是大于其余兩種擺放姿態(tài)。還建立了ELM和SVM兩種機器學(xué)習(xí)算法判別模型,從預(yù)測集判別準(zhǔn)確率和病果錯判個數(shù)觀察效果最佳都是豎放柄朝上的姿態(tài)。
綜合以上建立的6種判別模型來看,豎放柄朝上擺放在不同的判別模型中都有不錯的判別效果,這可能與在線檢測裝置中光源和檢測探頭的位置有關(guān)。從建模方法來看,4種擺放姿態(tài)整體判別效果最好的PLS-DA模型,再通過其VIP得分值提取特征波段690~720 nm后重新建立PLS-DA判別模型,豎放柄朝上和豎放柄朝下的預(yù)測集判別準(zhǔn)確率都達到93.75%,其中豎放柄朝上擺放檢測到的光譜建立的模型篩選病果的能力達到最佳,全部病果都能被判別出,因此豎放柄朝上擺放檢測是一種合理有效的蘋果霉心病在線檢測姿態(tài)。