桂江生,顧敏,吳子?jì)?,包曉?/p>
(浙江理工大學(xué)信息學(xué)院,杭州310018)
西蘭花(Brassica oleracea L.var.italic Planch.)又名青花菜,不僅所含營(yíng)養(yǎng)成分十分全面,還具有顯著的防癌抗癌功效,是人們?nèi)粘V饕秤玫氖卟酥籟1]。西蘭花是浙江省的特色蔬菜,不僅滿足國(guó)內(nèi)的消費(fèi)需求,還出口日本、韓國(guó)及遠(yuǎn)銷其他國(guó)際市場(chǎng),所以西蘭花的質(zhì)量安全問題不但影響國(guó)內(nèi)消費(fèi)者的身體健康與安全,還關(guān)系著我國(guó)的國(guó)際市場(chǎng)形象。由于西蘭花在生長(zhǎng)過程中,容易發(fā)生猝倒病、立枯病等,而且會(huì)受菜青蟲、小菜蛾的危害,因此農(nóng)藥的使用不可避免。資料表明,我國(guó)農(nóng)藥殘留超標(biāo)是西蘭花出口受阻的主要原因[2],因此對(duì)西蘭花的農(nóng)殘檢測(cè)具有十分重要的意義。
目前,西蘭花農(nóng)藥殘留檢測(cè)方法均為傳統(tǒng)有損檢測(cè),如氣相色譜法、高效液相色譜法、免疫分析法,等等[3-4]。這些傳統(tǒng)方法雖然檢測(cè)精度高,但是檢測(cè)耗時(shí)長(zhǎng),且依賴大量的化學(xué)試劑,浪費(fèi)大,有污染,不利于推廣。高光譜技術(shù)是近年來應(yīng)用到農(nóng)畜產(chǎn)品檢測(cè)的新技術(shù),具有無污染、無損壞、自動(dòng)化、快速高效等優(yōu)點(diǎn)[5],被廣泛應(yīng)用于農(nóng)產(chǎn)品的農(nóng)藥殘留檢測(cè)。如:JAMSHIDI等[6]利用高光譜技術(shù)實(shí)現(xiàn)了黃瓜中農(nóng)藥殘留的快速檢測(cè);SHAO等[7]利用高光譜成像技術(shù)和拉曼光譜技術(shù)實(shí)現(xiàn)了對(duì)小球藻中農(nóng)藥殘留種類的檢測(cè);孫俊等[8]利用高光譜圖像技術(shù)結(jié)合自適應(yīng)-支持向量機(jī)(Ada-SVM)算法檢測(cè)了桑葉中農(nóng)藥殘留的有無,檢測(cè)精度高達(dá)97.78%;胡榮明等[9]利用高光譜中特征參數(shù)反演了韭菜中毒死蜱的殘留量。上述研究都證明高光譜技術(shù)應(yīng)用于農(nóng)藥殘留檢測(cè)是可行的,但這些研究對(duì)象均為表面光滑的植物葉片,而尚未涉及像西蘭花這類表面呈球狀且凹凸不平的蔬菜。
農(nóng)藥殘留精準(zhǔn)檢測(cè)的前提是有無農(nóng)藥殘留及農(nóng)藥殘留的種類。本文以不含農(nóng)藥的西蘭花和含有3種農(nóng)藥(阿維菌素、丙森鋅、吡蟲啉)的西蘭花作為研究對(duì)象,利用高光譜圖像技術(shù)結(jié)合模式識(shí)別方法建立西蘭花中不同農(nóng)藥殘留種類檢測(cè)模型來檢測(cè)西蘭花中不同農(nóng)藥種類,旨在探索高光譜圖像技術(shù)在西蘭花表面農(nóng)藥殘留檢測(cè)中的應(yīng)用,為西蘭花農(nóng)藥殘留檢測(cè)提供一種新的快速、高效的無損檢測(cè)方法。
在西蘭花生長(zhǎng)過程中,常用的防治病蟲害的農(nóng)藥有阿維菌素、丙森鋅、蟲螨腈、吡蟲啉等[10]。本實(shí)驗(yàn)使用阿維菌素(含有效成分2%,由濟(jì)南金地農(nóng)藥有限公司生產(chǎn))、吡蟲啉(含有效成分10%,由杭州泰豐化工有限公司生產(chǎn))、丙森鋅(含有效成分70%,由拜耳作物科學(xué)有限公司生產(chǎn))3種農(nóng)藥作為農(nóng)藥殘留檢測(cè)對(duì)象。實(shí)驗(yàn)所用的西蘭花樣本來自浙江省杭州市余杭區(qū)喬司農(nóng)場(chǎng)西蘭花種植地,品種為日本炎秀;選取180顆長(zhǎng)勢(shì)和形態(tài)近似的成熟、無病害西蘭花,平均分成4組進(jìn)行農(nóng)藥噴灑。由于傍晚氣溫低,農(nóng)藥不會(huì)揮發(fā)且容易被植物吸收,實(shí)驗(yàn)于17:00進(jìn)行,對(duì)第一組西蘭花按推薦劑量(4 000倍稀釋液)均勻噴灑吡蟲啉農(nóng)藥;第二組西蘭花按推薦劑量(2 500倍稀釋液)均勻噴灑阿維菌素農(nóng)藥;第三組西蘭花按推薦劑量(500倍稀釋液)均勻噴灑丙森鋅農(nóng)藥;第四組西蘭花均勻噴灑清水。每顆西蘭花噴灑100 mL,每組噴灑4.5 L,24 h后(每組樣本的農(nóng)藥均被吸收但還未被分解,且肉眼觀測(cè)不出差別),每組采摘西蘭花各45顆,裝入保鮮袋密封保存并編號(hào),隨后立即送往實(shí)驗(yàn)室進(jìn)行高光譜圖像采集。
高光譜圖像采集實(shí)驗(yàn)使用的是四川雙利合譜科技有限公司的Image-λ-V10E-PS高光譜成像儀系統(tǒng)。成像光譜儀型號(hào)為Imperx IPX-2M30,光譜范圍為383.70~1 032.70 nm,光譜分辨率為2.73 nm,光源為標(biāo)準(zhǔn)汞燈。使用SpecView軟件采集高光譜圖像數(shù)據(jù)。為避免環(huán)境中雜散光帶來的影響,整個(gè)采集過程在暗箱中進(jìn)行。高光譜圖像采集參數(shù)設(shè)定如下:曝光時(shí)間15 ms,平移臺(tái)移動(dòng)速度1.15 cm/s,4個(gè)汞燈與平移臺(tái)的夾角為45°。按組依次對(duì)所有的西蘭花樣本進(jìn)行高光譜采集,同時(shí)將白板放置在與西蘭花相同距離的位置上進(jìn)行白板數(shù)據(jù)采集,然后關(guān)閉光源,蓋上鏡頭蓋進(jìn)行暗背景數(shù)據(jù)采集。黑白校正公式為:
式中:R是校正后的數(shù)據(jù),S是原始樣本數(shù)據(jù),W是白板數(shù)據(jù),D是暗背景數(shù)據(jù)。
1.3.1 分段多元散射校正
由于西蘭花表面呈半球形且表面花苞呈顆粒狀,因此在采集高光譜圖像時(shí)會(huì)產(chǎn)生光的散射現(xiàn)象,而分段多元散射校正(piecewise multiplicative scatter correction,PMSC)的主要作用正是消除顆粒造成的非線性光散射影響[11]。該算法假設(shè)在寬度為j=(w1+w2+1)的移動(dòng)窗口波長(zhǎng)范圍內(nèi),光譜xi與平均光譜x存在線性關(guān)系,對(duì)每一移動(dòng)窗口分別按式(2)進(jìn)行一元線性回歸,用最小二乘法依次求出每段移動(dòng)窗口的截距aik和斜率bik。
由式(3)得到校正后的光譜xPMSC。
1.3.2 降維算法
高光譜的數(shù)據(jù)量大,是高光譜圖像處理最主要的問題。雖然取樣品感興趣區(qū)域的平均光譜可以顯著減少數(shù)據(jù)量,但是全波段光譜數(shù)據(jù)之間線性相關(guān)性大,信息冗余會(huì)影響分類模型的性能。主成分分析算法(principal component analysis algorithm,PCA)[12]是一種非監(jiān)督的特征提取算法,主要思想是將多個(gè)變量進(jìn)行線性變換后轉(zhuǎn)換成另一組不相關(guān)的變量,將多波段圖像信息壓縮到少數(shù)更有效的幾個(gè)轉(zhuǎn)換波段。連續(xù)投影算法(successive projection algorithm,SPA)[13]是一種特征變量前向循環(huán)選擇算法,在所有光譜中循環(huán)投影尋找含有最低限度的冗余信息的變量組,提高模型的速度和效率,被廣泛應(yīng)用于光譜特征波長(zhǎng)的選擇上。
1.3.3 分類算法
馬氏距離(Mahalanobis distance,MD)是線性判別法中常用方法之一[14]。計(jì)算輸入樣本和測(cè)試樣本之間的馬氏距離,得到的距離越小則匹配效果越好。
最小二乘支持向量機(jī)(least square support vector machine,LSSVM)是支持向量機(jī)的一種類型[15]。該算法使用最小二乘線性系統(tǒng)代替二次規(guī)劃方法,對(duì)所采集的樣本通過非線性映射函數(shù)在高維特征空間建立最優(yōu)分類面,從而實(shí)現(xiàn)樣本的線性可分。與SVM相比,LSSVM把原方法的不等式約束變?yōu)榈仁郊s束,從而大大方便了Lagrange乘子的求解,使得求解速度得到極大提高。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)是用許多處理單元模擬人類的神經(jīng)網(wǎng)絡(luò)來進(jìn)行預(yù)測(cè),由輸入層、一個(gè)或多個(gè)隱含層及輸出層組成復(fù)雜的處理單元(人工“神經(jīng)元”)構(gòu)成。該算法具有智能化、高容錯(cuò)性、并行分布的處理和自學(xué)習(xí)能力等優(yōu)點(diǎn),被廣泛應(yīng)用于處理人腦和現(xiàn)代計(jì)算機(jī)較難處理的復(fù)雜數(shù)據(jù)中[16]。
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)是由HUANG等[17]提出的一種特殊的單隱層前饋神經(jīng)網(wǎng)絡(luò)算法,相比于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)和SVM算法,具有運(yùn)算速度快、泛化能力強(qiáng)、不過擬合的優(yōu)點(diǎn)。
實(shí)驗(yàn)統(tǒng)一選取樣本中心60像素×60像素的正方形區(qū)域作為感興趣區(qū)域(region of interest,ROI)。計(jì)算該正方形感興趣區(qū)域內(nèi)所有像素點(diǎn)的光譜平均值得到的原始光譜數(shù)據(jù)如圖1所示。從中可以看出,在數(shù)據(jù)開頭和結(jié)尾部分噪聲較大,因此剔除數(shù)據(jù)前后各20個(gè)波段的光譜數(shù)據(jù),以提高整體數(shù)據(jù)信噪比。實(shí)驗(yàn)得到180顆西蘭花樣本從431.84~981.71 nm之間共216個(gè)波段的光譜數(shù)據(jù),然后用PMSC算法消除西蘭花表面顆粒感造成的光散射和基線漂移數(shù)據(jù)。4種樣本(各45條光譜)的平均光譜曲線如圖2所示。從中可以看出,有、無農(nóng)藥殘留的西蘭花光譜曲線差異明顯,因此可利用西蘭花的高光譜信息識(shí)別其表面有無農(nóng)藥殘留。同時(shí),含農(nóng)藥殘留種類不同的西蘭花的光譜曲線也不同,由此可以識(shí)別出西蘭花表面所含農(nóng)藥殘留的種類。
通過主成分分析算法對(duì)預(yù)處理后的原始光譜數(shù)據(jù)進(jìn)行特征提取,得到主成分圖像(圖3)和各個(gè)主成分的累積貢獻(xiàn)率(表1)。從前5個(gè)主成分圖像中可以看出,第一主成分圖像最清晰,而圖像清晰度隨著成分?jǐn)?shù)的增加而降低。
圖1 西蘭花樣本圖和感興趣區(qū)域(ROI)光譜提取示意圖Fig.1 Schematic diagram of broccoli sample’s region of interest(ROI)selection and spectral extraction
圖2 不含農(nóng)藥殘留及含不同種類農(nóng)藥殘留的西蘭花平均光譜圖Fig.2 Average reflectance spectra of broccoli samples with different types of pesticide residues or without pesticide residues
從表1中可以看出,當(dāng)主成分?jǐn)?shù)達(dá)到9時(shí),累計(jì)貢獻(xiàn)率已經(jīng)達(dá)到99.05%。為了達(dá)到降低數(shù)據(jù)冗余性的同時(shí)最大程度保留數(shù)據(jù)信息的目的,選取主成分?jǐn)?shù)為10,此時(shí)累計(jì)貢獻(xiàn)率達(dá)到99.10%。
使用連續(xù)投影算法(SPA)對(duì)預(yù)處理后的光譜數(shù)據(jù)特征波長(zhǎng)進(jìn)行選擇,設(shè)定特征波長(zhǎng)最大個(gè)數(shù)為20。根據(jù)均方根誤差盡可能小且波長(zhǎng)個(gè)數(shù)盡可能少的原則,得到的特征波長(zhǎng)個(gè)數(shù)為8(圖4),此時(shí)均方根誤差為0.85 275,光譜特征波長(zhǎng)分別為458.51、500.02、522.13、551.77、614.04、720.32、769.08、818.26 nm。
圖3 前5個(gè)主成分圖像Fig.3 The first five principal component images of broccoli samples
表1 不同主成分的累計(jì)貢獻(xiàn)率Table 1 Cumulative contribution rates using different numbers of principal components %
圖4 連續(xù)投影算法(SPA)提取的特征波長(zhǎng)Fig.4 Characteristic wavelengths extracted by SPA
從預(yù)處理后的每類樣品中隨機(jī)抽取30個(gè)(共計(jì)120個(gè))數(shù)據(jù)作為訓(xùn)練集,余下的每類15個(gè)(共計(jì)60個(gè))數(shù)據(jù)作為測(cè)試集。對(duì)431.84~981.71 nm之間進(jìn)行PMSC處理后的原始光譜作為輸入變量,分別驗(yàn)證MD、ANN、LSSVM和ELM這4種分類方法的鑒別效果,結(jié)果如表2所示。其中最小二乘支持向量機(jī)算法(LSSVM)分別采用線性核函數(shù)和徑向基核函數(shù),該模型中的懲罰因子c和核函數(shù)參數(shù)gamma均為默認(rèn)參數(shù)。在人工神經(jīng)網(wǎng)絡(luò)算法(ANN)中,活化函數(shù)為L(zhǎng)ogistic,訓(xùn)練貢獻(xiàn)閾值設(shè)為0.94,隱含層數(shù)為1,權(quán)重調(diào)節(jié)速度為0.2,訓(xùn)練迭代次數(shù)1 000,允許誤差為0.06。極限學(xué)習(xí)機(jī)(ELM)模型隱含層節(jié)點(diǎn)數(shù)為31。
從表2中可以看出,4種基于全光譜的分類方法都能有效分類識(shí)別,其中識(shí)別效果最好的模型是人工神經(jīng)網(wǎng)絡(luò)算法建模,訓(xùn)練集和測(cè)試集正確率分別為99.17%和98.33%。使用ELM算法建模效果僅次于人工神經(jīng)網(wǎng)絡(luò)算法建模,訓(xùn)練集和測(cè)試集正確率分別為97.50%和95.83%。而使用徑向基核函數(shù)的LSSVM算法建模的正確率均高于使用線性核函數(shù)模型的正確率。
表2 基于全波段數(shù)據(jù)不同分類器建模結(jié)果Table 2 Results of different classification models using fullspectra %
同樣地,將選取的前10個(gè)主成分特征光譜和8個(gè)特征波長(zhǎng)分別作為輸入變量,構(gòu)建分類模型。分類結(jié)果如表3所示。其中最小二乘支持向量機(jī)算法、人工神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)算法的參數(shù)設(shè)置同2.3。從中可以看出,基于SPA特征波長(zhǎng)的分類模型的正確率整體都高于基于主成分特征光譜的分類模型,說明試驗(yàn)中采用連續(xù)投影算法進(jìn)行數(shù)據(jù)降維的效果優(yōu)于主成分分析算法。與2.3中的分類結(jié)果相比,基于SPA特征波長(zhǎng)的建模中,馬氏距離、最小二乘支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)模型正確率略有下降但是精度仍然較好,訓(xùn)練集的正確率均超過80%;而基于SPA特征波長(zhǎng)下的極限學(xué)習(xí)機(jī)模型的判別正確率有所提高,且高于其他3類分類器的正確率,訓(xùn)練集和測(cè)試集的正確率均高達(dá)96%以上。
表3 基于主成分特征光譜和SPA特征波長(zhǎng)的不同分類器建模結(jié)果Table 3 Results of different classification models using principal component characteristic spectra and characteristic wavelengths selected by SPA %
利用高光譜圖像技術(shù)采集4組西蘭花樣本圖像,利用圖像信息選取感興趣區(qū)域的平均光譜后,針對(duì)西蘭花表面凹凸不平的特點(diǎn)采用分段多元散射校正算法進(jìn)行預(yù)處理,有效地消除了顆粒造成的非線性光散射影響,然后基于全光譜信息分別采用馬氏距離算法、最小二乘支持向量機(jī)算法、人工神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)算法進(jìn)行分類建模。其中人工神經(jīng)網(wǎng)絡(luò)分類算法效果最優(yōu),訓(xùn)練集和測(cè)試集正確率分別為99.17%和98.33%。為剔除大量高光譜冗余數(shù)據(jù),提高模型的識(shí)別速度,采用主成分分析算法選取前10個(gè)主成分和連續(xù)投影算法選擇8個(gè)特征值波長(zhǎng)進(jìn)行特征提取,分別建立了基于特征信息的判別模型。在實(shí)驗(yàn)分類器中,SPA-ELM模型的識(shí)別效果均優(yōu)于其他3類分類器,訓(xùn)練集和測(cè)試集的正確率分別為98.33%、96.67%。綜上表明,利用高光譜圖像技術(shù)結(jié)合人工神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)西蘭花表面有、無農(nóng)藥殘留及殘留農(nóng)藥種類檢測(cè)是完全可行的,為西蘭花表面農(nóng)藥殘留快速無損檢測(cè)提供了一種新的方法。
參考文獻(xiàn)(References):
[1] XU L,CAO J,CHEN W.Structural characterization of a broccoli polysaccharide and evaluation of anti-cancer cell proliferation effects.Carbohydrate Polymers,2015,126:179-184.
[2] 孫彩霞,戚亞梅,楊桂玲,等.西蘭花出口的技術(shù)性貿(mào)易措施分析.農(nóng)產(chǎn)品質(zhì)量與安全,2013(1):55-57.SUN C X,QI Y M,YANG G L,et al.Analysis on technical trade measures of broccoli export.Quality and Safety of Agro-products,2013(1):55-57.(in Chinese)
[3] FARINA Y,ABDULLAH M P,BIBI N,et al.Determination of pesticide residues in leafy vegetables at parts per billion levels by a chemometric study using GC-ECD in Cameron Highlands.Food Chemistry,2017,224:55-61.
[4] ZHANG F,HUANG Z,ZHANG Y,et al.Determination of 20 carbamate pesticide residues in food by high performance liquid chromatography-tandem mass spectrometry.Chinese Journal of Chromatography,2010,28(4):348-355.
[5] CHO B K,KIM M S,BAEK I S,et al.Detection of cuticle defects on cherry tomatoes using hyperspectral fluorescence imagery.Postharvest Biology&Technology,2013,76:40-49.
[6]JAMSHIDI B,MOHAJERANI E,JAMSHIDI J.Developing a Vis/NIR spectroscopic system for fast and non-destructive pesticide residue monitoring in agricultural product.Measurement,2016,89:1-6.
[7] SHAO Y N,LI Y,JIANG L J,et al.Identification of pesticide varieties by detecting characteristics of Chlorella pyrenoidosa using visible/near infrared hyperspectral imaging and Raman microspectroscopy technology.Water Research,2016,104:432-440.
[8] 孫俊,張梅霞,毛罕平,等.基于高光譜圖像的桑葉農(nóng)藥殘留種類鑒別研究.農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(6):251-256.SUN J,ZHANG M X,MAO H P,et al.Identification of pesticide residues in mulberry leaves based on hyperspectral imaging.Transactions of the Chinese Society of Agricultural Machinery,2015,46(6):251-256.(in Chinese with English Abstract)
[9] 胡榮明,郭江波,黃遠(yuǎn)程,等.韭菜中毒死蜱殘留量與高光譜特征參數(shù)的相關(guān)性建模.農(nóng)藥學(xué)學(xué)報(bào),2015,17(5):563-570.HU R M,GUO J B,HUANG Y C,et al.Sensitivity model for chlorpyrifos residues in Chinese chive and hyper-spectral absorption parameters.Chinese Journal of Pesticide Science,2015,17(5):563-570.(in Chinese with English Abstract)
[10]EDELSON J V,MAGARO J J,BROWNING H.Control of insect pests on broccoli in southern Texas:A comparison between synthetic organic insecticidesand biorational treatments.Journal of Entomological Science,1993,28(2):191-196.
[11]BURGER J,GELADI P.Spectral pre-treatments of hyperspectral near infrared images:Analysis of diffuse reflectance scattering.Journal of Near Infrared Spectroscopy,2007,15(1):29-37.
[12]HUANG L,ZHAO J,CHEN Q,et al.Rapid detection of total viable count(TVC)in pork meat by hyperspectral imaging.Food Research International,2013,54(1):821-828.
[13]GAO J F,LI X L,ZHU F L,et al.Application of hyperspectral imaging technology to discriminate different geographical origins of Jatropha curcas L.seeds.Computers&Electronics in Agriculture,2013,99(6):186-193.
[14]MAESSCHALCK R D,JOUAN-RIMBAUD D,MASSART D L.The Mahalanobis distance.Chemometrics&Intelligent Laboratory Systems,2000,50(1):1-18.
[15]SUYKENS J A K,GESTEL T V,BRABANTER J D,et al.Least square support vector machine.Euphytica,2002,2(2):1599-1604.
[16]SUN M J,ZHANG D,LIU L,et al.How to predict the sugariness and hardness of melons:A near-infrared hyperspectral imaging method.Food Chemistry,2016,218:413.
[17]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:Theory and applications.Neurocomputing,2006,70(1/2/3):489-501.
浙江大學(xué)學(xué)報(bào)(農(nóng)業(yè)與生命科學(xué)版)2018年5期