CHENG Shaoming,WANG Jun*,WANG Yongwei,MA Yanghui
(1.College of Bio-systems Engineering and Food Science,Zhejiang University,Hangzhou 310029,China; 2.College of Information,Zhejiang University of Science and Technology,Hangzhou 310023,China)
Research on Distinguishing Tomato Seedling Infected with Early Blight Disease Using Different Characteristic Parameters by Electronic Nose*
CHENG Shaoming1,WANG Jun1*,WANG Yongwei1,MA Yanghui2
(1.College of Bio-systems Engineering and Food Science,Zhejiang University,Hangzhou 310029,China; 2.College of Information,Zhejiang University of Science and Technology,Hangzhou 310023,China)
In order to improve the calculation efficiency,we shouldminimize the number of features and try not to lose useful information for classification under the premise of the original features.This paper use themaximum value,average value of all data,maximum curvature of response curve and the intact integral value of response curve as the feature parameters for distinguishing infection early blight disease of tomato seedlings.The results show that the distinguished effect using average value of all data and the intact integral value of response curve as the feature parameters is the best,and that usingmaximum value is better.The worse is usingmaximum curvature of response curve.
characteristic parameter;tomato seedling;early blight disease;electronic nose
電子鼻是通過氣體傳感器和模式識別技術(shù)的結(jié)合,模擬生物嗅覺系統(tǒng)來進行氣體檢測和識別的儀器。它主要由傳感器陣列和自動化模式識別系統(tǒng)所組成。與普通的化學(xué)分析儀器不同,電子鼻系統(tǒng)檢測到的不是被測樣品中某種或某幾種成分的定性與定量結(jié)果,而是給予樣品中揮發(fā)性成分的整體信息。由于電子鼻系統(tǒng)檢測具有方便、快速、無損等特點,目前電子鼻在食品質(zhì)量控制[1-10]、環(huán)境檢測[11-13]、作物病蟲害檢測[14-15]、人體疾病檢測[16-17]等方面有不少成功的應(yīng)用。
電子鼻檢測的原始特征的數(shù)據(jù)很大,為提高計算效率,在盡可能保持較多原有信息的前提下,對原始特征進行合理的選擇,然后對選取的特征進行降低維數(shù)的處理。在電子鼻響應(yīng)信號的模式識別中,特征選擇的方法采用以下幾種:(1)基于原始曲線的基本特征選擇方法,在原始響應(yīng)曲線上選擇穩(wěn)定值、最大值,平均值、特定時間間隔的響應(yīng)值;(2)特定時間間隔的曲線包圍面積;(3)采用適當(dāng)?shù)哪P蛿M合原始響應(yīng)曲線,以模型參數(shù)為抽取特征等。
本論文利用最大值(Max)、全段數(shù)據(jù)平均值(Mean)、響應(yīng)曲線最大曲率(kmax)、響應(yīng)曲線的全段積分值(IV)等作為特征參數(shù),研究番茄苗早疫病病害區(qū)分效果,找出合適的特征數(shù)據(jù),實現(xiàn)對番茄苗早疫病不同病害程度較好的分類結(jié)果。
1.1 實驗材料
將浙雜809番茄種子播在塑料盆缽(Φ8 cm× 12 cm)中,在塑料溫室中進行培育,每盆1株苗,定期澆水施肥,待苗長到35 d,苗高25 cm~30 cm時用于實驗。
1.2 實驗裝置
1.2.1 番茄苗揮發(fā)物電子鼻檢測的采樣裝置
圖1為番茄苗采樣系統(tǒng)的示意圖,整個系統(tǒng)由空氣過濾器、活性碳、特氟隆管、出氣口、玻璃容器(40 cm高×10 cm直徑)、密封板、番茄苗和支架臺8個部分組成。工作時,被采氣體通過出氣口4,特氟隆管3,活性炭2及空氣過濾器1進入到電子鼻。
圖1 靜態(tài)頂空采樣系統(tǒng)示意圖
1.2.2 電子鼻
實驗采用的電子鼻系統(tǒng)是德國AIRSENSE公司的便攜式電子鼻PEN2(Portable Electronic Nose)。該系統(tǒng)主要由傳感器陣列、采樣通道、內(nèi)置泵、控制單元和計算機等部分組成。表1是PEN2電子鼻系統(tǒng)中各個傳感器性能指標(biāo)。
表1 PEN2電子鼻的各傳感器性能特點
1.3 試驗方法
1.3.1 番茄苗樣本處理
將準(zhǔn)備好的番茄苗進行早疫病病菌接種,按照每株番茄苗接種病菌的葉片數(shù)量不同將番茄苗分成4個處理,即每株番茄苗接種1個葉片、2個葉片、4個葉片和未進行接種作為對照組,分別記為zby1、zby2、zby4和control;每個處理作16個重復(fù)。接種后,將番茄苗放置于溫度35℃、濕度90%的環(huán)境中培養(yǎng)24 h,以使病菌快速入侵番茄苗葉片。
1.3.2 電子鼻測試
在進行電子鼻實驗前,四組番茄苗分別置于頂空采樣裝置中,頂空產(chǎn)生時間為30 min后進行電子鼻測試。電子鼻測試時的參數(shù)設(shè)置見表2。
表2 電子鼻參數(shù)設(shè)置
1.4 數(shù)據(jù)分析方法
圖2為電子鼻各傳感器對感染早疫病病害番茄苗所產(chǎn)生揮發(fā)物的響應(yīng)曲線。10條曲線代表10個傳感器的響應(yīng),其中,橫坐標(biāo)為采樣時間,縱坐標(biāo)為陣列的響應(yīng)信號(G/G0是傳感器接觸到樣品揮發(fā)物后的電阻R與傳感器在經(jīng)過潔凈空氣時的電阻R0的比值)。
圖2電子鼻傳感器對番茄苗揮發(fā)物的響應(yīng)特性
圖3 是在傳感器響應(yīng)曲線上分別取最大值、全段數(shù)據(jù)平均值、響應(yīng)曲線最大曲率、響應(yīng)曲線的全段積分值等作為特征參數(shù)的示意圖。
圖3 電子鼻響應(yīng)信號曲線特征選擇時的示意圖
圖4 不同特征參數(shù)區(qū)分不同程度病害的PCA圖
2.1 主成分分析
對4組不同處理番茄苗樣本(每株番茄苗接種1個葉片、2個葉片、4個葉片和未進行接種作為對照組分別記為zyb1、zyb2、zyb4和control)分別利用最大值(Max)、平均值(Mean)、最大斜率值(kmax)和全段積分值(IV)作為特征參數(shù)進行主成分分析,圖4是番茄苗接種早疫病病菌的取不同特征參數(shù)的主成分分析分析圖。從結(jié)果可知,最大值和最大斜率值作為特種參數(shù)時的第1主成分分析值(橫坐標(biāo)PC1)與第2主成分的分析值(縱坐標(biāo)PC2)之和小于85%,平均值和全段積分值作為特征參數(shù)時的第1主成分的分析值與第2主成分的分析值之和在85%以上。
從圖4可看出,利用全段平均值和全段積分值作為早疫病病害番茄苗的特征參數(shù)時,PCA分析圖區(qū)分效果較好,對照組、2葉片和4葉片基本可以區(qū)分開,但對照組和1葉片有部分重疊;利用最大值時的區(qū)分效果次之(圖4a),1葉片和4葉片、2葉片和對照組可以很好的區(qū)分開,但1葉片和對照組、2葉片和1葉片及4葉片有部分重疊;利用響應(yīng)曲線的最大斜率值的區(qū)分效果最差(圖4c),4種處理很難區(qū)分。
2.2 線性判別分析
對四組不同處理番茄苗樣本分別利用最大值(Max)、平均值(Mean)、最大斜率值(kmax)和全段積分值(IV)作為特征參數(shù)進行線性判別分析,圖5是番茄苗接種早疫病病菌的取不同特征參數(shù)的LDA分析圖。從結(jié)果可知,第1主成分的分析值(橫坐標(biāo)LD1)與第2主成分的分析值(縱坐標(biāo)LD2)之和已達85%以上,表明LDA第1主成分、第2主成分的結(jié)果可以代表電子鼻響應(yīng)信號對番茄苗揮發(fā)物的區(qū)分情況。
從圖5可知,利用全段平均值和全段積分值作為早疫病病害番茄苗的特征參數(shù)時,LDA分析圖區(qū)分效果較好;這可能與利用全段平均值和全段積分值作為特種參數(shù)時所綜合的是早疫病病害番茄苗揮發(fā)物的全部信息,而不是某一刻的早疫病病害番茄苗揮發(fā)物的信息有關(guān)。利用最大值時的區(qū)分效果次之(圖5(a)),1葉片和對照組及2葉片有部分重疊;利用響應(yīng)曲線的最大斜率值的區(qū)分效果最差(圖5(c)),對照組和4葉片基本能區(qū)分開,但其他處理間都有重疊現(xiàn)象。
2.3 神經(jīng)網(wǎng)絡(luò)模型分析
將不同病害的番茄苗分別每組隨機抽取10個樣本作為訓(xùn)練集(共40個樣本),用于對番茄苗病害程度的訓(xùn)練,剩余每組6個樣本(共24個樣本)作為預(yù)測集。分別用最大值(Max)、全段數(shù)據(jù)平均值(Mean)、響應(yīng)曲線最大曲率(kmax)、響應(yīng)曲線的全段積分值(IV))作為特征參數(shù)進行建模,分別采用BP神經(jīng)網(wǎng)絡(luò)BPNN(Back Propagation Neural Networks)和遺傳算法BP神經(jīng)網(wǎng)絡(luò)GABPNN(Genetic Algorithm Back Propagation Neural Networks)兩種識別模式對進行實驗數(shù)據(jù)進行識別。
圖5 不同特征參數(shù)區(qū)分不同程度病害的LDA圖
研究中,以10個傳感器響應(yīng)數(shù)據(jù)作為輸入,番茄苗樣本作為輸出,輸出層選擇為1。通過反復(fù)測試來調(diào)整隱含層神經(jīng)元數(shù)來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),得到較好網(wǎng)絡(luò)結(jié)構(gòu)為10(輸入)-20(隱含)-1(輸出),設(shè)定目標(biāo)誤差為0.001,網(wǎng)絡(luò)學(xué)習(xí)速率為0.01,訓(xùn)練迭代次數(shù)為1 000次。模型的實現(xiàn)是采用MATLAB語言編程,調(diào)用遺傳算法工具箱實現(xiàn)。遺傳算法的參數(shù)設(shè)置:種群規(guī)模為50,遺傳代數(shù)設(shè)定為100,交叉概率為0.9,變異概率為0.09,適應(yīng)度目標(biāo)選擇為BP神經(jīng)網(wǎng)絡(luò)模型設(shè)定的目標(biāo)誤差0.001。
表3是選用不同特征參數(shù)時利用BP神經(jīng)網(wǎng)絡(luò)(BPNN)和遺傳算法BP神經(jīng)網(wǎng)絡(luò)(GABPNN)兩種識別模式的預(yù)測結(jié)果。
表3 各特征選擇方法預(yù)測模型的結(jié)果
從表3可知,全段數(shù)據(jù)平均值和響應(yīng)曲線的全段積分值作為特征參數(shù)時的訓(xùn)練集和預(yù)測集的正確率較好,其次為最大值方法,預(yù)測結(jié)果最差的是響應(yīng)曲線最大曲率方法,造成這種分析結(jié)果可能是由于實驗用的電子鼻對樣本的測試響應(yīng)信號比較平穩(wěn),對于一個樣本響應(yīng)曲線最大曲率方法提取的特征點會在響應(yīng)曲線的不同時刻,這相比于穩(wěn)定狀態(tài)的分析效果要差,而全段數(shù)據(jù)平均值和全段積分值方法可以提取電子鼻信號的穩(wěn)定信息所以預(yù)測結(jié)果較好。
對比BP神經(jīng)網(wǎng)絡(luò)和GABP神經(jīng)網(wǎng)絡(luò)兩種模型結(jié)果,GABP神經(jīng)網(wǎng)絡(luò)分析的預(yù)測正確率均要高于BP神經(jīng)網(wǎng)絡(luò),說明經(jīng)過遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果要好于BP神經(jīng)網(wǎng)絡(luò)。這是由于遺傳算法的局部搜索能力較差,僅僅用遺傳算法訓(xùn)練網(wǎng)絡(luò)比較費時,并且在進化到一定代數(shù)后,搜索效率會變得很低,此后適應(yīng)度值基本沒什么變化。因此以遺傳算法得到的最好學(xué)習(xí)結(jié)果為基礎(chǔ),再進入BP學(xué)習(xí)過程,這樣不僅能發(fā)揮BP神經(jīng)網(wǎng)絡(luò)強大的非線性映射能力,而且使BP神經(jīng)網(wǎng)絡(luò)具有更快的收斂性和更強的學(xué)習(xí)能力,從而使遺傳算法BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果更好。
(1)利用4種不同特征參數(shù)進行早疫病病害番茄苗的PCA和LDA,結(jié)果表明采用全段平均值和全段積分值作為特征參數(shù)時的區(qū)分效果較好,最大值作為特征參數(shù)時的區(qū)分效果次之,響應(yīng)曲線的最大斜率值作為特征參數(shù)時的區(qū)分效果最差。
(2)利用BP神經(jīng)網(wǎng)絡(luò)和經(jīng)過遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)2中模式識別進行預(yù)測,結(jié)果表明利用經(jīng)過遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果均好于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果。
(3)不論哪種識別模式,利用全段數(shù)據(jù)平均值和響應(yīng)曲線的全段積分值作為特征參數(shù)時的訓(xùn)練集和預(yù)測集的正確率最高,其次利用最大值作為特征參數(shù),預(yù)測結(jié)果最差的是利用響應(yīng)曲線最大曲率作為特征參數(shù)。
[1]Pang L J,Wang J,Yu H C,et al.Discrimination of Storage Age for Wheat by E-Nose[J].Transactions of the ASABE,2008,51: 1707-1712.
[2]Cheng SM,Wang YW,Wang J,et al.Detection of Eggshell Crack Using Electronic Nose[J].Transactions of the ASABE,2010,53: 789-794.
[3]于慧春,王俊,張紅梅,等.龍井茶葉品質(zhì)的電子鼻檢測方法[J].農(nóng)業(yè)機械學(xué)報,2007(7):103-106.
[4]Zhang H M,Wang J.Detection of Age and Insect Damage Incurred by Wheatwith an Electronic Nose[J].Journal of Stored Products Research,2007,43:489-495.
[5]Gomez A H,Wang J,Hu G X,et al.Discrimination of Storage Shelf-Life for Mandarin by Electronic Nose Technique[J].LWTFood Science and Technology,2007,40:681-689.
[6]Wang Y W,Wang J,Zhou B,et al.Monitoring Storage Time and Quality Attribute of Egg Based on Electronic Nose[J].Analytica Chimica Acta,2009,650(2):183-188.
[7]柴春祥,陳慶森,劉勤生.雞肉新鮮度電子鼻評價特征值的確定[J].食品與發(fā)酵工業(yè),2007(11):5-8.
[8]周亦斌,王俊.基于電子鼻的番茄成熟度及貯藏時間評價的研究[J].農(nóng)業(yè)工程學(xué)報,2005,21(5):113-116.
[9]程紹明,馬楊琿,周博,等.基于電子鼻的番茄種子不同儲藏時間的鑒別研究[J].傳感技術(shù)學(xué)報,2011,24(7):941-944.
[10]龐林江,王俊,路興花.電子鼻判別小麥陳化年限的檢測方法研究[J].傳感技術(shù)學(xué)報,2007,20(8):1717-1722.
[11]Sohn JH,Hudson N,Gallagher E,et al.Implementation of an E-lectronic Nose for Continuous Odour Monitoring in a Poultry Shed[J].Sensors and Actuators B:Chemical,2008,133:60-69.
[12]DeVito,Massera E,Piga M,et al.On Field Calibration of an Electronic Nose for Benzene Estimation in an Urban Pollution Monitoring Scenario[J].Sensors and Actuators B:Chemical,2008,129: 750-757.
[13]Laura C,Selena S,Paolo C,et al.Massimiliano G.Electronic Nose for the Continuous Monitoring of Odours from a Wastewater Treatment Plant at Specific Receptors:Focus on Training Methdos[J]. Sensors and Actuators B:Chemical,2008,131:53-62.
[14]程紹明,王俊,王永維,等.基于電子鼻信號判別番茄苗機械損傷程度[J].農(nóng)業(yè)工程學(xué)報,2012,28(15):102-106.
[15]程紹明,王俊,馬楊琿,等.基于電子鼻系統(tǒng)的番茄苗不同種類損傷的區(qū)分效果研究[J].傳感技術(shù)學(xué)報,2012,25(9): 1184-1188.
[16]Dummer J,Storer M,Swanney M,et al.Analysis of Biogenic Volatile Organic Compounds in Human Health and Disease[J].Trends in Analytical Chemistry,2011,30(7):960-967.
[17]Bernabei M,Pennazza G,Santonico M,et al.A Preliminary Study on the Possibility to Diagnose Urinary Tract Cancers by an Electronic Nose[J].Sensors and Actuators B:Chemical,2008,131:1-4.
程紹明(1974-),男,博士,講師,浙江大學(xué),主要研究方向為農(nóng)產(chǎn)品品質(zhì)檢測,chengshaoming@zju.edu.cn;
王俊(1965-),男,浙江大學(xué)教授、博士生導(dǎo)師。入選教育部新世紀(jì)優(yōu)秀人才支持計劃和浙江省“151人才工程(重點和第一層次)”。先后主持國家高技術(shù)研究發(fā)展計劃(863計劃)1項、國家自然科學(xué)基金項目5項、高校博士學(xué)科點基金2項、浙江省科技廳重大招標(biāo)項目2項、其他省部級項目10余項。已獲國家發(fā)明專利15項。在國家級學(xué)報和境外學(xué)術(shù)刊物上已發(fā)表100余篇論文,其中SCI收錄60余篇。發(fā)表的SCI收錄論文中被引用300余次。研究方向之一為電子鼻電子舌技術(shù)的農(nóng)產(chǎn)品品質(zhì)檢測,jwang@zju.edu.cn。
基于電子鼻技術(shù)的不同特征參數(shù)對番茄苗早疫病病害區(qū)分效果影響的研究*
程紹明1,王俊1*,王永維1,馬楊琿2
(1.浙江大學(xué)生物系統(tǒng)工程與食品科學(xué)學(xué)院,杭州310029;2.浙江科技學(xué)院信息學(xué)院,杭州310023)
電子鼻檢測的原始特征的數(shù)據(jù)量很大,一般在進行降低維數(shù)的處理前需要對原始特征進行合理的選擇。選用最大值(Max)、全段數(shù)據(jù)平均值(Mean)、響應(yīng)曲線最大曲率(kmax)、響應(yīng)曲線的全段積分值(IV)作為4種不同特征參數(shù)對感染早疫病病害的番茄苗進行區(qū)分效果研究,結(jié)果表明在進行PCA和LDA區(qū)分時,利用全段數(shù)據(jù)平均值和響應(yīng)曲線的全段積分值作為特征參數(shù)的效果較好,其次為最大值方法,最差的是響應(yīng)曲線最大曲率方法;利用BP神經(jīng)網(wǎng)絡(luò)(BPNN)和遺傳算法BP神經(jīng)網(wǎng)絡(luò)(GABPNN)兩種識別模式進行預(yù)測時,利用全段數(shù)據(jù)平均值和響應(yīng)曲線的全段積分值作為特征參數(shù)的訓(xùn)練集和預(yù)測集的正確率較好,其次為最大值方法,預(yù)測結(jié)果最差的是響應(yīng)曲線最大曲率方法。
特征參數(shù);番茄苗;早疫病;電子鼻
TP242.64
A
1004-1699(2014)01-0001-05
2013-10-18修改日期:2013-12-16
C:7230J
10.3969/j.issn.1004-1699.2014.01.001
項目來源:國家自然科學(xué)基金項目(30071246,31370555);浙江省自然科學(xué)基金項目(Z5100155)