周鵬+郭頌+牛曉太+等
摘要:南疆紅棗病蟲害成為制約南疆紅棗產(chǎn)業(yè)發(fā)展的主要因素,因而紅棗內(nèi)在品質(zhì)成為評判優(yōu)質(zhì)等級的關(guān)鍵。首先利用光譜技術(shù)提取南疆紅棗相關(guān)參數(shù),分析紅棗在460~2 260 nm波長范圍內(nèi)的光譜特性參數(shù)。運用主成分分析法分析黑斑病紅棗一、二階微分光譜的前10個主成分解釋的變異百分比,比對光譜特征參數(shù)和重采樣光譜對紅棗病害等級識別的影響因素。最后以光譜參數(shù)為徑向基網(wǎng)絡輸入量,分析確定核函數(shù)和分類函數(shù),構(gòu)建南疆紅棗病蟲害等級識別支持向量機模型。結(jié)果表明,運用主成分分析法和帶懲罰系數(shù)及核參數(shù)的支持向量機技術(shù)構(gòu)建的支持向量機模型對南疆紅棗病蟲危害等級識別正確率為98.8%,實現(xiàn)了對南疆紅棗病蟲害進行精確的等級識別。
關(guān)鍵詞:新疆紅棗;病蟲害等級;光譜技術(shù);主成分分析;支持向量機;等級識別
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)06-0354-04
收稿日期:2013-09-26
基金項目:國家自然科學基金(編號:61162018);河南省基礎(chǔ)與前沿技術(shù)研究項目(編號:132300410422);河南省科技攻關(guān)計劃(編號:132102210049)。
作者簡介:周鵬(1969—),男,河南信陽人,碩士,教授,從事嵌入式系統(tǒng)、模式識別、遙感監(jiān)測和物聯(lián)網(wǎng)工程研究。E-mail:zpzqxy@163.com。南疆地處歐亞大陸的腹地,降雨量少,蒸發(fā)量大,空氣干燥,光熱資源豐富,根據(jù)紅棗的生物學特性,非常適合發(fā)展紅棗產(chǎn)業(yè)。近年來,隨著南疆紅棗種植面積不斷增加,病蟲害也逐年嚴重。南疆紅棗病蟲害除造成產(chǎn)量損失外,還造成紅棗內(nèi)在品質(zhì)的下降,甚至產(chǎn)生對人體有毒、有害的物質(zhì),紅棗病蟲害的發(fā)生越來越成為制約南疆紅棗產(chǎn)業(yè)發(fā)展的主要因素。以南疆紅棗原始光譜、對數(shù)光譜、一階和二階微分光譜等光譜數(shù)據(jù)形式為研究對象,篩選對南疆紅棗病蟲害脅迫響應敏感的光譜區(qū)域和波段。運用主成分分析法和帶懲罰系數(shù)C的支持向量機技術(shù),構(gòu)建南疆紅棗病蟲危害等級識別模型。
1材料與方法
1.1檢測的儀器設(shè)備
本次檢測使用的是美國ASD(Analytical Spectral Device)公司制造的便攜式Field Spec Pro FR 2500光譜輻射儀,測試的波段范圍為350~2 500 nm。當采樣間隔為1.4 nm時,要求檢測的波段為350~1 000 nm,光譜分辨率為3 nm;當采樣間隔為2 nm時,檢測的波段為1 000~2 500 nm,光譜分辨率為10 nm;模擬光源與光譜輻射儀配套的150 W鹵素燈,探頭視場角25°。
1.2光譜采集方法
試驗前設(shè)計一個簡易南疆紅棗樣品高光譜批量快速采集遴選裝置(圖1),其中轉(zhuǎn)臺和光纖多角度調(diào)節(jié)架是測試裝置的主要部件。在轉(zhuǎn)臺的水平上呈圓形結(jié)構(gòu)上的星形虛線部位為添加紅棗的卡槽,方便對紅棗進行固定;圖中的橢圓形陰影為待檢測的紅棗,三維光學調(diào)節(jié)臺采用的光纖調(diào)節(jié)支架,能夠根據(jù)需要改變二者之間的距離與測試的角度。光源發(fā)射光照射在紅棗后,紅棗吸收部分光線,會在紅棗的內(nèi)部發(fā)生漫反射出的光線。根據(jù)測試需要,可以調(diào)節(jié)光纖支架的測量距離和角度,調(diào)節(jié)反射光線的角度,并將反射光線漫反射至光纖接收并將其輸送至光譜輻射儀,也有利于減少紅棗皮或棗核對反射光線的影響,方便光譜輻射儀進行分析。在檢測過程中,通過緩慢移動改變光纖支架的距離和角度來獲取不同狀態(tài)的測量光譜信息,根據(jù)光譜的變化情況來分析紅棗內(nèi)部的變化情況,通常采用選取樣品的漫反射或漫透射光譜平均值作為測量結(jié)果。
采用批量采集檢測裝置和便攜式光譜輻射儀聯(lián)合測試,通過對紅棗進行旋轉(zhuǎn),方便對紅棗病蟲害開展具體實施的操作分析[1]。其中z軸表示紅棗的吸光度,x軸為光譜的波數(shù),y軸為檢測的時間。隨著時間變化,對紅棗的檢測光譜進行分析,形成測試紅棗不同部位的三維光譜圖。發(fā)生不同病蟲害的紅棗由于結(jié)構(gòu)發(fā)生變化,吸收光線的能力不一樣,這樣就形成兩側(cè)的糖度和內(nèi)部結(jié)構(gòu)有明顯不同。由于紅棗直徑一般約2~3 cm,整體的結(jié)構(gòu)差異較小,糖度差異較小,在測試時,做3次掃描糖度,就能夠滿足測試的要求。
1.3吸收光譜特征的提取
棗銹病、棗瘋病、黑斑病、縮果病危害等級不同的南疆紅棗,其內(nèi)在品質(zhì)的各成分含量和吸收光譜有所不同,根據(jù)發(fā)生病蟲害的紅棗對光譜的吸收,可以確定紅棗光譜的化學成分,能夠有效確定病蟲害的類型。通過吸收光譜的吸收深度和吸收面積,可以有效分析病蟲害的主要特征。采用包絡線消除法對獲取的光譜數(shù)據(jù)進行處理,能夠有效壓抑背景光譜,提高吸收光譜的特征,便于進行詳細的分析。在光譜提取前,要求對光譜的吸收數(shù)據(jù)進行歸一化處理,提高數(shù)據(jù)的分析精度,采用光譜波長為480、560、760、850、1 250、1 450 nm,圖2為發(fā)生黑斑病的紅棗的光譜反射率信號并通過數(shù)據(jù)歸一化處理后的光譜反射數(shù)據(jù)圖。
圖2中紅棗樣品的光譜反射率曲線由離散樣點組成,形成一個連續(xù)、完整的曲線,獲得近似表示樣本反射率包絡線,通過曲線可以分析紅棗的黑斑病情況。由于采用相同的光譜波段值,所得的分析結(jié)果即為該波段去包絡化后的歸一化光譜值,其值為[0,1],即為紅棗黑斑病的特征離散曲線。根據(jù)歸一化光譜值計算方式和處理方法,確定紅棗的吸收深度(Depth)和病蟲害紅棗光譜吸收面積(Area)之間的關(guān)系,相應的計算公式為:[2]
Depth=1-min(Rc)Iλ2λ1(1)
其中:Rc為歸一化光譜曲線值,λ1、λ2為吸收光譜特征的波段范圍,Area為光譜吸收峰到包絡線之間的積分面積。通過Area可以分析紅棗黑斑病發(fā)生的程度,即輕度、中度、重度、特重度,表1為波段在660 nm附近的紅棗光譜的吸收深度、吸收面積。
黑斑病紅棗的光譜吸收深度(Dept)和吸收面積(Area)
樣本數(shù)輕度中度重度特重度DepthAreaDepthAreaDepthAreaDepthArea10.52159.150.57173.660.66196.890.74226.3520.53162.150.57173.450.66205.010.75227.75290.52158.640.64193.890.67202.280.74225.42300.52158.630.64193.880.67202.290.74226.85
1.4紅邊光譜特征值的提取
發(fā)生病害紅棗的紅邊光譜特征參數(shù)[紅邊位置Rep和紅谷位置Lo]代表紅棗的葉綠素含量。其中紅邊光譜特征參數(shù)測試采用光譜微分技術(shù),通過吸收光譜可以進行紅邊光譜特征值的提取,便于對發(fā)生不同程度病害紅棗的區(qū)別。對輕度、中度、重度、特重度4個不同級別的黑斑病紅棗在光譜波長480~760 nm進行光譜測試,表2為在光譜反射率取值達到最大時,紅邊位置(Rep)波段和紅谷位置(Lo)的波段。
黑斑病紅棗的紅邊位置(Rep)和紅谷位置(Rep)光譜
樣本數(shù)輕度中度重度特重度RepLoRepLoRepLoRepLo170175270175269875270175127027556997536977527017522969975569975269775269975130698754699752698751701751
1.5紅棗指數(shù)的提取
由于紅棗指數(shù)是由紅棗在光譜吸收、反射與背景之間的關(guān)系決定,通常由多種指標構(gòu)成。通過分析輕度、中度、重度、特重度4個不同級別黑斑病紅棗,在光譜波長460~2 260 nm范圍內(nèi)獲得的光譜數(shù)據(jù),發(fā)現(xiàn)紅棗的紅邊波長集中在680 nm波段范圍,利用式NDVI_m=|Rl-Rm|Rl+Rm(式中l(wèi)表示固定的紅邊波長,m表示檢測紅棗的紅邊波段,Rl表示紅棗固定光譜反射率值,Rm表示相應的紅棗光譜反射率值) 進行歸一化處理,得到的相關(guān)數(shù)據(jù)見表3。
歸一化紅棗光譜指數(shù)值
等級數(shù)據(jù)黑斑病紅棗樣品數(shù)12…2930輕度NDVI-10.048 820.044 49…0.052 050.052 07NDVI-20.667 510.650 14…0.653 450.653 46 NDVI-60.013 220.012 26…0.014 010.014 04中度NDVI-10.051 770.048 21…0.056 960.056 97NDVI-20.630 880.667 29…0.668 180.668 19 NDVI-60.011 110.011 42…0.011 850.011 88重度NDVI-10.745 380.733 03…0.761 050.761 06NDVI-20.058 270.046 78…0.051 140.051 15 NDVI-60.010 770.008 92…0.009 330.009 33特重度NDVI-10.745 390.733 04…0.761 060.761 06NDVI-20.058 270.045 77…0.051 170.051 16 NDVI-60.010 780.00 891…0.009 350.009 36注:NDVI-1至NDVI-6入選波長分別是460、550、680、730、1 200、1 860 nm。
2結(jié)果與分析
2.1發(fā)生病蟲害紅棗的光譜主成分及等級識別相關(guān)度分析
在保證紅棗的光譜信息的前提下,對光譜的相關(guān)信息進行主成分分析,解決分析過程中出現(xiàn)的高光譜波段過多、譜帶重疊的問題[3-5]。利用波段選擇法確定主要成分的波段,結(jié)合PCA的波段選擇算法為等級識別提供變量因子,其中表4和表5分別表示基于PCA黑斑病紅棗一階和二階微分光譜的前10個主成分解釋的變異百分比。在確定主成分后,并進行分類處理,保證原始圖像的相關(guān)信息沒有任何改變。表4發(fā)生病害紅棗一階微分光譜的前10個主成分所占比重(%)
主成分棗銹病紅棗棗瘋病紅棗縮果病紅棗黑斑病紅棗460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nmPC180.41356.28647.16843.28961.01652.65991.59147.202PC27.03818.41237.31226.57120.41312.4623.39129.491PC33.0799.3494.28814.0563.819.7511.01113.431PC42.1325.2492.8295.7562.9813.0280.7526.251PC51.8953.7212.0534.0221.7762.1280.7381.648PC61.0682.1590.8912.1861.1421.8830.4850.785PC70.8131.5380.6010.9050.8421.6990.3860.461PC80.4060.4980.5010.4810.7291.6350.3450.279PC90.3610.3980.4130.4490.6481.2770.2530.101PC100.2990.2890.3570.3680.5561.2460.1760.082總和97.50497.89996.41398.08393.91387.76899.12899.731
發(fā)生病害紅棗二階微分光譜的前10個主成分所占比重(%)
主成分棗銹病紅棗棗瘋病紅棗縮果病紅棗黑斑病紅棗460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nm460~850 nm851~1 450 nmPC147.11251.93928.50843.78745.07274.33466.77160.159PC211.88325.40218.88927.04214.12818.3596.38122.374PC310.1216.4786.2918.6917.0382.7225.0726.324PC47.0725.9294.5034.5194.4811.1684.0963.437PC54.6682.5164.0462.7083.7410.3883.2562.501PC62.6761.4013.4142.1491.8350.3482.7211.742PC72.1481.2693.0911.7791.6780.3032.0830.962PC81.9681.0582.8461.4151.4970.2531.7160.697PC91.4290.5882.5071.1751.3510.2381.4480.407PC101.2680.5592.2571.0191.2120.1981.2790.352總和90.34597.13976.35294.28482.03398.31194.82398.955
2.1.1光譜特征參數(shù)與發(fā)生病害紅棗危害等級識別相關(guān)度分析采用線性和多項式擬合相結(jié)合的方法進行光譜特征參數(shù)與不同等級病害紅棗相關(guān)性分析,確定模型構(gòu)建參數(shù)[4]。光譜特征參數(shù)與不同等級病害紅棗相關(guān)性見表6。
光譜特征參數(shù)與紅棗病蟲等級的相關(guān)性
特征參數(shù)線性擬合多項式擬合相關(guān)系數(shù)誤差相關(guān)系數(shù)誤差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779
2.1.2基于重采樣光譜PCA-RBFN不同病害等級的識別分析在對紅棗的原始光譜進行合適的重新采樣后,仍有196個波段,如果采用全部數(shù)據(jù)輸入徑向基網(wǎng)絡RBFN(radial basis function neural network),數(shù)據(jù)的計算量十分龐大。圖3為經(jīng)過光譜儀進行重采樣光譜的第一主成分(PC1)在檢測的波段范圍內(nèi)的載荷圖。PC1與波長738~1 299 nm的光反射值具有負向比例的關(guān)系,在可見光(<713 nm)和短波紅外(>1 343 nm)波段范圍內(nèi)的相關(guān)性較弱。但是,當Spread為0.000 5時,光譜儀測試結(jié)果的RMSE為65.1%,對紅棗檢測的觀測值和模擬值的相關(guān)系數(shù)為0.141。這說明,經(jīng)過重采樣光譜進行壓縮處理后,對紅棗病蟲害的等級識別,還不能滿足檢測的要求。
2.2南疆紅棗病蟲危害等級識別模型
2.2.1模型構(gòu)建設(shè)X為模型的判斷輸入空間,X={xi}∈Rn,Rn為n維數(shù)據(jù)特征空間值,Y為模型的輸出域,矩陣的判斷主要由2類點組成數(shù)據(jù)方陣,Y={-1,+1}。對于n維數(shù)據(jù)特征樣本值組成的樣本集合S=[(x1,y1),…,(xn,yn)](X×Yn),構(gòu)建一個分析病蟲害的數(shù)據(jù)目標函數(shù),將非線性不可分的輸入空間映射到高維空間,通過形成的數(shù)據(jù)映像,可以有效地形成一個數(shù)據(jù)平面,使得訓練集中的點距離滿足線性要求,經(jīng)過歸一化后,對于紅棗光譜2類線性不可分數(shù)據(jù)樣本集(xn,yn)的分類超平臺應滿足:
yi(<ω·xi>+b)-1+ζi≥0(3)
相應的數(shù)據(jù)處理,就轉(zhuǎn)化為分類數(shù)據(jù)的間隔1/‖ω‖最大值等價于‖ω‖2最小,紅棗優(yōu)化平面的數(shù)據(jù)問題可以轉(zhuǎn)化為約束優(yōu)化問題[6]:
φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)
最終求出最優(yōu)解為:
ω=∑ni=1λiyixi,b=1-ωxs(5)
其中:φ代表Lagrange的函數(shù)值,病蟲害的識別模型轉(zhuǎn)變?yōu)閷Ζ睾蚥求φ函數(shù)的極小值和特征差異值。公式(5)代表垂直于紅棗分類超平面的法向量,代表數(shù)據(jù)的分類閾值,為病蟲害光譜值有效范圍,采用相應的計算公式可以求得;xi為紅棗病蟲害識別模型的輸入向量;C為懲罰系數(shù);ζi為函數(shù)的松弛因子。
從表6中看出光譜特征參數(shù)Rep、Lo、Eepth、NDVI-2、NDVI-4 和紅棗病蟲害等級線性相關(guān),Area、NDVI-3和紅棗病蟲害等級呈明顯多項式,而NDVI-1、NDVI-5、NDVI-6和紅棗病蟲害等級相關(guān)性較小,因此,能夠確定輸入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。測試結(jié)果表明,采用不同核函數(shù) 將獲得不同的分類結(jié)果。根據(jù)紅棗病蟲害等級和光譜特征參數(shù),確定采用徑向基函數(shù)(RBF)形式的核函數(shù),其表達式為:
K(xi,xj)=exp{-γ‖xi-xj‖2}(6)
γ為核參數(shù),構(gòu)建南疆紅棗病蟲害等級識別支持向量機模型為圖4。
2.2.2核參數(shù)及懲罰系數(shù)和分類函數(shù)的確定為獲得較高識別精度,需要對核參數(shù)γ和懲罰系數(shù)C進行測試與分析[7]。其中γ和C取值范圍為[2-12,212]。根據(jù)表7中的數(shù)據(jù),可以區(qū)分南疆紅棗病蟲害等級的支持向量,以及紅棗病蟲害識別模型的的重要影響參數(shù):核參數(shù)(γ)和懲罰系數(shù)(C)。通過計算,取得它們最佳值分別為C=210,γ=2-8。將核參數(shù)(γ)代入式(6),得到核函數(shù)K(xi,xj),將C和K(xi,xj)代入式(7),通過迭代計算,計算出南疆紅棗病蟲害等級分類超平面的垂直法向量ω和分類閾值b。
ω=-2.081 8
2.569 8,b=-0.280 6
-0.113 5
由此,得到分類函數(shù)為:
y=ωx+b=-2.081 8
2.569 8x+-0.280 6
-0.113 5(7)
不同核參數(shù)和懲罰系數(shù)判定準確率
C不同γ下的判定準確率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037
模型對南疆紅棗病蟲害等級識別正確率為98.8%,結(jié)果如表8所示。
樣本識別結(jié)果
級別樣本數(shù)
(個)識別結(jié)果(個)C1C2C3識別正確率
(%)C11201200098.8C212001200C312004116
3結(jié)論
采用高光譜技術(shù)在460~2 260 nm波長對南疆紅棗的吸收光譜的相關(guān)參數(shù)及光譜特性參數(shù)進行提取,并計算輕度、中度、重度、特重度4個不同級別黑斑病紅棗光譜特征參數(shù)與紅棗病蟲害等級識別的相關(guān)度。通過測試和模型識別計算,本研究結(jié)果表明,運用主成分分析法和帶懲罰系數(shù)及核參數(shù)的支持向量機技術(shù),構(gòu)建的模型能夠?qū)崿F(xiàn)南疆紅棗病蟲害等級識別,識別正確率為98.8%,實現(xiàn)了對南疆紅棗病蟲害進行精確的等級識別。
參考文獻:
[1]羅華平,盧啟鵬,丁海泉,等. 南疆紅棗品質(zhì)近紅外光譜在線模型參數(shù)的實驗研究[J]. 光譜學與光譜分析,2012,32(5):1225-1229.
[2]陳兵,李少昆,王克如,等. 病害脅迫下棉花葉片色素含量高光譜遙感估測研究[J]. 光譜學與光譜分析,2010,30(2):421-425.
[3]劉占宇,祝增榮,趙敏,等. 基于主成分分析和人工神經(jīng)網(wǎng)絡的稻穗健康狀態(tài)的高光譜識別[J]. 浙江農(nóng)業(yè)學報,2011,23(3):607-616.
[4]周鵬,張小剛,徐彪,等. 基于高光譜的南疆紅棗病蟲害特征譜段選擇模式[J]. 江蘇農(nóng)業(yè)科學,2013,41(4):108-111.
[5]何勇,李曉麗,邵詠妮. 基于主成分分析和神經(jīng)網(wǎng)絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[6]王秀珍,黃敬峰,李云梅,等. 水稻葉面積指數(shù)的高光譜遙感估算模型[J]. 遙感學報,2004,8(1):81-88.
[7]高洪智,盧啟鵬,丁海泉. 近紅外無創(chuàng)生化檢測中不同光程的光譜校正模型研究[J]. 光譜學與光譜分析,2012,32(5):1423-1426.葉小嶺,趙二擺,朱春陽. 基于Android智能手機的戶用沼氣池管理系統(tǒng)[J]. 江蘇農(nóng)業(yè)科學,2014,42(6):358-360.
2.1.1光譜特征參數(shù)與發(fā)生病害紅棗危害等級識別相關(guān)度分析采用線性和多項式擬合相結(jié)合的方法進行光譜特征參數(shù)與不同等級病害紅棗相關(guān)性分析,確定模型構(gòu)建參數(shù)[4]。光譜特征參數(shù)與不同等級病害紅棗相關(guān)性見表6。
光譜特征參數(shù)與紅棗病蟲等級的相關(guān)性
特征參數(shù)線性擬合多項式擬合相關(guān)系數(shù)誤差相關(guān)系數(shù)誤差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779
2.1.2基于重采樣光譜PCA-RBFN不同病害等級的識別分析在對紅棗的原始光譜進行合適的重新采樣后,仍有196個波段,如果采用全部數(shù)據(jù)輸入徑向基網(wǎng)絡RBFN(radial basis function neural network),數(shù)據(jù)的計算量十分龐大。圖3為經(jīng)過光譜儀進行重采樣光譜的第一主成分(PC1)在檢測的波段范圍內(nèi)的載荷圖。PC1與波長738~1 299 nm的光反射值具有負向比例的關(guān)系,在可見光(<713 nm)和短波紅外(>1 343 nm)波段范圍內(nèi)的相關(guān)性較弱。但是,當Spread為0.000 5時,光譜儀測試結(jié)果的RMSE為65.1%,對紅棗檢測的觀測值和模擬值的相關(guān)系數(shù)為0.141。這說明,經(jīng)過重采樣光譜進行壓縮處理后,對紅棗病蟲害的等級識別,還不能滿足檢測的要求。
2.2南疆紅棗病蟲危害等級識別模型
2.2.1模型構(gòu)建設(shè)X為模型的判斷輸入空間,X={xi}∈Rn,Rn為n維數(shù)據(jù)特征空間值,Y為模型的輸出域,矩陣的判斷主要由2類點組成數(shù)據(jù)方陣,Y={-1,+1}。對于n維數(shù)據(jù)特征樣本值組成的樣本集合S=[(x1,y1),…,(xn,yn)](X×Yn),構(gòu)建一個分析病蟲害的數(shù)據(jù)目標函數(shù),將非線性不可分的輸入空間映射到高維空間,通過形成的數(shù)據(jù)映像,可以有效地形成一個數(shù)據(jù)平面,使得訓練集中的點距離滿足線性要求,經(jīng)過歸一化后,對于紅棗光譜2類線性不可分數(shù)據(jù)樣本集(xn,yn)的分類超平臺應滿足:
yi(<ω·xi>+b)-1+ζi≥0(3)
相應的數(shù)據(jù)處理,就轉(zhuǎn)化為分類數(shù)據(jù)的間隔1/‖ω‖最大值等價于‖ω‖2最小,紅棗優(yōu)化平面的數(shù)據(jù)問題可以轉(zhuǎn)化為約束優(yōu)化問題[6]:
φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)
最終求出最優(yōu)解為:
ω=∑ni=1λiyixi,b=1-ωxs(5)
其中:φ代表Lagrange的函數(shù)值,病蟲害的識別模型轉(zhuǎn)變?yōu)閷Ζ睾蚥求φ函數(shù)的極小值和特征差異值。公式(5)代表垂直于紅棗分類超平面的法向量,代表數(shù)據(jù)的分類閾值,為病蟲害光譜值有效范圍,采用相應的計算公式可以求得;xi為紅棗病蟲害識別模型的輸入向量;C為懲罰系數(shù);ζi為函數(shù)的松弛因子。
從表6中看出光譜特征參數(shù)Rep、Lo、Eepth、NDVI-2、NDVI-4 和紅棗病蟲害等級線性相關(guān),Area、NDVI-3和紅棗病蟲害等級呈明顯多項式,而NDVI-1、NDVI-5、NDVI-6和紅棗病蟲害等級相關(guān)性較小,因此,能夠確定輸入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。測試結(jié)果表明,采用不同核函數(shù) 將獲得不同的分類結(jié)果。根據(jù)紅棗病蟲害等級和光譜特征參數(shù),確定采用徑向基函數(shù)(RBF)形式的核函數(shù),其表達式為:
K(xi,xj)=exp{-γ‖xi-xj‖2}(6)
γ為核參數(shù),構(gòu)建南疆紅棗病蟲害等級識別支持向量機模型為圖4。
2.2.2核參數(shù)及懲罰系數(shù)和分類函數(shù)的確定為獲得較高識別精度,需要對核參數(shù)γ和懲罰系數(shù)C進行測試與分析[7]。其中γ和C取值范圍為[2-12,212]。根據(jù)表7中的數(shù)據(jù),可以區(qū)分南疆紅棗病蟲害等級的支持向量,以及紅棗病蟲害識別模型的的重要影響參數(shù):核參數(shù)(γ)和懲罰系數(shù)(C)。通過計算,取得它們最佳值分別為C=210,γ=2-8。將核參數(shù)(γ)代入式(6),得到核函數(shù)K(xi,xj),將C和K(xi,xj)代入式(7),通過迭代計算,計算出南疆紅棗病蟲害等級分類超平面的垂直法向量ω和分類閾值b。
ω=-2.081 8
2.569 8,b=-0.280 6
-0.113 5
由此,得到分類函數(shù)為:
y=ωx+b=-2.081 8
2.569 8x+-0.280 6
-0.113 5(7)
不同核參數(shù)和懲罰系數(shù)判定準確率
C不同γ下的判定準確率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037
模型對南疆紅棗病蟲害等級識別正確率為98.8%,結(jié)果如表8所示。
樣本識別結(jié)果
級別樣本數(shù)
(個)識別結(jié)果(個)C1C2C3識別正確率
(%)C11201200098.8C212001200C312004116
3結(jié)論
采用高光譜技術(shù)在460~2 260 nm波長對南疆紅棗的吸收光譜的相關(guān)參數(shù)及光譜特性參數(shù)進行提取,并計算輕度、中度、重度、特重度4個不同級別黑斑病紅棗光譜特征參數(shù)與紅棗病蟲害等級識別的相關(guān)度。通過測試和模型識別計算,本研究結(jié)果表明,運用主成分分析法和帶懲罰系數(shù)及核參數(shù)的支持向量機技術(shù),構(gòu)建的模型能夠?qū)崿F(xiàn)南疆紅棗病蟲害等級識別,識別正確率為98.8%,實現(xiàn)了對南疆紅棗病蟲害進行精確的等級識別。
參考文獻:
[1]羅華平,盧啟鵬,丁海泉,等. 南疆紅棗品質(zhì)近紅外光譜在線模型參數(shù)的實驗研究[J]. 光譜學與光譜分析,2012,32(5):1225-1229.
[2]陳兵,李少昆,王克如,等. 病害脅迫下棉花葉片色素含量高光譜遙感估測研究[J]. 光譜學與光譜分析,2010,30(2):421-425.
[3]劉占宇,祝增榮,趙敏,等. 基于主成分分析和人工神經(jīng)網(wǎng)絡的稻穗健康狀態(tài)的高光譜識別[J]. 浙江農(nóng)業(yè)學報,2011,23(3):607-616.
[4]周鵬,張小剛,徐彪,等. 基于高光譜的南疆紅棗病蟲害特征譜段選擇模式[J]. 江蘇農(nóng)業(yè)科學,2013,41(4):108-111.
[5]何勇,李曉麗,邵詠妮. 基于主成分分析和神經(jīng)網(wǎng)絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[6]王秀珍,黃敬峰,李云梅,等. 水稻葉面積指數(shù)的高光譜遙感估算模型[J]. 遙感學報,2004,8(1):81-88.
[7]高洪智,盧啟鵬,丁海泉. 近紅外無創(chuàng)生化檢測中不同光程的光譜校正模型研究[J]. 光譜學與光譜分析,2012,32(5):1423-1426.葉小嶺,趙二擺,朱春陽. 基于Android智能手機的戶用沼氣池管理系統(tǒng)[J]. 江蘇農(nóng)業(yè)科學,2014,42(6):358-360.
2.1.1光譜特征參數(shù)與發(fā)生病害紅棗危害等級識別相關(guān)度分析采用線性和多項式擬合相結(jié)合的方法進行光譜特征參數(shù)與不同等級病害紅棗相關(guān)性分析,確定模型構(gòu)建參數(shù)[4]。光譜特征參數(shù)與不同等級病害紅棗相關(guān)性見表6。
光譜特征參數(shù)與紅棗病蟲等級的相關(guān)性
特征參數(shù)線性擬合多項式擬合相關(guān)系數(shù)誤差相關(guān)系數(shù)誤差Rep0.924 80.2910.913 80.245Lo0.721 10.5730.569 60.545Depth0.789 80.5050.802 70.374Area0.700 60.5020.808 90.371NDVI-10.431 50.7830.238 60.779NDVI-20.679 80.5810.633 50.583NDVI-30.763 50.5150.948 80.198NDVI-40.699 80.5390.616 60.535NDVI-50.158 10.8330.061 50.823NDVI-60.347 80.7980.098 80.779
2.1.2基于重采樣光譜PCA-RBFN不同病害等級的識別分析在對紅棗的原始光譜進行合適的重新采樣后,仍有196個波段,如果采用全部數(shù)據(jù)輸入徑向基網(wǎng)絡RBFN(radial basis function neural network),數(shù)據(jù)的計算量十分龐大。圖3為經(jīng)過光譜儀進行重采樣光譜的第一主成分(PC1)在檢測的波段范圍內(nèi)的載荷圖。PC1與波長738~1 299 nm的光反射值具有負向比例的關(guān)系,在可見光(<713 nm)和短波紅外(>1 343 nm)波段范圍內(nèi)的相關(guān)性較弱。但是,當Spread為0.000 5時,光譜儀測試結(jié)果的RMSE為65.1%,對紅棗檢測的觀測值和模擬值的相關(guān)系數(shù)為0.141。這說明,經(jīng)過重采樣光譜進行壓縮處理后,對紅棗病蟲害的等級識別,還不能滿足檢測的要求。
2.2南疆紅棗病蟲危害等級識別模型
2.2.1模型構(gòu)建設(shè)X為模型的判斷輸入空間,X={xi}∈Rn,Rn為n維數(shù)據(jù)特征空間值,Y為模型的輸出域,矩陣的判斷主要由2類點組成數(shù)據(jù)方陣,Y={-1,+1}。對于n維數(shù)據(jù)特征樣本值組成的樣本集合S=[(x1,y1),…,(xn,yn)](X×Yn),構(gòu)建一個分析病蟲害的數(shù)據(jù)目標函數(shù),將非線性不可分的輸入空間映射到高維空間,通過形成的數(shù)據(jù)映像,可以有效地形成一個數(shù)據(jù)平面,使得訓練集中的點距離滿足線性要求,經(jīng)過歸一化后,對于紅棗光譜2類線性不可分數(shù)據(jù)樣本集(xn,yn)的分類超平臺應滿足:
yi(<ω·xi>+b)-1+ζi≥0(3)
相應的數(shù)據(jù)處理,就轉(zhuǎn)化為分類數(shù)據(jù)的間隔1/‖ω‖最大值等價于‖ω‖2最小,紅棗優(yōu)化平面的數(shù)據(jù)問題可以轉(zhuǎn)化為約束優(yōu)化問題[6]:
φ(ω,b,λ)=12‖ω‖2+C∑ni=1ζi-∑ni,j=1λiλj{yiyj[K(xi,xj)+b]-1}(4)
最終求出最優(yōu)解為:
ω=∑ni=1λiyixi,b=1-ωxs(5)
其中:φ代表Lagrange的函數(shù)值,病蟲害的識別模型轉(zhuǎn)變?yōu)閷Ζ睾蚥求φ函數(shù)的極小值和特征差異值。公式(5)代表垂直于紅棗分類超平面的法向量,代表數(shù)據(jù)的分類閾值,為病蟲害光譜值有效范圍,采用相應的計算公式可以求得;xi為紅棗病蟲害識別模型的輸入向量;C為懲罰系數(shù);ζi為函數(shù)的松弛因子。
從表6中看出光譜特征參數(shù)Rep、Lo、Eepth、NDVI-2、NDVI-4 和紅棗病蟲害等級線性相關(guān),Area、NDVI-3和紅棗病蟲害等級呈明顯多項式,而NDVI-1、NDVI-5、NDVI-6和紅棗病蟲害等級相關(guān)性較小,因此,能夠確定輸入向量Rep、Lo、Depth、Area、NDVI-2、NDVI-3、NDVI-4。測試結(jié)果表明,采用不同核函數(shù) 將獲得不同的分類結(jié)果。根據(jù)紅棗病蟲害等級和光譜特征參數(shù),確定采用徑向基函數(shù)(RBF)形式的核函數(shù),其表達式為:
K(xi,xj)=exp{-γ‖xi-xj‖2}(6)
γ為核參數(shù),構(gòu)建南疆紅棗病蟲害等級識別支持向量機模型為圖4。
2.2.2核參數(shù)及懲罰系數(shù)和分類函數(shù)的確定為獲得較高識別精度,需要對核參數(shù)γ和懲罰系數(shù)C進行測試與分析[7]。其中γ和C取值范圍為[2-12,212]。根據(jù)表7中的數(shù)據(jù),可以區(qū)分南疆紅棗病蟲害等級的支持向量,以及紅棗病蟲害識別模型的的重要影響參數(shù):核參數(shù)(γ)和懲罰系數(shù)(C)。通過計算,取得它們最佳值分別為C=210,γ=2-8。將核參數(shù)(γ)代入式(6),得到核函數(shù)K(xi,xj),將C和K(xi,xj)代入式(7),通過迭代計算,計算出南疆紅棗病蟲害等級分類超平面的垂直法向量ω和分類閾值b。
ω=-2.081 8
2.569 8,b=-0.280 6
-0.113 5
由此,得到分類函數(shù)為:
y=ωx+b=-2.081 8
2.569 8x+-0.280 6
-0.113 5(7)
不同核參數(shù)和懲罰系數(shù)判定準確率
C不同γ下的判定準確率(%)2624222-12-22-42-62-8212878787879197988721089898989919699892888888888889696882683838383838895832472727272727284722262626262626272622-241414141414154412-438383838383843382-63737373737374037
模型對南疆紅棗病蟲害等級識別正確率為98.8%,結(jié)果如表8所示。
樣本識別結(jié)果
級別樣本數(shù)
(個)識別結(jié)果(個)C1C2C3識別正確率
(%)C11201200098.8C212001200C312004116
3結(jié)論
采用高光譜技術(shù)在460~2 260 nm波長對南疆紅棗的吸收光譜的相關(guān)參數(shù)及光譜特性參數(shù)進行提取,并計算輕度、中度、重度、特重度4個不同級別黑斑病紅棗光譜特征參數(shù)與紅棗病蟲害等級識別的相關(guān)度。通過測試和模型識別計算,本研究結(jié)果表明,運用主成分分析法和帶懲罰系數(shù)及核參數(shù)的支持向量機技術(shù),構(gòu)建的模型能夠?qū)崿F(xiàn)南疆紅棗病蟲害等級識別,識別正確率為98.8%,實現(xiàn)了對南疆紅棗病蟲害進行精確的等級識別。
參考文獻:
[1]羅華平,盧啟鵬,丁海泉,等. 南疆紅棗品質(zhì)近紅外光譜在線模型參數(shù)的實驗研究[J]. 光譜學與光譜分析,2012,32(5):1225-1229.
[2]陳兵,李少昆,王克如,等. 病害脅迫下棉花葉片色素含量高光譜遙感估測研究[J]. 光譜學與光譜分析,2010,30(2):421-425.
[3]劉占宇,祝增榮,趙敏,等. 基于主成分分析和人工神經(jīng)網(wǎng)絡的稻穗健康狀態(tài)的高光譜識別[J]. 浙江農(nóng)業(yè)學報,2011,23(3):607-616.
[4]周鵬,張小剛,徐彪,等. 基于高光譜的南疆紅棗病蟲害特征譜段選擇模式[J]. 江蘇農(nóng)業(yè)科學,2013,41(4):108-111.
[5]何勇,李曉麗,邵詠妮. 基于主成分分析和神經(jīng)網(wǎng)絡的近紅外光譜蘋果品種鑒別方法研究[J]. 光譜學與光譜分析,2006,26(5):850-853.
[6]王秀珍,黃敬峰,李云梅,等. 水稻葉面積指數(shù)的高光譜遙感估算模型[J]. 遙感學報,2004,8(1):81-88.
[7]高洪智,盧啟鵬,丁海泉. 近紅外無創(chuàng)生化檢測中不同光程的光譜校正模型研究[J]. 光譜學與光譜分析,2012,32(5):1423-1426.葉小嶺,趙二擺,朱春陽. 基于Android智能手機的戶用沼氣池管理系統(tǒng)[J]. 江蘇農(nóng)業(yè)科學,2014,42(6):358-360.