邵園園 王永賢 玄冠濤,2 高 沖 王凱麗 高宗梅
(1.山東農(nóng)業(yè)大學機械與電子工程學院, 泰安 271018; 2.山東省農(nóng)業(yè)裝備智能化工程實驗室, 泰安 271018;3.華盛頓州立大學精細與自動化農(nóng)業(yè)研究中心, 普羅瑟 99350)
肥城桃因產(chǎn)于山東省肥城市而得名,以個大味美、營養(yǎng)豐富享譽中外[1]。肥城桃屬于典型呼吸躍變型果實,鮮桃采摘后轉(zhuǎn)色快、果肉易發(fā)生褐變,進而導致軟化與腐爛[2-3]。鮮食和短期貯藏肥城桃,宜在成熟度90%左右時采摘,若遠途運輸銷售和長期貯藏,最好在成熟度70%時收獲。尋求快速、高效的檢測方法,對肥城桃進行品質(zhì)檢測與成熟度鑒別,可以提高果品質(zhì)量,實現(xiàn)優(yōu)果優(yōu)價。
高光譜成像技術(shù)將光譜與傳統(tǒng)圖像相結(jié)合,可以同時獲取目標的空間和光譜信息,具有簡便、快速、無損、準確等優(yōu)點,已成功用于水果成熟度檢測和果品分析[4-7]。文獻[8]利用高光譜成像技術(shù)對不同成熟度櫻桃進行分類,建立了櫻桃果實pH值和可溶性固形物含量預測模型,從而實現(xiàn)了櫻桃品質(zhì)可視化。文獻[9]應用高光譜成像技術(shù),結(jié)合特征波長對冬棗成熟度進行可視化判別,采用多種方法選擇特征波長,建立的PLS-DA模型判別精度可達90%以上。文獻[10]采用高光譜成像技術(shù),結(jié)合多個數(shù)據(jù)集的支持向量機分類模型,對草莓成熟度進行了評價。此外,高光譜成像技術(shù)結(jié)合化學計量學方法在藍莓、柿子、香蕉等水果成熟度分析及品質(zhì)評價方面也取得了較好效果[11-13]。但關(guān)于肥城桃品質(zhì)與成熟度高光譜成像檢測的研究鮮有報道。
本文以肥城桃為研究對象,采集兩種成熟度(70%和90%)鮮桃的高光譜信息,建立光譜信息與可溶性固形物含量(Soluble solids content,SSC)、硬度回歸模型,進行果品可視化分析與成熟度檢測。
不同成熟度肥城桃如圖1所示,成熟度70%(青熟期):桃子表面綠色逐漸褪減,整個果實表面少量著色,果實基本發(fā)育成型,質(zhì)地較硬,耐貯藏。成熟度90%(轉(zhuǎn)色期):果實表面大都著色,極少部分區(qū)域呈淡黃色,果實稍有彈性,少量區(qū)域變軟,香味濃郁?!敖鹎锿衩邸狈食翘曳N植于山東省肥城市劉臺肥桃合作社果園,采摘時間為2019年9月14日上午,在有經(jīng)驗的果農(nóng)指導下,隨機采摘兩種成熟度肥城桃并用水果泡沫網(wǎng)套包裹放入保鮮盒,運回實驗室。選取形狀大小均勻,無斑點、無疤痕的肥城桃作為實驗樣本,獲得兩種成熟度肥城桃樣本各80個,對選取的樣本進行編號,成熟度70%樣本編號1~80,成熟度90%樣本編號81~160,按照編號順序進行光譜數(shù)據(jù)的采集和理化性質(zhì)的測定。
圖1 桃子樣本Fig.1 Peach samples
1.2.1高光譜成像系統(tǒng)
GaiaField型便攜式高光譜系統(tǒng)(四川雙利合譜科技有限公司)組成如圖2所示,主要包括GaiaField-V10E型高光譜成像儀、1 392像素×1 040像素HSIA-OL23型成像鏡頭、4組HSIA-LS-T-200W型對稱分布專用光源、HSIA-TP-S型三腳架以及配有高光譜數(shù)據(jù)采集軟件SpecView的專用計算機等。光譜范圍為400~1 000 nm,光譜分辨率2.8 nm,有效狹縫長度9.8 mm,入射狹縫寬30 μm,視場角22°。通過創(chuàng)建400~1 000 nm的三維光譜立方體,研究所選像素特征,分析不同波長圖像,進行果品檢測與成熟度鑒別。
圖2 高光譜成像系統(tǒng)Fig.2 Hyperspectral imaging system1.高光譜儀 2.鏡頭 3.光源 4.肥城桃樣本 5.計算機
1.2.2圖像采集和校準
從保鮮盒取出桃子,待其恢復常溫(20℃)后,采集光譜數(shù)據(jù)。為了得到清晰圖像,將樣本與鏡頭距離設(shè)置為300 mm,相機曝光時間設(shè)置為15.2 ms。對高光譜成像系統(tǒng)進行黑白校正[14],以消除光照及相機暗電流等對圖像影響。全黑標定圖像Idark、全白標定圖像Iwhite分別通過遮蓋鏡頭、掃描標準白板獲得,校正圖像Ic為
(1)
式中Iraw——原始圖像
利用軟件ENVI 4.6(美國Exelis VIS公司)提取440像素×440像素感興趣區(qū)域(Region of interst,RoI)高光譜數(shù)據(jù),將RoI內(nèi)所有光譜信息的平均值作為對應反射光譜值。
肥城桃硬度測定使用GY-1型指針式水果硬度計(浙江托普云農(nóng)科技股份有限公司),測頭直徑3.5 mm,下壓深度10 mm,測試速度0.5 mm/s,選取RoI區(qū)域上、中、下3個位置進行測量,每個位置去除1 cm2左右果皮后進行測定,取3個位置平均值為硬度測定值。使用PAL-1型數(shù)顯折射儀(日本愛拓公司)進行SSC測定,3個位置上的測量平均值為肥城桃SSC測定值。
1.4.1異常值剔除
肥城桃光譜數(shù)據(jù)采集及SSC和硬度測定時,由于儀器、環(huán)境和人為操作等因素產(chǎn)生數(shù)據(jù)誤差,影響模型準確性,應對異常值進行剔除。蒙特卡羅偏最小二乘(Monte Carlo-partial least squares, MCPLS)法以蒙特卡羅交互驗證為基礎(chǔ),能夠同時檢測光譜異常值和理化性質(zhì)異常值,根據(jù)交叉驗證均方根誤差(Root mean square error of cross validation, RMSECV)最小原則確定最佳主成分數(shù),通過計算樣本預測誤差均值和標準差,具有較高均值和標準差的樣本為異常樣本[15-16]。
1.4.2樣本集劃分
采用光譜-理化值共生距離(Samples set partitioning based on joint X-Y distances, SPXY)[17]對經(jīng)過樣本剔除操作的SSC、硬度按2∶1比例進行建模集和預測集劃分。通過計算建模集和預測集樣本的最大值、最小值、平均值和標準偏差來評估樣本劃分是否合理。
1.4.3特征波長選取
由于全光譜含有256個波長變量,大量共線性波長會導致信息冗余,從而增加計算量降低建模效率。采用競爭性自適應權(quán)重采樣(Competitive adaptive reweighted sampling, CARS)算法、連續(xù)投影(Successive projections algorithm, SPA)算法和順序前向選擇(Sequential forward selection, SFS)算法進行特征波長選取。
CARS算法是一種基于適者生存和回歸系數(shù)進行波長選擇的有效方法,先利用PLS(偏最小二乘)模型篩選回歸系數(shù)大的波長,再通過十折交叉驗證優(yōu)選出均方根誤差最小的波長子集[18]。SPA算法是一種前向循環(huán)的特征變量篩選方法,能夠濾除無效信息,大大降低數(shù)據(jù)間的共線性影響[19]。SFS算法作為機器學習中的啟發(fā)式搜索方法,從一個空的特征子集開始自上而下搜索,每次將一個未選特征加入特征子集,使特征函數(shù)達到最優(yōu)[20]。
1.4.4回歸和分類模型的建立與評價
多元線性回歸(Multiple linear regression, MLR)是一種常用的建模方法,能夠建立多個自變量與因變量的關(guān)系模型[19]。而MLR適用于變量數(shù)少于樣本數(shù)的情況,所以本研究只對CARS和SPA算法提取的波長建立MLR模型。
人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network, ANN)是模擬人的大腦結(jié)構(gòu)而產(chǎn)生的,由大量的神經(jīng)元聯(lián)接構(gòu)成,具有很強的非線性函數(shù)逼近能力,擁有強大的容錯性[6]。本研究采用ANN對SFS算法提取的特征波長建立成熟度分類模型。
去掉首尾噪聲,對400~1 000 nm內(nèi)256個波段進行光譜特征分析,獲得肥城桃全部樣本光譜曲線和平均光譜曲線如圖3所示。由圖3可以看出,不同成熟度肥城桃的平均光譜曲線變化趨勢基本一致,450~650 nm間兩光譜曲線差距較大,說明不同成熟度肥城桃成分含量存在差異。其中,420 nm和680 nm附近光譜吸收峰主要由肥城桃中類胡蘿卜素和葉綠素吸收光譜引起[23-24],成熟度70%肥城桃由于含有更多的葉綠素,在680 nm處有較大吸收峰。740 nm和980 nm附近吸收峰與桃子內(nèi)部水分有關(guān),分別為O—H三級和二級倍頻特征吸收峰[25-26]。830 nm附近吸收峰反映了肥城桃含糖量[18]。
圖3 肥城桃光譜曲線Fig.3 Spectral curves of Feicheng peach
圖4 SSC蒙特卡羅偏最小二乘法檢測結(jié)果Fig.4 SSC Monte Carlo-partial least squares for removing outliers from peach samples
采用SPXY對剔除異常值的SSC和未進行剔除異常值的硬度分別結(jié)合光譜值進行數(shù)據(jù)集劃分,結(jié)果如表1所示。由表1可以看出,建模集包含SSC和硬度的最大值和最小值,且分布范圍較廣,樣本集劃分合理。
表1 肥城桃SSC和硬度Tab.1 SSC and firmness values of Feicheng peach
為了提高運行速度,挑選共線性最小、冗余最少的波長,采用CARS和SPA算法提取特征波長用來建立回歸模型。圖5a為CARS算法選擇SSC特征波長過程,運行次數(shù)為72時,選取波長數(shù)為42個,占波長總量16.4%。圖5b為CARS算法選擇硬度特征波長過程,運行次數(shù)為52時,選取波長數(shù)為40個,占波長總量15.6%。
圖5 CARS挑選特征波長過程Fig.5 Effective wavelength selected by CARS
圖6a為SPA算法優(yōu)選SSC特征波長分布,指定波長數(shù)N=5~30,共優(yōu)選出11個光譜波長,占波長總量4.3%;圖6b為SPA算法優(yōu)選硬度特征波長分布,指定波長數(shù)N=10~30,共優(yōu)選出11個光譜波長,同樣占波長總量4.3%。
相應地,以特定波長處光譜反射率X(下角標數(shù)字表示波長,單位nm)為自變量,建立預測SSC、硬度的CARS-MLR 模型
圖6 SPA優(yōu)選波長分布Fig.6 Distributions of wavelengths selected by SPA
表2 基于不同波長選擇方法的SSC和硬度MLR模型的性能Tab.2 Performance of MLR models of SSC and firmness based on different wavelength selection methods
圖7 SSC和硬度實測值與預測值散點圖Fig.7 Scatter plots of measured versus predicted values of SSC and firmness
Yssc=14.527-14.517X406-2.364X440+57.001X471- 29.217X506+15.690X565-44.734X617+218.637X667- 298.141X692+147.576X728-126.725X766+ 73.790X805+84.811X880-70.015X933-8.60X981
(2)
YF=6.436-51.386X411-41.118X423+44.069X457+ 85.159X493-78.627X540+38.268X570-18.434X627+ 46.731X687-101.082X703+282.756X769-4.736X800- 258.614X862-0.653X920+90.416X957-41.789X989
(3)
利用CARS-MLR模型估算肥城桃每個像素點SSC和硬度,運用偽彩圖處理技術(shù)生成SSC和硬度分布圖,不同顏色和深淺程度代表不同成熟度肥城桃SSC和硬度,結(jié)果如圖8所示。圖8a中,成熟度90%桃子主要呈深黃色,SSC集中在12~15°Brix,成熟度70%桃子主要呈淺黃色,SSC集中在10~13°Brix,成熟度90%桃子SSC高于成熟度70%桃子。圖8b中,成熟度90%桃子主要呈淺綠色,硬度集中在3~8 kg/cm2,成熟度70%桃子主要呈淺黃色和綠色,硬度集中在6~12 kg/cm2,成熟度70%桃子硬度高于成熟度90%桃子。SSC圖中桃子外藍色區(qū)域及硬度圖中桃子外紫色區(qū)域為采集背景。利用SSC和硬度可視化分布圖有助于在線檢測桃子品質(zhì)。
圖8 不同成熟度肥城桃SSC和硬度分布圖Fig.8 SSC and firmness distribution map of peach in different maturities
為了快速準確預測肥城桃成熟度,采用SFS算法進行特征波長提取。搜索過程中,SFS算法分別以14.120、13.432和12.613的標準值挑選出3個特征波長493、530、720 nm,如圖9所示。以SFS特征波長為輸入,建立ANN預測模型。對虛擬等級值分別為0、1的成熟度70%、成熟度90%肥城桃樣本按5∶3劃分建模集和預測集,參數(shù)設(shè)置為:最大訓練次數(shù)100、學習速率0.1、目標誤差0.1。通過混淆矩陣圖10可以看出,肥城桃成熟度預測總準確率為98.3%,結(jié)果較為理想。
圖9 SFS挑選特征波長Fig.9 Feature wavelengths selected by using SFS
圖10 混淆矩陣Fig.10 Confusion matrix
(2)利用CARS-MLR預測模型計算不同成熟度肥城桃每個像素點的SSC和硬度,生成可視化分布圖,實現(xiàn)不同成熟度肥城桃SSC和硬度的無損評價,有助于肥城桃品質(zhì)在線檢測。
(3)基于SFS特征波長建立ANN模型,對采后肥城桃進行成熟度預測,獲得98.3%的總識別準確率,說明高光譜成像技術(shù)能夠?qū)崿F(xiàn)肥城桃成熟度的檢測。