孫旭東,廖琪城,韓 熹,Hasan Aydin,謝冬福,龔志遠,付 偉,王欣鵬
1.華東交通大學機電與車輛工程學院,江西 南昌 330013 2.載運工具與裝備教育部重點實驗室(華東交通大學),江西 南昌 330013 3.北京偉創(chuàng)英圖科技有限公司,北京 100070 4.International Agricultural Research and Training Center(IARTC), Turkey
茶葉是受消費者青睞的健康飲品。但茶葉在機器采摘過程中,茶蟲和茶梗極易被機器誤割,形成外源性昆蟲異物和內(nèi)源性茶梗異物,污染茶葉原材料。在食品異物投訴事件中,昆蟲異物投訴比例高達25%[1]。昆蟲和茶梗屬于低密度有機異物,主流的X射線成像檢測技術(shù)很難適用[1-4]。迫切需要研發(fā)在線檢測技術(shù),在茶葉加工過程中實施在線檢測。
基于硅基探測器的短波近紅外光譜,波長范圍位于500~1 000 nm之間,具有低成本、穩(wěn)定、快速、無損等優(yōu)點[5],適于集成在食品生產(chǎn)線上,實施在線檢測,滿足食品行業(yè)的低成本檢測需求。研究人員開展了食品異物近紅外光譜檢測研究,Biancolillo等[6]采用近紅外光譜判別蟲蝕大米,正確識別率為97.5%。Moscetti等[7-8]應(yīng)用近紅外光譜檢測橄欖和板栗中的害蟲,利用遺傳算法篩選出6個特征變量建模,模型的錯誤判別率分別為6.25%和8.41%。Wang等[9]應(yīng)用近紅外光譜的透射、反射和混合三種模式檢測蟲蝕紅棗,正確識別率分別為97.0%,90.0%和100%。Jamshidi等[10]應(yīng)用近紅外光譜檢測石榴螟和角豆蛾,模型的正確識別率為90.6%。
近紅外光譜和圖像融合,能同時提供被測物料的光譜和圖像信息,為農(nóng)業(yè)食品物料檢測提供了新手段。例如,Tashima等[11]開發(fā)了一套基于SLD陣列和CMOS傳感器的近紅外在線檢測設(shè)備,將3 mm寬的昆蟲和0.1 mm直徑的毛發(fā)分別嵌入到5 mm厚的火腿和巧克力中,昆蟲和毛發(fā)均被成功檢出。Phetchalern等[12]開發(fā)了一套近紅外透射設(shè)備,由激光二極管和CMOS相機組成,利用透射圖像能觀察到2mm厚火腿片下的木棒(直徑為0.3 mm)、30 mm厚魚肉和20 mm厚雞翅中的骨頭。Yin等[13]應(yīng)用近紅外光譜結(jié)合圖像,檢測面包片上黏附的金屬、聚丙烯塑料和毛發(fā)異物,近紅外光譜能進行精確的點測量,模型的正確識別率分別為98%,94%和91%;而圖像提供了大范圍的檢測手段,改進U-net模型的正確識別率分別為95%,93%和92%。
食品異物檢測的關(guān)鍵在于充分利用食品基質(zhì)和異物的差異性。近紅外光譜和RGB圖像主要應(yīng)用食品基質(zhì)和異物的分光反射特性實施檢測,而熒光圖像利用紫外誘導物料產(chǎn)生熒光的特性進行檢測。Lohumi等[14]開發(fā)了一種基于LCTF的熒光多光譜成像設(shè)備,選取特定的熒光波長對鮮切蔬菜進行檢測,結(jié)果表明,熒光圖像與RGB圖像結(jié)合,可以檢出透明的彩色塑料片、殘皮、不同種類的昆蟲、小金屬片和不同種類的木片,包括原木(深色)和加工過的木材,如牙簽和耳塞等異物,正確識別率達到了95%。但LCTF熒光成像設(shè)備昂貴,很難滿足農(nóng)業(yè)和食品行業(yè)低成本的檢測需求。紫外光誘導熒光是低成本、易實現(xiàn)的熒光成像技術(shù),適合農(nóng)業(yè)和食品物料的低成本檢測需求。Everard等[15]搭建了一套推掃式高光譜成像系統(tǒng),當菠菜表面的糞便濃度處于1∶1到1∶10范圍時,熒光圖像對糞便污染的檢出率均為100%;而紫外圖像對1∶20和1∶30稀釋程度糞便的檢出率分別為99%和87%。Mustafic等[16]研制了一種以藍光和紫外光為激發(fā)光源、單反相機采集熒光圖像的設(shè)備,對棉花中的8種植物性異物(樹皮、苞片、棕葉、綠葉、外殼、種皮、種子、莖)和4種非植物性異物(紙、麻繩、塑料包裝、塑料袋)進行檢測,結(jié)果表明所有異物均可激發(fā)熒光,并且藍色LED為樹皮、棕葉、苞片、綠葉、殼和莖的最佳激發(fā)光,而紫外LED為紙張、塑料袋、塑料包裝、種子、種皮和麻繩的最佳激發(fā)光。但圖像檢測過程中,由于物料的堆疊或者異物被掩蓋,容易形成誤判。電磁振動能較好地實現(xiàn)食品基質(zhì)和異物的分離,提高檢測精度,是圖像檢測的有效輔助手段。
綜上,近紅外光譜主要反映食品基質(zhì)和異物的分光反射特性,熒光圖像反映食品基質(zhì)和異物的形狀和色素含量差異。本論文主要研究(1)基于近紅外光譜的昆蟲和茶梗異物在線檢測方法。(2)電磁振動上料輔助熒光圖像的昆蟲和茶梗異物在線檢測方法。
茶葉在機器采摘過程中,茶梗和昆蟲極易被機器誤割,混入原葉中形成內(nèi)源性和外源性異物。綠茶占茶葉總產(chǎn)量的70%,是我國的主要茶葉飲品,故選用龍井綠茶作為實驗樣品,由南昌某茶葉公司提供。昆蟲異物選擇面包蟲,長度和直徑分別為10~20和1~1.5 mm;茶梗異物的長度和直徑分別為12~35和1~2 mm。將所用的茶葉、茶梗以及面包蟲清洗干凈后,置于烘干箱中。烘干箱溫度控制在48 ℃左右,烘干時間為12 h。烘干后,取出樣品分別裝載在自封袋內(nèi)備用。
近紅外光譜和熒光成像系統(tǒng)如圖1所示,由北京偉創(chuàng)英圖科技有限公司提供,主要包括:調(diào)速移動平臺、步進電機、鹵鎢燈(12 V、50 W)、紫外燈(1 W、波長395~400 nm)、環(huán)形光纖探頭、光路切換器(具有參比自動測量及系統(tǒng)自檢)、光電限位開關(guān)、OtO近紅外光譜儀(430~1 100 nm)、SeeCAM_CU40相機、臺式電腦。環(huán)形光纖探頭和相機鏡頭到調(diào)速移動平臺的距離分別為14.5和16 cm。環(huán)形光纖探頭的環(huán)形光纖槽直徑2 cm、槽寬3 mm,鹵鎢燈通過光纖將光傳輸至環(huán)形光纖槽;環(huán)形光纖槽發(fā)出的光,經(jīng)物料漫反射由探頭接收,經(jīng)光纖傳輸至近紅外光譜儀。輕型電磁給料機的最大振幅為1.2 mm,頻率50 Hz。實驗中設(shè)置振幅為0.8 mm,能較好地將異物和茶葉分離,避免重疊形成誤判。輕型電磁給料機將茶葉和異物直接振動至樣品槽內(nèi)。樣品槽鑲嵌在移動平臺上,為敞開的長方體結(jié)構(gòu)。樣品槽四周為鋁合金材料、底部為白色聚四氟乙烯(PTFE)(厚5 mm),尺寸為59 cm×3.7 cm×1 cm。近紅外光譜儀和相機均通過USB數(shù)據(jù)線連接到臺式機上,采用多光譜成像與近紅外光譜檢測軟件系統(tǒng),采集近紅外光譜和圖像數(shù)據(jù)。
光譜采集前系統(tǒng)預(yù)熱30 min,同時設(shè)置系統(tǒng)參數(shù),開啟鹵鎢燈電源,積分時間設(shè)為1 000 μs,平均次數(shù)為10次,移動平臺速度為5 cm·s-1。光譜儀設(shè)置為連續(xù)觸發(fā)模式,觸發(fā)動作的啟動和停止由光電限位開關(guān)控制,樣品槽頭端進入采集工位啟動觸發(fā),樣品槽尾端離開采集工位停止觸發(fā),樣品槽運動過程中連續(xù)記錄100條近紅外光譜;光譜記錄過程中,同步觸發(fā)相機采集圖像,每條光譜均對應(yīng)保存一幀圖像。采用人工肉眼復(fù)檢,通過圖像標記每條光譜{1,2,3},分別對應(yīng)綠茶、茶梗和面包蟲。首先,采集參比光譜;控制移動平臺和空白樣品槽平移,連續(xù)記錄100條參比光譜。接著,采集樣品光譜;將面包蟲和茶梗與綠茶混合均勻后,緩慢倒入輕型電磁給料機上,由輕型電磁給料機振動上料,平移臺同步移動,同樣記錄100條光譜,由軟件自動轉(zhuǎn)換成吸光度光譜,取信噪比較好的600~1 050 nm波段進行建模和模型預(yù)測。重復(fù)上述實驗,共收集綠茶、面包蟲和茶梗光譜各200條。
SeeCAM_CU40相機為四通道多光譜相機(R,G,B和850 nm)。茶葉和昆蟲、茶梗異物的色素含量存在顯著差異,紫外光源(395~400 nm)照射樣品后,在460 nm附近的光譜強弱差異最明顯,SeeCAM_CU40相機的B通道圖像較為清晰,故采用B通道圖像進行分析計算。系統(tǒng)預(yù)熱30 min,開啟紫外燈電源,手動調(diào)節(jié)相機鏡頭至圖像清晰為止,相機曝光時間設(shè)為62.5 ms,圖幅設(shè)為1 344×760 pixels2。輕型電磁給料機振幅設(shè)為0.8 mm,移動平臺的速度設(shè)為5 cm·s-1。將面包蟲、茶梗和綠茶混合均勻,緩慢倒入輕型電磁給料機上,經(jīng)電磁振動分離異物和茶葉,落入樣品槽內(nèi)。相機采用連續(xù)觸發(fā)模式,也由光電限位開關(guān)控制觸發(fā)的啟動和停止。采集到昆蟲異物的R,G,B和850 nm通道圖像如圖2所示。
圖2 昆蟲異物的R(a),G(b),B(c)和850 nm(d)通道圖像
綠茶屬于片狀物料,在近紅外光譜采集過程中,容易產(chǎn)生散射。光程估計與校正方法(optical path-length estimation and correction,OPLEC)由陳增萍教授團隊提出,是一種將光譜校正與回歸結(jié)合的算法,能較好地校正光的散射效應(yīng)[17-18]。OPLEC采用建模集光譜數(shù)據(jù)與對應(yīng)的濃度向量,估計因物理性質(zhì)差異引起的光散射乘子效應(yīng)參數(shù);然后,由建立的雙校正模型預(yù)測值比值消除預(yù)測集樣本的乘子效應(yīng),具體步驟如下:
通過中國知網(wǎng)等數(shù)據(jù)庫檢索發(fā)現(xiàn),對體育舞蹈協(xié)調(diào)性與靈敏素質(zhì)的相關(guān)研究僅有11篇,且大多是以體育、舞蹈專業(yè)院校學生為調(diào)查對象,以普通大學生為調(diào)查對象的實驗研究較少。
首先,將光譜數(shù)據(jù)S(n×m,n為樣本數(shù),m為波長數(shù))進行奇異值(SVD)分解[U,S,V]=svd(S);然后,設(shè)置主成分數(shù)值v(v代表光譜抽象的活性化學成分數(shù)),取前v個的Uv,乘子效應(yīng)矢量p通過下列約束最小化獲得
(1)
式(1)中,-p≤-1,diag(c/w)是c/w的對角矩陣,w是權(quán)重。
最后,建立雙模型
diag(p)c=α1l+Sβ1
p=α2l+Sβ2
(2)
式(2)中,l是元素為1的矢量,diag(p)為對角元素為p對應(yīng)元素的對角矩陣;α1,β1,α2,β2由偏最小二乘法求得。預(yù)測集Spre的濃度值cpre
(3)
同時,去趨勢(Detrending)、多元散射校正(MSC)、標準正態(tài)變換(SNV)、變權(quán)重正態(tài)變換(VSN)、迭代自適應(yīng)加權(quán)懲罰最小二乘法(airPLS)、不對稱最小二乘法(ALS)等光譜預(yù)處理方法也被嘗試了。以光譜變量作為輸入變量X,以食品和異物類別作為輸出變量Y{1,2,3},應(yīng)用偏最小二乘判別分析法建模(PLS-DA),其中1,2,3分別代表綠茶、茶梗、昆蟲。
圖像處理包含圖像分割,取反運算,中值濾波,連通區(qū)域標記,特征提取。提取長軸長、短軸長、長短軸比、離心率共4個特征變量,作為輸入變量X,輸出變量Y同上。因為輸入變量X維數(shù)較低,故采用線性判別分析建模。上述算法均在MATLAB R2017a中實現(xiàn)。模型均采用正確判別率、召回率、精確率和F得分,評價模型的性能。在預(yù)測模型中,將污染物的數(shù)據(jù)定義為真陽性(TP)類,將純綠茶數(shù)據(jù)定義為真陰性(TN)類。因此,假陽性(FP)和假陰性(FN)分別表示將純茶葉誤判為污染物和將污染物誤判為茶葉,如式(4)—式(7)所示。
(4)
(5)
(6)
(7)
2.1.1 近紅外光譜特征分析
圖3 茶葉和異物的近紅外光譜(a)及主成分得分圖(b)
2.1.2 OPLEC光譜預(yù)處理
OPLEC采用雙模型策略,估算乘子效應(yīng)參數(shù),實施光程校正。參數(shù)v代表被測目標的活性化學成分數(shù),是OPLEC算法的關(guān)鍵參數(shù),通過求約束最小化問題minf(p)求解。繪制minf(p)與v的關(guān)系曲線,通過觀察,最小minf(p)對應(yīng)的v即為最佳v值。隨著v的增加,minf(p)值逐漸降低,當v值增加到11以后,minf(p)值無明顯變化,所以最佳v值確定為11。這意味著有效光譜信息與乘子效應(yīng)矢量p主要包含在Uv的前11個變量中。同時,最小預(yù)測均方根誤差(RMSEP)變化曲線也被繪制了,當v值為11時,RMSEP達到最小,綜合此時的RMSEP和v取值,效果達到最佳。采用OPLEC預(yù)處理后,異物正確識別率由78%提高至85%。
圖4 minf(p)與v的關(guān)系曲線(a)以及OPLEC模型的RMSEP值變化曲線(b)
2.1.3 近紅外光譜建模及預(yù)測
表1 各種預(yù)處理結(jié)合PLS-DA模型預(yù)測結(jié)果
近紅外光譜在線檢測時,需要對樣品槽的載物狀態(tài)進行預(yù)判,以決定進一步的操作。由圖3(a)可知,在750~850 nm范圍聚四氟乙烯(PTFE)的近紅外光譜明顯上升,而其他物料的近紅外光譜則平穩(wěn)且略微下降,選取850和750 nm兩波長的比值預(yù)判樣品槽是否有物料。若比值大于1,則樣品槽空載,OPLEC-PLS-DA模型不預(yù)測(用0表示);若比值小于等于1,則表示載有物料,將采集到的光譜代入OPLEC-PLS-DA模型,判別是屬于茶葉還是異物。若為異物,則將信號傳遞給后端執(zhí)行器,剔除異物。
(8)
2.2.1 熒光圖像分割
與近紅外光譜技術(shù)相比,圖像能掃描的范圍更大,可以在較大范圍內(nèi)進行異物檢測。采集了65張含有異物的熒光圖像,其中,33張為混有茶梗的綠茶圖像,32張為混有面包蟲的綠茶圖像。樣品槽底為白色的PTFE材料,反射較強,因此在原始圖像上灰度值較大,接近于1;而茶葉和異物區(qū)域,反射較弱,圖像灰度值更趨向于0。利用目標與背景在灰度值上的差異,通過閾值分割,提取目標。采用最大類間方差法(OTSU)獲取自動閾值T,按照式(9)對原始圖像f(x,y)實現(xiàn)分割后得g(x,y)二值圖像。
(9)
由圖5(c)和(d)可知,目標區(qū)域(茶葉和異物)和背景區(qū)域得到了較好的分割,供后續(xù)連通區(qū)域標記和特征提取使用。
2.2.2 特征提取
圖像分割后,采用取反運算,因為閾值分割時目標被賦值為0,而圖像連通區(qū)域標記是以1為目標進行標記的,故需要進行取反運算[圖5(e,f)];然后進行中值濾波,去除細小噪聲點[圖5(g,h)],對中值濾波后的圖像進行連通區(qū)域標記,最后運用MATLAB R2017a的圖像處理工具箱中的特征提取函數(shù)(regionprops)提取特征。實驗中,主要提取了離心率(E)、長軸長度(L)、短軸長度(W),計算了長短軸比(L/W)。從茶葉和異物的幾何形狀特征來看,綠茶呈片狀、長短軸比要略小于異物,邊緣曲線變化較為平緩,離心率要小于茶梗和昆蟲異物;茶梗和面包蟲異物多呈直線型,長短軸比要大于茶葉基質(zhì),端點尖角處曲線變化幅度較大,離心率要大于茶葉基質(zhì)(表2)。故實驗中,通過B通道圖像,提取離心率、長軸長、短軸長三個特征變量,計算長短軸比,共四個變量和355個感興趣目標(35個茶梗、35個面包蟲和285個綠茶目標)用于后續(xù)的建模和模型預(yù)測。
圖5 茶梗和昆蟲異物的B通道原始圖像及處理結(jié)果
表2 提取的綠茶和異物幾何形狀特征
2.2.3 LDA建模和預(yù)測
運用K-S方法將采集到的355個感興趣目標進行劃分,將267個感興趣目標劃入建模集,剩余的88個感興趣目標劃入預(yù)測集,用于評價模型的預(yù)測性能。每幅圖均按照上述方法提取變量,從B通道圖像中,提取了四個特征變量??紤]到變量數(shù)量較少,故采用線性判別分析算法(LDA)進行建模和模型預(yù)測。LDA建模的正確識別率為69%,采用預(yù)測集評價LDA模型的預(yù)測能力,正確識別率為64%。本實驗的正確識別率,低于Lohumi等[14]的鮮切蔬菜中異物識別率。主要是由于他們采用高精度的LCTF熒光成像設(shè)備,采集的圖像對比度優(yōu)于本實驗圖像。但考慮到,農(nóng)業(yè)食品對象對低成本的需求,本實驗的紫外誘導熒光成像技術(shù),更適合食品異物的低成本檢測需求。由表3可知,預(yù)測集中茶梗、綠茶、面包蟲召回率為50%,63%和88%,精確率為22%,98%和29%,F(xiàn)得分為31%,76%和44%,說明茶梗的召回率要低于面包蟲。由于茶梗和面包蟲的形狀接近,離心率和長短軸比較為相近,因此有4個茶梗異物被誤判為面包蟲,但是沒有被誤判為綠茶。由表3的預(yù)測結(jié)果可知,16個異物被成功檢出11個,存在4個茶梗被誤判為昆蟲,1個昆蟲異物被誤判為綠茶。而分別有13和14個綠茶樣本被誤判為昆蟲和茶梗異物,導致正確識別率下降,F(xiàn)得分較低。通過人工復(fù)檢圖像發(fā)現(xiàn),主要是由于綠茶的葉柄導致了誤判。綜上,運用電磁振動上料輔助熒光圖像進行茶梗和昆蟲異物的在線檢測具備可行性。對于誤判問題,后續(xù)可以從顏色、幾何形狀等多種特征角度實施檢測,降低誤判率。
表3 LDA建模和模型預(yù)測結(jié)果
在無電磁振動上料時,茶葉基質(zhì)和異物容易混堆在一起,異物無法暴露出來,增加了異物檢測的難度。而采用電磁振動上料,能較好地分離茶葉與異物,再結(jié)合熒光成像,能夠?qū)崿F(xiàn)對茶葉中異物的檢測,降低了異物混入茶葉的風險。電磁振動上料的效率影響在線檢測效果,本文采用上料速度(5 cm·s-1)、圖像寬度(3.3 cm)、單位時間內(nèi)落料的重量(3.251 g·cm-2)的乘積估算上料效率,約為53.64(g·s-1)。在實際應(yīng)用中,可以通過提高圖像視域?qū)挾?例如線陣相機)和提高圖像采集速率等方式,提高在線檢測的效率。
進行了電磁振動上料輔助近紅外光譜和熒光圖像在線檢測茶梗和昆蟲異物的可行性研究。近紅外光譜能實現(xiàn)較為精確的點測量,OPLEC結(jié)合近紅外光譜能較好地消除散射效應(yīng),正確識別率從78%提高到85%。與近紅外光譜相比,紫外誘導熒光成像技術(shù)提供了較大范圍的食品異物檢測手段,利用B通道圖像獲取的四個特征變量,建立的LDA定性判別模型,正確識別率達到了64%。雖然檢測精度較低,但仍有提升空間,為食品異物低成本在線檢測提供了解決方案。