吳明清 李傳峰 羅華平 弋曉康 SHAKEEL Ahmed Soomro 陳坤杰
(1.南京農(nóng)業(yè)大學(xué)工學(xué)院, 南京 210031; 2.塔里木大學(xué)機(jī)械電氣化工程學(xué)院, 阿拉爾 843300)
新疆地區(qū)陽光充足,干旱少雨,出產(chǎn)水果的營養(yǎng)和品質(zhì)明顯高于其他省份[1]。新疆的紅棗品種主要是駿棗和灰棗,大多經(jīng)過干制加工和分級后進(jìn)入市場[2]。由于受氣候、土壤及種植條件等各種因素的影響,同一品種紅棗的大小、顏色、糖度等品質(zhì)都有一定的差異,如果不經(jīng)過分級處理就上市流通,其商品價值會明顯降低。因此,分級是紅棗加工的關(guān)鍵環(huán)節(jié),對提高紅棗生產(chǎn)企業(yè)的經(jīng)濟(jì)效益具有重要作用[3]。
目前,紅棗的分級方法主要有人工分級、機(jī)械分級、機(jī)器視覺分級、光電分級4種方式。人工分級效率低,受主觀因素影響較大;機(jī)械分級主要根據(jù)紅棗的橫徑,將其分成3~5個不同等級,分級設(shè)備主要有帶式[4-5]、滾筒式和滾杠式[6-7]。機(jī)械分級雖然效率較高,但僅以紅棗的橫徑作為分級標(biāo)準(zhǔn),指標(biāo)單一,分級效果并不理想[8]。光電分級主要以紅棗的長度為分級依據(jù)[9],也存在指標(biāo)單一、分級效果不理想等缺點。近年來,有學(xué)者提出機(jī)器視覺紅棗分級技術(shù)[10]。馬學(xué)武等[11]利用機(jī)器視覺獲取紅棗的面積、顏色和最大直徑,設(shè)計了自動分級設(shè)備。劉艷麗等[3]研究了一種根據(jù)紅棗圖像面積和寬度進(jìn)行分級的檢測系統(tǒng)。由上述紅棗分級方法可知,不論是機(jī)械法、光電法還是機(jī)器視覺技術(shù),基本上都是根據(jù)紅棗的長度、橫徑、寬度、面積中的1或2個紅棗的物理特征參數(shù)進(jìn)行分級,參數(shù)的選擇具有一定的隨意性,缺乏科學(xué)根據(jù)。選擇不同的參數(shù)進(jìn)行分級,對分級結(jié)果會有一定的影響[12-13],但分級參數(shù)選擇對分級結(jié)果的影響,目前還沒有相關(guān)的研究報道。根據(jù)GB/T 5835—2009,紅棗分級的主要依據(jù)是果形的飽滿、良好、正常以及肥厚程度[14],這些指標(biāo)比較模糊,無法定量,在實際生產(chǎn)中很難執(zhí)行。因此,規(guī)范紅棗的分級方法,制定合理的紅棗分級定量指標(biāo)具有現(xiàn)實意義。
本文以新疆駿棗為研究對象,統(tǒng)計分析新疆駿棗各物理特征參數(shù)的分布情況,對不同特征參數(shù)的分級結(jié)果進(jìn)行分析比較,為制定合理的紅棗定量分級標(biāo)準(zhǔn)提供理論和科學(xué)依據(jù)。
采用產(chǎn)于新疆阿克蘇地區(qū)的駿棗為研究樣本,采集時間2016年11—12月。對所采集的樣本采用熱風(fēng)干燥后(濕基含水率(25±6)%),根據(jù)某企業(yè)現(xiàn)行的紅棗分級標(biāo)準(zhǔn),如圖1所示,將紅棗樣本按長徑分成5個等級:特級(36 mm以上),一級(32~36 mm),二級(28~32 mm),三級(24~28 mm),四級(20~24 mm)。每個等級取90個樣本,共計450個樣本備用。
圖1 5個等級紅棗 Fig.1 Five grades of red jujube
DT-1002A型電子天平(精確度0.001 g,上海卓越公司)、干燥箱(108-1A型,上海錦昱科學(xué)儀器有限公司)、電子數(shù)顯游標(biāo)卡尺(精度0.01 mm,中國桂林量具刃具有限責(zé)任公司)、量筒(量程250 mL,精度5 mL)、記號筆、密封袋、標(biāo)簽紙和鑷子。
駿棗呈圓臺形,少數(shù)呈規(guī)則的圓柱形,最大腰徑處橫截面近似為橢圓,因此,定義橢圓的長軸長稱為長徑,橢圓的短軸長為短徑,沿果蒂和果臍方向測量得到的兩端最大距離定義為長度,如圖2所示。根據(jù)上述定義,采用游標(biāo)卡尺直接測量出紅棗的三軸尺寸,即長徑、短徑和長度。
圖2 紅棗的三軸尺寸 Fig.2 Three-axis size of red jujube
周長是指紅棗最大腰徑處橫截面的周長,測量時,先找到樣本的最大腰徑位置,然后用一根線量取其周長,再用游標(biāo)卡尺測出其讀數(shù)。
將樣本依次放在電子天平上,稱量得到每個樣本的質(zhì)量,記作m0。
樣本的體積采用排水法進(jìn)行測量,具體如下:先將蒸餾水注入到圓柱直口嘴溢水燒杯中直到?jīng)]有水溢出,然后用鑷子將紅棗完全浸入水中,將溢出的水接入到一個精密量筒,讀出溢出水的體積,即得到樣本的體積,記作V0,測量得到樣本的體積和質(zhì)量后,樣本的密度計算公式為
(1)
式中ρP——樣本室溫下的密度,g/cm3
2.4.1圖像采集
圖像采集系統(tǒng)主要由相機(jī)、計算機(jī)、光源、暗箱等組成,如圖3所示。相機(jī)采用維視圖像MV-EM130型工業(yè)相機(jī)及4.0 mm焦距鏡頭,像素尺寸2.2 μm×2.2 μm,幀率15 f/s,以太網(wǎng)與計算機(jī)相連,照明光源采用2個柔光式LED燈。
圖3 紅棗圖像采集系統(tǒng) Fig.3 Image acquistion system for red jujube 1.計算機(jī) 2.光源控制器 3.光源 4.相機(jī)及鏡頭 5.暗箱
在進(jìn)行圖像采集時,首先將紅棗樣本放在一個白色托盤中,再置于輸送帶上,啟動輸送帶電動機(jī),將樣本輸入暗箱。當(dāng)樣本輸送到相機(jī)鏡頭正下方時,觸發(fā)相機(jī),采集一副樣本的正向俯視圖,以RGB格式存于計算機(jī)備用。
2.4.2圖像預(yù)處理
圖4 紅棗特征提取 Fig.4 Extraction of red jujube features
獲取紅棗投影面積和表面輪廓周長,需要對采集的樣本圖像進(jìn)行預(yù)處理,如圖4所示。根據(jù)文獻(xiàn)[10]所述方法,采用Matlab軟件編寫相應(yīng)的圖像處理程序,依次對每幅圖像進(jìn)行濾波降噪、灰度化、閾值分割、二值化、開運算、閉合運算、膨脹腐蝕、空洞填充等處理,得到樣本的二值化投影圖及二值化輪廓圖。
2.4.3投影面積和輪廓周長的計算
分別采用bwarea函數(shù)和bwperim函數(shù)計算紅棗二值化投影圖中灰度為1的像素個數(shù)Mj及二值化輪廓圖中灰度為1的像素個數(shù)Nj,根據(jù)事先對相機(jī)的標(biāo)定,每個像素的邊長相當(dāng)于實際長度0.125 mm,每個像素的面積相當(dāng)于實際面積0.016 mm2。因此,紅棗樣本的投影面積Ai計算公式為
Ai=0.016Mj
(2)
輪廓周長Li計算公式為
Li=0.125Nj
(3)
數(shù)據(jù)統(tǒng)計分析計算等處理利用Excel 2010分別求最大值、最小值、均值和標(biāo)準(zhǔn)偏差;利用SPSS 16.0軟件(IBM公司),采用最小顯著性差異(LSD)法,對數(shù)據(jù)組間差異性進(jìn)行比較[15];利用Excel 2010中“宏”數(shù)據(jù)分析工具中的相關(guān)分析進(jìn)行多變量相關(guān)關(guān)系分析。采用SPSS 16.0進(jìn)行系統(tǒng)聚類分析。采用Matlab R2014a進(jìn)行數(shù)據(jù)處理。
根據(jù)分級標(biāo)準(zhǔn),將樣本分成5個等級后,不同等級紅棗樣本的其他特征參數(shù)統(tǒng)計分析如表1所示。為直觀反映紅棗特征值的分布規(guī)律,做出不同等級紅棗特征參數(shù)的盒子圖,圖5中0~4分別表示特級、一級、二級、三級、四級。由圖5可知,除密度外,其他不同等級紅棗的特征值之間有明顯的差異,紅棗等級隨著特征參數(shù)的減小而增加。在表中,各個參數(shù)在等級內(nèi)的變異系數(shù)數(shù)值相近,導(dǎo)致等級變異程度較小。
為進(jìn)一步研究紅棗各特征參數(shù)均值與等級之間的關(guān)系,對紅棗特征參數(shù)和等級之間的關(guān)系進(jìn)行線性擬合,結(jié)果如表2及圖5所示,擬合后的決定系數(shù)為R2,統(tǒng)計量為F,F(xiàn)>F0.05(1,3)=10.13,F(xiàn)對應(yīng)的概率P值小于顯著性水平0.05,因此認(rèn)為各特征參數(shù)均值與等級間的線性關(guān)系顯著。
由上述分析可知,除密度外,紅棗其他各特征參數(shù)均隨著等級的降低而線性減小,各特征參數(shù)之間可能存在著一定的關(guān)聯(lián)性。這種變量之間關(guān)系程度可以用相關(guān)系數(shù)來定量表征[16-17]。因此,做出紅棗9個特征參數(shù)之間的相關(guān)系數(shù)矩陣如表3所示。相關(guān)系數(shù)用r表示,縱向觀察,投影面積和輪廓周長直徑的顯著相關(guān)性最高,r=0.96;其次是長度和輪廓周長,r=0.79;另外,短徑和周長、長度和投影面積、體積和投影面積、體積和輪廓周長相關(guān)系數(shù)r在0.74~0.75之間,其他特征參數(shù)之間的相關(guān)性較小。兩個自變量之間有較大的相關(guān)性,意味著這兩個參數(shù)具有共線性,對因變量的影響高度一致,是非獨立變量。因此,在選擇因變量的影響因素時,相關(guān)性較大的兩個自變量任選1個即可。例如在選擇影響紅棗等級的因素或建立紅棗等級的預(yù)測模型時,投影面積和輪廓周長只需任選1個作為模型的輸入變量。
表1 紅棗的特征參數(shù)統(tǒng)計 Tab.1 Statistical characteristics of red jujube
注:不同小寫字母表示差異顯著(P<0.05)。
在進(jìn)行多樣本分類時,如果依據(jù)單因素分類不足以全面綜合地描述其類別,就要考慮多因素分類[18-20]。由以上的分析可知,紅棗的9個特征參數(shù),均對其等級有一定的影響,但物理含義不盡相同。采用聚類分析,將8個參數(shù)按其性質(zhì)分成不同類型,將性質(zhì)相近的變量分成一類,對紅棗分級變量選擇以及分級模型的建立,具有一定的現(xiàn)實意義。
根據(jù)離差平方和法做出8個特征變量的R型聚類樹形圖(圖6),可知在類間距離等于5時,8個特征參數(shù)可以分為5類:第1類聚集了2個特征參數(shù),即周長和短徑,將這2個特征參數(shù)結(jié)合進(jìn)行分級,有助于提升紅棗的分級精度;第2類聚集了1個特征參數(shù),即長徑;第3類聚集了1個特征參數(shù),即體積;第4類聚集了1個特征參數(shù),即長度;第5類聚集了3個特征參數(shù),即質(zhì)量、輪廓周長、投影面積,其中投影面積和輪廓周長是機(jī)器視覺中分級的重要特征參數(shù)。聚類分析將紅棗特征參數(shù)進(jìn)行分類,為紅棗分級特征參數(shù)選擇提供一定的依據(jù)。
在根據(jù)幾何特征對紅棗進(jìn)行分級時,形狀特征會對分級結(jié)果產(chǎn)生一定的影響。例如,對于一個形狀短粗的紅棗樣本,按照長徑分級判定為特級,但如果再按長度來分級時,可能只能算作一級甚至二級。對于這種同一個樣本按不同參數(shù)進(jìn)行分級時等級發(fā)生變化的現(xiàn)象,稱之為竄級或誤分。按長徑劃分為5級,5個等級內(nèi)以周長的最大值和最小值確定周長等級劃分范圍。如圖7所示,根據(jù)箭頭出入將周長分為5個等級,箭頭的輸出為最大值,箭頭的輸入為最小值,不同等級之間有相交,如特級和一級在區(qū)間(114,103)內(nèi)重疊,認(rèn)為特級中有部分竄級到一級中;一級區(qū)間內(nèi)(114,103)和(100,90)分別與特級和二級重疊,認(rèn)為一級中有部分竄級到特級和二級中。
如圖8a所示,n級的樣本數(shù)等于A,n+1級的樣本數(shù)等于C,有B個n級樣本被判定為n+1級,定義n級參數(shù)分級誤分率,即B/A×100%。
圖5 紅棗特征參數(shù)盒子圖以及特征參數(shù)均值與等級之間的線性擬合結(jié)果 Fig.5 Box plots of red jujube characteristic parameters, and linear fitting results between mean and grade of characteristic parameters
同理,如圖8b所示,n級的樣本數(shù)等于A,n+1級的樣本數(shù)等于C,n+2級的樣本數(shù)等于E,有B個n+1級樣本被判定為n級,有D個n+1級被判定為n+2級,定義n+1級參數(shù)分級誤分率,即為(B+D)/C×100%。
根據(jù)上述原理計算結(jié)果如表4所示,誤分率用ε表示,密度的平均誤分率最大,ε=1%,說明該參數(shù)分級效果較差;周長誤分率最小,其值ε=0.76%。根據(jù)長徑標(biāo)準(zhǔn)分級確定其他特征參數(shù)的等級范圍,討論其他參數(shù)在該等級內(nèi)的誤分率,平均誤分率越大,該參數(shù)的竄級越大,分級效果越差,平均誤分率越小,該參數(shù)的竄級越小,分級效果越好。
表2 特征參數(shù)與等級之間的線性擬合結(jié)果的顯著性分析 Tab.2 Significant analysis of linear fitting results between feature parameters and grades
表3 紅棗各個特征參數(shù)之間的相關(guān)系數(shù) Tab.3 Correlation of each characteristic parameter of red jujube
圖6 R型聚類樹形圖 Fig.6 R-type clustering tree
圖7 周長等級示意圖 Fig.7 Schematic of perimeter level
圖8 參數(shù)等級誤差分析 Fig.8 Error analysis of parameter grade
%
(1)紅棗的各特征參數(shù)均對等級有顯著影響,除密度外,等級隨著特征標(biāo)準(zhǔn)偏差數(shù)值的減小而增大,各特征參數(shù)與等級之間有顯著性線性關(guān)系。
(2)紅棗的各特征參數(shù)之間存在相關(guān)性,輪廓面積和輪廓周長之間的相關(guān)性最高,其次是輪廓周長和長度,密度和質(zhì)量、短徑之間呈正相關(guān),密度和其他特征參數(shù)呈負(fù)相關(guān)。
(3)根據(jù)聚類分析,紅棗的特征參數(shù)可分成5類,聚類分析結(jié)果可以為特征參數(shù)的選取提供依據(jù)。
(4)按不同等級的最大值和最小值確定特征參數(shù)的分級范圍,計算不同特征參數(shù)的誤分率。平均誤分率越大,該參數(shù)的分級效果越差;平均誤分率越小,該參數(shù)的分級效果越好。