吳林峰 余懷鑫 祝志慧
(華中農(nóng)業(yè)大學(xué),湖北 武漢 430070)
雞蛋孵化過(guò)程大約需要21 d,對(duì)環(huán)境溫濕度條件要求較高,是個(gè)耗時(shí)、耗能的過(guò)程[1]。據(jù)統(tǒng)計(jì)[2],種蛋的成活率在85%~95%。目前市場(chǎng)上檢測(cè)種蛋最常見(jiàn)的方法主要是人工照蛋法,速度慢、效率低、準(zhǔn)確性差,且受到工人主觀判斷的影響,并不能滿足當(dāng)前自動(dòng)化生產(chǎn)的需要。有許多學(xué)者利用機(jī)器視覺(jué)技術(shù)[3]、近紅外光譜[4]、高光譜圖像[5-6]實(shí)現(xiàn)了對(duì)雞種蛋內(nèi)部特性的無(wú)損檢測(cè),這些方法具有檢測(cè)速度快、精度高、所需時(shí)間短、勞動(dòng)強(qiáng)度低等優(yōu)點(diǎn)[7]。但光譜設(shè)備對(duì)于低成本的農(nóng)業(yè)生產(chǎn)來(lái)說(shuō)過(guò)于昂貴,對(duì)檢測(cè)環(huán)境也有較高的要求,限制了這些方法的推廣;機(jī)器視覺(jué)技術(shù)目前對(duì)種蛋孵化信息的無(wú)損檢測(cè)僅處于靜態(tài)單個(gè)蛋的模型檢測(cè)研究。
本試驗(yàn)擬利用機(jī)器視覺(jué)技術(shù),直接以工業(yè)蛋托為基礎(chǔ),將整托蛋直接從孵化箱放進(jìn)檢測(cè)裝置采集群體種蛋的圖像,從群蛋圖像中分割出單個(gè)蛋圖像,提取圖像信息,利用不同方法建立無(wú)損檢測(cè)模型,為高通量在線檢測(cè)提供有力的理論依據(jù)。
種蛋:京粉2號(hào)褐殼蛋,峪口禽業(yè)有限公司,共計(jì)164枚,其中受精蛋96枚,無(wú)精蛋68枚,孵化溫度37.8 ℃,濕度63.5%,翻蛋時(shí)間間隔2 h,每天對(duì)雞蛋進(jìn)行稱重,從第3天開(kāi)始采集整托種蛋圖像,蛋托為6枚×6枚規(guī)格,共計(jì)5托,第5托數(shù)量不足部分用其他托中的蛋補(bǔ)齊,防止漏光現(xiàn)象。
搭建如圖1所示機(jī)器視覺(jué)系統(tǒng),由工業(yè)相機(jī)、鏡頭、光源、暗箱和計(jì)算機(jī)組成。相機(jī)選用DLC500型工業(yè)相機(jī),鏡頭選用精工XW0612型,其焦距為6~12 mm,光圈為f1.6。光源選用35 W的鹵素?zé)糁糜诜N蛋下方,用橡膠環(huán)托住雞蛋減少漏光現(xiàn)象;暗箱用于隔絕環(huán)境光,減少外界干擾。工業(yè)相機(jī)通過(guò)USB接口與計(jì)算機(jī)連接,計(jì)算機(jī)保存圖像數(shù)據(jù)并進(jìn)行處理。
1.光源 2.工業(yè)蛋托 3.種蛋 4.暗箱 5.攝像頭 6.USB線 7.計(jì)算機(jī)
圖1 圖像采集系統(tǒng)
Figure 1 Schematic diagram of image collection system
受精蛋和無(wú)精蛋的蛋重存在一定的差異,種蛋蛋重的大小對(duì)受精率和孵化率有顯著的影響[8]。使用XYSCALE的JAP型電子天平,精度為0.001 g,在每天固定時(shí)間測(cè)量蛋重信息,如圖2所示,在孵化0~8 d受精蛋與無(wú)精蛋的平均蛋重均緩慢下降,其中受精蛋共失重2.736 g,平均日失重率為0.55%;無(wú)精蛋共失重2.395 g,平均日失重率為0.53%。
將受精蛋和無(wú)精蛋每天的蛋重進(jìn)行對(duì)照試驗(yàn)T檢驗(yàn),所有P值<0.05,即證明在孵化0~8 d的受精蛋和無(wú)精蛋蛋重都符合正態(tài)分布,再進(jìn)行獨(dú)立樣本T檢驗(yàn),所有P值<0.05,即認(rèn)為2個(gè)總體之間的均值不相等,受精蛋平均蛋重大于無(wú)精蛋。雖然受精蛋與無(wú)精蛋的平均蛋重存在顯著差異,可以將蛋重用作特征參數(shù),但是每個(gè)雞蛋的大小、蛋殼厚度都不一,無(wú)法單一用蛋重來(lái)區(qū)分受精和未受精的雞蛋,需加上其他的特征來(lái)區(qū)分。
1.4.1 群蛋圖像的分割 采集整托蛋的圖像上共有36枚雞蛋,首先需要對(duì)圖像進(jìn)行分割。由于蛋殼厚度、孵化程度等因素,種蛋之間的亮度差異較大,局部閾值分割只能將少數(shù)亮度均勻的雞蛋分割出來(lái)。為了提高處理的速度和準(zhǔn)確性,將所有種蛋看作圓形,通過(guò)建立坐標(biāo)系確定每枚雞蛋中心的坐標(biāo),圖3(a)為第7天群蛋圖像,分別拾取左上、左下和右下3個(gè)雞蛋的中心,再通過(guò)蛋托的距離計(jì)算拿出每個(gè)雞蛋中心的坐標(biāo)。雞蛋的半徑主要分布在區(qū)間[135,180]的像素長(zhǎng)度上,為了防止拾取到非雞蛋像素,以125像素為半徑畫圓,如圖3(b)所示,保留圓形內(nèi)部像素,再按照順序分割為單個(gè)種蛋圖像。
1.4.2 特征值提取 采集后的圖像包含一些干擾信息,運(yùn)用平滑處理對(duì)圖像去噪[9],如圖4所示,通過(guò)平滑處理后直方圖的兩端更加突出,特征更加顯著。
圖2 孵化早期受精蛋與無(wú)精蛋蛋重變化Figure 2 The change of average weight in early days of hatching
圖3 分割得到的單個(gè)雞蛋圖像Figure 3 Single egg obtained by division
在此基礎(chǔ)上,再提取出圖像的RGB值,通過(guò)數(shù)學(xué)關(guān)系轉(zhuǎn)換為HIS值。分別挑選40個(gè)無(wú)精蛋和受精蛋統(tǒng)計(jì)各分量均值的散點(diǎn)圖,如圖5、6所示,第3天無(wú)精蛋與受精蛋的特征參數(shù)區(qū)分不明顯,到第7天多數(shù)無(wú)精蛋的G、B、I分量均值以及灰度均值都高于受精蛋,S分量均值低于受精蛋,無(wú)精蛋的R分量均值分布區(qū)間比受精蛋大。
種蛋數(shù)量按約為5∶3的比例分為訓(xùn)練集和測(cè)試集,從164枚中隨機(jī)挑選104個(gè)作為訓(xùn)練集,其中受精蛋61枚,無(wú)精蛋43枚,剩余的60個(gè)作為預(yù)測(cè)集,其中受精蛋35枚,無(wú)精蛋25枚,用Matlab對(duì)圖像中提取的R、G、B、H、S、I、灰度均值以及蛋重這8個(gè)特征參數(shù)分別建立多元線性回歸、SVM和BP神經(jīng)網(wǎng)絡(luò)模型。
圖4 預(yù)處理對(duì)于圖像質(zhì)量的影響Figure 4 Effects of image preprocessing
圖5 第3天蛋重特征參數(shù)Figure 5 Egg weight parameters on third day after hatching
圖6 第7天蛋重特征參數(shù)Figure 6 Egg weight parameters on seventh day after hatching
因變量y表示種蛋類別,設(shè)定受精蛋的y值為1,無(wú)精蛋為0,最后的擬合結(jié)果中將0.5及以上的值看做1,即受精蛋,小于0.5的值看做0,即無(wú)精蛋。RGB和HSI之間具有一定的數(shù)學(xué)關(guān)系,因此在建模前需去除其中的冗余信息。通過(guò)計(jì)算變量的方差膨脹因子(VIF)對(duì)變量的多重共線性進(jìn)行檢測(cè),當(dāng)VIF<5時(shí)可以認(rèn)為不存在共線性,當(dāng)5≤VIF<10時(shí)認(rèn)為存在中等程度的共線性;當(dāng)VIF>10時(shí),認(rèn)為共線性嚴(yán)重。每次剔除一個(gè)最大VIF值的變量,直到所有剩余變量VIF值都<5,如表1所示。建立線性回歸模型,結(jié)果如表1、2所示,在孵化3~6 d時(shí),蛋重是一個(gè)顯著性的影響因素,隨著孵化天數(shù)的增加,受精蛋圖像的顏色會(huì)逐漸變深,蛋重變量逐漸變得不顯著,故逐步判別時(shí)被剔除。從表2中可以看出,隨著孵化天數(shù)的延長(zhǎng),檢測(cè)精度逐漸提高。
SVM模型在高維數(shù)據(jù)、小樣本數(shù)據(jù)和非線性數(shù)據(jù)模式識(shí)別方面都有出色的表現(xiàn)[10],建立一個(gè)分類準(zhǔn)確的支持向量機(jī)模型需要選擇合適的核函數(shù)[11]。常用核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)(RBF)和Sigmoid核函數(shù),在其他參數(shù)相同的情況下進(jìn)行比較,結(jié)果如表3所示,Sigmoid核函數(shù)的結(jié)果非常低,RBF核函數(shù)準(zhǔn)確率略高,僅在第5天略低于Linear核函數(shù)建立的模型,且RBF核函數(shù)的收斂域相對(duì)較寬,不受訓(xùn)練樣本數(shù)量的制約,因此選用RBF作為核函數(shù)。
表1 多元線性回歸模型Table 1 Model of linear regression
表2 多元線性回歸方程結(jié)果Table 2 Results of linear regression
運(yùn)用SVM對(duì)種蛋進(jìn)行分類,首先通過(guò)網(wǎng)格搜索尋找最優(yōu)參數(shù),結(jié)果如圖7所示,根據(jù)等高線圖和3D圖得出懲罰因子c和核參數(shù)g的值分別為0.25和0.062 5。
運(yùn)用SVM模型對(duì)60個(gè)預(yù)測(cè)集進(jìn)行分類,結(jié)果如表4所示,隨著孵化天數(shù),準(zhǔn)確率逐步提升,在5 d之后準(zhǔn)確率達(dá)到了90%以上。
表3采用不同核函數(shù)時(shí)早期種蛋鑒別準(zhǔn)確率的對(duì)比
Table 3 Results of egg identification in early hatching period with different kernel functions
核函數(shù)第3 d第4 d第5 d第6 d第7 d第8 dLinear80.080.093.391.796.796.7Polynomial80.081.791.793.396.796.7RBF81.783.391.795.096.796.7Sigmoid58.358.358.358.358.358.3
表4 SVM模型鑒別結(jié)果Table 4 Results of SVM model
綜上表2、4、5可知,對(duì)孵化3~8 d的褐殼種蛋運(yùn)用多元線性回歸模型、SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行鑒別,種蛋鑒別的準(zhǔn)確率隨著孵化時(shí)間的延長(zhǎng)而逐漸升高,在第6天均能達(dá)到90%以上,都可以用來(lái)對(duì)群體褐殼種蛋的受精信息進(jìn)行判別,其中SVM鑒別模型最穩(wěn)定、準(zhǔn)確率最高,在第3天和第7天的準(zhǔn)確率分別達(dá)到81.7% 和96.7%。對(duì)比已有研究,利用機(jī)器視覺(jué)對(duì)整托白殼蛋的受精信息進(jìn)行判別在第7天達(dá)到了97%[13],利用機(jī)器視覺(jué)對(duì)單枚褐殼蛋橫向放置采集圖像,在孵化第6天達(dá)到90%以上[14],目前,褐殼蛋受精信息的研究?jī)H處于對(duì)單枚蛋,并無(wú)對(duì)整托褐殼蛋受精信息的研究,因此本研究提出的利用機(jī)器視覺(jué)技術(shù)和提取的特征參數(shù)來(lái)建模鑒別群體褐殼受精蛋和無(wú)精蛋是可行的,后續(xù)將進(jìn)一步提高鑒別精度。
c=0.25,g=0.062 5,CVAccuracy=98.076 9%
表5 BP神經(jīng)網(wǎng)絡(luò)鑒別結(jié)果Table 5 Results of BP neural network
本試驗(yàn)對(duì)整托褐殼蛋受精信息進(jìn)行檢測(cè),通過(guò)對(duì)蛋重?cái)?shù)據(jù)的分析表明了蛋重可以作為判別受精蛋和無(wú)精蛋的特征參數(shù);利用機(jī)器視覺(jué)技術(shù)采集群體種蛋孵化信息,將群蛋圖像分割并從圖像中提取RGB值,用RGB、HIS、灰度均值和蛋重作為特征值建立了多元線性模型、SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型。對(duì)比了SVM3種核函數(shù),其中RBF核函數(shù)的準(zhǔn)確率較高。利用相同的測(cè)試集對(duì)3個(gè)模型進(jìn)行驗(yàn)證,綜合考慮,在檢測(cè)群體種蛋孵化情況時(shí),SVM模型準(zhǔn)確率較高,在第3天和第7天分別達(dá)到了81.7% 和96.7%,具有最好的穩(wěn)定性和判別準(zhǔn)確率,說(shuō)明利用機(jī)器視覺(jué)技術(shù)對(duì)整托褐殼蛋進(jìn)行孵化受精信息檢測(cè)是可行的。但在孵化前3 d檢測(cè)精度有待提高,可以嘗試尋找其他特征值和改進(jìn)模型。