摘要:機(jī)器視覺技術(shù)能夠從香梨圖片中提取豐富的特征信息,自動(dòng)識(shí)別出香梨損傷區(qū)域。首先分析了機(jī)器視覺的技術(shù)原理以及圖像處理方法。接著,對(duì)采集到的香梨損傷圖片進(jìn)行平均值灰度化處理,去除圖像中的噪聲、增強(qiáng)有用的特征,保留彩色香梨圖像的大部分信息,形成特征向量矩陣。最后,將深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為分類器,對(duì)香梨損傷特征進(jìn)行訓(xùn)練和分類,實(shí)現(xiàn)香梨表面損傷的準(zhǔn)確識(shí)別。
關(guān)鍵詞:機(jī)器視覺;卷積神經(jīng)網(wǎng)絡(luò);損傷識(shí)別;特征提取
一、前言
香梨作為一種重要的水果品種,被全球廣泛種植和消費(fèi),其質(zhì)量與損傷問題直接影響著市場(chǎng)價(jià)值和消費(fèi)者滿意度。由于香梨表面損傷往往是隱蔽且細(xì)微的,傳統(tǒng)的人工檢測(cè)方法費(fèi)時(shí)費(fèi)力,且存在主觀性和不穩(wěn)定性的問題,難以滿足大規(guī)模、高效率的質(zhì)量檢測(cè)需求。機(jī)器視覺技術(shù)借助計(jì)算機(jī)視覺和圖像處理技術(shù),能夠從香梨圖片中提取豐富的特征信息,自動(dòng)識(shí)別出香梨損傷區(qū)域,極大地提高了香梨表面損傷識(shí)別的準(zhǔn)確性和效率。
通過深入研究損傷特征和優(yōu)化識(shí)別模型,預(yù)期可以大幅提高損傷識(shí)別的準(zhǔn)確率,降低漏檢和誤檢率。機(jī)器視覺技術(shù)的應(yīng)用將推動(dòng)農(nóng)業(yè)生產(chǎn)向智能化[1]、數(shù)字化方向邁進(jìn)[2],有助于提高農(nóng)產(chǎn)品生產(chǎn)效率和質(zhì)量水平。
二、機(jī)器視覺與圖像處理
(一)機(jī)器視覺技術(shù)原理
機(jī)器視覺技術(shù)模仿人類視覺系統(tǒng),通過計(jì)算機(jī)和圖像處理算法,使計(jì)算機(jī)能夠像人一樣獲取、處理和理解圖像信息。機(jī)器視覺技術(shù)的基本流程包括圖像獲取、圖像預(yù)處理、特征提取、特征匹配和決策輸出等。圖像獲取是機(jī)器視覺的第一步,由攝像頭、相機(jī)等設(shè)備采集目標(biāo)物體的靜態(tài)圖像或者視頻流。采集的圖像受到光照、噪聲等因素的影響,需要對(duì)圖像進(jìn)行灰度化、濾波、增強(qiáng)、去噪等預(yù)處理,以提高后續(xù)處理的效果。對(duì)預(yù)處理后的圖像進(jìn)行色彩、紋理、形狀分析,從中提取出有用的特征信息。在特征提取后,對(duì)提取到的特征進(jìn)行匹配,將其與事先存儲(chǔ)的模板或特征庫進(jìn)行比對(duì),從而找到與目標(biāo)相匹配的特征。根據(jù)特征匹配的結(jié)果,機(jī)器視覺系統(tǒng)做出相應(yīng)的決策輸出。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種深度學(xué)習(xí)模型,特別適用于圖像處理和視覺識(shí)別任務(wù),如圖1所示。在香梨表面損傷識(shí)別的研究中,采用CNN和圖像分割來實(shí)現(xiàn)損傷的自動(dòng)檢測(cè)和識(shí)別,可以達(dá)到更好的損傷識(shí)別效果。CNN網(wǎng)絡(luò)利用卷積操作和池化操作來提取圖像的特征。卷積操作通過濾波器在圖像上進(jìn)行卷積運(yùn)算,提取出圖像中緣、紋理。池化操作對(duì)特征圖進(jìn)行降采樣,減少特征圖的尺寸和參數(shù)數(shù)量,同時(shí)保留關(guān)鍵信息。通過多層卷積和池化操作,CNN能夠逐漸提取高級(jí)抽象的特征,從而實(shí)現(xiàn)對(duì)復(fù)雜圖像的識(shí)別和分類。
CNN通過反向傳播算法,最小化預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽之間的差異,即最小化損失函數(shù)。在分類任務(wù)中,常用的損失函數(shù)是交叉熵?fù)p失函數(shù),用于度量預(yù)測(cè)類別和真實(shí)類別之間的差異。
(二)圖像預(yù)處理方法
圖像處理基于圖像的像素信息和圖像中的空間結(jié)構(gòu)進(jìn)行操作,利用計(jì)算機(jī)算法對(duì)圖像進(jìn)行處理,以改變圖像的外觀、特征或質(zhì)量。閾值分割方法通過將像素灰度與預(yù)先設(shè)定的閾值進(jìn)行比較來分割圖像。將圖像轉(zhuǎn)為灰度圖,通過設(shè)定閾值將圖像分成不同的區(qū)域,將損傷區(qū)域與正常區(qū)域分離。
平均法是最常用的方法,將彩色圖像的紅、綠、藍(lán)三個(gè)通道的像素值求平均來得到灰度值,如公式(4)所示。平均法考慮了人眼對(duì)不同顏色通道的感知差異,能夠更好地保留圖像的視覺信息。灰度圖像轉(zhuǎn)化后,每個(gè)像素只有一個(gè)灰度值,這樣可以將圖像信息從三維(RGB)簡(jiǎn)化為二維,使得后續(xù)的圖像處理和特征提取更加高效。加權(quán)平均法是在平均法的基礎(chǔ)上,對(duì)不同通道的像素值進(jìn)行加權(quán)平均,以考慮不同顏色通道的重要性。
形態(tài)學(xué)處理方法通過結(jié)構(gòu)元素對(duì)圖像進(jìn)行腐蝕、膨脹等操作,來改變圖像的形狀和結(jié)構(gòu)。特征提取方法通過計(jì)算圖像的統(tǒng)計(jì)特征、顏色直方圖、紋理特征等,提取顏色、紋理、形狀等特征,來顯示圖像的內(nèi)容和特性,幫助識(shí)別不同類型的損傷。這些圖像處理方法能夠有效地提取和增強(qiáng)圖像中的有用信息,為香梨表面損傷的識(shí)別提供有力的支持。
三、基于機(jī)器視覺的香梨表面損傷研究
(一)香梨損傷特征
了解香梨的損傷特征及其成因,可以更好地設(shè)計(jì)和優(yōu)化損傷識(shí)別模型,提高損傷識(shí)別的準(zhǔn)確性和魯棒性,為農(nóng)產(chǎn)品質(zhì)量檢測(cè)和保鮮等領(lǐng)域提供有效的解決方案。香梨的損傷特征包括磕碰劃傷、淤傷、刺傷、病斑等(如圖2所示)。
磕碰劃傷是指香梨表面因與硬物碰撞或摩擦而產(chǎn)生的劃痕或凹陷,該損傷通常呈現(xiàn)不規(guī)則的形狀和邊緣,其灰度和紋理特征與周圍區(qū)域有明顯差異。淤傷指香梨表面因受到撞擊而形成的淺色斑點(diǎn)或色差[3]。淤傷的形狀通常較小且不規(guī)則,顏色與周圍區(qū)域有明顯差異。刺傷是指香梨表面因受到尖銳物體刺入而形成的穿透性損傷。刺傷通常呈現(xiàn)線狀或點(diǎn)狀,其邊緣清晰,顏色與周圍區(qū)域有明顯對(duì)比。病斑是指香梨表面因受到病菌或病毒感染而形成的不規(guī)則斑點(diǎn)或區(qū)域。病斑的顏色和紋理通常與正常區(qū)域明顯不同。
(二)特征提取
特征提取的目標(biāo)是從圖像中提取有助于區(qū)分不同損傷類型的特征信息。對(duì)于磕碰劃傷、淤傷、刺傷和病斑等不同類型的損傷,特征提取是非常重要的步驟。
首先,采用平均值灰度方法,對(duì)采集的香梨圖像進(jìn)行預(yù)處理,以去除圖像中的噪聲、增強(qiáng)有用的特征。平均值灰度法保留了彩色圖像的大部分信息,將彩色圖像轉(zhuǎn)換為灰度圖像后,每個(gè)像素點(diǎn)仍然包含有關(guān)原始圖像的某種形式的顏色信息。對(duì)于顏色分布較為均勻的圖像,采用平均值灰度法能夠比較好地保持圖像的對(duì)比度,使得圖像的邊緣和細(xì)節(jié)信息得以保留,如圖3所示。對(duì)于灰度圖像,每個(gè)像素的灰度值表示為矩陣中的一個(gè)元素[4]。整個(gè)圖像表示為一個(gè)二維矩陣,當(dāng)灰度圖像的大小為64×64像素,可以將其表示為一個(gè)64×64的矩陣,其中每個(gè)元素為0到255之間的一個(gè)灰度值。
根據(jù)不同損傷類型的特點(diǎn),選擇合適的特征用于識(shí)別。對(duì)于磕碰劃傷和淤傷,可以采用紋理特征、邊緣特征;對(duì)于刺傷,可以采用形狀和邊緣特征;對(duì)于病斑,可以采用顏色和紋理特征。將提取到的特征表示成合適的向量或矩陣形式,以便于后續(xù)的分類或識(shí)別。
如果提取的特征維度較高,可以采用特征選擇或降維算法來減少特征的維度,以提高計(jì)算效率和減少冗余信息。采用t-SNE構(gòu)建高維空間和低維空間之間的概率分布,使得相似的數(shù)據(jù)在高維空間和低維空間中有較高的概率,而不相似的數(shù)據(jù)在高維空間和低維空間中有較低的概率。首先,對(duì)于每對(duì)樣本i和j,通過高斯核函數(shù)來計(jì)算它們的相似度,高斯核函數(shù)的帶寬由用戶指定。計(jì)算低維空間中樣本之間的相似度時(shí),同樣使用高斯核函數(shù),但帶寬會(huì)根據(jù)樣本在高維空間中的相似度來自適應(yīng)調(diào)整,使得樣本在低維空間中更好地保持相對(duì)的距離關(guān)系。根據(jù)高維空間和低維空間中的相似度計(jì)算樣本的條件概率分布。接著,通過最小化高維空間和低維空間之間的Kullback-Leibler散度,優(yōu)化映射關(guān)系,使得相似的樣本在低維空間中更聚集,不相似的樣本在低維空間中更分散。高維空間中數(shù)據(jù)點(diǎn)i和數(shù)據(jù)點(diǎn)j之間的相似度計(jì)算方法如公式(5)所示:
(三)分類器設(shè)計(jì)與訓(xùn)練
CNN模型由多個(gè)卷積層和池化層交替堆疊構(gòu)成,通常包括若干個(gè)卷積層、激活函數(shù)、池化層、全連接層和輸出層。CNN的設(shè)計(jì)需要根據(jù)實(shí)際任務(wù)和數(shù)據(jù)集的特點(diǎn)來進(jìn)行調(diào)整。如CNN模型有LeNet[5]、AlexNet、VGG[6]等。由卷積層提取一系列的特征圖,由池化層減小特征圖的尺寸和參數(shù)數(shù)量。 在每個(gè)卷積層后,需要添加ReLU、Sigmoid或者Tanh激活函數(shù),常見的激活函數(shù)有ReLU、Sigmoid、Tanh等。經(jīng)過多個(gè)卷積和池化層之后,將特征圖展平為向量,并連接到一個(gè)或多個(gè)全連接層。全連接層用于對(duì)特征進(jìn)行進(jìn)一步處理和學(xué)習(xí),輸出最終的分類結(jié)果。輸出層通常使用Softmax函數(shù)將得分轉(zhuǎn)換為概率,用于分類任務(wù)。
香梨灰度圖像中包含了損傷區(qū)域和正常區(qū)域的灰度信息,通過圖像增強(qiáng),可以使損傷區(qū)域和正常區(qū)域的特征更加明顯和突出,通過增強(qiáng)對(duì)比度,使損傷區(qū)域與周圍區(qū)域的灰度差異更加明顯,有利于區(qū)分不同的損傷類型。同時(shí),對(duì)香梨灰度圖像進(jìn)行圖像增強(qiáng)可以改善圖像的視覺效果和質(zhì)量,增加香梨圖像的對(duì)比度、增強(qiáng)邊緣、減少噪聲等,使圖像更加清晰和明亮。
訓(xùn)練CNN模型是一個(gè)迭代的過程。將準(zhǔn)備好的數(shù)據(jù)集劃分為訓(xùn)練集和驗(yàn)證集,用于模型訓(xùn)練和驗(yàn)證。通過反向傳播算法計(jì)算梯度并更新模型參數(shù),不斷優(yōu)化模型。訓(xùn)練過程中,調(diào)整設(shè)置合適的學(xué)習(xí)率、批量大小和訓(xùn)練輪數(shù)等超參數(shù)。為了防止過擬合,可以使用正則化技術(shù)和早停策略等,如表1所示。訓(xùn)練完成后,使用驗(yàn)證集來評(píng)估模型的性能,并評(píng)估模型的表現(xiàn)。最終,在測(cè)試集上對(duì)模型進(jìn)行測(cè)試,得到損傷識(shí)別的結(jié)果。
在香梨表面損傷識(shí)別研究中,采用CNN網(wǎng)絡(luò)進(jìn)行分類和識(shí)別,準(zhǔn)確率可以達(dá)到91%。即經(jīng)過上述訓(xùn)練,CNN分類器可以對(duì)香梨表面的磕碰劃傷、淤傷、刺傷和病斑等不同類型的損傷進(jìn)行準(zhǔn)確的識(shí)別,從而為香梨質(zhì)量檢測(cè)和保鮮提供有效的解決方案。隨著數(shù)據(jù)量和訓(xùn)練深度的增加,CNN模型的性能和泛化能力將不斷得到提升。
四、結(jié)語
本文分析了基于機(jī)器視覺的香梨表面損傷識(shí)別問題,利用平均灰度值方法、特征提取和CNN分類器的設(shè)計(jì)與訓(xùn)練,進(jìn)行了表面缺陷分類檢測(cè)。CNN網(wǎng)絡(luò)在香梨表面損傷識(shí)別任務(wù)中表現(xiàn)出較高的準(zhǔn)確性和魯棒性,為農(nóng)產(chǎn)品質(zhì)量檢測(cè)和智能農(nóng)業(yè)的發(fā)展提供了一種可行的解決方案。目前,香梨表面損傷的數(shù)據(jù)集仍有限,數(shù)據(jù)量的增加可以進(jìn)一步提高模型的泛化能力和準(zhǔn)確性。因此,未來可以通過更廣泛的數(shù)據(jù)采集和標(biāo)注,構(gòu)建更大規(guī)模的數(shù)據(jù)集,并拓展到更多種類的損傷,提高系統(tǒng)的應(yīng)用范圍和實(shí)用性。除了圖像信息外,香梨損傷的識(shí)別還可以融合多種傳感器信息,如紅外圖像、超聲波等,提高識(shí)別的全面性和準(zhǔn)確性。
參考文獻(xiàn)
[1]崔焱,彭可,楊玉娥,等.基于機(jī)器視覺的手機(jī)蓋板表面缺陷檢測(cè)系統(tǒng)設(shè)計(jì)[J].制造業(yè)自動(dòng)化,2023,45(07):75-79+96.
[2]賀玉彬.基于機(jī)器視覺的大壩表面裂縫自動(dòng)測(cè)量方法[J].制造業(yè)自動(dòng)化,2023, 45(07):160-163.
[3]董建偉,劉媛媛,陳斐,等.基于多光譜圖像的庫爾勒香梨表面缺陷檢測(cè)[J].農(nóng)機(jī)化研究,2021,43(09):35-40.
[4]張衛(wèi)民,國海,劉帥帥.基于計(jì)算機(jī)視覺的碭山梨分級(jí)系統(tǒng)[J].安徽科技學(xué)院學(xué)報(bào),2022,36(04):55-59.
[5]付夏暉,王菊霞,崔清亮,等.基于輕量化卷積神經(jīng)網(wǎng)絡(luò)的蘋果表皮損傷分級(jí)研究[J].果樹學(xué)報(bào),2023,40(10):2263-2274.
[6]黃仁彬,詹道樺,楊修定,等.基于加權(quán)多尺度特征融合的帶鋼表面缺陷檢測(cè)算法[J].計(jì)算機(jī)集成制造系統(tǒng),2023(07):17.
作者單位:邱鵬,晉中信息學(xué)院;蘇兆兆,新疆大學(xué);賈瑤鏇,山西農(nóng)業(yè)大學(xué)
責(zé)任編輯:尚丹