河南機電職業(yè)學院 饒曉慧
機器視覺是農業(yè)機械研究發(fā)展的熱點方向,在圖像識別系統(tǒng)的不斷發(fā)展過程中,農業(yè)機械也開始將圖像識別系統(tǒng)引入機器視覺領域,實現作物采集、處理的高效性。本文將簡述機器視覺識別系統(tǒng)的構成,探索基于機器視覺的農業(yè)圖像識別系統(tǒng),并分析機器視覺圖像識別系統(tǒng)在農業(yè)機械中的應用,以期為農業(yè)機械自動化作業(yè)提供一些建議。
機器視覺識別技術已經逐漸在農業(yè)生產中應用,實現作物缺陷識別、種類分揀、形狀區(qū)分等功能,作為一種無損檢測技術,機器視覺識別可以提高農業(yè)機械生產效率,是農機自動化發(fā)展的必然趨勢。
機器視覺識別系統(tǒng)主要有軟、硬件兩大部分組成。在硬件方面,包括視覺傳感器、照明設備、圖像采集卡、計算機等系統(tǒng)設備,其中視覺傳感器是獲得圖像的關鍵設備,性能良好的硬件設備能夠傳達效果更佳的視覺圖像。而軟件方面則是圖像處理系統(tǒng),從感光器件獲取的圖像,將由圖像處理系統(tǒng)對其進行詳細分析,從顏色、波長、光亮等軟件單元進行處理,綜合考慮識別環(huán)境、識別對象等因素,獲得較為準確的圖像內容,以保障識別的準確性。
農業(yè)機械圖像識別系統(tǒng)是機器視覺的核心內容。視覺識別通常是先由視覺傳感器獲取相應的圖像,再利用機器視覺系統(tǒng)對圖像進行處理,經過圖像分割、特征提取等步驟后,得出最后的圖像內容。這一系列步驟在農業(yè)圖像識別系統(tǒng)中從圖像獲取和預處理的低級處理,傳輸到具備圖像分割與特征提取功能的中級處理層級,最后到利用各種算法完成圖像平面識別的高級處理。
圖像的采集和獲取依靠視覺傳感器,在獲得圖像后需要對圖像進行預處理,包括將RGB值轉變?yōu)镠IS模式,增強缺陷特點,優(yōu)化圖像分辨率等步驟。圖像預處理主要涉及四點內容。首先是灰度化處理,將RGB三基色轉換,把獲取的彩色圖像轉變?yōu)榛叶葓D像,并將24位圖像轉換為8位圖像。其次是對圖像內容進行統(tǒng)一化處理,使圖像上農作物轉變?yōu)榻y(tǒng)一的尺寸。圖像處理采用統(tǒng)一縮放形式,可以使待識別的作物圖像具備更多特征點,便于后續(xù)識別。之后是增強圖像,為了提高圖像清晰度,加強識別效果,需對圖像進行增強,例如可以利用膨脹和腐蝕來增強圖像的分辨率,或是利用濾波圖像中的干擾部分。最后,為了方便圖像處理,可以對圖像進行二值化處理,采用Niblack算法,在作物圖像上確定中心坐標,通過對像素點方差和均值的計算來實現二級化。
圖像分割是將圖像劃分為數個有意義的區(qū)域,圖像分割主要有三種分割方式,分別根據圖像邊緣、圖像閾值和圖像區(qū)域進行分割。其中基于圖像邊緣的分割方法,是通過邊緣檢測算法計算圖像區(qū)域的灰度值、顏色以及紋理等具有不規(guī)則性的邊緣,利用這些邊緣輪廓來確定圖像區(qū)域。
基于閾值的圖像分割是通過對物體表面光線發(fā)射或吸收的情況下來確定閾值,以此進行分割的方式,其主要包含兩種方式。一種是最為基礎的人工分割操作,運用直方圖技術測試出最佳閾值,并將分割目標與背景隔離。人工分割本身就會受到認為因素的影響,需要經過反復監(jiān)測和調整才能得到良好的分割效果,而再農業(yè)生產中作物受光照條件影響程度較大,發(fā)生改變時就需要調整閾值,而頻繁調整閾值效果很容易對閾值分割造成影響。另一種則是自動閾值分割,無需人為干涉,自動閾值在選擇分割目標的過程中會自動代入直方圖信息,再基于設定好的參數進行分割操作,不過閾值分割在面對沒有明顯峰谷的圖像時,很容易出現無法計算有效閾值的情況,致使分割出不完整的區(qū)域。
基于區(qū)域的分割方式是根據區(qū)域內代表性的像素內容進行組合,以此進行分割的方式,其對噪聲的識別效果不佳,大多用于識別作物表面有明顯特點的農作物,從作物整體、根莖、缺陷等位置區(qū)域進行識別。
特征是物體區(qū)分和識別的主要因素之一,也是分類算法有效實施的核心。農業(yè)生產中機器視覺特征提取主要集中在顏色、形狀、紋理和分形四方面。
顏色是非常明顯的特征,其直觀、有效的特點也被廣泛應用在特征提取方面。農作物、雜草、病蟲害都有著顯著的顏色區(qū)分,將這些部分的RGB顏色進行分量、計算均值和標準偏差,或是將RGB轉變?yōu)镠IS顏色空間,又或者將RGB和HIS相互結合,都能夠獲得較為良好的顏色信息。
物體的面積、周長、大小、曲率等信息決定了物體的形狀特征,在果蔬采摘機械識別系統(tǒng)中,機器視覺識別還需結合旋轉、比例、平移等幾何特征量,通過計算方差來確定物體的形狀信息,形狀信息提取更為準確,也需要更多的計算量來保持準確性。
紋理是物體的基本特征,與視覺外觀和觸摸品質有關。紋理與形狀特征有密切關系,兩者往往會同時進行分析,結合物體的走向、尺寸,測量出物體的紋理構造,而利用灰度共生矩陣,也可以計算出二階矩、熵值等深層紋理特征。另外,紋理特征可以構建基于HIS的彩色共生矩陣,將顏色特征與紋理特征相結合,提取出物體的紋理特征。
分形特征簡單來說就是依據物體表面粗糙度和邊界不規(guī)則性來衡量尺度,這是因為物體本身的形狀和外觀是具有相似性以及尺度不變性特征。分形特征主要用于識別果柄與花萼,通過計算兩者頻域分布,識別出缺陷果柄和花萼,其識別率可達90%以上。根據農作物的特點選擇適宜的特征提取方式,是農業(yè)機械圖像識別系統(tǒng)應用的主要途徑,在實際應用中應將多種特征提取方式進行結合,進一步提高系統(tǒng)識別的性能。
(1)直方圖識別
直方圖識別是最為基礎的識別方式,根據直方圖形狀計算出識別參數,以此判斷出作物的種類。直方圖識別需要灰度處理作為基礎,將灰度級大小、一階導數、形狀特性比值等參數代入,進行判別。以成熟蘋果和未成熟蘋果在顏色上的識別為例,由于成熟蘋果和未成熟蘋果在HIS顏色空間分量直方圖上的分布具有明顯不同,可以將RGB轉換為HIS,憑借直方圖閾值便能有效區(qū)分蘋果表面顏色的分布情況。只是蘋果在成熟階段的表面顏色分布不均,多數情況都存在顏色分布重疊情況,會對閾值設定和區(qū)分造成一定影響。不過,可以在圖像識別系統(tǒng)中應用人工神經網絡進行訓練,采取多元判別技術分辨H值特征,可以得到更多精準的判斷,以此解決重疊非問題。直方圖識別簡單方便,但在處理一些復雜的視覺圖像時效果不佳,現階段多是將直方圖識別與其他方法配合使用。
(2)線性判別分析識別
線性判別分析可以對所屬類別進行有效的分離,是早期處理復雜數據分類和統(tǒng)計的分析識別防范。線性判別分析識別的原理是將多元色調轉變?yōu)榉嵌嘣{,雖然會增加一些處理分析時間,卻不會限制測量對象所具有的色度維數,能夠得到高質量分辨效果。線性判別分析識別率可達95%以上,不過線性判別分析識別在面對類球形果蔬時識別率只能達到90%左右,這是因為有些數據在特征空間中并非表現為正態(tài)分布,無法精準識別邊界。
(3)神經網絡識別
人工神經網絡是信息技術智能化發(fā)展的主要趨勢,其本身具備的學習、記憶、處理和非線性轉換能力,在圖像識別系統(tǒng)中有著良好的應用。就農業(yè)生產而言,三層神經網絡就能滿足識別需求。通過將同種不同類別的作物作為輸出目標對象,讓神經網絡判斷目標對象的種類和特點,根據灰度直方圖計算出灰度級頻率,以此得到相應的分辨結果。三層神經網絡分別依據物體的形狀、紋理和分形進行識別,不斷對目標對象進行識別和分級,最終得到準確的分級結果。神經網絡識別技術還在發(fā)展當中,現今已經能夠檢測出玉米籽的裂紋等詳細情況。
(4)貝葉斯識別
貝葉斯判別就是一種統(tǒng)計學識別方法,根據目標對象的特征向量的函數分布情況,通過統(tǒng)計密度將將具有相同均值向量、協(xié)方差矩陣代入貝葉斯法則,便能得到相應的判別式。此種識別方式在正常情況下能達到92%的識別率,但在果蔬作物因成熟度發(fā)生明顯顏色變化的時期,其識別率會有明顯下降。
(5)向量機識別
向量機與神經網絡識別類似,是一種小樣本的學習方法,多適用于二類問題,大量樣本的學習、分析或是統(tǒng)計也會增加相應的計算時間,在農業(yè)機械快速運作中會增加系負荷。向量機面對非線性識別問題,可以運用核函數將非線性問題轉化為特征內容的線性問題,得到最優(yōu)分類。以蘋果為例,結合顏色特征和形狀特征,運用支持向量機識別方式,其徑向核函數識別率為93%左右,在二類問題識別方面其速度和精度都要優(yōu)于人工神經網絡。
基于機器視覺的圖像識別系統(tǒng)在農業(yè)機械中有著廣泛應用,主要涉及農機自動檢測、農業(yè)收獲、田間作業(yè)三方面。分揀作業(yè)有人力完成效率過低,而機械式的分揀方式過于單一,無法滿足農產品的分揀需求,還容易損傷產品。使用圖像識別系統(tǒng)便可以實現無損自動檢測,極大地提升了農業(yè)生產質量,而在農產品收獲和田間播種、施肥灌溉之中也有高效的應用?,F階段已經在農業(yè)生產中取得了良好的效果,正邁入更大范圍的應用階段。
結論:機器視覺在農業(yè)機械圖像識別系統(tǒng)已經有著不少的應用,從機器視覺圖像識別系統(tǒng)出發(fā),深入了解機器視覺圖像識別在農業(yè)生產中預處理、分割、特征提取、圖像識別的應用情況,在信息技術快速發(fā)展的背景下,機械設備和算法也在不斷優(yōu)化,機器視覺圖像識別也將更加精準和高效,為農業(yè)機械發(fā)展及農業(yè)生產提供了更為廣闊的發(fā)展空間。