周 智
基于高色差分離預處理的K-means茶葉嫩芽識別研究
周智
(華東交通大學理工學院江西南昌330000)
近年來,隨著無人機技術、計算機技術、圖像識別和處理等技術的不斷發(fā)展,應用場景也發(fā)生許多變化。文章在無人機進行低空拍攝的基礎上,利用G-B、ExR、Cg對樣本素材分離再結合后進行圖像的預處理,再利用K-means算法對合成圖中的茶葉嫩芽進行分割,通過對比發(fā)現,經過預處理的圖片在分割的過程中能有效識別和分割出茶葉嫩芽。
K-means算法;茶葉;圖像分割;識別;智能采摘
我國是茶葉生產的主要國家之一,由于茶葉采摘通常受到時節(jié)等因素的影響,如何及時、有效地完成茶葉的采摘是保障成茶質量的重要前提。目前,我國各大生產基地對于茶葉嫩芽采摘仍以人工采摘為主,該方式存在短時間內工作強度大、成本高、人為因素不穩(wěn)定等問題。隨著計算機技術的發(fā)展,研究茶葉相關的智能采摘技術具有重要的意義,因此,利用無人機采集圖像平臺采集茶葉圖像[1],借助圖像處理技術的茶葉嫩芽識別技術,以期在智能采摘、病蟲害預防、產量預估等方面獲得有效的提升。
K-means算法(K-均值聚類算法)是一種典型且應用廣泛的無監(jiān)督分類算法,它基于樣本間相似性度量的間接聚類方法[3],該算法認為當兩個對象的距離越近,其相似度就越大,并認為簇是由距離靠近的對象組成的,其目的是通過對無標記樣本的學習來揭示蘊含在數據之中的性質和規(guī)律,因此該算法也特別適合在沒有大量樣本可以進行學習的前提下智能設備的基礎算法。
K-means算法首先隨機選取K個點作為初始聚類中心,然后計算各個數據對象到各聚類中心的距離,把數據對象歸到離它最近的聚類中心所在的類;調整后的新類計算新的聚類中心,如果相鄰兩次的聚類中心沒有任何變化,說明數據對象調整結束,聚類準則函數F已經收斂。在每次迭代中都要考察每個樣本的分類是否正確,若不正確,則需要進行調整。在調整全部數據后,再修改聚類中心,進入下一次迭代。如果在一次迭代算法中,所有的數據對象被正確分類,則不會有調整,聚類中心也不會有任何變化,這標志著F已經收斂,算法結束。其實這跟普通的前饋神經網絡使用逆向傳播算法訓練模型的原理類似,通過分析誤差,修改模型直至達到要求的誤差范圍。
清明節(jié)前,在江西省井岡山市遂川縣茶場進行圖像采集,設備采用無人機,型號為DJIMavicair2。拍攝角度為垂直90 °,距離為80~100 cm。在實地拍攝的茶葉圖像中,信息具有一定的復雜度,我們將除嫩芽以外的信息稱為背景,背景主要由老葉和枝干等構成,其中茶葉老葉呈深綠色或者藍綠色,枝干呈灰褐色,而茶葉嫩芽呈黃綠色。隨機截取一個1 176 ×1 176 像素的圖片作為自然條件下的研究樣本(如圖1)。
圖1 自然條件下的茶葉樣本
軟件基件為MATLABR2020 a,計算機配置CPU為Intel(R)core(TM)i7-7500 U@2.70 GHz 2.90 GHz,內存為8G,硬盤為120 G固態(tài)盤加1T機械盤組合。
由于茶葉嫩芽和老葉的顏色相似,且自然條件下的圖像存在一定的噪聲,需要選擇對比度較大圖像處理的茶葉圖像。在通過對茶葉采樣圖像進行單一的RGB顏色分量的提取后,發(fā)現色差度并不是很明顯,且并沒有有效產生分離圖像的條件。具體結果如圖2所示。
對R-G、G-B、ExR、ExG、Cg這5個分量圖進行統(tǒng)計分析發(fā)現,G-B[4]、ExR、Cg采樣圖片中茶葉嫩芽與背景中的老葉具有較大差異,如圖3所示。其中對于ExR、G-B和Cg定義如下:
ExR:ExR=2*R-G-B
G-B:GB=G-B
Cg:Cg=128 +65.481 /256*R+112 /256*G-81.085 / 256*B[2]
基于G-B、ExR、Cg 3個分量圖的結果,將3個分量圖進行合成,合成思路為:Composeimage=cat(3,ExR,Cg,G-B),得到圖4。
首先對圖4茶葉合成圖進行K-means分割,其過程如下:
(1)在圖中隨機取K個簇作為質心點。
(3)所有實例點劃分到各簇后,使用簇內實例重新計算質心點。
(4)重復步驟(2)和步驟(3),直到各簇的質心點不再變動。
最后得到基于合成圖的分割效果,如圖5所示。
圖4 基于ExR、Cg、G-B的合成圖
圖5 基于合成圖的K-means分割效果
圖6 基于采樣圖像的K-means 分割效果
為了驗證該思路的有效性,利用同樣的算法代碼,對未曾進行前期處理的素材圖1進行處理,分割效果如圖6所示。對比之下,分割的效果明顯高于后者。
在自然環(huán)境中茶葉嫩芽圖像分割會受到自然光照、拍攝角度、灰塵、飛蟲等因素的干擾,文章針對航拍條件下茶葉圖像進行ExR分量、Cg分量、G-B分量分離再合成,以合成圖作為待分割樣本,利用K-means聚類算法分割圖像。通過對比發(fā)現,基于合成圖的圖像分割效果明顯高于未經預處理的分割效果。但其中仍然存在一定的噪聲,其原因有很多,當K-means聚類算法在收斂到全局時,未必能做到最優(yōu)解,但研究結果能為后期茶葉種植進一步智能化提供理論支持。
[1]姜鋮,馮傳烈,劉云,等.基于無人機低空攝像的嫩茶葉特征信息的研究[J].南方農機,2020,51(1):18.
[2]夏華鹍,方夢瑞,黃濤,等.基于SLIC超像素的茶葉嫩芽圖像分割方法研究[J].西昌學院學報(自然科學版),2019.
[3]吳雪梅,唐仙,張富貴,等.基于K-means聚類法的茶葉嫩芽識別研究[J].中國農機化學報,2015,36(5):161-164,179.
[4]吳雪梅,張富貴,呂敬堂.基于圖像顏色信息的茶葉嫩葉識別方法研究[J].茶葉科學,2013(6):98-103.
周智(1984- ),男,江西九江人,碩士,助教,研究方向:網絡傳播、機器學習、圖像分割與識別。
10.3969/j.issn.2095-1205.2020.11.36
S571.1
A
2095-1205(2020)11-74-02