周 智
基于高色差分離預(yù)處理的K-means茶葉嫩芽識別研究
周智
(華東交通大學(xué)理工學(xué)院江西南昌330000)
近年來,隨著無人機(jī)技術(shù)、計算機(jī)技術(shù)、圖像識別和處理等技術(shù)的不斷發(fā)展,應(yīng)用場景也發(fā)生許多變化。文章在無人機(jī)進(jìn)行低空拍攝的基礎(chǔ)上,利用G-B、ExR、Cg對樣本素材分離再結(jié)合后進(jìn)行圖像的預(yù)處理,再利用K-means算法對合成圖中的茶葉嫩芽進(jìn)行分割,通過對比發(fā)現(xiàn),經(jīng)過預(yù)處理的圖片在分割的過程中能有效識別和分割出茶葉嫩芽。
K-means算法;茶葉;圖像分割;識別;智能采摘
我國是茶葉生產(chǎn)的主要國家之一,由于茶葉采摘通常受到時節(jié)等因素的影響,如何及時、有效地完成茶葉的采摘是保障成茶質(zhì)量的重要前提。目前,我國各大生產(chǎn)基地對于茶葉嫩芽采摘仍以人工采摘為主,該方式存在短時間內(nèi)工作強(qiáng)度大、成本高、人為因素不穩(wěn)定等問題。隨著計算機(jī)技術(shù)的發(fā)展,研究茶葉相關(guān)的智能采摘技術(shù)具有重要的意義,因此,利用無人機(jī)采集圖像平臺采集茶葉圖像[1],借助圖像處理技術(shù)的茶葉嫩芽識別技術(shù),以期在智能采摘、病蟲害預(yù)防、產(chǎn)量預(yù)估等方面獲得有效的提升。
K-means算法(K-均值聚類算法)是一種典型且應(yīng)用廣泛的無監(jiān)督分類算法,它基于樣本間相似性度量的間接聚類方法[3],該算法認(rèn)為當(dāng)兩個對象的距離越近,其相似度就越大,并認(rèn)為簇是由距離靠近的對象組成的,其目的是通過對無標(biāo)記樣本的學(xué)習(xí)來揭示蘊(yùn)含在數(shù)據(jù)之中的性質(zhì)和規(guī)律,因此該算法也特別適合在沒有大量樣本可以進(jìn)行學(xué)習(xí)的前提下智能設(shè)備的基礎(chǔ)算法。
K-means算法首先隨機(jī)選取K個點作為初始聚類中心,然后計算各個數(shù)據(jù)對象到各聚類中心的距離,把數(shù)據(jù)對象歸到離它最近的聚類中心所在的類;調(diào)整后的新類計算新的聚類中心,如果相鄰兩次的聚類中心沒有任何變化,說明數(shù)據(jù)對象調(diào)整結(jié)束,聚類準(zhǔn)則函數(shù)F已經(jīng)收斂。在每次迭代中都要考察每個樣本的分類是否正確,若不正確,則需要進(jìn)行調(diào)整。在調(diào)整全部數(shù)據(jù)后,再修改聚類中心,進(jìn)入下一次迭代。如果在一次迭代算法中,所有的數(shù)據(jù)對象被正確分類,則不會有調(diào)整,聚類中心也不會有任何變化,這標(biāo)志著F已經(jīng)收斂,算法結(jié)束。其實這跟普通的前饋神經(jīng)網(wǎng)絡(luò)使用逆向傳播算法訓(xùn)練模型的原理類似,通過分析誤差,修改模型直至達(dá)到要求的誤差范圍。
清明節(jié)前,在江西省井岡山市遂川縣茶場進(jìn)行圖像采集,設(shè)備采用無人機(jī),型號為DJIMavicair2。拍攝角度為垂直90 °,距離為80~100 cm。在實地拍攝的茶葉圖像中,信息具有一定的復(fù)雜度,我們將除嫩芽以外的信息稱為背景,背景主要由老葉和枝干等構(gòu)成,其中茶葉老葉呈深綠色或者藍(lán)綠色,枝干呈灰褐色,而茶葉嫩芽呈黃綠色。隨機(jī)截取一個1 176 ×1 176 像素的圖片作為自然條件下的研究樣本(如圖1)。
圖1 自然條件下的茶葉樣本
軟件基件為MATLABR2020 a,計算機(jī)配置CPU為Intel(R)core(TM)i7-7500 U@2.70 GHz 2.90 GHz,內(nèi)存為8G,硬盤為120 G固態(tài)盤加1T機(jī)械盤組合。
由于茶葉嫩芽和老葉的顏色相似,且自然條件下的圖像存在一定的噪聲,需要選擇對比度較大圖像處理的茶葉圖像。在通過對茶葉采樣圖像進(jìn)行單一的RGB顏色分量的提取后,發(fā)現(xiàn)色差度并不是很明顯,且并沒有有效產(chǎn)生分離圖像的條件。具體結(jié)果如圖2所示。
對R-G、G-B、ExR、ExG、Cg這5個分量圖進(jìn)行統(tǒng)計分析發(fā)現(xiàn),G-B[4]、ExR、Cg采樣圖片中茶葉嫩芽與背景中的老葉具有較大差異,如圖3所示。其中對于ExR、G-B和Cg定義如下:
ExR:ExR=2*R-G-B
G-B:GB=G-B
Cg:Cg=128 +65.481 /256*R+112 /256*G-81.085 / 256*B[2]
基于G-B、ExR、Cg 3個分量圖的結(jié)果,將3個分量圖進(jìn)行合成,合成思路為:Composeimage=cat(3,ExR,Cg,G-B),得到圖4。
首先對圖4茶葉合成圖進(jìn)行K-means分割,其過程如下:
(1)在圖中隨機(jī)取K個簇作為質(zhì)心點。
(3)所有實例點劃分到各簇后,使用簇內(nèi)實例重新計算質(zhì)心點。
(4)重復(fù)步驟(2)和步驟(3),直到各簇的質(zhì)心點不再變動。
最后得到基于合成圖的分割效果,如圖5所示。
圖4 基于ExR、Cg、G-B的合成圖
圖5 基于合成圖的K-means分割效果
圖6 基于采樣圖像的K-means 分割效果
為了驗證該思路的有效性,利用同樣的算法代碼,對未曾進(jìn)行前期處理的素材圖1進(jìn)行處理,分割效果如圖6所示。對比之下,分割的效果明顯高于后者。
在自然環(huán)境中茶葉嫩芽圖像分割會受到自然光照、拍攝角度、灰塵、飛蟲等因素的干擾,文章針對航拍條件下茶葉圖像進(jìn)行ExR分量、Cg分量、G-B分量分離再合成,以合成圖作為待分割樣本,利用K-means聚類算法分割圖像。通過對比發(fā)現(xiàn),基于合成圖的圖像分割效果明顯高于未經(jīng)預(yù)處理的分割效果。但其中仍然存在一定的噪聲,其原因有很多,當(dāng)K-means聚類算法在收斂到全局時,未必能做到最優(yōu)解,但研究結(jié)果能為后期茶葉種植進(jìn)一步智能化提供理論支持。
[1]姜鋮,馮傳烈,劉云,等.基于無人機(jī)低空攝像的嫩茶葉特征信息的研究[J].南方農(nóng)機(jī),2020,51(1):18.
[2]夏華鹍,方夢瑞,黃濤,等.基于SLIC超像素的茶葉嫩芽圖像分割方法研究[J].西昌學(xué)院學(xué)報(自然科學(xué)版),2019.
[3]吳雪梅,唐仙,張富貴,等.基于K-means聚類法的茶葉嫩芽識別研究[J].中國農(nóng)機(jī)化學(xué)報,2015,36(5):161-164,179.
[4]吳雪梅,張富貴,呂敬堂.基于圖像顏色信息的茶葉嫩葉識別方法研究[J].茶葉科學(xué),2013(6):98-103.
周智(1984- ),男,江西九江人,碩士,助教,研究方向:網(wǎng)絡(luò)傳播、機(jī)器學(xué)習(xí)、圖像分割與識別。
10.3969/j.issn.2095-1205.2020.11.36
S571.1
A
2095-1205(2020)11-74-02