萬(wàn) 廣,陳忠輝,方洪波,閆建偉,張文勇,謝本亮
(1 貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽(yáng) 550025; 2 貴州大學(xué) 機(jī)械工程學(xué)院,貴州 貴陽(yáng) 550025; 3 貴州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴州 貴陽(yáng) 550025)
作為茶葉的原產(chǎn)地之一,中國(guó)有著歷史悠久的茶文化底蘊(yùn)[1],茶鮮葉質(zhì)量的優(yōu)劣基本決定著茶葉品質(zhì)的高低。隨著勞動(dòng)力的短缺以及勞動(dòng)成本的提升,茶產(chǎn)業(yè)機(jī)械化、工業(yè)化進(jìn)程的不斷推進(jìn),茶鮮葉的機(jī)械化采摘技術(shù)和裝備日趨成熟。但機(jī)采茶鮮葉混雜度高,包含有各種等級(jí)的茶葉,因此在制茶工藝中,分選成為了一道費(fèi)工、費(fèi)時(shí)且關(guān)鍵的工序。早期根據(jù)茶鮮葉的物理特性,研制出了滾篩、圓篩、風(fēng)選等分選方法[2],雖然可以去除茶鮮葉中的雜物(如殘葉、葉梗等),但難以對(duì)茶鮮葉進(jìn)行精確的等級(jí)劃分。
近年來(lái),隨著機(jī)器視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,茶葉的分類技術(shù)進(jìn)入智能化時(shí)代。陳全勝等[3]利用顏色特征建立支持向量機(jī)(Support vector machines, SVM)分類模型,通過(guò)色澤來(lái)分辨茶葉品質(zhì)的優(yōu)次,模型的平均識(shí)別率達(dá)到95%左右;吳正敏等[4]以大紅袍為例,通過(guò)提取夏秋季節(jié)茶葉各種形態(tài)特征參數(shù),判斷特征權(quán)重進(jìn)行特征選擇,并且設(shè)置不同的權(quán)重比來(lái)完成葉和梗的分離,最終識(shí)別準(zhǔn)確率為93.8%;高震宇等[5]通過(guò)建立卷積神經(jīng)網(wǎng)絡(luò),通過(guò)局部連接和權(quán)值共享等方法提高了網(wǎng)絡(luò)的訓(xùn)練性能,最終識(shí)別的準(zhǔn)確率不低于90%。余洪[6]通過(guò) RGB(Red, green, blue)和 HIS(Hue, instensity,saturation)顏色模型提取顏色特征,通過(guò)統(tǒng)計(jì)矩和灰度共生矩提取紋理特征,共提取到12個(gè)顏色特征和22個(gè)紋理特征,建立基于主成分分析、遺傳算法和BP神經(jīng)網(wǎng)絡(luò)的茶葉品質(zhì)分級(jí)模型,識(shí)別準(zhǔn)確率達(dá)到92.5%。
本研究應(yīng)用隨機(jī)森林分類模型,以3種不同品質(zhì)的茶鮮葉圖像作為依據(jù),分別提取茶鮮葉樣本圖像的顏色特征和邊緣特征,并且將2種特征同時(shí)輸入到分類模型中,以期實(shí)現(xiàn)對(duì)3種不同品質(zhì)茶鮮葉的精確識(shí)別和分類。
試驗(yàn)研究對(duì)象是綠茶中的都勻毛尖,于春季在貴州省黔西南州采摘,共采集到茶鮮葉樣本葉片906個(gè),其中包括單芽299個(gè)、一芽一葉302個(gè)、一芽二葉305個(gè)。拍攝環(huán)境為實(shí)驗(yàn)室,拍照設(shè)備為手機(jī)榮耀 20 (后置四攝 4800 萬(wàn)+1600 萬(wàn)+200 萬(wàn)+200萬(wàn)像素);為了突出茶鮮葉的顏色特征和邊緣特征,拍照背景選擇A4白紙以提高對(duì)比度;并用普通白熾燈照射,減弱周圍其他光源的影響;拍攝方式為垂直俯拍,并用支架固定手機(jī)拍攝位置,手機(jī)與樣本之間的距離為30 cm左右。采集的部分樣本圖像如圖1所示。
圖 1 不同等級(jí)茶鮮葉樣本圖像Fig. 1 Representative images of different grades of fresh tea leaves
圖像采集過(guò)程中避免不了外界因素的干擾,為了便于后續(xù)特征提取的方便,需要對(duì)獲得的圖像數(shù)據(jù)集進(jìn)行預(yù)處理。其中包括區(qū)域裁剪、尺寸歸一化和噪聲去除[7]。具體操作流程如圖2所示。
圖 2 圖像預(yù)處理流程圖Fig. 2 Flow chart of image preprocessing
1.2.1 區(qū)域裁剪和尺寸歸一化 由于拍攝條件的限制,茶鮮葉在圖像中的顯示位置會(huì)有差異,RGB圖像也不能保持一致。因此需要對(duì)茶鮮葉的圖像進(jìn)行區(qū)域裁剪。區(qū)域裁剪的目的是將研究以外的區(qū)域去除,保留圖像中心區(qū)域的茶鮮葉圖像作為感興趣區(qū)域 (Region of interest,ROI);對(duì)區(qū)域裁剪處理后的圖像進(jìn)行尺寸歸一化,使各個(gè)指標(biāo)處于同一個(gè)數(shù)量級(jí),處理后的圖像分辨率為 2 56×256像素,如圖2b所示。
1.2.2 噪聲去除 圖像中存在的噪聲會(huì)對(duì)茶鮮葉葉片的特征提取產(chǎn)生不利的影響,因此需要消除圖像中的噪聲干擾。采用中值濾波算法對(duì)圖像進(jìn)行預(yù)處理,在去除噪聲的同時(shí)保留完整的葉片信息,并且能夠很好地保護(hù)圖像的邊緣信息,使圖像中茶鮮葉的邊緣更加平滑,便于后續(xù)邊緣特征的提取。得到的濾波后圖像如圖2c所示。
1.3.1 顏色特征提取 顏色作為一種全局特征[8-10],是圖像中最簡(jiǎn)單直接的一種特征,直方圖作為一種簡(jiǎn)單有效的基于統(tǒng)計(jì)特性的特征描述,能描述圖像中顏色的全局分布。本文將RGB顏色空間和HSV(Hue,saturation,value)顏色空間[11]配合使用來(lái)區(qū)分不同等級(jí)的茶鮮葉顏色特征。HSV是根據(jù)顏色的直觀特性創(chuàng)建的一種顏色空間,更接近實(shí)際人類的視覺(jué)特征,手機(jī)拍攝獲得的圖像為RGB格式,需要轉(zhuǎn)化為HSV格式,RGB坐標(biāo)系向HSV空間轉(zhuǎn)化的公式為:
式中:(R,G,B)min表示三者中的最小值;H代表色調(diào),用角度度量,取值范圍為 [0°,360°],從紅色開(kāi)始按逆時(shí)針?lè)较蛴?jì)算,紅色為0°,綠色為120°,藍(lán)色為240°;S代表飽和度,表示顏色接近光譜色的程度;V代表明度,表示顏色明亮的程度,通常取值為0%(黑)~100%(白);R、G、B分別表示紅、綠、藍(lán)通道。
對(duì)經(jīng)過(guò)中值濾波處理后的圖像進(jìn)行顏色特征的提取,3種不同等級(jí)的茶鮮葉的RGB空間的直方圖和HSV空間的H、S、V通道的直方圖像素分布情況如圖3~圖6所示。
圖 3 3種等級(jí)茶鮮葉的顏色空間直方圖Fig. 3 Color space histogram of three grades of fresh tea leaves
圖 4 單芽茶鮮葉的H、S、V通道直方圖Fig. 4 H, S, V channel histogram of fresh tea leaf with single bud
圖 5 一芽一葉茶鮮葉的H、S、V通道直方圖Fig. 5 H, S, V channel histogram of fresh tea leaf with one bud and one leaf
圖 6 一芽二葉茶鮮葉的H、S、V通道直方圖Fig. 6 H, S, V channel histogram of fresh tea leaf with one bud and two leaves
對(duì)多個(gè)茶鮮葉的直方圖的像素進(jìn)行統(tǒng)計(jì)得出,在RGB空間中單芽圖像的像素主要分布區(qū)間為[134,184],一芽一葉圖像的像素主要分布區(qū)間為[43,96]和[147,186],一芽二葉圖像的像素主要分布區(qū)間為[41,197]。在HSV空間中3種等級(jí)的茶鮮葉圖像H通道像素主要分布區(qū)間為[0,70],S通道像素主要分布區(qū)間為[0,200],V通道像素主要分布區(qū)間為[40,200]。為了加強(qiáng)不同等級(jí)茶鮮葉像素之間的差異,分別對(duì)H、S、V三通道像素進(jìn)行非等間隔的量化,其中色調(diào)H空間分為8份,飽和度S和亮度V空間各劃分為3份,以提高分類器的構(gòu)建效率和識(shí)別的準(zhǔn)確率。
1.3.2 邊緣特征提取 圖像的邊緣特征主要針對(duì)物體的外邊界[12-14]。Canny算法是一種多級(jí)邊緣檢測(cè)算法,在實(shí)際操作中,Canny算法使用一個(gè)低閾值和一個(gè)高閾值來(lái)確定哪些點(diǎn)屬于輪廓,低閾值主要包括所有屬于明顯圖像輪廓的邊緣像素;高閾值是定義所有重要輪廓的邊緣,最后組合低閾值和高閾值兩幅邊緣圖生成最優(yōu)的輪廓圖。圖像的邊緣可以指向不同的方向,因此經(jīng)典Canny算法用4個(gè)梯度算子來(lái)計(jì)算水平、垂直和對(duì)角線方向的梯度[15]。本文采用梯度算子中的Sobel算子計(jì)算水平和垂直方向的差分Gx和Gy,由這2個(gè)條件便可計(jì)算梯度模和方向,如式(4)、式(5)所示。
圖 7 邊緣特征圖像Fig. 7 Edge feature image
1.4.1 算法原理 隨機(jī)森林 (Random forest,RF)[16-19]屬于并行集成學(xué)習(xí)中Bagging(Bootstrap AGGregatING)算法的一種擴(kuò)展變體,是在以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入隨機(jī)屬性選擇。它將多種弱分類器集成,形成新的分類器模型,決策樹(shù)決定了輸出分類,無(wú)需特征篩選也能得到較高的正確率,對(duì)特征具有較好的魯棒性。與傳統(tǒng)的分類器相比,隨機(jī)森林需要很少的參數(shù)調(diào)整,并且在準(zhǔn)確率方面有很大的優(yōu)勢(shì)。隨機(jī)森林擁有其獨(dú)特的特點(diǎn),能夠處理很高維度(特征較多)的數(shù)據(jù),不需要降維,訓(xùn)練速度較快,容易做成并行化方法,由于隨機(jī)性的引入,使得其很少出現(xiàn)過(guò)擬合的現(xiàn)象,隨機(jī)森林算法流程如圖8所示。
圖 8 隨機(jī)森林流程圖Fig. 8 Flow chart of random forest
1.4.2 隨機(jī)森林的訓(xùn)練過(guò)程 隨機(jī)森林的模型訓(xùn)練是通過(guò)隨機(jī)采樣(Bootstrap)方法隨機(jī)有放回地抽取k個(gè)樣本,并進(jìn)行Ntree次采樣,生成Ntree個(gè)訓(xùn)練集,分別訓(xùn)練Ntree個(gè)決策樹(shù)模型的過(guò)程。對(duì)于單個(gè)決策樹(shù)模型,每次分裂時(shí)根據(jù)信息增益和信息熵選擇最好的特征進(jìn)行分裂。對(duì)沒(méi)有抽中的樣本作為袋外數(shù)據(jù) (Out of bag,OOB)。
針對(duì)分類問(wèn)題,隨機(jī)森林的輸出采用多數(shù)投票法。利用隨機(jī)森林模型對(duì)測(cè)試集樣本進(jìn)行分類判別,過(guò)程就是讓每棵決策樹(shù)進(jìn)行投票抉擇,最終輸出最多的那個(gè)類別作為分類結(jié)果,輸出判別式如式(6)所示。
式中: a rgmax表示函數(shù)取得最大值時(shí)的參數(shù)值;H(x)表示隨機(jī)森林的最終分類結(jié)果;hi(x)表示單一決策樹(shù)模型分類結(jié)果;I()為示性函數(shù)(所謂示性函數(shù)是指一個(gè)函數(shù)使得當(dāng)集合內(nèi)有此數(shù)時(shí)值為1,當(dāng)集合內(nèi)無(wú)此數(shù)時(shí)值為0)[18];Y表示輸出變量(或稱目標(biāo)變量)。
本試驗(yàn)在Pycharm環(huán)境下進(jìn)行操作,所用電腦操作系統(tǒng)為Win10(64位),運(yùn)行內(nèi)存4 G,處理器為酷睿i5-6200u,主頻2.30 GHz,進(jìn)行圖像處理為OpenCV2庫(kù)。通過(guò)sklearn.ensemble調(diào)用Random-ForestClassifier分類模塊。隨機(jī)森林中決策樹(shù)的數(shù)目(Ntree)對(duì)最終分類結(jié)果有著及其重要的影響,Random-ForestClassifier模塊中通過(guò)n_estimators進(jìn)行調(diào)節(jié)。
多次試驗(yàn)證明,當(dāng)Ntree取值較小時(shí),隨機(jī)森林的分類誤差會(huì)較大,當(dāng)Ntree的值逐漸增大時(shí),隨機(jī)森林分類的精確度會(huì)有明顯的提升,但最終會(huì)趨于穩(wěn)定,甚至?xí)兴陆?。但?dāng)Ntree的數(shù)量越大時(shí),占用的內(nèi)存與訓(xùn)練和預(yù)測(cè)的時(shí)間也會(huì)相應(yīng)增加,且邊際效益是遞減的,所以要在可承受范圍內(nèi)盡可能地選取合適的數(shù)量。
為了進(jìn)一步選擇合適的決策樹(shù)數(shù)量,在固定其他參數(shù)不變、僅改變n_estimators參數(shù)的情況下,對(duì)茶鮮葉數(shù)據(jù)集進(jìn)行多次分類試驗(yàn),觀察分類精確度隨著決策樹(shù)數(shù)目的變化。
圖9顯示了分類準(zhǔn)確率隨著Ntree變化而變化的曲線。考慮到內(nèi)存和訓(xùn)練時(shí)間,本試驗(yàn)的Ntree選擇為35。
圖 9 分類準(zhǔn)確率隨決策樹(shù)數(shù)目(N tree)的變化Fig. 9 Classification accuracy varied with the number of decision trees (N tree)
試驗(yàn)時(shí)針對(duì)上述構(gòu)建好的隨機(jī)森林分類器模型,將預(yù)處理之后得到的906張圖像(單芽圖像299張,一芽一葉圖像302張,一芽二葉圖像305張)按照4∶1的比例劃分后進(jìn)行試驗(yàn),其中訓(xùn)練集724張,測(cè)試集182張。識(shí)別準(zhǔn)確率(Accuracy)是分類器性能判斷的重要指標(biāo)之一,另外,精確率(Precision)、召回率(Recall)以及綜合評(píng)價(jià)指標(biāo)(F1-score)在最終分類階段也作為常用的指標(biāo)。4種評(píng)價(jià)指標(biāo)公式如式(7)~式(10)所示。
式中:TP(True positive)為真陽(yáng)性,表示實(shí)際類別為正,算法輸出類別也為正;FP(False positive)為假陽(yáng)性,表示實(shí)際類別為負(fù),樣本輸出類別為正;TN(False negative)為假負(fù)性,表示實(shí)際類別為負(fù),算法輸出類別也為負(fù);FN(False negative)為假陰性,表示實(shí)際類別為正,算法輸出類別為負(fù)。
為了驗(yàn)證本文方法的有效性,分別將2個(gè)單一特征和融合特征輸入到隨機(jī)森林分類模型中,根據(jù)式(7)~(10),得到準(zhǔn)確率、精確率、召回率和綜合評(píng)價(jià)指標(biāo)等結(jié)果數(shù)值,分別列于表1~表3。
表 1 顏色特征分類結(jié)果Table 1 Color feature classification results %
表 2 邊緣特征分類結(jié)果Table 2 Edge feature classification results%
表 3 融合特征分類結(jié)果Table 3 Fusion feature classification results %
由表1可知,顏色特征的識(shí)別準(zhǔn)確率為92.31%,對(duì)單芽的分類結(jié)果最好,精確率、召回率和綜合評(píng)價(jià)指標(biāo)都為96.23%,主要原因在于單芽的直方圖像素區(qū)間較小,比較集中;一芽一葉和一芽二葉的顏色特征綜合評(píng)價(jià)指標(biāo)為90%左右,因?yàn)榇蠖鄶?shù)一芽一葉的直方圖像素區(qū)間為2個(gè),但2個(gè)區(qū)間的像素?cái)?shù)量并不是絕對(duì)為0,所以一芽一葉和一芽二葉容易造成混淆。
由表2可知,邊緣特征的識(shí)別準(zhǔn)確率為90.11%,比顏色特征低2.2個(gè)百分點(diǎn),主要原因也在于一芽一葉和一芽二葉之間的混淆,例如:測(cè)試集混淆矩陣中,一芽一葉55張,有7張識(shí)別為一芽二葉;一芽二葉59張,有8張識(shí)別為一芽一葉。
由表3可知,顏色和邊緣特征融合識(shí)別的準(zhǔn)確率為99.45%,比顏色特征和邊緣特征的識(shí)別準(zhǔn)確率分別高7.14,9.34個(gè)百分點(diǎn),該方法取2個(gè)特征識(shí)別時(shí)的交集,避免了單一特征識(shí)別時(shí)的局限性,提高了識(shí)別準(zhǔn)確率,證明了該方法的可行性。
為了進(jìn)一步說(shuō)明本文方法的有效性,將本文方法同傳統(tǒng)的機(jī)器學(xué)習(xí)方法K最近鄰(K-nearest neighbor, KNN)[20]和SVM分類器[21-22]進(jìn)行對(duì)照試驗(yàn)。其中K最近鄰算法中K設(shè)置為3,SVM分類器中懲罰系數(shù)C設(shè)置為10,核函數(shù)系數(shù)gamma為0.0001,試驗(yàn)結(jié)果如表 4 所示。
表 4 不同模型的平均分類結(jié)果Table 4 Average classification results of different models %
由表4可以看出,針對(duì)茶鮮葉等級(jí)的分類問(wèn)題,隨機(jī)森林模型明顯優(yōu)于K最近鄰和SVM分類器,在準(zhǔn)確率上分別高出15.38和5.49個(gè)百分點(diǎn),精確率、召回率和綜合評(píng)價(jià)指標(biāo)也有明顯的優(yōu)勢(shì)。以上結(jié)果表明,在茶鮮葉的分類中,隨機(jī)森林模型的分類性能最優(yōu),SVM次之,K最近鄰效果最差。作為機(jī)器學(xué)習(xí)中最常用的一種算法,SVM需要對(duì)參數(shù)進(jìn)行不斷的優(yōu)化,以提高分類的準(zhǔn)確率和防止過(guò)擬合問(wèn)題的出現(xiàn),相較于隨機(jī)森林模型需要耗費(fèi)更多的時(shí)間和精力。作為最簡(jiǎn)單的算法之一,K最近鄰算法原理簡(jiǎn)單,容易理解,但需要對(duì)樣本的特征進(jìn)行量化,才能獲得較好的分類結(jié)果。
本文以春季的都勻毛尖作為研究對(duì)象,利用隨機(jī)森林分類模型,提出了一種顏色特征和邊緣特征融合的方法,對(duì)3種不同等級(jí)的茶鮮葉進(jìn)行識(shí)別和分類。根據(jù)準(zhǔn)確率、精確率、召回率和綜合評(píng)價(jià)指標(biāo)進(jìn)行判定。首先對(duì)茶鮮葉圖像進(jìn)行區(qū)域裁剪、尺寸歸一化和噪聲去除等預(yù)處理,提取RGB空間的彩色直方圖并轉(zhuǎn)移到HSV空間中,計(jì)算H、S、V三通道像素區(qū)間,獲得茶鮮葉圖像的顏色特征。利用Canny邊緣檢測(cè)算法提取圖像的邊緣特征,將2種特征融合作為茶鮮葉的識(shí)別特征。為了判斷本文方法的有效性,將單一特征和融合特征后的分類結(jié)果進(jìn)行對(duì)照,并且將隨機(jī)森林模型同K最近鄰和SVM分類器進(jìn)行對(duì)照試驗(yàn)。試驗(yàn)結(jié)果表明,特征融合隨機(jī)森林模型的分類準(zhǔn)確率、精確率、召回率和綜合評(píng)價(jià)指標(biāo)分別達(dá)99.45%、99.40%、99.44%和99.42%,明顯高于單一特征的分類結(jié)果,并且隨機(jī)森林模型的分類性能最優(yōu)。該方法也能快速應(yīng)用到其他類型的茶鮮葉分選,為茶鮮葉分選的智能化進(jìn)程提供了一定的依據(jù)。