劉曉洋 趙德安 賈偉寬 阮承治 姬 偉
(1.江蘇大學(xué)電氣信息工程學(xué)院, 鎮(zhèn)江 212013; 2.山東師范大學(xué)信息科學(xué)與工程學(xué)院, 濟(jì)南 250358;3.武夷學(xué)院機(jī)電工程學(xué)院, 武夷山 354300)
蘋果是我國(guó)產(chǎn)量最高的水果,根據(jù)2019年中國(guó)統(tǒng)計(jì)年鑒數(shù)據(jù)顯示,2017年中國(guó)蘋果總產(chǎn)量達(dá)4 139萬(wàn)t。蘋果采摘作業(yè)是一種勞動(dòng)力密集型和時(shí)間密集型工作。為推進(jìn)農(nóng)業(yè)生產(chǎn)的自動(dòng)化,采用蘋果采摘機(jī)器人替代人工進(jìn)行果實(shí)采摘是農(nóng)業(yè)發(fā)展的必然趨勢(shì)[1-3]。在自然非結(jié)構(gòu)化的環(huán)境下,果實(shí)由于著色不均或受光線影響增加了識(shí)別和分割的難度。
根據(jù)果實(shí)和背景的色差并結(jié)合閾值分割的方法是一種常用的果實(shí)分割方法[4-5]。這種類型分割方法的核心思想是在RGB、Lab、HSV、HSI和YCbCr等顏色空間中尋找背景和目標(biāo)差異較大的顏色通道,或者根據(jù)不同顏色通道間的運(yùn)算構(gòu)造出背景和目標(biāo)差異較大的圖像,再進(jìn)行閾值分割[6-8]。呂繼東等[9]采用R-G色差結(jié)合Otsu動(dòng)態(tài)閾值法實(shí)現(xiàn)了對(duì)蘋果的快速分割。盧軍等[10]采用R-B色差結(jié)合Otsu動(dòng)態(tài)閾值法實(shí)現(xiàn)了對(duì)成熟柑橘的初步分割。司永勝等[11]將滿足公式R-G>0和(R-G)/(G-B)>1的像素點(diǎn)劃分為蘋果像素點(diǎn)實(shí)現(xiàn)了果實(shí)的分割。THENDRAL等[12]采用Lab顏色空間中的a分量,實(shí)現(xiàn)了對(duì)成熟柑橘的分割。該類型方法因簡(jiǎn)單、快速、運(yùn)算量少,且不涉及復(fù)雜運(yùn)算,便于在多種硬件平臺(tái)上實(shí)現(xiàn),而得到廣泛運(yùn)用。但是,其缺點(diǎn)同樣明顯,該類算法只能適應(yīng)特定的光線環(huán)境,對(duì)于自然環(huán)境下多變的光線環(huán)境識(shí)別效果不佳。此外,該類型算法難以對(duì)背景中所有景物實(shí)現(xiàn)有效的分離。例如,在利用R-G色差法結(jié)合Otsu自動(dòng)閾值法對(duì)成熟蘋果進(jìn)行分割時(shí),難以將果實(shí)與嫩枝和土壤等景物進(jìn)行有效分離。
相較于以上基于色差與閾值分割的果實(shí)分割算法,基于多種特征和智能分類算法的果實(shí)分割方法具有更好的分割效果[13-15]。TEIXID等[16]采集2種樹枝樣本、5種樹葉樣本和4種果實(shí)樣本,根據(jù)不同像素點(diǎn)樣本在RGB顏色空間的分布,建立11種線性顏色模型,以實(shí)現(xiàn)對(duì)桃子果實(shí)的分割。JI等[17]首先篩選出一批可能是蘋果的像素點(diǎn),然后以像素點(diǎn)之間在RGB顏色空間的歐氏距離作為相似性衡量標(biāo)準(zhǔn),采用區(qū)域生長(zhǎng)法對(duì)蘋果果實(shí)進(jìn)行初步分割,再通過(guò)生長(zhǎng)區(qū)域的顏色紋理特征,采用SVM法對(duì)其進(jìn)行分類,實(shí)現(xiàn)對(duì)果實(shí)的分割。LIU等[18]根據(jù)每個(gè)像素的RGB值和HSI值,采用反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural network, BPNN)進(jìn)行分類,初步分割出夜間的蘋果果實(shí),并根據(jù)已分割果實(shí)周圍像素的相對(duì)位置和顏色差,采用BPNN進(jìn)行再次分割,得到果實(shí)邊緣較暗的部分,實(shí)現(xiàn)對(duì)夜間果實(shí)的完整分割。
以上算法在初步分割階段僅考慮了單個(gè)像素的特征,而未考慮相鄰像素之間的潛在聯(lián)系。超像素分割算法是一種充分考慮鄰接像素位置關(guān)系的分割算法。常見的超像素分割算法包含以Graph-based和Graph Cuts為代表的基于圖論的方法與以分水嶺算法和SLIC為代表的基于梯度下降的算法。徐偉悅等[19]采用FSLIC算法進(jìn)行了自然場(chǎng)景下成熟蘋果的分割,并取得了良好的效果。任守綱等[20]采用超像素分割算法對(duì)黃瓜葉部病害圖像進(jìn)行分割,并運(yùn)用顯著性檢測(cè)算法實(shí)現(xiàn)病蟲害的識(shí)別。孫龍清等[21]結(jié)合分水嶺算法提出改進(jìn)的Graph Cuts算法,實(shí)現(xiàn)了對(duì)生豬圖像的分割。超像素分割方法能夠有效避免因單個(gè)像素突變帶來(lái)的分割誤差。
果實(shí)與背景差異越大,越容易分割,由于果實(shí)品種的差異,以及果園種植管理方面的差異,大部分果實(shí)在成熟狀態(tài)也難以均勻著色,并且在實(shí)際的識(shí)別中還要受到光線等多方面因素干擾。針對(duì)蘋果果實(shí)的分割問(wèn)題,本文提出一種基于超像素特征的果實(shí)分割方法。該方法首先將整幅圖像分割成若干超像素單元,然后提取超像素的顏色和紋理特征并用智能分類算法SVM對(duì)超像素進(jìn)行分類,最后根據(jù)超像素之間的鄰接關(guān)系對(duì)分類結(jié)果進(jìn)行修正,從而實(shí)現(xiàn)對(duì)果實(shí)的分割。
實(shí)驗(yàn)所用圖像在徐州市豐縣大沙河鎮(zhèn)蘋果經(jīng)濟(jì)示范園進(jìn)行分時(shí)段拍攝。具體拍攝時(shí)間為07:00、12:00、15:00和19:00前后。相機(jī)在距離果樹1~2 m范圍內(nèi)圍繞果樹進(jìn)行不同角度的拍攝。其中,夜間拍攝時(shí)采用LED光源進(jìn)行補(bǔ)光。圖像拍攝工具為佳能 IXUS 275HS型相機(jī),相機(jī)采用CMOS (Complementary metal oxide semiconductor) 圖像傳感器。圖像分辨率為3 000像素×4 000像素,保存為jpg格式,24位彩色圖像。文中所有實(shí)驗(yàn)程序采用Matlab 2018b編寫,并在個(gè)人計(jì)算機(jī)上運(yùn)行。該計(jì)算機(jī)配有主頻為3.00 GHz的Intel i5-7400 CPU和8.00 GB內(nèi)存,并安裝有64位的Windows 10 操作系統(tǒng)。
實(shí)驗(yàn)共采集400幅蘋果圖像,其中白天采集圖像300幅,夜間采集圖像100幅。所拍攝圖像中的果實(shí)、枝、葉和其他景物如圖1所示。從圖1a可以看出,蘋果果實(shí)的著色不均勻甚至部分果實(shí)還套有透明的塑膜袋,同時(shí)在拍攝過(guò)程中蘋果果實(shí)難以避免地受到光線、陰影等影響。圖1b顯示蘋果樹樹葉的正面和背面的顏色也不相同,有的樹葉因?yàn)椴∽兂尸F(xiàn)紅褐色。圖1c展示了果樹的嫩枝和老枝,二者在紋理和顏色上也有著較大差別。圖1d展示了圖像中可能出現(xiàn)的其他景物,從左至右依次是裸露的土壤、落葉、過(guò)曝的天空、夜間的黑暗背景和夜間的土壤。
圖1 采集圖像中的典型景物Fig.1 Typical objects in collected images
從以上分析可以看出,影響圖像分割的主要因素有圖像中景物的多樣性、相同景物所呈現(xiàn)的不同特性以及拍攝中光線的干擾。這些因素都為圖像的分割增加了難度。
本節(jié)采用簡(jiǎn)單線性迭代聚類(Simple linear iterative clustering,SLIC)算法將圖像分割成若干超像素單元,并通過(guò)實(shí)驗(yàn)確定恰當(dāng)?shù)某袼財(cái)?shù)量。
SLIC算法是一種超像素聚類算法[22]。超像素是指具有相似紋理、顏色和亮度等特征的相鄰像素構(gòu)成的具有一定視覺意義的不規(guī)則像素塊。ACHANTA等[23]提出SLIC算法,該算法是將圖像像素在Lab顏色空間3個(gè)顏色分量的值和每個(gè)像素在直角坐標(biāo)系下的2維位置坐標(biāo)組成N(N為圖像像素點(diǎn)的總數(shù))個(gè)5維特征向量,然后對(duì)5維向量構(gòu)造距離度量標(biāo)準(zhǔn)并進(jìn)行聚類。
一幅圖像設(shè)定的超像素?cái)?shù)目K(即將一幅圖像分割為約K個(gè)超像素)對(duì)分割效果有較大影響。圖2是當(dāng)K=400時(shí)采用SLIC算法對(duì)分辨率降為600像素×800像素的圖像進(jìn)行分割的效果圖。圖中紅色漁網(wǎng)狀線條為SLIC算法產(chǎn)生的圖像分割線(分割線的實(shí)際像素寬度為0,為了方便在圖中展示,采用1像素寬度表示分割線),圖兩側(cè)的子圖為4個(gè)超像素區(qū)域的放大圖。從圖中可以看出SLIC算法產(chǎn)生的超像素邊緣大部分區(qū)域和景物的實(shí)際邊緣是重合的,但是存在部分邊緣不完全重合現(xiàn)象。當(dāng)一個(gè)超像素中包含多種不同景物時(shí),會(huì)給超像素的分類造成困難,也會(huì)影響最后果實(shí)的識(shí)別精度。因此需要選擇一個(gè)合適的K值,以減少該狀況造成的誤差。
圖2 K=400時(shí)SLIC算法的分割效果圖Fig.2 Sample image segmented by SLIC when K was 400
為尋找一個(gè)較為合理的K值,在采集的400幅圖像中隨機(jī)選取100幅圖像,并采用選取不同K值的SLIC算法對(duì)其進(jìn)行聚類分割。由于實(shí)驗(yàn)?zāi)繕?biāo)是將果實(shí)從背景中分割出來(lái),因此實(shí)驗(yàn)只關(guān)心果實(shí)部分是否被錯(cuò)誤分割。將超像素邊緣和果實(shí)邊緣不完全重合的超像素定義為錯(cuò)誤分割的超像素并將其挑選出來(lái),最后統(tǒng)計(jì)這些超像素中蘋果像素點(diǎn)占蘋果所有像素的比例。錯(cuò)誤分割超像素挑選的具體步驟如下:
(1)復(fù)制原圖,如圖3a所示,并對(duì)副本圖像中的果實(shí)用紅色進(jìn)行標(biāo)記,如圖3b所示。
(2)利用采用不同K值的SLIC算法對(duì)原圖進(jìn)行分割,得到如圖3c中所示的被分割成超像素的二值圖像。
(3)從標(biāo)記圖像中提取出果實(shí)區(qū)域,得到如圖3d所示的果實(shí)掩模圖像。
(4)將圖3c中的每個(gè)超像素逐個(gè)與圖3d中的區(qū)域分別做交集運(yùn)算。若圖3c中的單個(gè)超像素與圖3c中區(qū)域的交集小于自身面積的20%,則將該超像素定義為背景超像素;若大于80%則定義為果實(shí)超像素;若在20%~80%之間則定義為錯(cuò)誤分割超像素。
之所以留出20%的容忍閾值,是考慮到人工標(biāo)記的誤差和SLIC算法導(dǎo)致的微小偏差。圖3e為錯(cuò)誤分割的超像素掩模,圖3f是以圖3e為掩膜在原圖中提取的錯(cuò)誤分割超像素。
圖3 提取和果實(shí)相關(guān)的錯(cuò)誤分割區(qū)域步驟Fig.3 Steps of extracting superpixels segmented falsely
圖4為當(dāng)K為不同值時(shí),圖像被錯(cuò)誤分割的超像素中果實(shí)像素占果實(shí)總像素的比率。從圖中可以看出,隨著K的增加,該比率總體呈下降趨勢(shì)。但是K越大,意味著一幅圖像被分割為超像素越多,則每個(gè)超像素越小,這不但會(huì)增加后續(xù)分類的計(jì)算量,也會(huì)失去超像素聚類的意義。由圖4可看出,當(dāng)K<600時(shí),比率下降較快,當(dāng)K>600時(shí),下降幅度明顯減小。因此選取K=600作為SLIC算法分割中的超像素?cái)?shù)目。圖5為K=600時(shí)SLIC算法分割的結(jié)果。對(duì)比圖2可以看出,圖5分割更加精確,錯(cuò)分的比率更小。
圖4 果實(shí)超像素單元被錯(cuò)誤分割的比率Fig.4 Ratios of superpixels segmented falsely
圖5 K=600時(shí)SLIC算法的分割效果圖Fig.5 Sample image segmented by SLIC when K was 600
SLIC算法已將圖像分割為600個(gè)左右的超像素單元,因此只要對(duì)超像素進(jìn)行分類并篩選出屬于目標(biāo)水果的超像素就能將目標(biāo)果實(shí)從復(fù)雜的背景中分割出來(lái)。由于超像素的形狀是不規(guī)則的,因此在圖像分類中只考查超像素的顏色和紋理特征,并采用支持向量機(jī)(Support vector machine,SVM)分類[24]方法對(duì)超像素進(jìn)行分類。
SVM算法是一種有監(jiān)督的學(xué)習(xí)方法,因此需要事先提取果實(shí)超像素和背景超像素的顏色和紋理特征對(duì)SVM進(jìn)行訓(xùn)練。從采集的400幅圖像中選取100幅圖像用于樣本超像素的采集。樣本超像素的采集方法與圖3所示的選取錯(cuò)誤分割超像素的方法相同,共采集果實(shí)超像素1 272個(gè),背景超像素3 854個(gè)。其中80%(1 018個(gè))的果實(shí)超像素和3 083個(gè)背景超像素用于SVM分類器的訓(xùn)練,剩余的超像素用于分類器的測(cè)試。圖6為用于訓(xùn)練的部分超像素示意圖。
圖6 部分樣本超像素示意圖Fig.6 Sketch of part of superpixel samples
用于超像素分類的顏色特征是超像素的一個(gè)重要特征,常用的顏色模型有RGB、HSV、HSI、Lab、YCbCr、YIQ、CMYK等。實(shí)驗(yàn)選用3種具有代表性的顏色模型RGB、Lab、HSI,并提取它們中每個(gè)顏色分量的均值組成超像素的顏色特征向量C=(R,G,B,L,a,b,H,S,I)。
由于超像素的形狀是不規(guī)則的矩形,因此采用灰度直方圖統(tǒng)計(jì)特征對(duì)超像素的紋理進(jìn)行描述,具體包括均值m、標(biāo)準(zhǔn)差σ、平滑度Rs、一致性U4個(gè)描述子。紋理特征提取過(guò)程中首先將彩色的超像素轉(zhuǎn)換為灰度圖像,然后根據(jù)超像素中每個(gè)像素的灰度值繪制灰度直方圖,最后根據(jù)直方圖計(jì)算出4個(gè)紋理描述子組成紋理特征向量E=(m,σ,Rs,U)。最后將顏色特征向量和紋理特征向量組合成一個(gè)向量,并進(jìn)行歸一化從而實(shí)現(xiàn)對(duì)超像素的特征描述。
實(shí)驗(yàn)采用基于Gaussian(高斯)核函數(shù)的SVM分類器對(duì)超像素特征向量進(jìn)行訓(xùn)練分類,并設(shè)果實(shí)超像素為正樣本標(biāo)記為“+1”,背景超像素為負(fù)樣本標(biāo)記為“-1”。采用測(cè)試樣本對(duì)訓(xùn)練好的SVM進(jìn)行測(cè)試得到每個(gè)超像素的置信度,若置信度小于0,則其被判別為背景超像素,分類標(biāo)簽為“-1”, 若超像素置信度大于0,則其被判別為果實(shí)超像素,分類標(biāo)簽為“+1”。測(cè)試結(jié)果顯示果實(shí)超像素的分類正確率僅為80.78%,背景超像素的分類正確率為99.22%,總的分類正確率為94.63%。
從以上分類數(shù)據(jù)可以看出,分類器的分類誤差較大,尤其是果實(shí)超像素的分類誤差。這是由于訓(xùn)練樣本集是人工選取的,缺乏一定的代表性,不易區(qū)分的超像素在樣本集中比重較少。因此為進(jìn)一步改進(jìn)分類的正確率,實(shí)驗(yàn)新增難例樣本集。難例樣本集的建立是通過(guò)重新選取100幅蘋果圖像并利用SLIC算法分割后,采用上述訓(xùn)練好的SVM對(duì)每個(gè)超像素進(jìn)行分類,并將錯(cuò)誤分類的果實(shí)超像素和背景超像素加入難例訓(xùn)練集。根據(jù)原樣本集和難例樣本集重新對(duì)SVM進(jìn)行訓(xùn)練并采用同樣的測(cè)試樣本集進(jìn)行測(cè)試,測(cè)試結(jié)果顯示果實(shí)超像素的分類正確率為98.73%,背景超像素的分類正確率為99.32%,總的分類正確率為98.91%。
最后綜合SLIC算法和SVM超像素分類對(duì)剩下的100幅圖像進(jìn)行分割測(cè)試,部分分割效果如圖7所示。
圖7 本文方法的果實(shí)分割效果Fig.7 Examples of fruit segmentation by proposed method
從圖7中可以看出,SVM能夠準(zhǔn)確地分類絕大部分的超像素單元,但是每幅圖像仍然存在個(gè)別錯(cuò)誤分類的超像素。對(duì)分類正確率的分析表明,該數(shù)據(jù)的虛高是由于測(cè)試樣本的總量較大導(dǎo)致的。在實(shí)際的圖像分類中,一幅圖像會(huì)被分成600個(gè)左右的超像素,平均一幅圖像約有6.54個(gè)超像素被錯(cuò)誤分類。因此,超像素的分類正確率仍然具有進(jìn)一步提高的空間。
為了進(jìn)一步提高超像素分類的正確率,需要對(duì)錯(cuò)誤分類的超像素進(jìn)行分析。表1列舉了部分錯(cuò)誤分類的超像素及分類數(shù)據(jù)。從表中示意圖可以看出,被錯(cuò)誤分類的超像素不管是從顏色上還是紋理上都存在較大的相似性,即使人工進(jìn)行識(shí)別也難以分辨。在現(xiàn)有圖像特征難以分辨的情況下,實(shí)驗(yàn)發(fā)現(xiàn)不同超像素之間的鄰接關(guān)系能夠在一定程度上作為超像素類別判斷的依據(jù)。通過(guò)觀察分割后的圖像發(fā)現(xiàn),一個(gè)完整的蘋果由多個(gè)超像素組成,這些超像素的鄰接關(guān)系和其他超像素有明顯的區(qū)別,每個(gè)果實(shí)超像素都與多個(gè)相同屬性的超像素相鄰。但是被錯(cuò)誤分成果實(shí)的超像素則相對(duì)孤立,與之相鄰的相同屬性的超像素較少。
表1 部分錯(cuò)誤分類的超像素
Tab.1 Part of superpixels classified falsely
為了定量地描述不同碎片在二維空間中的關(guān)系,需要建立一個(gè)區(qū)域鄰接圖(Region adjacency graph, RAG)來(lái)表達(dá)不同超像素區(qū)域之間的鄰接關(guān)系。區(qū)域鄰接圖是一個(gè)M×M的二值矩陣,M為超像素的數(shù)量。F為一幅區(qū)域鄰接圖,若F(i,j)=1(i,j=1,2,…,M),則表示第i個(gè)圖像碎片與第j個(gè)圖像碎片相鄰,若為0則不相鄰,具體鄰接圖生成方式如圖8所示。
圖8 區(qū)域鄰接圖生成示意圖Fig.8 Sketch of region adjacency graph
根據(jù)區(qū)域鄰接圖的描述,統(tǒng)計(jì)每個(gè)被誤判為果實(shí)超像素的區(qū)域周圍相鄰的果實(shí)超像素的數(shù)量。根據(jù)3.2節(jié)中100幅圖像分割的統(tǒng)計(jì)結(jié)果顯示,絕大多數(shù)被誤判為果實(shí)超像素的區(qū)域周圍相鄰的果實(shí)超像素?cái)?shù)量為0或1。而每個(gè)被正確分類的果實(shí)超像素周圍相鄰的果實(shí)超像素?cái)?shù)量都在2個(gè)及以上。根據(jù)此統(tǒng)計(jì)數(shù)據(jù),進(jìn)行以下操作:
圖9 圖像分割修正示例Fig.9 Examples of modified image segmentation
(1)為濾除被判別為果實(shí)超像素的背景超像素干擾,統(tǒng)計(jì)每幅分割后的圖像中每個(gè)果實(shí)超像素相鄰的果實(shí)超像素的數(shù)量,若為0或1,則將該超像素濾除。
(2)為了將被判別為背景超像素的果實(shí)超像素修正,統(tǒng)計(jì)每幅分割后圖像中每個(gè)背景超像素周圍相鄰的果實(shí)超像素?cái)?shù)量,若大于2且該背景超像素的置信度在-1~0之間,則將該背景超像素重新判別為果實(shí)超像素。
(3)進(jìn)行一次濾除或增加果實(shí)超像素后,更新區(qū)域鄰接圖并重復(fù)步驟(1)、(2),直到超像素分類結(jié)果不再變化。
需要注意的是,由于部分距離較遠(yuǎn)或者遮擋嚴(yán)重的蘋果在圖像中所占面積較小,在其被分割后只由1~3個(gè)超像素組成,由于其鄰接關(guān)系與被錯(cuò)誤分類的果實(shí)超像素鄰接關(guān)系相同,從而被濾除。但是由于其難以被在當(dāng)前位置的機(jī)器所采摘,因此將其同樣視作背景濾除并不會(huì)對(duì)機(jī)器采摘產(chǎn)生影響。在進(jìn)行區(qū)域鄰接圖修正后,提高了每幅圖像的超像素分類正確率,通過(guò)對(duì)30幅圖像的統(tǒng)計(jì),得到平均每幅圖像所有超像素的分類正確率為99.62%,即平均每幅圖像被錯(cuò)誤分類的超像素?cái)?shù)量為2.28個(gè)。
圖9展示了修正前后的圖像分割效果,為了清晰地表示每個(gè)超像素之間的鄰接關(guān)系,采用二值化圖像并結(jié)合SLIC算法分割線對(duì)分割后的圖像效果進(jìn)行展示。對(duì)比圖9b和圖9c可以看出,經(jīng)過(guò)修正后,消除了孤立的超像素并減少了部分被錯(cuò)誤分類的果實(shí)超像素,進(jìn)一步改善了圖像分割效果。
色差法與基于BPNN的蘋果圖像分割方法是較為常見的圖像分割方法。色差法采用的是R-G(RGB顏色空間的紅色分量與綠色分量的差)與最大類間方差(Otsu)法相結(jié)合的方法,即首先通過(guò)R-G運(yùn)算獲得果實(shí)與背景差異較大的灰度圖像,然后采用Otsu算法對(duì)灰度圖像進(jìn)行二值化,從而實(shí)現(xiàn)果實(shí)分割?;贐PNN的蘋果分割方法采用BPNN對(duì)每個(gè)像素5×5鄰域內(nèi)所有像素在RGB、Lab和HSI顏色空間中每個(gè)顏色分量的均值進(jìn)行訓(xùn)練和分類,從而實(shí)現(xiàn)果實(shí)的分割,BPNN的拓?fù)浣Y(jié)構(gòu)為9×13×1的3層網(wǎng)絡(luò)結(jié)構(gòu),即9個(gè)輸入層節(jié)點(diǎn),13個(gè)隱含層節(jié)點(diǎn)和1個(gè)輸出層節(jié)點(diǎn)。該方法需要進(jìn)行有監(jiān)督的訓(xùn)練,在各類超像素樣本中選取2 000個(gè)果實(shí)像素和5 000個(gè)背景像素,并提取其5×5鄰域內(nèi)所有像素的顏色特征輸入BPNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練。BPNN網(wǎng)絡(luò)訓(xùn)練根據(jù)Levenberg-Marquard方法進(jìn)行權(quán)值和偏差更新,采用均方差衡量分類誤差,最大迭代次數(shù)1 000次,初始動(dòng)量0.001,目標(biāo)誤差精度為1×10-5。
3種方法的主要區(qū)別在于,色差法運(yùn)用的是像素級(jí)圖像特征,基于BPNN的圖像分割方法采用的是包含鄰域像素的圖像特征,而本文所提出的方法更進(jìn)一步采用超像素圖像特征。色差法和基于BPNN的圖像分割方法通常會(huì)采用形態(tài)學(xué)方法對(duì)分割結(jié)果進(jìn)行進(jìn)一步優(yōu)化,而此處為比較采用不同等級(jí)像素特征對(duì)分割效果的影響,不進(jìn)行形態(tài)學(xué)優(yōu)化。采用這兩種方法對(duì)圖7a中圖像進(jìn)行分割,分割效果分別如圖10a和圖10b所示。對(duì)比同樣未經(jīng)鄰接關(guān)系修正的圖7b可以看出,隨著所采用的像素特征等級(jí)的提高,總體上分割效果也逐步提高。
圖10 兩種方法的分割效果Fig.10 Segmentation results of two kinds of comparison methods
為了進(jìn)一步定量描述3種方法的分割效果,實(shí)驗(yàn)對(duì)圖像中的景物重新定義。果實(shí)為前景設(shè)為正,其他景物為背景設(shè)為負(fù),前景像素被判別為前景設(shè)為真正(X),背景像素被判別為前景設(shè)為假正(Y),前景像素被判別為背景設(shè)為假負(fù)(Z)。準(zhǔn)確率V的計(jì)算公式為
V=X/(X+Y)
(1)
表示所有被檢測(cè)為前景像素的像素點(diǎn)中真正的前景像素所占的比率,反映了圖像分割算法的查準(zhǔn)率。召回率W的計(jì)算公式為
W=X/(X+Z)
(2)
表示所有前景像素中被正確判別的像素所占的比率,反映了圖像分割算法的查全率。
實(shí)驗(yàn)選取3.2節(jié)中用于測(cè)試的100幅圖像并對(duì)圖像中的果實(shí)和背景進(jìn)行人工標(biāo)記,然后分別采用色差法、BPNN分割方法以及本文方法對(duì)圖像進(jìn)行分割,并且與人工標(biāo)記的圖像進(jìn)行對(duì)比,分別計(jì)算分割后圖像準(zhǔn)確率V、召回率W和一幅圖像的平均分割時(shí)間T,結(jié)果如表2所示。從表中可以看出,無(wú)論是V還是W,本文所述方法都顯著優(yōu)于其他算法。色差法由于只采用了單個(gè)像素的顏色特征,對(duì)不同景物的分辨能力不足,因此存在較多的誤識(shí)別和漏識(shí)別,從而導(dǎo)致V和W在三者中最低。 基于BPNN的分割方法,通過(guò)綜合鄰域像素的顏色特征提高對(duì)不同景物的分辨能力。而本文提出的方法以超像素為單位對(duì)圖像進(jìn)行分割,不僅能夠提取顏色特征,還能夠方便地提取紋理特征,從而進(jìn)一步提高分割效果。但是從三者的運(yùn)行時(shí)間對(duì)比可以看出,色差法因?yàn)檫\(yùn)算簡(jiǎn)單,運(yùn)行速度最快并超出其他算法一個(gè)數(shù)量級(jí);基于BPNN的分割方法因?yàn)樾枰貜?fù)提取鄰域像素的圖像特征,運(yùn)行效率不高,因此較本文方法稍慢。總體來(lái)說(shuō),本文方法雖然運(yùn)算復(fù)雜,但是檢測(cè)精度高且基本滿足實(shí)時(shí)性需求。
表2 分割結(jié)果對(duì)比Tab.2 Comparison of segmentation results
(1)提出了基于超像素特征的圖像分割方法,從信息量上分析,超像素所包含的信息大于單個(gè)像素所含有的信息,有利于改善圖像分割效果。采用SLIC算法將圖像分為內(nèi)部屬性相對(duì)一致的超像素單元,然后根據(jù)超像素的顏色和紋理特征,采用SVM對(duì)其進(jìn)行分類,最后根據(jù)超像素間的鄰接關(guān)系對(duì)分割結(jié)果進(jìn)行進(jìn)一步修正。
(2)通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),本文方法對(duì)超像素的分類正確率為99.62%,即平均每幅圖像約有2.28個(gè)超像素被錯(cuò)誤分類。對(duì)比采用像素級(jí)特征的算法,采用超像素特征的算法在分割準(zhǔn)確率和召回率上均具有較好的表現(xiàn)。本文方法在進(jìn)行鄰接關(guān)系修正前,圖像分割的準(zhǔn)確率為0.921 4,召回率為0.856 5,平均分割識(shí)別一幅圖像耗時(shí)0.608 7 s。