□ 黃 旭 □ 張世義 □ 李 軍
重慶交通大學(xué) 機(jī)電與車(chē)輛工程學(xué)院 重慶 400074
圖像識(shí)別來(lái)源于模板匹配,從人類(lèi)自身的視覺(jué)識(shí)別中演變而來(lái)。人類(lèi)自身視覺(jué)識(shí)別的思路為,將眼前的物體和腦海中的印象進(jìn)行對(duì)比,完成對(duì)眼前物體的定義。圖像識(shí)別也是如此,對(duì)原圖像提取特征,和需要的目標(biāo)特征進(jìn)行對(duì)比,從而達(dá)到識(shí)別的效果。圖像識(shí)別在現(xiàn)代科技中扮演著至關(guān)重要的角色,許多領(lǐng)域,如無(wú)人駕駛、人臉識(shí)別、導(dǎo)彈跟蹤等,都離不開(kāi)圖像識(shí)別。隨著時(shí)代的進(jìn)步、科技的發(fā)展,圖像識(shí)別技術(shù)不斷完善,發(fā)展到今天主要有統(tǒng)計(jì)識(shí)別、模糊集識(shí)別、神經(jīng)網(wǎng)絡(luò)識(shí)別、模板匹配識(shí)別、結(jié)構(gòu)識(shí)別、支持向量機(jī)識(shí)別等方法。此外,在某些特殊情況下,還有利用輔助靶標(biāo)的識(shí)別方法?;旧纤袌D像識(shí)別技術(shù)都離不開(kāi)圖像預(yù)處理、圖像分割、特征提取、特征匹配識(shí)別等步驟。其中,圖像分割指為了節(jié)約計(jì)算資源,將圖像根據(jù)某些參數(shù)分成不同的區(qū)域,進(jìn)而剔除無(wú)效區(qū)域?;陂撝?、區(qū)域、邊緣的分割方法,以及超像素分割方法,都是如今常見(jiàn)的圖像分割方法。
圖像分割在圖像識(shí)別中起至關(guān)重要的作用,選擇合理的分割方法,可以大大縮短圖像識(shí)別的時(shí)間,節(jié)省計(jì)算資源。如在自動(dòng)駕駛車(chē)輛領(lǐng)域,通過(guò)圖像分割可以快速識(shí)別出車(chē)道線(xiàn)、指示牌、交通信號(hào)燈等重要交通信息??梢?jiàn),圖像分割非常重要。
基于閾值的圖像分割法是一種常見(jiàn)的圖像分割方法,主要思想為,不同的目標(biāo)具有不同的特征,如顏色、灰度、輪廓等,利用特征間的細(xì)微差別,選取閾值劃分為目標(biāo)物與背景。閾值分割能夠快速地實(shí)現(xiàn)圖像分割,常用于目標(biāo)與背景相差較大的情況,對(duì)于復(fù)雜環(huán)境識(shí)別難度較大。
劉睿等[1]基于灰度值最大類(lèi)間差算法對(duì)圖像進(jìn)行二值化處理,利用不斷變化的閾值使不同分類(lèi)之間的灰度值差異較大,能夠更加準(zhǔn)確地進(jìn)行圖像識(shí)別。
李成等[2]在進(jìn)行目標(biāo)識(shí)別時(shí)采用紅外成像技術(shù)獲得初始圖像。考慮到紅外圖像的缺點(diǎn),通過(guò)復(fù)合去噪和對(duì)比度增強(qiáng)等手段進(jìn)行處理,用于保障后續(xù)操作的連續(xù)性。考慮到紅外圖像的灰度變化明顯,采用閾值分割法來(lái)進(jìn)行分割。選取高亮區(qū)的比例、灰度標(biāo)準(zhǔn)的偏差值、長(zhǎng)寬比、復(fù)雜度、緊湊度等參數(shù)作為特征向量,結(jié)合模糊綜合評(píng)判法完成圖像目標(biāo)的識(shí)別。
Troya-galvis等[3-4]提出采用多閾值相結(jié)合的方法進(jìn)行單一目標(biāo)分類(lèi)分割的框架,由多個(gè)框架共同運(yùn)作,達(dá)到精確分割的目的。
閾值分割能夠較為快速地完成圖像的分割,但是需要目標(biāo)和周?chē)h(huán)境具有明顯的灰度值差異,因此往往需要進(jìn)行對(duì)比度增強(qiáng)等處理。由于對(duì)復(fù)雜圖像難以進(jìn)行準(zhǔn)確的分割,因此人們常用閾值分割進(jìn)行初步分割,在此基礎(chǔ)上再運(yùn)用邊緣檢測(cè)分割、區(qū)域增長(zhǎng)分割等方法,可以節(jié)約計(jì)算資源。
基于區(qū)域的圖像分割法分為區(qū)域生長(zhǎng)和分裂合并兩種類(lèi)型。對(duì)于區(qū)域生長(zhǎng)類(lèi)型,先選取一個(gè)像素,然后不斷合并具有相似特征的像素,從而達(dá)到圖像分割的目的。對(duì)于分裂合并類(lèi)型,將整個(gè)圖像作為出發(fā)點(diǎn),逐漸排除或合并相似的像素,最終完成圖像的分割。和傳統(tǒng)閾值分割方法相比,區(qū)域分割在像素的相似性和空間的鄰接性上更有優(yōu)勢(shì),可以明顯減小噪聲的干擾,具有更強(qiáng)的魯棒性。
李文靜等[5]在進(jìn)行室內(nèi)識(shí)別時(shí),考慮室內(nèi)場(chǎng)景的復(fù)雜性,結(jié)合歐氏聚類(lèi)算法高效率分割的特點(diǎn)和區(qū)域生長(zhǎng)對(duì)復(fù)雜環(huán)境適用度高的優(yōu)點(diǎn),利用區(qū)域生長(zhǎng)將物體分割出來(lái),應(yīng)用歐氏聚類(lèi)算法對(duì)歸屬物品分割,與標(biāo)志庫(kù)進(jìn)行對(duì)比,最終完成物體的識(shí)別。
王丹丹等[6]針對(duì)早期的蘋(píng)果體型小,不易識(shí)別的問(wèn)題,提出了區(qū)域分割和全卷積網(wǎng)絡(luò)相結(jié)合的識(shí)別方法,首先通過(guò)深層次神經(jīng)網(wǎng)絡(luò)提取蘋(píng)果的典型特征,然后進(jìn)行區(qū)域識(shí)別定位,從而克服復(fù)雜背景、果實(shí)重疊等干擾因素,提高識(shí)別的準(zhǔn)確率。
金旭輝[7]對(duì)交通指示牌進(jìn)行識(shí)別,在色調(diào)、飽和度、亮度顏色空間中,結(jié)合顏色分層技術(shù)和簡(jiǎn)單閾值處理,利用區(qū)域分割快速找到對(duì)應(yīng)顏色的指示牌區(qū)域,通過(guò)數(shù)學(xué)形態(tài)學(xué)手段對(duì)區(qū)域形狀進(jìn)行完善,提高識(shí)別準(zhǔn)確性。
基于邊緣的圖像分割法利用不同區(qū)域中像素灰度值不同,以及區(qū)域邊界像素灰度值變化比較大的特點(diǎn),檢測(cè)到邊界點(diǎn),并將各個(gè)邊界點(diǎn)連接起來(lái),從而完成區(qū)域分割。Roberts、Sobel、PreWitt、坎尼等都是常見(jiàn)的邊緣檢測(cè)方法。
Wang等[8]對(duì)圖像進(jìn)行二值化處理,根據(jù)目標(biāo)灰度值和環(huán)境灰度值相差較大的特點(diǎn),采用小波多尺度邊緣檢測(cè)法提取車(chē)輛的邊緣信息,從而進(jìn)行分割,并結(jié)合矩不變量的特征和改進(jìn)反向傳播神經(jīng)網(wǎng)絡(luò)完成對(duì)車(chē)輛的識(shí)別。
陳強(qiáng)等[9]在興趣區(qū)域中考慮鋼軌附近的灰度值分布在數(shù)值較小的區(qū)域,采用對(duì)數(shù)變換圖像增強(qiáng)的處理方法使需要的數(shù)值區(qū)間被拉大,壓縮無(wú)用的數(shù)值區(qū)間,提高識(shí)別度,并利用坎尼算子和概率霍夫變換提取軌道線(xiàn)。
王紅雨等[10]為減小光線(xiàn)條件差和噪聲污染的影響,將模糊理論和局部二值模式算子相結(jié)合,得到改進(jìn)的邊緣提取算法,以此提高圖像的邊緣連續(xù)性和識(shí)別的速度。但是,由于這種方法產(chǎn)生的邊緣粒子較粗,因此難以進(jìn)行精準(zhǔn)識(shí)別。
Wang等[11]在對(duì)手勢(shì)識(shí)別時(shí),采用雙邊濾波對(duì)圖像進(jìn)行處理,利用優(yōu)化彩色視頻信號(hào)顏色空間的橢圓模型提取手部膚色,加入Sobel算子完成對(duì)手勢(shì)的分割,以此達(dá)到對(duì)手勢(shì)的精確圖像識(shí)別。
超像素圖像分割法指將圖像中具有相似特征的局部連續(xù)像素聚合在一起的方法。和傳統(tǒng)方法相比,超像素分割有利于圖像局部特征的提取,減小了處理對(duì)象的規(guī)模,便于計(jì)算。
王璨等[12]為了提高農(nóng)作物與雜草識(shí)別的準(zhǔn)確性,在超像素分割的基礎(chǔ)上,提出了基于卷積神經(jīng)網(wǎng)絡(luò)提取多尺度分層特征的識(shí)別方法。應(yīng)用這一方法,首先建立神經(jīng)網(wǎng)絡(luò)模型提取分層特征,通過(guò)特征對(duì)圖像進(jìn)行識(shí)別;然后進(jìn)行超像素分割,將每個(gè)超像素內(nèi)全部像素的平均類(lèi)別作為像素的類(lèi)別;最后將相同的像素類(lèi)別合并,實(shí)現(xiàn)圖像的分割,從而達(dá)到快速識(shí)別。
曹正文等[13]采用基于線(xiàn)性譜聚類(lèi)的超像素分割對(duì)電子計(jì)算機(jī)斷層掃描圖像進(jìn)行分割,根據(jù)同一個(gè)超像素具有相似性的特征,對(duì)圖像進(jìn)行降維處理,得到視覺(jué)概要圖,有利于圖像中胰腺器官的分割。
楊飛等[14]通過(guò)無(wú)監(jiān)督分割均值漂移對(duì)圖像進(jìn)行分割,得到多個(gè)尺度的超像素分割,每個(gè)超像素代表一個(gè)尺寸,并在此基礎(chǔ)上建立道路分割模型。試驗(yàn)表明,這一模型具有良好的道路檢測(cè)性能。
劉艷等[15]為解決傳統(tǒng)視差圖的毛刺現(xiàn)象,將二進(jìn)制與超像素分割相結(jié)合,使視差優(yōu)化時(shí)的邊緣保持平滑。
對(duì)于自動(dòng)駕駛汽車(chē),往往需要快速分割出感興趣的區(qū)域,縮減后續(xù)操作空間,節(jié)約計(jì)算資源,達(dá)到快速識(shí)別的目的。對(duì)于道路交通指示牌的分割識(shí)別,目前的技術(shù)主要是通過(guò)目標(biāo)顏色生成相應(yīng)的灰度圖像,然后進(jìn)行迅速分割,結(jié)合目標(biāo)形狀鎖定區(qū)域進(jìn)行識(shí)別。目前技術(shù)仍受形狀相似或顏色相似干擾,在未來(lái)的發(fā)展中需要提高。
Agarwal等[16]在對(duì)交通信號(hào)燈進(jìn)行識(shí)別時(shí),為防止被發(fā)光二極管燈等光元素干擾,圍繞三種不同顏色的信號(hào)燈分別生成二值圖像,并利用邊緣檢測(cè)法提取輪廓,從而完成對(duì)交通信號(hào)燈的識(shí)別,流程如圖1所示。
圖1 交通信號(hào)燈識(shí)別流程
Tedjojuwono等[17]為了快速對(duì)車(chē)牌進(jìn)行識(shí)別,采用一種互聯(lián)圖像分割,首先對(duì)原圖像進(jìn)行對(duì)比度增強(qiáng)和降噪等預(yù)處理,然后采用坎尼算子提取車(chē)牌輪廓,從而使圖像分為幾個(gè)不同的區(qū)域,最后對(duì)幾個(gè)不同區(qū)域的輪廓進(jìn)行比較,得到車(chē)牌區(qū)域。
宋文杰等[18]對(duì)圖像進(jìn)行預(yù)處理增強(qiáng)對(duì)比度,根據(jù)標(biāo)志特征,結(jié)合色相、飽和度、明度和色彩空間進(jìn)行色彩分割,快速提取目標(biāo)輪廓,并應(yīng)用中值濾波消除噪點(diǎn),利用膨脹腐蝕原理完善目標(biāo)輪廓,從而達(dá)到分割的效果。
Zaklouta等[19]根據(jù)標(biāo)志顏色,采用對(duì)應(yīng)色彩增強(qiáng)的方法處理圖像,利用全局閾值法對(duì)圖像快速分割,鎖定標(biāo)志位置,結(jié)合梯度直方圖與支持向量機(jī)檢測(cè)器檢測(cè)三角和圓形符號(hào),以此達(dá)到實(shí)時(shí)識(shí)別交通標(biāo)志的目的。
Khan等[20]在亮度-顏色分量空間色度層上提取顏色特征,利用K均值聚類(lèi)算法分割出感興趣區(qū)域,根據(jù)數(shù)據(jù)庫(kù)對(duì)形狀進(jìn)行匹配識(shí)別,找出指示牌并對(duì)其進(jìn)行識(shí)別分析。
筆者主要介紹了四種不同的圖像分割方法,每種分割方法都有優(yōu)劣。基于閾值的圖像分割法能夠快速分割圖像,但對(duì)于復(fù)雜圖像難以進(jìn)行有效分割。基于邊緣的圖像分割法容易產(chǎn)生虛假的邊緣或者孤立的線(xiàn)段?;趨^(qū)域的圖像分割法會(huì)對(duì)無(wú)目標(biāo)物的空白區(qū)域進(jìn)行分割,浪費(fèi)計(jì)算資源。超像素圖像分割法難以在計(jì)算速度和計(jì)算精度之間達(dá)到很好的平衡。圖像分割技術(shù)發(fā)展至今,一般同時(shí)采取多種分割方法,如利用閾值分割和邊緣分割速度快的特點(diǎn),先確定大致區(qū)域,再進(jìn)行區(qū)域分割,以此縮短計(jì)算時(shí)間,提高效率。如今圖像分割技術(shù)已經(jīng)基本成熟,今后將會(huì)圍繞分割速度進(jìn)行研究。