姜 彬,施志剛
摘要:圖像分割是圖像處理中的一項(xiàng)關(guān)鍵技術(shù),也是一經(jīng)典難題,文章對(duì)近幾年來(lái)出現(xiàn)的圖像分割方法作了較為全面的分析,并對(duì)圖像分割技術(shù)的研究方向作了探討,對(duì)從事圖像處理學(xué)習(xí)與研究的人員具有一定的啟發(fā)作用。
關(guān)鍵詞:圖像分割;計(jì)算機(jī)視覺(jué);圖像解析
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)35-10066-03
Image segmentation Technology Analysis and Prospect
JIANG Bin, SHI Zhi-gang
(Management & Information Department, Nantong Vocational & Technical Shipping College, Nantong 226010, China)
Abstract: Image segmentation is a key image processing techniques, is also a classic problem. This article of image segmentation method appeared in recent years gave a more comprehensive analysis, and discussed image segmentation research directions ,and also have some instructive effects on image processing, learning and research staff.
Key words: image segmentation; computer vision; image parsing
所謂圖像分割是指根據(jù)灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個(gè)互不相交的區(qū)域,使得這些特征在同一區(qū)域內(nèi),表現(xiàn)出一致性或相似性,而在不同區(qū)域間表現(xiàn)出明顯的不同。簡(jiǎn)單的講,就是在一幅圖像中,把目標(biāo)從背景中分離出來(lái),以便于進(jìn)一步處理。
在圖象分割領(lǐng)域還沒(méi)有出現(xiàn)對(duì)任意圖象都適合的分割算法,如何根據(jù)不同行業(yè)圖像的特點(diǎn),找出適應(yīng)行業(yè)具體需求的圖像分割算法,是我們追求的目標(biāo)。本文旨在對(duì)近幾年出現(xiàn)的圖像分割算法的分析總結(jié)的基礎(chǔ)上,對(duì)圖像分割技術(shù)研究的方向作出一些展望。
1 圖像分割常用的五種方法
1.1 對(duì)圖像特征、空間做分類(lèi)的方法
常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關(guān)系特征
1.1.1 顏色特征
顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點(diǎn)的特征,此時(shí)所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對(duì)象的局部特征。另外,僅使用顏色特征查詢(xún)時(shí),如果數(shù)據(jù)庫(kù)很大,常會(huì)將許多不需要的圖像也檢索出來(lái)。顏色直方圖是最常用的表達(dá)顏色特征的方法,其優(yōu)點(diǎn)是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,基缺點(diǎn)是沒(méi)有表達(dá)出顏色空間分布的信息。
1.1.2 紋理特征
紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對(duì)應(yīng)景物的表面性質(zhì)。但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質(zhì)屬性,所以?xún)H僅利用紋理特征是無(wú)法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無(wú)法匹配成功。作為一種統(tǒng)計(jì)特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。但是,紋理特征也有其缺點(diǎn),一個(gè)很明顯的缺點(diǎn)是當(dāng)圖像的分辨率變化的時(shí)候,所計(jì)算出來(lái)的紋理可能會(huì)有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來(lái)的紋理不一定是3-D物體表面真實(shí)的紋理。
1.1.3 形狀特征
各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來(lái)進(jìn)行檢索,但它們也有一些共同的問(wèn)題,包括:①目前基于形狀的檢索方法還缺乏比較完善的數(shù)學(xué)模型;②如果目標(biāo)有變形時(shí)檢索結(jié)果往往不太可靠;③許多形狀特征僅描述了目標(biāo)局部的性質(zhì),要全面描述目標(biāo)常對(duì)計(jì)算時(shí)間和存儲(chǔ)量有較高的要求;④許多形狀特征所反映的目標(biāo)形狀信息與人的直觀(guān)感覺(jué)不完全一致,或者說(shuō),特征空間的相似性與人視覺(jué)系統(tǒng)感受到的相似性有差別。另外,從 2-D 圖像中表現(xiàn)的 3-D 物體實(shí)際上只是物體在空間某一平面的投影,從 2-D 圖像中反映出來(lái)的形狀常不是 3-D 物體真實(shí)的形狀,由于視點(diǎn)的變化,可能會(huì)產(chǎn)生各種失真。
1.1.4 空間關(guān)系特征
所謂空間關(guān)系,是指圖像中分割出來(lái)的多個(gè)目標(biāo)之間的相互的空間位置或相對(duì)方向關(guān)系,這些關(guān)系也可分為連接/鄰接關(guān)系、交疊/重疊關(guān)系和包含/包容關(guān)系等。
空間關(guān)系特征的使用可加強(qiáng)對(duì)圖像內(nèi)容的描述區(qū)分能力,但空間關(guān)系特征常對(duì)圖像或目標(biāo)的旋轉(zhuǎn)、反轉(zhuǎn)、尺度變化等比較敏感。另外,實(shí)際應(yīng)用中,僅僅利用空間信息往往是不夠的,不能有效準(zhǔn)確地表達(dá)場(chǎng)景信息。為了檢索,除使用空間關(guān)系特征外,還需要其它特征來(lái)配合。
1.2 基于區(qū)域的方法(如區(qū)域生長(zhǎng)分割法、分裂合并法、分水嶺分割法等)
1.2.1 區(qū)域生長(zhǎng)分割法
所謂區(qū)域生長(zhǎng)(region growing)是指將成組的像素或區(qū)域發(fā)展成更大區(qū)域的過(guò)程。從種子點(diǎn)的集合開(kāi)始,從這些點(diǎn)的區(qū)域增長(zhǎng)是通過(guò)將與每個(gè)種子點(diǎn)有相似屬性像強(qiáng)度、灰度級(jí)、紋理顏色等的相鄰像素合并到此區(qū)域。它是一個(gè)迭代的過(guò)程,這里每個(gè)種子像素點(diǎn)都迭代生長(zhǎng),直到處理過(guò)每個(gè)像素,因此形成了不同的區(qū)域,這些區(qū)域它們的邊界通過(guò)閉合的多邊形定義。
區(qū)域生長(zhǎng)分割算法的關(guān)鍵是初始種子點(diǎn)的選取和生長(zhǎng)規(guī)則的確定。算法的優(yōu)點(diǎn)在于計(jì)算簡(jiǎn)單,對(duì)于均勻的連通目標(biāo)有很好的分割效果,缺點(diǎn)是需要人為設(shè)定種子點(diǎn),對(duì)噪聲敏感,可能導(dǎo)致區(qū)域出現(xiàn)空洞。
1.2.2 分裂合并法
分裂合并法的基本思想是從整幅圖像開(kāi)始通過(guò)不斷分裂合并來(lái)得到各個(gè)區(qū)域。分裂合并算法的關(guān)鍵是分裂合并準(zhǔn)則的設(shè)計(jì),這種算法對(duì)復(fù)雜圖像的分割效果較好,但算法復(fù)雜,計(jì)算量大,分裂可能破壞區(qū)域的邊界。
1.2.3 分水嶺分割法
分水嶺分割法,是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛?圖像中每一點(diǎn)像素的灰度值表示該點(diǎn)的海拔高度,每一個(gè)局部極小值及其影響區(qū)域稱(chēng)為集水盆,而集水盆的邊界則形成分水嶺。
分水嶺分割法對(duì)微弱邊緣具有良好的響應(yīng),具有很強(qiáng)的邊緣檢測(cè)能力,正是由于其對(duì)微弱邊緣的良好響應(yīng),此算法可以得到比較好的封閉連續(xù)邊緣。但是同時(shí)對(duì)于圖像中的噪聲、物體表面細(xì)微的灰度變化,該算法也會(huì)產(chǎn)生“過(guò)度分割”的現(xiàn)象。
1.3 基于邊緣的方法(邊緣檢測(cè)等)
圖像的邊緣是指圖像局部區(qū)域亮度變化顯著的部分。該區(qū)域的灰度剖面一般可以看做一個(gè)階躍,即從一個(gè)灰度值在很小的緩沖區(qū)域內(nèi)急劇變化到另一個(gè)灰度相差較大的灰度值。圖像的邊緣部分集中了圖像的大部分信息,圖像邊緣的確定與提取對(duì)于整個(gè)圖像場(chǎng)景的識(shí)別與理解是非常重要的,同時(shí)也是圖像分割所依賴(lài)的重要特征。
邊緣檢測(cè)主要是圖像的灰度變化的度量、檢測(cè)和定位,邊緣檢測(cè)的基本思想是先利用邊緣增強(qiáng)算子,突出圖像中的局部邊緣,然后定義像素的“邊緣強(qiáng)度”,通過(guò)設(shè)置閾值的方法提取邊緣點(diǎn)集。但是由于噪聲和圖像模糊,檢測(cè)到的邊界可能會(huì)有間斷的情況發(fā)生。
1.4 基于函數(shù)優(yōu)化的方法(貝葉斯算法-Bayesian等)
貝葉斯(1702-1763) Thomas Bayes,英國(guó)數(shù)學(xué)家,在數(shù)學(xué)方面主要研究概率論。他首先將歸納推理法用于概率論基礎(chǔ)理論,并創(chuàng)立了貝葉斯統(tǒng)計(jì)理論,對(duì)于統(tǒng)計(jì)決策函數(shù)、統(tǒng)計(jì)推斷、統(tǒng)計(jì)的估算等做出了貢獻(xiàn)。
貝葉斯決策理論方法是統(tǒng)計(jì)模式識(shí)別中的一個(gè)基本方法。貝葉斯決策判據(jù)既考慮了各類(lèi)參考總體出現(xiàn)的概率大小,又考慮了因誤判造成的損失大小,判別能力強(qiáng)。
1.5 綜合考慮邊緣和區(qū)域信息的混合分割方法
這類(lèi)方法既可以很好的提取出圖像中目標(biāo)的邊緣又可以使得算法的計(jì)算相對(duì)簡(jiǎn)單,對(duì)于均勻的連通目標(biāo)有較好的分割效果。
2 圖像分割的研究方向
2.1 圖像匹配
在圖像識(shí)別的過(guò)程中,常需要把不同時(shí)間、不同成像條件下對(duì)同一景物獲取的兩幅或者多幅圖像在空間上對(duì)準(zhǔn),或根據(jù)已知模式到另一幅圖中尋找相應(yīng)的模式,這就稱(chēng)為圖像匹配。
圖像匹配主要可分為以灰度為基礎(chǔ)的匹配和以特征為基礎(chǔ)的匹配。
1)灰度匹配:灰度匹配的基本思想:以統(tǒng)計(jì)的觀(guān)點(diǎn)將圖像看成是二維信號(hào),采用統(tǒng)計(jì)相關(guān)的方法尋找信號(hào)間的相關(guān)匹配。利用兩個(gè)信號(hào)的相關(guān)函數(shù),評(píng)價(jià)它們的相似性以確定同名點(diǎn)。灰度匹配通過(guò)利用某種相似性度量,如相關(guān)函數(shù)、協(xié)方差函數(shù)、差平方和、差絕對(duì)值和等測(cè)度極值,判定兩幅圖像中的對(duì)應(yīng)關(guān)系。
2)特征匹配:特征匹配是指通過(guò)分別提取兩個(gè)或多個(gè)圖像的特征(點(diǎn)、線(xiàn)、面等特征),對(duì)特征進(jìn)行參數(shù)描述,然后運(yùn)用所描述的參數(shù)來(lái)進(jìn)行匹配的一種算法,基于特征的匹配所處理的圖像一般包含的特征有顏色特征、紋理特征、形狀特征、空間位置特征等。特征匹配首先對(duì)圖像進(jìn)行預(yù)處理來(lái)提取其高層次的特征,然后建立兩幅圖像之間特征的匹配對(duì)應(yīng)關(guān)系,通常使用的特征基元有點(diǎn)特征、邊緣特征和區(qū)域特征。 特征匹配需要用到許多諸如矩陣的運(yùn)算、梯度的求解、還有傅立葉變換和泰勒展開(kāi)等數(shù)學(xué)運(yùn)算?;趫D象特征的匹配方法可以克服利用圖象灰度信息進(jìn)行匹配的缺點(diǎn),由于圖象的特征點(diǎn)比較像素點(diǎn)要少很多,大大減少了匹配過(guò)程的計(jì)算量;同時(shí),特征點(diǎn)的匹配度量值對(duì)位置的變化比較敏感,可以大大提高匹配的精確程度;而且,特征點(diǎn)的提取過(guò)程可以減少噪聲的影響,對(duì)灰度變化,圖象形變以及遮擋等都有較好的適應(yīng)能力。所以基于圖象特征的匹配在實(shí)際中的應(yīng)用越來(lái)越廣泛。所使用的特征基元有點(diǎn)特征(明顯點(diǎn),角點(diǎn),邊緣點(diǎn)等),邊緣線(xiàn)段等。
3)兩者的比較:特征匹配與灰度匹配的區(qū)別:灰度匹配是基于像素的,特征匹配則是基于區(qū)域的,特征匹配在考慮像素灰度的同時(shí)還應(yīng)考慮諸如空間整體特征、空間關(guān)系等因素。
特征是圖象內(nèi)容最抽象的描述,與基于灰度的匹配方法相比,特征相對(duì)于幾何圖象和輻射度影響來(lái)說(shuō)更不易變化,但特征提取方法的計(jì)算代價(jià)通常較大,并且需要一些自由參數(shù)和事先按照經(jīng)驗(yàn)選取的閥值,因而不便于實(shí)時(shí)應(yīng)用。同時(shí),在紋理較少的圖象區(qū)域提取的特征的密度通常比較稀少,使局部特征的提取比較困難。另外,基于特征的匹配方法的相似性度量也比較復(fù)雜,往往要以特征屬性、啟發(fā)式方法及閥方法的結(jié)合來(lái)確定度量方法。
2.2 紋理分割和紋理合成
紋理分割是將紋理圖像依據(jù)同一紋理的一致性特征或不同紋理之間的特征差別,分割成若干有意義的區(qū)域的一種圖像分割技術(shù),如何提取有效的紋理特征是其關(guān)鍵點(diǎn)和難點(diǎn)。
紋理合成是為了解決紋理映射中存在的接縫走樣等問(wèn)題而提出的,目前紋理合成方法可分為兩類(lèi):一類(lèi)為過(guò)程紋理合成(PTS),另一類(lèi)為基于樣圖的紋理合成(TSFS)。
過(guò)程紋理合成通過(guò)對(duì)物理生成過(guò)程的仿真直接在曲面上生成紋理,如毛發(fā)、云霧、木紋等,從而避免了紋理映射帶來(lái)的失真。這種方法可以獲得非常逼真的紋理,但對(duì)每一種新的紋理,卻需要調(diào)整參數(shù)反復(fù)測(cè)試,非常不便,有的甚至無(wú)法得到有效的參數(shù)。自然界中存在大量的紋理,這些紋理往往具有自相似性,即一小塊紋理就能反映整體紋理的特點(diǎn)。這就促使人們著手研究基于樣圖的紋理合成方法以取得更有效的成果:給定一小塊紋理,生成大塊相似的紋理。
基于樣圖的紋理合成(texture synthesis from samples,TSFS))技術(shù)是近幾年迅速發(fā)展起來(lái)的一種新的紋理拼接技術(shù),它基于給定的小區(qū)域紋理樣本,按照表面的幾何形狀,拼合生成整個(gè)曲面的紋理,它在視覺(jué)上是相似而連續(xù)的。TSFS技術(shù)可以克服傳統(tǒng)紋理映射方法的缺點(diǎn),又避免了過(guò)程紋理合成調(diào)整參數(shù)的繁瑣,因而受到越來(lái)越多研究人員的關(guān)注,成為計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域的研究熱點(diǎn)之一。利用TSFS技術(shù)還可以進(jìn)行紋理填充(如修補(bǔ)破損的圖片,重現(xiàn)原有圖片效果),紋理傳輸,擴(kuò)展到時(shí)域則可以用一短段視頻圖像,生成任意長(zhǎng)度的非重復(fù)的視頻動(dòng)畫(huà)等。所以紋理合成技術(shù)在圖像編輯、數(shù)據(jù)壓縮、網(wǎng)絡(luò)數(shù)據(jù)的快速傳輸、大規(guī)模場(chǎng)景的生成以及真實(shí)感和非真實(shí)感繪制等方面具有廣泛的應(yīng)用前景。
2.3 圖像解析(Image Parsing)
自然圖像本質(zhì)上是由大量隨機(jī)生成的視覺(jué)模式構(gòu)成,圖像理解的目的是將輸入圖像解析成構(gòu)成它的不同的視覺(jué)模式。
根據(jù)我們所感興趣的不同類(lèi)型的模式,圖像解析問(wèn)題分別被稱(chēng)為:圖像分割(對(duì)均勻灰色、彩色和紋理區(qū)域的處理)、知覺(jué)組織(對(duì)點(diǎn)、線(xiàn)和一般圖形的處理)、目標(biāo)識(shí)別(對(duì)文本和對(duì)象的處理)。
3 總結(jié)
圖像分割是圖像理解與計(jì)算機(jī)視覺(jué)領(lǐng)域國(guó)際學(xué)術(shù)界公認(rèn)的將會(huì)長(zhǎng)期存在的最困難的問(wèn)題之一,到目前為止既不存在一種通用的圖像分割方法,也不存在一種判斷是否分割成功的客觀(guān)標(biāo)準(zhǔn)。圖像分割之所以困難的一個(gè)重要原因是其并不完全屬于圖像特征提取問(wèn)題,它還涉及到各種圖像特征的知覺(jué)組織。從一般意義上來(lái)說(shuō),只有對(duì)圖像內(nèi)容的徹底理解,才能產(chǎn)生完美的分割。
參考文獻(xiàn):
[1] Gonzalez R C. Digital Image Processing Using MATLAB[M].阮秋琦,譯.北京:電子工業(yè)出版社,2005.
[2] 孫即祥.圖像分析[M].北京:科學(xué)出版社,2005.
[3] 章毓晉.圖像工程[M].北京:清華大學(xué)出版社,2007.