張志遠(yuǎn),伏冬孝,段 堅(jiān)
(華北電力大學(xué) 機(jī)械工程系,河北 保定 071000)
機(jī)器視覺(jué)就是利用機(jī)器代替人眼對(duì)周圍環(huán)境來(lái)做各種測(cè)量和判斷。由于機(jī)器視覺(jué)技術(shù)具有檢測(cè)精度高、可擴(kuò)展性好、檢測(cè)速度快等優(yōu)點(diǎn),因此在現(xiàn)代自動(dòng)化生產(chǎn)過(guò)程中,機(jī)器視覺(jué)系統(tǒng)被廣泛地用于各種質(zhì)量控制、工況監(jiān)視和成品檢驗(yàn)等領(lǐng)域。視覺(jué)系統(tǒng)研究的主要目標(biāo)是:從攝像機(jī)獲取圖像,將圖像轉(zhuǎn)化為數(shù)字圖像,對(duì)數(shù)字圖像進(jìn)行必要的預(yù)處理,強(qiáng)化所需要的圖像特征,經(jīng)過(guò)進(jìn)一步的圖像處理,從而獲得目標(biāo)物體的位置、大小、顏色等所需要的信息[1]。
一般地,視覺(jué)系統(tǒng)獲取的圖像(即原始圖像)由于受到種種條件限制和隨機(jī)干擾,往往包含著各種各樣的噪聲和畸變,因而不能在視覺(jué)系統(tǒng)中直接使用,必須在進(jìn)行圖像分析和識(shí)別前進(jìn)行灰度校正、噪聲過(guò)濾等圖像預(yù)處理,從而去掉這些使圖像質(zhì)量劣化的因素,并對(duì)信息微弱的圖像進(jìn)行增強(qiáng),使圖像變得更容易觀看或使圖像中的有用信息更容易提取。為方便進(jìn)行分析還需要強(qiáng)化圖像中所需要的特征,衰弱不需要的特征。圖像預(yù)處理方法主要包括圖像增強(qiáng)、對(duì)比度增強(qiáng)和平滑處理[2,3]。
同一幅圖像中可能存在多個(gè)物體,為了識(shí)別各個(gè)物體的質(zhì)心,需要對(duì)圖像進(jìn)行分割。圖像分割通過(guò)像素間的相似性和跳躍性,將圖像分成多個(gè)區(qū)域進(jìn)行處理。根據(jù)分割使用的主要特征,圖像分割技術(shù)可分為以下3種[4,5]:
(1)基于閾值的分割算法。這是一種最常見(jiàn)的區(qū)域分割技術(shù),閾值是用于區(qū)分不同目標(biāo)的灰度值。在圖像只有目標(biāo)和背景的情況下,只需選取單閾值分割,將圖像中每個(gè)像素的灰度值和閾值比較,灰度值大于閾值的像素和灰度值小于閾值的像素分別歸類。如果圖像中有多個(gè)目標(biāo),就需要選取多個(gè)閾值將各個(gè)目標(biāo)分開(kāi),這種方法稱為多閾值分割。閾值分割的結(jié)果依賴于閾值的選取,確定閾值是閾值分割的關(guān)鍵。
(2)基于邊緣的分割算法。這種方法是利用不同區(qū)域間像素灰度不連續(xù)的特點(diǎn)檢測(cè)出區(qū)域間的邊緣,從而實(shí)現(xiàn)圖像分割。邊界的像素灰度值變化往往比較劇烈。首先檢測(cè)圖像中的邊緣點(diǎn),再按一定策略連接成輪廓,從而構(gòu)成分割區(qū)域。
(3)基于區(qū)域特性的分割算法。這種方法通過(guò)分析圖像的特性如灰度、紋理、形狀,選取其中最明顯的特性將圖像進(jìn)行分區(qū),再對(duì)不同的小區(qū)域應(yīng)用此特性進(jìn)一步分割。該方法對(duì)噪聲具有一定的抗干擾能力,基于區(qū)域的分割算法的缺點(diǎn)是區(qū)域特性的選取比較困難,選取不當(dāng)對(duì)分割結(jié)果影響很大,并且容易產(chǎn)生過(guò)分割現(xiàn)象。
基于邊緣的分割方法對(duì)邊界定義的準(zhǔn)確度要求較高,不容易產(chǎn)生封閉的區(qū)域輪廓;基于區(qū)域的分割算法對(duì)區(qū)域特性的選擇有很高要求,而且容易產(chǎn)生圖像過(guò)分割現(xiàn)象,所以本文采用算法簡(jiǎn)便、運(yùn)行速度較快的閾值分割算法。
閾值分割通過(guò)閾值的設(shè)定將目標(biāo)和背景分割開(kāi),常用的閾值分割為二值化分割。二值化分割的基本出發(fā)點(diǎn)是將圖像中的目標(biāo)和背景看成是以閾值為分割點(diǎn)的兩部分集合。圖像經(jīng)過(guò)采樣量化后,可以用矩陣F(j,k)來(lái)表達(dá)數(shù)字圖像。設(shè)Z是圖像F(j,k)的任意灰度級(jí)集合,Zf和Zb為任意選定的目標(biāo)灰度級(jí)和背景灰度級(jí),則閾值法圖像分割的基本原理如式(1)所示:
其中:g(j,k)為在選取閾值區(qū)間分割后的圖像。針對(duì)不同處理對(duì)象,可分別選用以下定義式,各定義式分割原理分別如圖1所示。
其中:T、T1、T2均為圖像處理時(shí)選取的閾值。
圖1 二值化分割原理
通過(guò)選擇合適的閾值將圖像中的物體與背景區(qū)分開(kāi)來(lái),進(jìn)而得到物體的輪廓。
目標(biāo)的定位需要求取物體的質(zhì)心,一般采用矩描述子的方式計(jì)算質(zhì)量均勻分布物體的質(zhì)心。矩描述子是通過(guò)對(duì)輪廓上所有點(diǎn)進(jìn)行積分運(yùn)算而得到的特征,可用于二值或灰度級(jí)的區(qū)域描述,對(duì)于數(shù)字圖像f(x,y),通常我們定義輪廓的(p×q)階矩[6]為:
其中:p,q=0,1,2,…。
我們選擇通過(guò)計(jì)算輪廓的最小外接矩形來(lái)獲取物體的矢量信息。先計(jì)算出輪廓的最小外接矩形的邊與圖像水平軸的夾角,再利用幾何關(guān)系求得物體的質(zhì)心,輪廓最小外接矩形的計(jì)算原理如圖2所示。
圖2中,L和W 表示物體輪廓的外接矩形的長(zhǎng)和寬,θ定義為圖像水平坐標(biāo)軸逆時(shí)針旋轉(zhuǎn)與第一條矩形邊相交所成的夾角。在求得輪廓的最小外接矩形的4個(gè)頂點(diǎn)坐標(biāo)P0、P1、P2、P3的基礎(chǔ)上,通過(guò)幾何關(guān)系,求出的矩形的質(zhì)心即可近似為物體的質(zhì)心,進(jìn)而得到物體的矢量信息。
本文以Reinvo公司的6自由度教學(xué)用工業(yè)機(jī)器人為試驗(yàn)平臺(tái),運(yùn)用VC++軟件編程進(jìn)行試驗(yàn)。獲得試驗(yàn)結(jié)果如圖3所示。
圖2 輪廓最小外接矩形的計(jì)算原理
圖3 圖像處理前、后的對(duì)比圖
對(duì)比圖3(a)與圖3(b)可以看出經(jīng)過(guò)閾值處理后物體圖像與背景完全區(qū)分開(kāi)了,試驗(yàn)求得的各物體的質(zhì)心坐標(biāo)是比較精確的,而且十字的橫豎分別與圖像輪廓的最小外接矩陣長(zhǎng)寬平行,可以方便工業(yè)機(jī)器人選取最優(yōu)的抓取方向。
通過(guò)試驗(yàn)表明,不同的閾值選取對(duì)圖像分割會(huì)有影響;對(duì)于閥值的選擇,需要根據(jù)圖像的具體情況確定。經(jīng)過(guò)驗(yàn)證,通過(guò)輪廓的最小外接矩形法可以快速準(zhǔn)確地確定多個(gè)不同物體的質(zhì)心位置,可以滿足機(jī)器人抓取的精度要求,具有一定的使用價(jià)值。
[1] 趙鵬.機(jī)器視覺(jué)理論及應(yīng)用[M].北京:電子工業(yè)出版社,2011.
[2] 詹青龍,盧愛(ài)芹.?dāng)?shù)字圖像處理技術(shù)[M].北京:清華大學(xué)出版社,2010.
[3] 潘振贛,龔聲蓉.淺談數(shù)字圖像處理技術(shù)的基本原理[J].電腦知識(shí)與技術(shù),2010,6(6):1452-1454.
[4] Rafael C Gonzalez,Richard E Woods.?dāng)?shù)字圖像處理[M].阮秋琦,阮宇智,譯.北京:電子工業(yè)出版社,2004.
[5] 鄭洪濤.淺談數(shù)字圖像處理中的圖像分割技術(shù)[J].電大理工,2011,12(4):31-32.
[6] 章毓晉.圖像處理和分析基礎(chǔ)[M].北京:高等教育出版社,2002.