王培屹
摘要:機(jī)器人項(xiàng)目是一項(xiàng)涉及多項(xiàng)技術(shù)的綜合性研究課題,自主移動(dòng)機(jī)器人作為機(jī)器人學(xué)科中技術(shù)含量較高的一個(gè)分支,具有廣泛的市場(chǎng)應(yīng)用前景。視覺(jué)系統(tǒng)作為機(jī)器人感知外界環(huán)境的重要手段,是全自主機(jī)器人的重要組成部分,雖然機(jī)器人實(shí)驗(yàn)中目標(biāo)物體的顏色、形狀特征已知,但由于實(shí)驗(yàn)的對(duì)抗性,使得視覺(jué)系統(tǒng)應(yīng)具有很高的實(shí)時(shí)性、較高的精確度、具有一定的適應(yīng)能力和抗干擾能力。如何精確高效地處理視覺(jué)信息是視覺(jué)系統(tǒng)的關(guān)鍵問(wèn)題。本文給出一種基于彩色圖像的目標(biāo)識(shí)別與定位方法,對(duì)全自主機(jī)器人感知環(huán)節(jié)進(jìn)行了研究。通過(guò)分析攝像頭采集的圖像畫(huà)面,并借助碰撞傳感器,紅外傳感器等方法確定目標(biāo)。
關(guān)鍵詞:全自主足球機(jī)器人;視覺(jué)系統(tǒng);目標(biāo)檢測(cè)
一、引言
機(jī)器人技術(shù)是機(jī)械設(shè)計(jì)與制造技術(shù)、計(jì)算機(jī)硬件與軟件技術(shù)、運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)理論、控制理論、電動(dòng)伺服控制技術(shù)、傳感器技術(shù)、多傳感器信息融合技術(shù)、人工智能等科學(xué)及技術(shù)領(lǐng)域的綜合應(yīng)用,代表了高新技術(shù)發(fā)展的前沿。而自主移動(dòng)機(jī)器人屬于第三代機(jī)器人,它能夠?qū)崟r(shí)獲取外界環(huán)境的信息,對(duì)目標(biāo)和障礙物進(jìn)行識(shí)別和測(cè)量,學(xué)習(xí)和理解外界環(huán)境,并根據(jù)設(shè)定的目標(biāo)進(jìn)行運(yùn)動(dòng)規(guī)劃,在無(wú)人干預(yù)的情況下,實(shí)時(shí)調(diào)整運(yùn)動(dòng)規(guī)劃,移動(dòng)到目的地并完成設(shè)定的工作。機(jī)器人足球?qū)嶒?yàn)是近幾年發(fā)展起來(lái)、進(jìn)步較快且有很大研究潛力的一類(lèi),這類(lèi)機(jī)器人的視覺(jué)及控制器等各類(lèi)部件均裝載在機(jī)器人本體上,通過(guò)無(wú)線通訊與其它機(jī)器人、主控計(jì)算機(jī)及人的信息交流。實(shí)驗(yàn)過(guò)程中,機(jī)器人通過(guò)視覺(jué)系統(tǒng)搜索球及球門(mén)等環(huán)境信息,通過(guò)聲納、紅外或激光等測(cè)距系統(tǒng)進(jìn)行機(jī)器人全局定位及障礙物檢測(cè),在進(jìn)行信息融合之后形成行動(dòng)策略并實(shí)施。因此,機(jī)器人如何快速識(shí)別目標(biāo)并且定位是實(shí)驗(yàn)取勝的關(guān)鍵環(huán)節(jié)[1],本文將對(duì)這方面的問(wèn)題進(jìn)行討論。
二、全自主型足球機(jī)器人視覺(jué)系統(tǒng)簡(jiǎn)介
(一)視覺(jué)識(shí)別系統(tǒng)的硬件組成
實(shí)驗(yàn)中使用的全自主型足球機(jī)器人是上海廣茂達(dá)公司研制的AS-UII能力風(fēng)暴智能機(jī)器人,它是典型的自主移動(dòng)機(jī)器人,具有較高的自規(guī)劃、自適應(yīng)能力,適合于較復(fù)雜的非結(jié)構(gòu)環(huán)境中工作的復(fù)雜系統(tǒng)。機(jī)器人與計(jì)算機(jī)之間使用基于68HCll單片機(jī)開(kāi)發(fā)的交互式C語(yǔ)言進(jìn)行編程。視覺(jué)識(shí)別系統(tǒng)采用CMUcam視覺(jué)系統(tǒng): CMUcam視覺(jué)模塊主要是由1個(gè)SX28微處理器與OV6620攝像頭(CMOS)組成,CMOS攝像頭把當(dāng)前窗口的視圖通過(guò)簡(jiǎn)單的處理,返回像素點(diǎn)矩陣。
(二)視覺(jué)識(shí)別系統(tǒng)的軟件流程
實(shí)驗(yàn)中,視覺(jué)識(shí)別系統(tǒng)依靠顏色來(lái)識(shí)別并判定目標(biāo)。機(jī)器人對(duì)顏色的識(shí)別過(guò)程如下:當(dāng)攝像頭獲得彩色圖像以后,機(jī)器人上的嵌入計(jì)算機(jī)系統(tǒng)將模擬視頻信號(hào)數(shù)字化,將像素根據(jù)顏色分成兩部分,感興趣的像素(搜索的目標(biāo)顏色)和不感興趣的像素(背景顏色)。然后對(duì)這些感興趣的像素進(jìn)行顏色分量的匹配。在實(shí)驗(yàn)之前已經(jīng)存儲(chǔ)了場(chǎng)地環(huán)境下的各種顏色信息,實(shí)驗(yàn)時(shí)需要將實(shí)時(shí)信息與顏色信息比較或匹配,以尋找搜索目標(biāo)的顏色區(qū)域。判斷:如果目標(biāo)出現(xiàn)在視野中,通過(guò)多種傳感器的綜合應(yīng)用,確定目標(biāo)與機(jī)器人的相對(duì)位置,為決策子系統(tǒng)提供依據(jù)。否則繼續(xù)尋找。
三、視覺(jué)識(shí)別系統(tǒng)中目標(biāo)的識(shí)別與相對(duì)定位
(一)顏色空間的建立
色空間是用數(shù)學(xué)方法形象化表示顏色,通常用三維模型表示,用代表3個(gè)參數(shù)的三維坐標(biāo)來(lái)描述,其顏色要取決于所使用的坐標(biāo)。為有效區(qū)分不同的目標(biāo)顏色,要求顏色模型要含有足夠多的顏色信息;為提高視覺(jué)系統(tǒng)的執(zhí)行速度,要求顏色含有盡量少的數(shù)據(jù)量。足球機(jī)器人系統(tǒng)常用的顏色模型有 RGB 模型、HSV 模型和 YUV 模型等,同一物體在不同的光照和成像距離條件下,映射到內(nèi)存的RGB數(shù)值會(huì)發(fā)生較大變化,不利于目標(biāo)的識(shí)別。為提高識(shí)別效果可將顏色表示從RGB顏色空間轉(zhuǎn)化到更接近人眼觀察方式的HSI顏色空間,從而提高不同光照環(huán)境下識(shí)別系統(tǒng)的魯棒性。
(二)目標(biāo)檢測(cè)
成熟的目標(biāo)檢測(cè)技術(shù)有:模板匹配、邊緣檢測(cè)、色彩分類(lèi)[2]等。實(shí)驗(yàn)規(guī)定:機(jī)器人和球都用不同的顏色加以區(qū)分,為快速檢測(cè)到目標(biāo)采用基于色彩的圖像分割是最好的方法。由于不同的光照環(huán)境下物體的RGB值變化很大,為能夠準(zhǔn)確識(shí)別目標(biāo)只有設(shè)定顏色空間中三個(gè)分量的上下閾值,這樣可以把目標(biāo)物體與圖像背景顏色區(qū)分開(kāi)。實(shí)驗(yàn)前針對(duì)特殊的實(shí)驗(yàn)環(huán)境,手工設(shè)定各個(gè)目標(biāo)顏色分量的值,通過(guò)計(jì)算機(jī)串口連接視覺(jué)傳感器,鎖定一幅目標(biāo)圖片,鼠標(biāo)選取顏色參考區(qū)域,計(jì)算該顏色區(qū)域中各點(diǎn)的顏色特征統(tǒng)計(jì)出RGB和HSI空間中各分量的最大值和最小值,利用最初確定的閾值對(duì)彩色圖像進(jìn)行二值化處理,參照?qǐng)D象處理的結(jié)果對(duì)閾值進(jìn)行小范圍調(diào)整,達(dá)到理想效果后記錄閾值,在此范圍內(nèi)的子空間為目標(biāo)顏色。
(三)圖像噪聲的去除
在圖像獲取過(guò)程中由于采樣量化、傳遞和環(huán)境干擾的存在致使圖像出現(xiàn)一些高頻的噪聲,這些噪聲會(huì)影響后續(xù)處理的效果,對(duì)圖像進(jìn)行平滑處理可降低噪聲,獲取比較理想的圖像質(zhì)量,提高后續(xù)處理的精度。因?yàn)?,系統(tǒng)要求有極高的實(shí)時(shí)性,而頻率域法所采用的算法比較復(fù)雜,要求對(duì)整個(gè)圖像進(jìn)行處理,實(shí)時(shí)性較差,因此系統(tǒng)采用比較簡(jiǎn)單的高斯濾波法。試驗(yàn)中高斯算子用模板表示卷積核為A/16,高斯函數(shù)能把圖像變模糊,有效地消除一切尺度遠(yuǎn)小于高斯分布空間常數(shù)σ的圖像強(qiáng)度變化,它在空域和頻域內(nèi)都是平滑的,因而引入任何在原始圖像中未曾出現(xiàn)的變化的可能性最小。經(jīng)過(guò)我們實(shí)際的實(shí)驗(yàn)測(cè)定,高斯濾波方法速度快,且效果也較理想,因此圖像平滑采用這種方法。
(四)邊緣的增強(qiáng)
邊緣通常是圖像中某些特性不連續(xù)行為表征的,如灰度的突變、彩色的變換、紋理結(jié)構(gòu)的變化等。邊緣表示圖像中一個(gè)區(qū)域過(guò)渡到另一個(gè)區(qū)域。通常圖像的邊界分為階躍式、灰度漸變式、斜率上升又下降式、脈沖式以及帶有不同干擾等形式,要突出圖像中的邊緣,然后再用某些閾值使之分割出來(lái),從而得到邊界的圖像。常用的處理方法有差分運(yùn)算、梯度算子、模板匹配等。以上幾種算子經(jīng)過(guò)實(shí)際應(yīng)用進(jìn)行比較,Sobel 算子運(yùn)算時(shí)間少且精度高,效果比較好。
(五)目標(biāo)的定位
當(dāng)機(jī)器人確定目標(biāo)出現(xiàn)在視野區(qū)域時(shí),為進(jìn)一步得到機(jī)器人與目標(biāo)的相對(duì)距離,本系統(tǒng)采用了紅外測(cè)距卡。它利用PSD 距離測(cè)量傳感器能精確測(cè)量10-80cm 范圍內(nèi)物體的距離,在機(jī)器人實(shí)驗(yàn)中可對(duì)周?chē)h(huán)境進(jìn)行探測(cè),確定對(duì)手所在方位等,紅外測(cè)距卡能連續(xù)地讀出距離,將距離信號(hào)轉(zhuǎn)換為電壓,不需要多余的外圍控制電路。用紅外測(cè)距卡測(cè)量距離PSD 輸出的是電壓變化值,由于PSD 所輸出的電壓與測(cè)量的距離是非線性關(guān)系,用函數(shù)可表示為因此若要顯示所測(cè)距離,必須根據(jù)實(shí)驗(yàn)數(shù)據(jù)求出α、β 的值,在對(duì)測(cè)量距離精度要求不是很高的情況下,可以用簡(jiǎn)單的分段線性方法對(duì)距離值進(jìn)行校正。具體定位方法:機(jī)器人通過(guò)視覺(jué)識(shí)別系統(tǒng)發(fā)現(xiàn)目標(biāo)后,通常需要確定目標(biāo)相對(duì)機(jī)器人的位置。本文綜合運(yùn)用數(shù)字羅盤(pán)標(biāo)定方向,聲納和紅外測(cè)距。先判斷機(jī)器人的方向,如果朝向?qū)Ψ角蜷T(mén)方向,通過(guò)聲納和紅外傳感器確定目標(biāo)和球門(mén)的距離,采取相應(yīng)的子策略。否則,通過(guò)數(shù)字羅盤(pán)方向,改變機(jī)器人的方向。
四、結(jié)語(yǔ)
通過(guò)對(duì)兩個(gè)機(jī)器人合作進(jìn)球多次的測(cè)試,表明視覺(jué)軟件系統(tǒng)可較好地完成檢測(cè)、識(shí)別和跟蹤預(yù)測(cè)的功能.系統(tǒng)運(yùn)行穩(wěn)定,其速度可達(dá)到25幀/s。在運(yùn)行過(guò)程中,當(dāng)發(fā)生快速碰撞時(shí),系統(tǒng)的跟蹤效果有些下降,但可以通過(guò)其他方法解決。
【參考文獻(xiàn)】
[1]賈云得.機(jī)器視覺(jué)[M].北京:科學(xué)技術(shù)出版社,2003.
[2]章毓晉.圖像工程(下)[M].北京:清華大學(xué)出版社,2000.endprint