亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        救援機(jī)器人中人臉檢測(cè)、定位和跟蹤系統(tǒng)模型

        2013-12-31 00:00:00趙浩李盼盼
        無(wú)線(xiàn)互聯(lián)科技 2013年11期

        摘 要:本文提出了一種在救援機(jī)器人中實(shí)現(xiàn)人臉檢測(cè)、定位和跟蹤的可行方案。首先通過(guò)攝像頭將救援機(jī)器人周?chē)膱?chǎng)景轉(zhuǎn)化成數(shù)字圖像,進(jìn)行預(yù)處理后,使之成為易于檢測(cè)和定位的圖像,然后運(yùn)用圖像分割技術(shù)找到感興趣的目標(biāo)并進(jìn)行定位,最后使用CamShift算法跟蹤運(yùn)動(dòng)的人臉并驅(qū)動(dòng)電機(jī)轉(zhuǎn)動(dòng)。

        關(guān)鍵詞:機(jī)器人;人臉識(shí)別;人臉檢測(cè)與定位;人臉跟蹤;CamShift

        1 引言

        目前,機(jī)器人的高度智能化和自主化是機(jī)器人學(xué)中兩個(gè)重要的研究方向,隨之而來(lái)的應(yīng)用也越來(lái)越廣泛。2008年北京奧運(yùn)會(huì)曾使用過(guò)三種機(jī)器人:福娃機(jī)器人、翻譯機(jī)器人和安保機(jī)器人。2011年3月,里氏9.0級(jí)地震引發(fā)日本福島第一核電站發(fā)生核泄漏事故,圖1為遙控機(jī)器人“Packbot”正在福島第一核電站3號(hào)反應(yīng)堆所在建筑內(nèi)進(jìn)行拍照、測(cè)量放射水平等工作。

        1.1 救援機(jī)器人的基本功能模塊

        作為救援機(jī)器人,一般有用戶(hù)控制,自主決策控制,傳感/基礎(chǔ)決策,運(yùn)動(dòng)/執(zhí)行等幾個(gè)子系統(tǒng)組成[1],其結(jié)構(gòu)如圖2所示。其中視覺(jué)系統(tǒng)實(shí)現(xiàn)對(duì)環(huán)境的實(shí)時(shí)感知,是救援機(jī)器人系統(tǒng)組成的重要部分。救援機(jī)器人通過(guò)攝像機(jī)等視覺(jué)傳感器獲取現(xiàn)場(chǎng)環(huán)境的二維圖像,并利用視覺(jué)處理器進(jìn)行分析和解釋?zhuān)尵仍畽C(jī)器人能夠識(shí)別物體并確定其位置。運(yùn)動(dòng)控制系統(tǒng)和執(zhí)行系統(tǒng)遠(yuǎn)端PC和車(chē)載PC的控制命令完成執(zhí)行動(dòng)作,車(chē)載PC則對(duì)各個(gè)系統(tǒng)進(jìn)行協(xié)調(diào)和控制,并與遠(yuǎn)端PC共同實(shí)現(xiàn)智能化的推理和決策。

        本文提出了一種將人臉檢測(cè)、定位和跟蹤功能加入到視覺(jué)系統(tǒng)中的可行的模型,即通過(guò)主動(dòng)攝像機(jī)從各種不同的場(chǎng)景中檢測(cè)出人臉的存在并確定其位置,然后驅(qū)動(dòng)攝像頭做出反應(yīng)。

        1.2 研究的目的和意義

        本研究基于救援機(jī)器人視覺(jué)系統(tǒng)中的人臉檢測(cè)、定位和跟蹤,但卻有著人臉識(shí)別的普遍意義[2],主要以下兩個(gè)方面:

        1.2.1 促進(jìn)相關(guān)學(xué)科發(fā)展

        人臉檢測(cè)、定位和跟蹤問(wèn)題的解決既涉及到模式識(shí)別,圖像處理、分析與理解、計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)、人工智能、人機(jī)交互等計(jì)算機(jī)相關(guān)領(lǐng)域,也采用了認(rèn)知科學(xué)、神經(jīng)計(jì)算、生理學(xué)、心理學(xué)等相關(guān)專(zhuān)業(yè)知識(shí)。它的解決對(duì)構(gòu)建這些學(xué)科領(lǐng)域的基礎(chǔ)實(shí)驗(yàn)平臺(tái),用于嘗試新方法,驗(yàn)證新理論,解釋新現(xiàn)象非常有利。它還是一個(gè)非常好的教學(xué)平臺(tái),通過(guò)它可以使學(xué)生將理論與實(shí)踐相結(jié)合,提高學(xué)生的動(dòng)手能力、創(chuàng)造能力和綜合能力,符合目前國(guó)家提倡的課程改革與素質(zhì)教育的要求。

        1.2.2 具有巨大的應(yīng)用前景

        如今,需要進(jìn)行身份認(rèn)證的地方越來(lái)越多,如在銀行的ATM上進(jìn)行金融業(yè)務(wù)時(shí)需要輸入密碼,進(jìn)入自己的計(jì)算機(jī)系統(tǒng)則需要輸入用戶(hù)名和密碼,登錄電子郵箱時(shí)的用戶(hù)名和密碼等等。但是,目前采用的身份證、鑰匙、用戶(hù)名、密碼等方式,安全性、可靠性和方便性較差。人臉識(shí)別作為一種典型的生物特征識(shí)別技術(shù),以其自然性、高可接受性等優(yōu)點(diǎn)受到了人們的青睞,可應(yīng)用于各行各業(yè)中,具體來(lái)說(shuō)可分為如下幾類(lèi):

        ⑴訪(fǎng)問(wèn)控制。在安全性要求較高的地方如政府、醫(yī)院,或某些公共場(chǎng)所,可以建立無(wú)門(mén)衛(wèi)的門(mén)禁系統(tǒng)。

        ⑵司法應(yīng)用。常見(jiàn)的是嫌犯(mug shot)識(shí)別,基本方法是對(duì)比目標(biāo)特征和數(shù)據(jù)庫(kù)存貯特征的相似性。

        ⑶電子商務(wù)。在在線(xiàn)金融、貿(mào)易活動(dòng)中,人臉識(shí)別可以提供客戶(hù)的身份認(rèn)證,并保證商業(yè)活動(dòng)無(wú)拒付地良性運(yùn)轉(zhuǎn)。

        ⑷視頻監(jiān)控。利用人臉識(shí)別技術(shù),監(jiān)控者可以從大街上或進(jìn)入大樓、機(jī)場(chǎng)的人群中找到自己要找的人。

        2 圖像處理

        2.1 人臉檢測(cè)與定位系統(tǒng)的構(gòu)成

        人類(lèi)感知外部世界是通過(guò)視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)和嗅覺(jué)等感覺(jué)器官,對(duì)于救援機(jī)器人,則是通過(guò)視覺(jué)系統(tǒng)來(lái)模擬人類(lèi)視覺(jué)功能,其中大量運(yùn)用了數(shù)字圖像處理、計(jì)算機(jī)圖形學(xué)等技術(shù)。救援機(jī)器人視覺(jué)系統(tǒng)主要包括數(shù)字圖像獲取、圖像預(yù)處理、特征提取和圖像識(shí)別等幾個(gè)功能模塊,如圖3所示。

        在數(shù)字圖像獲取階段,通過(guò)光學(xué)成像和數(shù)字化將救援機(jī)器人周?chē)膱?chǎng)景轉(zhuǎn)化成數(shù)字圖像;在預(yù)處理部分,利用圖像濾波、幾何變換、像素插值等方法將數(shù)字圖像進(jìn)行初步調(diào)整,使之成為易于檢測(cè)和定位的圖像;在特征提取部分,對(duì)圖像進(jìn)行抽象化,從而將圖像的紋理特征、顏色特征、形狀特征[3]等提取出來(lái);在識(shí)別部分,系統(tǒng)將上一步獲得的特征與數(shù)據(jù)庫(kù)中的特征進(jìn)行模式匹配,從而在圖像中找到感興趣的目標(biāo)并進(jìn)行定位。

        2.2 圖像分割方法

        利用救援機(jī)器人的攝像頭,經(jīng)過(guò)預(yù)處理便得到所需的圖像。怎樣從圖像中獲得我們感興趣的目標(biāo)區(qū)域,是人臉檢測(cè)和定位的關(guān)鍵步驟。本文利用圖像分割技術(shù)對(duì)目標(biāo)進(jìn)行特征提取和參數(shù)測(cè)量,進(jìn)而實(shí)現(xiàn)人臉檢測(cè)和定位。圖4列出來(lái)了常用的圖像分割方法。

        3 人臉跟蹤和電機(jī)控制方法

        3.1 人臉跟蹤算法

        人臉檢測(cè)和定位完成后,得到人臉圖像區(qū)域。然后使用CamShift算法[4](Continuous Adaptive Mean-Shift,即連續(xù)自適應(yīng)MeanShift算法)跟蹤人臉。CamShift算法利用目標(biāo)的顏色直方圖將圖像轉(zhuǎn)化為顏色概率分布圖,初始化搜索窗口的大小和位置,然后根據(jù)上一幀得到的結(jié)果自適應(yīng)調(diào)整搜索窗口的位置和大小,進(jìn)而定位出當(dāng)前圖像中目標(biāo)的中心位置。算法分為三個(gè)階段:

        3.1.1 計(jì)算色彩投影圖(反向投影)

        ⑴將圖像從RGB空間轉(zhuǎn)換為HSV空間,以減少光照亮度的變化對(duì)跟蹤效果的影響。

        ⑵由于HSV中的H分量可以表示顏色信息,因此對(duì)其作直方圖統(tǒng)計(jì),直方圖代表了不同H分量取值出現(xiàn)的概率或者像素的個(gè)數(shù),就是說(shuō)可以計(jì)算出H分量大小為x的概率或者像素的個(gè)數(shù),即得到了顏色概率查找表。

        ⑶將圖像中每個(gè)像素值用其顏色出現(xiàn)的概率替換,由此得到了顏色概率分布圖。

        這個(gè)過(guò)程叫做反向投影,需要注意的是顏色概率分布圖是一個(gè)灰度圖像。

        3.1.2 meanshift算法

        meanshift算法是一種密度函數(shù)梯度估計(jì)的非參數(shù)方法,通過(guò)不斷迭代尋優(yōu)找到概率分布的極值來(lái)定位目標(biāo)。其過(guò)程分為4步:

        ⑴在顏色概率分布圖中選取搜索窗W。

        ⑵計(jì)算零階矩:

        計(jì)算一階矩:

        計(jì)算搜索窗的質(zhì)心:

        ⑴調(diào)整搜索窗大?。簩挾葹?;長(zhǎng)度為1.2s。

        ⑵移動(dòng)搜索窗的中心到質(zhì)心,如果移動(dòng)距離大于預(yù)設(shè)的固定閾值,則重復(fù)上述2,3,4步,直到搜索窗的中心和質(zhì)心間的移動(dòng)距離小于預(yù)設(shè)的固定閾值,或者循環(huán)計(jì)算的次數(shù)達(dá)到某一最大值,則停止計(jì)算。

        3.1.3 CamShift算法

        CamShift算法就是在視頻序列的每一幀中都運(yùn)用meanshift算法,并將上一幀的結(jié)果,即搜索窗的大小和中心,作為下一幀meanshift搜索窗的初始值。如此不斷迭代,就可以實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤。算法過(guò)程分4步:⑴初始化搜索窗。⑵計(jì)算搜索窗的顏色概率分布(反向投影)。⑶運(yùn)行meanshift算法,獲得搜索窗新的大小和位置。⑷在下一幀視頻圖像中用第3步中的值初始化搜索窗的大小和位置,再跳轉(zhuǎn)至第2步繼續(xù)進(jìn)行。

        3.2 電機(jī)控制方法

        本系統(tǒng)可以根據(jù)人臉區(qū)域的中心與圖像中心的距離,發(fā)送控制命令到伺服電機(jī)的驅(qū)動(dòng)器,使攝像頭產(chǎn)生轉(zhuǎn)動(dòng),從而使人臉始終位于攝像頭圖像的中央位置。通過(guò)多次試驗(yàn),得到人臉在攝像頭圖像的位置與電機(jī)轉(zhuǎn)動(dòng)角度之間的對(duì)于關(guān)系,并將其作為驅(qū)動(dòng)電機(jī)轉(zhuǎn)動(dòng)角度的映射函數(shù)。

        4 結(jié)束語(yǔ)

        本文提出了一種在救援機(jī)器人中實(shí)現(xiàn)人臉檢測(cè)、定位和跟蹤的可行方案。介紹了人臉檢測(cè)、定位的關(guān)鍵技術(shù)和人臉跟蹤算法。此思想可以加以推廣和移植,如應(yīng)用于復(fù)雜環(huán)境下障礙物的識(shí)別、采摘機(jī)器人的果實(shí)識(shí)別、家用機(jī)器人動(dòng)態(tài)手勢(shì)的識(shí)別等等。

        [參考文獻(xiàn)]

        [1]Hao Zhao,Zhijie Liu.Design and Implementation of Wireless Communication Subsystem in WLAN-based Rescue Robot,International Conference on Internet Technology and Applications,Wuhan,China,August 21-23,2010.

        [2]何良華.人臉識(shí)別中若干關(guān)鍵技術(shù)的研究,博士后論文.同濟(jì)大學(xué),2007.

        [3]鄭秋梅,王紅霞,劉康煒.基于邊緣和顏色特征的圖像檢索技術(shù)[J].微計(jì)算機(jī)應(yīng)用,2008年11月第29卷第11期.

        [4]Bradski G R.Computer vision face tracking as a component of a perceptual user interface[C].Proceedings Fourth IEEE Workshop Applications of Computer Visio n. Berlin,Germany,1998:214-219.

        基金項(xiàng)目:2013年福建省教育廳科技研究項(xiàng)目(JB13282)。

        作者簡(jiǎn)介:趙浩(1982-),男,碩士,助教,研究方向:模式識(shí)別,網(wǎng)絡(luò)通信。

        亚洲天堂线上免费av| 在线观看中文字幕一区二区三区| 国产精品久久一区性色a| 一区两区三区视频在线观看| 亚洲乱码av一区二区蜜桃av| 亚洲精品一区二区三区播放| 一区二区三区日本在线| 亚洲女av中文字幕一区二区| 国产精品天天看天天狠| 亚洲精品无码永久在线观看你懂的| 日韩在线一区二区三区免费视频 | 含羞草亚洲AV无码久久精品| 黄 色 成 年 人 网 站免费| 好看的国内自拍三级网站| 国产成人91久久麻豆视频| 国产又爽又大又黄a片| 国产99久久精品一区二区| 亚洲欧洲日本精品| 国产成人丝袜在线无码| 精品一区二区三区牛牛| 成人免费在线亚洲视频| 免费观看18禁无遮挡真人网站| 丰满少妇高潮惨叫正在播放| 综合激情网站| 国产一级黄色性生活片| 亚洲日本一区二区三区四区| 久久无码字幕中文久久无码| 鲁鲁鲁爽爽爽在线视频观看| 欧美精品黄页在线观看视频| 亚洲国产欲色有一二欲色| 亚洲丰满熟女一区二亚洲亚洲| 99精品国产成人一区二区| 久久综合狠狠综合久久| 亚洲一区二区综合色精品| AV无码系列一区二区三区| 粉色蜜桃视频完整版免费观看在线 | 亚洲AV无码日韩一区二区乱| 中文国产乱码在线人妻一区二区| 日韩视频在线观看| 在线精品一区二区三区| 精品国产一级毛片大全|