鹿建國
(山東省水利職工大學,山東 淄博255130)
在人體識別領域的眾多研究方向中,人體朝向分析一直是一個少有人涉及的領域。在以往的研究成果中,有一些研究者談及了人臉朝向問題,其中大多數(shù)研究者希望在人臉識別過程中去除人臉水平旋轉(zhuǎn)對識別過程的不良影響,也有研究者利用人臉朝向來驅(qū)動多方位投影交互系統(tǒng)[1]。
本文涉及的是有關基于智能空間的人體監(jiān)控問題,研究人臉朝向是一件很有意義的工作,若能判斷和估計人臉朝向,便可以確定人的視野范圍及注意對象,進而推斷其當前的活動狀態(tài),分析他的行動意圖。
下面分別介紹針對多目及單目環(huán)境人體朝向分析的解決方案。
多攝像機系統(tǒng)由于能覆蓋較大的監(jiān)控區(qū)域,可有效地解決遮擋問題而成為近幾年來國內(nèi)外研究的熱點問題[2]。在多攝像機環(huán)境下,對于同一個目標,多個攝像機可以從不同的角度進行拍攝,從而可以得到不同視角下的圖像。因為各攝像機方位、角度已知,可以通過對各圖像的分析得到人臉的朝向信息。
在本部分內(nèi)容中,以同一人體從不同角度拍照得到的圖像模擬多攝像機的監(jiān)控環(huán)境。
本文采用的算法是將色度分析與灰度分析相結合,分別得到人體頭部的二值化圖像和人體頭部膚色區(qū)域所對應的二值化圖像,然后分別計算每幅圖像中膚色區(qū)域占人體頭部區(qū)域的比率(一般來說,該比率越大,表示其朝向該采集攝像頭方向的可能性越大),最后,根據(jù)得到的幾幅圖像各自的比率值判斷出人體的朝向。算法流程圖如圖1所示。
圖1 算法流程圖
本文采集了兩組圖片,分別顯示了兩個人的不同視角。第1組實驗效果如圖2所示。
圖2中,第1行為原始圖片,第 2行為利用圖像差分法得到的二值化圖像,第3行為頭部膚色區(qū)域。得到的實驗數(shù)據(jù)如表1所示。
從表1可以看出,列1的人體基本上面向鏡頭,它所對應的比率值最大;列3中的人體基本上背向鏡頭,它所對應的比率值最小。
表1 圖2對應的實驗數(shù)據(jù)
第2組圖片中的人戴眼鏡,穿紅色上衣,實驗效果如圖3所示。
圖3中,第 1行為原始圖片,第 2行為利用圖像差分法得到的二值化圖像,第3行為頭部膚色區(qū)域。得到的實驗數(shù)據(jù)如表2所示。
表2 圖2對應的實驗數(shù)據(jù)
從表2可以看出,列1人體正面面向鏡頭,它所對應的比率值最大;列2中的人體側面面向鏡頭,它所對應的比率值次之;列3中的人體側背向鏡頭,它所對應的比率值最小。
假定在一智能監(jiān)控的房間中,裝有4個攝像頭,其分布如圖4所示。
圖4中箭頭方向為人體的朝向,分別對由4個攝像頭拍攝到的圖像進行分析,可以得到4幅圖像所分別對應的比率值,由比率值就可以得到人體的朝向。如圖4所示的情況,西攝像頭對應的比率最大,北攝像頭的比率次之,南攝像頭的比率再次之,東攝像頭的比率最小,因此可以得到該人體的朝向是西偏北。
該方法可以推廣到分布有3個或更多攝像頭的情況,攝像頭越多,得到的人體朝向信息越準確。
在真實環(huán)境空間中,人體的朝向方向可能為360°范圍內(nèi)的任何方向,用單個攝像頭很難做到實時捕獲到所有的關鍵人臉信息,所以本文設計了一個大概判斷人體朝向的方法。
單目環(huán)境下,某一時刻只能獲得智能空間中的人體的單張圖片,因而無法獲得該人體的準確朝向信息。而本文的算法可以在得到人體頭部區(qū)域和人體頭部膚色區(qū)域的情況下,計算出人體頭部區(qū)域中各白色像素點X坐標的均值以及人體頭部膚色區(qū)域中各白色像素點X坐標的均值,通過比較這兩個均值的大小可判斷出人體朝向偏向鏡頭的左邊還是右邊,兩均值的差的絕對值越大,表明人體相對鏡頭偏轉(zhuǎn)的角度也越大,從而得到人體的大體朝向 (在攝像頭安裝位置、方位已知的情況下)。算法流程圖如圖5所示。
圖5 算法流程圖
第1組圖片測試效果如圖6所示。
圖6中,列 1為原始圖片,列2為圖像差分后得到的二值化圖像,列3為膚色區(qū)域,利用上述算法得到的數(shù)據(jù)如表3所示。
表3 圖6對應的數(shù)據(jù)比較
下面對表3中的數(shù)據(jù)進行進一步的分析。先假定攝像頭的安裝方位是房間的正北方,即攝像頭鏡頭面向正南(做這樣的假定便于后續(xù)分析,在后續(xù)的兩個分析中均采用相同的假定)。因該算法采用的X軸的正方向是水平向左的,若Xf<Xh,則表示得到的圖像中人體頭部偏向左邊,在房間中人體的朝向是面向北偏東方向;反之,若Xf>Xh,則表示圖像中人體頭部偏向右邊,在房間中人體的朝向是面向北偏西方向。而|Xf-Xh|的值越大,表示頭部偏東或偏西的角度越大。
按照上述思路對表3中的數(shù)據(jù)做進一步的整理,得到結果如表4所示。
仔細觀察行3和行4的原始圖片可以發(fā)現(xiàn),其實圖像中的人體該算是背向鏡頭的,這種情況可以借助面積比r來幫助識別,若r較大,認為是面向鏡頭;若r較小,則認為是背向鏡頭的。對于該組圖片,可以以r=0.4作為分界點,若 r<0.4,則認為人體是背向鏡頭的,所以將行3和行4對應的人體朝向分別改為“南偏西”(即改為表4中小括號內(nèi)的結果)。比較原始圖像與上表中的結果就可以發(fā)現(xiàn),用該方法可以正確地得到大概的人體朝向和偏轉(zhuǎn)信息。
表4 圖6對應的人體朝向分析
下面用另一組圖片對該算法進行驗證。該組圖片中人體遠離鏡頭,頭部區(qū)域很小,而且人體伴有點煙、吸煙等無規(guī)律的動作,如圖7所示。
按照前面的方法對得到的數(shù)據(jù)進行分析得到的結果如表5所示。
表5 圖7對應的數(shù)據(jù)比較及人體朝向分析
行3對應的圖片中的人體有吸煙的動作,行4對應的圖片中的人體有點煙的動作。比較原始圖片和得到的分析結果可以看出,在人體較小且存在無規(guī)律動作的情況下,該算法仍能正確地判斷出人體的大體朝向及偏轉(zhuǎn)程度。
本文首先給出了多目環(huán)境下人體朝向的分析方法,通過分析人體頭部區(qū)域中膚色區(qū)域所占的比率來判斷人體面向該攝像機的可能性大小,并用多組圖片驗證了該方法的有效性。隨后給出了單目環(huán)境下的人體朝向分析方法。在單目環(huán)境下無法獲得人體朝向的準確信息,所以本文提出的是在攝像頭安裝位置確定的情況下,得到人體大體朝向的算法:分別計算人體頭部區(qū)域的橫坐標均值和人體頭部區(qū)域中膚色區(qū)域的橫坐標均值,通過比較兩個值的大小來得到人體的大體朝向。
本文介紹的是少有人涉及的領域——人體朝向分析,在監(jiān)控人體與跟蹤過程中研究人體的朝向,可以確定人的視野范圍及注意對象,為進一步分析人體的行動意圖打好基礎。
[1]陳銳,李輝,侯義斌.由人臉朝向驅(qū)動的多方向投影交互系統(tǒng)[J].小型微型計算機系統(tǒng),2007,23(4):706-709.
[2]王濤,楊濤,潘泉.多攝像機環(huán)境下人臉最優(yōu)視角選擇算法[J].計算機工程與應用,2005,17(9):49-51.