向 曼
(上海大學(xué)數(shù)碼藝術(shù)學(xué)院,上海 201800)
視覺圖像是一類快速移動的圖像,背景目標識別技術(shù)已經(jīng)成為人們所關(guān)注的焦點,背景信息分割目標無效特征的存在使得背景提取無效的現(xiàn)象,導(dǎo)致目標信息識別準確率低、識別結(jié)果不完整,因此,如何高效識別視覺圖像背景,是現(xiàn)在相關(guān)研究領(lǐng)域的重要挑戰(zhàn)之一。
文獻[1]分析圖像背景區(qū)域內(nèi)灰度的統(tǒng)計特性,對視覺圖像背景區(qū)域進行統(tǒng)計特性擬合,建造圖像背景區(qū)域模型,使用Kolmogorov距離誤差測評對視覺圖像背景進行識別。但該方法在建造背景區(qū)域模型的過程中較為粗略,導(dǎo)致識別圖像背景時會出現(xiàn)識別不完整現(xiàn)象。文獻[2]提出非接觸指紋圖像識別算法,構(gòu)建圖像背景模型,將模型中的Cb分量和Otsu法結(jié)合,使用高頻強調(diào)濾波與迭代自適應(yīng)直方圖,增強處理圖像背景,提取圖像背景特征,識別出視覺圖像的背景反饋信息。該方法存在兩次增強,導(dǎo)致識別圖像背景的效率較低。文獻[3]提出了一種基于機器視覺的實時動態(tài)多目標識別的方法。該方法首先根據(jù)前后幀之間像素的變化,分割出運動目標和樣本圖像,然后使用Gabor濾波器提取圖像的特征,得到特征向量。最后使用Fisher判別準則分類識別,將得到的分類識別結(jié)果自動標注在輸出圖像中,并且將其連續(xù)輸出。上述方法在特定的視覺圖像中有著較好的識別效果,但是視覺圖像種類較多,大多數(shù)圖像背景無法使用卡爾曼濾波預(yù)測和均值漂移思想,導(dǎo)致該方法在識別圖像背景中受到類型限制較嚴重。
針對上述問題,本文提出一種視覺圖像背景多目標反饋信息自動識別。通過歸一化處理背景目標跟蹤與反饋信息,分類視覺圖像目標,提取多目標分割閾值,從而實現(xiàn)反饋信息自動識別。旨在達到有效提取信息分割閾值,在分割以后的圖像區(qū)域有效判別提取背景,準確識別圖像背景多目標反饋信息。
針對新目標的判斷,若運動的目標在進入監(jiān)控場景后,需要檢測出與其相應(yīng)區(qū)域沒有任何目標模板對應(yīng),就可以判定該區(qū)域內(nèi)有新的運動目標出現(xiàn),為此,需要建立一個與新目標所相應(yīng)的臨時模板信息進行跟蹤。在對運動目標的跟蹤過程中,提取運動目標的位置信息和顏色等特征,識別運動目標信息[4]。
圖像中的目標離開場景區(qū)域時進行判斷,考慮兩種情況,一是目標本身運動出監(jiān)控的區(qū)域,假如運動目標的矩形框觸碰到了監(jiān)控的范圍,同樣可以放棄對目標的跟蹤;二是跟蹤的目標沒有運動出監(jiān)控的范圍,不過在較長的時間里被判定為目標丟失的情況,出現(xiàn)這種情況,就需要考慮此目標相對的模板信息[5]。
在實際的監(jiān)控場景中,其運動目標在臨近兩幀之間的距離相對較小,之后利用矩陣框的中心為跟蹤特征。將Po,i(xi,yi)設(shè)為第i個所檢測至區(qū)域中心的坐標,Pd,j(xj,yj)代表第j個所檢測至區(qū)域中心的坐標,計算兩個坐標的歐式距離d:
(1)
若d小于閾值Th,初步判定第i個小目標與第j個區(qū)域很有可能是相似的目標[6]。目標連續(xù)跟蹤的幀數(shù)在達到給定閾值時,則可以判定為場景區(qū)域中的真實目標,否則就是虛假目標,應(yīng)當放棄跟蹤,并且與要將目標所相對應(yīng)的模板信息進行清除。
對于目標丟失判斷,假如某個運動目標并沒有與任何所檢測到的運動區(qū)域進行匹配,則可以認為該目標是因為處于特殊場景才致使沒有被檢測到,這時候可以認為該目標已經(jīng)丟失,則需要暫時停止跟蹤,若目標一直被判定為丟失,其幀數(shù)到達給定的幀數(shù)時,就可以確認目標丟失[7]。
在其初步判定之后,計算相應(yīng)的多目標模板區(qū)域和檢測區(qū)域的顏色直方圖。利用視覺一致性的HSV顏色空間,提取出S分量和H分量,并且將H分量分成30個小空間,S分量分成6個小空間,提取目標圖像中的像素點,統(tǒng)計各空間像素點數(shù)量,得到所有顏色的直方圖hist函數(shù)。
(2)
基于顏色直方圖hist函數(shù),歸一化處理圖像背景多目標反饋信息,其公式為
(3)
式中:hist1、hist2分別代表目標模板區(qū)域與檢測區(qū)域的顏色直方圖,而B代表兩個直方圖之間的巴氏距離,B越小,兩個顏色之間的直方圖相似程度就越高;反之,直方圖相似程度越小[8]。
第一層分類器所檢測出的是背景目標,分為行人與車輛兩種類型,而第二層則是分類器將第一層分類器所識別出來的行人進一步分為靜止行人與車輛,運動行人與車輛兩種。
相對于第一層分類器,在提取出背景目標以后,將輪廓面積ConArea作為分類判斷因子,計算離散度Dispersion,其公式表達式為
(4)
AspectRation=RHeight/RWidth
(5)
式中:CLength是輪廓的周長,RWidth和RHeight分別代表目標輪廓矩形的高和寬,AspectRation表示目標輪廓擬合的矩形長寬比。
對于第二層分類器,背景檢測后提取目標,引入?yún)?shù)靜止幀數(shù)sCount且初始化為零,需要判斷所有的真實目標兩幀之間的距離,如果兩幀之間的距離閾值d小于靜止距離的閾值Th,即可以定義為此目標是靜止的,sCount加1;假如連續(xù)靜止的幀數(shù)sCount>15,即可以說明該目標是運動的。該方法能夠識別出行人從靜止到運動的狀態(tài),并且成功的對目標消失以及新目標的出現(xiàn)進行有效并正確的處理[9]。
圖像分析處理過程,就是指圖像中某些特定的性質(zhì)區(qū)域。這些區(qū)域被稱為目標,而其它區(qū)域則被稱為背景。閾值的選取是閾值分割的關(guān)鍵技術(shù)。如果閾值的選擇過高,那么過多的目標點將會被誤以為是背景;反之,閾值選擇過低,那么會出現(xiàn)一些相反的現(xiàn)象。因此,為了對目標區(qū)域進行識別分析,需要提取區(qū)域背景閾值。
閾值法是比較常用的一種圖像分割算法,原理算法如下:將原始灰度圖像設(shè)為f(x,y),以一定的準則在f(x,y)中找出一個灰度值Th視為閾值。把圖像分割成兩部分,即分割后的二值圖像g(x,y)為
g(x,y)=Thf(x,y)
(6)
采用局部閾值法,通過圖像像素灰度與圖像像素周圍局部灰度的特性來確認像素的閾值。對目標的大小與像素灰度值不同的圖像均可以產(chǎn)生較好的分割效果,尤其在分割多目標時,其原理如下。
圖像的灰度值范圍時1~L,先將圖像的全部像素分成兩個大組:集灰度的范圍是(1,2,…,k)的一組與灰度范圍為(k+1,k+2,…,k)的一組,其概率如下
(7)
式中:ni代表為第i個像素點;N代表整個圖像的像素點;Pi代表像素點i出現(xiàn)的頻率;ω(k)代表像素點i出現(xiàn)的頻率總和。
整幅視覺圖像的分割閾值提取公式為
(8)
兩大組之間的方差為
σ2(Th)=ω0(Th)μ0+ω1(Th)μ1
(9)
式中:μ0與μ1分別是兩大組的各自平均灰度值,當灰度從I增長至L時,計算出所有的σ2(Th),尋找出使σ2(Th)達到最大值的Th值,這一灰度值就是需要尋找的閾值。
圖1 多目標反饋信息分割流程圖
針對圖像背景區(qū)域在初始化后,都需要進行背景的提取,然后跟蹤達到輪廓閾值的真實背景目標,其跟蹤目標的過程中,需要先對目標分類。對于運動目標,直接按照初始圖像和背景進行更新,而對于不確定是否會運動的目標,則需要利用同一目標的中心點距離對目標進行判斷是否靜止,而對于非靜止的目標區(qū)域,既需要通過初始的參數(shù)更新高斯模型,而對于靜止目標,需要通過零學(xué)習(xí)率來進行更新,利用這種控制方法融入背景。針對于不同的目標,要利用不同的更新率,才可以防止需要檢測的目標背景融入背景中[10]。
視覺圖像運動區(qū)域和背景區(qū)域二者所采用的更新策略是相同的,統(tǒng)稱為其它區(qū)域。不過圖像中的靜止區(qū)域,將其學(xué)習(xí)率歸置零,對該區(qū)域的背景融入進行控制[11],具體的方法如圖2所示。
圖2 測量直角坐標系下目標運動軌跡
在分割以后的圖像區(qū)域可以有效判別提取背景,即:當圖像目標區(qū)域處于邊緣或者是已經(jīng)被截取的情況下,這樣的目標特征是不完整的,所以須判定為無效。使用標志目標基本為圓形或者是橢圓形,并依據(jù)目標的基本判斷:目標區(qū)域的周長、面積以及緊湊度。
圖像背景多目標反饋信息自動識別通過下列步驟進行計算的:
1)利用隔行掃描的八鄰域編碼邊界跟蹤方法,構(gòu)建其目標區(qū)域的周長鏈碼描寫;
通過上述步驟,獲取目標識別參數(shù),完成視覺圖像背景多目標反饋信息自動識別。
為了驗證所提方法的有效性,進行仿真實驗。圖像組為某監(jiān)控區(qū)域嚴格配準的前后聚焦圖像。實驗參數(shù)設(shè)置如表1所示。
表1 實驗參數(shù)設(shè)置
將測量直角坐標系下的目標運動軌跡變換至測量極坐標系下,由此得到目標的距離、方位和俯仰角度,這些數(shù)據(jù)作為目標測量真值數(shù)據(jù)被保存,如圖2所示。
為了驗證多目標反饋信息自動識別效果,結(jié)果如圖3所示。
圖3 背景識別結(jié)果分析
通過上圖能夠看出,本文方法進行識別過后的圖像背景,并沒用出現(xiàn)細節(jié)丟失現(xiàn)象,同樣對多個目標的識別較為全面,通過兩者比較之下,說明本方法要優(yōu)于傳統(tǒng)方法,更加具有有效性。
由圖4可以看出,目標的局部背景比較簡單,經(jīng)過背景閾值分割后,在分割以后的圖像區(qū)域可以有效提取背景。
圖4 圖像背景多目標反饋信息背景分割結(jié)果
由圖5可以看出,本文方法對局部區(qū)域灰度特征突出的目標能取得很好的分割效果,特別是在有遮擋的情況下,經(jīng)過對局部區(qū)間兩次迭代分割后,雜物背景均被有效分割出去。
圖5 直方圖結(jié)果分析
為了進一步驗證視覺圖像背景多目標反饋信息自動識別準確度,進行仿真,具體結(jié)果如圖6所示。統(tǒng)計50次實驗的誤差均方根來衡量,即
(10)
采樣周期T設(shè)置為0.01s和0.05s,得到誤差均方根曲線如圖6所示。
圖6 濾波估計誤差結(jié)果分析
與圖2的運動軌跡對應(yīng)起來可以發(fā)現(xiàn),誤差增大的地方是在角運動軌跡拐彎變化明顯之處,在采樣周期比較大的情形下模型的準確性對濾波精度具有較大的影響。主要原因在于本文方法在有效提取視覺圖像分割閾值的基礎(chǔ)上,完成視覺圖像背景多目標反饋信息自動識別,提高了識別準確度。
在科技時代,人工智能已經(jīng)成為主流項目,所以圖像識別技術(shù),就順應(yīng)而生,傳統(tǒng)圖像識別技術(shù),是針對圖像目標進行識別,而本文所研究的是,圖像背景多目標信息反饋識別,通過背景建模來對圖像中的運動目標或者已經(jīng)靜止目標進行跟蹤和反饋,之后將圖像分割,最后使用特征計算法對分割后的圖像進行計算,從而達到多目標反饋信息有效識別的目的。此方法可以應(yīng)用于許多領(lǐng)域,來完成一些高難度的工作。所以受到廣泛的關(guān)注,使圖像背景識別的技術(shù)更加的完善。