羅會(huì)蘭鐘寶康孔繁勝
①(江西理工大學(xué)信息工程學(xué)院 贛州 341000)
②(浙江大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 杭州 310027)
帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法
羅會(huì)蘭*①鐘寶康①孔繁勝②
①(江西理工大學(xué)信息工程學(xué)院 贛州 341000)
②(浙江大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 杭州 310027)
針對(duì)矩形跟蹤框在邊緣處包含較多背景信息的問題,該文提出一種基于規(guī)范化梯度特征的帶權(quán)分塊壓縮感知的目標(biāo)特征提取方法。該方法將壓縮感知測量矩陣轉(zhuǎn)化為分塊對(duì)角矩陣,且根據(jù)塊的重要程度分配適當(dāng)?shù)臋?quán)重,縮小測量矩陣規(guī)模,簡化特征提取運(yùn)算,弱化背景干擾。然后將提取的特征輸入變先驗(yàn)概率的貝葉斯分類器,變先驗(yàn)概率的分類器充分利用已有的跟蹤結(jié)果,從一定程度預(yù)測了目標(biāo)的運(yùn)動(dòng)方向,減小候選目標(biāo)的分類歧義性,使得每一幀的分類函數(shù)根據(jù)以往跟蹤結(jié)果進(jìn)行變化,提高了分類的準(zhǔn)確度。實(shí)驗(yàn)在8個(gè)具有常見跟蹤難度的序列中測試,并與目前較流行的4種目標(biāo)跟蹤算法在跟蹤效果、成功率等方面進(jìn)行比較,結(jié)果從多個(gè)角度表明,該文提出的目標(biāo)跟蹤算法具有較高的準(zhǔn)確度和穩(wěn)定性。
目標(biāo)跟蹤;分塊壓縮感知;貝葉斯分類器;變先驗(yàn)概率
運(yùn)動(dòng)目標(biāo)的跟蹤是計(jì)算機(jī)視覺領(lǐng)域的核心問題[1]。由于目標(biāo)變化的復(fù)雜性(如姿態(tài)、光照、遮擋、運(yùn)動(dòng)模糊等),給運(yùn)動(dòng)目標(biāo)跟蹤帶來很大挑戰(zhàn)。目前,目標(biāo)跟蹤問題一般采用3種思路解決:基于逐幀檢測[24]-、基于預(yù)測[5,6]以及兩者相結(jié)合[7]。
基于逐幀檢測的目標(biāo)跟蹤算法在跟蹤過程中有兩個(gè)關(guān)鍵問題:樣本特征的準(zhǔn)確提取和分類器的設(shè)計(jì)。在樣本特征提取方面,文獻(xiàn)[8]發(fā)現(xiàn)在封閉目標(biāo)的梯度空間圖上,盡管目標(biāo)發(fā)生形變、光照等變化,只要將目標(biāo)歸一化到相同的尺度,它們就變得驚人地相似,于是提出一種準(zhǔn)確描述封閉目標(biāo)的規(guī)范化梯度特征(Normed G radient, NG),應(yīng)用于目標(biāo)檢測,取得非常好的效果。但是,目標(biāo)跟蹤與目標(biāo)檢測不同,目標(biāo)跟蹤要求對(duì)每一幀的檢測都是實(shí)時(shí)進(jìn)行的,且目標(biāo)模型需要不斷更新,因此目標(biāo)跟蹤中提取的特征應(yīng)盡量簡單有效。文獻(xiàn)[8]提出的規(guī)范化梯度特征數(shù)量較多,這就需要對(duì)特征進(jìn)行有效壓縮,雖然文獻(xiàn)[4]提出一種壓縮感知方法用于壓縮目標(biāo)特征,但是由于圖像本身信息量大,導(dǎo)致壓縮感知中測量矩陣規(guī)模較大,運(yùn)算復(fù)雜。文獻(xiàn)[9]提出一種分塊壓縮感知方法可以使測量矩陣變成分塊對(duì)角矩陣,在后續(xù)的感知過程中只需用小塊的測量矩陣感知信號(hào),通過這種方法可以使測量矩陣的規(guī)模迅速減小。在分類器設(shè)計(jì)方面,文獻(xiàn)[4]采用簡單有效的樸素貝葉斯分類器對(duì)候選目標(biāo)的壓縮特征進(jìn)行分類,取得較好的分類效果,但是在使用樸素貝葉斯分類器的過程中簡單地認(rèn)為候選區(qū)域的目標(biāo)和背景先驗(yàn)概率相等,忽略了候選目標(biāo)先驗(yàn)概率對(duì)分類的影響,沒有充分利用先驗(yàn)知識(shí)進(jìn)行分類。
基于預(yù)測的目標(biāo)跟蹤算法,是根據(jù)已有跟蹤結(jié)果利用數(shù)學(xué)知識(shí)直接求解目標(biāo)位置。比如基于1e范式最小化的目標(biāo)跟蹤(L1)[5],把目標(biāo)跟蹤問題當(dāng)成稀疏逼近問題,在粒子濾波框架下將噪聲、遮擋和其他跟蹤難點(diǎn)當(dāng)成碎片模板,然后將候選目標(biāo)用目標(biāo)模板基和碎片模板基進(jìn)行稀疏表達(dá),最后通過1e范式最小化求解,將最小錯(cuò)誤投影當(dāng)作目標(biāo)位置,從而實(shí)現(xiàn)目標(biāo)位置的預(yù)測。文獻(xiàn)[7]中的跟蹤學(xué)習(xí)檢測(Tracking-Learning-Detection, TLD)算法則是結(jié)合了預(yù)測和檢測算法,巧妙地把跟蹤、學(xué)習(xí)、檢測結(jié)合在一起。在運(yùn)動(dòng)目標(biāo)部分可見的情況下,用跟蹤器來預(yù)測目標(biāo)在連續(xù)幀間的運(yùn)動(dòng)。檢測器部分為一個(gè)高效的級(jí)聯(lián)分類器,使用簡單有效的圖像特征對(duì)目標(biāo)進(jìn)行實(shí)時(shí)的檢測,同時(shí)在必要的情況下糾正跟蹤器。學(xué)習(xí)模塊評(píng)估跟蹤器和檢測器的性能,通過生成有效的訓(xùn)練樣本完成檢測器的更新,消除檢測器誤差。雖然文獻(xiàn)[5, 7]利用了已有的跟蹤結(jié)果,但是對(duì)目標(biāo)預(yù)測的計(jì)算都非常復(fù)雜,難以達(dá)到實(shí)時(shí)性的要求。
本文提出一種基于規(guī)范化梯度特征的帶權(quán)分塊壓縮感知方法用于特征提取。給規(guī)范化梯度特征的每一分塊分配權(quán)重,以減小邊緣處背景信息干擾特征的影響。由于在大部分情況下,越靠近矩形框中心位置背景信息越少,因此權(quán)重的大小可以使用高斯分布,使得權(quán)值從矩形框中心位置向邊緣處逐漸減小。這樣提取的特征可以弱化背景干擾,提高特征的準(zhǔn)確度。同時(shí),本文提出一種基于線性貝葉斯分類器的變先驗(yàn)概率方法,用于分類器的設(shè)計(jì),與文獻(xiàn)[4]中判別目標(biāo)和背景的線性貝葉斯分類器不同,本文提出的算法并不是默認(rèn)候選目標(biāo)先驗(yàn)概率相等,而是通過對(duì)已有的跟蹤結(jié)果學(xué)習(xí)得到候選目標(biāo)的先驗(yàn)概率。本文提出的變先驗(yàn)概率的貝葉斯分類器能充分利用已有的跟蹤結(jié)果,增強(qiáng)分類器的分類準(zhǔn)確性。在8個(gè)具有挑戰(zhàn)性的視頻序列上(其中5個(gè)是文獻(xiàn)[3]中提供的標(biāo)準(zhǔn)測試序列;另外3個(gè)來自文獻(xiàn)[10])與4種目前較先進(jìn)的算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明本文提出的帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法能夠弱化背景干擾,減小特征的歧義性。同時(shí),基于跟蹤結(jié)果的變先驗(yàn)概率計(jì)算能夠增強(qiáng)分類的可信度,達(dá)到準(zhǔn)確跟蹤目標(biāo)的目的。
文章的第2節(jié)詳細(xì)論述了本文提出的算法,接下來是實(shí)驗(yàn)結(jié)果及分析,最后是結(jié)論。
本文提出了一種基于規(guī)范化梯度特征和帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法。通過對(duì)封閉目標(biāo)具有準(zhǔn)確表示的規(guī)范化梯度特征進(jìn)行分塊,然后給每一分塊分配權(quán)重,提出基于規(guī)范化梯度特征的帶權(quán)分塊壓縮感知特征提取方法,降低壓縮感知測量矩陣規(guī)模,弱化背景干擾。在分類階段,根據(jù)先前候選目標(biāo)的反饋結(jié)果,提出一種變先驗(yàn)概率的貝葉斯分類器,用于預(yù)測目標(biāo)運(yùn)動(dòng)方向,增強(qiáng)分類準(zhǔn)確度。為方便描述,將本文提出的帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法命名為帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法(Tracking using Weighted B lock Compressed sensing and location Prediction,TWBCP)。
2.1 基于NG特征的帶權(quán)分塊壓縮感知
文獻(xiàn)[8]中指出在封閉目標(biāo)的梯度空間圖上,將圖像規(guī)范化到相同的尺寸,目標(biāo)非常相似,基于此提出規(guī)范化梯度(Norm ed G radient, NG)特征用于封閉目標(biāo)檢測。由于圖像在梯度空間上是稀疏的[11],因此可以對(duì)梯度空間特征進(jìn)行壓縮感知,降低特征維數(shù)。文獻(xiàn)[9]采用相同的高斯測量矩陣對(duì)分塊圖像進(jìn)行感知,提出一種分塊壓縮感知(B lock Compressed Sensing, B lock CS)方法,這種方法使得測量矩陣變成分塊對(duì)角矩陣,在感知過程中只需利用小塊的測量矩陣進(jìn)行測量即可,能迅速降低測量矩陣的規(guī)模??紤]到在目標(biāo)跟蹤問題中,大多數(shù)目標(biāo)都具有良好的封閉性,本文提出一種基于NG特征的帶權(quán)分塊壓縮感知方法用于特征提取。
由于跟蹤的目標(biāo)常常是不規(guī)則的,矩形跟蹤框邊緣處通常包含較多背景信息。把背景特征當(dāng)成目標(biāo)特征進(jìn)行學(xué)習(xí)會(huì)影響學(xué)習(xí)的準(zhǔn)確性,并且會(huì)降低對(duì)于背景變化的魯棒性,影響跟蹤效果。因此,在基于NG特征的分塊壓縮感知特征提取階段,給每個(gè)NG特征塊進(jìn)行權(quán)重分配??紤]到通常情況下越靠近跟蹤框中心位置,背景信息越少,在分配權(quán)重時(shí),給中心位置分配較大的權(quán)重,而邊緣位置分配較小的權(quán)重,以弱化邊緣處背景的干擾。將NG特征分成L塊,第k塊的權(quán)重函數(shù)定義為
式(2)中(corex,corey)和(kx, ky)分別表示分塊的NG特征按照從左到右、從上到下的順序生成的2維中心塊位置坐標(biāo)和第k塊位置坐標(biāo)。(σx,σy)表示(kx, ky)離中心塊位置(corex,corey)的標(biāo)準(zhǔn)差。根據(jù)式(2)的定義,離中心塊位置越近的塊權(quán)重越大,表明其對(duì)特征的貢獻(xiàn)越大,反之越小。通過給邊緣處不重要的塊分配較小權(quán)重,中心處重要的塊分配較大權(quán)重的方法,可以減輕邊緣處的背景信息對(duì)目標(biāo)特征提取的干擾。
于是,基于NG特征的帶權(quán)分塊壓縮感知特征計(jì)算為
2.2 變先驗(yàn)概率的貝葉斯分類器
將式(4)代入文獻(xiàn)[12]提出的線性貝葉斯分類器整理得,第t幀第n個(gè)候選目標(biāo)變先驗(yàn)概率的貝葉斯分類判別函數(shù)為
式(6)的分類函數(shù)表明,該分類函數(shù)在每一幀都會(huì)根據(jù)先前跟蹤結(jié)果進(jìn)行變化。對(duì)于每一個(gè)候選目標(biāo)而言,如果正樣本先驗(yàn)概率越大,分類函數(shù)中后半部分越大,從而影響候選目標(biāo)的分類函數(shù)的值。式(6)定義的變先驗(yàn)概率的貝葉斯分類器在某種程度上有根據(jù)以往跟蹤結(jié)果預(yù)測目標(biāo)運(yùn)動(dòng)方向的作用,例如當(dāng)目標(biāo)向下運(yùn)動(dòng)時(shí),會(huì)導(dǎo)致在目標(biāo)下方的候選目標(biāo)先驗(yàn)概率集體增大,從而使得分類器具有運(yùn)動(dòng)方向預(yù)測作用。通過式(6)計(jì)算的分類得分很好地結(jié)合了本幀檢測和預(yù)測的結(jié)果。
2.3 算法流程
帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法流程圖如圖1所示,算法在每跟蹤一幀圖像后都要重新更新相關(guān)參數(shù),更新跟蹤參數(shù)使跟蹤算法能夠適應(yīng)目標(biāo)狀態(tài)的變化。在跟蹤當(dāng)前幀的過程中,先計(jì)算候選目標(biāo)的帶權(quán)分塊壓縮感知特征,然后將該特征輸入變先驗(yàn)概率的貝葉斯分類器計(jì)算候選目標(biāo)的分類得分。在所有候選目標(biāo)分類得分計(jì)算完成后,取得分最大的候選目標(biāo)作為本幀目標(biāo)位置,完成本幀目標(biāo)跟蹤。
在8個(gè)具有代表性的數(shù)據(jù)集(序列)上實(shí)驗(yàn)比較了本文提出的算法(TWBCP)與目前比較流行的4種目標(biāo)跟蹤算法:多示例學(xué)習(xí)(M u ltip le Instance Learning, M IL)[3]、壓縮跟蹤(Com pressive Tracking,CT)[4]、基于1e范式最小化的目標(biāo)跟蹤(L1)[5]和跟蹤學(xué)習(xí)檢測跟蹤(TLD)[7]。本文提出的跟蹤算法TW BCP與多示例學(xué)習(xí)(M IL)[3]跟蹤算法都是通過訓(xùn)練好的分類器判別候選目標(biāo)的得分,選取得分最大者作為本幀跟蹤位置,與M IL算法不同,本算法計(jì)算了候選目標(biāo)位置的先驗(yàn)概率,使得分類器對(duì)候選目標(biāo)位置具有記憶性,增強(qiáng)分類能力。在壓縮感知方面,與CT算法不同,本算法采用分塊的壓縮感知方法減小了感知矩陣的規(guī)模,特征的提取比CT算法更簡單有效?;陬A(yù)測的目標(biāo)跟蹤算法(L1)以及基于檢測與預(yù)測結(jié)合的目標(biāo)跟蹤算法(TLD)都是對(duì)目標(biāo)具體位置進(jìn)行預(yù)測,而本文提出的算法是通過候選目標(biāo)位置的先驗(yàn)概率預(yù)測目標(biāo)的運(yùn)動(dòng)方向。
3.1 實(shí)驗(yàn)數(shù)據(jù)集及參數(shù)設(shè)置
為了驗(yàn)證本文提出算法的有效性和穩(wěn)定性,選擇8個(gè)具有代表性的視頻數(shù)據(jù)集進(jìn)行測試。其中david, dollar, faceocc, faceocc2和surfer是文獻(xiàn)[3]中提供的標(biāo)準(zhǔn)數(shù)據(jù)集;boy, mhyang和fish數(shù)據(jù)集來自文獻(xiàn)[10]。這些數(shù)據(jù)集包含多種目標(biāo)跟蹤難點(diǎn),如目標(biāo)姿態(tài)變化、光照變化、遮擋、背景混亂、運(yùn)動(dòng)模糊、攝像頭抖動(dòng)等。
圖1 帶權(quán)分塊壓縮感知的預(yù)測目標(biāo)跟蹤算法流程圖
3.2 跟蹤效果比較
將本文提出的算法(TWBCP)與壓縮跟蹤(CT)、多示例學(xué)習(xí)(M IL), TLD跟蹤(TLD)和基于1e范式最小化的目標(biāo)跟蹤(L1)算法的跟蹤結(jié)果繪制于每一幀圖像,在dollar, faceocc2, faceocc和fish序列上的跟蹤定性比較結(jié)果如圖2所示。在算法的跟蹤結(jié)果中如果出現(xiàn)跟蹤丟失的現(xiàn)象,則跟蹤框不顯示在圖像上。
圖2 遮擋、光照變化對(duì)跟蹤結(jié)果的影響
圖2(a)dollar序列包含一個(gè)與目標(biāo)非常相似的物體,由實(shí)驗(yàn)結(jié)果可知,本文提出的TWBCP算法在第132幀目標(biāo)與相似物體分離的過程、第227幀目標(biāo)在運(yùn)動(dòng)的過程和第254幀目標(biāo)與相似物體靠近的過程都能夠較準(zhǔn)確地跟蹤選定的目標(biāo),跟蹤結(jié)果幾乎與CT算法一致。這表明基于NG特征的帶權(quán)分塊壓縮感知特征能夠準(zhǔn)確地表征目標(biāo),使得分類器在跟蹤過程中能夠根據(jù)特征準(zhǔn)確跟蹤目標(biāo)。在包含遮擋、姿態(tài)變化的圖2(b)faceocc2序列,本文提出的TWBCP算法在第265幀對(duì)于障礙物的遮擋適應(yīng)性較好;在第422幀姿態(tài)變化和遮擋同時(shí)發(fā)生的情況下,TWBCP算法仍然能夠準(zhǔn)確跟蹤人臉;甚至在第709幀臉部幾乎被完全遮擋的情況下也沒有丟失目標(biāo)。而對(duì)于把目標(biāo)跟蹤問題當(dāng)成稀疏逼近問題的L1算法,在第422幀和第709幀目標(biāo)姿態(tài)變化和存在遮擋的情況下,都出現(xiàn)目標(biāo)跟蹤錯(cuò)誤。
圖2(c)faceocc序列中,不管是遮擋目標(biāo)左部(第400幀)還是遮擋目標(biāo)右部(第563幀),本文提出的TWBCP算法都能準(zhǔn)確地定位目標(biāo)位置;在后續(xù)目標(biāo)在遮擋過后重現(xiàn)(第812幀)的情況下,本文提出的TWBCP算法跟蹤結(jié)果沒有被干擾,跟蹤位置比直接利用樸素貝葉斯分類器的CT算法更準(zhǔn)確。這表明盡管目標(biāo)遮擋對(duì)特征的提取造成干擾,TWBCP算法提出的變先驗(yàn)概率的貝葉斯分類器充分利用已有跟蹤結(jié)果,預(yù)測目標(biāo)將要運(yùn)動(dòng)的方向,在目標(biāo)被遮擋或者目標(biāo)由遮擋重現(xiàn)的過程中,算法預(yù)測的目標(biāo)方向能夠幫助分類器正確分類。圖2(d)fish序列是包含大量光照變化和攝像頭抖動(dòng)的序列,在第164幀光照突然變暗和第301幀光照突然變亮的前提下,本文提出的TWBCP算法定位的結(jié)果較為準(zhǔn)確;TLD算法在301幀后直到跟蹤結(jié)束,出現(xiàn)目標(biāo)丟失現(xiàn)象,這表明攝像頭抖動(dòng)和光照對(duì)TLD算法影響較大。由于本文提出的TWBCP算法是基于梯度空間特征的,梯度特征對(duì)光照變化等具有很好的魯棒性。
3.3 跟蹤成功率比較
為了定量比較算法的跟蹤準(zhǔn)確性,參照文獻(xiàn)[4]的做法,將跟蹤目標(biāo)與真實(shí)目標(biāo)矩形框的交集除以它們的并集作為跟蹤重合率,跟蹤重合率大于0.5即認(rèn)為是跟蹤成功的,將跟蹤成功的幀除以總幀數(shù)即得該序列的跟蹤成功率。
本文提出的TWBCP算法與壓縮跟蹤(CT)、多示例學(xué)習(xí)(M IL), TLD跟蹤(TLD)和基于1e范式最小化的目標(biāo)跟蹤(L1)算法在8個(gè)序列上的跟蹤成功率比較如表1所示。從表1中的實(shí)驗(yàn)結(jié)果可以看出,本文提出的TWBCP算法在6個(gè)序列中獲得了最好的跟蹤成功率,且在8個(gè)序列上的平均跟蹤成功率高出次好的TLD算法22%。而且本文提出的TWBCP算法在相對(duì)簡單的dollar序列和相對(duì)難的surfer序列都獲得最好的跟蹤成功率,這表明本文提出的TWBCP算法采用的基于NG特征的帶權(quán)壓縮感知特征對(duì)目標(biāo)的描述準(zhǔn)確,且變先驗(yàn)概率的貝葉斯分類器學(xué)習(xí)了以往的跟蹤結(jié)果,使得分類算法對(duì)常見的跟蹤難點(diǎn)魯棒性較好,對(duì)序列的適應(yīng)性較強(qiáng),跟蹤的結(jié)果不依賴于特定的序列。
表1 跟蹤成功率(取整)比較(%)
3.4 實(shí)驗(yàn)分析
從上面實(shí)驗(yàn)對(duì)比結(jié)果可以看出,本文提出的算法在具有各種跟蹤難點(diǎn)的序列中都具有較好的表現(xiàn)。從跟蹤效果來看,在具有大量遮擋的faceocc序列和faceocc2序列、光照變化強(qiáng)烈的fish序列和背景相似物體干擾的dollar序列,本算法具有較好的跟蹤效果(見圖2)。從算法的跟蹤成功率來看(見表1),本算法比性能優(yōu)秀的結(jié)合預(yù)測和檢測的TLD跟蹤算法平均成功率高出22%,比其他算法高出更多。這些實(shí)驗(yàn)結(jié)果從各個(gè)方面充分證明本文提出的基于NG特征的帶權(quán)分塊壓縮感知特征能較好地表達(dá)目標(biāo),同時(shí)變先驗(yàn)概率的貝葉斯分類器能根據(jù)以往跟蹤結(jié)果預(yù)測目標(biāo)的運(yùn)動(dòng)方向,實(shí)現(xiàn)準(zhǔn)確跟蹤。
本文將分塊壓縮感知應(yīng)用于目標(biāo)跟蹤,提出一種基于NG特征的帶權(quán)分塊壓縮感知用于目標(biāo)特征提取,削弱了背景干擾,增強(qiáng)了特征的表達(dá)能力。在跟蹤階段,候選目標(biāo)的先驗(yàn)概率是根據(jù)以往的跟蹤結(jié)果計(jì)算得出的,并不是簡單地認(rèn)為正負(fù)樣本先驗(yàn)概率相等,從某種程度上預(yù)測了目標(biāo)的運(yùn)動(dòng)方向,提高了算法的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果從多個(gè)角度表明,本文提出的算法對(duì)常見的跟蹤難度,如遮擋、光照變化、姿態(tài)變化具有較好的適應(yīng)性。本文算法采用的特征是基于簡單的圖像梯度特征,對(duì)封閉目標(biāo)有較好的效果。在后續(xù)的研究中嘗試融合更加復(fù)雜的特征,如哈爾(Haar)特征[13]、尺度不變特征變換(Scale-Invariant Feature Transform, SIFT)特征[14]以及方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征[15],從而使得算法對(duì)跟蹤的目標(biāo)有更寬松的要求。
[1] Yilmaz A, Javed O, and Shah M. Ob ject tracking:a survey[J]. ACM Computing Surveys, 2006, 38(4): 1-29.
[2] Saffari A, Godec M, Pock T, et al.. On line multi-class LPBoost[C]. Preceed ings of the IEEE Conference on Com puter Vision and Pattern Recognition, San Francisco,USA, 2010: 3570-3577.
[3] Babenko B, Yang M H, and Belongie S. Robust ob ject tracking w ith online multiple instance learning[J]. IEEE Transactions on Pattern Analysis and M achine Intelligence,2011, 33(8): 1619-1632.
[4] Zhang Kai-hua, Zhang Lei, and Yang M H. Real-time comp ressive tracking[C]. Preceedings of the European Conference on Computer Vision, Florence, Italy, 2012, 3: 864-877.
[5] Mei Xue and Ling Hai-bin. Robust visual tracking and vehicle classification via sparse representation[J]. IEEE Transactions on Pattern Analysis and M achine Intelligence, 2011, 33(11): 2259-2272.
[6] 孫景樂, 唐林波, 趙保軍, 等. 基于瑞利分布的粒子濾波跟蹤算法[J]. 電子與信息學(xué)報(bào), 2013, 35(4): 763-769. Sun Jing-le, Tang Lin-bo, Zhao Bao-jun, et al.. A new particle filter tracking algorithm based on Ray leigh distribu tion[J]. Journal of Electron ics & Inform ation Techno logy, 2013, 35(4): 763-769.
[7] Kalal Z, M ikolajczyk K, and M atas J. Face-TLD: trackinglearning-detection applied to faces[C]. Preceedings of the IEEE International Conference on Image Processing, Hong Kong, China, 2010: 3789-3792.
[8] Cheng M ing-m ing, Zhang Zi-ming, Lin Wen-yan, et al.. BING: binarized normed gradients for ob jectness estimation at 300fps[OL]. http://mm cheng.net/bing/, 2014.
[9] Liu Gan. B lock com pressed sensing of natural im ages[C]. Preceed ings of the International Conference on Digital Signal Processing, Cardiff, B ritain, 2007: 403-406.
[10] Wu Y, Lim J, and Yang M H. On line ob ject tracking: a benchmark[C]. Preceedings of the IEEE Conference on Com puter Vision and Pattern Recognition, Portland, USA,2013: 2411-2418.
[11] 李然, 干宗良, 崔子冠, 等. 聯(lián)合時(shí)空特征的視頻分塊壓縮感知重構(gòu)[J]. 電子與信息學(xué)報(bào), 2014, 36(2): 285-292. Li Ran, Gan Zong-liang, Cui Zi-guan, et al.. Block com p ressed sensing reconstruction of video combined w ith temporal spatial characteristic[J]. Journal of Electronics & Inform ation Techno logy, 2014, 36(2): 285-292.
[12] Ng Y A and Jordan I M. On discrim inative vs. generative classifier: a com parison of logistic regression and naive bayes[C]. Preceedings of the Advances in Neural Information Processing System s, W histler, Canada, 2002: 841-848.
[13] Papageorgiou P C, Oren M, and Poggio T. A general fram ework for ob ject detection[C]. Preceedings of the International Conference on Com puter V ision, Bombay, India, 1998: 555-562.
[14] 董文會(huì), 常發(fā)亮, 李天平. 融合顏色直方圖及SIFT特征的自適應(yīng)分塊目標(biāo)跟蹤方法[J]. 電子與信息學(xué)報(bào), 2013, 35(4): 770-776. Dong W en-hui, Chang Fa-liang, and Li T ian-p ing. Adaptive fragm ents-based target tracking m ethod fusing color histogram and SIFT features[J]. Journal of Electronics & Information Technology, 2013, 35(4): 770-776.
[15] Dalal N and Triggs B. Histogram s of oriented gradients for human detection[C]. Preceedings of the IEEE Conference on Com pu ter V ision and Pattern Recogn ition, San D iego, USA,2005, 1: 886-893.
羅會(huì)蘭: 女,1974年生,博士,教授,研究方向?yàn)闄C(jī)器學(xué)習(xí)、模式識(shí)別.
鐘寶康: 男,1988年生,碩士生,研究方向?yàn)槟繕?biāo)跟蹤、模式識(shí)別.
孔繁勝: 男,1946年生,博士生導(dǎo)師,教授,研究方向?yàn)槿斯ぶ悄芘c知識(shí)發(fā)現(xiàn).
Tracking Using Weighted Block Com p ressed Sensing and Location Prediction
Luo Hui-lan①Zhong Bao-kang①Kong Fan-sheng②①(School of Information Engineering, Jiangxi University of Science and Techno logy, Ganzhou 341000, China)
②(College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China)
To reduce side effects of background in formation included in the outer parts of tracking rectangular boxes, a weighted b lock com pressed sensing feature extraction method is p roposed based on normalized gradient features. The com pressed sensing m easurem ent matrix is converted to a b lock diagonal m atrix. App rop riate weights are assigned to different blocks according to the im portance of the blocks. It aims to reduce the measurement matrix size, weaken background interference and sim plify feature extraction. Then the extracted features are inputted into Bayesian classifier w ith adaptive p riori probabilities, which is proposed to make full use of existing tracking resu lts. To some extent the classifier w ith variable p riori p robabilities can p redict the direction of the moving targets, and reduce the ambiguities of target candidates. Each frame classification function changes according to the results of the previous track to im prove the classification accuracy. In the experim ents com pared w ith four state-of-the-art tracking algorithms on 8 common ly used tracking test sequences, the proposed target tracking algorithm has higher accuracy and stability in term s of tracking results and success rate.
Ob ject tracking; B lock com pressed sensing; Bayes classifier; Variable p riori p robability
TP391
: A
:1009-5896(2015)05-1160-07
10.11999/JEIT140997
2014-07-25收到,2014-09-28改回
國家973計(jì)劃項(xiàng)目(2010CB327900),國家自然科學(xué)基金(61105042,61462035)和江西省教育廳科技項(xiàng)目(GJJ13421)資助課題
*通信作者:羅會(huì)蘭 luohuilan@sina.com