包 芳 張炎凱, 王士同
1(江陰職業(yè)技術(shù)學(xué)院 江蘇 江陰 214400)2(江蘇省信息融合軟件工程技術(shù)研究開發(fā)中心 江蘇 江陰 214400)3(江南大學(xué) 江蘇 無錫 214000)
?
基于在線增量學(xué)習(xí)的實(shí)時(shí)人臉跟蹤算法
包芳1,2張炎凱1,2,3王士同3
1(江陰職業(yè)技術(shù)學(xué)院江蘇 江陰 214400)2(江蘇省信息融合軟件工程技術(shù)研究開發(fā)中心江蘇 江陰 214400)3(江南大學(xué)江蘇 無錫 214000)
摘要提出基于在線增量式極端隨機(jī)森林分類器的實(shí)時(shí)人臉跟蹤算法。算法用在線極端隨機(jī)森林分類器實(shí)現(xiàn)基于檢測的跟蹤,并結(jié)合動態(tài)目標(biāo)框架和P-N學(xué)習(xí)矯正檢測的錯(cuò)誤。 實(shí)驗(yàn)結(jié)果表明,該算法能夠在不確定背景下對任意人臉實(shí)現(xiàn)較長時(shí)間段內(nèi)的穩(wěn)定快速的實(shí)時(shí)跟蹤,并能有效排除背景等的干擾,效果較好。
關(guān)鍵詞在線增量學(xué)習(xí)極端隨機(jī)森林P-N學(xué)習(xí)動態(tài)目標(biāo)框架實(shí)時(shí)人臉跟蹤
0引言
在視頻監(jiān)控快速普及的情況下,迫切需要遠(yuǎn)距離、用戶非配合狀態(tài)下的快速識別和跟蹤技術(shù)。其中,人臉可以最自然的方式實(shí)現(xiàn)快速身份識別、預(yù)警和跟蹤。因此,人臉檢測、識別與跟蹤是機(jī)器視覺領(lǐng)域的一個(gè)研究熱點(diǎn),國內(nèi)外學(xué)者對此進(jìn)行了大量的研究。
靜態(tài)人臉的檢測與識別技術(shù),基本已成熟,且廣泛應(yīng)用于考勤、檢票等應(yīng)用場合中。運(yùn)動人臉的檢測與跟蹤又分為固定背景與不確定背景兩種情況。固定背景下的運(yùn)動人臉檢測主要采用AdaBoost系列算法[1,2],跟蹤則采用Mean-Shift算法[3]和粒子濾波算法[4]兩類框架實(shí)現(xiàn)。固定背景下的人臉跟蹤,只能是一種短期的、局限性較強(qiáng)的跟蹤,在實(shí)際場合中應(yīng)用價(jià)值并不大。在網(wǎng)絡(luò)集成、背景變化的情況下,任意選中需跟蹤人臉,進(jìn)行長時(shí)間穩(wěn)定跟蹤,才是實(shí)際應(yīng)用所需要的,可供公共交通場所、安全部門等用于特定人員的有效跟蹤,具備極高的實(shí)用價(jià)值。在任意環(huán)境中長期穩(wěn)定地跟蹤人臉,主要存在以下挑戰(zhàn):人臉的各類形變;人臉在某些幀中移開,過了一個(gè)不確定階段又出現(xiàn);背景的復(fù)雜性和不確定性等。因此,傳統(tǒng)的批量離線機(jī)器學(xué)習(xí)模式已不能解決此類問題,而需要使用在線增量學(xué)習(xí)模式。
目前,增量學(xué)習(xí)主要用基于決策樹的算法來實(shí)現(xiàn),特別是基于決策樹的隨機(jī)森林算法[5,6]。隨機(jī)森林對原始訓(xùn)練樣本進(jìn)行采樣替換,算法簡單、快速、穩(wěn)定適用于各種分類場合。但無論是應(yīng)用貪婪算法還是統(tǒng)計(jì)算法的隨機(jī)森林,在增量重構(gòu)時(shí)都需要重新計(jì)算最優(yōu)屬性或統(tǒng)計(jì)值,因此需要大量數(shù)據(jù)作為樣本。
Geutrs等提出的極端隨機(jī)森林算法[7],直接采用原始的訓(xùn)練樣本,隨機(jī)選擇分裂閾值,在分類精度和時(shí)間開銷方面,都優(yōu)于一般隨機(jī)森林算法,比較適合于小樣本數(shù)據(jù)流分類。視頻序列中的人臉跟蹤,屬于典型的小樣本數(shù)據(jù)流中的兩分類問題,適合用基于極端隨機(jī)森林的在線增量學(xué)習(xí)算法來實(shí)現(xiàn)。
另外,P-N學(xué)習(xí)[8]經(jīng)常被用于矯正分類器的錯(cuò)誤。P-experts將那些被分類器標(biāo)記為負(fù)樣本,但根據(jù)約束條件應(yīng)該為正樣本的那些樣本賦予“正”的標(biāo)簽,并添加到訓(xùn)練樣本集中;而N-experts則將那些被分類器標(biāo)記為正樣本,但根據(jù)約束條件應(yīng)該為負(fù)樣本的那些樣本賦予“負(fù)”的標(biāo)簽,并添加到訓(xùn)練樣本集當(dāng)中。這樣,P-experts增加了分類器的魯棒性,而N-experts則增加了分類器的判別能力。
近年來,基于檢測的跟蹤方法成為研究的熱點(diǎn)。一般這種方法都需檢測器和跟蹤器并行運(yùn)行,由檢測結(jié)果及時(shí)重置完善跟蹤,以達(dá)到持續(xù)跟蹤。檢測算法常用隨機(jī)森林分類器,跟蹤則采用光流法等。如上所述,隨機(jī)森林算法在增量重構(gòu)時(shí)需要大量樣本,光流法算法復(fù)雜,抗噪聲能力一般,均不能適應(yīng)視頻序列中人臉的實(shí)時(shí)跟蹤場合。
因此,本文提出應(yīng)用極端隨機(jī)森林分類器進(jìn)行在線增量式目標(biāo)檢測,然后應(yīng)用P-N學(xué)習(xí)[8]再次提升檢測性能,并構(gòu)建在線動態(tài)目標(biāo)框架,實(shí)時(shí)更新目標(biāo)框架。最后綜合應(yīng)用檢測和P-N學(xué)習(xí)的結(jié)果,以及距離動態(tài)目標(biāo)模型的相似度,實(shí)現(xiàn)人臉在線跟蹤。
1人臉建模和動態(tài)目標(biāo)框架
1.1人臉建模
本文采用2bitBP特征進(jìn)行人臉建模。這是一種類Harr特征[9],通過量化,只有4種可能的編碼。因此比較適合于在線監(jiān)測的場合。
建模過程包括特征類型的確定以及相應(yīng)的特征取值。假定需要判斷一個(gè)Patch塊是否為檢測目標(biāo)。所謂特征類型,是指在這個(gè)Patch在(x,y)坐標(biāo),取一個(gè)長width,高h(yuǎn)eight的框,這個(gè)組合(x,y,width,height)即為相應(yīng)的特征類型。在已經(jīng)選定特征類型的情況下,把框左右分成相等的兩部分,分別計(jì)算左右兩部分灰度和的大小,會有兩種情況。同樣的,把框分成上下相等的兩部分,也會有兩種情況。于是在分了上下左右后,總共會有4種情況,可以用2 bit來描述這4種情況,即可得到相應(yīng)的特征取值。
2bitBP特征對外界環(huán)境的光照等變化具有良好的魯棒性,但對于人臉自身形態(tài)的變化有較高的漏檢率,而基于人臉膚色的模型則對自身形變有很好的魯棒性。因此,本文在后續(xù)的P-N學(xué)習(xí)的約束條件中,利用基于YCgCr顏色空間[10]的膚色檢測模型,保證對形變的魯棒問題。
1.2動態(tài)目標(biāo)框架
本文提出一種動態(tài)目標(biāo)框架,它是歸一化后的正樣本和負(fù)樣本的集合,即為本文的訓(xùn)練集合。設(shè)pi+為第i個(gè)被添加進(jìn)去的正樣本,同理pi-為第i個(gè)被添加進(jìn)去的負(fù)樣本。
給定任意一個(gè)圖像片p和動態(tài)目標(biāo)框架M,定義以下概念:
(1) Patch 塊相似度:采用歸一化積相關(guān)算法NCC[11](Normalized Cross-Correlation)計(jì)算兩個(gè)圖像塊之間的相似度:
S(pi,j)=0.5×(NCC(pi,pj)+1)
(1)
(2) 正樣本相似度:
(2)
(3) 負(fù)樣本相似度:
(3)
(4) 最近鄰正樣本相似度:
(4)
由于本文涉及的是任意人臉的跟蹤問題,因此,在第1幀,正樣本為需跟蹤的人臉。然后,在離其最近的掃描窗口內(nèi),在1%的范圍內(nèi),進(jìn)行旋轉(zhuǎn)、偏移等20次幾何變換,這樣就產(chǎn)生了共20個(gè)正樣本。負(fù)樣本則在所有Patch塊的外部隨機(jī)生成。這些帶標(biāo)記的樣本構(gòu)成原始的動態(tài)目標(biāo)框架,可以用來訓(xùn)練原始的極端隨機(jī)森林分類器。在后續(xù)跟蹤過程中,正負(fù)樣本被標(biāo)記后再依據(jù)P-N學(xué)習(xí)被陸續(xù)添加進(jìn)來。
2基于在線增量式極端隨機(jī)森林分類器的人臉檢測
極端隨機(jī)森林是由多棵決策樹集成的分類器,它直接采用原始數(shù)據(jù)作為訓(xùn)練樣本,并且在每棵樹的決策節(jié)點(diǎn)上,隨機(jī)選擇分裂閾值。Geutrs等提出的極端隨機(jī)森林并不支持在線增量學(xué)習(xí),因此,王愛平等提出了支持在線學(xué)習(xí)的增量式極端隨機(jī)森林算法,稱為IERF(Incremental Extremely Random Forest)算法[12]。
IERF算法將新增的在線樣本存儲到葉節(jié)點(diǎn),并通過Gini系數(shù)來決定是否需對當(dāng)前葉節(jié)點(diǎn)進(jìn)行分裂擴(kuò)展。算法中的每棵決策樹被稱為增量超樹,設(shè)輸入為訓(xùn)練樣本p和樹索引i,輸出為增量超樹ti,其構(gòu)造步驟如下:
步驟1:
if ti的根節(jié)點(diǎn)不存在
//返回根節(jié)點(diǎn)
返回一個(gè)根節(jié)點(diǎn)為R的增量超樹ti,其標(biāo)記值為p的標(biāo)記值;
else
//需要分裂
訓(xùn)練樣本p經(jīng)分類后落到葉節(jié)點(diǎn)L;
將p存儲到L的樣本列表中;
更新L上樣本類別的數(shù)量;
if Gini(L)>分裂閾值
構(gòu)造一個(gè)子增量超樹T(見步驟2);
if L是根節(jié)點(diǎn)
將T作為新的根節(jié)點(diǎn);
else
用T替換L成為原父節(jié)點(diǎn)的子節(jié)點(diǎn);
endif
刪除葉節(jié)點(diǎn)L;
返回增量超樹 ti;
endif
endif
其中,Gini系數(shù)是用來衡量樣本集合純度的,設(shè)樣本集D共有k個(gè)類別,pi為類別i的樣本所占比率。Gini系數(shù)計(jì)算表達(dá)式為:
(5)
當(dāng)某葉節(jié)點(diǎn)上的Gini系數(shù)超過一定閾值,則認(rèn)為此節(jié)點(diǎn)上的混亂程度過高,需要繼續(xù)分裂,利用當(dāng)前存儲的樣本構(gòu)造子增量超樹。
(6)
當(dāng)用當(dāng)前存儲的樣本構(gòu)造子增量超樹時(shí),設(shè)輸入的是樣本集合S,輸出的是子增量超樹T。其算法見步驟2。
步驟2:
if |S| //生成葉節(jié)點(diǎn) 生成1個(gè)新的葉節(jié)點(diǎn)T; 將S中所有樣本存儲在T上; 統(tǒng)計(jì)S中所有類別標(biāo)記的數(shù)量分布,也存儲在T上; 返回葉節(jié)點(diǎn)T,T的標(biāo)記值由S的類別標(biāo)記數(shù)量確定; Else //生成子樹 將S劃分成2個(gè)子集Sl和Sr,決策屬性和分裂測試s*采用Geutrs在文獻(xiàn)[11]中的方法; 根據(jù)Sl和Sr,分別構(gòu)造子增量超樹Tl和Tr; 根據(jù)分裂測試s*,生成決策節(jié)點(diǎn)T,Tl和Tr分別是其左子樹和右子樹; 返回子增量超樹T; endif 其中nmin為設(shè)定的最小樣本數(shù)。 本文對于極端隨機(jī)森林的初始化訓(xùn)練,由第1幀生成的帶標(biāo)記的目標(biāo)框架完成。然后,隨著新幀的進(jìn)入,用掃描窗口處理每幀,掃描窗口的大小同原始框定的人臉,歸一化后構(gòu)成1個(gè)新的圖像塊。每個(gè)新圖像塊就是在線增量樣本,由以上算法對其進(jìn)行標(biāo)記。最后,極端隨機(jī)森林的判決結(jié)果由所有增量超樹的結(jié)果取概率平均,從而判斷其是否人臉樣本。為了提高檢測速度,在后續(xù)過程中,掃描只在每幀的膚色區(qū)域內(nèi)進(jìn)行,大大提高了檢測速度。 3P-N學(xué)習(xí) 當(dāng)按以上算法檢測出人臉樣本后,就應(yīng)該將其作為正樣本加入動態(tài)目標(biāo)框架。但檢測有可能存在誤檢,因此,在算法中加入了P-N學(xué)習(xí)模塊,對檢測錯(cuò)誤進(jìn)行再次矯正。 P-N學(xué)習(xí)利用帶標(biāo)記和不帶標(biāo)記的樣本之間存在的結(jié)構(gòu)性特征,來逐步訓(xùn)練并改善分類器分類性能。P-N學(xué)習(xí)的過程如下: (1) 準(zhǔn)備一個(gè)數(shù)量較少的訓(xùn)練樣本集和一個(gè)數(shù)量很大的測試樣本集。 (2) 利用訓(xùn)練樣本訓(xùn)練一個(gè)初始分類器,并對先驗(yàn)約束條件進(jìn)行相應(yīng)的設(shè)置。 (3) 利用訓(xùn)練好的初始分類器對測試樣本賦予標(biāo)記,并找出分類器賦予的標(biāo)記同約束條件相矛盾的那些樣本。 (4) 根據(jù)約束條件,為上述相矛盾的樣本重新賦予標(biāo)記,將其加入訓(xùn)練樣本,重新訓(xùn)練分類器。其中, P-experts將那些被分類器標(biāo)記為負(fù)樣本,但根據(jù)約束條件應(yīng)該為正樣本的那些樣本賦予“正”的標(biāo)簽,并添加到訓(xùn)練樣本集中;而N-experts則將那些被分類器標(biāo)記為正樣本,但根據(jù)約束條件應(yīng)該為負(fù)樣本的那些樣本賦予“負(fù)”的標(biāo)簽,并添加到訓(xùn)練樣本集當(dāng)中。這樣,P-experts增加了分類器的魯棒性,而N-experts則增加了分類器的判別能力。 本文對于經(jīng)分類器標(biāo)記的新樣本,需要確定恰當(dāng)?shù)募s束條件,找出分類器賦予的標(biāo)記同約束條件相矛盾的那些,加入動態(tài)目標(biāo)框架。從而近一步保障檢測效果。 根據(jù)本文涉及的具體領(lǐng)域,首先設(shè)置的約束條件為:YCgCr顏色空間中的膚色模型。目前公認(rèn)YCgCr顏色空間對于膚色的聚類性能是最好的,從視頻序列中圖像的RGB空間向YCgCr空間轉(zhuǎn)換的公式為: (7) 其中屬于膚色的范圍,也即為本文的約束條件1為: (8) 當(dāng)一個(gè)樣本中絕大多數(shù)像素滿足以上范圍,而被分類器標(biāo)注為負(fù),則該樣本被改為正樣本進(jìn)入動態(tài)目標(biāo)框架。同理,當(dāng)一個(gè)樣本中絕大多數(shù)像素不滿足以上范圍,而被分類器標(biāo)注為正,則該樣本被改為負(fù)樣本進(jìn)入動態(tài)目標(biāo)框架。 其次,人臉的跟蹤有其空間域上的特性,就是目標(biāo)在一個(gè)視頻幀中只可能出現(xiàn)在一個(gè)位置。因此,當(dāng)分類器和約束條件都認(rèn)可某目標(biāo)為正,剩余的圖像塊就被認(rèn)為是負(fù)樣本,即本文的約束條件2。 綜上所述,本文的人臉跟蹤算法總結(jié)如下: (1) 在第1幀,手工框定需跟蹤的任意人臉,并以此確定原始的正負(fù)樣本集并加入動態(tài)目標(biāo)框架,再利用其訓(xùn)練原始的極端隨機(jī)森林分類器。 (2) 在后續(xù)幀,在膚色區(qū)域內(nèi)利用掃描窗口獲取新樣本,并應(yīng)用在線增量極端隨機(jī)森林對其進(jìn)行標(biāo)記。然后進(jìn)入P-N學(xué)習(xí)模塊,再次確定此樣本的最終標(biāo)記,并加入動態(tài)目標(biāo)框架。 (3) 在每幀掃描結(jié)束后,若有符合約束條件2的樣本,則此樣本的當(dāng)前位置既為跟蹤的位置。否則,按式(4)計(jì)算所有正樣本的最近鄰正樣本相似度,選取值最大的樣本位置作為跟蹤位置,即實(shí)現(xiàn)了在線跟蹤。 4實(shí)驗(yàn)結(jié)果及分析 根據(jù)以上基本的算法思路,在實(shí)驗(yàn)過程中,增加膚色區(qū)域搜索、三級變框等實(shí)用技巧,獲得了較好的跟蹤準(zhǔn)確性和速度。實(shí)驗(yàn)環(huán)境為Intel i5-33i7U CPU,4 GB內(nèi)存,64位操作系統(tǒng)。 具體的實(shí)驗(yàn)步驟如下: (1) 在出現(xiàn)需跟蹤人臉的時(shí)候,框選目標(biāo)人臉,對框選人臉進(jìn)行隨機(jī)拉伸,旋轉(zhuǎn),獲得20個(gè)正樣本。在框選區(qū)域以外隨機(jī)框選20個(gè)矩形區(qū)域,作為負(fù)樣本。將這40個(gè)正負(fù)樣本RGB圖標(biāo)準(zhǔn)化轉(zhuǎn)化為20×20的標(biāo)準(zhǔn)像素灰度圖,然后將這些圖轉(zhuǎn)化為19×19的2 bit特征圖(每2×2個(gè)像素組合產(chǎn)生一個(gè)2 bit,因此少一維),以獲得的40個(gè)2 bit特征圖為基本數(shù)據(jù),建立極端隨機(jī)森林分類器。 (2) 從截取人臉的那一幀開始逐幀搜索人臉,每獲取一幀,進(jìn)行如下操作: ① 膚色區(qū)域搜索、三級變框等將RGB圖壓縮為100×100的RGB圖,然后轉(zhuǎn)化成YCgCr圖,找出Cr∈[Cr0-5,Cr0+5]、Cg∈[Cg0-5,Cg0+5]的所有聯(lián)通區(qū)域作為膚色區(qū)域(下面所有圖中左上角黑白圖區(qū))。按比例還原后,按照每個(gè)膚色區(qū)域的最邊緣產(chǎn)生方框,作為人臉的搜索區(qū)域,有效減少了搜索區(qū)域,提高了處理速度。 ② 考慮人臉形變和放大縮小,設(shè)置三級變框比[1,1;0.8,1;1.3,1;1,0.8;1,1.3],分別表示不變、長度變窄、長度變寬、寬度變窄、寬度變寬。用上一幀的人臉框的長寬乘以一種邊框比,然后用這個(gè)框在所有膚色區(qū)域依次掃描獲取框選圖像。用極端隨機(jī)森林對每張變框圖像進(jìn)行快速判斷。每個(gè)人臉框,保留其判斷“截圖”,共5個(gè)。 ③ 對比5個(gè)“截圖”,將極端隨機(jī)森林判斷最好的截圖作為“當(dāng)前最好截圖”,并將其2 bit特征圖與之前加入到動態(tài)目標(biāo)框架中的所有樣本進(jìn)行NCC比較,判斷是否為目標(biāo)。如果“當(dāng)前最好截圖”不是目標(biāo)人臉,則認(rèn)定沒有檢測到類似人臉區(qū)域。若是人臉,再進(jìn)行如下判斷(含P-N學(xué)習(xí)和實(shí)用技巧): a) 由于搜索區(qū)域并非完全膚色,因此重新判斷“當(dāng)前最好截圖”是否依舊符合膚色模型。如不符合,則其作為負(fù)樣本,加入增量極端隨機(jī)森林,并跳過b)、c)、d),開始分析下一幀(膚色約束條件,虛線框)。 b) 比較5個(gè)“截圖”中NCC判定為正的截圖與“當(dāng)前最好截圖”的邊框距離。如果超過半個(gè)人臉框的距離,則其作為負(fù)樣本,加入增量極端隨機(jī)森林(唯一性約束條件,虛線框)。 c) 對依舊沒被否定的“截圖”,以其隨機(jī)森林判斷結(jié)果作為權(quán)重,對其截圖位置進(jìn)行加權(quán)平均,得到最終的“加權(quán)截圖”?!凹訖?quán)截圖”應(yīng)該比“當(dāng)前最好截圖”更好。 d) 如果之前“當(dāng)前最好截圖”的隨機(jī)森林判斷結(jié)果中不滿95%的樹同意為人臉,則將“加權(quán)截圖”轉(zhuǎn)化成標(biāo)準(zhǔn)2 bit特征圖,并作為正樣本加入增量極端隨機(jī)森林。并且,確定其為當(dāng)前唯一跟蹤目標(biāo)位置(實(shí)線框)。超過95%同意,則表示“當(dāng)前最好截圖”跟蹤穩(wěn)定,也作為當(dāng)前唯一跟蹤目標(biāo)位置,但不用加入樣本集。 圖1中各子圖為按照完整算法對單人臉跟蹤的結(jié)果,從人臉進(jìn)入到離開的整個(gè)過程中,跟蹤穩(wěn)定快速。 圖1 完整算法單人臉跟蹤效果圖集 圖2中各子圖為減去P-N學(xué)習(xí)后的跟蹤結(jié)果。可見,缺少了膚色和唯一性兩個(gè)約束后,跟蹤基本是不正確和不穩(wěn)定的。 圖2 無P-N學(xué)習(xí)的單人臉跟蹤效果圖集 圖3中各子圖為不在動態(tài)目標(biāo)框架進(jìn)行NCC比較的跟蹤結(jié)果,不引入NCC比較,跟蹤速度略有提高,但跟蹤穩(wěn)定性在總體上不如完整算法。 圖3 無NCC比較的單人臉跟蹤效果圖集 圖4中各子圖為不使用三級邊框時(shí)的跟蹤結(jié)果,不使用三級變框,會造成跟蹤人臉目標(biāo)的局部性。 圖4 無三級變框的單人臉跟蹤效果圖集 圖5中各子圖為在學(xué)習(xí)過程中途,增加其他人臉時(shí),本算法對需跟蹤人臉的跟蹤效果,并且該人臉為側(cè)臉,本算法的跟蹤十分穩(wěn)定。 圖5 完整算法在多人臉中對跟蹤人臉的跟蹤效果圖集 表1為使用完整算法、無P-N學(xué)習(xí)、無NCC比較、無三級變框和全圖搜索(不是僅在膚色區(qū)域搜索),這五種情況下,視頻中每幀平均處理時(shí)間和正確跟蹤率的比較。 表1 五種情況下的幀平均處理速度與正確跟蹤率比較表 綜合考慮跟蹤正確率和速度,本文的完整算法是最優(yōu)的。在實(shí)際應(yīng)用過程中,一般的實(shí)時(shí)處理速度要求達(dá)到每秒25幀。在用戶認(rèn)可的誤差范圍內(nèi),在本文的完整算法中去掉3級變框或者NCC比較,或者使用更好的處理硬件,可以輕松達(dá)到實(shí)時(shí)跟蹤要求。無P-N學(xué)習(xí)和全圖搜索的算法則是不能實(shí)現(xiàn)跟蹤要求的。可見,本文算法有良好的穩(wěn)定性和魯棒性。 5結(jié)語 本文應(yīng)用在線的增量式極端隨機(jī)森林分類器進(jìn)行基于檢測的實(shí)時(shí)跟蹤,在算法中加入了P-N學(xué)習(xí)提升檢測性能,并提出了動態(tài)目標(biāo)框架的概念。算法綜合應(yīng)用分類器和P-N學(xué)習(xí)的結(jié)果,以及距離動態(tài)目標(biāo)模型的相似度,確定跟蹤位置,實(shí)現(xiàn)任意人臉在線跟蹤。并在算法中加入了應(yīng)用膚色聯(lián)通區(qū)域縮小搜索區(qū)域、人臉三級變框、加權(quán)平均定位等技巧。實(shí)驗(yàn)結(jié)果表明,本文算法能夠在不確定背景下對任意人臉實(shí)現(xiàn)較長時(shí)間段內(nèi)的穩(wěn)定快速的實(shí)時(shí)跟蹤,能夠排除背景和其他人臉的干擾。 本文對目標(biāo)消失一段時(shí)間后再度出現(xiàn)的情況,當(dāng)目標(biāo)再次出現(xiàn)后能進(jìn)行檢測定位,但在目標(biāo)沒在的時(shí)間段內(nèi)有一定比率的誤測,檢測穩(wěn)定性不夠。在后續(xù)工作中將針對這一應(yīng)用需求,進(jìn)一步完善跟蹤處理的算法。 參考文獻(xiàn) [1] Paul Viola,Micheal Jones.Rapid Object Detection using a Boosted Cascade of Simple Features[C]//Kauai Marriott,Hawaii,Proc of CVPR,2001:511-518. [2] 鄧亞峰,蘇廣大,傅博.一種基于Adaboost的快速動態(tài)人臉檢測算法[J].計(jì)算機(jī)工程,2006,32(11):222-224. [3] 王娟,劉教民,孟軍英,等.改進(jìn)的均值漂移算法在運(yùn)動目標(biāo)跟蹤中的研究[J].系統(tǒng)仿真學(xué)報(bào),2012,24(9):1896-1899. [4] 姚海濤,朱福喜,陳海強(qiáng).一種自適應(yīng)的PSO粒子濾波人臉視頻跟蹤算法[J].武漢大學(xué)學(xué)報(bào),2012,37(4):492-495. [5] Leo Breiman.Random Forests[J].Machine Learning,2001,45(1):5-32. [6] 劉足華,熊惠霖.基于隨機(jī)森林的目標(biāo)檢測與定位[J].計(jì)算機(jī)工程,2012,38(13):5-8. [7] Pierre Geurts,Damien Ernst,Louis Wehenkel.Extremely Randomized Trees[J].Machine Learning,2006,63(2):3-42. [8] Zdenek Kalal,Tiri Matas,Krystian Mikolajczyk.P-N Learning:Boosrapping Binary Classifiers y Structural Constraints[C]//VCPR2010 proceedings,2010:49-56. [9] 陳勇飛,劉新民.基于膚色和類Harr特征的人臉圖像的人眼檢測[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(33):174-176. [10] 丁友東,杜曉鳳,李曉強(qiáng).基于聚類膚色模型的人臉檢測[J].上海大學(xué)學(xué)報(bào),2007,13(5):511-515. [11] Rachid Belaroussi,Maurice Milgram.A Comparative Study on Face Detection and Tracking Algorithm[J].Expert System with Applications,2012,39(12):7158-7164. [12] 王愛平,萬國偉,程志全,等.支持在線學(xué)習(xí)的增量式極端隨機(jī)森林分類器[J].軟件學(xué)報(bào),2011,22(9):2059-2074. REAL-TIME FACE TRACKING ALGORITHM BASED ON ONLINE INCREMENTAL LEARNING Bao Fang1,2Zhang Yankai1,2,3Wang Shitong3 1(JiangyinPolytechnicCollege,Jiangyin214400,Jiangsu,China)2(InformationIntelligenceFusionResearchEngineeringCenterofJiangsu,Jiangyin214400,Jiangsu,China)3(JiangnanUniversity,Wuxi214000,Jiangsu,China) AbstractThe paper proposes a real-time face tracking algorithm, which is based on online incremental extremely random forests classifier. The algorithm achieves detection-based real-time tracking using online incremental extremely random forests classifier, and combines dynamic target framework and P-N learning to correct detection errors. Experimental results show, the proposed algorithm can realise fast and stable real-time tracking for any face in a longer period under uncertain background, and can effectively overcome interferences such as background with preferable effect. KeywordsOnline incremental learningExtremely random forestsP-N learningDynamic target frameworkReal-time face tracking 收稿日期:2014-10-16。江蘇省自然科學(xué)基金項(xiàng)目(BK2012128)。包芳,教授,主研領(lǐng)域:人工智能模式識別,神經(jīng)網(wǎng)絡(luò),模糊系統(tǒng),在線學(xué)習(xí)。張炎凱,碩士生。王士同,教授。 中圖分類號TP391.4 文獻(xiàn)標(biāo)識碼A DOI:10.3969/j.issn.1000-386x.2016.05.067