江雨燕,呂 魏,李 平,邵 金
(1.安徽工業(yè)大學(xué) 管理科學(xué)與工程學(xué)院,安徽 馬鞍山 243032;2.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 南京 210023)
行人再識(shí)別[1]在于行人從一個(gè)相機(jī)消失到另一個(gè)相機(jī)再次出現(xiàn)的時(shí)候?qū)ζ溥M(jìn)行再識(shí)別。目的是為了判別同一個(gè)人出現(xiàn)在兩個(gè)視圖中的相似性。通過度量學(xué)習(xí)的方法來計(jì)算兩個(gè)視圖特征的距離來判斷其相似性。在行人再識(shí)別算法上也有關(guān)于度量學(xué)習(xí)[2]和深度學(xué)習(xí)[3]被提出,基于無監(jiān)督學(xué)習(xí)的科學(xué)技術(shù)研究方法通過偽標(biāo)簽的形式進(jìn)行特征學(xué)習(xí)可以有效深度學(xué)習(xí)中改善全局特征不容易輕松識(shí)別的問題并能夠產(chǎn)生良好的效果。
基于無監(jiān)督學(xué)習(xí)的研究方法在面對(duì)同樣的行人出現(xiàn)在不同攝像機(jī)里會(huì)因?yàn)橥庠谝蛩?,例如光線、姿勢(shì)以及障礙物等造成兩者的相似度降低[4];同時(shí)兩者也存在衣服、膚色等外在特征相似的地方。但是需要對(duì)每個(gè)攝像機(jī)視圖構(gòu)建映射來提高相似性,并且難以區(qū)分共享視圖和特定視圖,無法準(zhǔn)確地建立攝像機(jī)視圖之間的共同性質(zhì)和特異性質(zhì)。因此通過跨視圖非對(duì)稱的方法[2,4-6]把視圖特征區(qū)分為共享視圖特征和特定于視圖特征,引入共享映射來探索共享特征,提取特定的視圖特征投影到公共子空間中使得兩視圖之間的差異盡可能縮小,然后通過無監(jiān)督學(xué)習(xí)進(jìn)行聚類[2-3,7]。但是,在特定于視圖特征的相似度區(qū)分上還需要進(jìn)一步提高,通過Bregman散度[8]方法來衡量特定于視圖之間特征的差異,減少對(duì)共享視圖特征區(qū)分的重復(fù)性,提高聚類效果,增強(qiáng)視圖之間的相似度,從而提高視圖之間相似的精確度。
對(duì)不斷更新增長的數(shù)據(jù)進(jìn)行標(biāo)簽是一項(xiàng)艱難而又復(fù)雜的工作,Martin K?stinger等人[9]提出了一種通過等價(jià)約束來指定標(biāo)簽,并通過馬氏距離度量的可擴(kuò)展性和需要的監(jiān)督程度來進(jìn)行學(xué)習(xí),明顯優(yōu)于現(xiàn)有的結(jié)果。Husheng Dong等人[10]提出了一種新的基于重疊條紋的描述子與從密集塊中提取的局部最大發(fā)生率(LOMO)相融合的增強(qiáng)局部最大發(fā)生率的方法,把精細(xì)的細(xì)節(jié)和表面的粗糙有效結(jié)合起來,充分利用其互補(bǔ)性,結(jié)合馬氏距離和雙線性相似性學(xué)習(xí)廣義相似性。Giuseppe Lisanti等人[11]提出了基于正則化相關(guān)分析的跨視圖匹配的學(xué)習(xí)技術(shù),在不相交的視圖中提取描述子空間的特征投影到公共子空間進(jìn)行學(xué)習(xí),在重新識(shí)別的技術(shù)上有明顯的效果。Yachuang Feng等人[3]基于度量學(xué)習(xí)將行人的特征投影到公共子空間中,在公共子空間中將行人的特征提取出來分為共同特征和特定視圖特征,并通過無監(jiān)督跨視圖的度量學(xué)習(xí)方法來計(jì)算相似性,通過最大均值差異(MMD)來計(jì)算不同樣本的均值,常作為最后損失函數(shù)的優(yōu)化,在遷移學(xué)習(xí)中使用頻率相對(duì)較高且計(jì)算強(qiáng)度低,通常用來衡量兩個(gè)分布之間的距離,屬于一種核學(xué)習(xí)方法。為縮減樣本之間的差異性,該文采用Bregman散度中的KL散度,KL散度在視圖中滿足非對(duì)稱特性,增加一個(gè)樣本的協(xié)方差,這樣能夠在一定程度上提高樣本之間的精確度。
傳統(tǒng)的度量學(xué)習(xí)是學(xué)習(xí)一個(gè)通用的變換矩陣,并將樣本投影到一個(gè)公共子空間,一對(duì)樣本xi和xj的距離為:
‖Wxi-Wxj‖2
(1)
其中,M=WTW,W是投影矩陣,xi和xj是相機(jī)視圖中獲取的不同樣本。由于所有視圖中的樣本都在(1)中處理相同的W,只從不同的視圖中提取共享特征。根據(jù)跨視圖非對(duì)稱度量學(xué)習(xí),為了處理攝像機(jī)視圖之間的不相似性,其形式如下:
(2)
(3)
其中,U0表示共享視圖投影,用于提取共同特征,Uv表示特定于視圖的投影,把Up和Uq投影到子空間來消除視圖之間的特異性。并讓Uvxv與U0xv正交,讓提取的視圖專有特征與普通特征互補(bǔ)。
目標(biāo)模型:
(4)
這里Wv=U0+Uv,重寫目標(biāo)函數(shù):
(5)
其中,∑v=XvXvT/Nv,I表示單位矩陣。
共享信息為U0,特定于視圖信息為Uv。Uv被分為Up和Uq,為了保證Up和Uq學(xué)到不同的信息,部分信息不被劃分到共享信息里面,這里保持Uv和U0盡量正交,又因?yàn)閮烧邔儆诓煌臉颖荆苯诱粵]有意義,故使得Uvxv與U0xv正交,這里引入Bregman divergence,通過Bregman divergence來衡量Up和Uq之間的差異。
Bregman散度是損失函數(shù)或者失真函數(shù),假設(shè)視圖p是視圖q的近似樣本,p是增加了障礙物或者光線的影響而形成的q,所以Bregman散度就是用來衡量p和q的之間的差異性。定義F是在凸集Ω上可微的嚴(yán)格凸函數(shù),在函數(shù)F生成的Bregman散度的形式是[7]:
DF(p‖q)=F(p)-[F(q)+
(6)
其中,DF(p,q)表示樣本p與q之間的距離,用來衡量p與q之間的差異,F(xiàn)(q)表示在q的梯度,
假設(shè)來自不同視圖的樣本是從類似場景中捕獲,因此它們的概率分布被視為相同。但在原始特征空間中的分布通常是不同的,因?yàn)樗鼈兪菑牟煌南鄼C(jī)、不同的場景中捕獲的,直接計(jì)算它們的距離可能是不準(zhǔn)確的。為此,盡可能地提高它們?cè)谧儞Q后的子空間中的概率分布的相似性,選擇不同的函數(shù)F,采用KL散度來衡量樣本分布之間的差異性。KL散度能夠有效解決樣本之間非對(duì)稱的問題,并且在衡量樣本之間差異性的時(shí)候,能夠有效衡量樣本的近似分布與真實(shí)分布之間的匹配程度,主要通過計(jì)算兩個(gè)樣本之間的高斯分布來表示KL散度。這里計(jì)算Up和Uq之間的距離形式為:
DF(Up‖Uq)=F(Up)-[F(Uq)+ Up-Uq>] (7) KL散度的形式為KL(p(hp)‖p(hq)),其中p(hv)~N(μv,Hv),p(Uv)是服從均值為μv,協(xié)方差為Hv的多元高斯分布,Up和Uq的多元高斯分布p(hv)表示為: (hv-μv)T(Hv)-1(hv-μv)] minO(U0,…,Uv)= (UvT∑vUv=I),V=1,2,…,v (8) 算法:跨視圖非對(duì)稱度量學(xué)習(xí)的行人重識(shí)別 1.通過K均值使用原始訓(xùn)練數(shù)據(jù)X來初始化D 3.重復(fù): 6.直到收斂或迭代結(jié)束 (9) 對(duì)兩個(gè)高斯分布p(hp)~N(μp,Hp),p(hq)~N(μq,Hq)計(jì)算KL散度KL(p(hp)‖p(hq))為:KL(p(hp)‖p(hq))=Epl(lnp(hp)-lnp(hq))即: (10) Bregman散度中的KL散度計(jì)算樣本均值,還計(jì)算了樣本的協(xié)方差,因此與最大均值誤差(MMD)方法進(jìn)行比較,這兩種方法均可以對(duì)不同的分布進(jìn)行判斷,并且滿足不同分布的距離不對(duì)稱性。 放寬約束條件: (11) minO(U0,…,UV)= (13) 對(duì)C進(jìn)行k-means聚類優(yōu)化,然后再計(jì)算D。 (14) (15) 其中K的形式為: (16) 這里A、B、L分別表示如下: (17) (18) L=(μqT+μpT)Hq-1AHq-1μp+(μpT- (19) (20) (21) 取所有等式右側(cè)函數(shù)的平方和為目標(biāo)函數(shù),計(jì)算這個(gè)函數(shù)關(guān)于自變量UV以和乘子Ψ、φ偏導(dǎo)數(shù),再對(duì)關(guān)于自變量及乘子的偏導(dǎo)數(shù)進(jìn)行迭代求解。 通過數(shù)據(jù)樣本來訓(xùn)練該方法的有效性,使用Cumulative Match Characteristic (CMC) Curve累計(jì)匹配曲線能夠綜合反映分類器的性能,Rank-1精度通過百分比的形式,計(jì)算每百張的平均精確度對(duì)文中方法和其他方法進(jìn)行比較。 VIPeR[12]數(shù)據(jù)集(見圖1)通過隨機(jī)將其分為兩半,316張圖像用于訓(xùn)練,316張圖像用于測試。重復(fù)這個(gè)過程十次,并報(bào)告每個(gè)算法的平均性能進(jìn)行比較。 圖1 VIPeR數(shù)據(jù)集部分行人樣本 CUHK01[13](見圖2)是通過兩個(gè)不重疊的攝像機(jī)捕捉的971個(gè)行人身份視圖,每視圖有4個(gè)圖像,共有3 884個(gè)圖像。訓(xùn)練集隨機(jī)選擇485人,測試集為其余486對(duì)行人。通過十次重復(fù)來評(píng)估并同時(shí)進(jìn)行單鏡頭(SS)和多鏡頭(MS)實(shí)驗(yàn)。 圖2 CUHK01數(shù)據(jù)集部分行人樣本 Market-1501[14](見圖3)與其他的數(shù)據(jù)集不同,只能在多鏡頭上進(jìn)行實(shí)驗(yàn)。選擇751人作為訓(xùn)練集,共12 936張圖像,其余750人用于測試。 圖3 Market-1501數(shù)據(jù)集部分行人樣本 這里主要是與稀疏字典學(xué)習(xí)模型(簡稱Dic)[15]、稀疏表示學(xué)習(xí)模型(ISR)[16]、視跨圖非對(duì)稱度量學(xué)習(xí)(CAMEL)[3]、組合度量(COMBINE)[17]、無監(jiān)督軌跡(UTAL)[18]、無監(jiān)督的跨視圖度量學(xué)習(xí)(UAML)[2]進(jìn)行比較,如表1所示,并畫出CMC曲線,如圖4所示。 表1 用秩-1精度(%)和MAP(%)測量三個(gè)數(shù)據(jù)集的無監(jiān)督方法的比較結(jié)果 UAML - KL通過學(xué)習(xí)每個(gè)攝像機(jī)視圖的投影矩陣,不僅把投影矩陣劃分成了共享投影和特定于視圖的投影去學(xué)習(xí)特征,在計(jì)算樣本的分布差異過程中引入了KL散度,通過計(jì)算兩者的多元高斯分布來表示分布的KL散度,進(jìn)一步去加強(qiáng)再識(shí)別的精度值,探索共同的特性并降低視圖之間的不一致之外,還更加細(xì)化每個(gè)攝像機(jī)視圖的特定視圖的特征。 (a)VIPeR (b)CUHK01(SS) 3.3.1 共享映射和特定視圖映射分析 共享映射和特定視圖映射的作用主要是對(duì)攝像機(jī)視圖之間的共性與不一致性進(jìn)行建模來獲得比較全面的、具有區(qū)分性的行人特征。為了使得該方法具有一定的性能,通過控制共享特征和特定于視圖的特征,只保留U0或UV來進(jìn)行對(duì)比驗(yàn)證,如表2所示。 表2 非對(duì)稱度量學(xué)習(xí)驗(yàn)證 KL散度的非對(duì)稱性質(zhì)能夠很好地與非對(duì)稱度量學(xué)習(xí)相契合,通過均值和協(xié)方差,在衡量樣本分布的時(shí)候,能夠與真實(shí)樣本分布進(jìn)行匹配,匹配程度越高,則樣本分布愈接近真實(shí)的樣本分布,進(jìn)一步改善相機(jī)視圖之間的分布差異。除了特定于視圖的映射可以為共享的特性提供互補(bǔ)的信息之外,還構(gòu)建了全面的和有區(qū)別的表示。 3.3.2 聚類分析 在三個(gè)數(shù)據(jù)集上驗(yàn)證K對(duì)行人再識(shí)別性能的影響實(shí)驗(yàn)。結(jié)果如表3所示,K在200到1 600之間變化,時(shí)間間隔為200。CUHK01的性能變化較大,這是因?yàn)镃UHK01與Market相對(duì)較小的集群。過多或過少的集群可能會(huì)阻礙對(duì)行人的樣本之間關(guān)系的準(zhǔn)確探索。 表3 不同聚類中心數(shù)量結(jié)果 3.3.3 特征分析 為了適應(yīng)不同特征的能力,為證明不僅在采用基于深度學(xué)習(xí)的JSTL特性時(shí)也很有效,還采用了LOMO特征,先進(jìn)行PCA進(jìn)行降維,得到512維LOMO特征,如表4所示。在所有模型中,Dic和ISR的結(jié)果最具可比性(Dic和ISR位居第二)。所以為了清晰起見,只把該方法和其他特征提取方法比較,LOMO特征作為基線。 表4 使用LOMO特征的比較結(jié)果 無監(jiān)督的行人再識(shí)別度量學(xué)習(xí)方法的基本思想是每個(gè)攝像機(jī)視圖中的行人樣本分別是從兩個(gè)分布中提取的:一個(gè)提取的是攝像機(jī)視圖之間的共同特征,另一個(gè)提取的是特定于視圖的特征。引入一個(gè)共享映射來探索共享特征,并構(gòu)造特定于視圖的映射與視圖相關(guān)的特征提取投影到一個(gè)公共子空間中。這樣不僅降低相機(jī)視圖之間的不一致性,還更加細(xì)化了特定視圖的特征,能夠更加精確地對(duì)行人進(jìn)行再識(shí)別。此外,為了實(shí)現(xiàn)精確的相似性測量,還減少變換空間中攝像機(jī)視圖之間的分布差異,在投影空間中對(duì)樣本進(jìn)行聚類,通過無監(jiān)督的方式進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,與其他算法相比,該方法具有較好的性能。2 模型與優(yōu)化
3 實(shí) 驗(yàn)
3.1 數(shù)據(jù)集介紹
3.2 參數(shù)設(shè)置
3.3 結(jié)果分析
4 結(jié)束語