檢測(cè)優(yōu)化的標(biāo)簽多伯努利視頻多目標(biāo)跟蹤算法

2023-06-07 08:30:20蔣凌云楊金龍

計(jì)算機(jī)與生活 2023年6期

蔣凌云，楊金龍

江南大學(xué) 人工智能與計(jì)算機(jī)學(xué)院，江蘇無錫214122

圖像處理在近幾年飛速發(fā)展且發(fā)展方向廣，其中文獻(xiàn)[1]代表了地質(zhì)科學(xué)方向。視頻多目標(biāo)跟蹤是目標(biāo)跟蹤方向的一個(gè)重要分支，由于存在新生目標(biāo)數(shù)量與出生位置的不確定性、遮擋或交叉導(dǎo)致的標(biāo)簽頻繁跳動(dòng)、目標(biāo)特征建模困難等問題，使得視頻多目標(biāo)跟蹤一直是目標(biāo)跟蹤領(lǐng)域中的研究熱點(diǎn)和難點(diǎn)。不同算法在各問題上提出優(yōu)化方案。如對(duì)于處理跟蹤算法中的實(shí)時(shí)性以及標(biāo)簽跳變問題，文獻(xiàn)[2]對(duì)檢測(cè)與跟蹤算法同時(shí)提出優(yōu)化，檢測(cè)方面構(gòu)建精簡(jiǎn)的模型以提高檢測(cè)速度，跟蹤方面利用長(zhǎng)短期記憶網(wǎng)絡(luò)（long short-term memory，LSTM）來減小預(yù)測(cè)誤差以減少標(biāo)簽跳變；對(duì)于處理數(shù)據(jù)關(guān)聯(lián)的不確定性和外觀特征難以表達(dá)的問題，文獻(xiàn)[3]提出了基于軌跡置信度的分層數(shù)據(jù)關(guān)聯(lián)方式和過程融合的特征提取網(wǎng)絡(luò)；對(duì)于算法魯棒性以及數(shù)據(jù)關(guān)聯(lián)的問題，文獻(xiàn)[4]提出將卡爾曼濾波的預(yù)測(cè)框和檢測(cè)器的檢測(cè)框作為模型的選擇，融合目標(biāo)多種特征信息完成多目標(biāo)之間的數(shù)據(jù)關(guān)聯(lián)。

在檢測(cè)新生目標(biāo)方面：近些年，隨機(jī)有限集（random finite sets，RFS）[5-11]濾波得到了廣泛關(guān)注，文獻(xiàn)[12-17]也將隨機(jī)有限集應(yīng)用到視頻跟蹤中，但由于新生目標(biāo)的隨機(jī)性未知，給該方法的使用帶來一定的困難。在隨機(jī)有限集濾波方法中，如傳統(tǒng)的多伯努利濾波（multi-Bernoulli filter，MBF）和概率假設(shè)密度（probability hypothesis density，PHD）算法需要建立新生模型（新生目標(biāo)可能出現(xiàn)的位置、狀態(tài)以及概率）來捕獲新生目標(biāo)，在這種情況下，通常預(yù)先了解場(chǎng)景信息。但在真實(shí)的視頻多目標(biāo)中，由于新生目標(biāo)的多變性，很難建立符合場(chǎng)景的新生模型，視頻中新生目標(biāo)可能從邊緣進(jìn)入，或被遮擋后重新出現(xiàn)，或從某建筑物出現(xiàn)等。文獻(xiàn)[18]提出了量測(cè)驅(qū)動(dòng)目標(biāo)新生模型，給定新生目標(biāo)新生概率，將檢測(cè)值作為高斯分量的均值，直接去除了低置信度的檢測(cè)值。

在目標(biāo)建模與重識(shí)別方面：Deepsort通過級(jí)聯(lián)匹配以及新軌跡確認(rèn)機(jī)制來進(jìn)行目標(biāo)的重識(shí)別。文獻(xiàn)[19]在網(wǎng)路特征圖中提取人物特征向量，采用一階段多任務(wù)學(xué)習(xí)，將人物特征向量與人物檢測(cè)框共同輸出，在精度差不多的情況提高了算法運(yùn)算速度。

在標(biāo)簽維持及關(guān)聯(lián)方面：多數(shù)方法在數(shù)據(jù)關(guān)聯(lián)方面利用預(yù)測(cè)得出的目標(biāo)建模信息與下一幀所獲取的檢測(cè)信息進(jìn)行相似度比較，并利用匈牙利或最大全匹配（Kuhn-Munkres algorithm，KM）算法進(jìn)行檢測(cè)框與目標(biāo)框的關(guān)聯(lián)。如MYL-Deepsort、Sort[20]、IOU17[21]將框與框之間的交并比（intersection-over-union，IOU）作為關(guān)聯(lián)算法的依據(jù)，運(yùn)算速度較快。文獻(xiàn)[1]則是利用特征與IOU 相結(jié)合的方式進(jìn)行關(guān)聯(lián)，準(zhǔn)確度較高但是運(yùn)算量大。

本文提出的主要問題在新生目標(biāo)以及數(shù)據(jù)關(guān)聯(lián)方面，主要貢獻(xiàn)概括如下：

（1）檢測(cè)自適應(yīng)新生模型。在傳統(tǒng)的標(biāo)簽多伯努利濾波中，需要在目標(biāo)可能出現(xiàn)的位置自定義新生模型，由于視頻多目標(biāo)跟蹤新生目標(biāo)的不確定性，本文將定義與檢測(cè)置信度相關(guān)的新生模型。由于檢測(cè)器檢測(cè)結(jié)果的置信度會(huì)有高低之分，相比直接去除低置信度的檢測(cè)方法，本文將檢測(cè)置信度與目標(biāo)新生概率結(jié)合，將低置信度的檢測(cè)加入到標(biāo)簽多伯努利的濾波中，提高目標(biāo)識(shí)別率的同時(shí)避免誤檢以及漏檢，為跟蹤提供良好的檢測(cè)數(shù)據(jù)。

（2）融入標(biāo)簽多伯努利算法。在大部分多目標(biāo)跟蹤中，通過目標(biāo)模板以及檢測(cè)數(shù)據(jù)進(jìn)行關(guān)聯(lián)來實(shí)現(xiàn)多目標(biāo)跟蹤，這些方法在多目標(biāo)跟蹤中有很好的效果，但在維持軌跡方面有所欠缺，標(biāo)簽多伯努利不同于傳統(tǒng)復(fù)雜的數(shù)據(jù)關(guān)聯(lián)方法，在檢測(cè)數(shù)目變化較多的情況下，仍然可以較好地估計(jì)目標(biāo)的數(shù)目以及目標(biāo)的狀態(tài)，即使目標(biāo)被遮擋后，也能較好地維持相應(yīng)目標(biāo)的軌跡。

（3）提出新的目標(biāo)重識(shí)別以及目標(biāo)特征提取策略。標(biāo)簽多伯努利算法在估計(jì)目標(biāo)數(shù)目以及目標(biāo)狀態(tài)的同時(shí)，還可以估計(jì)目標(biāo)的標(biāo)簽狀態(tài)，本文將結(jié)合目標(biāo)特征以及標(biāo)簽多伯努利所估計(jì)的標(biāo)簽狀態(tài)來進(jìn)行目標(biāo)重識(shí)別。

1 標(biāo)簽多伯努利隨機(jī)集理論

1.1 多伯努利隨機(jī)集

假設(shè)一個(gè)伯努利有限集是空的概率為1-r，是一個(gè)以p(·)為空間概率密度分布的概率為r，則伯努利的勢(shì)分布可表示為：

此概率密度函數(shù)可以理解為，加和符號(hào)將所有的伯努利隨機(jī)有限集的排列組合全部相加，即每個(gè)隨機(jī)集都是二項(xiàng)分布，計(jì)算M個(gè)有限集的排列組合。不是空集的伯努利隨機(jī)集i1,i2,…,in則會(huì)有具體的函數(shù)值x1,x2,…,xn。若為空集?，則概率密度的表達(dá)式可以表示為π=。如果將上式的空間密度分布忽略，則多伯努利的勢(shì)分布可表示為：

1.2 標(biāo)簽多伯努利隨機(jī)集

標(biāo)簽多伯努利隨機(jī)集與多伯努利隨機(jī)集不同的是，在狀態(tài)x∈X中增加了標(biāo)簽l∈L這一狀態(tài)維，以估計(jì)在多目標(biāo)場(chǎng)景中某一個(gè)目標(biāo)的標(biāo)簽或軌跡，標(biāo)簽通常從離散標(biāo)簽空間L={αi:i∈N}中提取，αi是互不相同的同時(shí)標(biāo)簽空間N是一系列的正整數(shù)。

每個(gè)目標(biāo)的標(biāo)簽被定義為l=(k,i)，其中k表示目標(biāo)從k時(shí)刻新生，i∈N是為了區(qū)分在同一時(shí)刻其他新生目標(biāo)，因此每個(gè)目標(biāo)的標(biāo)簽是獨(dú)有的并且固定的。在k時(shí)刻新目標(biāo)的標(biāo)簽空間可表示為L(zhǎng)k，同時(shí){k}×N。在k時(shí)刻新生目標(biāo)的狀態(tài)為x∈X×Lk，所有在k時(shí)刻的存活以及新生目標(biāo)的標(biāo)簽空間為L(zhǎng)0:k，迭代表達(dá)形式L0:k=L0:k-1?LK。

和多伯努利隨機(jī)集一樣，標(biāo)簽多伯努利隨機(jī)集也可以用參數(shù)集表示為{(r(ζ),p(ζ)):ζ∈Ψ}，Ψ是標(biāo)簽索引集合。當(dāng)一個(gè)伯努利分量(r(ζ),p(ζ))返回非空集合時(shí)，則會(huì)把標(biāo)簽α(ζ)附加到狀態(tài)集中。

方便起見，標(biāo)簽多伯努利隨機(jī)有限集（labelled multi-Bernoulli random finite sets，LMBRFS）的密度簡(jiǎn)寫為π={r(l),p(l)}l∈L，更緊湊的形式為：

1.3 廣義標(biāo)簽多伯努利隨機(jī)集

廣義標(biāo)簽多伯努利隨機(jī)集（generalized labelled multi-Bernoulli，GLMB）的分布是由一個(gè)在狀態(tài)空間X以及離散標(biāo)簽空間L的標(biāo)簽多伯努利隨機(jī)集根據(jù)以下公式產(chǎn)生的：

其中，C代表離散索引集合，權(quán)重ω(c)(L)和空間分布p(c)滿足歸一化條件：

標(biāo)簽多伯努利是廣義多伯努利的特例：

由于貝葉斯多目標(biāo)濾波器更新過程中數(shù)據(jù)關(guān)聯(lián)的不確定性，在GLMB 中迭代標(biāo)簽時(shí)標(biāo)簽索引集合將會(huì)有多種假設(shè)進(jìn)行向后的迭代，涉及到不同的軌跡標(biāo)簽集合。

1.4 δ 廣義標(biāo)簽多伯努利隨機(jī)集

δ廣義標(biāo)簽多伯努利隨機(jī)集（δ-generalized labelled multi-Bernoulli，δ-GLMB）是在狀態(tài)空間X以及標(biāo)簽空間L的GLMB的一種特例：

其中，Ξ是一個(gè)離散空間，ξ為空間里的具體狀態(tài)，I代表所有軌跡標(biāo)簽的一個(gè)集合。在目標(biāo)跟蹤的實(shí)際應(yīng)用中，離散空間Ξ通常為軌跡與量測(cè)關(guān)聯(lián)的歷史記錄。因此，δ-GLMB RFS 是GLMB RFS 的一個(gè)特例，在目標(biāo)跟蹤應(yīng)用中，δ-GLMB RFS的索引空間具有特殊結(jié)構(gòu)。δ-GLMB RFS的密度函數(shù)表示為：

勢(shì)分布為：

2 標(biāo)簽多伯努利濾波算法流程

標(biāo)簽多伯努利濾波器是完全后驗(yàn)遞歸的近似，算法流程如圖1所示。

圖1 LMB濾波器流程圖Fig. 1 LMB filter flow chart

LMB 是可以直接將所有量測(cè)更新的，但是這會(huì)造成不必要的計(jì)算并且造成計(jì)算資源的浪費(fèi)，因此需要加入Gating 和Grouping 步驟，此步驟把在參數(shù)空間內(nèi)距離目標(biāo)比較近的量測(cè)進(jìn)行分割與歸類，在目標(biāo)進(jìn)行量測(cè)更新時(shí)，只與一定范圍內(nèi)的量測(cè)進(jìn)行比較更新，以此可以顯著減少計(jì)算資源的浪費(fèi)，同時(shí)可以進(jìn)行并行計(jì)算，加快算法運(yùn)算速度。

2.1 預(yù)測(cè)

假設(shè)后驗(yàn)分布是具有狀態(tài)空間X和有限標(biāo)簽空間L的LMB分布，表示為：

在獲取下一次測(cè)量前的預(yù)測(cè)遵循狀態(tài)空間為X，有限標(biāo)簽空間為L(zhǎng)+=L?B的LMB分布：

該式中第一個(gè)集合表示的是上一時(shí)刻存活軌跡的LMB RFS，第二個(gè)集合表示為新生的LMB 分量，在LMB中該分量需要事先設(shè)定先驗(yàn)分布。對(duì)于存活軌跡，預(yù)測(cè)的標(biāo)簽與上一時(shí)刻的標(biāo)簽相同，并且預(yù)測(cè)的存在概率和空間分布是由存活概率和轉(zhuǎn)移密度計(jì)算加權(quán)推出。對(duì)于新出生的軌跡，l∈B是新的與存活軌跡不同的標(biāo)簽。

2.2 Gating和Grouping

在給出了LMB 的預(yù)測(cè)后，可以直接將所有的量測(cè)進(jìn)行δ-GLMB的更新，獲得與預(yù)測(cè)似然最高的一個(gè)量測(cè)值并進(jìn)行更新。但正如前文所述，利用空間信息更有效地對(duì)目標(biāo)和量測(cè)進(jìn)行分組，可以實(shí)現(xiàn)每一組的更新并行進(jìn)行。Gating 和Grouping 策略在不減少準(zhǔn)確度的情況下大大減少了算法時(shí)間復(fù)雜度。分組后，預(yù)測(cè)之后的LMB 參數(shù)集可以劃分為相互獨(dú)立的子集。可以表示為，是標(biāo)簽集合L+=L?B的分割子集，即：

其中，當(dāng)n≠m時(shí)Z(n)?Z(m)=?，Z(0)集合表示的集合為沒有被分配給任何目標(biāo)的量測(cè)集合，Z(n)集合則是與目標(biāo)相對(duì)應(yīng)的集合關(guān)聯(lián)上的量測(cè)集合。

因此對(duì)于每一個(gè)標(biāo)簽伯努利分量，任何落在分量預(yù)測(cè)的距離閾值內(nèi)閾值相關(guān)的量測(cè)則可表示為：

當(dāng)集合之間都沒有相同的量測(cè)時(shí)，融合分類算法完成。最后一共分成了N個(gè)關(guān)于軌跡的集合g(1),g(2),…,g(N)，每個(gè)集合中包含與之相關(guān)聯(lián)的量測(cè)。因此可以得出，多目標(biāo)預(yù)測(cè)之后的概率密度為：

2.3 并行更新

（1）對(duì)于每一個(gè)分組來說預(yù)測(cè)之后的密度形式都為L(zhǎng)MB，在更新前需要先把LMB 形式轉(zhuǎn)換為δ-GLMB，對(duì)于包含所對(duì)應(yīng)的目標(biāo)標(biāo)簽以及量測(cè)G(i)=的第i個(gè)分組，δ-GLMB 形式可轉(zhuǎn)換為：

（2）對(duì)于每一個(gè)分組i，δ-GLMB更新如下式所示：

式中，ΘI+表示索引空間，即包含θ：I+→{0,1,…,|Z(i)|}，意味著當(dāng)θ(l)=θ(l′)＞0時(shí)，l=l′。

（3）將更新后得到的δ-GLMB 轉(zhuǎn)化為L(zhǎng)MB，對(duì)于第i個(gè)分組，LMB 形式可表示為：

最終得出的目標(biāo)狀態(tài)的后驗(yàn)概率密度分布為：

2.4 軌跡剪枝與狀態(tài)提取

在得出LMB 形式的目標(biāo)狀態(tài)后，當(dāng)軌跡的存在概率小于事先設(shè)定的閾值時(shí)，該軌跡則被刪除，當(dāng)軌跡的存在概率大于設(shè)定的閾值時(shí)，則提?。?/p>

式中：

閾值?設(shè)定過高時(shí)，會(huì)減少因?yàn)殡s波而誤估計(jì)的軌跡，但這將同時(shí)造成新生軌跡的延遲出現(xiàn)。

當(dāng)閾值?設(shè)定過低時(shí)，新生目標(biāo)則會(huì)立即被估計(jì)出軌跡，但代價(jià)是會(huì)估計(jì)出大量的雜波軌跡。

3 特征提取與相似度比較

如何減少背景的干擾，提取具有很高區(qū)分度的視頻目標(biāo)特征，并同時(shí)保持較低的時(shí)間復(fù)雜度一直是學(xué)術(shù)界研究的重要課題。本文引入文獻(xiàn)[22]中的特征提取方式，能保持較高的區(qū)分度，同時(shí)采用了矩陣學(xué)習(xí)來降低目標(biāo)特征維度。該方法主要分為L(zhǎng)OMO（look more than once）提取目標(biāo)特征和XQDA（crossview quadratic discriminant analysis）矩陣學(xué)習(xí)降維兩大部分。

3.1 LOMO提取目標(biāo)特征

3.1.1 處理光照變化

對(duì)于描述一張人物圖片來說，顏色是一個(gè)很重要的特征，然而在實(shí)際工程中，由于攝像頭所在場(chǎng)景光照分布不均勻，會(huì)導(dǎo)致同一個(gè)人在同一個(gè)視頻中的特征有相當(dāng)大的特征區(qū)別，如圖2所示。

圖2 不同角度人物特征區(qū)別Fig. 2 Differences in character characteristics from different angles

本文采用了Retinex 算法[23-24]預(yù)處理檢測(cè)圖片，Retinex 算法的基本理論為：物體的顏色是由物體對(duì)長(zhǎng)波（紅色）、中波（綠色）、短波（藍(lán)色）的反射能力決定的，并不是通過反射光強(qiáng)度絕對(duì)值來決定的，從而可以得出物體的色彩不受光照的影響，具有一致性。Retinex 算法具有色感一致性、顏色恒常性。不同于一些只能對(duì)圖像的某一類特征進(jìn)行增強(qiáng)的算法，Retinex算法可以在邊緣增強(qiáng)、動(dòng)態(tài)范圍壓縮以及顏色恒常三方面進(jìn)行優(yōu)化和均衡，因此可以用于不同類型圖像的增強(qiáng)。經(jīng)過增強(qiáng)的圖片如圖3所示。

圖3 圖像增強(qiáng)后的對(duì)比Fig. 3 Contrast after image enhancement

3.1.2 形態(tài)變化處理

同一個(gè)行人在一個(gè)視頻中，隨著時(shí)間的變化，會(huì)導(dǎo)致人的變大縮小，或者當(dāng)一個(gè)行人一開始是向前走，但經(jīng)過拐彎后開始側(cè)著走，都會(huì)導(dǎo)致人的形態(tài)發(fā)生較大變化，進(jìn)而導(dǎo)致圖像特征發(fā)生較大的變化。

本文提出的處理方法為用滑動(dòng)窗口來描述一個(gè)目標(biāo)的局部細(xì)節(jié)。如一張128×48 大小的行人圖片，可以定義一個(gè)10×10 的窗口，用5 個(gè)像素的滑動(dòng)間距遍歷整張圖片。對(duì)于每一次遍歷，提取兩個(gè)尺度的SILTP 直方圖（和）和一個(gè)8×8×8的顏色模型（hue，saturation，value，HSV）直方圖。遍歷一張圖片的同一水平位置，并且最大化這些滑動(dòng)窗口計(jì)算各部分的值。最后得到的直方圖能夠?qū)θ梭w在形態(tài)上的變化有一定的不變性，進(jìn)而捕捉到人局部區(qū)域的細(xì)節(jié)特征。圖4為L(zhǎng)OMO特征提取方法。

圖4 人物特征提取方法Fig. 4 Character feature extraction method

為了進(jìn)一步提取多尺度的圖片信息，算法對(duì)圖片進(jìn)行了三層金字塔的特征表示，即對(duì)128×48 的圖片進(jìn)行3 次2×2 的平均池化得到3 個(gè)不同尺度的特征圖，最后對(duì)每一個(gè)特征圖進(jìn)行特征提取，并將所有的特征向量拼接成一個(gè)向量，該向量有(8×8×8+34×2)×(24+11+5)=26 960 個(gè)維度。最后用log 函數(shù)減弱數(shù)值差異較大所帶來的影響，同時(shí)對(duì)HSV 和SILTP 特征進(jìn)行歸一化。提出算法只用了HSV 以及SILTP特征，時(shí)間復(fù)雜度較低。

3.1.3 特征相似度比較

假設(shè)同一個(gè)目標(biāo)特征之間的差別為Δ=xi-xj（ifyi=yj），記作ΩI，不同目標(biāo)特征之間的差別為Δ=xi-xj（ifyi≠yj），記作ΩE，因此，可將識(shí)別某一張人物圖片是否屬于同一個(gè)人的問題轉(zhuǎn)化為二分類問題，即用QDA 模型對(duì)ΩI和ΩE進(jìn)行二分類。文獻(xiàn)[13]則用對(duì)數(shù)似然比來計(jì)算兩個(gè)高斯分布之間的差異，將之用在了Re-Id中。

Bayesian face 和KISSME 算法如下所示，在零均值的高斯分布下，ΩI和ΩE的差異Δ的似然被定義為：

其中，ΣI和ΣE為ΩI和ΩE的協(xié)方差矩陣，在下文中，nI和nE分別表示在這兩個(gè)類別中樣本的個(gè)數(shù)。基于貝葉斯規(guī)則和對(duì)數(shù)似然比，差異化函數(shù)被定義為：

最終兩個(gè)特征xi和xj之間的距離可表示為：

3.2 XQDA矩陣學(xué)習(xí)降維

一般來說，人物圖片經(jīng)過特征提取后的向量維度d很大，需要對(duì)其進(jìn)行降維獲得一個(gè)低維度的向量空間Rr(r＜d)，提高分類的準(zhǔn)確性和算法效率，文獻(xiàn)[25]分別對(duì)ΣI和ΣE進(jìn)行了矩陣分解來降低維度。文獻(xiàn)[13]則用主成分分析（principal component analysis，PCA）進(jìn)行降維，矩陣ΣI和ΣE在PCA子空間上求近似。然而，這兩種方法在降維時(shí)沒有考慮距離矩陣的學(xué)習(xí)，因此都不是最佳方式。

提出算法中，將用度量學(xué)習(xí)來對(duì)Bayesianface 和KISSME 算法進(jìn)行優(yōu)化。算法將用Re-Id數(shù)據(jù)集訓(xùn)練出子空間W=(w1,w2,…,wr)∈Rd×r，同時(shí)訓(xùn)練出距離度量方程用來計(jì)算在維度r上兩個(gè)樣本之間的相似度。假設(shè)有訓(xùn)練集{X,Z}，其中X=(x1,x2,…,xn)∈Rd×n，包含在同一個(gè)視野中的n個(gè)維度為d的樣本，Z=(z1,z2,…,zm)∈Rd×m，包含其他視野角度的m個(gè)維度為d的樣本，在同一個(gè)場(chǎng)景中，Z和X是相等的。

在維度為r的子空間W中，距離方程可表示為：

由于ΩI和ΩE是零均值的，給定一個(gè)投影方程w，投影過后的樣本依然是零均值的，但有不一樣的方差。由于兩類樣本為零均值，不能用線性判別分析（latent Dirichlet allocation，LDA）進(jìn)行優(yōu)化，但是由于方差的不同，依然可以用方差σI、σE對(duì)兩類樣本進(jìn)行分類。因此，需要優(yōu)化投影方向w，從而使σE(w)/σI(w)最大化，需要注意的是，σE(w)=wTΣEw，σI(w)=wTΣIw，因此σE(w)/σI(w)可表示為：

J(w)的最大值等價(jià)于：

4 標(biāo)簽多伯努利視頻多目標(biāo)跟蹤算法

本文通過標(biāo)簽多伯努利、新的數(shù)據(jù)驅(qū)動(dòng)新生模型和目標(biāo)重識(shí)別方法，減少了碎片軌跡、標(biāo)簽切換問題，目標(biāo)被遮擋后無法繼續(xù)跟蹤的情況也有所減少，算法流程如圖5所示。

圖5 視頻多目標(biāo)跟蹤流程圖Fig. 5 Flow chart of video multi-target tracking

4.1 運(yùn)動(dòng)模型

在標(biāo)簽多伯努利中，需要運(yùn)動(dòng)模型用來估計(jì)k時(shí)刻軌跡的狀態(tài)。算法中設(shè)置目標(biāo)的運(yùn)動(dòng)模型為隨機(jī)游走模型，目標(biāo)i運(yùn)動(dòng)狀態(tài)表示為mi=(x,y,w,h,x˙,y˙,w˙,h˙)，目標(biāo)的特征可表示為ai，標(biāo)簽為?，其中，x和y表示軌跡目標(biāo)框左上角坐標(biāo)，w表示目標(biāo)框?qū)挾?，h表示目標(biāo)框高度，x˙和y˙表示目標(biāo)框左上角坐標(biāo)在x方向、y方向上的變化率，w˙和h˙表示目標(biāo)框?qū)挾纫约案叨鹊淖兓省?/p>

4.2 新生目標(biāo)識(shí)別及目標(biāo)重識(shí)別

在獲得視頻每一幀對(duì)應(yīng)的檢測(cè)框后，需要對(duì)新生目標(biāo)進(jìn)行識(shí)別，在傳統(tǒng)的標(biāo)簽多伯努利或其他伯努利方法下，檢驗(yàn)新生目標(biāo)需要先驗(yàn)知識(shí)，即在目標(biāo)可能出現(xiàn)的區(qū)域設(shè)定新生模型。由于新生目標(biāo)會(huì)在接下來的時(shí)間內(nèi)持續(xù)產(chǎn)生檢測(cè)，進(jìn)而目標(biāo)的后驗(yàn)概率密度增加，從而識(shí)別出新生目標(biāo)。

為了解決傳統(tǒng)新生目標(biāo)檢測(cè)有延遲的問題，本文提出了量測(cè)驅(qū)動(dòng)的新生目標(biāo)檢測(cè)算法，同時(shí)將目標(biāo)檢測(cè)置信度融入到算法中，置信度高的存在概率越大，從而一定程度上能減少雜波對(duì)算法精度帶來的影響。

4.2.1 新生目標(biāo)識(shí)別

需要注意的是，當(dāng)k=1 時(shí)，還未出現(xiàn)軌跡，算法將所有的檢測(cè)都加入軌跡。

4.2.2 目標(biāo)重識(shí)別

新生目標(biāo)識(shí)別后需要對(duì)新生目標(biāo)進(jìn)行標(biāo)簽分類，進(jìn)而盡量減少標(biāo)簽跳變數(shù)，標(biāo)簽多伯努利只能減少目標(biāo)軌跡在運(yùn)動(dòng)時(shí)的標(biāo)簽跳變數(shù)。本文提出特征池思想，通過將新生目標(biāo)特征與特征池里的歷史特征進(jìn)行特征比較，將相似度較高的歷史特征所對(duì)應(yīng)的標(biāo)簽賦值給新生標(biāo)簽多伯努利分量。

其中，Σ-1為XQDA 矩陣學(xué)習(xí)出的正交矩陣，同時(shí)對(duì)f和p進(jìn)行了降維，得出相似度矩陣S：

新生目標(biāo)所對(duì)應(yīng)的標(biāo)簽數(shù)即為相似度矩陣S中每行最小值所對(duì)應(yīng)的標(biāo)簽。

4.3 標(biāo)簽多伯努利濾波

提出算法中采用高斯混合來對(duì)標(biāo)簽多伯努利濾波進(jìn)行閉合求解。

標(biāo)簽多伯努利隨機(jī)集是由多個(gè)標(biāo)簽伯努利隨機(jī)集組成的，表示為：

識(shí)別出新生目標(biāo)之后，需要對(duì)新生目標(biāo)狀態(tài)初始化，即用標(biāo)簽多伯努利對(duì)新生目標(biāo)進(jìn)行建模：

標(biāo)簽多伯努利濾波更新、預(yù)測(cè)、狀態(tài)提取等過程與多伯努利濾波過程類似，并且在新生時(shí)確定目標(biāo)標(biāo)簽后，目標(biāo)的預(yù)測(cè)與更新是不會(huì)改變目標(biāo)標(biāo)簽狀態(tài)的。

4.3.1 標(biāo)簽多伯努利預(yù)測(cè)

標(biāo)簽多伯努利的預(yù)測(cè)可表示為：

式中，LMBM表示標(biāo)簽多伯努利參數(shù)集，δx為狄拉克函數(shù)。LMBMk|k(xk)表示在k時(shí)刻標(biāo)簽多伯努利狀態(tài)密度表示，后驗(yàn)概率參數(shù)可表示為：

式中，hk表示為標(biāo)簽多伯努利所對(duì)應(yīng)的假設(shè)序號(hào)，Hk為總假設(shè)個(gè)數(shù)。

LMBMk+1|k(xk)表示預(yù)測(cè)后的先驗(yàn)標(biāo)簽多伯努利狀態(tài)密度集合，表示為：

式中，i′為k時(shí)刻表示后驗(yàn)密度的伯努利分量標(biāo)號(hào)，i″表示k時(shí)刻根據(jù)新生模型新生的伯努利分量標(biāo)號(hào)，對(duì)于每一個(gè)伯努利，預(yù)測(cè)過后依然為伯努利：

假設(shè)存活概率為常數(shù)，表示為：

當(dāng)用高斯混合對(duì)式子進(jìn)行求解時(shí)，運(yùn)動(dòng)方程的狀態(tài)轉(zhuǎn)移分布表示為：

預(yù)測(cè)后的參數(shù)為：

4.3.2 標(biāo)簽多伯努利更新

標(biāo)簽多伯努利的更新可表示為：

在進(jìn)行標(biāo)簽多伯努利更新前首先要進(jìn)行Gating和Grouping操作，將量測(cè)進(jìn)行分類，讓預(yù)測(cè)后的目標(biāo)與之距離較近的量測(cè)進(jìn)行更新，此操作不僅能夠極大減少算法時(shí)間復(fù)雜度，在準(zhǔn)確率上也會(huì)因?yàn)闇p少不相關(guān)量測(cè)的干擾而提高。

預(yù)測(cè)后得到的多伯努利參數(shù)為：

多伯努利的更新是基于目標(biāo)與Gating 和Grouping之后的檢測(cè)進(jìn)行更新運(yùn)算，計(jì)算出狀態(tài)以及權(quán)重，再根據(jù)權(quán)重篩選出最優(yōu)的假設(shè)，更新算法流程為：

計(jì)算多伯努利的后驗(yàn)概率密度參數(shù)

對(duì)于計(jì)算代價(jià)矩陣，假設(shè)有m個(gè)量測(cè)，一個(gè)多伯努利集合h有Nh個(gè)伯努利分量，則對(duì)應(yīng)的代價(jià)矩陣為：

算出代價(jià)矩陣后，用Murty算法計(jì)算出檢測(cè)與目標(biāo)最匹配的假設(shè)。

多伯努利更新后得到的參數(shù)為：

假設(shè)目標(biāo)i與檢測(cè)j相關(guān)聯(lián)，即θi=j，則對(duì)于該假設(shè)參數(shù)更新為：

對(duì)于沒有檢測(cè)與之關(guān)聯(lián)的假設(shè)，即θi=0，則第i個(gè)伯努利更新為：

用高斯混合對(duì)以上式子求解：

4.3.3 標(biāo)簽多伯努利狀態(tài)提取

經(jīng)過多伯努利更新，得到標(biāo)簽多伯努利參數(shù)集：

4.4 特征提取及特征池

4.4.1 特征選取

在標(biāo)簽多伯努利更新結(jié)束后，可以得到每個(gè)目標(biāo)的目標(biāo)位置參數(shù)(x,y,w,h,l)，在更新后對(duì)θi進(jìn)行判斷，如果θi=0，則表明在該幀沒有檢測(cè)與之匹配，為了防止該目標(biāo)被遮擋導(dǎo)致的模板污染，此時(shí)，不對(duì)該目標(biāo)進(jìn)行特征提取，即：

4.4.2 特征池

建立特征池，大小設(shè)為tp=tnum×T，T代表第一幀中新生目標(biāo)的數(shù)目，tnum為自定義大小。構(gòu)建大小為tp=NUM×T的隊(duì)列（即先進(jìn)先出模式）。

考慮到目標(biāo)被遮擋后會(huì)導(dǎo)致目標(biāo)特征提取不正確的問題，本文僅僅將高置信度檢測(cè)框所對(duì)應(yīng)的圖像特征以及對(duì)應(yīng)匹配上的ID放入特征池中。

在目標(biāo)進(jìn)行特征提取之后，包含標(biāo)簽信息的特征加入特征池，以便在目標(biāo)重識(shí)別時(shí)對(duì)標(biāo)簽進(jìn)行判別，是否為之前的目標(biāo)P={p1,p2,…}。

5 實(shí)驗(yàn)結(jié)果與分析

為了驗(yàn)證提出算法的有效性，在公開數(shù)據(jù)集MOT17 上與類似算法Sort[26]、GMPHD_RD、IOU17[27]、PHD_LMP[25]進(jìn)行對(duì)比實(shí)驗(yàn)。

5.1 數(shù)據(jù)集及評(píng)價(jià)算法

5.1.1 數(shù)據(jù)集

MOT17[28]中，采用了三種不同的檢測(cè)器FRCNN（faster region-based convolutional neural network）、DPM（deformable part model）、SDP（scale-dependent pooling），本文算法將三種檢測(cè)器的檢測(cè)結(jié)果帶入到提出的跟蹤算法中，驗(yàn)證提出算法的有效性。

不同檢測(cè)器有不同的檢測(cè)精度與檢測(cè)特性。FRCNN 與SDP 檢測(cè)器的檢測(cè)精度較高，同時(shí)在實(shí)際跟蹤過程中，可能會(huì)產(chǎn)生較多的雜波或碎片跟蹤軌跡。DPM 檢測(cè)器雖然召回率較高，然而會(huì)產(chǎn)生較多虛假檢測(cè)。表1為數(shù)據(jù)集中每個(gè)視頻人群特點(diǎn)。

表1 場(chǎng)景序列Table 1 Scene sequence

可以看出，序列05、10、11、13 中攝像機(jī)是移動(dòng)的，序列02亮度較暗，在數(shù)據(jù)集中對(duì)目標(biāo)遮擋的處理以及交叉運(yùn)動(dòng)的處理對(duì)結(jié)果的影響較大。

5.1.2 評(píng)價(jià)算法

本文算法所使用的評(píng)價(jià)指標(biāo)為MOT17公共數(shù)據(jù)集評(píng)價(jià)算法，評(píng)價(jià)指標(biāo)分別為：多目標(biāo)跟蹤正確度（multiple object tracking accuracy，MOTA）、多目標(biāo)跟蹤精度（multiple object tracking precision，MOTP）、誤跟數(shù)（false positive，F(xiàn)P）、漏跟數(shù)（false negative，F(xiàn)N）和標(biāo)簽跳變數(shù)（ID switch，IDS）。

5.2 實(shí)驗(yàn)環(huán)境及參數(shù)

（1）實(shí)驗(yàn)環(huán)境

處理器：Intel Core i7-8700 3.2 GHz

內(nèi)存：16 GB

顯卡：NVIDIA GeForce GTX 1080 Ti

軟件：Matlab R2019b

（2）實(shí)驗(yàn)參數(shù)

目標(biāo)狀態(tài)：(x,y,w,h,x˙,y˙,w˙,h˙,l)

量測(cè)：(x,y,w,h)

5.3 實(shí)驗(yàn)結(jié)果的定性分析

5.3.1 目標(biāo)緊鄰、遮擋

在MOT17-09視頻數(shù)據(jù)集中，商店門口有較為復(fù)雜的行人交叉走動(dòng)的情況，在Sort、GMPHD_RD、IOU17、PHD_LMP等跟蹤算法中，當(dāng)兩個(gè)目標(biāo)交叉運(yùn)動(dòng)時(shí)，跟蹤器不能很好地跟蹤上被遮擋的目標(biāo)。而提出算法中，利用標(biāo)簽多伯努利的預(yù)測(cè)，即使在短時(shí)間內(nèi)沒有目標(biāo)的檢測(cè)，也能很好地維持目標(biāo)軌跡，如圖6所示，所在幀為405、409、412、417、420、424。

圖6 MOT17-09數(shù)據(jù)集目標(biāo)被遮擋實(shí)驗(yàn)結(jié)果Fig. 6 Experimental results of target occlusion of MOT17-09 dataset

從實(shí)驗(yàn)結(jié)果可以看出，提出算法在處理行人被遮擋后，仍然可以根據(jù)標(biāo)簽多伯努利預(yù)測(cè)維持目標(biāo)軌跡，同時(shí)在目標(biāo)移動(dòng)過程中維持標(biāo)簽的不變性。在目標(biāo)重新出現(xiàn)后，其他對(duì)比算法雖能再次識(shí)別目標(biāo)，但其標(biāo)簽發(fā)生了跳變，被當(dāng)成了新生目標(biāo)。

視頻數(shù)據(jù)集MOT17-10的場(chǎng)景為夜晚，由于攝像頭拍攝不固定，會(huì)導(dǎo)致場(chǎng)景灰暗以及目標(biāo)模糊的狀態(tài)。與MOT17-09 數(shù)據(jù)集相比，不僅人數(shù)較多，而且較為密集，存在很多由于行人交叉運(yùn)動(dòng)而導(dǎo)致的目標(biāo)遮擋問題。由于采用了Gating和Grouping，算法依然有很好的穩(wěn)定性。實(shí)驗(yàn)對(duì)應(yīng)的視頻數(shù)據(jù)集MOT17-10的幀數(shù)為227、235、245、252、258，如圖7所示。

圖7 昏暗模糊場(chǎng)景下目標(biāo)被遮擋Fig. 7 Target occlusion in dim blurred scene

從實(shí)驗(yàn)結(jié)果圖7 中可以看出，當(dāng)標(biāo)簽為77 的目標(biāo)走來時(shí)，可以在遮擋的情況下維持標(biāo)簽不變，同時(shí)能準(zhǔn)確估計(jì)出目標(biāo)狀態(tài)，而其他對(duì)比算法在目標(biāo)被遮擋的情況下難以較好地跟蹤目標(biāo)。

5.3.2 標(biāo)簽維持

視頻數(shù)據(jù)集MOT17-04 為夜晚燈光人群密集的場(chǎng)景，在多目標(biāo)跟蹤中，如何保持標(biāo)簽長(zhǎng)時(shí)間以及長(zhǎng)距離不變是研究的難點(diǎn)。在人群密集時(shí)，當(dāng)目標(biāo)與另一個(gè)或幾個(gè)目標(biāo)緊鄰時(shí)，會(huì)出現(xiàn)標(biāo)簽切換。在提出算法中，目標(biāo)的標(biāo)簽是在目標(biāo)新生時(shí)分配的，算法迭代運(yùn)行過程中，會(huì)根據(jù)目標(biāo)歷史狀態(tài)賦予目標(biāo)標(biāo)簽，即使有多個(gè)目標(biāo)相鄰運(yùn)動(dòng)，考慮到每個(gè)目標(biāo)的速度大小以及速度方向，在復(fù)雜的場(chǎng)景中仍然能夠維持目標(biāo)軌跡以及標(biāo)簽狀態(tài)。

圖8 為各算法在MOT17-04 視頻數(shù)據(jù)集的179、204、214、222、266、314幀中所得的跟蹤結(jié)果，在提出的算法中，標(biāo)簽為21的目標(biāo)在179到314幀中一直維持自己的標(biāo)簽狀態(tài)以及目標(biāo)狀態(tài)，而在其他算法中，目標(biāo)不僅出現(xiàn)了跟丟時(shí)刻，同時(shí)出現(xiàn)了多次標(biāo)簽變換。

圖8 昏暗模糊場(chǎng)景下密集人群下的目標(biāo)軌跡維護(hù)Fig. 8 Target trajectory maintenance under dense crowd in dim and blurred scene

5.3.3 低分辨率漏跟

與其余1 920×1 080 數(shù)據(jù)集不同，視頻數(shù)據(jù)集MOT17-05 的分辨率為640×480，同時(shí)該視頻數(shù)據(jù)集為移動(dòng)攝像頭拍攝的，在跟蹤過程中常有目標(biāo)被漏跟蹤的情況。

圖9 為算法在MOT17-05 數(shù)據(jù)集306、309、310、311、312 幀的跟蹤結(jié)果，在提出的算法結(jié)果中，由于標(biāo)簽多伯努利在更新的過程中會(huì)考慮到目標(biāo)是否漏檢測(cè)的情況，當(dāng)目標(biāo)在之前的歷史幀中維持了較長(zhǎng)的軌跡，存在概率較大，當(dāng)目標(biāo)在之后的幀數(shù)中即使丟失檢測(cè)，也能夠在一定時(shí)間內(nèi)持續(xù)跟蹤目標(biāo)，當(dāng)某一時(shí)刻又重新獲得檢測(cè)時(shí)，存在概率較高未剪掉的軌跡重新與檢測(cè)關(guān)聯(lián)，從而解決了目標(biāo)漏跟問題。

圖9 算法對(duì)漏跟情況的處理Fig. 9 Algorithm processing for missing track

提出的算法中，標(biāo)簽為55 的目標(biāo)在這一時(shí)間段中持續(xù)被跟蹤上。在其他算法中，該目標(biāo)處于漏跟狀態(tài)。

5.3.4 處理誤檢測(cè)

公共檢測(cè)器FRCNN、SDP、DPM中，DPM檢測(cè)器性能最差，在檢測(cè)結(jié)果中經(jīng)常有誤檢測(cè)框，即在沒有目標(biāo)的地方檢測(cè)出有目標(biāo)，誤檢測(cè)框并不是在每一幀中都存在，同時(shí)誤檢測(cè)框的狀態(tài)也是非常不穩(wěn)定的。在標(biāo)簽多伯努利中，本文算法對(duì)誤檢測(cè)框進(jìn)行了雜波的泊松分布建模，由于誤檢測(cè)框的不穩(wěn)定性，在預(yù)測(cè)以及更新的過程中，在算法中不會(huì)將是雜波的檢測(cè)框當(dāng)作檢測(cè)，進(jìn)而避免目標(biāo)誤跟蹤。

圖10 為數(shù)據(jù)集MOT17-02 在DPM 檢測(cè)器下第46、49、56、61、67、77幀的跟蹤結(jié)果?？梢钥闯?，在提出的算法中，很好地解決了誤跟蹤框的情況，而在其他對(duì)比算法中，由于誤檢測(cè)跟蹤結(jié)果中出現(xiàn)了較多的跟蹤錯(cuò)誤。

圖10 算法對(duì)誤檢測(cè)的處理Fig. 10 Algorithm processing for error detection

5.4 實(shí)驗(yàn)結(jié)果的定量分析

5.4.1 未使用特征的方法

表2 給出了提出算法和對(duì)比算法在MOTA、FP、FN、IDs、MOTP 指標(biāo)上統(tǒng)計(jì)結(jié)果。本文的跟蹤結(jié)果都是基于3個(gè)公共檢測(cè)器DPM、FRCNN、SDP的檢測(cè)結(jié)果來跟蹤的。

表2 MOT17訓(xùn)練集上未使用特征的方法比較Table 2 Comparison of methods on MOT17 training set without feature

從表2 中可以看出，提出算法在MOT17 訓(xùn)練集上與沒有使用圖像特征的算法進(jìn)行比較，取得了較好的效果。與Sort相比，MOTA提高了4.1，效果提升了9.2%；與IOU17相比，MOTA提高了4.2，效果提升了9.3%。

本文在沒有用圖像特征信息的情況下使用了標(biāo)簽多伯努利算法來估計(jì)和更新目標(biāo)的位置信息，在攝像機(jī)位置固定的情況下可以較好地處理目標(biāo)被遮擋的情況。從表2中可以看出，提出算法的FN（漏跟蹤目標(biāo)數(shù)）指標(biāo)相比其他算法降低很多，相比Sort 算法降低了9.3%，相比IOU17 算法降低了6.7%。與此同時(shí)，存在概率較大也會(huì)帶來反作用，使得FP 增加，因?yàn)楫?dāng)存活目標(biāo)消失的時(shí)候，依然會(huì)有較高的存在概率，算法會(huì)認(rèn)為該目標(biāo)可能還存在，導(dǎo)致誤跟目標(biāo)數(shù)的增加，也間接導(dǎo)致了IDs的增加。由于目標(biāo)被誤跟，被誤跟的目標(biāo)也會(huì)分配給額外的標(biāo)簽，導(dǎo)致IDs的增長(zhǎng)。

5.4.2 MOT17濾波方法比較

表3 為提出算法與其他運(yùn)用濾波方法的算法比較，本文算法在IDs 也減少了許多，相比其他對(duì)比算法，提出算法有著更好的表現(xiàn)。雖然本文算法在FP與FN的指標(biāo)上沒有提升，但是相較于對(duì)比算法達(dá)到了一個(gè)相對(duì)平衡的狀態(tài)。加入圖像特征后，每一幀都把檢測(cè)與軌跡的歷史特征進(jìn)行相似度比較，將剔除匹配不上檢測(cè)的軌跡，能一定程度上解決目標(biāo)消失之后的誤跟蹤問題，進(jìn)而FP 指標(biāo)有一定程度的下降。由于FP 指標(biāo)的下降，在標(biāo)簽多伯努利預(yù)測(cè)以及更新的過程中將會(huì)防止很多誤檢測(cè)對(duì)算法精確度的影響，F(xiàn)N指標(biāo)也會(huì)隨之下降。IDs的減少有兩方面的原因：一方面是目標(biāo)重識(shí)別的加入，在目標(biāo)標(biāo)簽分配前，先進(jìn)行特征相似度比較，將已出現(xiàn)過的目標(biāo)分配舊標(biāo)簽；另一方面則是由于FN 的減少，標(biāo)簽多伯努利的標(biāo)簽估計(jì)和更新更加精確。

表3 MOT17上濾波方法比較Table 3 Comparison of filtering methods on MOT17 dataset

5.4.3 目標(biāo)數(shù)目變化明顯情況下方法比較

本文算法在數(shù)據(jù)集MOT17-05 上的跟蹤結(jié)果要優(yōu)于其他算法，MOT17-05數(shù)據(jù)集為移動(dòng)相機(jī)在繁忙街道的拍攝，在拍攝時(shí)會(huì)出現(xiàn)人物對(duì)攝像頭進(jìn)行大面積遮擋的情況，會(huì)導(dǎo)致目標(biāo)數(shù)目變化明顯。同時(shí)在上文定性分析中分析了該算法對(duì)于漏跟情況的解決，避免了碎片化軌跡的造成。根據(jù)實(shí)驗(yàn)結(jié)果可以看出，相對(duì)于其他四種方法，提出的算法在MOTA指標(biāo)上有著更好的表現(xiàn)。由于FN、FP、IDs三方面的均衡優(yōu)化，本文算法在MOT17 數(shù)據(jù)集上有著較好的效果，如表4所示。

表4 MOT17-05序列SDP檢測(cè)器各種方法比較Table 4 Comparison of various methods using SDP detector in MOT17-05

5.4.4 人數(shù)密集情況下方法比較

MOT17-04數(shù)據(jù)集為人數(shù)最密集的場(chǎng)景，在檢測(cè)器SDP下各對(duì)比算法的跟蹤結(jié)果如表5所示。FN指標(biāo)有所提高，可能是由于目標(biāo)數(shù)目過多，標(biāo)簽多伯努利總數(shù)很多，導(dǎo)致當(dāng)目標(biāo)消失，目標(biāo)存在概率衰減慢而導(dǎo)致誤檢為目標(biāo)仍然存在，已在上文定性分析中分析了該算法在密集場(chǎng)景下標(biāo)簽維持的能力。

表5 MOT17-04數(shù)據(jù)集SDP檢測(cè)器各種方法比較Table 5 Comparison of various methods using SDP detector in MOT17-04 dataset

5.4.5 算法消融實(shí)驗(yàn)與時(shí)間復(fù)雜度分析

（1）算法消融實(shí)驗(yàn)

消融實(shí)驗(yàn)算法的結(jié)果如表6所示，可以看出：

表6 消融實(shí)驗(yàn)對(duì)比Table 6 Comparison of ablation experiments

Our_1（傳統(tǒng)標(biāo)簽多伯努利新生模型），由于需要在固定位置建立新生模型，在每一時(shí)刻都會(huì)將預(yù)先定義的新生模型伯努利分量加入到算法的更新中，會(huì)極大地增加算法復(fù)雜度。即使真實(shí)新生目標(biāo)在初始幀就出現(xiàn)，當(dāng)所定義的新生標(biāo)簽多伯努利分量距離新生目標(biāo)比較遠(yuǎn)時(shí)，仍不能判定該檢測(cè)為新生目標(biāo)檢測(cè)，進(jìn)而導(dǎo)致FN（漏檢數(shù)）的上升。

Ours_2（將置信度低的檢測(cè)移除），本文低置信度的檢測(cè)框加入到標(biāo)簽多伯努利的算法中進(jìn)行預(yù)測(cè)更新，同時(shí)進(jìn)行消融實(shí)驗(yàn)對(duì)比。由于直接去除了較多的檢測(cè)框，在時(shí)間復(fù)雜度上有較多的提升，但是在檢測(cè)精度上有所下降。

Ours_3（不使用目標(biāo)重識(shí)別），判斷出新的目標(biāo)新生后，會(huì)與最近30幀置信度高的檢測(cè)框進(jìn)行匹配，進(jìn)一步推出該檢測(cè)為哪個(gè)軌跡的檢測(cè)，從而推出標(biāo)簽重識(shí)別。因此在FN、FP指標(biāo)上幾乎毫無變動(dòng)，IDs略微下降。由于加入了特征的提取與匹配，導(dǎo)致了FPS的下降。

（2）復(fù)雜度分析

在目標(biāo)跟蹤算法中，算法運(yùn)行復(fù)雜度很大程度上是由視頻中每一幀的檢測(cè)數(shù)量影響的，在本文中定義平均每幀數(shù)量Avgdet來描述視頻中的檢測(cè)數(shù)量：

式中，Numdet為每個(gè)數(shù)據(jù)集總檢測(cè)數(shù)，Numframe為每個(gè)數(shù)據(jù)集總幀數(shù)。

對(duì)SDP檢測(cè)器的檢測(cè)結(jié)果進(jìn)行算法時(shí)間復(fù)雜度分析，考慮到本文算法是基于模型推理的濾波算法，同時(shí)不需要進(jìn)行訓(xùn)練，在運(yùn)算復(fù)雜度上具有一定的劣勢(shì)。

如表7 所示，當(dāng)人數(shù)較少時(shí)，標(biāo)簽多伯努利所對(duì)應(yīng)的高斯分量就比較少，因此計(jì)算量較少。當(dāng)人數(shù)急劇增加時(shí)，會(huì)導(dǎo)致算法復(fù)雜度的急劇上升，這也是今后科研需要解決的問題。

表7 不同人數(shù)下的時(shí)間復(fù)雜度分析Table 7 Time complexity analysis under different number of persons

5.4.6 算法結(jié)果

表8為提出算法在MOT17數(shù)據(jù)集上采用不同檢測(cè)器的跟蹤結(jié)果，可以看出，提出算法在檢測(cè)效果最差的DPM 到檢測(cè)效果最好的SDP 都有著較好的跟蹤結(jié)果。在相機(jī)固定的場(chǎng)景中和移動(dòng)的復(fù)雜環(huán)境中，都具有較好的跟蹤結(jié)果。

表8 不同視頻中MOT17方法的比較Table 8 Comparison of MOT17 methods in different videos

6 結(jié)論

本文提出了基于標(biāo)簽多伯努利的視頻多目標(biāo)跟蹤方法，在使用公共檢測(cè)器的基礎(chǔ)上，首先采用量測(cè)驅(qū)動(dòng)新生模型的思想，解決傳統(tǒng)標(biāo)簽多伯努利新生模型收斂慢的問題；同時(shí)采用特征池的思想進(jìn)行目標(biāo)重識(shí)別，一定程度上減少了目標(biāo)標(biāo)簽切換次數(shù)，從而使IDs減小。此外，借助于標(biāo)簽多伯努利的預(yù)測(cè)以及更新，可以有效地解決由于檢測(cè)器性能差而導(dǎo)致的目標(biāo)丟失問題，減少了碎片化軌跡。標(biāo)簽多伯努利濾波過程中，根據(jù)目標(biāo)狀態(tài)對(duì)標(biāo)簽進(jìn)行估計(jì)，對(duì)標(biāo)簽（航跡）的維持起到了很大的作用。最后通過實(shí)驗(yàn)驗(yàn)證，提出算法能夠在各種復(fù)雜場(chǎng)景下實(shí)現(xiàn)對(duì)多目標(biāo)較好的跟蹤。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放