亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于SIFT算法的人群密集檢測(cè)應(yīng)用研究

2022-12-08 17:03:12謝光敏向蓓蓓古榮龍

現(xiàn)代計(jì)算機(jī) 2022年19期

郭妍，謝光敏，向蓓蓓，古榮龍，王磊

（四川水利職業(yè)技術(shù)學(xué)院，成都 610039）

0 引言

隨著經(jīng)濟(jì)持續(xù)穩(wěn)定的發(fā)展，生活水平的日益提高，城市公共場(chǎng)所作為經(jīng)濟(jì)文化的主要載體承擔(dān)著各種各樣的活動(dòng)，而隨著人口密度的增大以及人們對(duì)生活質(zhì)量追求的提高，每一次的活動(dòng)都會(huì)伴隨著人群的聚集。近年來，人口聚集的場(chǎng)所突發(fā)事件時(shí)有發(fā)生，每一次的突發(fā)事件不僅造成了人們的恐慌，也伴隨著經(jīng)濟(jì)的損失和一系列的安全問題。其實(shí)大多時(shí)候人群聚集而引發(fā)事故發(fā)生進(jìn)而導(dǎo)致重大的后果并不是事故自身的問題，而是因?yàn)槿巳哼^于密集，事發(fā)時(shí)慌亂擁擠造成的。從目前社會(huì)的整體情況來說，我國(guó)的社會(huì)形勢(shì)已經(jīng)基本保持在一個(gè)穩(wěn)定的狀態(tài)。但在經(jīng)濟(jì)蓬勃發(fā)展的今天，由于人們對(duì)物質(zhì)文化需求的增多，各種人群聚集的活動(dòng)也逐漸增加。而公共場(chǎng)所作為承擔(dān)著各種活動(dòng)的重要載體，突發(fā)事件發(fā)生的可能性也比較大。

2014年的12月31日晚，這本來是一個(gè)令人激動(dòng)的跨年之夜，很多游客市民聚集在上海外灘準(zhǔn)備迎接新年的到來，但因有人失衡摔倒接連誘發(fā)多人摔倒、疊壓，致使擁擠踩踏事件發(fā)生，最終導(dǎo)致36 人遇難，49 人負(fù)傷［1］。因此，為了防止類似事件的發(fā)生，降低其概率，對(duì)人群密集的檢測(cè)是非常有必要的。

1 SIFT算法簡(jiǎn)介

SIFT 算法，即尺度不變特征變換算法，它可以用于檢測(cè)與描述影像局部特征，找到空間尺度上的特征點(diǎn)，并提取其位置、尺度、旋轉(zhuǎn)不變量。辨識(shí)物體可以通過描述與檢測(cè)局部影像特征起到作用［2］。SIFT 特征與圖像的尺寸和旋轉(zhuǎn)無關(guān)，它是基于物體上的一些局部外觀興趣點(diǎn)的，對(duì)光線、噪聲以及些微視角變化也有較高的容忍度。它們因?yàn)橐陨咸卣鞫尸F(xiàn)高度顯著的特點(diǎn)并相對(duì)容易獲得，而且能夠較容易且很少錯(cuò)誤地識(shí)別基數(shù)龐大的特征數(shù)據(jù)庫(kù)中的對(duì)象。

在不同的尺度空間上找到特征點(diǎn)，并獲得其方向是SIFT 算法的實(shí)質(zhì)。它通過高斯模糊來達(dá)到尺度空間的獲取。因此，特征點(diǎn)的提取篩選資源從高斯金字塔產(chǎn)生的差分高斯空間中的局部特征點(diǎn)獲得。

2 方案介紹

2.1 提取人群特征點(diǎn)

提取人群特征點(diǎn)，需要先提取出能較好反映出人物事件的特征，可以成為影響后期人群密集檢測(cè)的重要因素。即待檢測(cè)圖像讀入內(nèi)存并進(jìn)行圖像預(yù)處理之后，進(jìn)行背景差分，提取圖像的人群特征，對(duì)提取后的圖像采用SIFT 算法建立差分金字塔圖像［3］，進(jìn)行極值檢測(cè)。最后通過關(guān)鍵點(diǎn)精確定位生成人群特征點(diǎn)，根據(jù)視頻圖像中人群的特征點(diǎn)數(shù)目判斷人群是否密集。算法流程如圖1所示。

圖1 算法流程圖

2.2 圖像預(yù)處理

通過圖像預(yù)處理去掉原始圖像所夾雜的一些不相干信息，可以提高我們所需的有用信息的可檢測(cè)性且盡可能精簡(jiǎn)數(shù)據(jù)，以此達(dá)到特征提取的目的［3］。目前常見的圖像預(yù)處理技術(shù)包括彩色圖像的灰度化、直方圖均衡化、圖像的二值化處理和形態(tài)學(xué)處理等。

其中圖像灰度化處理［3］是將彩色圖像轉(zhuǎn)化成為灰度圖像。彩色圖像中的每個(gè)像素的顏色是由紅（R）、綠（G）、藍(lán)（B）三個(gè)分量決定，而每個(gè)分量有255個(gè)值（0～255），經(jīng)計(jì)算，一個(gè)像素點(diǎn)約有1600多萬（256*256*256）色。而灰度圖像是紅（R）、綠（G）、藍(lán)（B）特殊的彩色圖像，一個(gè)像素點(diǎn)的取值范圍為0～255。因此，數(shù)字圖像處理中，通常將圖像進(jìn)行灰度化處理以減少計(jì)算量。圖像的灰度化處理過程可用下列公式表示：

其中WR、WG、WB分別為R、G、B 的權(quán)值。研究表明，人眼對(duì)顏色的敏感度由高到低依次為綠、紅、藍(lán)。因此若想取得較好的結(jié)果，取WG＞W(wǎng)R＞W(wǎng)B時(shí)的權(quán)值較合理。

2.3 背景差分

背景差分法［4］又稱背景減法，它的原理是將當(dāng)前幀與背景圖像進(jìn)行差分從而得到運(yùn)動(dòng)目標(biāo)區(qū)域。背景差分法將視頻幀圖像視為兩個(gè)部分，即前景和背景。它最初需要選取一幅圖像當(dāng)作背景，而且這幅圖像中不能含有運(yùn)動(dòng)前景。這種方法能夠更好地識(shí)別和提取目標(biāo)。由于攝像頭和背景的固定性，采用背景差法可以簡(jiǎn)單、快速地提取出前景圖像，即用每一幀圖像減去背景圖像，便可得到我們所需的前景圖像。它可以在背景平穩(wěn)時(shí)達(dá)到良好的檢測(cè)效果，并且視頻中靜止的目標(biāo)也可以被檢測(cè)到。

在不考慮噪聲n(x,y,t)的影響下，可以將運(yùn)動(dòng)目標(biāo)m(x,y,t)與背景圖像b(x,y,t)組成的圖像稱為視頻幀圖像I(x,y,t)：

由式（2）并不能夠得到真正的運(yùn)動(dòng)目標(biāo)，而是由運(yùn)動(dòng)目標(biāo)區(qū)域與噪聲所組成的差分圖像d(x,y,t)，即：

對(duì)其進(jìn)行進(jìn)一步處理后，可得到運(yùn)動(dòng)目標(biāo)：

其中，T代表閾值。樣本圖像和經(jīng)背景差法處理后的圖像分別如圖2和圖3所示。

圖2 樣本圖像

圖3 背景差法處理后的圖像

2.4 建立差分金字塔

SIFT 為獲得連續(xù)變化的尺度，采用高斯金字塔來構(gòu)建尺度空間。尺度空間上的極值點(diǎn)可以在計(jì)算獲得金字塔后被檢測(cè)［5］。尺度規(guī)范的算子（Laplacion of Gaussian）被Tony Lindeberg 說明具備真正的尺度不變性。高斯差分金字塔類似算子被Lowe 用來對(duì)穩(wěn)固的特征點(diǎn)在尺度空間中進(jìn)行檢測(cè)。對(duì)原始圖像進(jìn)行不停降階采樣后會(huì)獲得相應(yīng)的有差別的圖像，將其由大到小、由下至上排列組成塔狀模型，這就是圖像的金字塔模型［6］。通常情況下，金字塔的第一層是原始圖像，金字塔層數(shù)為，每層（一張圖像對(duì)應(yīng)一層）是每次降采樣后獲得的新圖像。圖像的最初尺寸以及塔頂圖像的尺寸一起決定了金字塔的層數(shù)，層數(shù)的計(jì)算公式如下：

其中，原始圖像的尺寸用M,N表示，t為塔頂圖像的最小維數(shù)的對(duì)數(shù)值。

本方案在現(xiàn)實(shí)中進(jìn)行極值檢測(cè)［7］時(shí)，需先建立高斯差分金字塔，其通過用高斯金字塔每組中相鄰的上下兩層圖像作差而產(chǎn)生。經(jīng)過同一組內(nèi)DOG 各相鄰兩層圖像之間的對(duì)比，由DOG 空間的局部極值點(diǎn)組成的關(guān)鍵點(diǎn)可以獲得初步檢測(cè)。本文中DOG 函數(shù)的極值點(diǎn)的檢測(cè)要求每一個(gè)像素點(diǎn)與它全部鄰近的點(diǎn)作對(duì)比，觀察結(jié)果是高于還是低于它的圖像域和尺度域的鄰近點(diǎn)。將中間的檢測(cè)點(diǎn)與具有和其相同尺度的8 個(gè)鄰近點(diǎn)以及與它相鄰尺度中對(duì)應(yīng)的9 × 2個(gè)點(diǎn)進(jìn)行對(duì)比，以確保尺度空間和二維圖像空間中的極值點(diǎn)都可以被檢測(cè)到。

圖4 DOG空間極值檢測(cè)

2.5 生成人群關(guān)鍵點(diǎn)

本文結(jié)合特征點(diǎn)鄰域像素的梯度方向分布特性，指定方向參數(shù)［6］給每個(gè)特征點(diǎn)，以此讓其在圖像發(fā)生改變時(shí)不會(huì)發(fā)生變化。在對(duì)關(guān)鍵點(diǎn)進(jìn)行運(yùn)算后，鄰域內(nèi)像素的梯度和方向通過直方圖來表示。該梯度直方圖以每柱10°的區(qū)間將0～360°的方向范疇平均分成36 個(gè)柱（bins）。如圖5所示，關(guān)鍵點(diǎn)的主方向即直方圖的峰值對(duì)應(yīng)的方向。

圖5 關(guān)鍵點(diǎn)方向直方圖

在獲得關(guān)鍵點(diǎn)鄰域的像素梯度分布特征信息之后便可明確關(guān)鍵點(diǎn)主方向［8］。一個(gè)特征點(diǎn)處鄰域梯度的方向由方向直方圖的峰值代表，該關(guān)鍵點(diǎn)的主方向即是圖中最大值對(duì)應(yīng)的方向。本文將該關(guān)鍵點(diǎn)的輔方向定義為高于主方向峰值80%的方向。為了向其提供穩(wěn)定性，每個(gè)關(guān)鍵點(diǎn)都可以存在多個(gè)輔方向。本文在實(shí)際處理時(shí)，將其復(fù)制成多份。這些復(fù)制后的關(guān)鍵點(diǎn)將被賦予該點(diǎn)的多方向。而為了獲得更加準(zhǔn)確的方向角度值，要對(duì)離散的梯度直方圖進(jìn)行插值擬合處理［9］。生成關(guān)鍵點(diǎn)后的檢測(cè)效果如圖6所示。

圖6 檢測(cè)效果圖

2.6 輸出檢測(cè)結(jié)果

在生成關(guān)鍵點(diǎn)后，統(tǒng)計(jì)所生成的關(guān)鍵點(diǎn)數(shù)目i，將生成的關(guān)鍵點(diǎn)數(shù)目i與預(yù)先設(shè)定的中間值c做比較。如果i≥c，則待檢測(cè)樣本判斷為密集人群，反之則為稀疏人群。

本文所采取的運(yùn)行的待檢測(cè)視頻幀圖像來源于PETS 2009 視頻數(shù)據(jù)庫(kù)中的視頻序列P2 和P3，背景原圖來自于該視頻數(shù)據(jù)庫(kù)中視頻序列P1。這些相關(guān)圖像序列均是分辨率為768×576的24 位JPG 圖像。根據(jù)算法比對(duì)，相同場(chǎng)景下具有不同人群密集程度的視頻序列圖像對(duì)其進(jìn)行相應(yīng)的實(shí)驗(yàn)檢測(cè)，檢測(cè)結(jié)果如圖7所示。

圖7 相同場(chǎng)景下不同人群密集程度

根據(jù)檢測(cè)結(jié)果，分別對(duì)這兩種情況下的人群圖像進(jìn)行討論分析，檢測(cè)結(jié)果如表1所示。

表1 對(duì)圖7中不同人群圖像的檢測(cè)對(duì)比

針對(duì)不同場(chǎng)景下的不同人群圖像，也分別對(duì)它們進(jìn)行相應(yīng)的SIFT 提取特征點(diǎn)的檢測(cè)，檢測(cè)結(jié)果如圖8所示。

圖8 不同場(chǎng)景下不同人群密集程度

根據(jù)檢測(cè)結(jié)果，分別對(duì)這兩種情況下的人群圖像進(jìn)行討論分析，檢測(cè)結(jié)果如表2所示。

表2 對(duì)圖8中不同人群圖像的檢測(cè)對(duì)比

3 結(jié)語(yǔ)

隨著城市和經(jīng)濟(jì)的全球化發(fā)展，人口密度的增加而帶來的各種經(jīng)濟(jì)、安全問題已經(jīng)成為當(dāng)今社會(huì)所無法避免的現(xiàn)實(shí)問題。因此對(duì)人群是否密集的檢測(cè)顯得尤為重要。本文重點(diǎn)研究了SIFT 提取特征算法。通過軟件測(cè)試檢驗(yàn)，SIFT 針對(duì)不同人群密集程度的圖像進(jìn)行特征點(diǎn)提取，都能夠很好地將圖像人群區(qū)域的特征點(diǎn)檢測(cè)出來。