喻 恒
(平頂山學院 計算機科學與技術學院,河南 平頂山 467000)
視覺物聯(lián)網(wǎng)下的自習教室人數(shù)統(tǒng)計方法
喻 恒
(平頂山學院 計算機科學與技術學院,河南 平頂山 467000)
以圖像處理技術為基礎,提出了一套基于視覺物聯(lián)網(wǎng)框架下的人數(shù)統(tǒng)計方法。該方法利用背景差分法提取目標,再進行圖像濾波的預處理,利用邊緣檢測和形態(tài)學算法獲得人物目標對象的完整輪廓。通過對連通域填充和標記來獲得精確的人數(shù),并對利用面積閾值法消除統(tǒng)計誤差進行了討論。通過對整套算法進行仿真實驗分析,該方法能比較準確地完成自習室中人數(shù)的統(tǒng)計。
圖像處理;邊緣檢測;形態(tài)學;人數(shù)統(tǒng)計
計算機視覺在人數(shù)統(tǒng)計方面的應用目前國內(nèi)對于該項研究開展得較少,而國外的研究成果主要有:Terada和Yoshida[1]利用立體攝像機模擬左、右眼,通過獲得的時空圖像來實現(xiàn)人數(shù)統(tǒng)計;Beymerl[2]采用立體攝像機,利用高斯混合模型跟蹤個體的狀態(tài),并進行分類,做出判定是否計數(shù);Schofield和Stonham[3]采用單個攝像機和基于隨機存取存儲器(RAM)神經(jīng)網(wǎng)絡的方法實現(xiàn)人數(shù)統(tǒng)計。以上方法采用的設備成本過高,算法復雜,要求處理速度較高,不適合實際應用中的推廣和普及。
智能視覺物聯(lián)網(wǎng)[4]是新一代信息技術的重要組成部分,視覺物聯(lián)網(wǎng)技術下的人數(shù)統(tǒng)計的難點就是對采集的室內(nèi)圖像進行處理分析,得到準確的人數(shù)信息。本文通過將視頻監(jiān)控圖像進行預處理后,將目標對象“人”進行輪廓提取和形態(tài)學處理之后,對連通域進行標記統(tǒng)計,并通過面積閾值糾正誤差,達到智能快速統(tǒng)計教室的人數(shù)。從而使教室人數(shù)信息能夠?qū)崟r共享,有利于學校教室人數(shù)流動的統(tǒng)計,提高學生學習效率和教室資源的利用率。
視覺物聯(lián)網(wǎng)下的人數(shù)統(tǒng)計是對教室內(nèi)通過局域網(wǎng)連接的視頻監(jiān)控器獲取的圖像進行處理,檢測統(tǒng)計人數(shù),并通過網(wǎng)絡實時上傳統(tǒng)計數(shù)據(jù)。首先,要對圖像進行背景差分、圖像濾波等一系列處理;其次,運用邊緣檢測以及形態(tài)學算法進行處理,得到圖像的輪廓,并采用面積閾值法剔除不符合要求的連通域,最終統(tǒng)計出人數(shù)(如圖1所示)。
圖1 視覺人數(shù)統(tǒng)計原理
在實際中,一般采用安放在不同角度的幾個攝像頭,多角度圖像的獲?。?],雖然可以增加目標圖像的信息,但也增加了數(shù)據(jù)處理量以及系統(tǒng)成本。同時,考慮到前方人物對象面部和衣服特征增加了圖像的信息復雜度,本文選擇安置在室內(nèi)后方的兩個不同角度的攝像頭。本文采用差分法消除背景以及光照等因素影響,通過維納濾波消除圖像的噪聲,以實現(xiàn)后續(xù)處理,提高檢測準確率。
2.1背景差分
背景差分法[6]是通過將含有目標對象的圖像與不含目標的背景圖像相比較從而消除背景,達到對目標對象的識別和檢測的一種方法。
本文采用直接靜態(tài)背景法。直接靜態(tài)背景法攝取沒有目標對象的場景圖像作為背景圖像。先將不同季節(jié)和不同時間點得背景圖像保存到數(shù)據(jù)庫中,再根據(jù)測量時攝取圖像當時的季節(jié)和時間點提取背景圖像,以適應場景隨時間的變化。這種方法適用于靜止的背景,運動目標比較少,且場景按照規(guī)律變化的密封環(huán)境??紤]到教室背景靜態(tài)性較好,環(huán)境基本屬于密封性的,以及算法的運算效率,
2.2圖像濾波
普通攝像頭拍攝的圖像一般由于光源的顏色,明暗變化、表面灰塵等因素的影響會產(chǎn)生大量噪聲,所以對圖像進行去噪、平滑的預處理十分必要。維納濾波[7]是根據(jù)最小均方誤差準則實現(xiàn)的最優(yōu)化濾波,它使得原始圖像和濾波后的圖像之間的均方誤差最小,如式1:
其中為f(x,y)原始圖像,g(x,y)為濾波后圖像,得到 再找到估計值,使均方誤差
式中f'(x,y)為f(x,y)的最小二乘估計。維納濾波器對于含有高斯噪聲的圖像去噪效果不錯,本文采用維納濾波,得到了較好的效果,有利于后續(xù)的圖像處理。
評價對一副圖像進行邊緣提取的結果,總的來說有如下標準:檢測出的邊緣必須是目標邊緣;邊緣的定位準確性必須足夠好;得到的檢測邊緣最好是單像素等??紤]到實際檢測中要求,本文采取Canny算法提取目標圖像的邊緣,再通過形態(tài)學運算獲得完整封閉的邊緣輪廓。
3.1邊緣檢測
傳統(tǒng)的圖像邊緣提取算法包括Robert、Prewitt、Sobel、Gauss-Laplace、Canny等。其中,Canny算子[8]提出了嚴格的邊緣檢測三個標準,在工程試驗中具有信噪比優(yōu)良,定位精度高,單邊緣響應好等優(yōu)點,因此得到了廣泛應用。
傳統(tǒng)Canny算子來進行邊緣檢測的基本思想是:首先,利用二維高斯函數(shù)的任一方向上的一階方向?qū)?shù)作為噪聲濾波器進行濾波平滑;接下來在濾波后的圖像中用有限差分近似偏微分計算梯度的幅度和方向,最后依據(jù)雙門限算法檢測和連接目標邊緣,它能獲得較好的邊緣檢測結果的同時對噪聲進行抑制[9]。該過程的數(shù)學表達式為:
其中σ為平滑系數(shù),其數(shù)值決定對邊緣的平滑作用和噪聲抑制程度。工程應用一般取σ在1.2到1.8之間。Cannay算子檢測到的邊緣圖像有很多的具體細節(jié),而且邊緣是單像素,連續(xù)性相對較好,不容易出現(xiàn)邊緣斷裂,有利于后續(xù)填充。
3.2形態(tài)學處理
由邊緣圖像可以看出,基于Canny算子提取的邊緣,還是有很多細小的邊緣沒有連接上就無法進行圖像填充。通過形態(tài)學的腐蝕和膨脹,可以消除原圖像中的微小干擾顆粒,同時邊緣不連續(xù)的地方連接起來,形成一個邊緣封閉的圖像。
膨脹[10],數(shù)學上膨脹定義為集合運算。A被B膨脹,記為A⊕B,定義為:
其中B為具有特定幾何形狀的結構元素。腐蝕與膨脹是兩個互逆的過程,其數(shù)學定義與膨脹相似,假設選定了結構元素B,利用它來腐蝕圖像集合A,定義為:
根據(jù)這個原理,選取合適的結構元素,就可以去掉圖像中不需要的小物體,也可以將那些我們想要分割開,卻又連接在一起的區(qū)域分割開來,從而得到封閉完整的輪廓。效果如圖2所示。
圖2 邊緣檢測和形態(tài)學處理
提取到完整的圖像輪廓后,通過對圖像進行填充[11],計算連通域的面積,設計適當?shù)拈撝?,將不符合特征要求的連通域[12]剔除,最后對連通域進行標記,就可以得到具體的人數(shù)。
由于輪廓填充圖中會有少量的非連通域的出現(xiàn),同時由于圖片中的存在兩人或多人遮擋重疊的問題,都會使計數(shù)統(tǒng)計出現(xiàn)錯誤[13]。為了減少這種統(tǒng)計誤差,本算法采用了面積閾值法。本文根據(jù)經(jīng)驗值設定閾值:T1=0.3S。S為根據(jù)攝像頭像素和角度以及經(jīng)驗設定的面積值。剔除掉面積小于T1的連通域后,剩余連通域認為就是目標“人”。
同時,設定面積倍數(shù)閾值N=Sx/S,Sx是某連通域面積,當N在1.4~2.0之間,認定為兩人,在2.0~2.6之間,認定為三人,根據(jù)經(jīng)驗可類推確定范圍值。通過閾值處理后就可以得到圖像中的人數(shù),同時消除因重疊造成的誤差,如圖3所示。
圖3 圖像填充和面積閾值處理效果圖
本文基于MATLAB編程,設計了圖形用戶界面(GUI),集成了算法中的每一步實現(xiàn),全面測試本文算法。本界面可直觀地看到圖像處理和人數(shù)統(tǒng)計的結果,如圖4所示。
圖4 Matlab仿真程序界面
為了驗證本算法的可行性,在某自習室內(nèi)環(huán)境攝取了幾段連續(xù)的視頻圖像,本文是在五十人規(guī)格教室內(nèi)進行的人數(shù)統(tǒng)計,要考慮各種人數(shù)的情況,故采集分別有3人,5人,10人,20人,30人的情況,在每段視頻中隨機抽取了200幅含目標的圖像,利用本文的算法對每幅圖像進行了人數(shù)統(tǒng)計進行了算法驗證,如表1。
表1 算法分析
通過大量實驗可以看出,超過教室人數(shù)半數(shù)以上的情況,由于會出現(xiàn)大量遮擋重疊,嚴重影響統(tǒng)計的結果。在實際應用中,利用不同角度的兩個攝像頭,取計算數(shù)較大的一個結果,可降低這種因素影響,同時自習教室中學生座位比較分散,遮擋重疊現(xiàn)象不多,人數(shù)一般情況也在25人以下,因此本文算法在統(tǒng)計自習室人數(shù)方面可以獲得滿意的結果。
本文在視覺物聯(lián)網(wǎng)技術框架下,綜合應用各種圖像處理技術實現(xiàn)了自習室人數(shù)的智能統(tǒng)計。該方法是基于教室中視頻攝像頭獲得原始圖像,再對原始圖像的進行增強濾波等處理,利用邊緣檢測,形態(tài)學等一系列方法獲得了封閉的連通域,通過對連通域的標記,得到精確的人數(shù)。由于實際情況的復雜性和算法本身的理論局限性,在人數(shù)較多的時候,本方法的計數(shù)結果也會有誤差,但本文涉及的研究對象主要是自習教室,本身室內(nèi)人數(shù)相對較少,而且比較分散,重疊造成的誤差影響不大,在實際應用中幾乎沒有增加現(xiàn)有成本,算法時效性比較好,能得到比較滿意的結果。
主要參考文獻
[1]K Terada,D Yoshda,S Oe,eta1.A Counting Method of the Number of Passing PeopleUsing Astereo Camera[J].Industrial Electronics Society,1999(3):1318-1323.
[2]D Beymer.person counting using stero [C]//ttoceedings Human Workshopon,Motion.Los Alamitos CA,:IEEE,2000:127-133.
[3]A J Schofidld,T J Stonham,P A Mthta. A RAM Based Neural Network Approach to People Counting[C]//Fifth International Conference on Image Processing and its Applications,Edinburgh,UK:IEEE,1995:652-656.
[4]周志勇.利用智能視覺物聯(lián)網(wǎng)構建機場周界報警系統(tǒng)[J].中國公共安全:綜合版,2012(13):162-165.
[5]李健.運動目標的獲取、傳輸與跟蹤[D].南京:南京理工大學,2008.
[6]吳青青,許廷發(fā),閆輝,等.復雜背景下的顏色分離背景差分目標檢測方法[J].兵工學報,2013,34(4):501-506.
[7]朱立新,楊擴,秦加合.一種新的基于自適應神經(jīng)網(wǎng)絡模糊推理系統(tǒng)的圖像濾波器[J].計算機科學,2014,41(z1):211-214.
[8]J Canny . A Computational Approach to Edge Detection[J].Pattern Analysis and Machine Intelligence IEEE Trans on,1986,8(6):679-698.
[9]喻恒,趙建軍.基于數(shù)字圖像的實體黃河模型河勢寬度檢測[J].河南大學學報:自然科學版,2011,41(2):188-192.
[10]C R Gonzalez,E Woods. Digital Image Processing[M].2nd. ed.Beijing: Electronic Industry Press,2003:70-81,463-474.
[11]王曉,唐洪鵬,周麗雅.圖像處理在客流檢測中的算法研究[J].中國海洋大學學報:自然科學版,2010,40(6):161-166..
[12]孔斌.快速連通域分析算法及其實現(xiàn)[J].模式識別與人工智能,2003,16(1):110-115.
[13]于麗梅.視覺物聯(lián)網(wǎng)下智能公交客流采集統(tǒng)計方法仿真[J].計算機仿真,2014,31(6):187-190.
10.3969/j.issn.1673-0194.2015.02.168
TP391.41
A
1673-0194(2015)02-0235-03
2014-12-22