田文莎,張娃旦,田 由
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210046)
隨著科學(xué)技術(shù)的進(jìn)一步發(fā)展,智慧化已走進(jìn)人們的生活,人們更加希望可以提高生活質(zhì)量,比如當(dāng)拖著一天的疲憊回到家中后,機(jī)器通過時間的把握和人形的識別,自動播放主人最愛的歌曲;當(dāng)老人因意外不慎在家中跌倒時,機(jī)器將第一時間根據(jù)人形特征向老人子女發(fā)出求救信號;當(dāng)兒童獨自在家時,系統(tǒng)自動關(guān)閉門窗,調(diào)整屋內(nèi)燈光強(qiáng)度,關(guān)閉屋內(nèi)電器等。智能家居已成為一個熱門的研究,但當(dāng)今市場上,具有人形識別功能的智能家居設(shè)備較為少見,而且在沒有網(wǎng)絡(luò)的情況下無法工作,所以在智能家居背景下研究人形識別系統(tǒng)尤為重要。
用卷積掃描圖像中的每一個像素,用卷積確定的鄰域內(nèi)像素的加權(quán)平均灰度值去替代模板中心像素點的值。其中,高斯函數(shù)選用:
用目標(biāo)圖像和背景圖像進(jìn)行減除運(yùn)算,得到減除后的圖像,為:
式(2)中:E(x,y)為所得圖像;F(x,y)為目標(biāo)圖像;B(x,y)為背景圖像。
對于LBP特征向量的提取,我們采取了以下步驟:①將檢測窗口劃分為9×9的cell。②對于每個cell中的像素,將相鄰的8個像素的灰度值與其進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點的位置被標(biāo)記為1,否則為0.這樣,3×3鄰域內(nèi)的8個點經(jīng)過比較可產(chǎn)生8位二進(jìn)制數(shù),即可得到該窗口中心像素點的LBP值。③計算每個cell的直方圖,即每個數(shù)字出現(xiàn)的頻率,然后對該直方圖進(jìn)行歸一化處理。④將得到的每個cell的統(tǒng)計直方圖連接成為一個特征向量,也就是整幅圖的LBP紋理特征向量。
其中,歸一化可采用(0,1)標(biāo)準(zhǔn)化,通過遍歷單元格內(nèi)的每個數(shù)據(jù)將最大值和最小值記錄下來,并將最大值和最小值之差作為基數(shù)進(jìn)行數(shù)據(jù)的歸一化處理:
同時,一幅圖像的基本組成單位是以RGB為基礎(chǔ)的,其中,R為一個紅色通道,表示為1;G為一個綠色通道,表示為2;B為一個藍(lán)色通道,表示為3;有一處白色圖像則為4,它是由1,2,3處的通道顏色混合而成,即幾種顏色混合在一起將產(chǎn)生一種新的顏色。下面列出提取HOG特征的算法:分離人形圖像3個顏色通道圖像;將圖像劃分成小區(qū),每個小區(qū)包含6×6像素;將3×3個小區(qū)組成一個大區(qū),一個大區(qū)內(nèi)所有小區(qū)的特征串聯(lián)起來便是該大區(qū)的HOG特征。將圖像內(nèi)所有大區(qū)的HOG特征歸一化后串聯(lián)起來就可以得到該圖像的HOG特征,這就是最終可供分類使用的特征向量。
支持向量機(jī)是一種二類分類模型,其基本模型定義為特征空間上間隔最大的線性分類器,其學(xué)習(xí)策略便是間隔最大化,最終可轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解。選擇不同的核函數(shù),可以生成不同的SVM,常用的核函數(shù)有以下4種:①線性核函數(shù)K(x,y)=x×y;②多項式核函數(shù)K(x,y)=[(x×y)+1]d;③徑向基函數(shù)K(x,y)=exp(-|x-y|2/d2);④二層神經(jīng)網(wǎng)絡(luò)核函數(shù)K(x,y)=tanh[a(x×y)+b].
針對本項目,我們編寫了人形識別的算法:①準(zhǔn)備正樣本集和負(fù)樣本集,并手動裁剪樣本,使樣本尺寸保持一致;②將所有正樣本圖像放在一個文件夾中,將所有負(fù)樣本放在另一個文件夾中;③提取所有正、負(fù)樣本的HOG特征,對所有正負(fù)樣本賦予樣本標(biāo)簽,我們將正樣本標(biāo)記為1,負(fù)樣本標(biāo)記為0;④將正負(fù)樣本的HOG特征、正負(fù)樣本的標(biāo)簽都輸入到徑向基函數(shù)K(x,y)=exp(-|x-y|2/d2)中進(jìn)行訓(xùn)練。我們將以上算法用Python語言實現(xiàn),并在樹莓派上操作,用路由器將樹莓派與手機(jī)終端連接起來。
對于攝像頭采集的視頻流(一幀幀圖像),經(jīng)過樹莓派圖像信息處理,然后通過路由器樹莓派與手機(jī)終端通信,最終終端上顯示出圖片處理的結(jié)果,我們用控制變量法分析并驗證了系統(tǒng)的可行性,結(jié)果如表1所示。
表1 實驗結(jié)果記錄表
由此可以看出,總系統(tǒng)的處理速度相當(dāng)迅速,并且適合各種光照條件和背景條件,還可以識別多人,說明系統(tǒng)設(shè)計合理。
本文通過設(shè)計背景減除法、LBP特征提取、SVM分類
器的訓(xùn)練等一系列圖像信息處理算法,并將這些算法用
Python語言在樹莓派上實現(xiàn),完成了智能家居場景下人形識別系統(tǒng)的開發(fā),本系統(tǒng)將在智能家居方面有廣泛的應(yīng)用。
[1]毛志智.人形識別關(guān)鍵技術(shù)的研究與實現(xiàn)[D].武漢:華中科技大學(xué),2011.
[2]李琪.基于支持向量機(jī)的人形檢測[D].昆明:昆明理工大學(xué),2007.
[3]鄧昀,李朝慶,程小輝.基于物聯(lián)網(wǎng)的智能家居遠(yuǎn)程無線監(jiān)控系統(tǒng)設(shè)計[J].計算機(jī)應(yīng)用,2017(01):159-165.