汪輝進(jìn)
(池州職業(yè)技術(shù)學(xué)院信息技術(shù)系,安徽池州 247000)
基于變柱寬多分辨率直方圖矩特征的不良圖像過濾
汪輝進(jìn)
(池州職業(yè)技術(shù)學(xué)院信息技術(shù)系,安徽池州 247000)
隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)上出現(xiàn)大量不良圖像,如何對這些不良圖像進(jìn)行自動過濾成為一個研究重點(diǎn)。本文提出一種基于彩色變柱寬多分辨率直方圖矩特征(Color Variable Binwidth Multiresolution Histogram Moments,CVB-MHM)的不良圖像過濾框架。彩色變柱寬多分辨率直方圖矩特征能夠有效地表示圖像的顏色和空間信息,同時有著特征維數(shù)低,計算量小的優(yōu)勢。在提取特征后,采用動態(tài)詞袋模型,在驗證集合上確定最優(yōu)的視覺詞匯表大小,對不良圖像進(jìn)行建模,在圖像過濾階段使用SVM分類器進(jìn)行分類。通過互聯(lián)網(wǎng)隨機(jī)下載不良圖像,并加入大量包括人像的正常圖片進(jìn)行測試。結(jié)果顯示,本文方法有效地提高了對不良圖像的過濾效果。
柱寬;多分辨率直方圖矩;詞袋模型;圖像過濾
隨著移動互聯(lián)網(wǎng)和自媒體的迅速發(fā)展,互聯(lián)網(wǎng)產(chǎn)生的圖片信息越來越多,一些圖片中包含淫穢色情等不良信息。據(jù)中國互聯(lián)網(wǎng)違法和不良信息舉報中心發(fā)布的消息稱,僅2016年4月,全國共處置156.4萬件互聯(lián)網(wǎng)淫穢色情信息,在這些色情信息中,圖像和視頻信息占據(jù)主要部分。如何快速、有效地對互聯(lián)網(wǎng)中的不良圖像進(jìn)行過濾,凈化互聯(lián)網(wǎng)環(huán)境,是擺在我們面前的一個重要任務(wù)。早期的自動不良圖像過濾,一般采用對網(wǎng)站網(wǎng)址進(jìn)行屏蔽,或者對敏感的關(guān)鍵詞進(jìn)行屏蔽等措施。但是由于網(wǎng)址可以動態(tài)更改,同時大量圖片并沒有標(biāo)注敏感關(guān)鍵詞,這兩種方法的作用比較有限。
在大數(shù)據(jù)時代的今天,基于內(nèi)容(Context-based)[1-2]的自動不良圖像過濾成為學(xué)者研究的重點(diǎn)。采用圖像分割等方法,檢測提取圖像中皮膚、人臉等區(qū)域一直是基于內(nèi)容不良圖像過濾的一個研究方向。例如,Liu等[3]提出通過結(jié)合視覺注意和皮膚顏色模型的不良圖像過濾方法;Wang等[4]使用皮膚檢測、紋理過濾和人臉檢測來提取圖像特征,再通過決策樹算法過濾不良圖像;Yan等[5]構(gòu)造一個顯著映射模型,再結(jié)合皮膚顏色和人臉檢測模型,來確定不良圖像的重點(diǎn)感興趣區(qū)域?;诮y(tǒng)計模型的方法也被應(yīng)用到不良圖像過濾研究上,例如,Wijaya等[6]在檢測到的皮膚區(qū)域上采用LDA方法來建模,區(qū)分色情圖像;Lienhart等[7]通過使用PLSA模型將圖像建模,對成人圖像進(jìn)行過濾。此外,Ni等[8]通過提取Haar-liket特征檢測人體關(guān)鍵部位,提取灰度共生矩陣和彩色矩特征,使用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對不良圖像進(jìn)行過濾。Li等[9]對空間金字塔匹配進(jìn)行研究,采用Incremental Learning方法在圖像壓縮域直接進(jìn)行不良圖像過濾等。Schettini等[10]提取了大量圖像的紋理和顏色特征,采用決策樹和支持向量機(jī)方法對色情圖像進(jìn)行過濾。目前,關(guān)于不良圖像過濾研究已經(jīng)取得一定的成效?;谀w色、人臉區(qū)域的檢測方法,由于需要使用圖像分割技術(shù),算法復(fù)雜度比較高,并且膚色檢測后主要考慮顏色比例,膚色顏色比例大的并非一定就是色情圖像,色情圖像塊在結(jié)構(gòu)上與正常膚色圖像也是有區(qū)別的;而使用統(tǒng)計模型的方法,過濾結(jié)果存在不確定性,且計算量也比較大。結(jié)合文本方法,需要事先知道圖像的準(zhǔn)確文本標(biāo)注,不利于色情圖像的自動過濾。其他諸如提取人體關(guān)鍵部位[11-13]、采用神經(jīng)網(wǎng)絡(luò)等方法,在特征提取階段也存在比較復(fù)雜的問題。
本文提出了一個新的彩色變柱寬多分辨率直方圖矩特征(CVB-MHM)提取圖局部像塊特征的方法,并將此特征應(yīng)用到圖像的動態(tài)詞袋模型表示上,采用基于SVM分類器對不良圖像進(jìn)行過濾?;谠~袋的方法是最近被應(yīng)用到場景圖像分類和不良圖像檢索領(lǐng)域的[14],已取得了一定成效。目前,大部分基于詞袋的方法還是利用顏色或SIFT特征,SIFT特征計算復(fù)雜度較高,而有時在計算SIFT特征后,又采用比較復(fù)雜的統(tǒng)計模型方法進(jìn)行圖像過濾。本文提出的CVB-MHM特征能有效地表示圖像局部塊的顏色和紋理特征,特征維度小并且計算迅速,具備常用的SIFT特征。
考慮到皮膚顏色信息不僅在不良圖像中出現(xiàn),在大量正常圖像中也會出現(xiàn),為了能有效區(qū)分不良圖像,需要同時提取圖像的顏色和結(jié)構(gòu)信息。E Hadjidemetriou[15]在紋理圖像分類中提出多分辨率直方圖的概念,取得了較好的分類效果。隨后,Y Jiang[16]提出多分辨率直方圖矩特征,進(jìn)一步提高了紋理圖像分類的識別率和對噪聲的魯棒性。在文獻(xiàn)[16]基礎(chǔ)上,本文提出了彩色變柱寬多分辨率直方圖矩特征,在提取顏色特征的同時,更有效地表示圖像空間結(jié)構(gòu)信息,變柱寬多分辨率直方圖矩是基于圖像的多分辨率直方圖特征的。
2.1 多分辨率直方圖
多分辨率直方圖已被用于圖像檢索上,并取得了一定的效果[17],本文中的多分辨率直方圖與文獻(xiàn)[17]不同。本文中的多分辨率直方圖是指2001年Hadjidemetriou等[15]在紋理圖像分類中提出的概念,其中的“多分辨率”是指對圖像進(jìn)行Gauss分解,得到多個層級下的圖像。每一次分解后,圖像的長、寬縮小為原來的二分之一。計算每個層級下圖像的灰度直方圖,并計算累積直方圖和差分直方圖,最終歸一化為多分辨率直方圖(Multiresolution Histogram,MH)。多分辨率直方圖在醫(yī)學(xué)圖像處理和場景圖像分類中得到一定應(yīng)用,圖像的MH特征提取過程如圖1所示。
圖1 MH特征提取過程
2.2 變柱寬多分辨率直方圖矩特征
多分辨率直方圖特征是在圖像的灰度空間上提取的,并且特征維數(shù)比較高,Y Jiang[16]提出將多分辨率直方圖矩特征進(jìn)行紋理分類,有效地降低了特征維數(shù),并增加了對噪聲的魯棒性,但在每個分辨率下提取直方圖時,均采用相等的直方圖柱寬(柱寬為1),沒有考慮直方圖柱寬隨多分辨率層級的變化。事實(shí)上,與紋理圖像識別不同,在進(jìn)行局部圖像塊特征提取的時候,這些局部圖像塊一般比較小,如采用16×16的矩形塊。對這樣的矩形塊在進(jìn)行三級分解后,得到的圖像塊大小為4×4,然后提取256級灰度的直方圖,平均每個直方圖柱上只有1/16個點(diǎn),顯然缺乏統(tǒng)計意義的支撐。
本文提出在不同的多分辨率層級上采取不同的直方圖柱寬,隨著高斯分解分辨率的提高,加大所提取的圖像直方圖的柱寬,提高直方圖的光滑度,使得每個直方圖柱中有足夠多的像素點(diǎn),具有更好的統(tǒng)計意義。對于不良圖像,假設(shè)其局部圖像塊為T,分別在R,B,G通道下,對其用高斯濾波器進(jìn)行多分辨率分解,得到L級分辨率下的局部圖像塊Tl=T*G(l),l=1,…,L,其中G(l)表示高斯濾波器。
直方圖的X方向2,3階矩特征可以表示為:
同樣,Y方向1階矩特征[16]計算為:
可以看出,Y方向1階矩特征正比于圖像的大小,因此,只利用其來計算高階矩特征,不將其作為圖像區(qū)塊的特征,Y方向的2,3階矩特征計算為:
在每個分辨率下采取不同的柱寬,并將不同柱寬的X方向1到3階矩特征,和Y方向2,3階矩特征連接起來,得到變柱寬多分辨率直方圖矩特征(VB-MHM)。
針對局部圖像塊的每個RGB顏色分量{TR,TG,TB},分別計算其變柱寬多分辨率直方圖矩特征,得到彩色變柱寬多分辨率直方圖矩特征:CVB-MHM={VB-MHMR,VB-MHMG,VB-MHMB}.
假設(shè)對圖像采用3級多分辨率分解,CVB-MHM特征的維數(shù)為5×3×3=45,而采用多分辨率直方圖特征,其維數(shù)為256×2×3=1536維,而常用的CSIFT特征的維數(shù)為128×3=384??梢钥闯觯珻VB-MHM有著較小的維度。在提取時CVB-MHM特征不需要計算圖像的梯度,只需要進(jìn)行Gauss分解和統(tǒng)計直方圖,其計算速度比CSIFT快很多。同時,由于直方圖的提取和方向是沒有關(guān)系的,CVB-MHM特征有著較好的旋轉(zhuǎn)不變性,CVB-MHM特征能夠較好地表示圖像的空間和顏色信息。
BOW(Bag of Words,詞袋),是文本檢索領(lǐng)域提出的一個概念。詞袋模型,是指將一個文本文檔看成是大量獨(dú)立單詞的集合,忽略單詞之間的順序和語法特征,統(tǒng)計所有單詞在文檔中出現(xiàn)的次數(shù),得到一個維(n表示詞匯表中詞匯的數(shù)目)的矢量F,并將矢量F直接看作是該文檔的特征,進(jìn)行檢索。
2003年,Sivic等[18]首次將詞袋模型應(yīng)用到視頻圖像處理領(lǐng)域中,將圖像看作是一個特殊的“文檔”,有一系列局部圖像塊(patch)組成。所謂patch,實(shí)際上是指采取某種方法對圖像進(jìn)行的劃分。主要有兩種patch提取方法:一是稀疏的patch提取,首先確定圖像中的感興趣點(diǎn),然后將以感興趣點(diǎn)為中心的矩形或橢圓區(qū)域劃定為patch。這樣得到的圖像patch數(shù)目較少,在整個圖像中呈稀疏分布。Sivic等提出的詞袋模型就是基于圖像的稀疏patch。另一是密集的圖像patch提取,對圖像進(jìn)行網(wǎng)格分割,以每個網(wǎng)格的交叉點(diǎn)為中心,提取規(guī)則的方形區(qū)域為patch,這樣得到的patch區(qū)域會互相重疊,提取的patch密集分布在整個圖像上,patch的數(shù)目比較多,例如Bosch[19]等人采用混合生成區(qū)分模型的場景圖像分類方法。得到圖像的patch之后,再提取每個patch的SIFT特征,將訓(xùn)練圖像集合中的所有patch的特征聚類,得到圖像的視覺詞匯表(Visual Words Table,VWT),最后根據(jù)視覺詞匯表,將圖像的所有patch量化,得到圖像的“視覺詞匯”表示,并計算每個“視覺詞匯”出現(xiàn)的次數(shù),形成“視覺詞匯”的直方圖,作為該patch的特征表示,根據(jù)圖像視覺詞匯出現(xiàn)的直方圖進(jìn)行匹配,也就是基于圖像的詞袋表示方法。
詞袋模型被擴(kuò)展到圖像檢索中,但是大部分的基于詞袋模型的圖像檢索、過濾方法都采用固定視覺詞匯表大小V,不利于圖像的過濾,本文在模型訓(xùn)練階段,抽取一定數(shù)量的訓(xùn)練圖像組成驗證集合,用于對視覺詞匯表大小V進(jìn)行最優(yōu)驗證,在驗證集合上取得最佳過濾效果的視覺詞匯表大小V,應(yīng)用到最終不良圖像過濾中,得到較好的過濾效果。動態(tài)詞袋模型不良圖像過濾如圖2所示。
圖2 動態(tài)詞袋模型不良圖像過濾流程圖
為驗證本文方法的有效性,從互聯(lián)網(wǎng)上隨機(jī)下載不良圖片和正常圖片,構(gòu)成兩個圖像庫,用于實(shí)驗。圖像庫1:包含隨機(jī)下載的400幅不良圖片和400幅正常圖片。圖像庫2:包含圖像庫1,并且添加了400幅隨機(jī)下載的正常人像圖片和在Corel圖像庫中隨機(jī)抽取的2800幅圖片,增加了不良圖像過濾的難度?;谶@兩個圖像庫進(jìn)行兩組實(shí)驗,用于比較本文方法的性能。
實(shí)驗一:對比固定柱寬直方圖矩特征和變柱寬多分辨率直方圖矩特征在兩個圖像庫上的識別效果,實(shí)驗采用固定視覺詞匯表大小為200的詞袋模型。
查全率(R)=(系統(tǒng)過濾的不良圖像數(shù)/所有不良圖像數(shù))×100%,
查準(zhǔn)率(P)=(系統(tǒng)過濾的不良圖像數(shù)/系統(tǒng)過濾的所有圖像數(shù))×100%,
表1 CVB-MHM和CMHM實(shí)驗對比結(jié)果
實(shí)驗二的結(jié)果如表2所示。本文方法在圖像庫1上取得了最好的過濾效果,F(xiàn)1值達(dá)到95.85%。在圖像庫2中,本文方法的查全率好于CSIFT方法,CSIFT方法的查準(zhǔn)率和F1值略好于本文方法。通過實(shí)驗說明,CSIFT特征的整體過濾效果要略好于CBV-MHM特征,但是本文方法不需要計算圖像的梯度,計算量要比CSIFT方法小,更有利于不良圖像的實(shí)時過濾。
表2 CVB-MHM和其他方法對比結(jié)果
本文提出的基于變柱寬多分辨率直方圖矩特征,能夠有效地表示圖像的顏色和結(jié)構(gòu)信息,通過動態(tài)詞袋方法對不良圖像建模,不良圖像的過濾效果比原始多分辨率直方圖矩特征要好,與經(jīng)典的SIFT特征相比效果相當(dāng)?;谠~袋模型的方法,不需要對圖像進(jìn)行分割,或計算復(fù)雜的數(shù)學(xué)統(tǒng)計模型,總體計算量小,圖像過濾的結(jié)果穩(wěn)定。同時,本文提出的方法還可以應(yīng)用于其他的圖像處理領(lǐng)域,如人臉識別、遙感圖像處理,并且可以結(jié)合其他模型如空間金字塔匹配對圖像建模。
[1]Y Fu,W Wang.Fast and effectively identify pornographic images[C].International Conference on Computational Intelligence & Security,2011:1122-1126.
[2]A N Ganar,C S Gode,S M Jambhulkar.Enhancement of image retrieval by using colour,texture and shape features[C].International Conference on Electronic Systems,Signal Processing and Computing Technologies, 2014:251-255.
[3]Y Z Liu,D Zhou,J X Liu,et al.A novel approach for region-of-interest detection in pornographic images[C].Proceedings of 3rdInternational Conference on Multimedia Technology. Paris:Atlantis Press, 2013:861-868.
[4]B S Wang, X Q Lv, T Wang,et al. An effective method on pornographic images realtime recognition[C].International Conference on Graphic and Image Processing.Bellingham:SPIE-Int Soc Optical Engineering,2013.
[5]C C Yan,Y Z Liu, H T Xie,et al.Extracting salient region for pornographic image detection[J].Journal of Visual Communication and Image Representation,2014,25(5):1130-1135.
[6]I G P S Wijaya,I B K Widiartha,K Uchimura,et al.Pornographic image rejection using eigenporn of simplified LDA of skin ROIs images[C].14thInternational Conference on QiR (Quality in Research). Lombok, Indonesia:Institute of Electrical and Electronics Engineers Inc.,2015:77-80.
[7]R Lienhart,R Hauke.Filtering adult image content with topic models[C].Multimedia and Expo,IEEE International Conference on,2009:1472-1475.
[8]P Ni,J Huang.Pornographic image filtering method based on human key parts[C].2012 International Conference on Information Technology and Software Engineering,2013:677-688.
[9]D Li, N Li, J Wang,et al.Pornographic images recognition based on spatial pyramid partition and multi-instance ensemble learning[J].Knowledge-Based Systems,2015,84(c):214-223.
[10]R Schettini,C Brambilla,C Cusano,et al.On the detection of pornographic digital images[M].Bellingham: Spie-Int Soc Optical Engineering,2003.
[11]裴向杰,唐紅昇,陳鵬.融合YCbCr膚色分割的不良圖像檢測算法研究[J].計算機(jī)技術(shù)與發(fā)展,2015,25(12):80-84.
[12]陳驍,金鑫,譚曉陽.基于軀干檢測的單人不良圖片識別[J].中國圖象圖形學(xué)報,2016,21(3):348-355.
[13]王景中,周靖.基于比例特征的網(wǎng)絡(luò)不良圖像過濾算法研究[J].計算機(jī)工程與科學(xué),2016,38(3):514-519.
[14]L Zhuo,Z Geng,J Zhang,et al.ORB feature based web pornographic image recognition[J]. Neurocomputing,2016, 173(3):511-517.
[15]E Hadjidemetriou,M D Grossberg,S K Nayar.Multiresolution histograms and their use for recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(7):831-847.
[16]Y Jiang,R Wang.Texture description based on multiresolution moments of image histograms[J].Optical Engineering,2008,43(3):037001-037007.
[17]N Kawamura, M Yoshimura,S Abe.Image query by multiresolution spectral histograms[M].New York:IEEE,2006.
[18]J Sivic,A Zisserman,S Ieee Computer,et al.Video Google:A text retrieval approach to object matching in videos[C].Ninth IEEE International Conference on Computer Vision, Vols I and Ii, Proceedings. Los Alamitos:IEEE Computer Soc,2003:1470-1477.
[19]A Bosch, A Zisserman,X Muoz.Scene classification using a hybrid generative/discriminative approach[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2007,30(4):712-727.
Pornographic Image Filtering Based on Variable Binwidth Multiresolution Histogram Moment Features
WANG Hui-jin
(Department of Information Technology, Chizhou Vocational and Technical College,Chizhou Anhui 247000,China)
With the rapid development of internet, there are many pornographic images on internet. It is important for us to study how to filter these pornographic images automaticly. This paper proposed a pornographic image fitering framwork based on Color Variable Binwidth Multiresolutino Histogram Moments features(CVB-MHM) and dynamic Bag of Words(BOW) models. Color Variable Binwidth Multiresolution Histogram Moments can represent the color and spatial information of images efficiently, and have the low dimension and computation. The dynamic BOW model uses the best vocabulary table size to model the pornographic images. We use SVM classifier to filter the images which are downloaded from the Internet randomly and include many normal people images. Using method of this paper, we improve the effect of the pornographic image filtering.
binwidth; multiresolution histogram moments; Bag of Words model; image filtering
2017-02-15
2016年安徽省高校優(yōu)秀青年人才支持計劃重點(diǎn)項目“基于簡單統(tǒng)計特征的互聯(lián)網(wǎng)不良圖像信息過濾研究”(gxyqZD2016530);安徽省高等學(xué)校省級質(zhì)量工程項目“計算機(jī)應(yīng)用專業(yè)教學(xué)團(tuán)隊”(2013jxtd065);2016年安徽省高等學(xué)校省級質(zhì)量工程項目精品資源共享課程“Windows Server網(wǎng)絡(luò)操作系統(tǒng)”(2016gxk099)。
汪輝進(jìn)(1978- ),男,副教授,碩士,從事計算機(jī)信息安全及圖像分析研究。
TP391.4
A
2095-7602(2017)08-0034-06