亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學(xué)習(xí)在網(wǎng)絡(luò)色情圖像識(shí)別中的研究與應(yīng)用①

        2018-12-27 08:54:50
        關(guān)鍵詞:深度實(shí)驗(yàn)檢測(cè)

        ( 福州大學(xué)至誠(chéng)學(xué)院,福建 福州 350002)

        0 引 言

        目前國(guó)內(nèi)外針對(duì)色情圖像的識(shí)別方法主要有三種:①基于膚色和紋理檢測(cè)的色情圖像識(shí)別。這類方法對(duì)于紋理復(fù)雜以及類膚色區(qū)域較多的正常圖像容易產(chǎn)生誤檢[1]。②基于膚色檢測(cè)和多個(gè)維度特征的色情圖像識(shí)別[2]。這類方法雖然可以滿足基本圖像內(nèi)容過濾的要求,但是敏感圖像的正檢率還有待提高。③基于深度學(xué)習(xí)的色情圖像識(shí)別[3]。隨著計(jì)算機(jī)視覺的發(fā)展,改進(jìn)的訓(xùn)練數(shù)據(jù)和深度學(xué)習(xí)算法,使計(jì)算機(jī)能夠更精確地自動(dòng)分類色情圖像。

        基于此,提出在傳統(tǒng)YCbCr膚色檢測(cè)算法的基礎(chǔ)上,結(jié)合深度學(xué)習(xí)的NSFW模型對(duì)網(wǎng)絡(luò)圖像進(jìn)行色情判別。實(shí)驗(yàn)結(jié)果表明,該檢測(cè)方法識(shí)別正確率較傳統(tǒng)方法有較大提升,可滿足實(shí)際應(yīng)用需求。

        1 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

        網(wǎng)絡(luò)色情圖像檢測(cè)系統(tǒng)的總體流程如圖1所示。

        其中“互聯(lián)網(wǎng)”為未經(jīng)過檢測(cè)的原始數(shù)據(jù)源,其可能包含帶色情內(nèi)容的圖像,檢測(cè)系統(tǒng)包含圖像采集和色情圖像識(shí)別,將識(shí)別結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù)中反饋給審查人員,由審查人員對(duì)網(wǎng)站做出相應(yīng)處理。

        1.1 分布式爬蟲模塊

        網(wǎng)絡(luò)圖像是通過爬蟲模塊來抓取的,該模塊以Scrapy-Redis為基礎(chǔ)實(shí)現(xiàn)分布式爬取網(wǎng)絡(luò)圖像。

        爬蟲模塊的基本流程如圖2所示。

        圖1 網(wǎng)絡(luò)色情圖像檢測(cè)系統(tǒng)總體流程圖

        圖2 爬蟲模塊的基本流程圖

        1.2 色情圖像識(shí)別模塊

        網(wǎng)絡(luò)圖像各式各樣,為了減少背景信息的干擾,提高色情圖像識(shí)別的正確率,在進(jìn)行識(shí)別前需要先對(duì)原始圖像進(jìn)行預(yù)處理。

        一般網(wǎng)站中正常圖像的比例明顯要高于色情圖像的比例,基于YCbCr膚色模型檢測(cè)的色情圖像識(shí)別的局限性在于容易被類膚色的圖像背景誤導(dǎo),但該算法簡(jiǎn)單,且對(duì)于正常圖像有較高的識(shí)別率,因此該模塊使用YCbCr膚色模型和NSFW模型進(jìn)行級(jí)聯(lián)識(shí)別,首先由YCbCr膚色模型進(jìn)行一級(jí)識(shí)別,若被判定為疑似色情圖像則再利用NSFW模型進(jìn)行二級(jí)識(shí)別。色情圖像識(shí)別模塊的流程如圖3所示。

        圖3 色情圖像識(shí)別流程圖

        1.2.1 圖像預(yù)處理

        由于網(wǎng)絡(luò)圖像參差不齊,圖像中若存在多個(gè)皮膚裸露層度不同的人物或者類膚色背景時(shí),對(duì)識(shí)別成功率會(huì)造成負(fù)影響,因此在色情圖像識(shí)別流程中需要先將圖像中的人物與背景相分離,再對(duì)人物進(jìn)行針對(duì)性識(shí)別。圖像預(yù)處理模塊的功能就是提取原始圖像中的人物圖像,并調(diào)整成指定大小(256×256像素)。

        圖4 圖像預(yù)處理的流程

        圖5 疑似色情圖像

        人物圖像分離是基于TensorFlow框架并采用Google的ssd_mobilenet模型來實(shí)現(xiàn)。首先對(duì)圖像中的物體進(jìn)行識(shí)別,獲取與“人”相似率高于50%的物體坐標(biāo)矩陣,接著根據(jù)坐標(biāo)矩陣對(duì)圖像進(jìn)行切割獲取人體圖像,最后將人體圖像按照指定大小保存。圖像預(yù)處理的流程如圖4所示。

        1.2.2 色情圖像識(shí)別

        基于YCbCr膚色檢測(cè)算法對(duì)系統(tǒng)資源消耗較少效率較高,而基于深度學(xué)習(xí)的NSFW模型相比膚色檢測(cè)算法的資源消耗相對(duì)較高,因此對(duì)預(yù)處理后的圖像文件,只有在一級(jí)識(shí)別為疑似色情圖像時(shí)再進(jìn)行二級(jí)判定,能夠在較低的資源消耗下同時(shí)提高識(shí)別準(zhǔn)確率。

        但基于YCbCr膚色檢測(cè)算法的局限性在于如皮膚裸露較多但非色情圖像的誤檢率較高,如對(duì)圖5中的比基尼和米開朗基羅著名作品《大衛(wèi)》兩張圖像,YCbCr膚色檢測(cè)算法均判定為色情圖像,因此當(dāng)一級(jí)識(shí)別結(jié)果為色情圖像時(shí),需要再利用NSFW模型識(shí)別進(jìn)行二級(jí)識(shí)別,才能提高識(shí)別正確率。

        基于深度學(xué)習(xí)的NSFW模型是由基于加權(quán)的混合卷積神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)的。模型體系結(jié)構(gòu)如圖6所示,包含8個(gè)CNN模型,每個(gè)模型都使用相同的體系結(jié)構(gòu),并使用普通最小二乘法計(jì)算每個(gè)模型的權(quán)重值。

        圖6 加權(quán)的混合卷積神經(jīng)網(wǎng)絡(luò)

        因?yàn)樯疃壬窠?jīng)網(wǎng)絡(luò)模型需要較長(zhǎng)的訓(xùn)練時(shí)間,所以采用在單個(gè)訓(xùn)練過程中同時(shí)獲取具有不同權(quán)重的八個(gè)子模型的方法,可大幅減少訓(xùn)練時(shí)間。子模型是基于深度卷積神經(jīng)網(wǎng)絡(luò)的二分類模型,輸出結(jié)果為0~1,數(shù)值越接近于1,疑似色情的概率越大。若數(shù)值< 0.2 表示很安全;當(dāng)數(shù)值> 0.8 表示有非常大可能性是色情圖像。實(shí)驗(yàn)?zāi)P偷木W(wǎng)絡(luò)使用Caffe[4]在Hadoop和Spark模型訓(xùn)練集群中深度學(xué)習(xí),網(wǎng)絡(luò)結(jié)構(gòu)采用ResNet[5]。

        基于NSFW模型的色情圖像識(shí)別流程如圖7所示。

        圖7 基于NSFW模型的色情圖像識(shí)別流程

        利用NSFW模型分別對(duì)圖5中的兩張疑似色情圖像進(jìn)行檢測(cè),輸出結(jié)果分別為0.01973和0.54456,在閾值為0.8時(shí)可判定為正常圖像。

        2 實(shí)驗(yàn)結(jié)果及分析

        2.1 色情圖像識(shí)別驗(yàn)證實(shí)驗(yàn)

        首先,選擇4000張彩色圖片對(duì)色情圖像識(shí)別進(jìn)行實(shí)驗(yàn),圖像大小跨度幾十至上千像素,圖像種類包括BMP、JPG、PNG等網(wǎng)絡(luò)常見圖片格式,其中正常圖片3200張(包含風(fēng)景、幼兒、比基尼、實(shí)體雕像、人物等),色情圖像(包括裸露皮膚和只露點(diǎn)等)800張,兩者比例為4∶1。實(shí)驗(yàn)結(jié)果如表1所示。

        表1 圖像種類判斷結(jié)果

        實(shí)驗(yàn)結(jié)果表明,對(duì)正常圖像和色情圖像的總體檢測(cè)率達(dá)到98.2%,表明該方法可滿足實(shí)際應(yīng)用的需求。

        2.2 指定網(wǎng)站驗(yàn)證實(shí)驗(yàn)

        1)選取從今日頭條https://www.toutiao.com通過關(guān)鍵字美女爬取的357幅圖像作為實(shí)驗(yàn)數(shù)據(jù),其中未發(fā)現(xiàn)色情圖像,識(shí)別正確率為100%。

        2)選取某色情網(wǎng)站爬取的5726幅圖像進(jìn)行識(shí)別,其中107幅為正常圖像,其余為色情圖像,試驗(yàn)結(jié)果如表2所示。

        表2 某色情網(wǎng)站圖像識(shí)別結(jié)果

        實(shí)驗(yàn)結(jié)果顯示該系統(tǒng)可以滿足網(wǎng)絡(luò)色情圖像檢測(cè)的要求,將正檢率提升至97%。但在實(shí)際中還存在一些誤判的情況,主要是兩方面:一是將一些性感但不露點(diǎn)圖像識(shí)別為色情圖像;二是部分情趣露點(diǎn)或只露點(diǎn)但其它皮膚未裸露圖像未能夠正確識(shí)別,仍然被判定為正常圖像。

        3 結(jié) 論

        在互聯(lián)網(wǎng)信息膨脹、網(wǎng)絡(luò)不良圖像泛濫的今天,色情圖像識(shí)別過濾技術(shù)的研究具有很大的意義。將傳統(tǒng)基于YCbCr膚色檢測(cè)算法和基于深度學(xué)習(xí)的NSFW模型有效結(jié)合起來,構(gòu)成二級(jí)識(shí)別模型,并使用分布式網(wǎng)絡(luò)爬蟲技術(shù)提高了網(wǎng)絡(luò)色情圖像的檢測(cè)效率。實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果表明,該方法的色情圖像識(shí)別正確率達(dá)到 97% 以上精度。

        隨著網(wǎng)絡(luò)帶寬的增大和流媒體技術(shù)的發(fā)展,網(wǎng)絡(luò)視頻和直播在互聯(lián)網(wǎng)上所占的比重日益增大,對(duì)網(wǎng)絡(luò)視頻和直播內(nèi)容的監(jiān)控和識(shí)別勢(shì)必成為未來的研究熱點(diǎn)。對(duì)于網(wǎng)絡(luò)視頻和直播內(nèi)容的檢測(cè)也是后續(xù)的研究工作。該部分可通過提取網(wǎng)絡(luò)視頻文件的關(guān)鍵幀圖像和直播視頻過程的截圖,對(duì)其進(jìn)行圖像識(shí)別,從而實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)視頻文件和直播內(nèi)容的檢測(cè)。

        猜你喜歡
        深度實(shí)驗(yàn)檢測(cè)
        記一次有趣的實(shí)驗(yàn)
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        深度理解一元一次方程
        做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
        深度觀察
        深度觀察
        深度觀察
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        寂寞人妻渴望被中出中文字幕| 亚洲加勒比无码一区二区在线播放 | 欲妇荡岳丰满少妇岳| 在线视频青青草猎艳自拍69| 五月综合丁香婷婷久久| 免费毛儿一区二区十八岁| 成人h视频在线观看| 日韩亚洲制服丝袜中文字幕| av免费网站不卡观看| 26uuu在线亚洲欧美| 精品人妻va出轨中文字幕| 一本大道久久a久久综合| 国产情侣自拍偷拍精品| 日本丰满少妇xxxx| 亚洲va中文字幕无码| 456亚洲人成在线播放网站| 丝袜美腿亚洲综合在线播放 | 国产午夜精品一区二区三区视频| 亚洲蜜桃视频在线观看| 亚洲成人中文字幕在线视频 | 国内露脸少妇精品视频| 综合网在线视频| 色婷婷一区二区三区77| 国产一区二区三区日韩精品| 国产真实伦在线观看| 精品无吗国产一区二区三区av | 亚洲日产无码中文字幕| 亚洲一区在线二区三区| 国产又大又黑又粗免费视频| 亚洲成色在线综合网站| 日本韩国黄色三级三级| 国产日产韩国av在线| 久久久久久亚洲精品中文字幕| 久久99国产亚洲高清| 国产一区二区三区精品毛片| 白丝爆浆18禁一区二区三区| 真人男女做爰无遮挡免费视频 | 手机在线精品视频| 亚洲男人的天堂色偷偷| 成人欧美一区二区三区在线观看 | 精品专区一区二区三区|