亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度卷積網絡在數據審核校驗中應用研究*

        2019-10-09 05:22:26閆玲博韋占坤吳庚杰
        通信技術 2019年9期
        關鍵詞:深度

        范 亮,閆玲博,韋占坤,金 星,吳庚杰

        (1.中國人民解放軍75837部隊,廣東 廣州 510000;2.國防科技大學信息通信學院,陜西 西安 710106)

        0 引 言

        隨著社會的發(fā)展與進步,人們的日常生活已經與各式各樣的數據息息相關?;A數據作為社會服務的支撐,已經開始讓大家意識到公共服務質量的好壞在很大程度上依賴于基礎數據的規(guī)范性與準確性,特別是對于涉及公共服務的基礎數據則顯得尤為重要。當前為了改善數據的規(guī)范性和準確性通常采用以下兩種方式:在數據采集錄入時,基于數據錄入要求和填報規(guī)則等約束條件實現(xiàn)數據準確與規(guī)范;在數據匯聚整編時,基于規(guī)則匹配和人工核對相結合的審核校驗方式實現(xiàn)數據準確與規(guī)范。由于前一種方式往往對系統(tǒng)部署統(tǒng)一性要求較高,在當前大數據相互融合匯聚的趨勢下并不能完全解決基礎數據的規(guī)范性和準確性的所有問題,因而第二種方式始終作為數據管理的一項重要的補充手段受到大家的重視。

        當前數據審核校驗通常采用基于規(guī)則和模式匹配的方式[1-2]實現(xiàn)結構化數據的自動化審核校驗,然而對于文本、媒體等非格式數據的審核校驗往往只能基于人工核對的方式進行篩選判斷,因而當面對大量數據的審核校驗任務時則顯得力不從心,進而影響了基礎數據在公共服務中的支撐保障效果。

        得益于近些年來計算資源的升級和機器學習算法的發(fā)展,人們已經在人工智能領域取得了長足的進步。特別深度神經網絡算法的再度興起,人工智能算法當前在部分領域所展現(xiàn)的工作能力足以與人工相媲美。例如,在文獻[3-5]介紹了采用深度卷積網絡實現(xiàn)圖片媒體數據中特定物體特征屬性的自動化學習,并實現(xiàn)了泛化樣本中相應物體的檢測與判別。通過在ImageNet等公開數據集上的測試,上述算法的識別準確率已經超過人工識別水平取得令人驚喜的實際效果。相較而言,當前基礎數據中非結構化媒體數據上的審核校驗依舊依靠人工比對的方式進行,因此在工作效率和保障效果上都存在較大缺陷。例如在人力資源系統(tǒng)中審核相關人員照片的級別、崗位等信息內容時,只能粗粒度核查重要崗位領導人員的信息。

        針對上述等問題,為了有效緩解當前非結構化媒體數據自動化審核手段不足的問題,本文以人力資源系統(tǒng)中人員媒體數據的審核為切入點,通過深度卷積網絡實現(xiàn)非結構化媒體數據的自動化審核校驗,有效提高人力資源系統(tǒng)中人員媒體基礎數據的審核校驗,為基于機器學習的方式實現(xiàn)非結構化數據審核校驗探索了新思路,因而具有較好現(xiàn)實意義和實際應用價值。

        本文的后續(xù)內容安排如下:第二部分主要介紹了深度卷積網絡(Convolutional Neural Network,CNN)的基本組成和概念;第三部分主要以非結構化人員媒體數據為研究對象,綜合考慮計算資源和設計復雜度等因素,設計提出了基于VGG卷積網絡結構(Visual Geometry Group network,VGG)的人員媒體數據自動化審核校驗方法;第四部分通過實際采集的數據對本文提出的審核校驗方法進行了測試,驗證了該方法在實際工作中的可行性與有效性;第五部分對全文內容進行了總結。

        1 深度卷積神經網絡

        卷積神經網絡(Convolutional Neural Network,CNN)作為一種特殊的前饋神經網絡[6],是由上世紀60年代Hubel和Wiesel等人在研究貓腦皮層時發(fā)現(xiàn)的一種獨特的網絡結構。該網絡結構相較于傳統(tǒng)全連接形式的反饋神經網絡而言具有復雜度較小的優(yōu)勢,為實現(xiàn)當前構建深度神經網絡提供有利條件。隨著人們對深度卷積網絡的研究和實踐,人們發(fā)現(xiàn)CNN網絡在圖像模式識別與分類領域具有突出優(yōu)勢,能夠自適應的實現(xiàn)特征的學習與選擇,有效避免傳統(tǒng)圖像處理技術中復雜的特征選取等預處理操作,因此具有廣泛的應用價值。

        CNN網絡通常主要包括卷積層(Convolutional Laye,Conv)、線性整流層(Rectified Linear Units Layer,Relu)、池化層(Pooling Layer,Pooling)以及全連接層(Fully-Connected Layer,F(xiàn)C)等4種基本結構,其基本組成形式如圖1所示。在實際應用中通過對上述4種基本單元的組合與設計,能夠形成如ResNet、AlexNet、VGG、Inception等各種不同模式的深度卷積網絡。

        (1)Conv層:該單元通過構建具有寬度(Width)、高度(Height)、深度(Depth)的三維神經元來對輸入層的局部特診進行過濾篩選。靠近網絡輸入端的卷積層通常能夠實現(xiàn)圖像中邊緣、線條和拐角等特征的識別與提取。隨著卷積層的深入迭代,在靠近輸出端的卷積層則能夠進一步識別圖片中具有具體語義的物體特征,最終實現(xiàn)物體屬性的識別。

        (2)Relu層:該單元通過構建非線性的激活函數,使得整個神經網絡結構具備非線性特征的學習能力。相較于傳統(tǒng)的Sigmod,Tanh激活函數,Relu激活函數在保證網絡具有非線性特征的基礎上,具有運算復雜度小、反饋梯度導數簡單特點,因此廣泛被應用于深度卷積神經網絡的設計過程。

        (3)池化層:該單元能夠對圖像中所提出特征進行聚合和匯聚,同時剔除局部重復特征的冗余信息實現(xiàn)特征參數的降維,節(jié)省計算資源。另一方面,由于該網絡層能夠通過對局部特征的篩選,減少非重要特征對分類判別的影響從而對網絡的過擬合學習具有一定的抑制作用,從而在一定程度上提高了系統(tǒng)的泛化能力。

        圖1 CNN網絡基本結構示意圖

        (4)全連接層:該單元通常為卷積網絡的輸出單元,主要實現(xiàn)根據前端網絡提取的特征參數實現(xiàn)對輸入數據的分類與判別。

        2 媒體數據審核校驗網絡的設計

        在綜合考慮算法性能和計算資源的基礎上,當前較為通用靈活的CNN網絡主要分為AlexNet、GoogleNet、VGG、以及ResNet等類型,其中Alex網絡結構較為簡單但存在著隨網絡層數的增加參數規(guī)模急劇增加的缺點;GoogleNet網絡為了適應圖像中不同大小的結構特征采用不同尺度的卷積核有效提高了圖像分類的準確性,但其在網絡結構拓撲設計上往往需要較強的專業(yè)知識,因此也是一項十分艱巨的任務;VGG網絡則通過多層小尺寸的卷積核來覆蓋大尺寸卷積核視野的方式,有效地簡化了網絡結構,降低了訓練參數規(guī)模,具有算法性能較好、訓練速度快等優(yōu)點;ResNet則為了適應更高深度卷積網絡的學習訓練,通過殘差的方式進一步提高網絡深度,取得更好的學習分類效果,但其對計算資源的要求則更為苛刻。

        本文在綜合考慮計算資源和網絡結構設計復雜程度等因素,主要以VGG卷積網絡結構為基礎,設計提出了針對人力資源系統(tǒng)中人員媒體數據的自動化審核校驗方法,實現(xiàn)人員媒體數據中崗位級別的判斷與審核。

        2.1 VGG卷積神經網絡

        VGG網絡結構是由英國牛津大學Visual Geometry Group團隊與2015年提出[7],正如上節(jié)介紹的,該網絡結構能夠通過多層的小尺寸的卷積核得到與大卷積核同樣效果的“感受野”,從而減少網絡參數,使得網絡結構樣式能夠簡單和統(tǒng)一,有效緩解大家對于深度神經網絡拓撲結構的設計壓力。VGG網絡具有從A到E共5種配置方式,卷積層數也從8層到19層,具體參數如圖2所示。

        圖2 各型VGG網絡結構配置示意圖

        2.2 媒體數據審核網絡

        在實際應用可知,在針對媒體數據進行審核校驗時,可以根據媒體數據的具體特點設計調整相應網絡參數,以較低的計算資源開銷取得較好的審核效果即可。因此本文以人力資源中警務系統(tǒng)的人員媒體數據為對象,重點實現(xiàn)對警務人員的崗位級別數據的審核校驗。由于警務人力資源系統(tǒng)中人員媒體數據相對規(guī)范,具有規(guī)定大小和分辨率,因此可以適當選擇規(guī)模較小、相對簡單的網絡結構實現(xiàn)崗位級別的判斷。通過對于實際數據進行分析預處理后,本文主要從以下3方面對原始VGG網絡的進行調整配置:

        (1)由于媒體數據采集規(guī)范的約束,當前錄入的人員媒體數據通常具有固定的分辨率,即為寬295像素、高413像素的RGB彩色照片。人員崗位級別標識通常在照片中相對固定的位置,因此可以通過裁剪的方式摳取媒體數據中崗位級別標識,以此剔除相關干擾信息,提高算法的識別準確率。

        (2)由3.1節(jié)可知,原始VGG網絡最大可設計為19層神經網絡層,同時各層卷積網絡所使用的卷積核數量(64、128、256、512)和全連接層神經元個數(4 096)都十分龐大。因此在綜合考慮當前單個筆記本獨立運行的硬件資源約束以及識別任務相對簡單等因素,本文主要在VGG-A網絡結構的基礎上將輸入媒體尺寸調整配置為寬128像素、高128像素的RGB彩色照片;減小各卷積層的卷積核數量,相應分別配置為16、32、64、128;實際判別人員崗位等級較少,將最后兩全連接層的神經元個數減少為1024。

        (3)為了適應深度神經網絡的快速收斂,在每個卷積網絡的激活單元前端添加了批歸一化操作(Batch Normalization,BN),使激活層的數據輸入滿足0均值、方差為1的標準化分布,從而解決網絡內部因協(xié)變量偏移造成網絡訓練效果不理想的問題[8]。為了進一步提高訓練模型對實際數據的泛化能力,在全連接層后引入了Dropout操作[9],通過隨機抑制部分神經元的活性來使得整個網絡更加傾向提取數據中的本質特征,進一步防止模型的過擬合。

        為了增加網絡對媒體數據的旋轉角度、亮度、對比度以及顏色等的泛化能力,提高魯棒性,在進行預處理時本文通過隨機旋轉,調整亮度、對比度、色度以及清晰度等操作對媒體數據進行變化,一定程度上豐富樣本數據的數量,克服數據樣本的隨機性干擾。通過上述調整即可完成對人員媒體數據進行審核校驗的卷積網絡設計,整個網絡模型的訓練流程如圖3所示。

        圖3 針對媒體數據自動審核校驗示意圖

        3 實際數據實驗結果與分析

        為了驗證本文所提出方法的有效性,本節(jié)以實際采集收錄的2 000幅人員媒體照片作為訓練數據對2.2節(jié)所提出的網絡模型進行訓練,并另取1 000幅人員媒體照片作為測試數據對訓練后的模型進行測試驗證。訓練過程中,以80副人員媒體數據作為一批(Batch)進行訓練,總共迭代訓練30 000次;以網絡判別概率分布與實際期望的概率分布之間的交叉熵[10]作為網絡識別損失;配置學習率為0.000 5的Adam優(yōu)化算子作為模型的優(yōu)化方法,配置選擇隨機概率為0.5的Dropout算子,進行網絡學習訓練。通過上述配置,整個模型的最終學習曲線如圖4所示。

        圖4 媒體數據審核校驗網絡訓練學習曲線

        由圖4可知隨著不斷的訓練迭代,整個網絡的識別損失在逐步下降并逐漸趨于平緩,其原因在于隨著網絡模型的不斷收斂,Dropout操作所引入的隨機性逐漸變成了網絡不確定性的主要因素,因此在整個訓練的最后階段網絡仍舊以較小的幅度進行的震蕩。當迭代步數達到25 000時訓練準確率已經可以達到92.3%,因此可知最終訓練后的網絡已經具有較好的判別能力。

        在網絡訓練結束后,以1 000幅人員媒體數據作為測試樣本,對訓練的模型進行驗證。在實際數據審核校驗中人們更加關心媒體數據與相關采集的信息是否一致的問題,因此在該部分主要結合數據審核校驗的實際工作目的,對實際數據進行判別檢測,其檢測結果如表1所示。

        表1 實際數據在審核校驗中的測試結果

        通過表1數據可知,本文所提出的模型能夠有效對人員媒體數據中崗位級別信息進行一致性審核校驗,其準確率接近80%。因此在實際應用過程中,可以通過該網絡的自動識別后,依靠人工輔助的方式對判別結果進一步進行核準,即能夠快速完成大批量非結構化媒體數據的審核校驗,從而有效地減緩人工作業(yè)壓力,具有良好的現(xiàn)實意義和實際應用價值。

        4 結 語

        為了緩解當前依靠人工方式進行非結構化媒體數據審核校驗的現(xiàn)狀,本文在綜合考慮計算資源和人員媒體數據基本特點的基礎上,設計實現(xiàn)了一種基于深度卷積網絡的媒體數據自動化審核校驗方法,為實現(xiàn)非結構化基礎數據的自動化審核給出了一種有效的解決思路。該方法能夠通過機器學習的方式對媒體數據中的特征進行自動提取,并能實現(xiàn)相應規(guī)則的判斷與識別,進而實現(xiàn)媒體數據自動化審核校驗,有效地減輕數據整編作業(yè)壓力,具有較高的實際應用價值。最后,以實際工作中人員媒體數據的審核校驗為實際應用場景,對現(xiàn)實數據進行訓練與測試,其測試結果表明本文所提方法能夠有人員媒體中崗位級別的重要基礎信息,從而實現(xiàn)媒體數據的自動化審核校驗,有力的驗證了本方法的實用性和現(xiàn)實價值。

        猜你喜歡
        深度
        深度理解不等關系
        四增四減 深度推進
        深度理解一元一次方程
        深度觀察
        深度觀察
        深度觀察
        深度觀察
        芻議深度報道的深度與“文”度
        新聞傳播(2016年10期)2016-09-26 12:14:59
        提升深度報道量與質
        新聞傳播(2015年10期)2015-07-18 11:05:40
        微小提議 深度思考
        手机在线中文字幕av| 午夜家庭影院| 99re6久精品国产首页| 美女性色av一区二区三区| 香蕉视频在线观看亚洲| 日韩欧群交p片内射中文| 四虎成人在线| 手机在线免费av网址| 一区二区三区字幕中文| 久久久久人妻精品一区蜜桃| 国产爆乳乱码女大生Av| 国产精品农村妇女一区二区三区| 亚洲国产精品一区二区毛片| 真人做爰片免费观看播放| 日本一本久道| 色偷偷亚洲女人的天堂| 日本在线一区二区三区不卡| 国产真人性做爰久久网站| 国产97色在线 | 免| 日本av第一区第二区| 少妇无码av无码专线区大牛影院| 玩弄少妇高潮ⅹxxxyw| 一区二区视频观看在线| 日韩精品国产精品亚洲毛片| 久久亚洲色一区二区三区| 中国亚洲女人69内射少妇| 亚洲女同一区二区久久| 美女主播网红视频福利一区二区| 2021国产精品国产精华| 无码毛片高潮一级一免费| 成人性生交大片免费看激情玛丽莎| 亚洲 日韩 激情 无码 中出 | 国产av电影区二区三区曰曰骚网| 国产视频最新| 96中文字幕一区二区| 曰本女人与公拘交酡| 久久久国产精品ⅤA麻豆| 在线观看免费人成视频国产| 黑人老外3p爽粗大免费看视频| 在线精品国产一区二区三区| 亚洲深夜福利|