亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        卷積神經(jīng)網(wǎng)絡圖像處理

        2018-05-08 13:20:44柯研王希龍鄭鈺輝
        電子技術與軟件工程 2018年22期
        關鍵詞:圖像處理深度學習

        柯研 王希龍 鄭鈺輝

        摘要

        隨著互聯(lián)網(wǎng)信息技術的迅速發(fā)展,圖像類型的數(shù)據(jù)也呈現(xiàn)出爆炸式增長,如何能夠快速有效地對這些圖像信息進行處理,已經(jīng)成為目前計算機領域的一個重要研究方向。傳統(tǒng)的圖像識別方法,主要是先通過提取一些特征點,然后再通過數(shù)學統(tǒng)計模型表示圖像,最后通過圖像匹配的算法對圖像進行識別。然而隨著人工智能,深度神經(jīng)網(wǎng)絡的發(fā)展,深度學習的技術已經(jīng)廣泛地應用于語音識別,自然語言處理,計算機視覺等多個領域,并且取得了巨大的成功。本文主要介紹一種對于處理圖像非常有效的神經(jīng)網(wǎng)絡 卷積神經(jīng)網(wǎng)絡。

        【關鍵詞】深度學習 卷積神經(jīng)網(wǎng)絡 圖像處理

        近年來,隨著研究神經(jīng)網(wǎng)絡特別是卷積神經(jīng)網(wǎng)絡相關領域的研究人員不斷地增長,技術的發(fā)展也是日新月異,卷積神經(jīng)網(wǎng)絡也變的愈加復雜,越來越深。卷積神經(jīng)網(wǎng)絡是人工神經(jīng)網(wǎng)絡和深度學習相結合的結構,所謂深度神經(jīng)網(wǎng)絡或者深度學習指的是含有多層隱藏層的神經(jīng)網(wǎng)絡。目前,卷積神經(jīng)網(wǎng)絡已經(jīng)成為人工神經(jīng)網(wǎng)絡中應用最廣泛,效果最好的一種神經(jīng)網(wǎng)絡。卷積神經(jīng)網(wǎng)絡的大體結構與普通的人工神經(jīng)網(wǎng)絡非常相似,但是在大規(guī)模的圖像數(shù)據(jù)集上著有非常好的效果。

        如圖1所示,卷積神經(jīng)網(wǎng)絡的主要結構包括;卷積層,池化層以及全連接層。卷積神經(jīng)網(wǎng)絡屬于前饋式神經(jīng)網(wǎng)絡,通過卷積,池化以及非線性激活函數(shù)映射這些操作一層一層地將高層的語義信息從原始數(shù)據(jù)中剝離出來,這就屬于前饋運算。每個卷積層后都會有一個池化層,這是因為信息此時從低維映射到高維,參數(shù)非常多,維度也過高,不適宜作為下一層神經(jīng)元的輸入,所以必須對這一層的輸出做一個降維的處理,因此引入池化操作。若是不對數(shù)據(jù)進行降維,則很容易造成過擬合,甚至導致維數(shù)災難。

        1 積神經(jīng)網(wǎng)絡結構

        1.1 卷積層

        卷積層對應的就是卷積操作,圖像以矩陣X的形式輸入,在卷積層中就是X與參數(shù)矩陣W做卷積操作的過程。其中W就被稱作為卷積核,不同的卷積核能夠提取到圖像中的不同特征,一般而言我們會把很多卷積核拼接在一起運算,這樣就可以盡可能多的獲取圖像中的信息。卷積核的每個元素與被卷積圖像對應位置相乘,再求和。通過卷積核的不斷移動,我們就有了一個新的圖像,這個圖像完全由卷積核在各個位置時的乘積求和的結果組成。二維卷積在圖像中的效果就是:對圖像的每個像素的鄰域(鄰域的大小就是卷積核的大小)加權求和得到該像素點的輸出值,也就是可以使原信號的特征增強,并且降低噪聲。

        事實上,卷積網(wǎng)絡中的卷積核參數(shù)是通過反向傳播中不斷優(yōu)化訓練學出的,除了可以學到類似于橫向邊緣、縱向邊緣的卷積核,還可以學到任意角度邊緣甚至檢測顏色、紋理這些信息的卷積核。而且這些卷積核全都可以包含在一個足夠復雜的深層卷積神經(jīng)網(wǎng)絡中。如圖2所示,這是一張圖像經(jīng)過第卷積層之后的結果,與不同的卷積核卷積運算之后的結果也不相同。隨著“組合”這些卷積核以及各種操作的進行,圖像的信息會逐漸被抽象為具有高層語義的“概念”表示,然后就可以通過這些高層的語義信息進行后續(xù)分類這樣的操作。

        1.2 池化層

        通常我們使用的池化操作為最大池化或者平均池化,與之前卷積層里的卷積核不同,池化層參數(shù)矩陣里的參數(shù)是不需要學習去變化的。實際使用時只需要提前指定好池化的類型、核大小以及池化操作的步長等超參數(shù)就不用再改變了。最大池化也就是在每次操作時,將池化核所覆蓋的區(qū)域中所有值的最大值作為池化結果,平均池化亦然。池化操作后的圖像矩陣大小相比于輸入的圖像矩陣變小了,也就是說池化操作其實就是一個下采樣的過程。

        如圖3所示,這是一張圖像經(jīng)過第池化層之后的結果,我們可以看出相比于卷積層的輸出,池化層的輸出更加抽象,通過這樣的下采樣能夠很好的保留主要信息,減少計算量。池化層具有以下這些特性:

        (l)特征不變性。池化操作能夠使模型更加關注特征的存在與否而不是特征所在的具體位置。這樣可以很好的提高模型的泛化能力。

        (2)特征降維。由于池化操作屬于一個下采樣的過程,因此能夠減少圖像矩陣的維數(shù),在更廣范圍的范圍內(nèi)抽取特征。

        (3)在一定程度防止過擬合,更方便優(yōu)化。

        1.3 激活函數(shù)

        激活函數(shù)層又被稱為是非線性映射層,也就是說激活函數(shù)的能夠增加整個網(wǎng)絡模型的表達能力即非線性的特性。如果沒有激活函數(shù),卷積池化這些線性操作層的堆疊仍然只能起到一個線性映射的作用,無法表達出圖像中的一些非線性特征。通常使用的激活函數(shù)有sigmoid,tanh和relu。我們選擇的激活函數(shù)應該具有如下的一些性質:

        (1)非線性。我們需要激活函數(shù)去幫助網(wǎng)絡模型表示出非線性的特征,線性的函數(shù)不符合我們的需求。

        (2)連續(xù)且可微。我們通過反向傳播,使用梯度下降法來優(yōu)化參數(shù),由于需要求梯度,激活函數(shù)必須是連續(xù)且可微的。

        (3)單調性。激活函數(shù)是單調增長或下降時,則損失函數(shù)則會是一個凸函數(shù),由于凸函數(shù)已經(jīng)被廣泛的研究,有很多已有的方法可以利用方便我們?nèi)?yōu)化。

        (4)在原點處近似于線性。權值矩陣的參數(shù)初始化為接近0的隨機值時,網(wǎng)絡里的參數(shù)可以更快地學習更新。

        1.4 全連接層

        全連接層在卷積神經(jīng)網(wǎng)絡中起到“分類器”的作用。如果說卷積層、池化層和激活函數(shù)層的操作就是將原始數(shù)據(jù)映射到一個新的特征空間上,全連接層則是將學習到的特征空間里的特征參數(shù)映射到樣本的標記空間里。在實際使用中,全連接層可由全局卷積操作來實現(xiàn),也就是用一個與前一層輸出的圖像矩陣大小相同的卷積核與前一層的輸出做卷積運算,這樣就能夠將一個矩陣映射為一個數(shù),而多個這樣的卷積核組合就可以將前層輸出的圖像矩陣映射成一個固定長度的特征向量,一般來說,特征向量的長度也就對應分類的類別數(shù)。由于這個特征向量里的值是將經(jīng)過多個卷積層,池化層以及激活函數(shù)所獲得的圖像特征進行高度提純得到的,所以這個特征向量具有高層的特征信息,也就是包含了輸入圖像經(jīng)過各種操作的所有特征的組合信息,這些信息就是圖像中最具有特點特征,這樣就可以通過這些信息輸出圖像具體所屬類別的概率值來對圖像進行分類。

        1.5 損失函數(shù)

        與很多機器學習模型一樣,卷積神經(jīng)網(wǎng)絡也通過最小化損失函數(shù)來學習模型里的權值參數(shù)。損失函數(shù)可以體現(xiàn)出網(wǎng)絡模型所輸出的預測值與真實值之間的不一致程度,輸出的函數(shù)值是一個非負的值,輸出值越小,那么說明網(wǎng)絡的預測值與真實值越接近,也就是說模型的魯棒性越好。一般在圖像分類中我們選擇邏輯回歸中的softmax函數(shù)作為我們的損失函數(shù)。

        2 總結

        隨著深度學習越來越火爆,人工智能也離我們越來越近了,卷積神經(jīng)網(wǎng)絡在工業(yè)界廣泛的應用,使得我們能夠越來越方便快捷地處理各種圖像信息,而想要更好的使用卷積神經(jīng)網(wǎng)絡這個工具,就需要深刻地理解它每一部分的含義以及作用,只有這樣我們才能知道如何調整各種超參數(shù)來優(yōu)化網(wǎng)絡,使其效果更好,在此基礎上我們還能不斷加深網(wǎng)絡,讓網(wǎng)絡獲取更多的信息,甚至是在結構上加入我們的創(chuàng)新,去解決各種各樣問題,以此來推動神經(jīng)網(wǎng)絡的發(fā)展,推動深度學習的發(fā)展,讓深度學習在更多的領域迸發(fā)出活力。

        參考文獻

        [1]LeCun Y, Bottou L, Bengio Y, et al.Gradient-based learning applied todocument recognition [J].

        Proceedingsof the IEEE,

        1998, 86 (11): 2278- 2324.

        [2lGulcehre C,Moczulski M, Denil M, et al.

        Noisy activation functions [C]//Internat ional

        Conference on MachineLearning. 2016: 3059-3068.

        [3] Graves A, Fern a ndez S, Gomez F,et al. Connectionist temporalclassification: labelling unsegmentedsequence data with recurrent neuralnetworks [C]//Proceedings of the 23rdinternational conference on Machinelearning. ACM, 2006: 369-376.

        猜你喜歡
        圖像處理深度學習
        基于圖像處理的機器人精確抓取的設計與實現(xiàn)
        機器學習在圖像處理中的應用
        電子制作(2018年18期)2018-11-14 01:48:20
        模糊圖像處理,刑事偵查利器
        圖像處理技術的實戰(zhàn)應用
        有體驗的學習才是有意義的學習
        電子商務中基于深度學習的虛假交易識別研究
        MOOC與翻轉課堂融合的深度學習場域建構
        大數(shù)據(jù)技術在反恐怖主義中的應用展望
        深度學習算法應用于巖石圖像處理的可行性研究
        軟件導刊(2016年9期)2016-11-07 22:20:49
        基于深度卷積網(wǎng)絡的人臉年齡分析算法與實現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        亚洲白嫩少妇在线喷水| 亚洲美女啪啪| 亚洲国产综合专区在线电影| 久久亚洲av熟女国产| 亚洲男女内射在线播放| 人人妻人人澡人人爽精品欧美| 国产又黄又爽视频| 国产成年女人特黄特色毛片免| 亚洲国产精品一区二区久久恐怖片 | 欧美日本国产va高清cabal| 亚洲一区区| 中文字幕乱码一区在线观看| 国产精品二区一区二区aⅴ污介绍| 国产在线精品欧美日韩电影 | 亚洲国产精品夜男人天堂| 熟女一区二区中文字幕| 亚洲国产成人久久综合| 亚洲一区日韩无码| 亚洲av色在线观看网站| 亚洲中文字幕在线一区| 伊在人天堂亚洲香蕉精品区| 亚洲AV一二三四区四色婷婷| 天天综合色中文字幕在线视频| 色欲色香天天天综合网www| 一本色道久久99一综合| 欧美激情中文字幕在线一区二区| 日本一区二区三区一级片| 天天躁日日躁aaaaxxxx| 六月丁香婷婷色狠狠久久| 午夜一区二区三区在线视频| 天堂av网手机线上天堂| 亚洲国产av玩弄放荡人妇系列| 制服丝袜天堂国产日韩| 亚洲一区二区三区最新视频| 人人爽久久久噜人人看| 精品久久久久久中文字幕大豆网 | 国产三级自拍视频在线| 极品尤物人妻堕落沉沦| 无码精品人妻一区二区三区影院| 中文字幕第一页亚洲观看| 男女上床免费视频网站|