亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學習的圖像識別算法研究

        2019-12-13 07:22:50屈薇
        關(guān)鍵詞:深度學習

        屈薇

        摘要:深度學習在圖像識別方面的應(yīng)用方面技術(shù)優(yōu)勢明顯。傳統(tǒng)的方法不能有效滿足當前圖像識別要求,因此,深度學習是圖像識別研究的熱點?;诖?,文章論述了深度學習的基本思想,探討了深度學習常用模型,如深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)算法原理。

        關(guān)鍵詞:深度學習;圖像識別算法;深度神經(jīng)網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò)

        中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2019)09-0121-02

        0 引言

        大數(shù)據(jù)時代圖像數(shù)據(jù)規(guī)??焖僭鲩L,如何從海量圖像數(shù)據(jù)中快速準確地識別出有價值的圖像數(shù)據(jù)成為迫切需要解決的問題。基于深度學習借助深度神經(jīng)網(wǎng)絡(luò)構(gòu)建圖像識別算法,通過分層方式采集圖像的特征信息,自動學習圖像的特征信息,從而高效識別圖像。在此背景下,基于深度學習的圖像識別算法不斷出現(xiàn),其中具有代表性的算法模型包括深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)這三種。而卷積神經(jīng)網(wǎng)絡(luò)是目前基于深度學習的最為理想的算法模型,文章重點論述了基于深度學習的圖像識別算法。

        1 基本思想

        作為仿真人腦的計算方式,深度學習的“深度”是其最大特點,這里的深度即包含多個層次的隱含層,深度學習并非傳統(tǒng)的I/O關(guān)系而是端對端的關(guān)系。如含有n層隱含層的深層網(wǎng)絡(luò)S,其各個隱含層可以用表示,其中輸入為I,輸出為O,系統(tǒng)分布式可用,表示,其中表示一種輸入形式,當輸入I為0時,說明輸入I經(jīng)過逐層變換后,輸入輸出之間的信息沒有丟失,表示每一個隱含層的信息量相等,但這里輸入輸出理論上相等,但在時間中往往更能會丟失,因此需要持續(xù)修正系統(tǒng)參數(shù),降輸入輸出之間的誤差降到最低,以獲取I的層次特征表示:。通過多層堆疊將上層輸出設(shè)為下層輸入,分級表達數(shù)據(jù),通過調(diào)節(jié)參數(shù)減少誤差,這是深度學習的基本思想。

        2 基于深度學習的圖像識別算法研究

        2.1 通過深度神經(jīng)網(wǎng)絡(luò)重構(gòu)MNIST數(shù)字圖像

        MNIST是美國國家標準與技術(shù)研究院的大型數(shù)據(jù)集中的子數(shù)據(jù)庫,是一個手寫體數(shù)字庫,樣本由分辨率為28*28的0到9數(shù)字樣本組成。MNIST數(shù)據(jù)集可以無需做預(yù)處理即可應(yīng)用,因而被作為識別技術(shù)研究首選數(shù)據(jù)庫。

        用限制波爾茲曼機建立四層深度信念網(wǎng)絡(luò)可以對MNIST樣本進行重新構(gòu)建。第一步,提取圖像數(shù)據(jù)的多維特征,通過修正參數(shù)降圖像數(shù)據(jù)I/O之間的信息誤差。第二步,降低圖像維度有效壓縮數(shù)據(jù),節(jié)約圖像儲存空間。

        2.2 通過神經(jīng)網(wǎng)絡(luò)識別MNIST數(shù)字圖像

        2.2.1 變換層

        圖像包含一些固定的特征,且一部分特征與其它圖像的特征相同,卷積神經(jīng)網(wǎng)絡(luò)基于此規(guī)律實現(xiàn)權(quán)值共享,精簡參數(shù)。圖像可以被是為一個平面,保留圖像二維特性,然后采用線性/非線性變換方式對圖像進行處理。

        非線性操作即激勵函數(shù),常見的有三種非線性激勵函數(shù)。第一:sigmoid函數(shù),當前應(yīng)用較少,因為神經(jīng)元激活值在0或1 附近時,區(qū)域梯度接近0,在反向傳播時最初幾層權(quán)值變化很小,如初始權(quán)值過大神經(jīng)元會快速達到飽和。當神經(jīng)元處理數(shù)據(jù)中心非0時對梯度下降動態(tài)性將產(chǎn)生負面影響。第二:雙曲正切函數(shù)。第三:右一為非線性修正函數(shù),相比前兩個函數(shù)非線性修正函數(shù)計算更簡潔,因而應(yīng)用越來越廣泛,但非線性修正函數(shù)的大梯度值經(jīng)過ReLU神經(jīng)元時ReLU神經(jīng)元不會被激活,ReLU單元較脆弱。

        2.2.2 池化層

        卷積提取特征維度高,存在冗余,因此需要降低維度,為實現(xiàn)這個目的可以統(tǒng)計聚合圖像各位置特征。如計算圖像某區(qū)域的某特征的最大值、均值,達到降低特征維度的目的,這樣的處理方式成為聚合叫池化。

        3 算法分析

        文章采用卷積神經(jīng)網(wǎng)絡(luò)自動學習圖像特征,達到識別圖像的目的。傳統(tǒng)圖像識別算法需預(yù)處理圖像,有著非常大的不確定性,易受人為因素影響,準確性欠缺,而且需要進行復(fù)雜的參數(shù)調(diào)節(jié)。而卷積神經(jīng)網(wǎng)絡(luò)可直接輸入二維圖像在初始圖像中識別出視覺模式,無需太多的預(yù)處理,受人為因素影響小。卷積神經(jīng)網(wǎng)絡(luò)時一種端到端學習網(wǎng)絡(luò),識別準確率達99.16%?;诰矸e神經(jīng)網(wǎng)絡(luò)的圖像識別算法中計算梯度的值來自于輸入樣本的數(shù)目。

        根據(jù)上個計算公式可知,如樣本數(shù)量較少,程序能正常運行,反之則需要消耗大量的計算資源和計算時間,計算速度非常慢,需要大量的硬件空間資源支持。隨機選擇樣本更新參數(shù)稱為隨機梯度下降,將造成嚴重的代價損失函數(shù)震蕩,帶來較大的數(shù)據(jù)誤差。

        4 softmax回歸

        softmax回歸器是logistic回歸拓展形式,logistic回歸通常用來處理二類分類的問題,而softmax回歸器通常用于處理互斥的多類分類任務(wù)。訓練集類標簽可以取k個值,輸出一個k維向量,用于表示樣本屬于k個類別的概率值,每一個類別j估算得出的概率值為。

        5 深度學習在圖像識別領(lǐng)域的應(yīng)用趨勢

        隨著圖像識別需求的持續(xù)增加,深度學習技術(shù)的不斷發(fā)展,而可以遇見未來,圖像識別中的深度學習應(yīng)用日益廣泛,朝著智能化方向不斷發(fā)展。接下來將論述深度學習在圖像識別領(lǐng)域應(yīng)用趨勢。

        5.1 模型的層次越來越多,模型的結(jié)構(gòu)越來越復(fù)雜

        基于深度學習應(yīng)該對圖像特征進行逐層模型構(gòu)建,假如網(wǎng)絡(luò)模型的深度不足將使計算單元快速增加,大幅提高圖像識別的難度,使得需要我們對圖像進行更多的局部區(qū)域劃分,導(dǎo)致模型的層次大幅增加。通過對圖像的多層特征進行深度學習,深度學習網(wǎng)絡(luò)學習到的特征全局性日益增強,識別還原出來的圖片真實感不斷提升。例如,2012年AlexNet奪得ImageNet圖像識別競賽第一名使用的網(wǎng)模型采用2個全連接層、3個pool層、5個卷積層;2014年GoogLeNet奪得ILSVRC賽事第一名使用的網(wǎng)絡(luò)模型采用2個全連接層、16個pool層、59個卷積層。

        5.2 深度學習訓練數(shù)據(jù)規(guī)模不斷擴大

        當前深度學習模型復(fù)雜度呈快速上升趨勢,需要識別的圖像特征大幅增加,這需要深度學習網(wǎng)絡(luò)進行規(guī)模更多的學習訓練,也就需要更大規(guī)模的學習數(shù)據(jù)來滿足學習訓練要求,從而提高圖像識別準確度?,F(xiàn)階段,深度學習算法訓練數(shù)據(jù)規(guī)模主要在幾十萬、上百萬級,Google、百度等大型企業(yè)的深度學習模型的訓練數(shù)據(jù)規(guī)模已達千萬級、億級,但還是不能完全滿足快速增加的深度學習訓練需求。

        5.3 深度學習模型識別精度不斷提升

        隨著深度學習模型的不斷發(fā)展,圖像識別精度,識別速度大幅提高。如初期的R-CNN模型處理一張圖像需13秒,準確率53.7%。2015年,F(xiàn)aster R-CNN模型圖像識別速度達17FPS,準確率達78.8%。2016 年YOLO 模型圖像識別速度達45FPS,識別效率、識別精度大幅提升。

        6 結(jié)語

        綜上所述,文章首先針對深度學習的基本思想進行了簡要論述,闡述了基于深度信念網(wǎng)絡(luò)對MNIST數(shù)據(jù)集進行圖像重構(gòu)的方法,獲得可以表征圖像集最有效的特征。通過構(gòu)建5層卷積神經(jīng)網(wǎng)絡(luò)識別MNIST圖像。揭示了網(wǎng)絡(luò)層次越深代表可以更加準確高效地識別圖像特征。

        參考文獻

        [1] 楊雄.深度學習在網(wǎng)絡(luò)色情圖像識別中的研究與應(yīng)用[J].佳木斯大學學報(自然科學版),2018,36(06):902-905.

        [2] 周宇杰.深度學習在圖像識別領(lǐng)域的應(yīng)用現(xiàn)狀與優(yōu)勢[J].中國安防,2016(07):75-78.

        [3] 李衛(wèi). 深度學習在圖像識別中的研究及應(yīng)用[D].武漢理工大學,2014.

        Abstract:Deep learning has obvious technical advantages in the application of image recognition. Traditional methods can not effectively meet the current requirements of image recognition. Therefore, depth learning is a hotspot in image recognition research. Based on this, the basic idea of deep learning is discussed, and the common models of deep learning, such as deep belief network and convolution neural network, are discussed.

        Key words:depth learning; image recognition algorithm; depth neural network; convolution neural network

        猜你喜歡
        深度學習
        從合坐走向合學:淺議新學習模式的構(gòu)建
        面向大數(shù)據(jù)遠程開放實驗平臺構(gòu)建研究
        基于自動智能分類器的圖書館亂架圖書檢測
        搭建深度學習的三級階梯
        有體驗的學習才是有意義的學習
        電子商務(wù)中基于深度學習的虛假交易識別研究
        利用網(wǎng)絡(luò)技術(shù)促進學生深度學習的幾大策略
        考試周刊(2016年94期)2016-12-12 12:15:04
        MOOC與翻轉(zhuǎn)課堂融合的深度學習場域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學習算法應(yīng)用于巖石圖像處理的可行性研究
        中文字幕亚洲综合久久天堂av| 97人妻视频妓女网| 国产精品伦人视频免费看| 中文字幕乱码在线婷婷| 色综合天天综合网国产成人网 | 日韩av水蜜桃一区二区三区| 国产精品久久久久久久久绿色| 成人无码免费一区二区三区| 国产精品27页| 久久99免费精品国产| 久久影院午夜理论片无码| 久久亚洲精品成人av| 亚洲色偷偷综合亚洲AVYP| 隔壁人妻欲求不满中文字幕| 色偷偷偷在线视频播放| 亚洲欧洲无码一区二区三区| 加勒比日本东京热1区| 日本女优五十路中文字幕| 无码人妻久久一区二区三区蜜桃| 99久久国产露脸精品竹菊传媒 | 男女18禁啪啪无遮挡| 一区二区三无码| 91精品啪在线观九色| 粗大猛烈进出白浆视频| 国产91网址| 激情视频在线播放一区二区三区| 亚洲最新无码中文字幕久久| 人妻在线日韩免费视频| 国内精品久久久久久久久蜜桃| 在线观看一区二区蜜桃| 国模吧无码一区二区三区| 在线观看免费a∨网站| 日韩av在线不卡观看| 久久精品国产亚洲av麻豆瑜伽| 天天鲁一鲁摸一摸爽一爽| 日本女优中文字幕看片| 日日高潮夜夜爽高清视频| 女的扒开尿口让男人桶30分钟| 国产爽爽视频在线| 亚洲一区二区三区资源| 国产97色在线 | 国产|