亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學(xué)習(xí)的模型搭建及過(guò)擬合問(wèn)題的研究

        2018-02-27 20:13:22陶礫楊朔楊威
        計(jì)算機(jī)時(shí)代 2018年2期
        關(guān)鍵詞:深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

        陶礫+楊朔+楊威

        摘 要: 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像,聲音和文本。文章介紹了一種多層感知器結(jié)構(gòu)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,并推導(dǎo)了其實(shí)現(xiàn)的算法。用數(shù)字識(shí)別實(shí)驗(yàn)驗(yàn)證了該模型及其算法的可靠性;驗(yàn)證了過(guò)擬合的發(fā)生與訓(xùn)練集的大小以及神經(jīng)網(wǎng)絡(luò)的復(fù)雜度之間的重要關(guān)系。過(guò)擬合問(wèn)題的研究對(duì)降低誤差有重要的意義。

        關(guān)鍵詞: 深度學(xué)習(xí); 神經(jīng)網(wǎng)絡(luò); 隱藏層; 過(guò)擬合

        中圖分類號(hào):TP391.9 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2018)02-14-04

        Abstract: Deep learning is a new field in machine learning research. It simulates the mechanism of human brain to interpret data, such as image, voice and text. In this paper, a deep learning neural network model of multilayer perceptron structure is introduced and its implementation algorithm is derived. The reliability of the model and its algorithm are also verified by some digital recognition experiments, and find that the size of the training set and the complexity of neural networks are highly related with the over-fitting. It is of great significance to study the problem of over-fitting to reduce the error.

        Key words: deep learning; neural networks; hidden layer; over-fitting

        0 引言

        深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究[3]。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層來(lái)表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。在深度學(xué)習(xí)泛化(generalization)過(guò)程中,主要存在兩個(gè)挑戰(zhàn):欠擬合和過(guò)擬合(overfitting)。欠擬合是指模型不能在訓(xùn)練集上獲得足夠小的誤差,而過(guò)擬合是指訓(xùn)練誤差和測(cè)試誤差之間的差距太大。

        1 模型設(shè)計(jì)

        1.1 多層感知器結(jié)構(gòu)[1]

        本文采用多層感知器(MLP)作為訓(xùn)練模型,它是一種前饋人工神經(jīng)網(wǎng)絡(luò)模型。它包括至少一個(gè)隱藏層(除了一個(gè)輸入層和一個(gè)輸出層以外)本文采用的多層感知器模型中的信號(hào)流傳播如下:

        ⑴ 輸入:yi(n)為i神經(jīng)元的輸出,為下一個(gè)神經(jīng)元j的輸入。

        ⑵ 誘導(dǎo)局部區(qū)域:神經(jīng)元j被它左邊的yi(n)神經(jīng)元產(chǎn)生的一組函數(shù)信號(hào)所饋,神經(jīng)元j產(chǎn)生誘導(dǎo)局部區(qū)域。

        ⑶ 激活函數(shù):神經(jīng)元j輸出處的函數(shù)信號(hào)yi(n)為,其中為j層神經(jīng)元的激活函數(shù)。采用激活函數(shù)的一個(gè)好處是引入非線性因素,使神經(jīng)網(wǎng)絡(luò)變成非線性系統(tǒng)。本文采用Sigmoid函數(shù)作為激活函數(shù),其定義為:,導(dǎo)數(shù)可用自身表示:

        ⑷ 誤差:k為輸出神經(jīng)元,則誤差ek(n)=dk(n)-yk(n),其中dk(n)為信號(hào)輸出。

        1.2 代價(jià)函數(shù)

        代價(jià)函數(shù)是用來(lái)反映/度量預(yù)測(cè)結(jié)果yk(n)與實(shí)際結(jié)果dk(n)的偏差,本文采用最小平方(LMS)算法來(lái)構(gòu)造代價(jià)函數(shù):

        1.3 隨機(jī)梯度下降算法[4]

        本文采用隨機(jī)梯度下降算法(SGD)進(jìn)行迭代,在此算法中,對(duì)的連續(xù)調(diào)整是在最速的方向進(jìn)行的,即它是與梯度向量方向相反的。記為,因此,梯度下降算法一般表示為:。其中這里η是一個(gè)常數(shù),稱為學(xué)習(xí)率參數(shù),是梯度向量值。

        1.4 反向傳播算法[5]

        本文采用的反向傳播算法以與1.3節(jié)類似的方式對(duì)突觸權(quán)值應(yīng)用一個(gè)修正值,它正比于偏導(dǎo)數(shù),即:

        1.4.1 神經(jīng)元j是輸出節(jié)點(diǎn)

        圖1為輸出神經(jīng)元j細(xì)節(jié)的信號(hào)流圖。

        根據(jù)微分的鏈?zhǔn)揭?guī)則,可以將這個(gè)梯度表示為:

        本文采用Sigmoid函數(shù)作為激活函數(shù),即:

        為了方便,我們定義:

        1.4.2 神經(jīng)元j是隱藏層節(jié)點(diǎn)

        見圖1,我們對(duì)式中通過(guò)鏈?zhǔn)揭?guī)則后的偏導(dǎo)數(shù)可以看到:,神經(jīng)元k是輸出節(jié)點(diǎn),故:

        以上為倒數(shù)第一個(gè)隱藏層的傳播公式,得出了δj的反向傳播遞推公式(k為j正向傳播的下一個(gè)神經(jīng)元),并用Sigmoid函數(shù)作為激活函數(shù):

        于是我們得出了遞歸的校正值的定義:

        2 實(shí)驗(yàn)

        本模型以識(shí)別手寫數(shù)字為例,測(cè)試深度學(xué)習(xí)模型。本文采用的數(shù)據(jù)集為著名的“MNIST數(shù)據(jù)集”。這個(gè)數(shù)據(jù)集有60000個(gè)訓(xùn)練樣本和10000個(gè)測(cè)試用例。我們首先對(duì)該模型進(jìn)行驗(yàn)證,然后通過(guò)調(diào)整訓(xùn)練集的大小和神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)來(lái)觀察其對(duì)正確率的影響。

        2.1 模型算法

        學(xué)習(xí)階段:本文采用mini-batch 梯度下降算法:假設(shè)總樣本數(shù)為Sn,將Sn隨機(jī)按每組N個(gè)樣本分為(Sn/N)組。多層感知器的突觸權(quán)值的調(diào)整在訓(xùn)練樣本集合的所有N個(gè)樣本例都出現(xiàn)后進(jìn)行。(Sn/N)次完成整個(gè)樣本集的訓(xùn)練,構(gòu)成了一個(gè)訓(xùn)練的回合(epoch)。學(xué)習(xí)需經(jīng)過(guò)多個(gè)回合,不斷完善。具體步驟如下。endprint

        猜你喜歡
        深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        久久精品国产69国产精品亚洲| 日韩精品极品系列在线免费视频 | 成人久久久精品乱码一区二区三区| 日本又色又爽又黄的a片18禁| 久久亚洲中文字幕无码| 韩国女主播一区二区在线观看 | 亚洲av日韩aⅴ永久无码| 亚洲一区二区视频蜜桃| 亚洲国产精品国自产电影| 亚洲av影片一区二区三区| 一二三区亚洲av偷拍| 国产日产精品一区二区三区四区的特点 | 国产精品.xx视频.xxtv| 色窝窝手在线视频| 亚洲国产精品色一区二区| 产美女被爽到高潮免费a| 亚洲а∨精品天堂在线| 2022Av天堂在线无码| 国产在线播放免费人成视频播放| 中文有码亚洲制服av片| 3d动漫精品一区二区三区| 91精品啪在线观看国产色| 在线观看一区二区三区视频| 加勒比一本heyzo高清视频| 蜜桃av噜噜一区二区三区| 婷婷激情五月综合在线观看| 久久久精品人妻一区二区三区游戏| 摸进她的内裤里疯狂揉她动图视频 | 日韩字幕无线乱码免费| 无码人妻精品中文字幕| 毛茸茸的中国女bbw| 丁香九月综合激情| 中文字幕一区久久精品| 日韩精品区一区二区三vr| 亚洲欧美在线观看一区二区| 国产伦奸在线播放免费| 亚洲av首页在线| 成人午夜毛片| 亚洲国产丝袜美女在线| 高清毛茸茸的中国少妇| 国产精品揄拍100视频|