亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的圖像風(fēng)格轉(zhuǎn)換淺論

        2018-04-13 03:47:55欒五洋
        數(shù)字通信世界 2018年2期
        關(guān)鍵詞:池化權(quán)值神經(jīng)元

        欒五洋

        (南陽(yáng)市第二中學(xué),南陽(yáng) 473000)

        1 引言

        首先基于實(shí)用主義對(duì)人工智能下一個(gè)定義:人工智能是對(duì)計(jì)算機(jī)系統(tǒng)如何能夠履行那些只有依靠人類智慧才能完成任務(wù)的理論研究,比如說(shuō)ALPHA GO下圍棋,圍棋是憑借人類智慧才可以完成的,是人類特有的技能,然而在李世石1比4被完敗,已經(jīng)證明了在圍棋上機(jī)器已經(jīng)超過(guò)了人類,于是人們將目光轉(zhuǎn)向一個(gè)人類特有的領(lǐng)域——藝術(shù),繪畫(huà)的風(fēng)格一直被認(rèn)為是不可能被機(jī)器模仿的,被認(rèn)為是人類的一種天分,繪畫(huà)的風(fēng)格是很抽象的概念,不同畫(huà)家的繪畫(huà)風(fēng)格我們?nèi)庋酆苋菀拙涂梢员鎰e,但是在計(jì)算機(jī)看來(lái)就是一堆像素的疊加,于是需要計(jì)算機(jī)找到除了像素外更加潛在的可以量化的特點(diǎn)。而在2015年德國(guó)有三位科學(xué)家提出算法使計(jì)算機(jī)可以模仿知名畫(huà)家創(chuàng)作繪畫(huà),他們的算法主要是通過(guò)多層的卷積神經(jīng)網(wǎng)絡(luò)將畫(huà)家的畫(huà)作進(jìn)行特征提取,再通過(guò)矩陣將風(fēng)格量化,再將風(fēng)格轉(zhuǎn)化為畫(huà)作的特有紋理并疊加在任意的畫(huà)作上,就形成了對(duì)畫(huà)家風(fēng)格的模仿。

        2 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)

        2.1 卷積神經(jīng)網(wǎng)絡(luò)概述

        卷積神經(jīng)網(wǎng)絡(luò)是當(dāng)前人工神經(jīng)網(wǎng)絡(luò)方面最重要的內(nèi)容,這種人工神經(jīng)網(wǎng)絡(luò)區(qū)別于其他的神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)是卷積神經(jīng)網(wǎng)絡(luò)采用了權(quán)值共享,與生物神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的相似性,并且它的網(wǎng)絡(luò)復(fù)雜程度大幅度降低,使得可以被廣泛的運(yùn)用。

        從本質(zhì)上來(lái)看,卷積神經(jīng)網(wǎng)絡(luò)可以看成一種映射,這種網(wǎng)絡(luò)可以通過(guò)學(xué)習(xí)大量的輸入到輸出的結(jié)果,不需要這種輸入到輸出過(guò)程的精確的映射關(guān)系,只要通過(guò)一定的模式對(duì)其進(jìn)行訓(xùn)練,就可以使得網(wǎng)絡(luò)具有輸入到輸出的能力。一般來(lái)說(shuō),卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以分為兩個(gè)階段,在訓(xùn)練前,先用隨機(jī)數(shù)對(duì)其網(wǎng)絡(luò)的權(quán)值進(jìn)行初始化,之后進(jìn)入到向前傳播訓(xùn)練階段,首先從樣本集中抽取一個(gè)樣本(X,Ym),將X傳遞到卷積神經(jīng)網(wǎng)絡(luò)的輸入層,之后經(jīng)過(guò)逐級(jí)的傳遞傳送到輸出層,計(jì)算實(shí)際的輸出Gm,之后進(jìn)入向后傳播訓(xùn)練階段,計(jì)算實(shí)際輸出與理想輸出的誤差并根據(jù)誤差最小的原理來(lái)調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值。

        2.2 卷積神經(jīng)網(wǎng)絡(luò)特點(diǎn)

        2.2.1 稀疏連接

        相對(duì)與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),卷積神經(jīng)網(wǎng)絡(luò)采用了稀疏連接的方式,不再是層與層間每個(gè)神經(jīng)元都相互連接,每個(gè)神經(jīng)元節(jié)點(diǎn)只與其相近的上層神經(jīng)元相連接。

        圖1

        M-1層為輸入層,如果是傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)的話,那么就是M-1層的每個(gè)神經(jīng)元都與M層上所有神經(jīng)元連接,而卷積神經(jīng)網(wǎng)絡(luò)的M-1層只與其相近的三個(gè)上級(jí)神經(jīng)元相連接,這樣大大減小了整個(gè)網(wǎng)絡(luò)的數(shù)據(jù)復(fù)雜度。

        2.2.2 權(quán)值共享

        在傳統(tǒng)的全連接網(wǎng)絡(luò)中,對(duì)于一個(gè)圖像來(lái)說(shuō),輸入層的每個(gè)神經(jīng)元要連接所有的像素,在第一層就會(huì)產(chǎn)生幾百萬(wàn)的權(quán)值,導(dǎo)致運(yùn)算進(jìn)行的十分緩慢,而在卷積神經(jīng)網(wǎng)絡(luò)中,一個(gè)卷積核卷積處理整個(gè)圖像而其內(nèi)在的權(quán)值并不發(fā)生變化,一個(gè)卷積核提取一種特征,通過(guò)增加卷積核的個(gè)數(shù)來(lái)提取圖像的多個(gè)特征,通過(guò)這樣的方法使得再對(duì)圖像進(jìn)行特征提取時(shí)不用考慮圖像的局部特征,并且使得整個(gè)網(wǎng)絡(luò)的矩陣運(yùn)算更加簡(jiǎn)單。

        2.2.3 最大池化

        最大池化是一種非線性采樣方法,經(jīng)過(guò)卷積層的操作后,獲取了圖像的特征并對(duì)其進(jìn)行分類,但是這個(gè)過(guò)程會(huì)產(chǎn)生一個(gè)數(shù)百萬(wàn)維的特征向量,而池化過(guò)程就是對(duì)卷積特征矩陣進(jìn)行降維操作,主要是將卷積特征分為N*N個(gè)不相交的區(qū)域,取這些區(qū)域的最大值來(lái)表示降維后的卷積特征,除此之外還有平均池化,即取這些區(qū)域的平均值來(lái)表示降維后的卷積特征。一般來(lái)說(shuō),池化可以使得特征減少,極大的降低了來(lái)自上層運(yùn)算的復(fù)雜度,除此之外,池化還可以保持圖像的旋轉(zhuǎn)平移等的不變性,平均池化可以保持圖像的背景信息,而最大池化可以最大的保留圖像的紋理信息。

        2.3 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

        卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)主要包括卷積層、激活函數(shù)、池化層和全連接層。

        2.3.1 卷積層

        卷積層是卷積神經(jīng)網(wǎng)絡(luò)的最重要的一部分,主要是對(duì)圖像的特征進(jìn)行提取,整個(gè)卷積層由大量的卷積核或者叫濾波器構(gòu)成,用來(lái)提取圖像的特征,這些卷積核的大小一致,但是深度必須和輸入數(shù)據(jù)的深度一致,通過(guò)一個(gè)卷積核對(duì)圖像進(jìn)行二維卷積運(yùn)算,得到圖像的特征。在每一個(gè)卷積層后都必須要有一個(gè)非線性的激活函數(shù),常見(jiàn)的如Tanh函數(shù)。

        圖2

        由于卷積神經(jīng)網(wǎng)絡(luò)的線性能力比較差,通過(guò)加入非線性的激活函數(shù),增加整個(gè)網(wǎng)絡(luò)的非線性,使整個(gè)網(wǎng)絡(luò)更加穩(wěn)定。

        2.3.2 池化層

        池化層一般是固定嵌在卷積層之后的,主要是對(duì)卷積層運(yùn)算后得到的圖像特征進(jìn)行降維,這樣就減少了卷積神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)的參數(shù)數(shù)量,使得運(yùn)算的速度大大提升,提高網(wǎng)絡(luò)的運(yùn)行效率,并且保持圖像的特征不變。

        圖3

        2.3.3 全連接層

        全連接層一般在池化層后,整個(gè)網(wǎng)絡(luò)的末端,在這一層中,神經(jīng)元對(duì)于上一層的神經(jīng)元是全部連接的,它的主要作用是將學(xué)習(xí)到的分布的特征將其映射到樣本空間中,可以對(duì)整個(gè)圖像的特征做一個(gè)分類。

        2.3.4 優(yōu)化算法

        上文提到在卷積層中卷積核的初始值是隨機(jī)數(shù),在前向傳播訓(xùn)練過(guò)程中不可避免的產(chǎn)生損失函數(shù),而卷積神經(jīng)網(wǎng)絡(luò)就是通過(guò)損失函數(shù)的計(jì)算來(lái)推動(dòng)分類特征的,而在反向傳播訓(xùn)練過(guò)程中通過(guò)優(yōu)化濾波器的參數(shù)來(lái)達(dá)到最優(yōu)相應(yīng),而優(yōu)化算法就是通過(guò)反向傳播來(lái)更新濾波器參數(shù)的,常見(jiàn)的有梯度下降算法,自適應(yīng)矩估算算法和牛頓法。

        3 圖像的風(fēng)格轉(zhuǎn)化

        首先對(duì)于圖像風(fēng)格轉(zhuǎn)化做一個(gè)定義,圖像風(fēng)格轉(zhuǎn)換是指給出一張圖像A和一張風(fēng)格圖像B,求一張圖像C,使得圖像C和圖像A內(nèi)容一致而風(fēng)格又與圖像B相近。

        3.1 基于迭代優(yōu)化的圖像風(fēng)格轉(zhuǎn)換

        我們知道卷積層后的輸出是圖像的提取特征,那么我們只要提取出圖像A的內(nèi)容和圖像B的風(fēng)格后再合成即可得到一個(gè)與圖像A內(nèi)容一致,與圖像B風(fēng)格一致的圖像C,即完成了圖像B的風(fēng)格遷移到圖像A上。

        首先,一個(gè)圖像經(jīng)過(guò)卷積層后是一個(gè)三維的數(shù)組,一張圖像經(jīng)過(guò)卷積層后,得到若干個(gè)三維數(shù)組Ki,這些數(shù)組就代表了圖像的內(nèi)容,這些數(shù)組又組成了一個(gè)多維數(shù)組,這個(gè)多維數(shù)組就代表了這個(gè)圖像的內(nèi)容,而對(duì)這個(gè)多維數(shù)組求格拉姆矩陣,就可以得到該圖像的紋理,在這里,我們將紋理看成圖像風(fēng)格的具體表現(xiàn)。

        提取好圖像的內(nèi)容和風(fēng)格后,進(jìn)行內(nèi)容誤差和風(fēng)格誤差的計(jì)算,則C與A的內(nèi)容誤差為T(mén)c,圖像C與圖像B的風(fēng)格誤差為T(mén)s,則其總體誤差為T(mén)=α*Tc+β*Ts,α和β是指內(nèi)容和風(fēng)格在圖像中的比重。那么整個(gè)迭代優(yōu)化的過(guò)程可以分為以下幾步,首先對(duì)圖像C進(jìn)行初始化,求出整體誤差T,根據(jù)梯度下降算法調(diào)整圖像C的像素參數(shù),判斷誤差T是否收斂或者小于閾值,若是,則停止,若不是,則繼續(xù)計(jì)算整體誤差并調(diào)整像素。

        這種方法可以很好的獲取風(fēng)格圖像的紋理并達(dá)到讓人滿意的效果,但是由于不斷的迭代優(yōu)化,使得運(yùn)行時(shí)間太長(zhǎng),效率太低。

        圖4

        3.2 基于轉(zhuǎn)換網(wǎng)絡(luò)的圖像風(fēng)格轉(zhuǎn)換

        相比較于迭代優(yōu)化方法,這種方法運(yùn)行的速度有了極大的提升。這種網(wǎng)絡(luò)是一種全卷積層的網(wǎng)絡(luò),不包括任何的池化和全連接層,結(jié)構(gòu)為一個(gè)下采樣部分,其中包含三個(gè)卷積層,一個(gè)殘差網(wǎng)絡(luò),由若干個(gè)殘差塊組成,主要是解決一定層數(shù)后梯度變淺后的效果變差問(wèn)題,還有一個(gè)上采樣部分,包含兩個(gè)采樣層和一個(gè)卷積層,這三個(gè)部分構(gòu)成圖像的生成網(wǎng)絡(luò),在訓(xùn)練階段,給定風(fēng)格圖像,將圖片輸入網(wǎng)絡(luò),生成網(wǎng)絡(luò)會(huì)輸出一張圖像,由損失網(wǎng)絡(luò)來(lái)計(jì)算風(fēng)格誤差和內(nèi)容誤差,并通過(guò)誤差的值來(lái)調(diào)整生成網(wǎng)絡(luò)的參數(shù),達(dá)到最小的損失。

        4 結(jié)束語(yǔ)

        本文首先介紹了圖像風(fēng)格轉(zhuǎn)化的背景,藝術(shù)被認(rèn)為是人類獨(dú)有的領(lǐng)域,而人工神經(jīng)網(wǎng)絡(luò)正在企圖打破這一獨(dú)有的領(lǐng)域,其后首先介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本概念,特點(diǎn)和組要組成,為下面的圖像風(fēng)格轉(zhuǎn)化做了鋪墊,最后介紹了兩種風(fēng)格轉(zhuǎn)換的方法,一種是基于迭代優(yōu)化的方法,不斷地調(diào)整像素,這種方法效果顯著,但是效率太低,第二種是基于轉(zhuǎn)換網(wǎng)絡(luò)的方法,這種方法相比之下運(yùn)行的速度會(huì)更快一些。卷積神經(jīng)網(wǎng)絡(luò)是目前深度學(xué)習(xí)方面最重要的部分,從仿生學(xué)上看,卷積神經(jīng)網(wǎng)絡(luò)是最接近人大腦神經(jīng)的人工神經(jīng)模型,并且在社會(huì)的各個(gè)領(lǐng)域都有著舉足輕重的作用,是未來(lái)科技的核心,而對(duì)于卷積神經(jīng)網(wǎng)絡(luò)不同環(huán)境的架構(gòu)仍然需要人們?nèi)ゲ粩嗟拈_(kāi)發(fā)和探索。

        [1] Simon Haykin.神經(jīng)網(wǎng)絡(luò)基礎(chǔ)[M].北京:機(jī)械工業(yè)出版社,2012:145-162.

        [2] 岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2007:43-56.

        [3] 楊楠.基于caffe深度學(xué)習(xí)框架的卷積神經(jīng)網(wǎng)絡(luò)研究[D].河北師范大學(xué),2014:1-7.

        猜你喜歡
        池化權(quán)值神經(jīng)元
        基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識(shí)別方法研究
        基于Sobel算子的池化算法設(shè)計(jì)
        一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
        卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
        《從光子到神經(jīng)元》書(shū)評(píng)
        自然雜志(2021年6期)2021-12-23 08:24:46
        CONTENTS
        基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識(shí)別研究
        躍動(dòng)的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
        基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
        基于二次型單神經(jīng)元PID的MPPT控制
        国产美女露脸口爆吞精| 激情五月开心五月啪啪| 99久久国产精品网站| 少妇人妻大乳在线视频不卡| 国产精品丝袜黑色高跟鞋| 精品久久久久久99人妻| 99伊人久久精品亚洲午夜| 国产免费久久精品99久久| 久久综合九色综合网站| 国产一级在线现免费观看| 美腿丝袜网址亚洲av| 久久777国产线看观看精品| 久久精品免费观看国产| 国产精品一区二区在线观看完整版| 中文字幕av久久激情亚洲精品| 亚洲综合日韩一二三区| 国产xxxxx在线观看| 欧美一欧美一区二三区性| 婷婷开心五月综合基地| 国产自拍偷拍精品视频在线观看| 欧美寡妇xxxx黑人猛交| 澳门毛片精品一区二区三区| 女同久久精品国产99国产精| 变态调教一区二区三区女同| 国产精品久久国产三级国不卡顿| 亚洲AV肉丝网站一区二区无码| 久久2020精品免费网站| 欧美伦费免费全部午夜最新| 国产zzjjzzjj视频全免费| 91网红福利精品区一区二| 日本精品一级二区三级| 性猛交╳xxx乱大交| 84pao强力打造免费视频34| av东京热一区二区三区| 日本一级特黄aa大片| 久久不见久久见免费影院www| 精品综合久久久久久8888| 日韩精品国产精品亚洲毛片| 先锋五月婷婷丁香草草| 91视频香蕉| 亚洲精品在线观看自拍|