亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于有限數(shù)據(jù)集的圖像快速生成改進方法*

        2019-06-10 07:00:56張家亮何志鵬王媛媛
        通信技術(shù) 2019年5期
        關(guān)鍵詞:正則網(wǎng)絡(luò)結(jié)構(gòu)編碼器

        張家亮,何志鵬,王媛媛,曾 兵,沈 宜,賈 宇

        (1.成都三零凱天通信實業(yè)有限公司,四川 成都 610041;2.電子科技大學(xué) 信息與通信工程學(xué)院,四川 成都 611731; 3.烏魯木齊市公安局 網(wǎng)絡(luò)安全保衛(wèi)支隊,新疆 烏魯木齊 830000)

        0 引 言

        生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks, GAN)[1]自2014年Ian Goodfellow提出以來,受到了學(xué)術(shù)界的持續(xù)關(guān)注。生成對抗網(wǎng)絡(luò)在諸多領(lǐng)域都有廣泛的應(yīng)用,如圖像生成、圖像去模糊以及文字轉(zhuǎn)換為圖像等。雖然在這些領(lǐng)域有著優(yōu)于傳統(tǒng)方法的優(yōu)勢,但是生成對抗網(wǎng)絡(luò)本身存在的訓(xùn)練不穩(wěn)定性和模式崩潰問題也不容忽視。針對這兩個問題,學(xué)術(shù)界提出了許多改進方法,其中David Berthelot提出的BEGAN[2]提供了一種新的GAN網(wǎng)絡(luò)結(jié)構(gòu),只使用標(biāo)準(zhǔn)的訓(xùn)練方式可以穩(wěn)定收斂,同時提供了一個超參數(shù)來均衡圖像的多樣性和生成質(zhì)量以及一種收斂程度的估計,但是該結(jié)構(gòu)需要大量的圖像作為訓(xùn)練集才能使生成器較好地學(xué)習(xí)到真實圖像的數(shù)據(jù)分布,且需要訓(xùn)練多個批次才能使網(wǎng)絡(luò)達(dá)到穩(wěn)定狀態(tài)。

        為了能夠在有限數(shù)據(jù)集上快速生成圖像,本文基于BEGAN和變分自編碼器(Variational Auto Encoder,VAE)[3],采取兩個生成模型并聯(lián)的方式,利用變分自編碼器提取真實圖像的編碼信息,將VAE的重建圖像視為虛假圖像,以提高判別器區(qū)分真假圖像的難度。特別是在訓(xùn)練前期,可進一步提高模型訓(xùn)練的穩(wěn)定性,緩解了模式崩潰問題,通過正則化項供給生成器有效的真實數(shù)據(jù)分布信息加快了學(xué)習(xí)過程。

        1 生成對抗網(wǎng)絡(luò)

        1.1 生成對抗網(wǎng)絡(luò)模型簡介

        生成對抗網(wǎng)絡(luò)主要由兩個模塊構(gòu)成——生成器G和判別器D。生成器輸入為隨機噪聲Z,噪聲經(jīng)過生成器G映射到新的數(shù)據(jù)空間,得到生成數(shù)據(jù)G(Z);判別器的輸入為真實圖像與生成的虛假圖像,可以簡單理解為一個二分類器,用于判別圖像的來源。判別器輸入為x,代表一張圖像,輸出D(x)表示x為真實圖像的概率。若D(x)=1,則代表x為真實圖像;若D(x)=0,則代表x為虛假圖像。該網(wǎng)絡(luò)模型的主要思想是對抗訓(xùn)練思想。訓(xùn)練過程中,生成器更新參數(shù)生成與真實圖像分布相似的虛假圖像,以欺騙判別器D;判別器D增強區(qū)分真實圖像與虛假圖像的能力。如此循環(huán)訓(xùn)練,直到判別器無法辨別圖像的來源,即D(x)=0.5,網(wǎng)絡(luò)達(dá)到納什均衡,生成器G和判別器D無法再提高各自生成與判別能力,訓(xùn)練結(jié)束。

        1.2 標(biāo)準(zhǔn)生成對抗網(wǎng)絡(luò)模型

        標(biāo)準(zhǔn)生成對抗網(wǎng)絡(luò)的模型如圖1所示。

        圖1 標(biāo)準(zhǔn)生成對抗網(wǎng)絡(luò)模型

        1.3 生成對抗網(wǎng)絡(luò)的損失函數(shù)

        原始生成對抗網(wǎng)絡(luò)的目標(biāo)函數(shù)為:

        其中V(D,G)表示生成對抗網(wǎng)絡(luò)中的目標(biāo)函數(shù),x~pr表示x服從訓(xùn)練集中的真實圖像分布pr;z~pz(z)表示z服從的某一隨機噪聲分布;E[·]表示求數(shù)學(xué)期望。

        2 變分自編碼器

        2.1 變分自編碼器簡介

        變分自編碼器VAE與生成對抗網(wǎng)絡(luò)的目標(biāo),都是希望構(gòu)建一個從隨機噪聲Z到生成數(shù)據(jù)X的模型。VAE的主要模塊分別為編碼器和解碼器,其中編碼器負(fù)責(zé)將高維空間中的圖像轉(zhuǎn)化為一個低維空間的向量Z。給定一張圖像Xk,假定p(Z|Xk)是專屬于Xk的后驗概率分布,而這個概率分布服從正態(tài)分布。如果能夠得到這個概率,就可以從分布中采樣,并且通過解碼器將圖像從低維空間映射回高維空間,從而達(dá)到恢復(fù)圖像的目的。

        2.2 重參數(shù)化技巧

        需要從p(Z|Xk)中采樣Zk,而采樣操作是不可導(dǎo)的,采樣結(jié)果是可導(dǎo)的。于是,從N(0,I)中采樣一個ε,令Z=μ+εσ就相當(dāng)于從N(μ,σ2)中采樣一個Z。所以,將從N(μ,σ2)中采樣變成從N(0,I)采樣,然后通過參數(shù)變換得到N(μ,σ2)中采樣的結(jié)果。這樣“采樣”操作就不用參與梯度下降,改為采樣的結(jié)果參與,而采樣的結(jié)果是可導(dǎo)的,從而使得整個模型能夠訓(xùn)練,即VAE中重參數(shù)化的技巧。

        2.3 變分自編碼器的損失函數(shù)

        變分自編碼的損失函數(shù)由兩個部分組成:原始圖像與重建圖像之間的重建損失,后驗概率分布與標(biāo)準(zhǔn)正態(tài)分布之間的正則項。

        2.3.1 重建損失

        交叉熵度量:

        均方誤差度量:

        其中,x表示原始圖像,x^表示重建后的圖像。Lrecon越小,表示原始圖像與重建圖像越接近。

        2.3.2 正則項

        正則項為采樣與標(biāo)準(zhǔn)正態(tài)分布之間的相對熵,化簡可得:

        3 模型架構(gòu)與損失函數(shù)

        3.1 BEGAN

        3.1.1 BEGAN的網(wǎng)絡(luò)結(jié)構(gòu)

        BEGAN沒有采用其他GAN估計概率分布的方法,不直接估計生成圖像的數(shù)據(jù)分布和真實圖像分布之間的差距,而是改為估計分布的誤差之間的差距。為了估計分布的誤差,BEGAN與EBGAN[4]類似,也將判別器設(shè)計為自編碼器結(jié)構(gòu),輸入和輸出的圖像大小相同。BEGAN的網(wǎng)絡(luò)模型如圖2所示。

        圖2 BEGAN網(wǎng)絡(luò)結(jié)構(gòu)

        3.1.2 BEGAN的損失函數(shù)設(shè)計

        BEGAN估計分布誤差之間的差距,采用范數(shù)衡量圖像分布的誤差,具體函數(shù)如下:

        其中,L(v)是一個像素誤差的損失,表示圖像v與經(jīng)過判別器D之后的輸出D(v)之間的相似程度;L(v)越小,則說明v、D(v)越接近。LD表示判別器的損失函數(shù),LG表示生成器的損失函數(shù),x表示真實圖像,L(·)表示圖像與經(jīng)過判別器D之后輸出的像素誤差,z表示隨機噪聲分布,kt∈[0,1]控制L(G(z))在梯度下降時的比例實現(xiàn),λk為k的學(xué)習(xí)率。γ∈[0,1]為比例系數(shù),用于均衡生成圖像的生成質(zhì)量和多樣性。γ越小,多樣性越差,生成質(zhì)量越高。mglobal表示訓(xùn)練程度的好壞,越小,訓(xùn)練程度越好。

        3.2 改進的BEGAN

        3.2.1 改進的BEGAN的網(wǎng)絡(luò)結(jié)構(gòu)

        為了在有限數(shù)據(jù)集上快速生成圖像,將BEGAN 與VAE結(jié)合,利用VAE提取真實圖像的數(shù)據(jù)分布,并且將VAE的重建圖像也視為虛假圖像,增加了判別器辨別真假圖像的能力,特別是在訓(xùn)練前期能夠進一步穩(wěn)定模型的訓(xùn)練。通過設(shè)計的正則項,生成器可以獲取VAE提取的真實圖像信息,達(dá)到加快圖像生成和在有限數(shù)據(jù)集上生成圖像的目的。改進后的BEGAN網(wǎng)絡(luò)模型如圖3所示。

        圖3 改進的BEGAN網(wǎng)絡(luò)模型

        3.2.2 改進的BEGAN的損失函數(shù)設(shè)計

        通過正則化項獲取變分自編碼器提取的真實圖像信息,若潛空間變量越相似,那么得到的生成圖像也應(yīng)該越相似。

        其中,Lreg為設(shè)計的正則化項,L1表示L1范數(shù)約束,為潛空間變量與生成圖像之間的維度比例[5]。

        其中,LVAE表示變分自編碼器的損失函數(shù),Lrecon表示變分自編碼器的重建損失,本文實驗中使用L2范數(shù)。Lμ,σ2表示重參數(shù)化的正則項,kg,kvae∈[0,1]分別控制L(G(z))、L(VAE(x))在梯度下降時的比例實現(xiàn),λk為k的學(xué)習(xí)率,γ∈[0,1]為比例系數(shù),用于均衡生成圖像的生成質(zhì)量和多樣性,γ越小,多樣性越差,生成質(zhì)量越高,α,β為正則化項的比例系數(shù),mglobal表示訓(xùn)練程度的好壞,越小訓(xùn)練程度越好。

        3.2.3 改進的BEGAN的模型訓(xùn)練機制

        模型訓(xùn)練的基本思想是對抗訓(xùn)練思想,訓(xùn)練大體流程與BEGAN一致。由于在模型中加入了變分自編碼器,所以模型訓(xùn)練的步驟可歸納為以下四個步驟:

        (1)訓(xùn)練判別網(wǎng)絡(luò),降低判別網(wǎng)絡(luò)的損失函數(shù),盡可能判別出圖像的真假。

        (2)訓(xùn)練變分自編碼器,使得變分自編碼器盡可能生成接近于真實樣本的圖像,為生成網(wǎng)絡(luò)的更新提供信息,增加判別網(wǎng)絡(luò)辨別圖像來源的難度。

        (3)訓(xùn)練生成網(wǎng)絡(luò),通過正則化項獲取變分自編碼器提取的潛變量信息,盡可能生成真實的圖像去迷惑判別網(wǎng)絡(luò),達(dá)到對抗訓(xùn)練的目的。

        (4)經(jīng)過三個網(wǎng)絡(luò)的不斷循環(huán)訓(xùn)練,直至判別網(wǎng)絡(luò)無法區(qū)分其輸入圖像的來源,即D(x)=0.5,標(biāo)志著訓(xùn)練達(dá)到平衡,各網(wǎng)絡(luò)無法再通過參數(shù)優(yōu)化提高能力,此時生成網(wǎng)絡(luò)的生成能力達(dá)到最佳,能夠生成高質(zhì)量和高多樣性的圖像。

        4 實驗與分析

        4.1 具體實驗?zāi)P团c參數(shù)

        BEGAN基本上解決了GAN訓(xùn)練的不穩(wěn)定性和模式崩潰問題。本文使用CelebA人臉數(shù)據(jù)集,將人臉數(shù)據(jù)統(tǒng)一裁剪為128×128×3大小的圖像,對原始BEGAN與改進后的BEGAN進行對比實驗。為了驗證改進模型在少量數(shù)據(jù)集上的圖像生成效果,分別采用1萬張和8萬張人臉圖像對兩個網(wǎng)絡(luò)模型進行訓(xùn)練。改進的BEGAN網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,其中具體的判別器網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示;變分自編碼器網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示,生成器網(wǎng)絡(luò)結(jié)構(gòu)如 圖6所示。

        圖4 判別器網(wǎng)絡(luò)結(jié)構(gòu)

        圖5 變分自編碼器網(wǎng)絡(luò)結(jié)構(gòu)

        圖6 生成器網(wǎng)絡(luò)結(jié)構(gòu)

        相關(guān)參數(shù)設(shè)置為:epoch=50,batch_size=25,lr=0.000 1,m=0.5,m2=0.999,γ=0.7,λk=0.001,fn=128,z=128,α=0.2,β=0.1。其中epoch表示迭代次數(shù);batch_size表示批處理大??;lr表示學(xué)習(xí)率;m、m2分別表示Adam優(yōu)化器的兩個參數(shù);γ用于在生成圖像質(zhì)量和多樣性之間做調(diào)節(jié),γ越高,圖像的多樣性越高;λk表示kg、kvae更新時的步長;fn表示卷積核個數(shù);z表示噪聲維度,α、β分別表示正則項的比例系數(shù)。

        4.2 實驗結(jié)果

        4.2.1 1萬數(shù)據(jù)集

        下面將分析訓(xùn)練集為1萬張人臉圖像時,BEGAN和改進的BEGAN的訓(xùn)練結(jié)果。其中,圖7為BEGAN訓(xùn)練過程中分別迭代2 500次、5 000次、10 000次、15 000次和20 000次生成的圖像。

        圖7 BEGAN訓(xùn)練中生成圖像

        圖8 為改進后的BEGAN訓(xùn)練過程中分別迭代2 500次、5 000次、10 000次、15 000次和20 000次生成的圖像。圖9為BEGAN訓(xùn)練完成后由隨機噪聲生成的5組圖像。圖10為改進后的BEGAN訓(xùn)練完成后由隨機噪聲生成的5組圖像。

        圖8 改進后的BEGAN訓(xùn)練中生成圖像

        圖9 BEGAN完成訓(xùn)練后生成的5組圖像

        圖10 改進后的BEGAN完成訓(xùn)練后生成的5組圖像

        4.2.2 8萬數(shù)據(jù)集

        下面是訓(xùn)練集為8萬張人臉圖像時,BEGAN和改進的BEGAN的訓(xùn)練結(jié)果。其中,圖11為BEGAN訓(xùn)練過程中分別迭代2 500次、5 000次、10 000次、15 000次和20 000次生成的圖像。圖12為改進后的BEGAN訓(xùn)練過程中分別迭代2 500次、 5 000次、10 000次、15 000次和20 000次生成的圖像。圖13為BEGAN訓(xùn)練完成后由隨機噪聲生成的5組圖像。圖14為改進后的BEGAN訓(xùn)練完成后由隨機噪聲生成的5組圖像。

        圖11 BEGAN訓(xùn)練中生成圖像

        圖12 改進后的BEGAN訓(xùn)練中生成圖像

        圖13 BEGAN完成訓(xùn)練后生成的5組圖像

        圖14 改進后的BEGAN完成訓(xùn)練后生成的5組圖像

        4.3 實驗結(jié)果分析

        在不同量級數(shù)據(jù)集上的對比實驗數(shù)據(jù)表明,改進后的BEGAN可以更快地學(xué)習(xí)到圖像的特征,特別是基于1萬CelebA人臉數(shù)據(jù)集,生成圖像的質(zhì)量與多樣性都遠(yuǎn)遠(yuǎn)高于原始的BEGAN,且訓(xùn)練過程中的穩(wěn)定性較高,即使減少了訓(xùn)練的迭代次數(shù),也能生成高質(zhì)量與多樣性并存的圖像。

        5 結(jié) 語

        本文提出了一種使用變分自編碼器提取真實圖像信息,并將重建圖像視為虛假圖像來改進BEGAN的方法。經(jīng)試驗對比分析,該改進BEGAN的方法有可能實現(xiàn)基于少量數(shù)據(jù)集快速生成高質(zhì)量和高多樣性圖像的目的。此外,該改進方法依然存在許多可以持續(xù)改進的地方,如在網(wǎng)絡(luò)結(jié)構(gòu)中加入ResNet模塊,使用逆卷積代替resize操作對圖像進行縮放等,以實現(xiàn)對BEGAN更進一步的 改進。

        猜你喜歡
        正則網(wǎng)絡(luò)結(jié)構(gòu)編碼器
        剩余有限Minimax可解群的4階正則自同構(gòu)
        類似于VNL環(huán)的環(huán)
        基于FPGA的同步機軸角編碼器
        基于PRBS檢測的8B/IOB編碼器設(shè)計
        基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
        知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
        滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實證分析
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計
        電子器件(2015年5期)2015-12-29 08:42:24
        復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進展
        有限秩的可解群的正則自同構(gòu)
        亚洲av日韩av天堂一区二区三区| 可以免费观看的毛片| 99精品欧美一区二区三区美图| 亚洲综合天堂av网站在线观看| 一区二区国产av网站| 亚洲精品久久| 亚洲另类激情综合偷自拍图| 精品久久久无码不卡| 久久精品国产亚洲av麻豆床戏 | av网页在线免费观看| 风韵人妻丰满熟妇老熟女视频| 亚洲成在人线av品善网好看| 亚洲av色福利天堂| 国产精品一区二区三密桃| 狠狠爱婷婷网五月天久久| 爱性久久久久久久久| 国产在线播放网址| 国产肥熟女视频一区二区三区| av免费在线播放视频| 欧美内射深喉中文字幕| 国产在线网址| 538亚洲欧美国产日韩在线精品| 国产又大大紧一区二区三区| 日韩人妻少妇一区二区三区| 国产精品毛片无码| 色二av手机版在线| 国产一区二区三区免费精品视频| 欧美真人性野外做爰| 伊人久久大香线蕉免费视频 | 五十路熟妇亲子交尾| 偷拍女厕尿尿在线免费看| 亚洲天堂精品成人影院| 中文字字幕在线精品乱码| 中文字幕乱偷乱码亚洲| 男人一插就想射的原因| 99热在线观看| 国产又爽又黄的激情精品视频| 日韩成精品视频在线观看| 图片小说视频一区二区| aaaaaa级特色特黄的毛片| 亚洲AV秘 无套一区二区三区 |