亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于VGG神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像風(fēng)格遷移的方法

        2022-09-20 02:57:28謝志明劉少鍇蔡少霖
        現(xiàn)代計(jì)算機(jī) 2022年14期
        關(guān)鍵詞:特征內(nèi)容效果

        謝志明,劉少鍇,蔡少霖

        (汕尾職業(yè)技術(shù)學(xué)院工程學(xué)院,汕尾 516600)

        0 引言

        自1987年Alexander Waibel等人提出第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)——時(shí)延網(wǎng)絡(luò)(TDNN),和1988年Zhang提出平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(SIANN),CNN仍然不被人們所熟知和關(guān)注,直到LeCun于1998年提出基于CNN構(gòu)建的LeNet-5模型并成功應(yīng)用于手寫數(shù)字識(shí)別,該模型的成功使得CNN的應(yīng)用得到空前的關(guān)注及大批學(xué)者參與研究。2006年深度學(xué)習(xí)理論提出后,CNN得到更進(jìn)一步的研究,兩者相輔相成,CNN的深入研究推動(dòng)著深度學(xué)習(xí)不斷快速向前發(fā)展。2015年Gatys等提出運(yùn)用CNN來實(shí)現(xiàn)圖像風(fēng)格遷移這一目標(biāo),通過分類目標(biāo)內(nèi)容圖像A的內(nèi)容特征和參考風(fēng)格圖像B的風(fēng)格特征實(shí)現(xiàn)圖像風(fēng)格遷移,獲得了非??捎^的藝術(shù)效果,此外關(guān)于這方面的諸多研究成果還成功轉(zhuǎn)化成商業(yè)應(yīng)用。為此,本文實(shí)驗(yàn)將依據(jù)VGG算法模型并結(jié)合TensorFlow2框架,利用神經(jīng)網(wǎng)絡(luò)遷移開展圖像風(fēng)格遷移應(yīng)用研究。

        1 VGG網(wǎng)絡(luò)簡(jiǎn)介

        VGGNet由牛津大學(xué)的視覺幾何組(visual geometry group,VGG)提出,并在2014年舉辦的ILSVRC賽項(xiàng)中獲得了定位任務(wù)第1名和分類任務(wù)第2名的成績(jī)。VGGNet網(wǎng)絡(luò)結(jié)構(gòu)是通過改良AlexNet的層數(shù)得到的,AlexNet是2012年ImageNet競(jìng)賽目標(biāo)識(shí)別任務(wù)賽項(xiàng)的冠軍,該網(wǎng)絡(luò)在LeNet思想啟發(fā)下將CNN應(yīng)用到更深更寬的網(wǎng)絡(luò)中,效果提升明顯。此后,VGGNet在AlexNet基礎(chǔ)上對(duì)CNN網(wǎng)絡(luò)進(jìn)一步改良的過程中發(fā)現(xiàn)網(wǎng)絡(luò)深度與性能的相關(guān)性,通過持續(xù)性地添加小尺寸卷積核來代替大卷積核,當(dāng)網(wǎng)絡(luò)堆疊到一定層數(shù)后,網(wǎng)絡(luò)效果得到進(jìn)一步改善。目前,主流的VGGNet網(wǎng)絡(luò)結(jié)構(gòu)主要有六種配置模式,其效果展示如表1所列。

        從表1可以發(fā)現(xiàn)VGG六種配置中,VGG-16和VGG-19效果最好,由于VGG-16網(wǎng)絡(luò)結(jié)構(gòu)相較簡(jiǎn)單,比VGG-19少了3個(gè)卷積層,參數(shù)量也相對(duì)較少,因此從理論上來說更加適合神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)。后面我們將通過實(shí)驗(yàn)對(duì)其驗(yàn)證,找到最佳VGG模型并進(jìn)行優(yōu)化。

        表1 VGGNet網(wǎng)絡(luò)配置效果及參數(shù)量

        2 VGG-19網(wǎng)絡(luò)結(jié)構(gòu)模型

        VGG模型是由Simonyan等于2014年提出的,模型非常簡(jiǎn)單,只有卷積層、最大池化層和全連接層。VGG模型首次提出了小卷積核的優(yōu)勢(shì),在卷積層使用小尺寸卷積核(3×3)可添加更多的卷積層,使得網(wǎng)絡(luò)層次變得更深。VGG-19相比AlexNet的一個(gè)重要改進(jìn)是采用連續(xù)的3×3的卷積核代替AlexNet中的較大卷積核(11×11,7×7,5×5),研究發(fā)現(xiàn)小卷積核的疊加可以使其感受野達(dá)到大卷積核的效果。比如2個(gè)3×3的卷積核疊加,它們的感受野等同于1個(gè)5×5的卷積核,疊加3個(gè)卷積核則感受野相當(dāng)于1個(gè)7×7的效果,由于感受野相同,又使用ReLU激活函數(shù),網(wǎng)絡(luò)增加了非線性表達(dá)能力,從而可以提供更復(fù)雜的模式學(xué)習(xí)。

        VGG-19共有16個(gè)卷積層,3個(gè)全連接層,比VGG-16多了3個(gè)卷積層,其全部采用3×3卷積核,步長(zhǎng)和Padding統(tǒng)一為1,最大池化層為2×2,N個(gè)卷積層和后面緊接的最大池化層為一個(gè)block。VGG-19和VGG-16一樣,都共有5個(gè)block,每個(gè)block的通道數(shù)一致,最大池化層減少特征圖的尺寸。隨著卷積層一層層的運(yùn)算,卷積核輸出的內(nèi)容變得越來越抽象,特征圖尺寸和留存信息變小變少。Block5完成后將特征圖平鋪成一維數(shù)據(jù)作為全連接層的輸入。最后3層為全連接層,前2層每層具有4096個(gè)神經(jīng)元,使用ReLU非線性激活函數(shù),第3層有1000個(gè)神經(jīng)元(1000個(gè)類別)使用softmax函數(shù)。VGG-19網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        圖1 VGG-19神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)

        3 風(fēng)格損失

        Gatys等認(rèn)為風(fēng)格參考圖片與生成圖片之間會(huì)在不同的層激活過程中保留相似的內(nèi)部相互關(guān)系。風(fēng)格損失使用了CNN多個(gè)層,并從所有空間尺度上而非單一尺度上提取風(fēng)格參考圖像外觀特征,依據(jù)特征之間相互關(guān)系映射在特定空間尺度下模式的統(tǒng)計(jì)規(guī)律,使用層激活的格拉姆矩陣(Gram matrix),即某一層特征圖的內(nèi)積。風(fēng)格損失主要有以下兩個(gè)特點(diǎn):

        (1)在目標(biāo)內(nèi)容圖像和生成圖像之間保持相似的較高層激活能夠保留內(nèi)容。卷積神經(jīng)網(wǎng)絡(luò)能夠“看到”目標(biāo)圖像和生成圖像包含相同的內(nèi)容;

        (2)通過在較低和較高的激活層中保持類似的內(nèi)部相互關(guān)系能夠保留風(fēng)格。特征相互關(guān)系捕捉到的是紋理,生成圖像和風(fēng)格參考圖像在不同的空間尺度上具有相同的紋理。

        4 實(shí)驗(yàn)與分析

        4.1 實(shí)驗(yàn)環(huán)境

        本實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境為Windows7+Python3.8+TensorFlow2.3.0,CPU為3.40GHz的Inter i7-6700,內(nèi)存為DDR4 16 G,顯卡為NVIDIA GT-720 2 G,CUDA為10.2,使用的神經(jīng)網(wǎng)絡(luò)模型為VGG-16和VGG-19。

        4.2 實(shí)驗(yàn)實(shí)現(xiàn)過程

        (1)導(dǎo)入相關(guān)庫(kù),如TensorFlow,IPython,numpy,matplotlib和time模塊;

        (2)自定義編寫圖片預(yù)處理函數(shù),將加載的圖片解碼成像素值數(shù)組并做歸一化處理;

        (3)從VGG中挑出風(fēng)格層和內(nèi)容層,風(fēng)格層的輸出旨在代表風(fēng)格圖片的特征,內(nèi)容層的輸出旨在表示內(nèi)容圖片的特征;

        (4)對(duì)VGG模型輸出重新定義,因?yàn)樵嫉腣GG輸出為分類結(jié)果,而風(fēng)格遷移時(shí)需要輸出的是兩張圖片的特征;

        (6)建立風(fēng)格遷移模型,得到風(fēng)格圖片的風(fēng)格特征和內(nèi)容圖片的內(nèi)容特征;

        (7)定義優(yōu)化函數(shù)和損失函數(shù),模型訓(xùn)練不斷迭代,得到風(fēng)格遷移圖片。

        4.3 內(nèi)容層和風(fēng)格層選取

        本組實(shí)驗(yàn)選取一張海龜為內(nèi)容圖片,隨機(jī)選取康丁斯基的一幅抽象畫為風(fēng)格圖片,同時(shí)選擇多組內(nèi)容層參數(shù)和風(fēng)格層參數(shù)進(jìn)行風(fēng)格遷移實(shí)驗(yàn),找到最佳的參數(shù)組合。如圖2所示。

        圖2 不同內(nèi)容層和風(fēng)格層的圖像風(fēng)格遷移結(jié)果

        通過實(shí)驗(yàn)我們找到最佳內(nèi)容層和風(fēng)格層組合為content_layers=[‘block5_conv2’],style_layers=[‘block1_conv1’,‘block2_conv1’,‘block3_conv1’,‘block4_conv1’,‘block5_conv1’],同時(shí)從圖2中發(fā)現(xiàn)選取的內(nèi)容層越靠前,內(nèi)容圖片保存的數(shù)據(jù)就越豐富,而要得到較好風(fēng)格圖片數(shù)據(jù)盡量選取各blocks的靠前卷積層,這樣得到的風(fēng)格數(shù)據(jù)會(huì)更多。

        4.4 不同模型對(duì)風(fēng)格遷移結(jié)果的分析

        本組實(shí)驗(yàn)根據(jù)找到最佳內(nèi)容層和風(fēng)格層參數(shù)組合,選擇VGG-16和VGG-19模型來對(duì)比圖像風(fēng)格遷移效果,內(nèi)容圖片和風(fēng)格圖片選取不變,根據(jù)訓(xùn)練迭代次數(shù)的不同,觀察不同迭代次數(shù)遷移結(jié)果圖像的色彩特征及紋理特征。如圖3所示。

        圖3 不同模型不同迭代次數(shù)的圖像風(fēng)格遷移結(jié)果

        從圖3可以看出,VGG-16和VGG-19風(fēng)格遷移效果都還是比較成功的,相比之下,VGG-19的圖像色彩表現(xiàn)得更加豐富自然,紋理也更加清晰明亮,這和參數(shù)量多了6 M有一定的關(guān)系,實(shí)驗(yàn)過程還發(fā)現(xiàn)相同條件下訓(xùn)練迭代1000次后,VGG-19耗時(shí)會(huì)更長(zhǎng),比VGG-16多了500秒左右。

        4.5 不同風(fēng)格圖像對(duì)風(fēng)格遷移結(jié)果的分析

        本組實(shí)驗(yàn)仍然選擇同一張海龜為內(nèi)容圖片,并選取4張出自不同畫家的風(fēng)格圖片,以風(fēng)格遷移效果最優(yōu)的VGG-19為網(wǎng)絡(luò)模型,在相同的訓(xùn)練迭代次數(shù)(1000次)的情況下,得到的圖像風(fēng)格遷移結(jié)果分別如圖4所示。

        圖4 不同風(fēng)格圖片迭代1000次的圖像風(fēng)格遷移結(jié)果

        從圖4可以看出,當(dāng)采用同一內(nèi)容圖像,不同的風(fēng)格圖像,在相同的模型參數(shù)和訓(xùn)練次數(shù)的情況下,風(fēng)格遷移結(jié)果也各不相同,展現(xiàn)的色彩特征、紋理特征等也存在較大差異;此外,我們還發(fā)現(xiàn)使用總變分損失可以有效減少因圖片本身小而花紋經(jīng)頻繁卷積加強(qiáng)后被強(qiáng)化的噪聲,因此有很好的降噪作用,這也正體現(xiàn)了VGG網(wǎng)絡(luò)結(jié)構(gòu)具有很好的魯棒性和普適性。

        5 結(jié)語(yǔ)

        本文以TensorFlow2為深度學(xué)習(xí)框架、VGG為網(wǎng)絡(luò)模型,通過實(shí)驗(yàn)分析圖像風(fēng)格遷移的有效性。VGGNet通過使用小卷積核代替大卷積核,有效地加深了網(wǎng)絡(luò)深度,并使用ReLU作為激活函數(shù),提升了復(fù)雜模式的學(xué)習(xí)能力。通過實(shí)驗(yàn)對(duì)比VGG-16和VGG-19兩種網(wǎng)絡(luò)結(jié)構(gòu),找到最佳的風(fēng)格遷移效果模型為VGG-19;最后使用多張不同風(fēng)格圖片放到VGG-19模型中來驗(yàn)證圖像風(fēng)格遷移效果,發(fā)現(xiàn)遷移后的圖像既保證了內(nèi)容圖像的完整性,同時(shí)具有風(fēng)格圖像的色彩、紋理等特性,符合圖像風(fēng)格遷移特點(diǎn),效果較好。

        猜你喜歡
        特征內(nèi)容效果
        內(nèi)容回顧溫故知新
        按摩效果確有理論依據(jù)
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        迅速制造慢門虛化效果
        抓住“瞬間性”效果
        抓住特征巧觀察
        模擬百種唇妝效果
        Coco薇(2016年8期)2016-10-09 02:11:50
        主要內(nèi)容
        臺(tái)聲(2016年2期)2016-09-16 01:06:53
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        婷婷久久亚洲中文字幕| 女人色毛片女人色毛片18| 精品久久久久久久久免费午夜福利| 久久精品国产亚洲AV古装片 | 国产一区二区三区男人吃奶| 亚洲一区二区高清在线| 久久精品亚洲精品国产区| 亚洲毛片在线观看免费| 免费在线观看视频播放| 性欧美老人牲交xxxxx视频| 欧美jizzhd精品欧美| 久久久无码一区二区三区| 日韩免费高清视频网站| 女同成片av免费观看| av在线播放免费网站| 夫妇交换性三中文字幕| 91精品一区国产高清在线gif| 亚洲熟妇夜夜一区二区三区 | 国产猛烈高潮尖叫视频免费| 日本大尺度吃奶呻吟视频| 国产成人cao在线| 97国产精品麻豆性色| 亚洲国产成人久久精品不卡| 欧美伦费免费全部午夜最新| 久久精品国产亚洲av大全| 人妻人妻少妇在线系列| 日本av在线精品视频| 久久精品不卡一区二区三区| 中文字幕丰满乱子无码视频| 精品一区二区久久久久久久网站| 亚洲免费视频播放| 国内自拍偷拍一区二区| 大奶白浆视频在线观看| 精品国产免费一区二区三区| 免费人成再在线观看网站| 日本一区二区亚洲三区| 国产麻豆久久av入口| 欧美aaaaaa级午夜福利视频| 久久这里都是精品一区| 久久国产成人午夜av影院| 成年视频国产免费观看|