亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進型任意風(fēng)格快速遷移元網(wǎng)絡(luò)算法*

        2020-05-13 04:51:50劉運鑫江愛文葉繼華王明文
        計算機與生活 2020年5期
        關(guān)鍵詞:風(fēng)格化方差均值

        劉運鑫,江愛文,葉繼華,王明文

        江西師范大學(xué) 計算機信息工程學(xué)院,南昌 330022

        1 引言

        圖像風(fēng)格遷移是圖像紋理遷移的擴展,可以理解為提取風(fēng)格圖中的風(fēng)格(紋理、顏色等),并與內(nèi)容圖相結(jié)合,進行圖像重建,生成風(fēng)格化的結(jié)果圖。由于技術(shù)的局限性,傳統(tǒng)技術(shù)只能做到紋理遷移,但隨著卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,Gatys 等人[1]開辟了基于深度學(xué)習(xí)的風(fēng)格遷移研究領(lǐng)域。他們的實驗結(jié)果表明,圖片的風(fēng)格和內(nèi)容可以被深度卷積神經(jīng)網(wǎng)絡(luò)分離并提取,通過不同內(nèi)容和風(fēng)格的融合,達到圖像風(fēng)格遷移的目的。他們提出利用Gram 矩陣作為風(fēng)格統(tǒng)計量和損失,并證明相同風(fēng)格的圖片Gram 矩陣是相同的。他們的方法可以對任意尺寸的圖像實現(xiàn)風(fēng)格遷移并且能夠生成相對高質(zhì)量的風(fēng)格化圖片。但是,他們的方法優(yōu)化過程十分緩慢,需要使用數(shù)百次的梯度下降過程來逼近最優(yōu)的圖像解,無法做到實時性。一旦更換目標(biāo)遷移的風(fēng)格,模型就需要重新訓(xùn)練。因此,Gatys 等人[1]的方法是典型的單模型單風(fēng)格的風(fēng)格遷移算法。

        除了Gram 矩陣作為損失函數(shù),Li 和Wand[2]提出了基于馬爾科夫隨機場(Markov random field,MRF)的非參數(shù)風(fēng)格遷移的算法。該算法核心是使用MRF損失來代替Gram 損失,文獻[3-5]都是此類非參數(shù)方法。除此以外,Li 等人[6]提出的均值和方差,Risser 等人[7]提出的直方圖損失,Peng 等人[8]提出的CORAL 損失均可以作為風(fēng)格損失來滿足風(fēng)格遷移的要求。

        Johnson 等人[9]改進了Gatys 等人[10]的方法,使用前饋網(wǎng)絡(luò)和感知損失進行風(fēng)格遷移,大大提升了風(fēng)格遷移的速度,在一定程度上做到了實時性。但是,此方法依然保留著對每一個新的風(fēng)格都需要重新訓(xùn)練一個新的模型的局限性。

        隨后出現(xiàn)了大量風(fēng)格遷移的算法,如文獻[11-13]中的單模型多風(fēng)格。他們能夠做到單一模型實現(xiàn)多個風(fēng)格遷移的效果。盡管如此,這些模型能夠遷移的風(fēng)格依然有限和固定。

        本文關(guān)注的是更具挑戰(zhàn)性和實際應(yīng)用價值的單模型任意風(fēng)格遷移[14-16]。

        Fig.1 Method results of Ref.[17]圖1 文獻[17]方法結(jié)果

        Shen 等人[17]提出基于元網(wǎng)絡(luò)的任意風(fēng)格遷移算法,成功實現(xiàn)了快速的任意風(fēng)格遷移,并且擁有良好的實驗結(jié)果,得到業(yè)界的廣泛關(guān)注。經(jīng)過反復(fù)實驗作者提供的源代碼,并仔細驗證Shen 等人[17]的方法,發(fā)現(xiàn)該算法在進行風(fēng)格遷移時,主要存在兩方面的缺陷:(1)風(fēng)格化后結(jié)果圖片總是出現(xiàn)明顯風(fēng)格不一致的不協(xié)調(diào)像素缺塊,如圖1 所示。從圖1 中可以看出幾乎每一張圖片都有一個比較明顯的灰色橢圓形缺塊(在圖中已用紅框標(biāo)出)。在該算法中,這是一個普遍現(xiàn)象。(2)圖1 中風(fēng)格圖與風(fēng)格化后的結(jié)果圖,在顏色布局上通常并不一致。例如,Style3 的風(fēng)格示例圖,整體是藍白黑三色調(diào),但是得到的風(fēng)格化后的結(jié)果圖帶有大部分的米黃色色調(diào)。Style2 中也存在類似現(xiàn)象。這種色調(diào)不一致的現(xiàn)象反復(fù)出現(xiàn)。經(jīng)過多次實驗驗證發(fā)現(xiàn)該算法測試生成的結(jié)果圖顏色布局與訓(xùn)練過程中最后一張風(fēng)格圖相關(guān)(主要在顏色上受影響),導(dǎo)致風(fēng)格化后結(jié)果圖與風(fēng)格示例圖具有不一致的顏色布局。從圖1 中便可見一斑。風(fēng)格完全不同的Style1、Style2、Style3 對應(yīng)的風(fēng)格化結(jié)果圖在顏色色調(diào)上卻很接近。因此,此方法在遷移效果上,僅做到了紋理風(fēng)格的不完美遷移,并沒有完全做到風(fēng)格的任意遷移。

        為了避免風(fēng)格化結(jié)果圖出現(xiàn)明顯的不協(xié)調(diào)像素缺塊,且同時實現(xiàn)風(fēng)格化結(jié)果圖與風(fēng)格圖的顏色布局相一致,本文主要借鑒Gatys 等人[1]提出的Gram 矩陣,在風(fēng)格統(tǒng)計量和損失函數(shù)等方面對Shen 等人[17]方法進行了改進。通過實驗對比,本文改進的模型能夠較完美地解決前述兩方面的問題,實現(xiàn)良好、快速有效的任意風(fēng)格任意內(nèi)容的快速遷移。

        本文的主要貢獻在于:(1)將Gram 矩陣引入基于元網(wǎng)絡(luò)的任意風(fēng)格遷移算法框架并進行改進,有效解決了基準(zhǔn)方法的明顯缺陷,同時實現(xiàn)實時有效的任意內(nèi)容任意風(fēng)格的單圖像風(fēng)格遷移。(2)對于風(fēng)格遷移問題,通過充分的實驗驗證、理論分析,進一步厘清了Gram 矩陣統(tǒng)計量在算法收斂性和視覺效果上優(yōu)越性所在。

        2 基于Gram 矩陣的元網(wǎng)絡(luò)任意風(fēng)格遷移

        2.1 元網(wǎng)絡(luò)

        Shen 等人[17]提出的元網(wǎng)絡(luò)為兩層全連接層,輸入是風(fēng)格圖的組合特征向量,輸出向量用于對圖像轉(zhuǎn)換網(wǎng)絡(luò)(image transformation network,ITN)各卷積層的卷積核進行權(quán)重分配,以達到不同的風(fēng)格對應(yīng)不同的卷積核,最終實現(xiàn)任意風(fēng)格遷移的目的。他們將VGG16[18]中Relu1_2、Relu2_2、Relu3_3、Relu4_3 卷積層對應(yīng)的特征映射圖,求均值和方差,然后串聯(lián)成一維向量,輸入至元網(wǎng)絡(luò)的第一層全連接層。輸入向量的維度大小等于(64+128+256+512)×2=1 920。為了避免元網(wǎng)絡(luò)參數(shù)過大,第二層全連接層采用分組全連接層的思路:每組全連接輸入128 維,各組輸出對應(yīng)分配到特定卷積層權(quán)重。圖像轉(zhuǎn)換網(wǎng)絡(luò)的卷積層,包括下采樣卷積層2 層、殘差卷積層10 層、上采樣反卷積層2 層。因此,元網(wǎng)絡(luò)第二層的全連接層輸入大小為14×128=1 792 維。該方法的具體元網(wǎng)絡(luò)細節(jié)如圖2 所示,其他細節(jié)在此不再贅述。

        雖然均值和方差計算非常簡單,但作為風(fēng)格統(tǒng)計量,其包含的信息量有限,不足以表征風(fēng)格圖的特點,這也是Shen 等人[17]的方法存在前述缺陷的主要因素。本文主要借鑒Gatys 等人[1]提出的Gram 矩陣,改變了Shen 等人[17]方法中元網(wǎng)絡(luò)輸入信息和風(fēng)格損失計算方式。本文不再使用特征圖的均值和方差,而是使用VGG16 的Relu1_2、Relu2_2、Relu3_3、Relu4_3 的特征映射圖計算Gram 矩陣。

        相對于均值和方差,直接使用Gram 矩陣輸入至元網(wǎng)絡(luò)中,會使全連接層的參數(shù)變得非常大,整個網(wǎng)絡(luò)框架幾乎無法放進主流GPU(如11 GB顯存的GTX 1080TI)。為了既能最大程度保留Gram 矩陣信息豐富的特點,又能適當(dāng)縮小網(wǎng)絡(luò)參數(shù)規(guī)模,把尺寸最大的Relu4_3 層的Gram 矩陣(大小為512×512)進行了下采樣,采用平均池化將其大小變?yōu)樵瓉沓叽绲?/4。由于Gram 矩陣式對稱陣,選擇Gram 矩陣的上三角或下三角數(shù)值作為特征,再結(jié)合分組全連接的思路,最終能將整個網(wǎng)絡(luò)控制在合理參數(shù)規(guī)模范圍以內(nèi)。改進后的元網(wǎng)絡(luò)輸入信息是能夠有效表征風(fēng)格特點的Gram 矩陣,由4 個Gram 子矩陣64×64、128× 128、256×256、256×256 串聯(lián)而成。

        Fig.2 Meta network architecture圖2 元網(wǎng)絡(luò)框架

        2.2 內(nèi)容損失

        在內(nèi)容損失函數(shù)計算方面,本文保持和Shen 等人[17]方法一致。具體地,將風(fēng)格化結(jié)果圖和原始內(nèi)容圖分別經(jīng)過在ImageNet 預(yù)訓(xùn)練好的VGG16 網(wǎng)絡(luò),計算它們相同層對應(yīng)的特征圖之間的歐式距離。內(nèi)容損失公式如式(1)所示:

        其中,x為輸入的內(nèi)容圖像,像,F(xiàn)j(x)是處理圖像x時VGG16 網(wǎng)絡(luò)第j層的特征圖,尺寸為Cj×Wj×Hj。

        預(yù)訓(xùn)練好的VGG16 網(wǎng)絡(luò)參數(shù)在整個訓(xùn)練和測試過程中保持固定。

        2.3 風(fēng)格損失

        在風(fēng)格損失計算方面,Shen 等人[17]計算風(fēng)格化結(jié)果圖y分別經(jīng)過VGG16 的Relu1_2、Relu2_2、Relu3_3、Relu4_3 四層后的特征圖的均值和方差的歐式距離。

        Shen 等人[17]利用均值和方差代替Gram 矩陣作為風(fēng)格統(tǒng)計量的做法,雖然也能使風(fēng)格化后結(jié)果圖具有與風(fēng)格示例圖相似的紋理,且相對于Gram 矩陣計算速度更快,計算量更小,但是經(jīng)常很容易導(dǎo)致結(jié)果圖的整體風(fēng)格布局與風(fēng)格圖不相匹配或者匹配度較低,如Huang 等人[16]的方法便采用了均值和方差作為損失函數(shù)。該方法的風(fēng)格化結(jié)果圖像均帶有明顯的塊狀,以至于在視覺上他們的結(jié)果與其他方法存在差距。均值和方差作為風(fēng)格統(tǒng)計量并不適用于所有的框架。

        Gram 矩陣計算圖像特征之間的偏心協(xié)方差矩陣(即沒有減去均值的協(xié)方差矩陣)。定義矩陣Ψ表示大小為C×W×H特征圖Fk(x)。

        令Ψ=[f1,f2,…,fC],其中fi∈?WH是特征圖Fk(x)第i={1,2,…,C}個通道層對應(yīng)的特征平面的所有元素構(gòu)成的列向量。Gram 矩陣如式(2)所示:

        特征圖Fk(x)的方差和均值表示為σ=[σ1,σ2,…,σC],μ=[μ1,μ2,…,μC],其中均值向量元素,方差向量元素σi=(fi-μiI)T(fi-μiI)。類似地,可以計算協(xié)方差:

        從它們的數(shù)學(xué)計算過程也不難看出,Gram 矩陣計算是均值和方差計算的一般泛化形式,包含了比方差和均值更豐富的信息。Gram 矩陣可以度量特征各維度自身特性以及各維度之間的關(guān)系,能夠更全面表示特征圖Fk(x)的結(jié)構(gòu)特性,反映風(fēng)格的整體屬性。相比之下,均值和方差只能反映特征維度自身的特性。

        采用能更好適用于風(fēng)格特征表示的Gram 矩陣作為風(fēng)格損失,雖然會使計算量變大,也會使網(wǎng)絡(luò)整體框架變得更大,但是只要能進行合理優(yōu)化,是可以做到性能與計算代價的平衡。

        風(fēng)格損失如下:

        其中,G表示在VGG16 網(wǎng)絡(luò)中第j層的特征圖的Gram 矩陣。

        需要指出的是,雖然在元網(wǎng)絡(luò)輸入表示時,對Gram 矩陣進行池化操作,但在訓(xùn)練時,因為不涉及到網(wǎng)絡(luò)參數(shù)大小的問題,采用了原始大小的Gram 矩陣計算風(fēng)格損失。

        網(wǎng)絡(luò)最終的總損失函數(shù)如式(5)所示。

        其中,超參數(shù)α和β分別為內(nèi)容權(quán)重和風(fēng)格權(quán)重。

        作為用戶控制參數(shù),提高α/β的比值會使風(fēng)格化結(jié)果圖注重內(nèi)容信息,視覺上更偏向于內(nèi)容圖像;減小α/β風(fēng)格權(quán)重會使風(fēng)格化結(jié)果圖像注重風(fēng)格信息,使其更具有風(fēng)格化。

        2.4 神經(jīng)風(fēng)格遷移

        圖像轉(zhuǎn)換網(wǎng)絡(luò)(ITN)的權(quán)重(除了第一層和最后一層)由元網(wǎng)絡(luò)分配。改進模型的整體框架如圖3所示。

        圖3 所示的整體網(wǎng)絡(luò)的數(shù)據(jù)流向為:(1)網(wǎng)絡(luò)輸入有內(nèi)容圖像和風(fēng)格圖像。(2)紅色數(shù)據(jù)流向指示,風(fēng)格圖像經(jīng)過預(yù)訓(xùn)練VGG16 網(wǎng)絡(luò)。其中,若干層卷積特征計算Gram 矩陣輸入元網(wǎng)絡(luò)。元網(wǎng)絡(luò)的輸出為圖像轉(zhuǎn)換網(wǎng)絡(luò)(ITN)進行權(quán)重賦值。(3)藍色數(shù)據(jù)流向指示,內(nèi)容圖像經(jīng)過風(fēng)格權(quán)重賦值的圖像轉(zhuǎn)換網(wǎng)絡(luò),生成結(jié)果風(fēng)格化圖像。(4)綠色數(shù)據(jù)流向指示,訓(xùn)練時,風(fēng)格化圖像結(jié)果經(jīng)過VGG16 網(wǎng)絡(luò),在對應(yīng)卷積層上計算與風(fēng)格圖像的風(fēng)格損失,計算與內(nèi)容圖像的內(nèi)容損失。

        3 實驗

        3.1 實驗細節(jié)

        實驗所使用的內(nèi)容圖像來自于Microsoft COCO數(shù)據(jù)集,風(fēng)格示例圖來自于WikiArt 數(shù)據(jù)集。其中,內(nèi)容圖像大約80 000 張,風(fēng)格圖大約有8 000 張。在訓(xùn)練過程中,先把內(nèi)容圖像縮放到[256,480]的區(qū)間范圍,然后再隨機剪裁成256×256 尺寸的圖像。優(yōu)化器采用Adam,網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)率固定為0.001,批量大小Batchsize 設(shè)置為2。每20 輪循環(huán),隨機更換一張風(fēng)格圖。

        在內(nèi)容損失方面,重點考慮圖像高層語義相似性計算,因此采用預(yù)訓(xùn)練好的VGG16的Rule3_3層的特征圖來計算內(nèi)容損失;在風(fēng)格損失方面,選取預(yù)訓(xùn)練好的VGG16的Relu1_2、Relu2_2、Relu3_3、Relu4_3四層的特征圖的Gram 來計算風(fēng)格損失;ITN 網(wǎng)絡(luò)結(jié)構(gòu)保持與Shen 等人[17]方法一致。

        由于內(nèi)容損失和風(fēng)格損失計算的量值比例的原因,將α/β比值作為用戶控制參數(shù)。在圖4 展示了不同的α/β值的效果。當(dāng)比值為2×10-5時,能夠做到內(nèi)容與風(fēng)格平衡協(xié)調(diào)。因此,為了調(diào)參的方便,后續(xù)實驗均采用此設(shè)置。式(5)中內(nèi)容權(quán)重α=1,風(fēng)格權(quán)重為β=2×105。

        3.2 實驗對比

        為了評價改進方法的有效性,與其他主流的風(fēng)格遷移方法進行了對比。

        Fig.3 Model architecture圖3 模型結(jié)構(gòu)

        Fig.4 Effect of different weight ratios圖4 不同權(quán)重比值的效果

        在損失收斂方面,將本文方法與Shen 等人[17]的方法進行了比較,如圖5 所示。在內(nèi)容損失方面本文方法更加穩(wěn)定,從風(fēng)格損失方面可以看到本文方法收斂得更好。主要歸因于Gram 矩陣在風(fēng)格損失的計算數(shù)值上較均值和方差更穩(wěn)定。

        Fig.5 Loss convergence圖5 損失收斂情況

        為了驗證Gram 矩陣作為風(fēng)格損失計算的必要性,繼續(xù)進行了對比實驗。Johnson 等人[9]提出的框架是風(fēng)格遷移領(lǐng)域中最基礎(chǔ)、最通用的方法之一。用均值和方差作為損失替代該算法框架中的Gram矩陣,并且將超參數(shù)調(diào)整到實驗最優(yōu),結(jié)果如圖6 所示。除卻偽影,從紋理和顏色方面可以看出使用均值和方差損失的效果與Gram 矩陣差距較大。均值方差損失在風(fēng)格遷移中的效果并不理想。通過前述理論分析、實驗佐證,進一步肯定了采用Gram 矩陣作為風(fēng)格損失和特征統(tǒng)計量在算法收斂性和視覺效果方面的優(yōu)越性。

        Fig.6 Comparison of effects of different losses圖6 不同損失的效果比較

        Fig.7 Stylized effect results of proposed model(Compared with Fig.1)圖7 本文模型的風(fēng)格化效果圖(與圖1 對比)

        在圖像風(fēng)格化的質(zhì)量與效果方面,圖7 展示了本文改進方法結(jié)果的優(yōu)越性。相比圖1中Shen等人[17]方法的實驗結(jié)果,無論在圖像缺塊問題,還是在顏色色調(diào)布局不一致方面,在本文改進的方法中都得到了較好的解決。

        圖8 所采用的風(fēng)格示例圖,均為Shen 等人[17]和本文的方法在訓(xùn)練過程中從未訓(xùn)練過的風(fēng)格圖。不難看出,在視覺紋理分布上,本文方法與Gatys 等人[10]的方法基本相似,都比Shen 等人[17]的方法紋理更豐富;同時,本文在內(nèi)容上比Gatys 等人[10]的方法視覺表現(xiàn)更好;在顏色色調(diào)方面,本文方法也取得了比其他方法明顯更好的效果。

        為了更多地驗證本文方法的適應(yīng)能力,圖9 展示了使用本文方法進行風(fēng)格遷移的更多效果圖。所有生成的圖片尺寸均為256×256,不難看出,本文方法取得了不錯的結(jié)果,可以適用于不同風(fēng)格、不同內(nèi)容的場景。

        Fig.8 Contrast of stylized effect charts of different methods圖8 不同方法的風(fēng)格化效果圖對比

        Fig.9 More stylized results generated by proposed model圖9 更多本文模型生成的風(fēng)格化結(jié)果

        表1 記錄了五種主流風(fēng)格化遷移算法的遷移速度。在GTX1080TI 上進行測試,測試的風(fēng)格圖像和內(nèi)容圖像大小均為256×256??梢钥闯鰜恚疚姆椒m然比Shen 等人[17]的原方法慢了3 ms(主要是計算Gram 矩陣的原因),但幾乎是可以忽略不計的程度,仍然可以實現(xiàn)快速的風(fēng)格遷移。

        Table 1 Comparison of transfer speed for different methods表1 不同方法的遷移速度對比

        4 結(jié)束語

        本文在Shen 等人[17]的基礎(chǔ)上解決了他們的方法遺留下的風(fēng)格結(jié)果圖存在的不協(xié)調(diào)缺塊和顏色布局與目標(biāo)風(fēng)格圖不一致等問題,提出了基于Gram 矩陣風(fēng)格統(tǒng)計量的元網(wǎng)絡(luò)風(fēng)格遷移改進網(wǎng)絡(luò),并通過合理優(yōu)化避免了傳統(tǒng)Gram 矩陣帶來網(wǎng)絡(luò)參數(shù)整體過大的問題。通過實驗驗證,使用本文方法不僅不會出現(xiàn)風(fēng)格化圖像不協(xié)調(diào)缺塊的問題,而且還可以完美保持與風(fēng)格圖像的顏色布局一致。本文方法進行風(fēng)格遷移后的圖片在視覺效果上比原方法具有更好的效果和表現(xiàn),可以實現(xiàn)任意風(fēng)格任意內(nèi)容的快速風(fēng)格遷移。

        猜你喜歡
        風(fēng)格化方差均值
        方差怎么算
        基于深度神經(jīng)網(wǎng)絡(luò)的圖像風(fēng)格化方法綜述
        概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
        計算方差用哪個公式
        方差生活秀
        修拉的點的可能性與不可能性
        淺析插畫造型的風(fēng)格化表現(xiàn)
        東方教育(2016年3期)2016-12-14 20:10:11
        結(jié)合原創(chuàng)漫畫《百鬼夜行》談動漫的教學(xué)
        戲劇之家(2016年16期)2016-09-28 18:36:29
        均值不等式失效時的解決方法
        均值與方差在生活中的應(yīng)用
        亚洲a∨无码一区二区三区| 一区二区三区手机看片日本韩国 | 中文字幕久久久久久精| 久久亚洲精精品中文字幕早川悠里| 成人影院视频在线免费观看| 亚洲精品无码永久在线观看你懂的| 国产一区二区三区四区五区vm| 日韩人妻无码精品系列专区无遮| 久久精品亚洲国产av网站| 男人女人做爽爽18禁网站| 无码专区久久综合久中文字幕| 久久精品午夜免费看| 国产午夜精品视频在线观看| 久久人人爽爽爽人久久久| 美丽人妻被按摩中出中文字幕| 18禁黄无遮挡免费网站| 一区二区三区在线视频观看| 国产白袜脚足j棉袜在线观看| 国产成人影院一区二区| 日韩精品少妇专区人妻系列| 精品国产成人av久久| 男女车车的车车网站w98免费| 日本精品网| 亚洲女人毛茸茸的视频| 久久久久国产精品| 99精品视频在线观看| 水蜜桃在线视频在线观看| 一区二区三区免费看日本| 精品无码日韩一区二区三区不卡 | 亚洲精品中文字幕二区| 亚洲毛片一区二区在线| 50岁熟妇大白屁股真爽| 亚洲是图一区二区视频| 福利视频偷拍一区二区| 玩弄丰满奶水的女邻居| 一出一进一爽一粗一大视频免费的| 人妻av不卡一区二区三区| 久久99精品久久久大学生| 成人无码一区二区三区网站| 极品粉嫩小仙女高潮喷水视频| 免费人成视频网站在在线|