亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        AI造圖新境界!OpenAI提出的可逆生成模型,比GAN更具潛力

        2018-08-03 03:15:30
        海外星云 2018年14期
        關(guān)鍵詞:掩碼體系結(jié)構(gòu)卷積

        最近,著名人工智能研究組織OpenAI發(fā)布了其最新工作:《Glow:更好的可逆生成模型》(《Glow:BetterReversible Generative Models》)。

        據(jù)文章介紹,Glow是一個(gè)可逆的生成模型,它使用了可逆的1×1卷積。它基于以前關(guān)于可逆生成模型的研究,并簡(jiǎn)化了體系結(jié)構(gòu)。該模型能夠生成逼真的高分辨率圖像,支持有效的采樣,并能發(fā)現(xiàn)可用于數(shù)據(jù)處理的特征。研究人員公開了模型代碼和一個(gè)在線可視化工具,以便人們能夠使用這個(gè)模型并繼續(xù)開展研究。

        生成模型是基于觀察數(shù)據(jù),然后學(xué)習(xí)出如何生成這些數(shù)據(jù)的模型。學(xué)習(xí)數(shù)據(jù)生成過(guò)程需要學(xué)習(xí)數(shù)據(jù)中存在的結(jié)構(gòu),成功的模型應(yīng)該能夠生成與數(shù)據(jù)相似的輸出。精確生成模型具有廣泛的應(yīng)用,包括語(yǔ)音合成、文本分析與合成、半監(jiān)督學(xué)習(xí)和基于模型的控制。研究人員提出的技術(shù)也可以應(yīng)用于這些問題。

        Glow是一種可逆的生成模型,也稱為基于流的生成模型,是NICE和RealNVP技術(shù)的延伸。相比于GAN和VAES,基于流的生成模型在研究領(lǐng)域中關(guān)注較少。

        而基于流的生成模型的優(yōu)點(diǎn)包括:

        精確的潛變量推斷和最大似然估計(jì)。在VAE中,只能近似推斷對(duì)應(yīng)于數(shù)據(jù)點(diǎn)的潛變量的值。GAN根本沒有編碼器來(lái)推斷潛在的情況。在可逆的生成模型中,推斷潛在情況可以在沒有近似的情況下精確完成。這不僅可以導(dǎo)致精確的推斷,而且還可以優(yōu)化最大似然估計(jì)。

        有效推理和有效生成。自回歸模型,例如PixelCNN,也是可逆的,但是從這些模型很難并行化,而且通常在并行時(shí)效率很低?;诹鞯纳赡P停鏕low和RealNVP,對(duì)于推理和生成來(lái)說(shuō)都是高效的并行化模型。

        Glow對(duì)兩名研究人員臉部圖像的屬性操作。訓(xùn)練過(guò)程中,模型沒有提供眼睛、年齡等屬性標(biāo)簽等情況下,自己學(xué)習(xí)潛在空間,部分特定方向?qū)?yīng)胡須密度,年齡,頭發(fā)顏色等屬性的變化

        下游任務(wù)可用的潛在空間。自回歸模型的隱藏層具有未知的邊緣分布,使得對(duì)數(shù)據(jù)的有效處理變得更加困難。在GANs中,數(shù)據(jù)點(diǎn)通常不能在潛在空間中直接表示。對(duì)于可逆的生成模型和VAE則不是這樣,它們?cè)试S各種操作,例如數(shù)據(jù)插值和數(shù)據(jù)修改。

        節(jié)省內(nèi)存。在可逆神經(jīng)網(wǎng)絡(luò)中計(jì)算梯度需要一定數(shù)量的內(nèi)存,在RevNet文章中有所解釋。

        結(jié)果

        RealNVP是以前基于流的生成模型最好的結(jié)果,研究人員的方法與RealNVP相比取得了顯著的改進(jìn)。對(duì)于RealNVP模型和Glow模型,在不同數(shù)據(jù)集的測(cè)試集上進(jìn)行了量化性能評(píng)估。Glow模型可以高效生成逼真的高分辨率圖像。這個(gè)模型在NVIDIA 1080 Ti GPU上產(chǎn)生一個(gè)256×256的樣品需要130毫秒。

        潛空間內(nèi)插

        研究人員還可以在任意人臉之間進(jìn)行插值,使用編碼器對(duì)兩幅圖像進(jìn)行編碼,并從中間點(diǎn)進(jìn)行采樣。請(qǐng)注意,輸入是任意的人臉,而不是來(lái)自模型的樣本,從而證明了模型支持整個(gè)目標(biāo)分布。

        潛空間操作

        研究人員可以在沒有標(biāo)簽的情況下訓(xùn)練一個(gè)基于流的模型,然后將學(xué)習(xí)到的模型用于后續(xù)任務(wù),比如處理輸入的屬性。這些語(yǔ)義屬性可以是面部或頭發(fā)的顏色、圖像的風(fēng)格、聲音的音高,或者文本句子的情感。由于基于流的模型有一個(gè)非常好的編碼器,因此可以對(duì)輸入進(jìn)行編碼,并計(jì)算有和不帶屬性的輸入的平均潛在向量。然后,可以使用兩者之間的向量方向來(lái)操作對(duì)該屬性的任意輸入。

        貢獻(xiàn)

        研究人員的主要貢獻(xiàn)同時(shí)也是與RealNVP模型的不同之處在于增加了一個(gè)可逆的1×1卷積,以及刪除了一些組件,從而簡(jiǎn)化了整個(gè)體系結(jié)構(gòu)。

        RealNVP體系結(jié)構(gòu)由兩種類型的層組成:具有棋盤掩碼的層和具有通道掩碼的層。研究人員移除了棋盤掩碼的層,簡(jiǎn)化了體系結(jié)構(gòu)。具有通道掩碼的層重復(fù)執(zhí)行以下步驟可以等效:

        通過(guò)在通道維度上逆轉(zhuǎn)輸入的順序來(lái)改變輸入。

        按照特征維數(shù)將輸入對(duì)分成A和B兩個(gè)部分。

        將A輸入淺層卷積神經(jīng)網(wǎng)絡(luò)。根據(jù)神經(jīng)網(wǎng)絡(luò)的輸出線性變換B。

        連接A和B。

        通過(guò)連接這些層,A更新B,B更新A,然后A更新B。這種信息的雙向流動(dòng)顯然是相當(dāng)僵化的。研究人員發(fā)現(xiàn),通過(guò)將步驟(1)的反向排列改變?yōu)殡S機(jī)全排列,模型的性能得到了改善。

        更進(jìn)一步,研究人員還可以學(xué)習(xí)最優(yōu)排列。學(xué)習(xí)置換矩陣是一種離散優(yōu)化,不能適用到梯度上升。但由于置換操作只是具有平方矩陣的線性變換的特例,所以可以用卷積神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn),因?yàn)橹脫Q通道等價(jià)于輸入和輸出通道數(shù)相等的1x1卷積運(yùn)算。因此,研究人員用學(xué)習(xí)的1x1卷積運(yùn)算代替固定置換。將lxl卷積的權(quán)值初始化為隨機(jī)旋轉(zhuǎn)矩陣。此操作帶來(lái)了顯著的模型改進(jìn)。研究人員還證明了通過(guò)對(duì)權(quán)值進(jìn)行LU分解,可以有效地完成目標(biāo)函數(shù)優(yōu)化所涉及的計(jì)算。

        另外,研究者還刪除了批歸一化,并將其替換為激活歸一化層。這一層只是簡(jiǎn)單地轉(zhuǎn)移和縮放激活函數(shù),給定數(shù)據(jù)的初始minibatch,該層具備依靠數(shù)據(jù)的初始化技術(shù)可對(duì)激活函數(shù)進(jìn)行歸一化操作。這允許將minibatch的大小縮小到1(對(duì)于大型圖像),并擴(kuò)大模型的大小。

        規(guī)模

        研究人員的體系結(jié)構(gòu)結(jié)合了各種優(yōu)化,例如梯度檢查點(diǎn),使其能夠更大的規(guī)模地訓(xùn)練基于流的生成模型。研究人員使用Horovod在集群上輕松地訓(xùn)練研究人員的模型;研究人員演示中使用的模型在五臺(tái)機(jī)器上進(jìn)行了訓(xùn)練,每臺(tái)機(jī)器有八個(gè)GPU。使用這個(gè)配置,研究人員可以訓(xùn)練超過(guò)一億個(gè)參數(shù)的模型。

        研究方向

        研究人員的工作表明,可以訓(xùn)練基于流的模型來(lái)生成逼真的高分辨率圖像,并可以很容易地學(xué)習(xí)到隱藏表征。研究人員為今后的工作提出了幾個(gè)方向:

        在似然函數(shù)上與其他模型比較。在對(duì)數(shù)似然方面,自回歸模型和VAE模型的性能優(yōu)于基于流的模型,但它們分別存在采樣效率低和推理不精確的缺點(diǎn)。研究人員可以將基于流的模型、VAE模型和自回歸模型結(jié)合起來(lái),以權(quán)衡它們的優(yōu)勢(shì),這將是未來(lái)工作的一個(gè)有趣的方向。

        改進(jìn)體系結(jié)構(gòu),提高計(jì)算效率和參數(shù)效率。為了生成逼真的高分辨率圖像,人臉生成模型使用了200億參數(shù)和600層卷積層,這使得訓(xùn)練的成本很高。深度較小的模型在學(xué)習(xí)長(zhǎng)期依存關(guān)系方面表現(xiàn)較差。使用自注意架構(gòu),或者進(jìn)行漸進(jìn)式的訓(xùn)練來(lái)擴(kuò)展到高分辨率,可以使訓(xùn)練Glow模型的成本降低。(摘自美《深科技》)(編輯/華生)

        猜你喜歡
        掩碼體系結(jié)構(gòu)卷積
        基于時(shí)域全卷積網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        低面積復(fù)雜度AES低熵掩碼方案的研究
        基于布爾異或掩碼轉(zhuǎn)算術(shù)加法掩碼的安全設(shè)計(jì)*
        基于粒計(jì)算的武器裝備體系結(jié)構(gòu)超網(wǎng)絡(luò)模型
        作戰(zhàn)體系結(jié)構(gòu)穩(wěn)定性突變分析
        基于DODAF的裝備體系結(jié)構(gòu)設(shè)計(jì)
        基于云計(jì)算的航天器控制系統(tǒng)自組織體系結(jié)構(gòu)
        基于掩碼的區(qū)域增長(zhǎng)相位解纏方法
        蜜臀人妻精品一区二区免费| 性色av无码一区二区三区人妻| 香蕉视频www.5.在线观看| 欧美国产一区二区三区激情无套| 午夜不卡av免费| 久久丫精品国产亚洲av| 亚洲片在线视频| 黑人巨大亚洲一区二区久| 在线观看日韩精品视频网站| 国产亚洲精品综合在线网站| 成人自拍小视频在线看 | 粉嫩av最新在线高清观看| 亚洲第一女人av| 国产综合色在线精品| 无码午夜成人1000部免费视频| 亚洲av无码专区国产乱码不卡| 国产成人无码一二三区视频| 亚洲V无码一区二区三区四区观看 久久精品国产亚洲综合色 | 精品人妻伦一二三区久久| 麻豆影视视频高清在线观看| 18禁男女爽爽爽午夜网站免费| 日韩精品成人无码AV片| 国产大学生自拍三级视频| 六月婷婷亚洲性色av蜜桃| 亚洲成在人线视av| 无码一区二区三区亚洲人妻| 欧美黑人粗暴多交高潮水最多| 久久99久久99精品免观看女同| 久久精品伊人久久精品| 久久精品国产av一级二级三级| 欧美丰满熟妇xxxx性| 欧美日韩亚洲精品瑜伽裤| 亚洲免费视频一区二区三区| 亚洲av推荐网站在线观看| 亚洲av三级黄色在线观看| 午夜成人理论福利片| 亚洲男人的天堂在线播放| 日本韩国三级aⅴ在线观看| av天堂一区二区三区| 一区二区亚洲精品在线| 免费无码一区二区三区a片百度|