亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        概率統(tǒng)計分析在深度生成模型中的應(yīng)用

        2022-07-06 11:12:56王寶麗安曉丹
        運城學(xué)院學(xué)報 2022年3期
        關(guān)鍵詞:變分概率分布編碼器

        王 浩,王寶麗,安曉丹

        (1. 太原師范學(xué)院 計算機系,山西 晉中 030619;2. 運城學(xué)院 數(shù)學(xué)與信息技術(shù)學(xué)院,山西 運城 044000)

        引言

        作為一門交叉學(xué)科,人工智能不僅融合了腦認知科學(xué)、心理學(xué)等社會科學(xué)研究成果,而且離不開數(shù)學(xué)、統(tǒng)計學(xué)、信息科學(xué)、計算機科學(xué)等諸多學(xué)科的支持。其中,統(tǒng)計理論及統(tǒng)計應(yīng)用方法在人工智能中發(fā)揮著不可或缺的作用[1,2]。近年來,深度學(xué)習作為人工智能的核心技術(shù),已經(jīng)廣泛應(yīng)用在各個領(lǐng)域,如計算機視覺[3]、自然語言處理[4]、網(wǎng)絡(luò)數(shù)據(jù)挖掘[5]等。深度學(xué)習作為機器學(xué)習的一個工具,其依然滿足機器學(xué)習的基本范式,而統(tǒng)計學(xué)習理論是機器學(xué)習的理論基礎(chǔ)[6]。一方面,統(tǒng)計分布是決策樹學(xué)習算法的核心支撐理論,用于控制分支屬性的選擇及分支節(jié)點作為葉子節(jié)點的終止條件[7]。另一方面,機器學(xué)習的泛化誤差、逼近能力等基本理論的分析,都需要依賴嚴格的概率統(tǒng)計分析,這表明概率統(tǒng)計分析對于機器學(xué)習的發(fā)展起到了重要的理論支撐作用。

        深度學(xué)習近年來已經(jīng)成為人工智能和機器學(xué)習領(lǐng)域最熱門的研究方向,其在很多工程上的預(yù)測精度已經(jīng)超越了人類。但是,深度學(xué)習的理論研究并沒有引起大家的重視,深度學(xué)習的相關(guān)理論仍然沒有完善,這嚴重限制了深度學(xué)習的進一步發(fā)展。因此,為了更好地理解深度學(xué)習,尤其是深度生成模型背后的機理,我們將從概率統(tǒng)計分析的角度對變分自編碼器(variational auto-encoder,VAE)[8]和生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)分別進行數(shù)學(xué)機理分析。

        1. 變分自編碼器的概率統(tǒng)計分析

        變分自編碼器作為自編碼器(auto-encoder,AE)的變體,其在隱空間引入了概率統(tǒng)計分布后,解決了自編碼器無法生成新數(shù)據(jù)的缺陷。目前,變分自編碼器已成為生成任務(wù)中主流的生成工具。接下來我們從概率統(tǒng)計的角度分析自編碼器的缺陷以及變分自編碼器背后的機理。

        1.1 自編碼器

        自編碼器屬于無監(jiān)督式的深度學(xué)習模型,模型架構(gòu)如圖1所示。主要由編碼器(Encoder)和解碼器(Decoder)兩部分組成。編碼器模塊主要負責將輸入數(shù)據(jù)x通過映射函數(shù)f轉(zhuǎn)變?yōu)殡[變量z:

        z=f(x)

        其中l(wèi)oss為重構(gòu)損失。

        圖1 自編碼器模型架構(gòu)示意圖

        根據(jù)以上分析,可知編碼器的本質(zhì)是特征降維的過程,解碼器的本質(zhì)是特征重構(gòu)的過程。也就是自編碼器可以將一個數(shù)據(jù)降維到隱空間后再重構(gòu)回其本身。同時,從自編碼器的優(yōu)化目標可以看出,自編碼器只是對重構(gòu)損失進行了約束,并沒有對隱空間的性質(zhì)進行約束,僅僅是得到了輸入數(shù)據(jù)對應(yīng)的具體隱變量。因此,模型經(jīng)過訓(xùn)練后,只能確保訓(xùn)練集中的數(shù)據(jù)點能夠從隱空間無誤差地重構(gòu)回本身,而這也意味著模型出現(xiàn)了過擬合現(xiàn)象,導(dǎo)致自編碼器對于訓(xùn)練集之外的數(shù)據(jù)點無法進行有效解碼,即無法生成新的數(shù)據(jù)。

        1.2 引入變分推斷的變分自編碼器

        圖2 變分自編碼器模型架構(gòu)示意圖

        根據(jù)貝葉斯公式,在訓(xùn)練階段我們需要利用觀測變量對隱空間的概率分布進行更新學(xué)習,即:

        =Eq(z|x)logp(x)

        =Eq(z|x)logp(x,z)-Eq(z|x)logp(z|x)

        =KL(q(z|x)‖p(z|x))+ELBO

        ELBO=-KL(q(z|x)‖p(z|x))+Eq(z|x)logpq(x|z),由于KL(q(z|x)‖p(x|z))≥0,因此可以得到:

        =-KL(q(z|x)‖p(z))+Eq(z|x)logp(x|z)

        最小化KL(q(z|x)‖p(z))也就是讓概率分布q(z|x)和p(z)之間的距離最小化,為了方便計算,變分自編碼器假設(shè)q(z|x)和p(z)均為正態(tài)分布,其中,q(z|x)~N(μ,σ2),p(z)~N(0,I)。可以得到:

        KL(N(μ,σ2)‖N(0,1))

        1.3 變分自編碼器的損失函數(shù)

        與自編碼器的優(yōu)化目標不同,變分自編碼器的優(yōu)化目標(損失函數(shù))由兩部分組成:

        正則化損失也正是變分自編碼器與自編碼器的本質(zhì)區(qū)別,即變分推斷的引入。變分自編碼器最初的目的是對自編碼器進行改進從而可以用于生成數(shù)據(jù),因此需要學(xué)習出隱空間的概率分布p,得到隱空間的概率分布后,即可在隱空間隨機進行采樣其他變量送入解碼器,從而生成新的數(shù)據(jù)。但是,直接去求解后驗概率來計算隱空間的概率分布計算量很大,實際中很難直接求解,因此變分自編碼器引入變分推斷的思想,通過學(xué)習易于求解的概率分布q,同時保證概率分布p和q的距離最小化,這樣就可以用概率分布q來近似概率分布p。本質(zhì)上來說,變分推斷解決的問題可以歸結(jié)為概率統(tǒng)計機器學(xué)習問題,很多生成模型的背后機理都用到了變分推斷。也正是變分推斷的引入,即概率統(tǒng)計分析的引入,才使得傳統(tǒng)深度學(xué)習模型自編碼器能夠成功應(yīng)用于生成問題,這也意味著概率統(tǒng)計分析對于深度學(xué)習的發(fā)展起到了至關(guān)重要的作用。

        2. 生成對抗網(wǎng)絡(luò)的概率統(tǒng)計分析

        生成對抗網(wǎng)絡(luò)是深度學(xué)習領(lǐng)域最熱門的研究方向之一,是目前最成功的生成模型,已經(jīng)成功應(yīng)用于實際應(yīng)用中,特別是在計算機視覺領(lǐng)域掀起了研究熱潮,研究學(xué)者們相繼提出了StyleGAN、DCGAN、CycleGAN等生成模型用于特定任務(wù)。接下來我們將從概率統(tǒng)計的角度分析生成對抗網(wǎng)絡(luò)背后的數(shù)學(xué)機理。

        生成對抗網(wǎng)絡(luò)屬于無監(jiān)督模型,主要由生成器和判別器兩部分組成,模型架構(gòu)如圖3所示。生成對抗網(wǎng)絡(luò)本質(zhì)上是一種零和博弈思想的體現(xiàn),其將數(shù)據(jù)生成任務(wù)看作生成器和判別器兩個模塊之間的對抗博弈,即生成器根據(jù)輸入的噪聲(通過正態(tài)分布采樣或者均勻分布采樣得到)來生成新樣本,而判別器用來判別樣本是真實觀測的還是由生成器生成的新樣本。生成器的目的是生成盡可能逼近真實樣本的新樣本,而判別器則試圖正確區(qū)分出真實樣本和生成的新樣本,這也正是對抗思想的體現(xiàn),生成器和判別器正是在對抗迭代訓(xùn)練中彼此提高自己的性能,當判別器區(qū)分不出真實樣本和生成的樣本時,此時生成器即可生成完美的新樣本。

        圖3 生成對抗網(wǎng)絡(luò)的模型架構(gòu)示意圖

        上述GAN的思想可以用一個優(yōu)化目標來形式化描述:

        其中pdata代表觀測真實數(shù)據(jù)的概率分布,p(z)表示輸入的噪聲分布,θg和θd分別表示生成器和判別器的參數(shù)。Gθg(z)表示生成器生成的新樣本。Dθd(x)表示判別器的輸出,為[0,1]之間的概率,1表示輸入數(shù)據(jù)為真實樣本,0表示輸入數(shù)據(jù)為生成樣本。

        具體地,生成器Gθg(z)希望最小化目標函數(shù),使得Dθd(Gθg(z))盡量接近于1,即使得其生成的樣本盡可能逼近真實樣本,即

        而判別器Dθd(x)希望最大化目標函數(shù),使得Dθd(x)接近于1,而Dθd(Gθg(z))接近于0,即:

        從概率統(tǒng)計的角度分析,生成對抗網(wǎng)絡(luò)的本質(zhì)是利用生成器和判別器進行迭代對抗訓(xùn)練,學(xué)習一個從隨機噪聲分布p(z)到真實數(shù)據(jù)分布pdata的映射函數(shù),然后從噪聲分布p(z)中隨機采樣新的噪聲輸入該映射函數(shù)即可生成得到新的樣本。

        3. 結(jié)語

        深度學(xué)習雖然在各個應(yīng)用領(lǐng)域都取得了巨大的成功甚至超過了人類專家水平,然而,理論部分的欠缺嚴重限制了深度學(xué)習的進一步發(fā)展。文章從概率統(tǒng)計的角度,對深度生成模型變分自編碼器和生成對抗網(wǎng)絡(luò)背后的數(shù)學(xué)機理進行了系統(tǒng)的理論分析,為深度生成模型的進一步發(fā)展提供了理論支撐。

        猜你喜歡
        變分概率分布編碼器
        離散型概率分布的ORB圖像特征點誤匹配剔除算法
        逆擬變分不等式問題的相關(guān)研究
        求解變分不等式的一種雙投影算法
        基于FPGA的同步機軸角編碼器
        關(guān)于一個約束變分問題的注記
        關(guān)于概率分布函數(shù)定義的辨析
        科技視界(2016年19期)2017-05-18 10:18:46
        基于PRBS檢測的8B/IOB編碼器設(shè)計
        基于概率分布的PPP項目風險承擔支出測算
        一個擾動變分不等式的可解性
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計
        電子器件(2015年5期)2015-12-29 08:42:24
        欧美性猛交xxxx免费看蜜桃| 亚洲天堂av另类在线播放| 国产亚洲精品一品二品| 国产av一区二区三区无码野战| 无码精品日韩中文字幕| 欧美一区二区午夜福利在线yw| 久久无人码人妻一区二区三区| 亚洲日本国产精品久久| 久久久受www免费人成| 丝袜国产高跟亚洲精品91| 在线日本高清日本免费| 日韩精品视频久久一区二区| 2021国产精品国产精华| 亚洲 国产 哟| 国产精品亚洲最新地址| 18禁免费无码无遮挡不卡网站 | 极品少妇一区二区三区| 色综合天天综合欧美综合| 丁香花在线影院观看在线播放| 国产资源在线视频| 日韩亚洲一区二区三区在线 | 青草热久精品视频在线观看| 国产av区亚洲av毛片| 91久久精品国产综合另类专区| 久久久无码人妻精品一区| 青草网在线观看| 水蜜桃一二二视频在线观看免费 | 一区二区三区四区在线观看日本| 48久久国产精品性色aⅴ人妻| 午夜性刺激免费视频| 国产噜噜亚洲av一二三区| 亚洲成在人线视av| 成人精品综合免费视频| 成人无码激情视频在线观看| 日产一区日产2区日产| 亚洲中文字幕久久无码精品| 被黑人做的白浆直流在线播放| 国产一区二区三区蜜桃 | 日韩精品久久久肉伦网站| 久久无码一一区| 国产大屁股熟女流白浆一区二区|