亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)生成方法*

        2022-01-26 08:23:30
        火力與指揮控制 2021年11期
        關(guān)鍵詞:模型

        孔 潔

        (中國(guó)勞動(dòng)關(guān)系學(xué)院,北京 100048)

        0 引言

        當(dāng)前,已全面跨入了大數(shù)據(jù)時(shí)代,但在很多具有重要研究?jī)r(jià)值領(lǐng)域,因其數(shù)據(jù)采集困難而受限制,比如作戰(zhàn)數(shù)據(jù)、作戰(zhàn)文書和裝備數(shù)據(jù)等[1-3]。軍事數(shù)據(jù)是作戰(zhàn)推演、作戰(zhàn)模擬的基礎(chǔ),目前數(shù)據(jù)的生成依然高度依賴人工要素,導(dǎo)致成本高昂且效率低下,實(shí)現(xiàn)高效自主的數(shù)據(jù)生產(chǎn)成為提升模擬、推演成效的必要突破點(diǎn)[4]。數(shù)據(jù)生成的本質(zhì)即通過數(shù)據(jù)之間的數(shù)學(xué)運(yùn)算得到預(yù)期的數(shù)據(jù)結(jié)果,神經(jīng)網(wǎng)絡(luò)相關(guān)的人工智能技術(shù)有望成為數(shù)據(jù)生成的有力工具。例如,文獻(xiàn)[5]針對(duì)傳統(tǒng)的Fuzz 測(cè)試普遍存在挖掘深度不足、樣本沒有指向性問題,提出一種使用長(zhǎng)短期記憶網(wǎng)絡(luò)引導(dǎo)生成瀏覽器Fuzz 所需的樣本集的框架,從而克服了傳統(tǒng)瀏覽器Fuzz 中樣本挖掘深度不足、指向性弱的問題。文獻(xiàn)[6]在深度學(xué)習(xí)技術(shù)的基礎(chǔ)上引入遷移學(xué)習(xí)技術(shù),提取出預(yù)訓(xùn)練模型的權(quán)重和樣本特征,實(shí)現(xiàn)了目標(biāo)小數(shù)據(jù)集訓(xùn)練與生成。文獻(xiàn)[7]基于卷積神經(jīng)網(wǎng)絡(luò),利用人類視覺和卷積模型在識(shí)別物體中表現(xiàn)出的形狀偏好特性,通過顏色模型的擾動(dòng)變換來(lái)生成對(duì)抗樣本,提出了一種基于顏色模型的語(yǔ)義對(duì)抗樣本生成方法。文獻(xiàn)[8]基于DQN 算法實(shí)現(xiàn)智能體的自主尋路,為此提出了基于白盒的樣本生成算法,從而使其通過自主尋路無(wú)法達(dá)到應(yīng)有的最優(yōu)最短路徑,并有效降低模型的運(yùn)算量。

        由于深度學(xué)習(xí)采用了多層網(wǎng)絡(luò)結(jié)構(gòu),其模型復(fù)雜度比傳統(tǒng)的單隱含層模型要大得多,為了確保模型的泛化能力,就必須相應(yīng)地增大訓(xùn)練數(shù)據(jù)[9]。當(dāng)前在工業(yè)界取得突破的基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的人工智能應(yīng)用,對(duì)訓(xùn)練樣本都有著數(shù)量上的要求,而訓(xùn)練模型所必須的海量訓(xùn)練數(shù)據(jù)樣本難以獲取,已經(jīng)成為阻礙深度學(xué)習(xí)技術(shù)進(jìn)一步推廣的一個(gè)普遍性難題[10]。

        本文在生成對(duì)抗網(wǎng)絡(luò)(GAN)[11]框架的基礎(chǔ)上,構(gòu)建長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)代替生成對(duì)抗網(wǎng)絡(luò)中的生成器和鑒別器,以最大平均差異和最大似然估計(jì)作為指標(biāo),構(gòu)建數(shù)據(jù)生成評(píng)估模型,提出一種可生成實(shí)值數(shù)據(jù)序列的循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)(RCGAN)。該方法完全依靠數(shù)據(jù)驅(qū)動(dòng),無(wú)需經(jīng)過精心設(shè)計(jì)的建模過程,生成數(shù)據(jù)與真實(shí)數(shù)據(jù)一致,魯棒性強(qiáng),受噪聲的干擾較小,具有很好的泛化性。

        1 生成對(duì)抗網(wǎng)絡(luò)框架

        生成對(duì)抗網(wǎng)絡(luò)(GAN)是最先進(jìn)的AI 框架[12],作為一種數(shù)據(jù)生成框架已顯示出卓越的應(yīng)用優(yōu)勢(shì),其核心思想是在生成器和鑒別器之間建立博弈關(guān)系。生成對(duì)抗網(wǎng)絡(luò)的一般結(jié)構(gòu)如圖1 所示,由生成器與鑒別器兩部分組成,其中,生成器用于學(xué)習(xí)真實(shí)數(shù)據(jù)樣本的潛在分布,并基于學(xué)習(xí)到的分布生成新樣本;鑒別器用于判別其輸入屬于真實(shí)樣本還是生成器生成的樣本[13]。

        圖1 生成對(duì)抗網(wǎng)絡(luò)

        在生成對(duì)抗網(wǎng)絡(luò)(GAN)中,生成器和鑒別器通過反向傳播,分別提高了它們的生成能力和鑒別能力。對(duì)于生成器,其反向傳播過程旨在縮小生成的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間的差距。當(dāng)所生成的數(shù)據(jù)和實(shí)數(shù)據(jù)被輸入到鑒別器時(shí),鑒別器輸出的是實(shí)數(shù)據(jù)的預(yù)測(cè)概率。鑒別器的反向傳播用于擴(kuò)展真實(shí)數(shù)據(jù)和生成數(shù)據(jù)之間的預(yù)測(cè)概率。

        從目標(biāo)數(shù)據(jù)分布pd行采樣,使用生成器生成目標(biāo)數(shù)據(jù)的概率為:

        式中,θ 是發(fā)生器的網(wǎng)絡(luò)參數(shù),其訓(xùn)練目的就是找到能夠最大化L 的θ*[14]:

        2 長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)

        長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)已經(jīng)被證明能夠通過記憶細(xì)胞在向后傳輸?shù)臅r(shí)間步中獲取信息來(lái)學(xué)習(xí)復(fù)雜的時(shí)間序列。如下頁(yè)圖2 所示,長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)是在RNN 網(wǎng)絡(luò)的基礎(chǔ)上搭建LSTM 單元,以解決RNN 所存在的長(zhǎng)期依賴以及梯度爆炸問題,從而能夠在任意時(shí)間間隔內(nèi)記住有價(jià)值的信息。

        圖2 長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)

        為了處理時(shí)間序列數(shù)據(jù),本文用LSTM-RNN 代替生成對(duì)抗網(wǎng)絡(luò)的生成器和鑒別器。按照常規(guī)的生成對(duì)抗網(wǎng)絡(luò)的框架架構(gòu),將生成對(duì)抗網(wǎng)絡(luò)模型訓(xùn)練成二人極大極小博弈。

        其中,生成器是LSTM-RNN 模型,定義其生成樣本的概率分布Grnn(z),z 服從隨機(jī)分布。鑒別器是另一種LSTM-RNN 模型,通過訓(xùn)練能夠使其預(yù)測(cè)和序列標(biāo)簽之間的平均交叉熵最小化。鑒頻器的損失函數(shù)為:

        同時(shí),生成器被訓(xùn)練來(lái)混淆鑒別器,以便鑒別器能夠盡可能多地識(shí)別出真實(shí)的生成樣本。生成器的損失函數(shù)是:

        3 循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)

        基于生成對(duì)抗網(wǎng)絡(luò)框架,鑒別器和生成器選用LSTM-RNN 結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上提出一種可生成數(shù)據(jù)序列的循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)(RCGAN)。如圖3 所示,生成器在每個(gè)時(shí)間步長(zhǎng)采用不同的隨機(jī)種子,如果想用額外的數(shù)據(jù)對(duì)生成的序列進(jìn)行條件設(shè)置,則還要加上額外的輸入。由此,在每個(gè)時(shí)間步長(zhǎng)上接受一個(gè)額外的輸入,以約束輸出。

        圖4 中展示了鑒別器如何獲取生成的序列。鑒別器獲取真實(shí)/合成序列,并為每一個(gè)時(shí)間步長(zhǎng)生成一個(gè)真實(shí)/合成分類。但對(duì)于RCGAN,它還在每個(gè)時(shí)間步長(zhǎng)上接受一個(gè)額外的輸入,以約束輸出,并對(duì)輸入序列的每一個(gè)時(shí)間步長(zhǎng)生成一個(gè)合成的或真實(shí)的分類。

        圖4 鑒別器數(shù)據(jù)輸出

        在每一批訓(xùn)練集中,鑒別器將同時(shí)處理真實(shí)序列和合成序列。于是,對(duì)于真實(shí)序列,將yn的標(biāo)簽設(shè)為“1”;對(duì)于合成序列,則將yn的標(biāo)簽設(shè)為“0”。

        生成器的目標(biāo)是“欺騙”鑒別器,將其輸出的分類認(rèn)定為真。這也就是說,生成器希望將鑒別器將預(yù)測(cè)序列與“真”標(biāo)簽之間的交叉熵最小化。根據(jù)式(5)得到關(guān)于{zn}的生成器損失:

        式中,zn是獨(dú)立于噪聲空間的采樣序列。

        為了在RCGAN 中不因?yàn)檫z忘門而對(duì)條件信息打折扣,于是對(duì)每個(gè)LSTM-RNN 的樣本輸入,在每個(gè)時(shí)間步長(zhǎng)中采用條件信息cn來(lái)進(jìn)行擴(kuò)增。

        4 循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)評(píng)價(jià)模型

        生成對(duì)抗網(wǎng)絡(luò)的性能評(píng)估中,由于生成器和鑒別器并不容易檢測(cè),一直是極具挑戰(zhàn)性的工作。為此,在對(duì)循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)(RCGAN)的性能評(píng)估中,本文構(gòu)建了一種可量化的評(píng)估方法。

        對(duì)于時(shí)間序列中的核函數(shù),將生成的樣本以及真實(shí)的樣本通過確定時(shí)間軸對(duì)齊,然后再將時(shí)間序列作為向量進(jìn)行比較。

        此外,為更好地反映生成數(shù)據(jù)概率的趨勢(shì),如圖5 所示構(gòu)建了循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)的最大似然估計(jì)模型[15]:

        圖5 循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)的最大似然估計(jì)模型

        5 仿真實(shí)驗(yàn)

        5.1 實(shí)驗(yàn)環(huán)境

        本文實(shí)驗(yàn)環(huán)境主要包括計(jì)算平臺(tái)和環(huán)境配置兩部分。其環(huán)境配置詳細(xì)參數(shù)如表1 所示。

        表1 環(huán)境配置參考表

        5.2 數(shù)據(jù)集

        為檢驗(yàn)本算法的有效性與可比性,實(shí)驗(yàn)數(shù)據(jù)選用了MNIST 數(shù)據(jù)集、正弦波信號(hào)數(shù)據(jù)集,以及任意平滑波形數(shù)據(jù)集。其中,MNIST 數(shù)據(jù)集由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所提供,是經(jīng)典的人工智能訓(xùn)練測(cè)試數(shù)據(jù),被廣泛用于不同算法間的性能比對(duì)及驗(yàn)證,訓(xùn)練結(jié)果具有很強(qiáng)的公平性和說服力。其數(shù)據(jù)來(lái)自于250 個(gè)不同人手寫數(shù)字,由0~9 十個(gè)手寫數(shù)字組成,包含70 000 張28×28 手寫數(shù)字的灰度圖片,分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。由于正弦波數(shù)據(jù)集具有易于檢查、確認(rèn)的優(yōu)勢(shì),而且可通過改變振幅和頻率對(duì)任意波形進(jìn)行擬合,因而選用了這類數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。在實(shí)際軍事應(yīng)用中,通常希望能夠生成更為復(fù)雜的信號(hào)數(shù)據(jù)。因此,實(shí)驗(yàn)中又考慮了軍事通信平滑波形數(shù)據(jù)。

        5.3 實(shí)驗(yàn)與分析

        實(shí)驗(yàn)中將每個(gè)28×28 手寫數(shù)字轉(zhuǎn)換為784 維的向量,運(yùn)用算法進(jìn)行MNIST 數(shù)字自動(dòng)生成。通過數(shù)據(jù)的生成,可以容易且直觀地評(píng)價(jià)數(shù)據(jù)生成效果,也足以檢驗(yàn)算法的有效性和精確性。如圖6 所示,展示了方法在生成平滑數(shù)據(jù)序列訓(xùn)練過程中鑒別器損失、生成器損失、MMD2以及最大似然估計(jì)值的分布情況。說明該方法并不知道底層的數(shù)據(jù)分布,而是完全依靠數(shù)據(jù)驅(qū)動(dòng),通過模型自主學(xué)習(xí)獲得真實(shí)數(shù)據(jù)的分布規(guī)律。

        圖6 算法訓(xùn)練指標(biāo)效果

        如圖7 所示,為算法進(jìn)行100 次自主訓(xùn)練,所生成的手寫數(shù)字。其中,剛開始訓(xùn)練時(shí)所生成的數(shù)字難以辨認(rèn),隨著訓(xùn)練次數(shù)的增加,各數(shù)字特征越來(lái)越明顯。如圖8 所示,當(dāng)算法訓(xùn)練100 次后,所生成的手寫數(shù)字已經(jīng)跟MNIST 真實(shí)數(shù)據(jù)集難以區(qū)分。

        圖7 手寫數(shù)字自主生成效果

        圖8 算法生成數(shù)據(jù)與MNIST 真實(shí)數(shù)據(jù)比對(duì)

        如圖9 所示,給出了不同訓(xùn)練迭代次數(shù)下樣本似然分布的演化過程。在迭代1,代理似然值非常低,因?yàn)樗惴ㄉ傻膱D像僅僅是隨機(jī)噪聲。隨著訓(xùn)練不斷遞增,概率分布向高值轉(zhuǎn)移,所得數(shù)據(jù)效果也越來(lái)越好。

        圖9 不同迭代次數(shù)下的最大似然概率分布

        在這個(gè)MNIST 數(shù)字生成實(shí)驗(yàn)中,為了評(píng)估和比較本文算法的性能,將本文算法與經(jīng)典GAN 算法進(jìn)行了比對(duì)實(shí)驗(yàn)。如圖10 所示,是分別運(yùn)用本文算法訓(xùn)練100 次后所生成的手寫數(shù)字,以及使用GAN算法訓(xùn)練100 次后所生成的手寫數(shù)字。相比較,同樣訓(xùn)練次數(shù)下本文生成的數(shù)據(jù)明顯優(yōu)于使用GAN生成的圖像,所得數(shù)據(jù)分辨率更高、噪聲更低。此外,如下頁(yè)圖11 所示,在對(duì)GAN 增加一倍訓(xùn)練次數(shù)后所生成的數(shù)據(jù)也稍遜于本文算法所生成的數(shù)據(jù)。這意味著經(jīng)典GAN 的思想雖可在廣泛領(lǐng)域得到運(yùn)用,但本文算法更適合樣本數(shù)據(jù)生成。

        圖10 本文算法與經(jīng)典GAN(Epoch 100)效果比對(duì)

        圖11 本文算法與經(jīng)典GAN(Epoch 200)效果比對(duì)

        本文還對(duì)其他兩種數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),如圖12所示,為生成的正弦波信號(hào)數(shù)據(jù)。通過肉眼就可判定該數(shù)據(jù)波形穩(wěn)定,相位、振幅滿足正弦波信號(hào)要求。如圖13 所示,為生成的軍事通信平滑波形數(shù)據(jù)。為比較生成數(shù)據(jù)效果,在圖中加入了真實(shí)平滑波形,即綠色虛線所示。比較可知,所生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)相差無(wú)幾,能夠達(dá)到數(shù)據(jù)生成的要求。

        圖12 生成的正弦波信號(hào)數(shù)據(jù)

        圖13 生成的任意平滑波形數(shù)據(jù)

        如圖14 所示,計(jì)算了3 種生成數(shù)據(jù)的最大似然概率分布。其中,從MNIST 數(shù)據(jù)集獲得的樣本的最高似然估計(jì)值;正弦波信號(hào)包含了不同的振幅和相位,估計(jì)的可能性相對(duì)較低;軍事通信平滑波形據(jù)集的概率要小得多,這是因?yàn)槠交ㄐ螖?shù)據(jù)集的樣本比MNIST 以及正弦波信號(hào)的樣本更多樣化所致。

        圖14 針對(duì)不同數(shù)據(jù)的最大似然概率分布

        6 結(jié)論

        本文在生成對(duì)抗網(wǎng)絡(luò)(GAN)框架的基礎(chǔ)上,構(gòu)建長(zhǎng)短期循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM-RNN)代替生成對(duì)抗網(wǎng)絡(luò)中的生成器和鑒別器,以最大平均差異和最大似然估計(jì)作為指標(biāo)構(gòu)建了數(shù)據(jù)生成評(píng)估模型,提出了一種基于循環(huán)條件生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)生成方法。該方法完全依靠數(shù)據(jù)驅(qū)動(dòng),無(wú)需經(jīng)過精心設(shè)計(jì)的建模過程,生成的新數(shù)據(jù)也并不是對(duì)原始數(shù)據(jù)的簡(jiǎn)單復(fù)制與拼接,而是學(xué)習(xí)到了真實(shí)數(shù)據(jù)分布規(guī)律,生成了全新的、有效的新數(shù)據(jù)。與傳統(tǒng)數(shù)據(jù)生成方法相比,本文方法具有較強(qiáng)的魯棒性,受噪聲的干擾較小,有很好的泛化性,在對(duì)真實(shí)數(shù)據(jù)相似度的提升上也得到了很好的效果,有效緩解了數(shù)據(jù)生成人工依賴性強(qiáng)、成本高、效率低的問題,對(duì)軍事關(guān)鍵、敏感領(lǐng)域的數(shù)據(jù)獲取提供了一種新的有效途徑。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        国产成人亚洲一区二区| 国内成人精品亚洲日本语音| 国产日产亚洲系列av| 中文字幕人妻精品一区| 亚洲一区二区三区尿失禁| 久久99精品国产99久久6尤物| 精品国产福利久久久| 国产女主播在线免费看| 少妇性俱乐部纵欲狂欢少妇| 极品新婚夜少妇真紧| 人妻少妇不满足中文字幕| 青青草在线成人免费视频| 手机看片久久第一人妻| 久久久av精品波多野结衣| 国产精品99久久久久久98AV| 色婷婷一区二区三区四| 久久久国产精品无码免费专区 | 国产九色AV刺激露脸对白| 日韩精品资源在线观看免费| 欧洲美女黑人粗性暴交视频| 67194熟妇在线永久免费观看 | 国产视频在线一区二区三区四区| 日本中文字幕官网亚洲| 精品无码久久久久久久久| 亚洲日韩精品欧美一区二区 | 午夜a福利| 久久99免费精品国产| 国产一精品一av一免费爽爽| 亚洲色自偷自拍另类小说| 粉嫩小泬无遮挡久久久久久| 东京热加勒比久久精品| 久久精品无码av| 国产av天堂成人网| 国产成人久久精品二区三区| 亚洲国产精品日本无码网站| 男人边吻奶边挵进去视频| 高潮社区51视频在线观看| 亚洲国产女性内射第一区二区| 亚洲日韩av无码| 午夜tv视频免费国产区4| 美女人妻中文字幕av|