摘"要: 路面病害數(shù)據(jù)具有豐富的空間信息且具備的特征信息關聯(lián)性較高,針對現(xiàn)有的圖像數(shù)據(jù)增強方法難以有效捕獲此類信息的問題,提出了一種改進的生成對抗網(wǎng)絡(CLSGAN),用于路面病害數(shù)據(jù)增強.首先,為了避免出現(xiàn)模式崩塌,保證生成圖像的多樣性,引入新?lián)p失項,重新構建了生成器的目標函數(shù).其次,融合CAE的編碼結構,使模型能獲取真實圖片的空間潛在信息,用于強化生成器對于圖像空間信息的學習,提高模型的收斂速度與生成質(zhì)量.最后,構建了輕量級的殘差投影-擴展-投影-擴展模塊(RPEPX)并引入譜歸一化,進一步提升生成圖像的質(zhì)量并保證模型訓練時的穩(wěn)定性.實驗在新建立的CSGP數(shù)據(jù)集上進行,結果表示CLSGAN對生成路面裂縫與凹陷圖像各個評價指標FID,SSIM,PSNR都有較大的提升.最后利用Yolov5s檢測網(wǎng)絡驗證文中方法的先進性,結果表明在小樣本數(shù)據(jù)集的情況下,相對于傳統(tǒng)數(shù)據(jù)增強方法,所提方法使檢測結果達到最優(yōu).
關鍵詞: 數(shù)據(jù)增強;生成對抗網(wǎng)絡;編碼器;譜歸一化;RPEPX
中圖分類號:TP391.4"""文獻標志碼:A"""""文章編號:1673-4807(2024)04-049-09
Enhancement of pavement disease image data set based on improved GAN
ZHAO Xinxu1, ZHANG Boyi2, QIAN Huimin1, LIU Qinghua1,2*
(1.College of Automation, Jiangsu University of Science and Technology, Zhenjiang 212100, China)
(2.School of Computer, Jiangsu University of Science and Technology, Zhenjiang 212100, China)
Abstract:The pavement disease data has rich spatial information and high correlation of feature information, while the existing image data enhancement methods are difficult to make the model capture such information effectively. In this paper, an improved generative countermeasure network (CLSGAN) is proposed for pavement disease data enhancement. First, in order to avoid pattern collapse and ensure the diversity of generated images, a new loss term is introduced to reconstruct the objective function of the generator. Secondly, by integrating the coding structure of CAE, the model can obtain the spatial potential information of real pictures, which is used to strengthen the generator′s learning of image spatial information, and improve the convergence speed and generation quality of the model. Finally, a lightweight residual projection expansion projection expansion module (RPEPX) is constructed and spectral normalization is introduced to further improve the quality of the generated image and ensure the stability of the model during training. The experiment was carried out on the newly established CSGP data set, and the results showed that CLSGAN had a greater improvement in the evaluation indexes FID, SSIM, PSNR of the generated pavement crack and depression images. Finally, Yolov5s detection network is used to verify the progressiveness of this method. The results show that in the case of small sample data sets, compared with traditional data enhancement methods, this method achieves the optimal detection results.
Key words:data enhancement, GAN, encoder, spectral normalization, RPEPX
近年來,深度學習[1]在公路領域快速發(fā)展,尤其是對路面病害圖像的處理,經(jīng)過不斷地改進運用,在路面病害的檢測、分類[2]、分割[3]等方面都取得了重大成功,但是訓練一個良好的模型往往需要一個較大規(guī)模的數(shù)據(jù)集.常見的數(shù)據(jù)增強方法可以分為有監(jiān)督與無監(jiān)督兩種:有監(jiān)督的數(shù)據(jù)增強方法是在已有的標簽數(shù)據(jù)上進行的按照設定的圖像處理規(guī)則進行的變化,但這些方法在擴充數(shù)據(jù)集時會帶來大量的冗余信息,增加訓練負擔且對模型泛化能力提升不大;無監(jiān)督網(wǎng)絡有自編碼器和變分自編碼器(VAE),但其生成效果并不理想.生成式對抗網(wǎng)絡(generative countermeasure network,GAN)的提出有效解決了數(shù)據(jù)集獲取困難的問題,該模型通過博弈的思想能夠生成與真實圖像極為相似的高質(zhì)量圖像.
文獻[4]提出了一種基于深度卷積生成對抗網(wǎng)絡(deep convolution generative adversarial network,DCGAN)生成人工大腦磁共振圖像的方法,有助于為各種缺乏數(shù)據(jù)的臨床應用提供額外的合成數(shù)據(jù).文獻[5]通過修改StarGAN的重構誤差實現(xiàn)了人臉表情的多風格轉(zhuǎn)換.文獻[6]提出了一種用于太陽圖像反卷積的生成對抗網(wǎng)絡,用于恢復太陽圖像中的暗點.針對條件生成對抗網(wǎng)絡中由于分類困難導致對生成器反饋失效的問題,文獻[7]提出了一種可以學習如何在數(shù)據(jù)匹配和標簽匹配之間取得平衡的雙投影GAN模型,同時還提出了一種cGAN模型,可以通過最小化假條件詞和真條件詞的f散度,直接對齊假條件詞和真條件詞.
但是目前GAN在公路領域應用較少,文獻[8]基于生成對抗網(wǎng)絡實現(xiàn)了對裂縫的端到端生成對抗學習,通過將較大尺寸的裂縫圖像饋送到非對稱U形生成器克服了生成器收斂過程中容易出現(xiàn)的“全黑”問題.文獻[9]為提升檢測路面裂縫模型的精度,提出了一種基于DCGAN的裂縫圖像生成方法,首先運用濾波去噪以及伽馬變換操作增強了裂縫特征的辨識度,并調(diào)整優(yōu)化網(wǎng)絡參數(shù),生成了更真實的路面裂縫圖像.文獻[10]針對智能道路檢測中樣本量小的問題,將DCGAN與VAE相結合,對模型進行改進,并通過Adam優(yōu)化器進行優(yōu)化,得到大量與實際道路裂縫圖像相似的虛擬圖像.
GAN在數(shù)據(jù)集擴充方面已經(jīng)取得了相當大的成功.但是在實際應用時,還是容易出現(xiàn)一些不容忽視的問題,如生成的圖片模糊,生成圖片速度太慢,生成質(zhì)量不穩(wěn)定,只生成少量特征相似的圖片等等.文中提出了一種改進的損失敏感生成對抗網(wǎng)絡(least squares generative adversarial network,LSGAN)模型,使用小樣本數(shù)據(jù)生成大規(guī)模、可靠的路面病害數(shù)據(jù),做出了以下幾個改進:① 引入新的損失項,設計了新的生成器目標函數(shù),保證了生成樣本良好的多樣性.融合CAE編碼器與LSGAN生成器結構,使用編碼器獲得真實樣本向量的空間潛在特征向量并對生成器進行訓練,使得網(wǎng)絡的收斂速度與生成質(zhì)量都得到一定的提高.② 構建一種輕量級的殘差投影-擴展-投影-擴展模塊(RPEPX),在判別網(wǎng)絡中分層添加RPEPX提高判別器對圖片空間特征的學習能力,在不大量增加計算量的同時進一步提高了模型生成質(zhì)量.③ 在生成器與判別器中都加入譜歸一化,使得模型表現(xiàn)出更穩(wěn)定的訓練效果,進一步提高模型收斂的穩(wěn)定性.
1"相關理論
1.1"生成對抗網(wǎng)絡(GAN)
GAN可以使用兩個敵對網(wǎng)絡生成人工圖像.它由兩個部分組成,包括G和D.G負責生成,而D負責判定.D和G之間通過訓練不斷競爭優(yōu)化,直到達到納平衡.GAN中的損失函數(shù)定義:
minGmaxDL(D,G)=
EX~Pdata[logD(x)]+Ez~Pz[log(1-D(G(z))](1)
式中:z為隨機噪聲;G(z)為生成的虛假圖像;x為真實樣本圖像;EX~Pdata為所有真實實例的期望值;EZ~Pz為所有虛假實例的期望值.
然而,GAN并不穩(wěn)定,在訓練過程中容易導致不收斂.此外,GAN的不穩(wěn)定性使其容易出現(xiàn)欠擬合或過擬合.因此,在訓練過程中必須仔細調(diào)整GAN的參數(shù).
1.2"最小二乘生成對抗網(wǎng)絡(LSGAN)
最初的GAN在生成器中引入了極大極小損失和非飽和損失,并使用sigmoid交叉熵損失函數(shù)作為判別器,但是極大極小損失和非飽和損失都會導致模型出現(xiàn)消失梯度的問題.LSGAN通過最小二乘損失函數(shù)構建了一個新的距離度量解決這個問題,假設對鑒別器使用a-b編碼方案,LSGAN的目標函數(shù)則可以定義為:
minDL(D)=12EX~Pdata[(D(x)-b)2]+
12EZ~Pz[(D(G(z))-a)2](2)
minGL(G)=12EZ~Pz[(D(G(z))-c)2](3)
式中:a為假數(shù)據(jù)的標簽;b為真實數(shù)據(jù)的標簽,c為G為D設置的值,以確定生成的圖像是否為真實數(shù)據(jù).
首先通過固定G,令D的目標函數(shù)的導數(shù)為0,可以得出判別器的最佳解:
D*(x)=bpdata(x)+apg(x)pdata(x)+pg(x)(4)
minGL(G)=12EX~Pdata[(D(x)-b)2]+
12EZ~Pz[(D(G(z))-a)2](5)
將式(4)帶入式(5),其中另加項12EX~Pdata [(D(x)-c)2]對minGL(G)沒有影響,因為它不包含G,再使b-c=1,b-a=2就可以得到皮爾森卡方散度:
2L(G)=∫x(2pg(x)-(pd(x)+pg(x)))2pd(x)+pg(x)dx=
χ2Pearson (pd+pg‖2pg)(6)
也就是說,此時優(yōu)化LSGAN等價于優(yōu)化皮爾森卡方散度.所以上面的a,b,c約束也就是LSGAN損失函數(shù)所要滿足的約束.這使得LSGAN減少了模式搜索,并緩解了模式崩潰問題.
2"本文方法
2.1"生成器目標函數(shù)設計
在對抗訓練過程中,如果許多假樣本與真樣本相同,樣本多樣性就會喪失,即模式崩潰.文中對生成器的優(yōu)化函數(shù)進行了重新設計,以克服模式崩潰問題,提高GAN訓練階段的穩(wěn)定性.此外,生成樣本的初始分布也是一個很容易導致多樣性損失的重要因素.因此在生成器的目標函數(shù)中加入一個損失項,使得偽樣本趨于均勻分布.通過增加熵項H(G(z))來增加樣本的多樣性.熵越大,產(chǎn)生的樣本越混亂和均勻.因此,生成器的目標更改為:
L′G=-H(G(z))-EZ-Pz(D(G(z))-c)2(7)
式中:Pz為隨機噪聲的分布;(D(G(z))-c)2指數(shù)據(jù)被判斷為真實的概率;H(G(z))為偽樣本的熵項.
一批真實樣本中的每個樣本都是不同的,但如果發(fā)生模式崩潰,生成的所有樣本可能都是相同的.為了解決這個問題,提出抽離術語為:
H(y)=1bs(bs-1)∑i∑j≠iyTiyj‖yi‖‖yj‖2(8)
式中:y為生成的樣本;bs為一批樣品的數(shù)量;i和j為生成樣本的序列號.
該術語表示所生成的樣本批中的每個樣本都由編碼器編碼以生成向量.計算兩個向量之間的余弦距離,然后對余弦距離的和進行平均.將該項優(yōu)化得盡可能小,兩個向量越正交,其相似性就越低.這一項僅用于訓練生成的樣本而非真實樣本,因為它是為了解決生成器的模式崩潰問題而設計的.經(jīng)過一系列數(shù)學推導后,損失項H(G(z))最終表示為:
H(G(z))=EZ-Pz[‖z-En(G(z))‖2](9)
式中:En是一個帶參數(shù)的編碼器;En(G(z))為鑒頻器輸出的生成樣本的中間層特征.
最終生成器的目標函數(shù)為:
L′G=-EZ~Pz[D(G(z))+μ‖z-En(G(z))‖2](10)
式中:μ為虧損項目的權重值.
2.2"生成器結構設計
基于CAE在處理二維圖像時能保留大量的空間信息,提出將將CAE中的編碼器融入LSGAN的生成器中,提升模型對圖像空間信息的獲取,該模型的結構如圖1,將真實的路面圖像通過編碼器直接映射到潛空間,從而提取出真實圖像的空間特征信息,獲得該真實樣本向量的隱變量.
隱變量獲取過程如圖2,圖像輸入后首先通過t個卷積核W,每個卷積核搭配一個偏置,與輸入x卷積后生成t個特征圖h為:
ht=σ(x·Wt+bt)(11)
每張?zhí)卣鲌Dh與其對應的卷積核的轉(zhuǎn)置進行卷積操作并將結果求和,然后加上偏置c,獲得其隱變量值,公式如下:
y=σ(Σtht·W~t+c)(12)
獲取隱變量之后,再進行多次卷積與轉(zhuǎn)置卷積操作最終獲得生成圖像.
為了防止梯度的稀疏性,使用步長為2的卷積代替最大池化,并且為了減少上采樣時的信息損失,增大映射能力,用轉(zhuǎn)置卷積代替原先的線性插值.生成器結合編碼器結構將原本輸入的隨機噪聲更換為了帶有真實圖片特征信息的隱變量,從而增快模型的收斂速度,提高模型的生成質(zhì)量.其中編碼器由3個3×3的卷積網(wǎng)絡,1個3×3的轉(zhuǎn)置卷積網(wǎng)絡組成,其中第一個與第二個卷積步長為2起到下采樣的作用.生成器中剩余結構由3個步長為1的3×3卷積網(wǎng)絡和1個3×3轉(zhuǎn)置卷積網(wǎng)絡組成,最后一層使用tanh激活函數(shù)進行處理.
2.3"構建輕量級的殘差投影-擴展-投影-擴展模塊
在CLSGAN模型中,通過強化生成器對圖像空間特征的學習,提高了生成圖像質(zhì)量與速度,但由于判別器卷積層較少,對于圖像特征響應的層次較淺,面對生成的不太精細的圖像,會產(chǎn)生錯誤的反饋,而殘差網(wǎng)絡可以強化網(wǎng)絡的學習能力.文中設計一個輕量級的殘差模塊RPEPX并加入到CLSGAN模型的判別器中,提升判別器對圖像空間特征的鑒別能力,進而能夠提供精確的反饋到生成器,最終達到提升生成圖像質(zhì)量的作用.
RPEPX的結構如圖3,第一階段投影為1×1卷積,用于將輸入特征投影到較低維度,第一階段擴展為1×1卷積用于將特征擴展到不同于輸入特征的更高維度,中間層使用3×3深度卷積用于學習空間特征,以最小化計算復雜度,同時保留表示能力,第二階段投影為1×1卷積,用于將特征投影回較低維度,第二階段擴展為1×1卷積,將通道維度擴展到初始維度并與輸入結合以生成最終特征.
通過實驗發(fā)現(xiàn),在判別器中的第一層第二層與第三層之后添加殘差塊對模型生成圖像優(yōu)化效果最好,改進后的判別器模型如圖4.
輸入圖像大小為128×128,通道為1,通過4個卷積核心為3×3,stride為2的卷積核,3個RPEPX模塊與4個SN層之后,最終連接一個全連接層,經(jīng)全連接層之后判定圖像是否為真.
2.4"引入譜歸一化
在訓練CLSGAN模型時,發(fā)現(xiàn)模型收斂不穩(wěn)定,生成圖像質(zhì)量不穩(wěn)定等問題.譜歸一化(spectral normalization,SN)通過約束矩陣結構滿足Lipschitz約束進而消除模型在訓練時容易出現(xiàn)的收斂問題.
圖5為將譜歸一化分別添加至模型各模塊之后,訓練2 000次過程中生成圖像的FID效果圖,其中FID指標越小表示生成圖像效果越好.
由圖5可以看出,在未添加譜歸一化的情況下,模型生成圖片F(xiàn)ID值起伏波動較大,生成效果時好時壞,模型訓練不穩(wěn)定;在將譜歸一化添加至判別器中之后,訓練效果得到了很大的改善,不再出現(xiàn)大幅波動;在生成器與判別器中都加入譜歸一化之后,模型訓練效果得到進一步的提升,由此可見,添加譜歸一化之后模型表現(xiàn)出更加穩(wěn)定的訓練效果,可以避免異常梯度的產(chǎn)生,并且有效防止參數(shù)幅度的上升.
3"實驗與結果分析
為驗證算法的有效性,將改進算法與未改進算法進行對比.從主觀人眼觀察,客觀評價指標與應用檢測驗證對結果進行對比分析.實驗在Windows 10操作系統(tǒng)下,基于深度學習框架PyTorch實現(xiàn),CPU為3.6 GHz AMD Ryzen 5 1400 Quad-Core Processor ,GPU為 NVIDIA 1060 6 GB.
3.1"參數(shù)設置及數(shù)據(jù)集
文中數(shù)據(jù)來源IEEE大數(shù)據(jù)杯道路損壞數(shù)據(jù)集GRDDC 2020,原始數(shù)據(jù)包含日本道路損壞圖像10 506張,由于數(shù)據(jù)包含大量背景信息,為滿足訓練要求,對原始圖像進行裁剪、灰度化并重構大小以解決圖像無關信息過多且圖像過大難以訓練的問題.原始圖像大小為600×600的RGB圖像,預處理之后的圖像為128×128的灰度圖像,為平衡圖像類別的多樣性,分別篩選1 000張路面裂縫圖像、1 000張路面凹陷圖像與200張背景圖像,并組成數(shù)據(jù)集記為GCSP數(shù)據(jù)集.圖6為數(shù)據(jù)集獲取過程.分別抽取裂縫與凹陷圖像中900張用于訓練,100張用于測試.訓練參數(shù)如表1,網(wǎng)絡采用小批量梯度下降方式進行優(yōu)化.
3.2nbsp;主觀分析
分別使用文獻[9]、文獻[10]、DCGAN、WGAN-GP、LSGAN與所提CLSGAN對路面裂縫與路面凹陷圖像進行生成.
圖7為CLSGAN生成效果圖.圖7中(a)、(c)為路面裂縫與路面凹陷原圖,由于瀝青路面是黑色且數(shù)據(jù)采集時天氣、光線等一系列外在因素的影響,導致大部分圖片整體亮度偏暗,存在一定的背景噪聲,圖片特征與周圍背景對比度偏低,經(jīng)過本文模型的生成之后,由圖7(b)、(d)可以看出生成之后的圖像較原圖亮度有了一定的提升且特征與背景的對比度有了較大提高,也有一定的去噪效果.
特別是對于數(shù)據(jù)集中亮度較低的圖像,如圖8、9,圖8中(a)為亮度較低的路面裂縫圖像,圖9中(a)為亮度較低的路面凹陷圖像,由于曝光程度低導致病害特征不明顯,而生成的裂縫圖片如圖8(b),生成的凹陷圖片如圖9(b),生成的圖片亮度更高,裂縫與凹陷特征更加清晰,但是相較于正常光線生成的圖像圖8(d)與圖9(d),光線較暗情況下生成的圖像背景噪聲更多,正常光線情況下生成圖像背景更加平滑.
圖10為文中模型與其他模型的生成效果對比,在2 000次的訓練下,LSGAN模型與DCGAN模型生成效果相近,生成的圖中裂縫與凹陷特征都較難識別.WGAN-GP生成的裂縫圖像可以辨別出但較為模糊,生成凹陷圖像難以識別.文獻[9]模型生成裂縫特征效果尚可,但對于凹陷特征生成效果比文獻[10]模型生成效果差,文獻[10]模型生成的裂縫圖像雖然可以辨別裂縫特征,但整體較為模糊.相較于這幾種模型生成效果,CLSGAN模型生成生成圖像清晰度更好,輪廓與細節(jié)也都好于其他算法,能夠判生成圖像別所屬病害類別,如圖10(f).
3.3"圖像評價指標分析
為了驗證文中提出的算法,對算法進行消融實驗,在比較同時還加入文獻[9]、文獻[10]進行進一步對比.采用FID,SSIM,MSE,PSNR與模型參數(shù)量評價指標,F(xiàn)ID通過特征向量之間距離來判定真實圖像和生成圖像的關系,具體公式為:
FID=‖μr-μg‖2+Tr(Σr+Σg-2(ΣrΣg)1/2)(13)
式中:μr為真實圖片的特征均值;μg為生成圖片的特征均值;Σr為真實圖片的特征協(xié)方差矩陣;Σg為生成圖片的特征協(xié)方差矩陣.
FID越小表示生成圖像與真實圖像的特征越接近,質(zhì)量越好多樣性越高.SSIM是衡量兩張圖結構相似性的指標,越靠近1表示圖片越相似.PSNR是衡量圖片質(zhì)量的指標,通過兩張圖片的MES來定義,MES越小PSNR越大,PSNR越大代表圖片質(zhì)量越好.
選取的測試圖片為在訓練完成得模型下訓練測試集生成的圖片,大小為128×128,用訓練獲取的40張圖片與測試集進行對比獲得FID值.
通過表2的消融實驗可以得出,對于小樣本數(shù)據(jù)集,在改進生成器后對于路面裂縫圖像生成的FID值為200.1,SSIM為0.780,PSNR為28.6,較為改進模型各指標都有較大提升.對于路面特征更加復雜的路面凹陷圖片,F(xiàn)ID值降低了200.6,SSIM提升了0.469,PSNR也提升了11.2.由于將一維的噪聲更換為了二維的圖像,所以參數(shù)量(paprms)有了一定的上升.
進一步的,在判別器中加入RPEPX模塊并引入譜歸一化后,由于增加了對圖像的深入識別,參數(shù)量又有了一定的上升,對于生成裂縫圖片與凹陷圖片F(xiàn)ID分別有22.0與35.4的降低,SSIM與PSNR也都有一定的提升.總體來說對于路面裂縫與路面凹陷圖像的生成,文中改進都是有效的.
在不斷進行改進模型實驗時,還加入了最終改進模型與其他文獻模型的對比,如表3,DCGAN、WGAN-GP生成圖像各項指標都較差,模型參數(shù)量DCGAN最少,WGAN-GP最多.文獻[9]對于路面特征復雜的路面凹陷生成效果較差,SSIM只有0.319,PSNR值也較低.文獻[9]與文獻[10]模型對于路面裂縫圖像生成與文中模型FID值相差不大,但SSIM PSNR相差較大,對于路面凹陷圖像生成,文獻[9]與文獻[10]模型與文中各個指標都有一定的差距.
總的來說,各指標結果和主觀觀察結果大體一致,文中算法對于路面裂縫與路面凹陷圖片生成效果不管是在質(zhì)量、多樣性還是相似性方面均好于另外幾種模型,模型的參數(shù)量也遠小于文獻[9]與文獻[10]兩種算法.
3.4"應用分析
為驗證對于路面裂縫與凹陷數(shù)據(jù)集增強的有效性,設計了不同數(shù)據(jù)集擴充方法的對比實驗,如表4,選擇Yolov5s檢測模型作為評價模型,傳統(tǒng)數(shù)據(jù)集擴充方法為幾何變換,包括旋轉(zhuǎn),鏡像和折疊.
檢測網(wǎng)絡選用的常見的評價指標檢測平均精度map0.5,使用傳統(tǒng)的數(shù)據(jù)集擴充方法與文中生成對抗網(wǎng)絡擴充方法都能使檢測網(wǎng)絡精度指標得到一定的提升,但較傳統(tǒng)擴充方法,文中方法提升更大.
4"結論
文中提出了一種基于LSGAN改進的生成對抗網(wǎng)絡來解決路面病害數(shù)據(jù)增強的問題.首先在生成器目標函數(shù)中引入新的損失項來保證生成圖像的多樣性,并在生成器中融合編碼器以獲取真實圖像的空間潛在信息,提高了網(wǎng)絡的收斂速度與生成圖像的質(zhì)量.其次,構建了一種輕量級的殘差投影-擴展-投影-擴展模塊(RPEPX),并融入判別器中進一步提高了生成圖像的質(zhì)量.最后在生成器與判別器中都引入譜歸一化提高了模型訓練時的穩(wěn)定性.
文中提出的改進生成對抗網(wǎng)絡模型在路面病害圖像數(shù)據(jù)增強上取得了一定的成功,特別對于路面裂縫圖像的生成效果較好,但對于特征更加復雜的路面凹陷圖像生成圖像與真實圖像還是有一定差距的.且經(jīng)過檢測實驗發(fā)現(xiàn)在同等數(shù)據(jù)集的情況下,文中數(shù)據(jù)集擴充方法可以使檢測精度達到最優(yōu).在今后的研究過程中,可以增加注意力模塊以及加深網(wǎng)絡的深度強化生成器以提升對包含復雜特征圖像的特征提取,生成質(zhì)量更好的復雜圖像.
參考文獻(References)
[1]"鄭遠攀,李廣陽,李曄.深度學習在圖像識別中的應用研究綜述[J].計算機工程與應用,2019,55(12):20-36.
[2]"陳昌川,王海寧,趙悅,等.一種基于深度學習的交通標志識別新算法[J].電訊技術,2021, 61 (1):76-82.
[3]"車滿強,李樹斌,李銘.基于HarDNet全卷積網(wǎng)絡的道路路面語義分割方法[J].計算機應用,2021,41(S2):76-80.
[4]"KAZUHIRO K, WERNER R A, TORIUMI F, et al. Generative adversarial networks for the creation of realistic artificial brain magnetic resonance images[J]. Tomography, 2018, 4(4): 159-163.
[5]"孫曉,丁小龍.基于生成對抗網(wǎng)絡的人臉表情數(shù)據(jù)增強方法[J].計算機工程與應用,2020,56(4):115-121.
[6]"XU L, SUN W Q, YAN Y H, et al. Solar image deconvolution by generative adversarial network[J]. Research in Astronomy and Astrophysics, 2020, 20(11): 170.
[7]"HAN L, MIN M R, STATHOPOULOS A, et al. Dual projection generative adversarial networks for conditional image generation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. USA:IEEE,2021: 14438-14447.
[8]"ZHANG K, ZHANG Y, CHENG H D. Crackgan: Pavement crack detection using partially accurate ground truths based on generative adversarial learning[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 22(2): 1306-1319.
[9]"裴莉莉,孫朝云,孫靜,等.基于DCGAN的路面裂縫圖像生成方法[J].中南大學學報(自然科學版),2021,52(11):3899-3906.
[10]"PEI L, SUN Z, XIAO L, et al. Virtual generation of pavement crack images based on improved deep convolutional generative adversarial network[J]. Engineering Applications of Artificial Intelligence, 2021, 104: 104376.
(責任編輯:曹莉)