亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的長(zhǎng)尾數(shù)據(jù)集分類精度提高的研究

        2021-11-29 02:17:58王中洲魏勝楠
        關(guān)鍵詞:實(shí)驗(yàn)

        王中洲,陳 亮,魏勝楠

        (沈陽(yáng)理工大學(xué) 自動(dòng)化與電氣工程學(xué)院,沈陽(yáng) 110159)

        在機(jī)器學(xué)習(xí)及其視覺識(shí)別的應(yīng)用中,處理的數(shù)據(jù)集通常都有一個(gè)基本假設(shè),即該數(shù)據(jù)集各類別對(duì)應(yīng)的樣本數(shù)量近似服從均勻分布,亦即類別平衡,但實(shí)際數(shù)據(jù)往往呈現(xiàn)極端不平衡狀態(tài)[1]。在一個(gè)訓(xùn)練樣本集中一些類別的樣本數(shù)量較多,這種類別的樣本稱為頭類樣本;一些樣本的數(shù)量較少,是頭類樣本的十分之一甚至更少,這種類別的樣本稱為尾類樣本。頭類樣本與尾類樣本的比值稱為不平衡率,不平衡率大于10的數(shù)據(jù)集稱為長(zhǎng)尾數(shù)據(jù)集[2]。汽車輪胎缺陷的分類和定位研究中實(shí)驗(yàn)用輪胎數(shù)據(jù)集即為長(zhǎng)尾數(shù)據(jù)集。

        數(shù)據(jù)集類別不平衡導(dǎo)致模型學(xué)習(xí)非常容易被頭類樣本主導(dǎo)而產(chǎn)生過擬合;同時(shí)模型對(duì)于尾類樣本的建模能力極其有限,從而在模型測(cè)試階段表現(xiàn)出對(duì)尾類樣本預(yù)測(cè)精度不高的問題。

        經(jīng)典統(tǒng)計(jì)機(jī)器學(xué)習(xí)處理長(zhǎng)尾問題采用處理傳統(tǒng)類別不平衡問題的方法?,F(xiàn)有技術(shù)有兩類做法:第一類為重采樣法,即通過采樣方式緩解長(zhǎng)尾分布帶來的樣本極度不平衡[3];第二類為重權(quán)重法,通過改變權(quán)重來調(diào)整不同類別的訓(xùn)練比重[4]。

        深度學(xué)習(xí)使用的方法如下。

        (1)開放長(zhǎng)尾識(shí)別算法(Open Long-tail Recognition,OLTR)基于一種度量標(biāo)準(zhǔn)將圖像映射到一個(gè)特征空間[5]。其優(yōu)點(diǎn)是在尊重封閉世界的同時(shí)承認(rèn)開放世界的新穎性,但是訓(xùn)練過程復(fù)雜,操作繁瑣。

        (2)解耦算法認(rèn)為對(duì)任何不平衡分類數(shù)據(jù)的重平衡本質(zhì)上都是對(duì)分類器重平衡[6]。按照此理論提出了一種可以將特征學(xué)習(xí)和分類器學(xué)習(xí)解耦的訓(xùn)練策略,但該算法使用類平衡策略會(huì)出現(xiàn)學(xué)習(xí)頭類樣本特征不充分的問題。

        (3)標(biāo)簽分布感知邊緣算法(Label-Distribution-Aware Margin,LDAM)提出基于邊緣泛化界限的損失函數(shù)[7],取代了訓(xùn)練網(wǎng)絡(luò)中的損失函數(shù),但是訓(xùn)練過程相比其他算法并沒有優(yōu)勢(shì)。

        兩階段法訓(xùn)練過程分為兩個(gè)階段:第一個(gè)階段深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)服從原始長(zhǎng)尾分布;第二階段是緩解長(zhǎng)尾分布帶來的不平衡。2020年CVPR會(huì)議上Zhou B等基于兩階段法提出雙邊分支神經(jīng)網(wǎng)絡(luò)(Bilateral-Branch Network,BBN),用于解決在自然界中存在的長(zhǎng)尾數(shù)據(jù)集中尾類樣本數(shù)量少、分類精確度低的問題[8];該訓(xùn)練方法簡(jiǎn)單、操作步驟較少,可以兼顧特征學(xué)習(xí)和分類器學(xué)習(xí)。

        本文使用BBN網(wǎng)絡(luò)解決輪胎長(zhǎng)尾數(shù)據(jù)集中缺陷樣本分類精度低的問題。

        1 BBN網(wǎng)絡(luò)結(jié)構(gòu)分析

        BBN雙分支循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        圖1 BBN雙分支循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

        BBN中包含的兩個(gè)分支用于表示特征學(xué)習(xí)和分類器學(xué)習(xí)。兩個(gè)分支使用相同的殘差網(wǎng)絡(luò)結(jié)構(gòu),共享除最后一個(gè)殘差塊以外的所有權(quán)值。其工作過程如下。

        (1)設(shè)x表示訓(xùn)練樣本集,y∈{1,2,…,H}是x內(nèi)各元素對(duì)應(yīng)的標(biāo)簽,其中H是類別數(shù)量。經(jīng)采樣得到的樣本(xc,yc)和(xr,yr)作為兩個(gè)分支網(wǎng)絡(luò)輸入數(shù)據(jù),其中(xc,yc)為傳統(tǒng)學(xué)習(xí)分支的輸入數(shù)據(jù),(xr,yr)為重平衡分支的輸入數(shù)據(jù)。

        (2)先將兩個(gè)分支的輸入數(shù)據(jù)經(jīng)過殘差網(wǎng)絡(luò)特征提取,然后經(jīng)過全局平均池化(Global Average Pooling,GAP)降低維度,減少訓(xùn)練參數(shù),得到特征向量fc和fr。

        (3)將(2)中得到的特征向量fc和fr經(jīng)過特定的累積學(xué)習(xí)策略,改變網(wǎng)絡(luò)對(duì)兩個(gè)分支特征向量的注意力。通過累計(jì)學(xué)習(xí)策略中的自適應(yīng)權(quán)衡參數(shù)α控制fc和fr的權(quán)值,將加權(quán)特征向量αfc和(1-α)fr分別傳輸?shù)絎c和Wr分類器中,輸出結(jié)果為

        (1)

        式中z為預(yù)測(cè)輸出向量。

        (4)將兩分支輸出的結(jié)果經(jīng)過歸一化指數(shù)函數(shù)Softmax處理,計(jì)算每一個(gè)類別的概率。Softmax函數(shù)計(jì)算公式為

        (2)

        式中:zi為第i個(gè)節(jié)點(diǎn)的輸出;j為輸出的網(wǎng)絡(luò)節(jié)點(diǎn)類別。

        (3)

        1.1 特征提取網(wǎng)絡(luò)

        在數(shù)據(jù)集的特征提取網(wǎng)絡(luò)中,卷積神經(jīng)網(wǎng)絡(luò)特征提取效果相比于其它網(wǎng)絡(luò)更好。

        采用ResNet-32與ResNet-50網(wǎng)絡(luò)在不同不平衡率的CIFAR-10和CIFAR-100數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)錯(cuò)誤率結(jié)果如表1所示。

        表1 不同骨干網(wǎng)絡(luò)錯(cuò)誤率對(duì)比

        從表1可見,使用網(wǎng)絡(luò)ResNet-50比使用ResNet-32的錯(cuò)誤率更低,表明ResNet-50相比于ResNet-32提取效果更好,沒有出現(xiàn)網(wǎng)絡(luò)退化問題。

        ResNet-50的網(wǎng)絡(luò)結(jié)構(gòu)如表2所示。

        表2 ResNet-50網(wǎng)絡(luò)結(jié)構(gòu)

        1.2 數(shù)據(jù)采樣

        傳統(tǒng)學(xué)習(xí)分支的輸入數(shù)據(jù)來自均勻采樣器,其中訓(xùn)練數(shù)據(jù)集中的每個(gè)樣本在一個(gè)訓(xùn)練時(shí)期中以相等概率只采樣一次[9]。均勻采樣器保留了原始分布的特征,有利于表征學(xué)習(xí)。而重平衡分支的目的是為了緩解數(shù)據(jù)不平衡。表3為實(shí)驗(yàn)得出的不同采樣器模型的錯(cuò)誤率。從表中可以看出,反向采樣器取得了比均勻采樣器和平衡采樣器更低的錯(cuò)誤率,表明重平衡分支可以通過使用反向采樣器更多地關(guān)注尾類缺陷數(shù)據(jù)[12]。

        表3 不同采樣器的錯(cuò)誤率 %

        1.3 累積學(xué)習(xí)策略

        累積學(xué)習(xí)策略使用一個(gè)權(quán)衡參數(shù)α,可以將訓(xùn)練的注意力從一個(gè)分支轉(zhuǎn)變到另一個(gè)分支。不同的α取值方式對(duì)于實(shí)驗(yàn)的影響如表4所示。

        表4 不同α在輪胎數(shù)據(jù)集的對(duì)比實(shí)驗(yàn)

        從表4的實(shí)驗(yàn)結(jié)果可以看出:以線性衰減和拋物線衰減為取值方式的α的錯(cuò)誤率相比其它取值方式更低。說明首先訓(xùn)練傳統(tǒng)學(xué)習(xí)分支,再訓(xùn)練重平衡分支的訓(xùn)練方法,可以避免破壞學(xué)習(xí)到的原始分布特征,又提升了分類準(zhǔn)確率。

        2 實(shí)驗(yàn)結(jié)果與分析

        輪胎數(shù)據(jù)集樣本量分布如圖2所示。

        圖2 輪胎長(zhǎng)尾數(shù)據(jù)集樣本量分布圖

        輪胎數(shù)據(jù)集中共10類缺陷,其中稀線缺陷樣本為頭類樣本,氣泡缺陷樣本為尾類樣本。

        實(shí)驗(yàn)中除使用長(zhǎng)尾版本的CIFAR數(shù)據(jù)集CIFAR-10和CIFAR-100外,還使用了實(shí)驗(yàn)室標(biāo)注分類的輪胎數(shù)據(jù)集。此數(shù)據(jù)集包含60000張圖片,50000張圖片用于訓(xùn)練,10000張圖片用于驗(yàn)證,缺陷類別數(shù)量為10,不平衡因子設(shè)置為10。

        實(shí)驗(yàn)中制作數(shù)據(jù)集時(shí),采用的數(shù)據(jù)增強(qiáng)策略是從原始圖像中隨機(jī)裁剪一個(gè)32×32的圖片橫向翻轉(zhuǎn),每邊填充4個(gè)像素[10],目的是提升訓(xùn)練樣本的數(shù)據(jù)量,改善網(wǎng)絡(luò)模型的魯棒性。

        2.1 長(zhǎng)尾數(shù)據(jù)集實(shí)驗(yàn)分析

        本實(shí)驗(yàn)使用不同不平衡率的長(zhǎng)尾CIFAR-10和長(zhǎng)尾CIFAR-100訓(xùn)練數(shù)據(jù),錯(cuò)誤率為評(píng)價(jià)指標(biāo)。不同損失函數(shù)的實(shí)驗(yàn)結(jié)果如表5所示。

        表5 不同損失函數(shù)在CIFAR-10和CIFAR-100上的錯(cuò)誤率對(duì)比

        從表5可以看出,使用Softmax函數(shù)比CE損失函數(shù)的錯(cuò)誤率更低,而且隨著不平衡率的上升,相較于CE損失函數(shù),使用Softmax函數(shù)錯(cuò)誤率變化更穩(wěn)定,說明該方法可有效解決樣本不平衡對(duì)分類精度的影響問題。

        2.2 自制數(shù)據(jù)集實(shí)驗(yàn)分析

        本實(shí)驗(yàn)使用輪胎數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),損失值、平均精度均值(mAP)、錯(cuò)誤率作為評(píng)價(jià)指標(biāo)。實(shí)驗(yàn)過程中損失值的變化曲線如圖3所示。

        從圖3可以看出,使用ResNet-50比使用ResNet-32收斂速度更快,收斂維度更低。證明對(duì)于輪胎缺陷圖片ResNet-50比ResNet-32特征提取效果更好,沒有出現(xiàn)網(wǎng)絡(luò)退化問題。

        圖3 不同骨干網(wǎng)絡(luò)的對(duì)比圖

        為驗(yàn)證損失函數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響,使用Softmax函數(shù)和CE損失函數(shù)進(jìn)行對(duì)比試驗(yàn),實(shí)驗(yàn)結(jié)果如圖4所示。

        圖4 不同損失函數(shù)的對(duì)比圖

        從圖4可以看出,使用Softmax函數(shù)與CE損失函數(shù)相比,收斂維度降低,收斂速度更快。證明在BBN網(wǎng)絡(luò)中使用 Softmax函數(shù)可以降低訓(xùn)練難度,提高分類準(zhǔn)確性。

        在輪胎數(shù)據(jù)集上訓(xùn)練改進(jìn)后的網(wǎng)絡(luò)模型(OURS)與網(wǎng)絡(luò)模型OLTR、Decoupling、LDAM、BBN進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表6所示。

        表6 不同網(wǎng)絡(luò)模型實(shí)驗(yàn)結(jié)果 %

        從表6可見,改進(jìn)后的網(wǎng)絡(luò)模型各評(píng)價(jià)指標(biāo)均優(yōu)于其他網(wǎng)絡(luò)。說明改進(jìn)后的網(wǎng)絡(luò)在特征提取效果和分類器性能兩方面均有提升。

        在輪胎數(shù)據(jù)集上訓(xùn)練BBN網(wǎng)絡(luò)模型和改進(jìn)后網(wǎng)絡(luò)得到的部分輪胎缺陷分類結(jié)果如圖5所示。

        圖5 實(shí)驗(yàn)結(jié)果圖

        由圖5可見,改進(jìn)后的網(wǎng)絡(luò)相比于原網(wǎng)絡(luò),雜質(zhì)和氣泡兩類缺陷的分類準(zhǔn)確率有很大提高。

        3 結(jié)論

        本文使用BBN雙邊分支神經(jīng)網(wǎng)絡(luò)訓(xùn)練輪胎數(shù)據(jù)集。通過對(duì)BBN神經(jīng)網(wǎng)絡(luò)中的骨干網(wǎng)絡(luò)采用更適合提取輪胎缺陷圖片的ResNet-50神經(jīng)網(wǎng)絡(luò),損失函數(shù)采用適合輪胎數(shù)據(jù)集的Softmax 函數(shù),權(quán)衡參數(shù)調(diào)整為線性衰減,令改進(jìn)后的BBN神經(jīng)網(wǎng)絡(luò)更適合訓(xùn)練本實(shí)驗(yàn)室制作的輪胎數(shù)據(jù)集,使輪胎數(shù)據(jù)集中的尾類缺陷的分類效果更好,平均準(zhǔn)確率更高。

        猜你喜歡
        實(shí)驗(yàn)
        我做了一項(xiàng)小實(shí)驗(yàn)
        記住“三個(gè)字”,寫好小實(shí)驗(yàn)
        我做了一項(xiàng)小實(shí)驗(yàn)
        我做了一項(xiàng)小實(shí)驗(yàn)
        記一次有趣的實(shí)驗(yàn)
        有趣的實(shí)驗(yàn)
        微型實(shí)驗(yàn)里看“燃燒”
        做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        精品一区二区三区长筒靴| 人妻少妇中文字幕专区| 中文字幕在线看精品乱码 | 国产区精品| 中文字幕在线一区乱码| 国产亚洲成人精品久久久| 久久午夜无码鲁丝片午夜精品| 免费男人下部进女人下部视频| 亚洲欧美日韩在线中文一| 国产av精选一区二区| 久久五月精品中文字幕| 亚洲精品一品区二品区三区| 日韩丰满少妇无码内射| 亚洲中文字幕无线无码毛片 | 午夜时刻免费入口| 久久久亚洲色| 少妇bbwbbw高潮| av在线不卡一区二区| 日本一本之道高清不卡免费| 六月婷婷国产精品综合| 熟女人妻中文字幕一区| 有坂深雪中文字幕亚洲中文| 日韩视频中文字幕精品偷拍| 国产香蕉尹人综合在线观| 亚洲精品女同在线观看| 激情综合婷婷色五月蜜桃| 国产成人综合色在线观看网站| 成人免费无码a毛片| 成人久久精品人妻一区二区三区| 影音先锋色小姐| 国产天堂在线观看| 激情视频在线观看免费播放| 手机看片久久第一人妻| 久久99热久久99精品| 亚洲成人av一区二区三区| 我揉搓少妇好久没做高潮| 又嫩又硬又黄又爽的视频| 日韩在线免费| 久久久一本精品久久久一本| 无码一区二区三区| 国产又色又爽无遮挡免费动态图|