亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于采樣的深度神經(jīng)網(wǎng)絡(luò)測試方法研究①

        2020-10-29 05:04:54
        關(guān)鍵詞:置信度方差神經(jīng)元

        蘇 警

        (安徽電子信息職業(yè)技術(shù)學(xué)院 軟件學(xué)院,安徽 蚌埠 233000)

        0 引 言

        隨著人工智能應(yīng)用的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)模型稱為很多軟件系統(tǒng)的重要組成部分[1-2]。因此,在實(shí)際應(yīng)用環(huán)境中對深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行有效的測試,是確保模型能夠正常運(yùn)行的必要手段。但是,對實(shí)際環(huán)境數(shù)據(jù)集進(jìn)行標(biāo)記需要花費(fèi)大量的人力物力,造成巨大的成本。針對該問題,利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的分布表征,縮減測試所需的輸入空間,有效減少測試數(shù)據(jù)的標(biāo)注代價。

        1 實(shí)際環(huán)境的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)測試

        深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)是由輸入層、輸出層以及多層隱藏層組成是的人工神經(jīng)網(wǎng)絡(luò)。DNN將輸入轉(zhuǎn)換為相應(yīng)的輸出,能夠描述線性和非線性關(guān)系。神經(jīng)網(wǎng)絡(luò)后一層的輸入是其前一層輸出的線性組合,其中的激活函數(shù)φ使神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的擬合能力。與其他機(jī)器學(xué)習(xí)模型類似,深度神經(jīng)網(wǎng)絡(luò)首先會使用訓(xùn)練數(shù)據(jù)集進(jìn)行參數(shù)訓(xùn)練(即神經(jīng)元之間的權(quán)重wi,j和偏置bi)。實(shí)際上,深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的是后驗(yàn)概率分布,即p(y|x)。

        將經(jīng)過訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型部署在特定應(yīng)用環(huán)境中時,該深度神經(jīng)網(wǎng)絡(luò)模型可能并不能達(dá)到預(yù)期的精度。造成深度神經(jīng)網(wǎng)絡(luò)模型精度下降的原因有多種,例如模型在特定的訓(xùn)練數(shù)據(jù)集下發(fā)生過擬合或者欠擬合,或者是訓(xùn)練數(shù)據(jù)集和應(yīng)用場景的數(shù)據(jù)集之間存在數(shù)據(jù)分布差異。在實(shí)踐中,數(shù)據(jù)分布差異的情況時常發(fā)生。因此,在深度神經(jīng)網(wǎng)絡(luò)模型在投入使用之前必須經(jīng)過充分測試。深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了歸納推理,它與基于邏輯推理的軟件程序不同,因此深度神經(jīng)網(wǎng)絡(luò)測試與傳統(tǒng)的軟件測試不同。對于經(jīng)過訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型,不存在確定且通用的測試方法。深度神經(jīng)網(wǎng)絡(luò)測試的大概流程是,提供預(yù)先訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型和特定的操作上下文,以判斷該模型在此上下文中的性能,判斷的依據(jù)是深度神經(jīng)網(wǎng)絡(luò)模型的預(yù)測準(zhǔn)確性。如果能夠獲得足夠多的標(biāo)記數(shù)據(jù),那么深度神經(jīng)網(wǎng)絡(luò)測試并不是一個困難的任務(wù)。實(shí)際上,盡管可以從操作環(huán)境中收集未標(biāo)記的數(shù)據(jù),但是對數(shù)據(jù)進(jìn)行標(biāo)記的成本非常昂貴。因此,深度神經(jīng)網(wǎng)絡(luò)測試的關(guān)鍵中心問題是如何使用少量的帶標(biāo)記數(shù)據(jù)樣本準(zhǔn)確測試深度神經(jīng)網(wǎng)絡(luò)在其操作環(huán)境中的性能。

        (1)

        Var[H(X)]=E[Var[H(X|Z)]]+Var[E[H(X|Z)]]

        (2)

        式(2)中,總方差Var[H(X)]由兩部分構(gòu)成,第一部分是誤差的均值E[Var[H(X|Z)]],第二部分是誤差的方差Var[E[H(X|Z)]]。E[H(X|Z)]是關(guān)于Z的函數(shù),而且有E[H(X)]=E[E[H(X|Z)]]。

        可以利用Z的分布進(jìn)行采樣,并且由于E[H(X|Z)]的方差比H(X)小,可以估計(jì)E[H(X|Z)]而不是直接估計(jì)H(X)。如果可以制作一個完整的Z樣本,即樣本覆蓋了Z的所有值zi,則估計(jì)的方差將會是估計(jì)E[H(X|zi)]所引入的方差。此外,如果H(X)的值完全由Z決定,則方差為零。但是,這兩個條件難以被滿足,尤其是在操作軟件測試的復(fù)雜場景中。因此,要提高測試的效率,需要:(1)盡可能確定影響H(X)準(zhǔn)確性的Z,以便使在每個zi條件下H(X)的方差最??;(2)盡可能選擇Z中具有代表性的樣本,以便可以很好地處理Z帶來的不確定性。上述兩點(diǎn)在實(shí)際實(shí)踐的過程中互相矛盾的。直觀地講,H(X)的解釋Z越“精確”,它的粒度就越細(xì),而用小樣本就越難代表它。因此需要小心地選擇樣本Z以在它們之間取得良好的平衡。用于提高測試效率的調(diào)節(jié)技術(shù)可以看作是常規(guī)白盒測試中結(jié)構(gòu)化覆蓋。然而,由于深度神經(jīng)網(wǎng)絡(luò)測試的黑盒性質(zhì),將這一想法應(yīng)用于深度神經(jīng)網(wǎng)絡(luò)測試極具挑戰(zhàn)性。而且深度神經(jīng)網(wǎng)絡(luò)模型的樣本Z是一個高維向量,因此難以用小樣本來表示。

        2 基于采樣的測試方法

        給定訓(xùn)練過的深度神經(jīng)網(wǎng)絡(luò)模型M,從操作上下文中收集的N個未標(biāo)記樣本的集合S,從集合S中選擇子集T并對T中的樣本進(jìn)行標(biāo)記,子集T的大小為n=|T|?N。使用T來測試模型M在樣本S上的準(zhǔn)確度,使估計(jì)誤差盡量小。利用模型M和樣本集合S的信息,試通過調(diào)節(jié)來實(shí)現(xiàn)有效的估計(jì)。首先討論基于置信度的分層抽樣調(diào)節(jié),然后提出了一個解決方案,該方案通過模型M所學(xué)習(xí)的表示來進(jìn)行調(diào)節(jié),并通過交叉熵最小化來近似樣本S的分布。

        (3)

        可以將最后一層隱藏層神經(jīng)元的輸出作為隨機(jī)變量Z。該輸出可以看成是訓(xùn)練數(shù)據(jù)的學(xué)習(xí)表征。操作上下文的數(shù)據(jù)不是獨(dú)立同分布時,表征會比預(yù)測更穩(wěn)定。對于經(jīng)過訓(xùn)練的模型M,假設(shè)其最后一個隱藏層L由m個神經(jīng)元ei組成。將每個神經(jīng)元ei的輸出Dei分成K個相等的部分,并定義函數(shù)fei(x)=j,表示輸入x所對應(yīng)的神經(jīng)元ei的輸出屬于集合Dei,j。

        令Sz1,…,zm={x∈S|fei(x)=zi}是S的子集,子集Sz1,…,zm中的元素與z=(z1,…,zm)一一對應(yīng)。樣本Z的概率分布PS(z)的定義為:

        (4)

        但是,由于樣本Z具有較高的維數(shù),要根據(jù)Z的分布從整個測試集S中獲取樣本T極具挑戰(zhàn)性,更不用說實(shí)施分層采樣了。對此,通過最小化PS(Z)和PT(Z)之間的交叉熵來選擇樣本集合T,即

        (5)

        其中,

        (6)

        在這種高維情況下,很難直接計(jì)算出最小值。由于深度神經(jīng)網(wǎng)絡(luò)通常會減少最后一個隱藏層中神經(jīng)元之間的相關(guān)性[3],因此可以通過假設(shè)它們在計(jì)算最小化時彼此獨(dú)立來進(jìn)行近似。在這種情況下,可以通過最小化PS(Z)和PT(Z)之間的平均交叉熵來最小化CE(T),即

        (7)

        當(dāng)PS(z)=PT(z)時,可以得到CE(T)的最優(yōu)值。因此,模型準(zhǔn)確度的估計(jì)可以表示為:

        (8)

        為了求解優(yōu)化問題(7),提出了一種基于隨機(jī)游走的輸入選擇算法(如算法1所示)。

        表1 隨機(jī)游走的輸入選擇算法

        3 實(shí)驗(yàn)評估

        使用Tensorfow和Keras框架實(shí)現(xiàn)了本文提出的方法。對于基于置信度的分層抽樣,使用通過實(shí)驗(yàn)獲得的最佳設(shè)置。樣本分為三個層次,具有最高置信度前80%樣本分配給第一層,將其后的10%分配給第二層,將最低的10%分配給第三層。為了獲得大小為n的樣本,分別從三個層次中選取0.2n、0.4n和0.4n個樣本。對于實(shí)現(xiàn)基于表示的條件的基于交叉熵的采樣,將每個神經(jīng)元的切片數(shù)K設(shè)置為20。

        (a)訓(xùn)練數(shù)據(jù)集與操作環(huán)境數(shù)據(jù)集相同 (b)訓(xùn)練數(shù)據(jù)集與操作環(huán)境數(shù)據(jù)集不同

        通常,可操作深度神經(jīng)網(wǎng)絡(luò)測試是在特定操作環(huán)境中檢測深度神經(jīng)網(wǎng)絡(luò)模型的性能損失。假設(shè)深度神經(jīng)網(wǎng)絡(luò)模型已經(jīng)使用訓(xùn)練集進(jìn)行了很好的訓(xùn)練。實(shí)驗(yàn)采用的深度神經(jīng)網(wǎng)絡(luò)模型為LeNet-5[4],操作環(huán)境的數(shù)據(jù)集為MNIST[5]。訓(xùn)練數(shù)據(jù)集有兩個,一個是原始的MNIST數(shù)據(jù)集,另一個是經(jīng)過篡改標(biāo)注的MNIST數(shù)據(jù)集。估計(jì)器的性能指標(biāo)是平均平方誤差(MSE)。實(shí)驗(yàn)是在PC上進(jìn)行的,使用Liunx操作系統(tǒng),CPU為i7-9700K,內(nèi)存為64GB,GPU為英偉達(dá)GTX 1060Ti。實(shí)驗(yàn)結(jié)果如圖1所示。圖1(a)是訓(xùn)練數(shù)據(jù)集和操作環(huán)境數(shù)據(jù)集均為MNIST的MSE結(jié)果,圖(b)是訓(xùn)練數(shù)據(jù)集為經(jīng)過篡改的MNIST的MSE結(jié)果。由圖1(a)可知,基于置信度的分層采樣方法表現(xiàn)最好,其MSE最低。但是,如圖1(b)所示,當(dāng)訓(xùn)練數(shù)據(jù)集和操作環(huán)境數(shù)據(jù)集不一致時,基于置信度的分層采樣方法具有最高的MSE。這說明基于置信度的采樣具有較低的魯棒性。對比圖1(a)和(b)可知,基于交叉熵的采樣方法表現(xiàn)最為穩(wěn)定,其MSE均低于隨機(jī)采樣方法,具有較高的魯棒性。

        4 結(jié) 論

        利用深度神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到的表征來提高操作環(huán)境中深度神經(jīng)網(wǎng)絡(luò)測試的效率,通過實(shí)驗(yàn)評估了提出的基于表征條件的采樣方法的有效性。在后續(xù)的工作中,將對實(shí)驗(yàn)進(jìn)行擴(kuò)展。使用更多目前常見的深度學(xué)習(xí)模型(例如VGG-19,ResNet-50,Dave-drop)和數(shù)據(jù)集(例如ImageNet,MS-COCO,VisualQA,CIFAR-10)進(jìn)一步驗(yàn)證本方法的有效性。

        猜你喜歡
        置信度方差神經(jīng)元
        方差怎么算
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        《從光子到神經(jīng)元》書評
        自然雜志(2021年6期)2021-12-23 08:24:46
        概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
        計(jì)算方差用哪個公式
        正負(fù)關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
        躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
        方差生活秀
        基于二次型單神經(jīng)元PID的MPPT控制
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        精品免费看国产一区二区| 亚洲无人区乱码中文字幕动画 | 久久精品国产熟女亚洲av麻豆| 精品日韩亚洲av无码| 纯爱无遮挡h肉动漫在线播放| 国产偷国产偷亚洲欧美高清| 色妞一区二区三区免费视频| 色婷婷精品久久二区二区蜜桃| 97久久超碰国产精品旧版| 久久aⅴ无码一区二区三区| 国产一区二区在线观看视频免费| 看女人毛茸茸下面视频| 粗大猛烈进出高潮视频| 国产一毛片| 国产亚洲精品一区二区在线播放| 精品人妻av一区二区三区 | 91偷拍与自偷拍亚洲精品86| 波多野42部无码喷潮在线| 人人妻人人澡人人爽人人精品电影| 日本一区二区不卡超清在线播放 | 日本二区视频在线观看| 人妻少妇中文字幕久久| 极品新婚夜少妇真紧| 国产农村三片免费网站| 人妻秘书被社长浓厚接吻| 少妇久久久久久被弄高潮| 久久久久麻豆v国产精华液好用吗 欧美性猛交xxxx乱大交丰满 | 熟女体下毛荫荫黑森林| 日日碰狠狠躁久久躁9| 天天射色综合| 日韩人妻久久中文字幕| 黑森林福利视频导航| 亚洲成a人片在线网站| 亚洲精品乱码久久麻豆| 丝袜人妻一区二区三区| 精品福利视频一区二区三区| 亚洲无码毛片免费视频在线观看| 日韩人妻系列在线观看| 久久久久国产一区二区| 久久天堂av色综合| 国产视频激情视频在线观看|