亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ArcReLU激活函數(shù)的優(yōu)化研究

        2021-11-05 02:48:04徐菲菲許赟杰
        關(guān)鍵詞:定義實(shí)驗(yàn)

        徐菲菲, 許赟杰

        (上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 200090)

        隨著人工神經(jīng)網(wǎng)絡(luò)[1]的研究和發(fā)展,具有多層隱含層的深度學(xué)習(xí)逐漸成為人工智能領(lǐng)域中較為熱門的研究方向,而伴隨著神經(jīng)網(wǎng)絡(luò)的逐步發(fā)展,激活函數(shù)依舊是其結(jié)構(gòu)中不可或缺的部分。若在神經(jīng)元中不使用非線性的函數(shù)作為激活函數(shù),那么無論神經(jīng)網(wǎng)絡(luò)具有多少隱含層,最終都只會(huì)得到輸入數(shù)據(jù)的線性組合。這樣的結(jié)果將會(huì)偏離現(xiàn)實(shí)情況,無法做到真正的擬合。因此,為了使神經(jīng)網(wǎng)絡(luò)可以應(yīng)用于各種現(xiàn)實(shí)問題,需要引入非線性的因素。這是激活函數(shù)所具備的重要作用。本文將對各類不同系的激活函數(shù)進(jìn)行研究和比對,綜合其優(yōu)點(diǎn)和不足之處,并加以改進(jìn),以達(dá)到提高收斂速度和計(jì)算精度的目標(biāo)。

        目前常用的激活函數(shù)大致分為Sigmoid系函數(shù)和線性整流函數(shù)(Rectified Linear Unit,ReLU)系函數(shù)兩類。Sigmoid系中最具代表性的分別是Sigmoid[2]函數(shù)和Tanh[3]函數(shù)。這兩個(gè)函數(shù)都具備可導(dǎo)性,但若輸入值趨近于定義域邊界時(shí),其導(dǎo)數(shù)都將會(huì)趨于平緩,從而導(dǎo)致向下傳播的梯度因子趨近零,最終會(huì)使神經(jīng)網(wǎng)絡(luò)參數(shù)難以得到有效的訓(xùn)練。上述情況就是Sigmoid系函數(shù)的軟飽和性[4]所導(dǎo)致的梯度消失[5]現(xiàn)象。

        為緩解梯度消失現(xiàn)象,研究者在Sigmoid系函數(shù)后提出了ReLU函數(shù)[6]。ReLU函數(shù)具有分段函數(shù)的結(jié)構(gòu)特征,當(dāng)輸入值落入正半軸時(shí),其導(dǎo)數(shù)部分恒為1,可以保持梯度在向下傳播時(shí)不衰減,因此能夠有效地緩解梯度消失現(xiàn)象。但是由于其負(fù)軸部分恒為零,因此負(fù)軸的導(dǎo)數(shù)部分將難以傳遞梯度變化,會(huì)產(chǎn)生神經(jīng)元死亡現(xiàn)象。

        指數(shù)化線性單元(Exponential Linear Unit,ELU)函數(shù)[3]作為ReLU函數(shù)的一種變體,可以較好地緩解神經(jīng)元死亡現(xiàn)象。其負(fù)軸部分具備一定的軟飽和性,整體而言更是解決了ReLU函數(shù)的均值偏移問題,是一個(gè)相對理想的激活函數(shù)。但由于其需要針對不同的模型修改參數(shù),因此在實(shí)際應(yīng)用中需要花費(fèi)大量的成本進(jìn)行訓(xùn)練和參數(shù)設(shè)置。

        針對上述常見問題,本文對ArcReLU函數(shù)[7]進(jìn)行了改進(jìn)。實(shí)驗(yàn)結(jié)果表明:改進(jìn)的ArcReLU函數(shù)具有更快的收斂速度,能夠有效降低模型的訓(xùn)練誤差,同時(shí)還能緩解梯度消失現(xiàn)象的發(fā)生;在解決ReLU函數(shù)神經(jīng)元死亡問題的同時(shí),由于其負(fù)軸部分的導(dǎo)數(shù)趨于零的速度更慢,相較于Sigmoid系函數(shù)更為緩和,學(xué)習(xí)效率也會(huì)得到進(jìn)一步的提高;在為其添加了數(shù)超參數(shù)的改進(jìn)后,使其增加了對數(shù)據(jù)集噪聲的魯棒性,緩解了均值偏移的問題。

        1 線性整流函數(shù)和指數(shù)化線性單元函數(shù)

        1.1 線性整流函數(shù)

        ReLU函數(shù)可以有效地解決Sigmoid系函數(shù)引起的梯度消失現(xiàn)象。其定義為

        f(x)=max(0,x)

        (1)

        其圖像如圖1所示。從圖1不難看出,該函數(shù)負(fù)軸部分會(huì)出現(xiàn)神經(jīng)元死亡的現(xiàn)象。

        圖1 ReLU 函數(shù)

        從圖1和式(1)可以看出:在正半軸其導(dǎo)數(shù)值恒為1,因此當(dāng)輸入值位于正軸時(shí),能夠保持向下的梯度不衰減,從而緩解梯度消失的問題;當(dāng)輸入值落入負(fù)半軸時(shí),該函數(shù)具有硬飽和性[2]。若輸入值位于負(fù)軸部分,神經(jīng)元的梯度將難以保持傳遞,其權(quán)重值也將無法更新,進(jìn)而導(dǎo)致計(jì)算結(jié)果無法收斂。整體而言,ReLU函數(shù)雖為分段函數(shù),但其輸出均值恒大于等于零,即存在均值偏移問題[8]。這將會(huì)使神經(jīng)網(wǎng)絡(luò)具備稀疏特性。

        1.2 指數(shù)化線性單元函數(shù)

        ELU函數(shù)是對ReLU函數(shù)的一個(gè)改進(jìn),其定義為

        (2)

        其圖像如圖2所示。

        圖2 ELU函數(shù)

        從式(2)和圖2可以看出,ELU函數(shù)在正半軸可以有效地緩解梯度消失現(xiàn)象,而負(fù)半軸部分能夠讓ELU函數(shù)對輸入值的變化具有更好的魯棒性。整體而言,ELU函數(shù)的輸出均值趨近于零,因此具有更快的收斂速度。

        2 ArcReLU函數(shù)的優(yōu)化

        2.1 ArcReLU函數(shù)

        (3)

        其函數(shù)圖像如圖3所示。

        圖3 ArcReLU 函數(shù)

        依據(jù)圖3提出初步假設(shè),該函數(shù)在其定義域范圍內(nèi)連續(xù)且單調(diào)遞增。為證明上述理論,需要先驗(yàn)證該函數(shù)在原點(diǎn)處的可導(dǎo)性。將正軸部分定義為f1(x),負(fù)軸部分定義為f2(x),證明如下。

        f(x)=f(x-)=f(x+)=0,x=0

        (4)

        (5)

        (6)

        依據(jù)式(4)可得ArcReLU函數(shù)在原點(diǎn)處有定義且連續(xù)。因?yàn)槭?5)與式(6)存在結(jié)果且相等,依據(jù)導(dǎo)數(shù)定義,該函數(shù)在原點(diǎn)處連續(xù)且可導(dǎo),因此該函數(shù)可用于反向傳播幫助算法沿負(fù)梯度方向調(diào)整參數(shù),并可得出ArcReLU的導(dǎo)數(shù)為

        (7)

        從式(7)可得,ArcReLU函數(shù)的導(dǎo)函數(shù)值恒大于零。依據(jù)導(dǎo)數(shù)定義,可證明其為單調(diào)遞增函數(shù)。當(dāng)激活函數(shù)具備單調(diào)性時(shí),單層網(wǎng)絡(luò)能夠保證為凸函數(shù)[9],從而可推斷出該函數(shù)在訓(xùn)練過程中將具有更好的收斂性。

        2.2 RArcReLU函數(shù)

        為提高ArcReLU函數(shù)的收斂速度,并使其具備更好的魯棒性,本文對其作進(jìn)一步的改進(jìn)。將改進(jìn)的ArcReLU函數(shù)稱為RArc-ReLU函數(shù),其定義為

        (8)

        其中,λ為一個(gè)從均勻分布的G(i,j)中隨機(jī)抽取的數(shù)值,λ∈G(i,j),i

        式(8)中,為ArcReLU的負(fù)軸部分添加了一個(gè)非線性因子1/λ。從式(8)不難看出,當(dāng)λ取值為1時(shí),新的函數(shù)將會(huì)退化為ArcReLU函數(shù);當(dāng)λ取值為零時(shí),新的函數(shù)將會(huì)退化為ReLU函數(shù)。

        因此,為避免上述退化情況的出現(xiàn),λ的取值范圍將定義為[0,1),實(shí)際訓(xùn)練過程中會(huì)采用所有λ的均值構(gòu)建非線性因子,使函數(shù)整體具有更好的自歸一化作用和更好的擬合能力。另外,優(yōu)化函數(shù)后,將使函數(shù)的負(fù)半軸更為緩和,能夠更有效地緩解梯度消失的問題。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        本文在BP神經(jīng)網(wǎng)絡(luò)中使用UCI上的公開數(shù)據(jù)集,分別對ELU函數(shù)、ArcReLU函數(shù)和RArc-ReLU函數(shù)進(jìn)行4次對比實(shí)驗(yàn)。實(shí)驗(yàn)在Windows 10操作系統(tǒng)下,通過Python3.7.2編寫程序進(jìn)行。4組數(shù)據(jù)集分別為:關(guān)于皮馬印第安人糖尿病情況的數(shù)據(jù)統(tǒng)計(jì),數(shù)據(jù)集共768個(gè)對象;汽車評(píng)估數(shù)據(jù)集,共1 728個(gè)對象;美國人口普查收入情況統(tǒng)計(jì),數(shù)據(jù)集共9 502個(gè)對象;阿維拉數(shù)據(jù)集,共12 647個(gè)對象。4組數(shù)據(jù)集中所包含的屬性分別如表1~表4所示。實(shí)驗(yàn)中,將各表中最后一個(gè)屬性作為決策屬性,取值均做量化處理。

        表1 關(guān)于皮馬印第安人糖尿病情況的數(shù)據(jù)統(tǒng)計(jì)

        表2 汽車評(píng)估數(shù)據(jù)集

        表3 美國人口普查收入情況統(tǒng)計(jì)

        表4 阿維拉數(shù)據(jù)集

        本次實(shí)驗(yàn)將在2層BP神經(jīng)網(wǎng)絡(luò)[8]中,使用10次十折交叉驗(yàn)證法進(jìn)行測試。通過在4組不同的數(shù)據(jù)集上對3種激活函數(shù)進(jìn)行對比實(shí)驗(yàn),能夠直觀地得出各激活函數(shù)的優(yōu)點(diǎn)與不足。實(shí)驗(yàn)中,學(xué)習(xí)率η經(jīng)過多次實(shí)驗(yàn)取值為0.001,迭代次數(shù)設(shè)置為5 000次,λ取值范圍為[0,1)。

        鑒于數(shù)據(jù)集中各屬性具有不同的量綱方式,會(huì)影響對最終數(shù)據(jù)結(jié)果的分析,因此為減少指標(biāo)間的量綱影響,本文在實(shí)驗(yàn)前采用Z-score標(biāo)準(zhǔn)化的方式對數(shù)據(jù)集進(jìn)行了預(yù)處理,以確保在不消除指標(biāo)特征性的同時(shí)使其維持在相同的范圍內(nèi)。

        3.2 各數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對比

        4組數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果對比如表5~表8所示。

        表5 皮馬印第安人糖尿病數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對比

        表6 汽車評(píng)估數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對比

        表7 美國人口普查收入實(shí)驗(yàn)結(jié)果對比

        表8 阿維拉數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對比

        由上述4組實(shí)驗(yàn)結(jié)果可知,RArc-ReLU的計(jì)算時(shí)間均少于ArcReLU和ELU兩個(gè)函數(shù),其收斂速度和分類精度在實(shí)驗(yàn)中均高于另外兩種激活函數(shù)。

        4 結(jié) 語

        本文通過分析和研究常用的經(jīng)典激活函數(shù),對新構(gòu)造的ArcReLU函數(shù)進(jìn)行了進(jìn)一步的改進(jìn),提出了RArc-ReLU函數(shù),從而在保持原有優(yōu)點(diǎn)的情況下,提高了其收斂速度和分類精度。通過4組不同的數(shù)據(jù)集,對ELU函數(shù)、ArcReLU函數(shù)和RArc-ReLU函數(shù)進(jìn)行了對比實(shí)驗(yàn)。結(jié)果表明,RArc-ReLU函數(shù)初始的累積誤差小,因此達(dá)到收斂值所需的時(shí)間會(huì)較少。伴隨神經(jīng)網(wǎng)絡(luò)不斷的迭代,RArc-ReLU函數(shù)將更快趨于平穩(wěn),說明其相較于另外兩種函數(shù)具有更好的收斂性。在分類精度上,該函數(shù)能夠有效地降低訓(xùn)練誤差,同時(shí)能夠有效緩解梯度消失和神經(jīng)元死亡的問題。實(shí)驗(yàn)中RArc-ReLU的AUC值相較于另外兩種激活函數(shù)都大,由此可見,RArc-ReLU具有更佳的泛化性能。

        此外,由于在RArc-ReLU函數(shù)中添加了非線性因子,使其能夠幫助模型更好地?cái)M合不同的數(shù)據(jù)集。RArc-ReLU在計(jì)算速度上也有所提高,相較于改進(jìn)前的ArcReLU函數(shù)在計(jì)算消耗上更快且更為平穩(wěn)。下一步的研究工作將針對RArc-ReLU是否能夠提高深度學(xué)習(xí)模型的計(jì)算速度和精準(zhǔn)度進(jìn)行探索。另外,還將嘗試使用更多種類的數(shù)據(jù)集對RArc-ReLU函數(shù)的魯棒性進(jìn)行研究。

        猜你喜歡
        定義實(shí)驗(yàn)
        記一次有趣的實(shí)驗(yàn)
        微型實(shí)驗(yàn)里看“燃燒”
        永遠(yuǎn)不要用“起點(diǎn)”定義自己
        海峽姐妹(2020年9期)2021-01-04 01:35:44
        定義“風(fēng)格”
        做個(gè)怪怪長實(shí)驗(yàn)
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        成功的定義
        山東青年(2016年1期)2016-02-28 14:25:25
        修辭學(xué)的重大定義
        山的定義
        日韩少妇内射免费播放| 最新国产激情视频在线观看| 国产精品久久久天天影视| 国语对白嫖老妇胖老太| 亚洲色图在线观看视频| 亚洲av网一区天堂福利| 亚洲国产精品成人av在线不卡 | 波多野结衣久久精品99e| 大胆欧美熟妇xxbbwwbw高潮了 | 风韵饥渴少妇在线观看| 亚洲自拍愉拍| 色噜噜色哟哟一区二区三区| 中文有码无码人妻在线| 3d动漫精品一区二区三区| 成人国产永久福利看片| 国产一区二区白浆在线观看| 午夜爽爽爽男女免费观看影院| 亚洲欧美日韩中文在线制服| 中文字幕精品一二三区| 亚洲中文字幕精品久久久| 国产国语亲子伦亲子| 亚洲av无码av吞精久久| 亚洲夫妻性生活视频网站| 中文字幕乱码日本亚洲一区二区 | 国产chinese在线视频| 男女啪啪啪的高清视频| 久久人人爽爽爽人久久久| 日本精品一区二区三区在线视频| 夫妻一起自拍内射小视频 | 欧美成人精品a∨在线观看| 国产第19页精品| 国产粉嫩美女一区二区三| 男人的天堂手机版av| 国产婷婷色综合av蜜臀av| 亚洲制服无码一区二区三区| 国产亚洲一区二区毛片| 亚洲av日韩av永久无码下载| av大片在线无码免费| 久久久国产视频久久久| 人妻夜夜爽天天爽三区丁香花| 日本不卡在线视频二区三区|