亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Polyak步長(zhǎng)的隨機(jī)遞歸梯度算法

        2024-04-13 00:32:08王福勝李曉桐
        應(yīng)用數(shù)學(xué) 2024年1期
        關(guān)鍵詞:步長(zhǎng)方差殘差

        王福勝,李曉桐

        (太原師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,山西 晉中 030619)

        1.引言

        在機(jī)器學(xué)習(xí)中,經(jīng)常會(huì)出現(xiàn)以下的優(yōu)化問(wèn)題:

        其中n是訓(xùn)練集大小,每個(gè)fi,i ∈{1,2,···,n}是凸函數(shù)且有Lipschitz連續(xù)導(dǎo)數(shù).解決上述優(yōu)化問(wèn)題的標(biāo)準(zhǔn)有效的方法為梯度下降法(GD)[1].對(duì)于光滑優(yōu)化問(wèn)題(1.1),梯度下降的迭代方法為

        其中ηt>0表示步長(zhǎng).當(dāng)n較大時(shí)需要計(jì)算全梯度,導(dǎo)致計(jì)算量很大.Robbins和Monro[2]在1951年提出了隨機(jī)近似(stochastic approximation,SA).之后,研究者提出了隨機(jī)梯度下降(stochastic gradient descent,SGD)[3-4],該方法的迭代公式如下:

        其中下標(biāo)it是從{1,2,···,n}中隨機(jī)選取得到.

        在機(jī)器學(xué)習(xí)中有一系列改進(jìn)SGD的工作[3-4].SGD算法的收斂性質(zhì)取決于隨機(jī)方向和真實(shí)梯度的方差,因此,如何縮減方差是改進(jìn)SGD的方法之一.常見(jiàn)的有隨機(jī)方差縮減梯度算法(SVRG)[5],隨機(jī)遞歸梯度算法(SARAH)[6],隨機(jī)平均梯度算法(SAG)[7]等.

        對(duì)于方差縮減類(lèi)算法而言,步長(zhǎng)也是關(guān)鍵因素.傳統(tǒng)的步長(zhǎng)要選擇遞減步長(zhǎng)或者較小的固定步長(zhǎng),并且滿(mǎn)足

        關(guān)于步長(zhǎng)的工作也有很多,AdaGrad[8]和Adam[9]等采用對(duì)角修正技術(shù)為每個(gè)分量自適應(yīng)地選取步長(zhǎng).當(dāng)前,由于BB步長(zhǎng)[10]特有的性質(zhì),許多學(xué)者將方差縮減方法與BB步長(zhǎng)相結(jié)合,如SARAH-I-BB[11]算法.本文考慮將Polyak[12]步長(zhǎng)與隨機(jī)遞歸梯度下降算法[6]結(jié)合,提出SARAH-Polyak.

        2.算法

        其中,it ∈{1,2,···,n}.可以看出,SARAH算法的迭代方向vt是真實(shí)梯度的有偏估計(jì),即

        接下來(lái),我們介紹一下Polyak[12]步長(zhǎng),它普遍用于投影次梯度法.假設(shè)我們要求解以下的無(wú)約束優(yōu)化問(wèn)題:

        其中f:Rd →R是凸但可能非光滑的函數(shù).假設(shè)f在xk處的次梯度f(wàn)′(xk)∈?f(xk)是可計(jì)算的.投影次梯度法有如下形式:

        再根據(jù)文[13]中引理8.11有

        其中x?是問(wèn)題(2,1)的最優(yōu)解,f(x?)是(2.1)的最優(yōu)值.tk的一種選擇是取不等式(2.2)右端的最小值,因此有

        當(dāng)f′(xk)=0時(shí),上述式子未定義,我們可以人為的定義tk=1(也可以取任意正數(shù)),最后得到Polyak步長(zhǎng)

        從上述表達(dá)式可知,Polyak步長(zhǎng)依賴(lài)于f(x?)的值.在一些應(yīng)用中,f(x?)的值是已知的.并且現(xiàn)有的算法中Polyak步長(zhǎng)使用的是隨機(jī)的次梯度,而本文使用的是全梯度.即

        文[14]構(gòu)建了一個(gè)簡(jiǎn)單函數(shù)h,通過(guò)下式計(jì)算步長(zhǎng)

        函數(shù)h有不同的形式:

        因?yàn)樵谠缙诘?可以選取較大步長(zhǎng)加速收斂,然后逐漸選擇較小步長(zhǎng)防止振蕩.因此,當(dāng)選取h=g(k)時(shí),可以令g(k)是關(guān)于外循環(huán)數(shù)k的單調(diào)遞增函數(shù).文[14] 中的算法(SARAH-AS)選取函數(shù)的具體形式如下:

        為了加快收斂,本文中的步長(zhǎng)也采用上述方式,具體形式為

        其中tk為(2.4)中的步長(zhǎng),h=

        下面我們將上述Polyak步長(zhǎng)與隨機(jī)遞歸梯度下降算法相結(jié)合構(gòu)造成新的算法,算法框架見(jiàn)算法2.

        3.收斂性分析

        假設(shè)3.1假設(shè)每個(gè)函數(shù)fi(x)都是凸函數(shù),且目標(biāo)函數(shù)F(x)是μ-強(qiáng)凸的,即

        這里我們定義x?為問(wèn)題(1.1)的最優(yōu)解.并且由于F(x)是強(qiáng)凸的,因此x?是唯一的.

        假設(shè)3.2假設(shè)每個(gè)函數(shù)fi(x)的梯度是L-Lipschitz連續(xù)的,即

        即?F(x)也是L-Lipschitz連續(xù)的.

        引理3.1[15]假設(shè)F(x)是凸函數(shù),且?F(x)是L-Lipschitz連續(xù)的,則對(duì)?x,y ∈Rd,有

        引理3.2[15]假設(shè)F(x)是凸函數(shù),且?F(x)是L-Lipschitz連續(xù)的,則對(duì)?x,y ∈Rd,有

        上面最后一個(gè)不等式中我們利用了引理3.6以及F(x)的強(qiáng)凸性.并且有

        即算法2具有R-線性收斂速度.

        證根據(jù)目標(biāo)函數(shù)F(x)的強(qiáng)凸性以及?F(x?)=0,可知

        上式蘊(yùn)含算法2具有R-線性收斂速度.

        近年來(lái),強(qiáng)凸性假設(shè)一直是證明算法收斂的標(biāo)準(zhǔn)假設(shè),但這一假設(shè)并不適用于文獻(xiàn)中的許多問(wèn)題.為了在一般凸條件下證明算法的收斂性,我們先給出一些條件.我們將X?表示為問(wèn)題(1.1)的最優(yōu)解集,將xproj表示為x在X?上的投影.因此,?F(xproj)=0.我們使用x?表示(1.1)的最優(yōu)值.首先假設(shè)F是一階連續(xù)可微的,并且F是L-Lipschitz連續(xù)的,ν>0.我們給出以下四個(gè)條件:

        接下來(lái),我們分析了RSI條件下SARAH的性質(zhì).

        引理3.7[11]若假設(shè)F是凸的并且滿(mǎn)足(3.1)并且?F(x)是L-Lipschitz連續(xù)的,那么對(duì)于任何α ∈[0,1],有

        4.數(shù)值實(shí)驗(yàn)

        在本節(jié)中,通過(guò)數(shù)值實(shí)驗(yàn)結(jié)果驗(yàn)證算法SARAH-Polyak的有效性.我們針對(duì)機(jī)器學(xué)習(xí)中二分類(lèi)的?2正則化邏輯回歸問(wèn)題: 給定一組訓(xùn)練集(a1,b1),(a2,b2),···,(an,bn),其中ai ∈Rd,bi ∈{+1,-1},通過(guò)求解下列問(wèn)題得到最優(yōu)預(yù)測(cè)值x ∈Rd,

        其中λ>0是正則化參數(shù).我們使用了三個(gè)公開(kāi)的數(shù)據(jù)集,數(shù)據(jù)集的大小為n,維度為d,詳細(xì)信息如表4.1所示,所有數(shù)據(jù)可以在LIBSVM網(wǎng)站(www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/)下載.表中還列出了實(shí)驗(yàn)中所選取的λ>0值(在所有數(shù)據(jù)集上設(shè)置參數(shù)為λ=10-4,m=2n.所有的數(shù)值實(shí)驗(yàn)均在相同的Python計(jì)算環(huán)境下進(jìn)行.所有的實(shí)驗(yàn)結(jié)果如圖4.1-4.6所示.

        圖4.1 heart上的殘差損失

        表4.1 數(shù)值實(shí)驗(yàn)中使用的數(shù)據(jù)集和正則化參數(shù)

        圖4.1到圖4.6展示了SARAH-BB,SARAH 以及SARAH-Polyak三個(gè)算法在數(shù)據(jù)集heart,splice和ijcnn1上的殘差損失及步長(zhǎng)變化趨勢(shì).在所有的圖中,藍(lán)色,紅色和綠色實(shí)線代表不同步長(zhǎng)的SARAH-Polyak 算法;黑色實(shí)線代表最優(yōu)步長(zhǎng)的SARAH-BB算法;藍(lán)色,紅色和綠色虛線對(duì)應(yīng)著固定步長(zhǎng)的SARAH算法.在所有的圖中,x軸代表外循環(huán)數(shù),圖4.1,4.3和圖4.5中y軸表示最優(yōu)間隔,即F(xk)-F(x?),圖4.2,4.4和4.6中y軸表示步長(zhǎng)變化趨勢(shì).

        圖4.2 heart上的步長(zhǎng)變化趨勢(shì)

        圖4.3 splice上的殘差損失

        圖4.4 splice上的步長(zhǎng)變化趨勢(shì)

        圖4.5 ijcnn1上的殘差損失

        圖4.6 ijcnn1上的步長(zhǎng)變化趨勢(shì)

        從圖4.1,4.3和4.5中可以看出:SARAH-Polyak算法收斂速度整體上比采用固定步長(zhǎng)的SARAH 算法快,并且當(dāng)選擇不同的初始步長(zhǎng)η0時(shí),SARAH-Polyak算法的收斂性能不受影響.并且SARAH-Polyak與最優(yōu)步長(zhǎng)的SARAH-BB算法相差不大.圖4.2,4.4和4.6中可以看出: 當(dāng)選取不同的初始步長(zhǎng)時(shí),SARAH-Polyak算法的步長(zhǎng)最終收斂于最優(yōu)步長(zhǎng)的鄰域.

        5.結(jié)論

        在本文中,我們提出了一種改進(jìn)的算法SARAH-Polyak.首先我們用理論說(shuō)明Polyak步長(zhǎng)并沒(méi)有增加算法的復(fù)雜度,因?yàn)樵撍惴ㄒ呀?jīng)計(jì)算出全梯度,并且可以通過(guò)其他算法得到最優(yōu)值.然后分別在強(qiáng)凸和一般凸的假設(shè)下證明了它的收斂性.最后從實(shí)驗(yàn)結(jié)果分析來(lái)看,相比于使用固定步長(zhǎng)的SARAH算法,新算法的收斂速度更快,并且可以和最優(yōu)步長(zhǎng)的SARAH-BB相媲美,不受初始步長(zhǎng)選取的影響.新算法對(duì)初始步長(zhǎng)的選擇是有效的.

        猜你喜歡
        步長(zhǎng)方差殘差
        方差怎么算
        基于雙向GRU與殘差擬合的車(chē)輛跟馳建模
        基于Armijo搜索步長(zhǎng)的BFGS與DFP擬牛頓法的比較研究
        概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
        基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
        基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
        計(jì)算方差用哪個(gè)公式
        方差生活秀
        平穩(wěn)自相關(guān)過(guò)程的殘差累積和控制圖
        河南科技(2015年8期)2015-03-11 16:23:52
        基于逐維改進(jìn)的自適應(yīng)步長(zhǎng)布谷鳥(niǎo)搜索算法
        一本色道久久88—综合亚洲精品 | 精品国免费一区二区三区| 综合久久加勒比天然素人| 91在线视频在线视频| 朝鲜女人大白屁股ass| 最新亚洲人成网站在线| 日本一区二区三区在线观看免费| 亚洲av男人的天堂一区| 中文字幕无码毛片免费看| 亚洲综合一区二区三区四区五区 | 国产熟妇搡bbbb搡bb七区| 亚洲中字幕永久在线观看| 精品福利一区二区三区| 成年性生交大片免费看| 免费无码av片在线观看| 欧美h久免费女| 日本久久精品视频免费| 国产精品理论片| 欧美一级三级在线观看| 久久久国产精品五月天伊人| 亚洲色图在线免费观看视频| 久久久久久亚洲精品中文字幕| 欧美日韩区1区2区3区| 偷拍熟女露出喷水在线91| 天天做天天爱夜夜爽女人爽| 少妇寂寞难耐被黑人中出| 无码中文字幕专区一二三| 午夜亚洲精品视频在线| 亚洲欧美日韩成人高清在线一区| 国产成人久久精品二区三区牛| 久久精品人妻嫩草av蜜桃| 99国产精品久久99久久久| 摸进她的内裤里疯狂揉她动视频| 亚洲欧洲AV综合色无码| 在线免费观看蜜桃视频| 丁字裤少妇露黑毛| 无码精品一区二区三区超碰| 丝袜美腿亚洲综合一区| 免费女人高潮流视频在线观看 | av中文字幕少妇人妻| 精品国产车一区二区三区|