亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于慣性動力系統(tǒng)的加速梯度算法

        2021-12-20 11:05:56
        關(guān)鍵詞:辛格慣性梯度

        李 春 凱

        (北京郵電大學(xué) 理學(xué)院, 北京 100876)

        近年來,優(yōu)化算法廣泛應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域,對于求解大規(guī)模的問題,Hessian矩陣的計(jì)算和存儲成本大,因此一階梯度算法再一次回歸主流.對連續(xù)時(shí)間下的常微分方程(Ordinary differential equation,ODE)與離散迭代算法建立聯(lián)系,獲取加速梯度算法引起越來越多的關(guān)注.

        本文針對二階的ODE 采用不同的離散格式,得到了加速梯度算法.

        1 研究方法

        本文考慮無約束最優(yōu)化問題:

        (1)

        其中:f是光滑的凸函數(shù).最基礎(chǔ)的一階梯度算法是梯度下降法(Gradient decent method,GD):

        xk+1=xk-sf(xk),

        (2)

        其中:x0是初始點(diǎn),s是步長.在一階優(yōu)化算法的框架下,是否存在改進(jìn)GD收斂速率的算法是一個(gè)微妙而重要的問題.

        1.1 動量方法

        動量方法是指迭代過程中在僅使用一階梯度信息的基礎(chǔ)上加入前一步的迭代信息的一種方法.現(xiàn)代對于這種擴(kuò)展的一階算法的研究可以追溯到Polyak[1-2],他在GD 的基礎(chǔ)上加入動量項(xiàng)(xk-xk-1),得到重球方法(Heavy-Ball):

        yk+1=xk-sf(xk),xk+1=yk+1-α(xk-xk-1)(3)

        其中:α>0是動量系數(shù).重球方法在最小值附近比GD能獲得更快的局部收斂速率,但它通常并不能保證全局加速.而且Lessard[3]證明了即使對于強(qiáng)凸函數(shù),由于步長的選擇,重球方法并不能保證收斂性.

        另外一種重要的動量方法是Nesterov[4-5]提出的Nesterov加速梯度算法(Nesterov’s accelerated gradient algorithm,NAG),當(dāng)目標(biāo)函數(shù)f為強(qiáng)凸函數(shù)時(shí),迭代形式為:

        (4)

        (5)

        1.2 連續(xù)時(shí)間ODE

        近年來,通過連續(xù)時(shí)間的ODE來分析加速梯度算法越來越受到人們的關(guān)注.特別是Su等人[6]表明,假設(shè)目標(biāo)函數(shù)f為凸函數(shù),當(dāng)s→0時(shí),NAG可收斂到一個(gè)關(guān)于時(shí)間t的連續(xù)時(shí)間ODE:

        (6)

        Su等人通過構(gòu)造合適的連續(xù)時(shí)間下的Lyapunov函數(shù),證明了在連續(xù)時(shí)間下迭代點(diǎn)的加速收斂速率,進(jìn)而佐證NAG具有加速收斂速率.

        文獻(xiàn)[7-8]中Lagrangian和Hamiltonian框架被用來生成一大類連續(xù)時(shí)間的ODE,以便統(tǒng)一處理基于加速梯度的方法.但Wilson等人指出[8],當(dāng)f為強(qiáng)凸函數(shù)時(shí),NAG對應(yīng)的ODE為:

        (7)

        重球方法對應(yīng)的ODE與式(7)相同,然而重球方法和NAG的迭代形式并不一樣,NAG的收斂速率更快且收斂性更好,因此并不能通過分析式(7)體現(xiàn)出NAG的優(yōu)勢.因此Shi等人[9]在計(jì)算ODE過程中提高精度,得到重球方法和NAG的高精度的ODE.值得注意的是,當(dāng)f為強(qiáng)凸函數(shù)時(shí),重球方法和NAG的高精度ODE是不同的,分別為:

        (8)

        (9)

        1.3 離散化ODE

        2 慣性動力系統(tǒng)

        ‖f(y)-f(x)‖≤L‖y-x‖

        當(dāng)目標(biāo)函數(shù)f為強(qiáng)凸函數(shù)時(shí),重球方法對應(yīng)的高精度ODE(8)和NAG對應(yīng)的高精度ODE(9)都可以看作是Attouch文中[14]中特殊形式的Hessian-driven慣性動力系統(tǒng):

        (10)

        對該連續(xù)時(shí)間系統(tǒng)離散化,可以得到一系列的優(yōu)化算法.系統(tǒng)中包含的Hessian項(xiàng)可以看作是f(X(t))對t的導(dǎo)數(shù),正好對應(yīng)到NAG中函數(shù)梯度差.

        在優(yōu)化問題中,Polyak[12]首先利用慣性動力學(xué)使梯度法獲得加速收斂速率,即帶有摩擦系數(shù)的連續(xù)時(shí)間下的重球方法(HBF):

        (11)

        其中:阻尼系數(shù)γ>0,由于很難取到合適的γ,且在一些優(yōu)化問題中,收斂性并不好.Alvare[15]受連續(xù)時(shí)間牛頓方法啟發(fā),引入Hessian項(xiàng),得到類牛頓的慣性動力系統(tǒng)(Dynamic inertial system,(DIN)γ,β):

        (12)

        (13)

        本文的目的是通過不同的離散格式對式(13)離散化,得到優(yōu)化算法,并證明定理1中的指數(shù)收斂速率可轉(zhuǎn)換為離散迭代格式下的線性收斂速率.

        3 新的優(yōu)化算法

        采用三種離散格式:辛格式,顯示Euler,隱式Euler對上述微分方程離散化,得到三種優(yōu)化算法.

        3.1 辛格式優(yōu)化算法

        第一種離散格式是辛格式,近似規(guī)則如下:

        由辛格式離散ODE(13)可得優(yōu)化算法:

        證明設(shè)Lyapunov函數(shù)為:

        已知

        f(xk+1)-f(xk)≤〈f(xk+1),xk+1-xk〉-

        2x*)+vk+1+vk+β(f(xk+1)+f(xk))〉-

        2x*)+vk+1+vk+β(f(xk+1)+f(xk))〉-

        2x*)+vk+1+vk+β(f(xk+1)+f(xk))〉-

        已知以下兩個(gè)等式

        顯然成立,所以

        因?yàn)槟繕?biāo)函數(shù)為強(qiáng)凸函數(shù),所以滿足

        因此可得:

        由假設(shè)可知

        根據(jù)強(qiáng)凸性質(zhì)

        所以

        由Cauchy-Schwarz不等式,可知

        βf(xk)‖2≤

        成立.所以

        3.2 顯式Euler優(yōu)化算法

        第二種離散格式是顯式Euler格式,近似規(guī)則如下:

        由顯式Euler格式離散ODE(13)可得優(yōu)化算法:

        證明設(shè)Lyapunov函數(shù)為:

        βf(xk)‖2+f(xk)-f(x*)

        <1),且各件產(chǎn)品是否為不合格品相互獨(dú)立.

        vk+1+vk+β(f(xk+1)+f(xk))〉≤

        根據(jù)Cauchy-Schwarz不等式以及f為強(qiáng)凸函數(shù),以下兩個(gè)不等式

        成立,因此

        利用Cauchy-Schwarz不等式得:

        x*‖2+‖vk‖2+β2‖f(xk)‖2)

        又因?yàn)閒為強(qiáng)凸函數(shù),所以有:

        因此

        3.3 隱式Euler優(yōu)化算法

        另一種格式是隱式Euler格式,近似規(guī)則如下:

        2f(xk+1)vk+1≈f(xk+1)-f(xk)

        由隱式Euler格式離散ODE(13)可得優(yōu)化算法:

        證明設(shè)Lyapunov函數(shù)為:

        βf(xk)‖2+f(xk)-f(x*)

        vk+1+vk+β(f(xk+1+f(xk))〉≤

        根據(jù)Cauchy-Schwarz不等式

        3μ‖xk+1-x*‖2+f(xk+1)-f(x*)

        4 結(jié) 語

        本文主要是通過離散連續(xù)時(shí)間下的慣性動力系統(tǒng)得到加速梯度算法.具體是通過三種不同的離散格式:辛格式、顯式Euler和隱式Euler對該動力系統(tǒng)進(jìn)行離散后得到三種優(yōu)化算法,并證明了當(dāng)目標(biāo)函數(shù)是強(qiáng)凸函數(shù)時(shí),由辛格式以及隱式Euler離散慣性動力系統(tǒng)(13)得到的的優(yōu)化算法能夠?qū)崿F(xiàn)與文獻(xiàn)[13]中相同的加速收斂速率.

        猜你喜歡
        辛格慣性梯度
        你真的了解慣性嗎
        沖破『慣性』 看慣性
        我的自由
        一個(gè)改進(jìn)的WYL型三項(xiàng)共軛梯度法
        一種自適應(yīng)Dai-Liao共軛梯度法
        一類扭積形式的梯度近Ricci孤立子
        無處不在的慣性
        普遍存在的慣性
        看電影
        手機(jī)不通
        精品久久久久久国产| 揄拍成人国产精品视频| 欧美一区二区三区视频在线观看| 国产精品区一区第一页| 国产精品久久久久免费a∨不卡| 男生自撸视频在线观看| 妺妺窝人体色777777| 精品久久久久久久久久中文字幕 | 国精品无码一区二区三区在线| 久久久久久中文字幕有精品| 日本办公室三级在线看| 亚洲av综合色区无码另类小说| 风间由美性色一区二区三区| 无码一区二区三区在线在看| 在线久草视频免费播放| 久久精品国产亚洲av无码偷窥| 色婷婷综合中文久久一本| 日韩精品视频在线观看免费| 亚洲1区第2区第3区在线播放| 精品一区二区三区免费视频| 国产亚洲精品aaaa片app| 亚洲女同精品久久女同| 自拍偷自拍亚洲一区二区| 国产农村妇女毛片精品久久| 午夜a福利| 日韩在线视频专区九区| 天堂а在线中文在线新版| japanesehd中国产在线看| 三级黄色片一区二区三区| 国产一区二区三区中文在线| 亚洲18色成人网站www| 中文字幕乱码人妻无码久久久1| 亚洲女厕偷拍一区二区| 亚洲春色在线视频| 人妻AV无码一区二区三区奥田咲 | 久久一区二区三区不卡| 亚洲精品国产av日韩专区| 日本最大色倩网站www| 精品99在线黑丝袜| 精品久久一品二品三品| 免费人成视频x8x8入口|