亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向深度增強學習的網(wǎng)絡數(shù)據(jù)流優(yōu)化研究

        2020-01-03 03:47:52何學成
        信陽農林學院學報 2019年4期
        關鍵詞:深度

        何學成

        (宣城職業(yè)技術學院 信息與財經(jīng)學院,安徽 宣城 242000)

        為了減少分布式環(huán)境中深度增強學習的通信負載,研究人員們提出了一系列的網(wǎng)絡通信協(xié)議和框架[1-4]。現(xiàn)有的研究大多基于無損網(wǎng)絡的假設,即在通信過程中不會發(fā)生網(wǎng)絡丟包;然而目前的互聯(lián)網(wǎng)(尤其是無線網(wǎng)絡)并不能完全地避免丟包的發(fā)生。探討在有損網(wǎng)絡中深度學習數(shù)據(jù)流的優(yōu)化問題,將參數(shù)服務器架構[5]和AllReduce架構[6]相結合,設計一種新穎的數(shù)據(jù)流優(yōu)化算法,使部署在有損網(wǎng)絡中的深度增強學習框架仍然可以保持其收斂性。

        1 算法設計

        1.1 問題描述

        所考慮的深度增強學習具有以下的形式:

        (1)

        其中,n是計算節(jié)點的數(shù)量,Di是計算節(jié)點i的本地訓練數(shù)據(jù)集合,F(xiàn)i(x;ξ)是計算節(jié)點i中模型x的損失函數(shù)。節(jié)點通過網(wǎng)絡進行通信,假設網(wǎng)絡的丟包率為p,所有丟包事件都是獨立的。

        1.2 算法流程

        在參數(shù)匯聚過程中,每一個計算節(jié)點會將其參數(shù)分成 個相同大小的塊,如下所示:

        (2)

        (3)

        算法1LTFlowOpt算法輸入:學習速度,最大迭代次數(shù)MAX_T輸出:xi,T1:初始化xi,12:whilet<=MAX_Tdo3: CalLocalSGD(); ∥計算本地梯度4: CalModel(); ∥根據(jù)梯度計算本地模型5: DivideModel(); ∥將模型分成大小相等的參數(shù)塊6: ParaAggregate(); ∥進行參數(shù)匯聚過程7: ParaBroadcast(); ∥進行參數(shù)廣播過程8:endwhile9:returnxi,T;

        (4)

        (5)

        (6)

        其中,α1和α2為常量,0<α2<α1<1。

        2 收斂速度

        接下來說明LTFlowOpt算法如何在有損網(wǎng)絡中保證深度增強學習算法的收斂性。首先假設所有函數(shù)fi(·)的梯度均具有李普希茲連續(xù)性,即‖fi(x)-fi(y)‖≤L‖x-y‖。與此同時,假設隨機梯度的差是有界的,即Eξ~Di‖F(xiàn)i(x;ξ)-fi(x)‖2≤σ2及2。能夠得到以下的結論:當學習速率γ足夠小,并滿足時,算法LTFlowOpt的收斂速率為

        (7)

        3 性能評估

        采用三個深度增強學習框架來評估LTFlowOpt算法的性能,這三個框架分別是ADNet、JointOS以及ADRL。ADNet是一個用于目標跟蹤的深度增強學習的框架,JointOS是目標檢測框架,而ADRL是一個視頻人臉檢測系統(tǒng)。

        在實驗中,采用CNTK深度學習套件來模擬網(wǎng)絡丟包的情況,并采用MPI標準的接口來實現(xiàn)LTFlowOpt算法。在深度增強學習的深度神經(jīng)網(wǎng)絡訓練過程中,batch的大小被設置為64。采用一個由10個服務器節(jié)點組成的集群,每一個服務器上配置有一塊英偉達Tesla K80 GPU,節(jié)點之間由10Gbps的以太網(wǎng)相互連接。采用訓練損失作為指標,分別考察LTFlowOpt算法和標準隨機梯度下降算法的收斂情況。網(wǎng)絡丟包概率設置為1%。實驗結果分別如圖1、2和3所示。

        圖1ADNet框架下算法訓練損失對比 圖2JointOS框架下算法訓練損失對比 圖3ADRL框架下算法訓練損失對比

        由結果可知,與標準隨機梯度下降算法相比,LTFlowOpt算法具有更好的丟包容忍性,在出現(xiàn)丟包的情況下仍然可以確保收斂性。

        4 結論

        針對部署在有損網(wǎng)絡中深度增強學習框架,設計了網(wǎng)絡數(shù)據(jù)流優(yōu)化算法LTFlowOpt。LTFlowOpt算法具有可靠性,在網(wǎng)絡出現(xiàn)丟包時仍然可以保證深度學習算法的收斂性。采用實驗,在三個深度增強學習框架的數(shù)據(jù)流下,評估了算法在有損網(wǎng)絡中的性能。未來的工作在于從理論上深入地分析LTFlowOpt算法的收斂性,并在大型的網(wǎng)絡集群中實現(xiàn)該算法。

        猜你喜歡
        深度
        深度理解不等關系
        四增四減 深度推進
        深度理解一元一次方程
        深度觀察
        深度觀察
        深度觀察
        深度觀察
        芻議深度報道的深度與“文”度
        新聞傳播(2016年10期)2016-09-26 12:14:59
        提升深度報道量與質
        新聞傳播(2015年10期)2015-07-18 11:05:40
        微小提議 深度思考
        日韩极品免费在线观看| 国产成人亚洲精品无码青| 日本一区二区视频免费在线看| 亚洲a∨无码男人的天堂| 人人妻人人爽人人澡人人| 91日本精品国产免| 亚洲AV无码精品色欲av| 久久青草国产免费观看| 在线免费观看视频播放| 日本一区二区免费在线看| 欧美日韩亚洲中文字幕二区| 无码aⅴ在线观看| 亚洲性爱区免费视频一区| 桃色一区一区三区蜜桃视频| 欧美变态另类刺激| 欧美人与物videos另类xxxxx| 胳膊肘上有白色的小疙瘩| 日韩精品一区二区免费| 少妇被粗大的猛烈进出69影院一| yeyecao亚洲性夜夜综合久久| 亚洲福利第一页在线观看| 蜜臀av毛片一区二区三区| 十八18禁国产精品www| 亚洲色大成网站www永久一区| 亚洲综合伦理| 手机在线观看亚洲av| 久久久精品视频网站在线观看| 50岁熟妇大白屁股真爽| 成人不卡国产福利电影在线看| 精品人妻日韩中文字幕| 国产亚洲综合一区二区三区| 亚洲av无码久久精品狠狠爱浪潮| 久久成年片色大黄全免费网站| 亚洲老熟妇愉情magnet| av在线天堂国产一区| 亚洲热线99精品视频| 日韩中文网| 日本一区二三区在线中文| 亚洲国产精品成人久久| 免费国精产品自偷自偷免费看| 国产自产c区|