亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

深度學習模型的數(shù)據(jù)并行訓練算法研究

2017-05-19 01:27:28何婕

商情 2017年12期

何婕

（重慶工商職業(yè)學院）

【摘要】針對并行訓練算法面臨的諸多問題上，提出了一種并行分布式訓練模型。該模型采用主-從機結(jié)構(gòu)，通過數(shù)據(jù)片split迭代得到數(shù)據(jù)塊block，然后聚合所有從機優(yōu)化得到的模型。實驗表明，該模型在犧牲部分模型性能的情況下，實現(xiàn)了訓練的線性加速

【關(guān)鍵字】深度學習數(shù)據(jù)并行訓練框架

1 引言

深度學習是現(xiàn)代信息處理的一種智能算法，通過多層人工神經(jīng)網(wǎng)絡擬合訓練樣本數(shù)據(jù)，解決了傳統(tǒng)神經(jīng)網(wǎng)絡算法在訓練多層神經(jīng)網(wǎng)絡時出現(xiàn)的局部最優(yōu)問題，基于深度學習對于圖像、文本、語音等識別算法能夠較快的提取對象特征值，且時效性較好，得到越來越深入的研究。

2 深度學習模型

近年來，深度學習模型最引人注目的是谷歌公司開發(fā)的DistBelief訓練框架，該框架在數(shù)以千計的計算節(jié)點上訓練不同類型的深度學習模型，這種算法屬于異步SGD算法。根據(jù)谷歌公布的結(jié)果顯示，隨著用于并行訓練機器的增多，異步SGD訓練得到的模型性能會出現(xiàn)顯著下降。對其算法進行可擴展化訓練的思路，一是可以采用基于模型平均的算法，還有一種是基于狀態(tài)聚類的多DNN訓練算法，它將深度學習訓練任務分解成多個子任務，每個子任務獨立進行各自模型的訓練，因而可以并行處理，在系統(tǒng)性能略有下降的情況下，實現(xiàn)了DNN的加速訓練。

3 數(shù)據(jù)并行的分布式訓練算法

針對現(xiàn)有并行訓練算法面臨的諸多問題（可擴展性差、實現(xiàn)困難、并行效率低），我們通過多方面的嘗試，在數(shù)據(jù)并行的増量塊式訓練（Incremental Block Training，IBT）框架下，提出了一種新的分布式訓練算法。該算法的主要思想是：把無約束的深度學習模型訓練問題轉(zhuǎn)化成全局一致性優(yōu)化問題進行分布式求解。當并行運算機器増多時，訓練呈線性加速的同時，相對于單機訓練得到的模型，并行訓練得到的模型性能不再下降，在一些情況下甚至優(yōu)于單機模型。

3.1 并行增量塊訓練框架

IBT框架中，每次取訓練數(shù)據(jù)的一個子集稱之為數(shù)據(jù)塊（block），用該數(shù)據(jù)塊對模型進行訓練，模型更新完畢再取下個數(shù)據(jù)塊進行訓練，即模型的訓練是按照數(shù)據(jù)塊逐個進行的。如果數(shù)據(jù)塊內(nèi)的訓練數(shù)據(jù)是被多個處理單元并行處理的，便實現(xiàn)了數(shù)據(jù)并行訓練。見圖1所示。

IBT采用主-從機結(jié)構(gòu)，主機上的模型為全局模型，從機上的模型為局部模型。單個從機處理的為一個數(shù)據(jù)片（split），每次主機算法迭代時，n臺從機處理的split便構(gòu)成上了一個block。

3.2 并行分布式訓練算法

ADMM是一種用于解決線性等式約束凸優(yōu)化問題的分布式優(yōu)化算法，成功應用于大規(guī)模機器學習問題的求解。我們把深度學習模型的訓練，采用全局一致問題的ADMM算法優(yōu)化模型參數(shù)。

3.3 實驗結(jié)果

我們選取 Google Earth等網(wǎng)絡軟件下載圖像數(shù)據(jù) 25000 張，將其分為居民地、道路、綠化區(qū)、湖泊、土地 5 類，每類 5000 張。通過改進的并行分布式訓練，我們把每個block的split數(shù)目N為10，20，40，10*496，20*248，40*124，在這些數(shù)據(jù)分割下，分別進行傳統(tǒng)的ADMM和改進的并行分布式訓練。并行訓練使用的GPU數(shù)目和每個block包含的split數(shù)目相同，我們通過統(tǒng)計每種算法處理一遍數(shù)據(jù)的用時計算訓練的加速比。結(jié)果表明，在犧牲部分模型性能的情況下，實現(xiàn)了訓練的線性加速，使用32塊GPU卡達到了28倍以上的訓練加速，且并行訓練得到的模型相對單機基準模型，性能基本沒有下降，有些情況下甚至好于單機模型。

4 結(jié)語

本文對深度學習模型進行了研究，在并行訓練算法面臨的諸多問題上，提出了一種并行分布式訓練模型。實驗數(shù)據(jù)表明，該模型在犧牲部分模型性能的情況下，實現(xiàn)了訓練的線性加速。

參考文獻：

[1]陳凱.深度學習模型的高效訓練算法研究[D].中國科學技術(shù)大學.2016

[2]HATFIELD.F.J，WIGGERT.D.C.Response of pipe-linesto seismic motion in：the axial direction.ASME PVPConf.Symp.on Recent Advances.in Design， Analysis，Testing， and Qualification Methods. San Diego， US-A， July 1987： 289–295.

基金項目：2016年重慶工商職業(yè)學院科學研究“基于深度學習模型的圖像識別技術(shù)研究”項目（項目編號YB2016-18）。