亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù)

        2021-03-23 09:12:58陳折桂張偉功
        關(guān)鍵詞:實(shí)驗(yàn)質(zhì)量

        陳折桂,王 晶,2+,張偉功,3

        (1.首都師范大學(xué) 信息工程學(xué)院,北京 100048;2.首都師范大學(xué) 北京成像理論與技術(shù)高精尖創(chuàng)新中心,北京 100048;3.首都師范大學(xué) 電子系統(tǒng)可靠性技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)

        0 引 言

        伴隨著神經(jīng)網(wǎng)絡(luò)應(yīng)用范圍的擴(kuò)展,近年來涌現(xiàn)出了大量針對不同需求的機(jī)器學(xué)習(xí)框架[1-3],用于處理現(xiàn)代社會(huì)爆炸式增長的信息和數(shù)據(jù)。隨之而來的是數(shù)以千計(jì)的計(jì)算機(jī)組成的數(shù)據(jù)中心,為機(jī)器學(xué)習(xí)框架的執(zhí)行和數(shù)據(jù)的處理提供算力支持。然而,爆炸式增長的數(shù)據(jù)使得數(shù)據(jù)中心所需的計(jì)算成本更加昂貴,存儲(chǔ)墻問題更加嚴(yán)重。有限物理存儲(chǔ)容量限制了訓(xùn)練的規(guī)模和推理的速度。

        壓縮方案是應(yīng)用廣泛且實(shí)施簡單的拓展有限存儲(chǔ)容量的方法,然而這些只能對特定特征的數(shù)據(jù)進(jìn)行壓縮的無損方法會(huì)在壓縮解壓縮的過程中帶來很大的開銷。針對存儲(chǔ)墻和高開銷問題,本文提出一種基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù)(redundant data approximation),主要貢獻(xiàn)如下:

        (1)提出基于神經(jīng)網(wǎng)絡(luò)中冗余數(shù)據(jù)存儲(chǔ)特征的冗余數(shù)據(jù)近似算法,針對權(quán)值矩陣稀疏化、輸入數(shù)據(jù)重復(fù)化等不同的冗余模式選擇壓縮算法,針對相似數(shù)據(jù)小范圍浮動(dòng)型的冗余模式選擇近似算法,提高數(shù)據(jù)存儲(chǔ)密度。

        (2)針對神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)了支持拓?fù)涓兄娜哂鄶?shù)據(jù)近似算法,根據(jù)不同的網(wǎng)絡(luò)拓?fù)?,冗余?shù)據(jù)近似算法能夠?qū)ふ业捷^為優(yōu)化的近似方式,進(jìn)而提高壓縮效率和計(jì)算效率。

        (3)實(shí)驗(yàn)結(jié)果表明,采用本方案近似壓縮率平均達(dá)到了51.38%,為提高數(shù)據(jù)密集型應(yīng)用的系統(tǒng)加速比提供了廣闊的可行性。

        1 研究動(dòng)機(jī)

        為克服神經(jīng)網(wǎng)絡(luò)訓(xùn)練的內(nèi)存容量瓶頸,理想化的解決方案就是讓訪存和搬運(yùn)數(shù)據(jù)所需時(shí)間等于計(jì)算所需要的時(shí)間,如式(1)

        (1)

        目前典型的壓縮算法包括:ZCA(zero-content augmented)壓縮,該算法針對的存儲(chǔ)數(shù)據(jù)值大多為0,或NULL;FVC(frequent value compression)壓縮,該算法可將存儲(chǔ)的大量重復(fù)數(shù)據(jù)進(jìn)行壓縮,以此減少源數(shù)據(jù)所占的空間;FPC(frequent pattern compression)壓縮試圖把幾種可壓縮的模式進(jìn)行壓縮,比如4位符號擴(kuò)展,8位符號擴(kuò)展等。這些壓縮算法都能夠保證無損壓縮,但是都只能對特定特征的數(shù)據(jù)進(jìn)行壓縮,對其它數(shù)據(jù)特征無法進(jìn)行有效壓縮,并且壓縮解壓縮過程中帶來的開銷很大。傳統(tǒng)的無損壓縮方法能夠消除冗余數(shù)據(jù)提高系統(tǒng)性能,然而對于神經(jīng)網(wǎng)絡(luò)應(yīng)用,其自身具有一定的錯(cuò)誤容忍能力,對于結(jié)果要求并不那么精確,神經(jīng)網(wǎng)絡(luò)的冗余數(shù)據(jù)以及對不精確結(jié)果的可容忍性為降低無損壓縮帶來的壓縮和解壓縮等額外開銷提供了可能。

        神經(jīng)網(wǎng)絡(luò)的容錯(cuò)特性使得其可以接受近似計(jì)算的存在。近似計(jì)算利用了應(yīng)用程序?qū)Σ痪_結(jié)果的容忍度和用戶的感知限制,放松了對精確計(jì)算的要求,實(shí)現(xiàn)了計(jì)算精度與能效的折中。在很多既具有冗余數(shù)據(jù)又具有容錯(cuò)能力的新興領(lǐng)域中,如圖像和聲音處理、計(jì)算機(jī)視覺、數(shù)據(jù)挖掘等得到廣泛應(yīng)用。近似計(jì)算技術(shù)通常分為兩類,基于軟件的近似計(jì)算技術(shù)和基于硬件的近似計(jì)算技術(shù)。軟件近似機(jī)制通過對應(yīng)用程序的特殊代碼段近似執(zhí)行來達(dá)到減少計(jì)算開銷的目的[5]?;谟布慕朴?jì)算又可以大致分為基于計(jì)算的近似和基于存儲(chǔ)的近似?;诖鎯?chǔ)的近似可以探索存儲(chǔ)器體系結(jié)構(gòu)中的數(shù)據(jù)相似性,如文獻(xiàn)[6]就探索了高速緩存行之間的近似;根據(jù)高速緩存的空間/時(shí)間相關(guān)性提出的跳過一些內(nèi)存訪問也是一種好方法[7]。最常見的基于計(jì)算的近似就是精度縮放技術(shù)[8],該技術(shù)在質(zhì)量約束下調(diào)整操作數(shù)位寬以提高能量效率。目前針對數(shù)據(jù)方面比較常用的近似方法就是跳過內(nèi)存訪問和尾數(shù)截?cái)?,但它們不考慮數(shù)據(jù)本身的特性,比如尾數(shù)截?cái)嗟姆椒?,就是簡單粗暴地裁減掉尾數(shù)后幾位,雖然它能夠相對應(yīng)地減少操作數(shù)位數(shù),但沒有考慮數(shù)據(jù)與相鄰數(shù)據(jù)之間的關(guān)系。針對此,本文提出的方案在處理數(shù)據(jù)時(shí)考慮到了相鄰數(shù)據(jù)的相似性,在質(zhì)量約束下有選擇地調(diào)整操作數(shù)位寬,可以實(shí)現(xiàn)壓縮率的提升進(jìn)而顯著地提高運(yùn)算加速比。

        2 基于數(shù)據(jù)冗余模式的近似方案

        基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù)方案的主要目標(biāo)是實(shí)現(xiàn)精確度和性能的折中。為實(shí)現(xiàn)此目標(biāo),本方案接受擁有可近似代碼段的程序和用戶的資源約束作為輸入,并使用針對冗余數(shù)據(jù)類型設(shè)計(jì)的優(yōu)化生成具有不同精度的近似方案。圖1顯示了基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù)方案的整體框架和運(yùn)行時(shí)的整體操作。

        圖1 基于冗余數(shù)據(jù)的近似方案概況

        通過對應(yīng)用程序中冗余數(shù)據(jù)模式的分析可知,常見的程序時(shí)間和空間的開銷都由數(shù)據(jù)信息位的長度決定,而由于數(shù)據(jù)局部性和相似性特征,神經(jīng)網(wǎng)絡(luò)應(yīng)用中的數(shù)據(jù)又存在著冗余信息,那么可以通過消除冗余信息,減少數(shù)據(jù)信息位的長度,提升數(shù)據(jù)壓縮率,進(jìn)而降低程序的時(shí)間開銷和空間開銷。因此,本文提出基于數(shù)據(jù)特征的冗余近似方案:2.1.1節(jié)描述了針對稀疏矩陣這種數(shù)據(jù)存儲(chǔ)特征的冗余數(shù)據(jù)處理方案;2.1.2節(jié)描述了針對輸入數(shù)據(jù)中重復(fù)型數(shù)據(jù)的處理方案;2.1.3節(jié)展現(xiàn)了近似值的產(chǎn)生,根據(jù)分析神經(jīng)網(wǎng)絡(luò)中相鄰數(shù)據(jù)間的相似數(shù)據(jù)小范圍浮動(dòng)型而得到的冗余模式,選擇相應(yīng)的近似算法;2.2節(jié)描述了具有神經(jīng)網(wǎng)絡(luò)拓?fù)涓兄娜哂鄶?shù)據(jù)近似計(jì)算技術(shù),展現(xiàn)了本方案在不同網(wǎng)絡(luò)結(jié)構(gòu)下的應(yīng)用。

        基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù)通過將冗余數(shù)據(jù)消除和近似以便在緩沖區(qū)存儲(chǔ)更多數(shù)據(jù),一方面提高系統(tǒng)運(yùn)行加速比,另一方面消除從存儲(chǔ)器檢索數(shù)據(jù)的等待時(shí)間和能量。在傳統(tǒng)的存儲(chǔ)系統(tǒng)中,會(huì)經(jīng)常性發(fā)生未命中后從存儲(chǔ)器層次結(jié)構(gòu)中的下一級獲取。而在本方案中,對于可近似代碼段中的輸入數(shù)據(jù)近似后存放在緩沖區(qū)中,能夠在相同的容量下存放更多的數(shù)據(jù),從而消除一定的缺失率。之后取出近似值,處理器假定這是實(shí)際精確值并繼續(xù)執(zhí)行。

        2.1 數(shù)據(jù)的近似存儲(chǔ)

        神經(jīng)網(wǎng)絡(luò)中存在大量的輸入和權(quán)值數(shù)據(jù),輸入和權(quán)值的變化都可能會(huì)導(dǎo)致輸出質(zhì)量的變化。神經(jīng)網(wǎng)絡(luò)中同樣存在大量利于近似的規(guī)整數(shù)據(jù),例如大量的0值,重復(fù)型數(shù)據(jù)以及數(shù)據(jù)差值范圍浮動(dòng)較小的相似數(shù)據(jù)集?,F(xiàn)有冗余數(shù)據(jù)消除算法只針對具有某一種數(shù)據(jù)特征的存儲(chǔ)塊進(jìn)行設(shè)計(jì),難以靈活高效處理不同特征的數(shù)據(jù),為提高壓縮率,本文提出針對不同數(shù)據(jù)冗余模式的近似消除技術(shù)。圖2為形式化算法流程,其中,將近似代碼段的輸入數(shù)據(jù)值視為一組固定大小的值的集合(如8/4/2字節(jié)),按固定大小依次比較,匹配冗余模式,當(dāng)為稀疏型時(shí)僅保留一個(gè)零值,其余舍棄;當(dāng)為重復(fù)型時(shí),僅保留一組重復(fù)值,其余舍棄;當(dāng)為小范圍浮動(dòng)型時(shí),僅保留基值。成功通過匹配近似并且存儲(chǔ)長度最短的保留值即為近似值用以計(jì)算和存儲(chǔ),而未能夠匹配到冗余模式的輸入數(shù)據(jù)則視為不可近似,直接使用真實(shí)值進(jìn)行計(jì)算和存儲(chǔ)。

        圖2 數(shù)據(jù)近似存儲(chǔ)策略的形式化算法流程

        2.1.1 權(quán)值矩陣稀疏化

        首先是針對于稀疏矩陣型冗余數(shù)據(jù)的消除。在神經(jīng)網(wǎng)絡(luò)中,其權(quán)值矩陣中存在大量的0值,如圖3所示,去除冗余權(quán)值,將稠密權(quán)值矩陣(圖3(a))轉(zhuǎn)換為稀疏矩陣(圖3(b))。之后計(jì)算輸出元素時(shí)會(huì)去掉零權(quán)重的乘法累加操作,使得整個(gè)操作過程中計(jì)算操作數(shù)減少,并且能達(dá)到存儲(chǔ)空間的降低。針對于稀疏矩陣中0值的冗余,本文提出的方案是只需存儲(chǔ)一個(gè)數(shù)值。

        圖3 稀疏矩陣性冗余數(shù)據(jù)的處理

        2.1.2 重復(fù)型輸入數(shù)據(jù)壓縮

        神經(jīng)網(wǎng)絡(luò)的輸入有大量的圖像視頻等應(yīng)用,在這些應(yīng)用領(lǐng)域中,彼此相鄰的元素可能具有相同的值,于是,輸入時(shí)利用一部分元素的值代替其它重復(fù)的元素值進(jìn)行計(jì)算也可以得到符合要求的目標(biāo)輸出質(zhì)量。針對于輸入數(shù)據(jù)中存在著的重復(fù)數(shù)值,本文根據(jù)重復(fù)值的字節(jié)數(shù)的不同,基于數(shù)據(jù)的對齊存儲(chǔ)特性可分為4字節(jié)和8字節(jié)重復(fù)值存儲(chǔ),并標(biāo)記其它重復(fù)值的個(gè)數(shù)。圖4反映了輸入數(shù)據(jù)中重復(fù)數(shù)值的處理和復(fù)用方式,利用這種方式可以大量壓縮冗余數(shù)據(jù),提高壓縮率。

        圖4 輸入數(shù)據(jù)中重復(fù)型冗余數(shù)據(jù)的處理

        2.1.3 小范圍浮動(dòng)型近似

        實(shí)際過程中的很多應(yīng)用并不需要執(zhí)行完全精確的計(jì)算。一方面,精度較低的數(shù)據(jù)并不總是導(dǎo)致功能錯(cuò)誤;另一方面,由于許多數(shù)據(jù)密集型神經(jīng)網(wǎng)絡(luò)應(yīng)用本身具有抗錯(cuò)誤能力,有時(shí)甚至可以恢復(fù),其可以接受一定數(shù)量的功能錯(cuò)誤,并且不會(huì)影響最終輸出質(zhì)量。因此,在此部分,我們提出了相鄰數(shù)據(jù)具有近似可能性的小范圍浮動(dòng)相似值的近似計(jì)算方案,如圖5所示。對小范圍浮動(dòng)值冗余模式,需要判斷基值和差值。由于基值越多,算法越復(fù)雜,時(shí)間開銷越大,壓縮率越低,基于性能和開銷的折中考慮,方案選用2個(gè)基值,一個(gè)基值為0值,另一個(gè)基值根據(jù)具體的神經(jīng)網(wǎng)絡(luò)矩陣中的數(shù)值進(jìn)行選取,利用精度擴(kuò)縮舍去矩陣行中的數(shù)據(jù)與基值進(jìn)行向量減操作得到的增值,僅保留2個(gè)基值。由于應(yīng)用程序的數(shù)據(jù)存在多樣性,因而支持多種數(shù)據(jù)長度,基值可支持2字節(jié)、4字節(jié)和8字節(jié)。此方案相對于無損壓縮由于舍掉增值而引入了誤差,但同時(shí),由于舍掉增值僅存儲(chǔ)基值而使源數(shù)據(jù)信息位的長度變短,提升了數(shù)據(jù)壓縮率,空間開銷和延遲開銷也會(huì)相比于無損壓縮進(jìn)一步減少,系統(tǒng)的運(yùn)行加速比增高,同時(shí)相較于無損壓縮還省去了壓縮和解壓縮的額外開銷。另外,本文提出的方案不僅能夠減少操作數(shù)位寬,還能相對應(yīng)地減少操作數(shù)計(jì)算個(gè)數(shù),進(jìn)而減少神經(jīng)網(wǎng)絡(luò)中的計(jì)算量。

        圖5 相鄰數(shù)據(jù)小范圍浮動(dòng)值近似

        表1給出了支持的小范圍浮動(dòng)型數(shù)據(jù)的近似方式,小范圍浮動(dòng)值根據(jù)所選基值的不同,分為3種。

        2.2 網(wǎng)絡(luò)拓?fù)涓兄娜哂鄶?shù)據(jù)近似方案

        神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),包括層數(shù)和每層的神經(jīng)元數(shù)量都可以變化。并且不同層的輸入數(shù)據(jù)之間沒有關(guān)聯(lián),其相似度往往較差。而針對小范圍浮動(dòng)值的近似技術(shù)中,近似數(shù)據(jù)的范圍是影響壓縮效果和網(wǎng)絡(luò)精度的關(guān)鍵。例如,對

        表1 近似壓縮方式

        于①3-8結(jié)構(gòu)的網(wǎng)絡(luò):有3層(包含input、output和1個(gè)隱藏層),隱藏層有8個(gè)神經(jīng)元;和②4-4-4結(jié)構(gòu)的網(wǎng)絡(luò):有4層(包含input、output和2個(gè)隱藏層),每個(gè)隱藏層有4個(gè)神經(jīng)元。兩個(gè)網(wǎng)絡(luò)隱藏層神經(jīng)元數(shù)量都是一樣的,此時(shí)想要近似就得考慮這些神經(jīng)元相對應(yīng)的數(shù)據(jù)究竟是在同一層里還是在不同層里,雖然8個(gè)數(shù)據(jù)同時(shí)在存儲(chǔ)區(qū),但是對于3-8的網(wǎng)絡(luò),這8個(gè)數(shù)據(jù)是一起使用,而對于4-4-4,是先使用前4個(gè)數(shù)據(jù)再使用后4個(gè)。見表2,如果不去分析拓?fù)?,而是采用一個(gè)固定的范圍如每4個(gè)數(shù)據(jù)一組去做冗余數(shù)據(jù)近似,那么對于3-8網(wǎng)絡(luò)中的8個(gè)數(shù)據(jù),每4個(gè)近似需要2個(gè)基值,相比于每8個(gè)一組不能最大化近似效果,造成時(shí)間和能量的開銷;同樣的,若統(tǒng)一采用每8個(gè)數(shù)據(jù)一組做近似,那么對于4-4-4網(wǎng)絡(luò),相比于每4個(gè)一組,由于兩層隱藏層之間數(shù)據(jù)相似性可能并不大,在這些相鄰數(shù)據(jù)之間找到的近似值可能誤差會(huì)很大。這就要求近似方法能夠感知網(wǎng)絡(luò)拓?fù)?,能根?jù)網(wǎng)絡(luò)的結(jié)構(gòu)調(diào)整近似的范圍,產(chǎn)生合適的冗余數(shù)據(jù)近似方案。

        基于上述的分析,本文提出的網(wǎng)絡(luò)拓?fù)涓兄娜哂鄶?shù)據(jù)近似方案首先會(huì)分析網(wǎng)絡(luò)結(jié)構(gòu),確定網(wǎng)絡(luò)的層數(shù)、順序和每層神經(jīng)元的個(gè)數(shù),從而針對每一層節(jié)點(diǎn)的數(shù)量對神經(jīng)網(wǎng)絡(luò)中的各層輸入數(shù)據(jù)做近似范圍地劃分,之后在這些范圍內(nèi)對數(shù)據(jù)實(shí)施2.1節(jié)所述的冗余數(shù)據(jù)近似方案。通過感知網(wǎng)絡(luò)拓?fù)洌梢越鉀Q對數(shù)據(jù)進(jìn)行固定范圍近似所帶來的問題,能夠更加優(yōu)化壓縮效果,減少網(wǎng)絡(luò)精度的損失。

        表2 網(wǎng)絡(luò)拓?fù)涓兄娜哂鄶?shù)據(jù)近似方案

        3 評測與分析

        實(shí)驗(yàn)選擇對比了不壓縮不近似的基準(zhǔn)方案(base),使用收縮神經(jīng)網(wǎng)絡(luò)加速器的近似方案(SNNAP)[9]以及本文提出的冗余數(shù)據(jù)近似(RDA)方案。實(shí)驗(yàn)首先面向Axbench基準(zhǔn)測試程序進(jìn)行精度和壓縮率的對比,其次面向神經(jīng)網(wǎng)絡(luò)應(yīng)用進(jìn)行評測對比,最后探索了當(dāng)神經(jīng)網(wǎng)絡(luò)拓?fù)渥兓瘯r(shí)冗余數(shù)據(jù)近似方案對神經(jīng)網(wǎng)絡(luò)應(yīng)用的影響。

        3.1 面向Axbench程序的評測

        3.1.1 實(shí)驗(yàn)平臺與基準(zhǔn)測試程序

        我們在sniper[10]模擬環(huán)境中運(yùn)行Axbench[11]基準(zhǔn)測試程序?qū)Ρ疚姆桨高M(jìn)行評估。體系結(jié)構(gòu)參數(shù)具體見表3。

        表3 體系結(jié)構(gòu)參數(shù)

        Axbench是代表了現(xiàn)代和新興應(yīng)用并可以應(yīng)用到神經(jīng)網(wǎng)絡(luò)等廣泛領(lǐng)域的基準(zhǔn)數(shù)據(jù)集。其中JPEG是針對彩色圖像的有損壓縮技術(shù),輸入是未壓縮的圖像,實(shí)驗(yàn)中讓JPEG算法執(zhí)行有損壓縮并生成與原文件大小相比減小的類似圖像。Sobel廣泛用于圖像處理和計(jì)算機(jī)視覺應(yīng)用,在Sobel的實(shí)驗(yàn)中,RGB圖像作為輸入,最終生成邊緣被重點(diǎn)標(biāo)注的近似灰度圖像。K-means是一種常用的聚類算法,廣泛用于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘,它旨在將多個(gè)n維輸入點(diǎn)劃分為k個(gè)不同的簇,使用RGB圖像作為輸入,輸出是聚集在不同顏色區(qū)域的近似圖像。FFT算法主要計(jì)算序列的離散傅里葉變換或其逆,輸入是時(shí)域中的信號序列,輸出是頻域中信號值的近似表示。

        3.1.2 程序近似敏感度和近似閾值分析

        我們使用相對誤差作為實(shí)驗(yàn)的精度測量標(biāo)準(zhǔn)。把base方案和SNNAP方案作為兩個(gè)比較基準(zhǔn)。對輸入數(shù)據(jù)所能夠近似的變化范圍稱之為近似閾值,應(yīng)用程序使用者所能接受的最小輸出結(jié)果精確度稱之為目標(biāo)輸出質(zhì)量。

        分析JPEG、Sobel、K-means、FFT在不同近似閾值(即不同近似程度)下的敏感度研究實(shí)驗(yàn),可以得到,在這些基準(zhǔn)程序的實(shí)驗(yàn)中,對于每一個(gè)實(shí)驗(yàn)樣本,當(dāng)所能夠容忍的近似閾值變大時(shí),最終基準(zhǔn)程序的輸出誤差也隨之增大,即輸出精度隨之降低;反之,輸出誤差減小。并且通過幾個(gè)基準(zhǔn)程序的敏感度實(shí)驗(yàn)對比可以發(fā)現(xiàn),如圖6所示,像圖像處理、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘這些具有大量重復(fù)和相似數(shù)據(jù)的應(yīng)用程序,其實(shí)驗(yàn)中的樣本對于近似閾值的變化都很敏感,本文提出的冗余數(shù)據(jù)近似方案十分適用;而對于像FFT這樣的并不存在大量重復(fù)相似的應(yīng)用程序,近似閾值可選度非常小,輸出誤差也基本沒變化。并且這幅圖給使用者提供了一個(gè)動(dòng)態(tài)的可調(diào)整的方案,以不同近似程度的實(shí)驗(yàn)作為支撐,程序使用者可以根據(jù)自己所需求的目標(biāo)輸出質(zhì)量選擇各基準(zhǔn)程序在最合適近似程度下的近似方案。

        圖6 各基準(zhǔn)程序敏感度研究

        3.1.3 近似效果分析

        圖7左側(cè)坐標(biāo)軸是base方案、SNNAP方案、RDA方案的輸出質(zhì)量比較。為使實(shí)驗(yàn)數(shù)據(jù)圖表呈現(xiàn)最好效果,在本文的RDA方案實(shí)驗(yàn)中,我們對JPEG、Sobel、K-means這3種基準(zhǔn)程序選擇當(dāng)近似閾值為63時(shí)的輸出質(zhì)量作為比較,F(xiàn)FT選擇近似閾值為127時(shí)的輸出質(zhì)量作為比較。實(shí)驗(yàn)結(jié)果表明:在FFT的實(shí)驗(yàn)中3種方案相差不大,因?yàn)樵贔FT中并不存在大量的重復(fù)和相似數(shù)據(jù),可壓縮與可近似程度非常小,因此質(zhì)量損失并沒有太大變化。在JPEG實(shí)驗(yàn)中,RDA方案相較于base方案質(zhì)量下降了6.45%,相較于SNNAP方案質(zhì)量提高了2.27%;在Sobel實(shí)驗(yàn)中,RDA方案相比于另外兩種方案質(zhì)量分別下降了23.25%,提高了11.53%;在K-means實(shí)驗(yàn)中,RDA方案相比于另外兩種方案質(zhì)量分別下降了1.35%,提高了10.67%。這3種基準(zhǔn)程序都是與圖像處理、機(jī)器學(xué)習(xí)等有關(guān)的具有大量重復(fù)和相似數(shù)據(jù)的應(yīng)用程序,它們的冗余數(shù)據(jù)可壓縮性和可近似性非??捎^,通過近似后便會(huì)產(chǎn)生一定的質(zhì)量損失。但通過實(shí)驗(yàn)數(shù)據(jù)可以看到,綜合來看,本文提出的方案并不會(huì)對應(yīng)用程序輸出質(zhì)量產(chǎn)生大的影響,平均降低了10.35%,并且,本文的方案相較于SNNAP方案效果更好,平均提高了8.16%。

        圖7右側(cè)坐標(biāo)軸是使用了RDA方案后的數(shù)據(jù)壓縮率的情況。近似壓縮率定義為可被近似壓縮的數(shù)據(jù)總量和壓縮前的數(shù)據(jù)總量的比值(式(2)),近似壓縮率的值越高表明壓縮效果越好,系統(tǒng)加速比提升空間更大,帶寬利用率也會(huì)隨之提高。根據(jù)實(shí)驗(yàn)結(jié)果顯示,圖像處理、機(jī)器學(xué)習(xí)等應(yīng)用程序的代表程序JPEG、Sobel、K-means,近似壓縮率分別達(dá)到了61.88%、67.20%、25.07%,為我們提供了廣闊的可行性

        (2)

        圖7 各方案下應(yīng)用的近似效果比較

        3.2 面向神經(jīng)網(wǎng)絡(luò)的近似技術(shù)評測

        Axbench中還引入了神經(jīng)網(wǎng)絡(luò)近似方案[9,11],于是,我們面向神經(jīng)網(wǎng)絡(luò)應(yīng)用,以該神經(jīng)網(wǎng)絡(luò)近似方案為基準(zhǔn)方案(base),與神經(jīng)網(wǎng)絡(luò)應(yīng)用背景下的RDA方案進(jìn)行比較。

        3.2.1 近似效果分析

        由上面的實(shí)驗(yàn)評估和討論可以看到,本文提出的冗余數(shù)據(jù)近似方案對圖像處理、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘這些具有大量重復(fù)和相似數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)應(yīng)用程序十分適用,因此,本小節(jié)便對這些神經(jīng)網(wǎng)絡(luò)應(yīng)用進(jìn)行探索與討論,以代表程序JPEG、Sobel、K-means為例。

        在面向神經(jīng)網(wǎng)絡(luò)近似環(huán)境下,通過冗余數(shù)據(jù)近似方案對神經(jīng)網(wǎng)絡(luò)應(yīng)用影響的探究實(shí)驗(yàn)可得,敏感度和之前3.1.2節(jié)討論的典型程序的敏感度類似,對于每一個(gè)實(shí)驗(yàn)樣本,當(dāng)所能夠容忍的近似閾值變大時(shí),最終基準(zhǔn)程序的輸出誤差也隨之增大,即輸出精度隨之降低;反之,輸出誤差減小。

        圖8是面向神經(jīng)網(wǎng)絡(luò)應(yīng)用的RDA和base方案的輸出質(zhì)量比較。為使實(shí)驗(yàn)數(shù)據(jù)圖表呈現(xiàn)最好效果,在本文的神經(jīng)網(wǎng)絡(luò)探索實(shí)驗(yàn)中,對JPEG、Sobel、K-means這3個(gè)程序同樣選擇當(dāng)近似閾值為63時(shí)的輸出質(zhì)量作為比較。實(shí)驗(yàn)結(jié)果表明:在JPEG實(shí)驗(yàn)中,面向神經(jīng)網(wǎng)絡(luò)應(yīng)用的RDA方案較于base方案質(zhì)量下降了0.92%,在Sobel實(shí)驗(yàn)中,提高了11.56%,在K-means實(shí)驗(yàn)中,輸出質(zhì)量基本持平。通過實(shí)驗(yàn)數(shù)據(jù)可以看到,綜合來看,面向神經(jīng)網(wǎng)絡(luò)的RDA方案不會(huì)對應(yīng)用程序輸出質(zhì)量產(chǎn)生太大影響。

        圖8 冗余數(shù)據(jù)近似對神經(jīng)網(wǎng)絡(luò)精度的影響

        本次神經(jīng)網(wǎng)絡(luò)探索實(shí)驗(yàn)中的近似壓縮率也與3.1.3節(jié)的差別不大,在此不過多敘述。綜合輸出精度與近似壓縮率,可以看到冗余數(shù)據(jù)近似方案對于圖像處理、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘這類需要神經(jīng)網(wǎng)絡(luò)處理大量重復(fù)和相似數(shù)據(jù)的應(yīng)用程序十分適用,為神經(jīng)網(wǎng)絡(luò)量化加速提供了廣闊的前景。

        3.2.2 不同網(wǎng)絡(luò)拓?fù)湎陆菩Ч治?/p>

        本小節(jié)研究內(nèi)容是通過冗余數(shù)據(jù)近似方案對神經(jīng)網(wǎng)絡(luò)應(yīng)用可近似區(qū)域的輸入數(shù)據(jù)量化之后,探究神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)拓?fù)涞母淖儗敵鲑|(zhì)量的影響。圖9為以JPEG為例的實(shí)驗(yàn)數(shù)據(jù)所繪制的結(jié)果,橫坐標(biāo)為不同網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),3-2表示神經(jīng)網(wǎng)絡(luò)最大層數(shù)為3層,隱藏層最多神經(jīng)元個(gè)數(shù)是2,其余同理;縱坐標(biāo)是JPEG在不同網(wǎng)絡(luò)拓?fù)湎碌妮斎胝`差平均值。通過圖9可知,無論網(wǎng)絡(luò)拓?fù)渥兓枚鄰?fù)雜,面向神經(jīng)網(wǎng)絡(luò)采用冗余數(shù)據(jù)近似方案其輸出誤差最大不會(huì)超過1.5%,表明了本文提出的冗余數(shù)據(jù)近似方案在神經(jīng)網(wǎng)絡(luò)應(yīng)用中優(yōu)秀的魯棒性和穩(wěn)定性。

        圖9 誤差隨網(wǎng)絡(luò)拓?fù)渥兓闆r

        4 相關(guān)工作

        近似計(jì)算利用了應(yīng)用對不精確結(jié)果的容忍特性和用戶的感知限制,使得近似后的結(jié)果仍然能滿足某些指標(biāo)的要求。近年來提出了很多提高效能的近似計(jì)算方法,下面介紹與本文相關(guān)的近似計(jì)算技術(shù)工作。

        神經(jīng)網(wǎng)絡(luò)通常過度參數(shù)化,源于在用參數(shù)表示近似模型的方式中存在著顯著冗余。因此,一系列提案旨在通過減輕網(wǎng)絡(luò)冗余來減少神經(jīng)網(wǎng)絡(luò)內(nèi)存使用。特別是網(wǎng)絡(luò)裁剪策略已經(jīng)被先前文獻(xiàn)[12,13]廣泛研究。網(wǎng)絡(luò)裁剪通過刪除那些滿足給定裁剪標(biāo)準(zhǔn)的冗余網(wǎng)絡(luò)連接,可以有助于減少模型權(quán)重分配的內(nèi)存。但這些提議為節(jié)省內(nèi)存使用提供了有限的機(jī)會(huì),因?yàn)闄?quán)重僅占神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的總內(nèi)存分配的一小部分。最近還有不少方案為卷積神經(jīng)網(wǎng)絡(luò)提出了一系列加速器設(shè)計(jì)[14-16]。這些先前提案屬于神經(jīng)網(wǎng)絡(luò)的推理領(lǐng)域,而我們的工作重點(diǎn)是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的數(shù)據(jù)。更重要的是,這些先前的工作都沒有解決由于神經(jīng)網(wǎng)絡(luò)內(nèi)存虛擬化而產(chǎn)生的通信瓶頸。

        除此之外,大量文獻(xiàn)也著眼于與存儲(chǔ)空間有關(guān)的近似所帶來的性能和效率的提高??稍贒RAM中支持近似存儲(chǔ)以節(jié)省能量,當(dāng)然也會(huì)帶來一定的錯(cuò)誤[17]。也有工作將寄存器中的冗余數(shù)據(jù)量[18]作為探索點(diǎn),通過壓縮消除寄存器中冗余數(shù)據(jù)更有效地節(jié)省能量。還有的工作著眼于精度縮放這種常用的近似技術(shù),通過調(diào)節(jié)輸入操作數(shù)的位寬來實(shí)現(xiàn)能量和質(zhì)量的權(quán)衡[19]。

        5 結(jié)束語

        神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)框架在視覺、語言等眾多應(yīng)用領(lǐng)域發(fā)揮了重要作用,但是隨著數(shù)據(jù)的爆炸式增長,計(jì)算和存儲(chǔ)成本將變得更加昂貴,精確度和開銷也難達(dá)到更好的平衡。為此本文提出了基于數(shù)據(jù)冗余性的近似計(jì)算技術(shù),它是通過分析數(shù)據(jù)密集型神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)冗余特征,針對頻繁出現(xiàn)的稀疏矩陣型、數(shù)據(jù)重復(fù)型、相似數(shù)據(jù)小范圍浮動(dòng)型這3種數(shù)據(jù)分別提出各自的壓縮方案和近似方案,進(jìn)而降低開銷,提高存儲(chǔ)密度。研究結(jié)果表明本文方案相比于SNNAP方案輸出質(zhì)量平均提高了8.16%,對擁有神經(jīng)網(wǎng)絡(luò)的基準(zhǔn)程序進(jìn)行近似和量化后輸出質(zhì)量平均提高了10.5%。另外,圖像處理、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘這些具有大量重復(fù)和相似數(shù)據(jù)的數(shù)據(jù)密集型應(yīng)用程序更加適用于本方案,平均壓縮率能達(dá)到51.38%,為提高系統(tǒng)加速比提供了廣闊的可行性。至于未來工作還有許多問題有待進(jìn)一步研究,例如如何快速有效精準(zhǔn)地對輸入數(shù)據(jù)的重要性進(jìn)行評價(jià),以達(dá)到更好的輸出質(zhì)量更大的壓縮率,以及提高壓縮率對提高系統(tǒng)加速比的具體影響,都值得深入探究。

        猜你喜歡
        實(shí)驗(yàn)質(zhì)量
        記一次有趣的實(shí)驗(yàn)
        微型實(shí)驗(yàn)里看“燃燒”
        “質(zhì)量”知識鞏固
        質(zhì)量守恒定律考什么
        做個(gè)怪怪長實(shí)驗(yàn)
        做夢導(dǎo)致睡眠質(zhì)量差嗎
        關(guān)于質(zhì)量的快速Q(mào)&A
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        人妻少妇被猛烈进入中文| 在线成人福利| 最新日韩av在线不卡| 日本av在线精品视频| 国产精品成年人毛片毛片| 在线播放国产自拍av| 丰满人妻熟妇乱又仑精品| 亚洲热妇无码av在线播放| 日韩人妻无码一区二区三区| 7777精品久久久大香线蕉| 精品囯产成人国产在线观看| 欧美在线Aⅴ性色| 日韩av天堂一区二区三区在线| 国产精品一区二区三区在线免费| 精品国产一区二区三区久久狼 | 久久久综合九色合综国产| 成人精品免费av不卡在线观看| 久久国产A∨一二三| 日本视频一区二区三区三州| 日本女优激情四射中文字幕| 高清国产国产精品三级国产av| 亚洲男人av天堂久久资源| 国产在线观看免费视频软件| 国产精品一卡二卡三卡| 99久久国产福利自产拍 | 麻豆国产AV网站| 久久久精品国产亚洲av网麻豆| 国产av无码专区亚洲av果冻传媒| 国产av无码专区亚洲av麻豆| 精品亚洲成a人无码成a在线观看| 婷婷五月综合丁香在线| 97se亚洲精品一区| 思思久久96热在精品不卡| 亚洲国产精一区二区三区性色| 日韩精品国产精品亚洲毛片| 久久国产精品亚洲婷婷片| 亚洲av永久无码精品网站在线观看| 亚洲国产精品特色大片观看完整版| 国产精品青草视频免费播放| 中文字幕日本女优在线观看| 男人天堂插插综合搜索|