亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        非精確浮點數(shù)乘法器設計

        2016-12-03 07:39:22尹培培
        電子技術應用 2016年3期
        關鍵詞:浮點數(shù)乘法器尾數(shù)

        尹培培

        (南京航空航天大學 計算中心,江蘇 南京 210016)

        非精確浮點數(shù)乘法器設計

        尹培培

        (南京航空航天大學 計算中心,江蘇 南京 210016)

        隨著電路系統(tǒng)數(shù)值運算范圍以及數(shù)據(jù)運算精度的不斷擴大,浮點數(shù)運算的研究變得越來越重要。但傳統(tǒng)浮點數(shù)運算單元硬件復雜、功耗大、延時長,這些因素很大程度上制約著浮點數(shù)運算的性能。非精確計算可以減少容錯設備的動態(tài)及靜態(tài)能量損耗,作為解決以上問題的有效方法。提出了一種非精確浮點數(shù)乘法器的算法設計,同時將該算法應用于高動態(tài)范圍圖片的圖像處理中,并將結果與精確浮點數(shù)乘法器的應用結果進行對比,結果表明所提出的非精確浮點數(shù)乘法器具有很好的性能。

        浮點數(shù);非精確;乘法器;高動態(tài)范圍圖片

        0 引言

        目前,集成電路的設計工藝已經(jīng)進入深亞微米階段,工藝水平大幅度提高,計算機微處理器也不斷更新?lián)Q代。在微處理系統(tǒng)中,數(shù)據(jù)類型分為定點數(shù)和浮點數(shù),相對于定點數(shù)的有限范圍及有限精度,浮點數(shù)可以靈活地表示更大范圍及更高精度的實數(shù),由于以上原因,浮點數(shù)運算成為微處理器以及信號處理系統(tǒng)中的重要部件之一。但同時相對于定點數(shù)而言,浮點數(shù)運算需要更復雜的硬件電路,消耗更大的面積及能量,因此為數(shù)據(jù)范圍的拓寬帶來了能量及面積上的消耗。傳統(tǒng)的電路設計大多運用精確計算算法,但對于一些圖像處理的可容錯應用,這些系統(tǒng)并不需要絕對的精確性。所以將非精確運算[1]運用到這些系統(tǒng)中可以減小能量損耗及電路面積,同時也可提高系統(tǒng)的性能。

        非精確的算法設計作為減少容錯設備的動態(tài)及靜態(tài)能量損耗的有效方法,它的主要思想是通過減小硬件的復雜度來提高系統(tǒng)的性能及效率。目前非精確計算主要集中在定點數(shù)的研究[2-5],文獻[2]中非精確處理器犧牲了 7.58%的相對錯誤率,但速度、面積比精確處理器速度提高了將近15倍,能量損耗也減少了將近15倍。研究表明運用非精確算法設計出的芯片面積更小,速度更快,能量損耗更低。雖然定點數(shù)在非精確研究方面取得了較成功的應用,但相對于定點數(shù)而言,目前對非精確浮點數(shù)運算的研究并不多。由于浮點數(shù)運算電路更復雜,能量也消耗更多,非精確浮點數(shù)算法的研究顯得尤為重要。

        文獻[5]設計了一種非精確的浮點數(shù)加法器,該設計通過將低位部分精確加法替代為或門算法實現(xiàn)非精確運算;文獻[6]研究了一種低功耗的浮點數(shù)乘法器,該研究通過直接截斷浮點數(shù)的數(shù)值位來減少硬件;文獻[7]設計了一種高效率的浮點數(shù)乘法器;文獻[8]利用低精度浮點數(shù)來減小MP3解碼時的內存損耗。

        本文提出了一種非精確浮點數(shù)乘法器的算法設計,同時將該算法應用于高動態(tài)范圍圖片的圖像處理中,并將結果與精確浮點數(shù)乘法器的應用結果進行對比。文章內容分布如下:在第1節(jié)中,首先簡單介紹了浮點數(shù)構成及精確的浮點數(shù)乘法器的結構;在第2節(jié)中提出了非精確乘法器的設計方法;在第3節(jié)中將該非精確乘法器應用到高動態(tài)范圍圖片中;最后總結了該設計算法。

        1 背景簡介

        1.1 浮點數(shù)表示方法

        在算數(shù)運算中,數(shù)據(jù)的表示方法有兩個,定點數(shù)和浮點數(shù)。定點數(shù)可以表示以0為中心的一定范圍的正負整數(shù),由于定點數(shù)小數(shù)點固定,不能表示太大動態(tài)范圍的數(shù),同時也不能表示過大或過小的數(shù),此時浮點數(shù)的優(yōu)勢就體現(xiàn)了出來,它可以在不增加位數(shù)的前提下擴展數(shù)據(jù)的動態(tài)范圍。

        在IEEE 754-2008標準中,浮點數(shù)是一個以3個量表示的二進制位串(如圖1所示),該位串分為3個部分:符號位部分、指數(shù)位部分和尾數(shù)位部分。

        圖1 IEEE 754-2008浮點數(shù)格式

        浮點數(shù)的標準表達式為:

        其中,S為符號位,當S=0時表示該浮點數(shù)是一個正值,當 S=1時表示該浮點數(shù)是一個負值;E為指數(shù)位,bias表示偏移量,對于單精度bias=127,雙精度bias=1023,則E-bias既可為正數(shù)也可為負數(shù);M為尾數(shù)位,對于規(guī)格化的尾數(shù),存儲時默認省去小數(shù)點前的1,則對于非零尾數(shù),尾數(shù)值為1.M。

        1.2 精確浮點數(shù)乘法器

        最初的浮點數(shù)乘法器是依靠軟件實現(xiàn)的,但隨著超大規(guī)模集成技術的發(fā)展以及乘法器對計算速度要求的提高,乘法運算逐漸變成一個硬件的部件,浮點數(shù)乘法的基本原理是將相乘兩數(shù)的指數(shù)和作為乘積的指數(shù),相乘兩數(shù)尾數(shù)的積作為乘積的尾數(shù),相乘兩數(shù)的符號位異或作為乘積符號位。

        精確的浮點數(shù)乘法器如圖2所示,默認這里兩個操作數(shù)都已規(guī)格化,如若沒有,則首先需將輸入的操作數(shù)規(guī)格化。然后從兩操作數(shù)中分別提取每個操作數(shù)的符號位、指數(shù)位及尾數(shù)位,并將尾數(shù)位補充省略的第一位1。浮點數(shù)的乘法只要包括兩個運算:指數(shù)的加法和尾數(shù)的乘法,這兩運算結束后就是將結果進行規(guī)格化,生成符合IEEE 754-2008標準的結果。

        2 非精確浮點數(shù)乘法器設計

        非精確乘法器的設計是基于圖2所示的精確計算的算法級設計,主要是將非精確定點數(shù)乘法器運用到浮點數(shù)尾數(shù)乘法設計中,同時考慮到尾數(shù)乘積已是非精確結果,舍入單元及規(guī)格化也進行了簡化。

        圖2 精確浮點數(shù)乘法器結構

        2.1 尾數(shù)乘法器

        尾數(shù)乘法器就是計算兩個浮點數(shù)尾數(shù)部分的乘積,也就是兩個無符號定點數(shù)的乘法,主要包括3個部分:部分積的生成、部分積壓縮及最終結果的生成。本文部分積通過非精確 Booth編碼[9]生成,部分積壓縮通過非精確 4-2壓縮器[10]及 Wallace樹[11]完成。對于單精度浮點數(shù),尾數(shù)的乘法是無符號定點 24×24位的乘法器,修正 Booth編碼產(chǎn)生了 13個部分積;4-2壓縮器、Wallace樹以及進位存儲加法器將部分積壓縮成2個操作數(shù);最后48位和進位采用快速超前進位加法器相加。

        非精確 Booth編碼是在修正 Booth編碼算法上改進的,修正 Booth編碼算法的門級電路如圖3(a)所示,式(2)給出了部分積(Partial Products,PP)與輸入之間的關系。非精確Booth編碼的門級電路如圖3(b)所示,式(3)給出了部分積與輸入之間的關系。

        圖3 編碼門級電路

        部分積的壓縮通過4-2壓縮器實現(xiàn),非精確壓縮器是在精確4-2壓縮器上改進得到,精確4-2壓縮器的實現(xiàn)方法如圖4(a)所示,式(4)~式(6)給出了壓縮結果與部分積輸入之間的關系。非精確4-2壓縮器的實現(xiàn)方法如圖4(b)所示,式(7)~式(8)給出了壓縮結果與部分積輸入之間的關系。

        圖4 4-2壓縮器門級電路

        以單精度浮點數(shù)為例,非精確尾數(shù)乘法器的Wallace樹結構如圖5所示,由于最終標準化后只取乘積的前24位,所以進行 24×24乘法時 0~23位的計算直接舍去,24~42位進行非精確計算,43~47位進行精確計算,圖5中實線框中進行非精確Booth編碼及非精確壓縮,虛線框進行精確Booth編碼及精確壓縮。

        圖5 非精確24×24乘法器

        2.2 舍入單元

        舍入單元的作用是在結果被返回放回浮點格式時,將多出來的位舍棄,使得有效數(shù)據(jù)的位數(shù)保持在固定的位數(shù)范圍內。在精確浮點數(shù)乘法器中,IEEE列出了4種不同的舍入方法:舍入到最近(Round To Nearest,RTN)、朝正無窮大方向舍入(Round To Positive Infinity,RTPI)、朝負無窮大方向舍入(Round To Negative Infinity,RTNI)、朝0方向舍入(Round To Zero,RTZ)。在非精確設計中,乘積結果已是非精確的,舍入方法的選擇對算法沒有太大意義,所以在非精確浮點數(shù)乘法器中,舍入單元將不再考慮。

        2.3 非精確浮點數(shù)乘法器結構

        基于以上分析,非精確浮點數(shù)乘法器可以通過設計非精確無符號定點數(shù)乘法器、簡化規(guī)格化處理及省略舍入單元來實現(xiàn),具體結構如圖6所示。

        圖6 非精確浮點數(shù)乘法器結構

        3 圖像處理應用

        很多非精確浮點數(shù)乘法都應用于圖像處理中,OpenEXR是由 Industrial Light and Magic開發(fā)的高動態(tài)范圍圖片(High Dynamic-Range,HDR)的文件格式,它支持16位及32位浮點。本文采用高動態(tài)范圍圖片來驗證該非精確浮點數(shù)乘法器的有效性。高動態(tài)范圍可視區(qū)分度檢測(High Dynamic Range Visible Difference Predictor,HDR-VDP)是度量兩幅圖片區(qū)別的方法,它可以檢測兩幅圖片的可視區(qū)別。圖7、圖8分別為精確、非精確浮點數(shù)乘法生成圖片,兩幅圖片的區(qū)別檢測圖如圖9所示。

        圖7 精確浮點數(shù)乘法生成的圖片

        圖8 非精確浮點數(shù)乘法生成的圖片

        HDR-VDP中整體可視檢測中定義了兩個度量方法,一個為 P_det,定義為兩幅圖片的可視區(qū)別概率,它的范圍為0~1,數(shù)值越大,說明兩圖片的區(qū)別人眼越容易察覺;另一度量方法是Q_MOS,它定義為圖片的平均觀測質量,它的范圍是 0~100,數(shù)值越大說明圖片質量越好。經(jīng)測量本文設計的非精確浮點數(shù)乘法器的兩個度量值分別為:度量值 P_det表明兩幅圖片的差異不太容易被檢測,度量值Q_MOS表明兩幅圖片質量很好。

        圖9 HDR-VDP檢測圖片

        4 結論

        本文主要采用非精確定點尾數(shù)乘法器設計非精確浮點數(shù)乘法器,并將該乘法器運用到圖像處理中,結果表明本文所設計的非精確浮點數(shù)乘法器具有很好的性能。

        [1]PALEM K,INGAMNENI A.Ten years of building brokenchips:the physics and engineeringofinexactcomputing[J]. ACMTrans.Embedded Computing Systems,2013,12(2),87: 1-23.

        [2]LINGAMNENI A,MUNTIMADUGU A,ENZ C,et al.Algorithmic methodologies for ultra-efficient inexact architectures for sustaining technology scaling[J].Proc.ACM Int.Conf. Computing Frontiers,2012:3-12.

        [3]YANG Z,JAIN A,LIANG J,et al.Approximate XOR XNOR-based Adders for inexact computing[J].Proc.13rd IEEE Conf.Nanotechnol.(IEEE-NANO),2013:690-693.

        [4]Liu Weiqiang,Chen Linbin,Wang Chenghua,et al.Design and analysis of inexact floating-point adders[J].IEEE Transactions on Computers,2016,65(1):308-314.

        [5]Liu Weiqiang,Chen Linbin,WANG C,et al.Inexact Floating-Point Adder for Dynamic Image Processing[J].Proceedings of the 14th IEEEInternational Conference on Nanotechnology Toronto,Canada,2014.

        [6]TONG J Y,NAGLE D,RUTENBAR R.Reducing powerbyoptimizingthe necessary precision/rangeof floating-point arithmetic[J].IEEE Trans.Very Large Scale Integr.Syst. 2000,8:273-286.

        [7]GUPTA A,MANDAVALLI S,MOONEY V,et al.Low power probabilistic floatingpoint multiplier design[J].Proc.IEEE Comput.Soc.Annu.Symp.VLSI,2011:182-187.

        [8]EILERT J,EHLIAR A,LIU D.Using low precision floating pointnumbersto reduce memory costforMP3 decoding[J].Proc.6thIEEE Workshop on Multimedia Signal Processing,2004:119-122.

        [9]YEH W C,JEN C W.High-speed booth encoded parallel multiplier design[J].IEEE Trans.Computers,2000,49(7): 692-701.

        [10]Amir Momeni,Jie Han,Paolo Montuschi,et al.Design and analysis of approximate compressor for multilication[J]. IEEE Trans.Computers,2015,64(4):984-994.

        [11]MILLAR B,MADRID P E,SWARTZLANDER E E.A fast hybrid multiplier combining Booth and Wallace/Dadda algorithms[J].Proceedings of the 35th MidwestSymposium on Circuits and Systems,1992,1(8):158-165.

        Design and analysis of inexact floating-point multiplier

        Yin Peipei
        (Computer Center,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)

        With the increasing extending the scope of digital operation and demands of digital precision,the study of floating-point (FP)arithmetic has become more important.But the complex hardware,high power consumption and long delay of traditional floating-point arithmetic unit restrict the performance of floating-point arithmetic.An inexact circuit offers a promising approach to significantly reduce both dynamic and static power dissipation for error-tolerant applications.To solve the above problems,the inexact floating-point multiplier is proposed by approximately designing a mantissa multiplier.High dynamic range(HDR)images are processed using the proposed inexact floating-point multiplier to show the validity of the inexact design,comparison results show that the proposed inexact floating-point multiplier has a good property.

        floating-point;inexact;multiplier;HDR

        TP332.2

        A

        10.16157/j.issn.0258-7998.2016.03.011

        尹培培.非精確浮點數(shù)乘法器設計[J].電子技術應用,2016,42(3):38-41,46.

        英文引用格式:Yin Peipei.Design and analysis of inexact floating-point multiplier[J].Application of Electronic Technique,2016,42 (3):38-41,46.

        2015-12-23)

        尹培培(1988-),通信作者,女,博士研究生,助理工程師,主要研究方向:非精確計算,E-mail:ppyin0223@126.com。

        猜你喜歡
        浮點數(shù)乘法器尾數(shù)
        “改寫”與“省略”三不同
        四種Python均勻浮點數(shù)生成方法
        電腦報(2021年11期)2021-07-01 08:26:31
        連續(xù)自然數(shù)及乘積的尾數(shù)和奇偶性的分析
        2019年度下半年《啟迪與智慧》上下半月刊、《幽默與笑話》上下半月刊、《拳擊與格斗》上半月刊抽大獎中獎結果
        在C語言中雙精度浮點數(shù)線性化相等比較的研究
        船電技術(2017年1期)2017-10-13 04:23:24
        基于FPGA的流水線單精度浮點數(shù)乘法器設計*
        有趣的九九乘法表
        乘法器模塊在FPGA中的實現(xiàn)
        基于FPGA的整數(shù)開方運算
        微處理機(2012年3期)2012-07-25 03:21:16
        基于FPGA 的數(shù)字乘法器性能比較*
        電子器件(2011年6期)2011-08-09 08:07:22
        欧美丰满熟妇bbb久久久| 少妇内射视频播放舔大片| 欧美与黑人午夜性猛交久久久| 精品人体无码一区二区三区| 久久久精品久久波多野结衣av| 亚洲国产高清在线观看视频| 91精品欧美综合在线观看| 小黄片免费在线播放观看| 精品国产三级a在线观看不卡| 蜜臀av无码人妻精品| 特级av毛片免费观看| 嫩草影院未满十八岁禁止入内| 欧美成人a在线网站| 国产成年无码AⅤ片日日爱| 综合激情中文字幕一区二区 | 国产久久久自拍视频在线观看| gg55gg国产成人影院| 成人艳情一二三区| 国产乱人激情h在线观看| 日韩一欧美内射在线观看| 亚洲国产精品午夜电影| 熟女高潮av一区二区| 极品老师腿张开粉嫩小泬| 亚洲依依成人亚洲社区| 久国产精品久久精品国产四虎| 日本黄色影院一区二区免费看 | 无码一区二区三区网站| 国产成人色污在线观看| 国产农村妇女精品一区| 国语精品一区二区三区| 自拍偷自拍亚洲精品播放| 偷拍自拍一区二区三区| 免费观看在线视频播放| 亚洲三区在线观看内射后入| 成人亚洲性情网站www在线观看 | 亚洲最大不卡av网站| 少妇愉情理伦片丰满丰满| 国产精品无码成人午夜电影| 亚洲人免费| 亚洲日韩AV无码美腿丝袜| 天堂av国产一区二区熟女人妻|