亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于時序的加/減法器組優(yōu)化方法

        2017-10-21 22:47:31胡平科余建德
        電腦知識與技術 2017年18期

        胡平科 余建德

        摘要:針對現場可編程門陣列(Field Programmable Gate Array,FPGA)電路模塊中混合加/減法器組的時序優(yōu)化問題,本文提出了一種在寄存器傳輸級(Register-Transfer-Level,RTL)綜合優(yōu)化階段考慮加/減法器的輸入端口數據位時延的正負矩陣優(yōu)化方法,有效地利用了FPGA芯片中的進位鏈結構。在FPGA公司軟件工具平臺上的算法實現和芯片測試結果顯示,這種正負矩陣優(yōu)化方法相比于傳統(tǒng)方法取得了很好的時序優(yōu)化效果。

        關鍵詞:混合加/減法器組;RTL綜合;輸入端口數據位時延;正負矩陣

        中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2017)18-0221-02

        近年來云計算、人工智能等方面的技術越來越火熱,在性能、上市時間、成本、穩(wěn)定性和長期維護方面擁有先天優(yōu)勢的FPGA也備受關注。

        EDA(Electronic design automation)工具作為FPGA電路設計的核心工具,采用自頂向下的設計方法。使用行為級描述語言(verilog HDL或VHDL)將用戶的需求轉換成EDA工具的輸入,再通過EDA工具的RTL綜合優(yōu)化、門級優(yōu)化、布局布線、仿真與調試等步驟,完成整個電路模塊的設計。

        針對加/減法器的優(yōu)化是EDA工具在RTL綜合優(yōu)化過程中不可或缺的一部分。目前已有的針對加法器優(yōu)化的方法主要分兩類:一類是針對兩輸入端口加法器的內部實現進行優(yōu)化,如超前進位加法器、進位保留加法器、進位選擇加法器等,通過優(yōu)化進位鏈上的結構來達到優(yōu)化時序的目的;另一類是針對多輸入端口加法器的輸入端口進行優(yōu)化,如樹型加法、Sklansk加法、Kogge-Stone加法、Brent-Kung加法等,通過樹型化的思想來減少路徑上的延時。本文針對電路模塊中混合加/減法器組的時序問題,提出了一種基于輸入端口數據位時延對加/減法器進行優(yōu)化的方法。它通過考慮一組可重構的加/減法器中的每一個輸入端口數據位的時延(即數據的到達時間),重新構建一組加/減法器,并替代原加/減法器組,優(yōu)化電路模塊的時序,使從加/減法器組的輸入到輸出的最大延時最小。

        1加/減法器優(yōu)化時的時序問題

        在RTL電路綜合過程中,對一組加/減法器進行優(yōu)化是一個很常見的問題。通常對一組加/減法器的優(yōu)化方法是,將一組加/減法器樹型化,使得邏輯電路的物理級數最小化,達到優(yōu)化RTL邏輯電路的目標。例如,有一組鏈狀的加/減法器“al+a2-a3-a4”樹型化后如式1所示:

        (a1+a2)-(a3+a4) (1)

        然而一個物理級數最少的電路在時序上卻不一定是最好的。例如,式1中若‘al+a2計算出結果時,a3的數據已經到達,但a4的數據仍未到達。則此時先用‘al+a2的結果減去a3,然后再和a4相減,電路級數會多一級,但時序反而變好。如式2所示:

        ((a1+a2)-a3)-a4 (2)

        更進一步地,如果式2中的輸入端都為6位,a4[2:0]的數據比a3[2:0]先到達;a3[5:3]的數據比a4[5:3]先到達。此時式2的時序也將不再是最好的。其最好時序的運算順序如式3所示:

        ((al+a2)-{a3[5:3],a4[2:0]})-{a4[5:3],a3[2:0]} (3)

        由此可見,在加/減法器樹型化思想的基礎之上,需要一種基于輸入端口數據位時延的加/減法器的化優(yōu)化方法,考慮每一位輸入的時延對RTL電路時序的影響,最大化地優(yōu)化RTL電路中的時序。

        2基于時延的加法器進行優(yōu)化

        該優(yōu)化過程是將一組加/減法器的所有輸入端口數據位放人正值和負值兩個矩陣上;然后對這兩個矩陣進行一些優(yōu)化處理(如優(yōu)化連續(xù)相同值、抵消正負值等);最后根據輸入端口數據位的時延排序并生成多個兩輸入端加法器。其中,輸入端口數據位矩陣中的一行相當于是加法器的一個輸入端口,且高位在前;而它的列則包含了同一位置上的所有輸入端口數據位。其具體實現步驟如算法2-1所示。

        3實驗結果分析

        本文中提到的所有算法都使用C++程序設計語言實現。為了對比,同時實現了基于最短路徑的樹型加/減法器優(yōu)化算法和基于輸入端口數據位時延的加/減法器優(yōu)化算法。算法在上海安路信息科技有限公司的商用FPGA軟件工具TangDynas-ty3.0(TD3.0)上進行測試。為了測試本文中提出的算法在實際應用中的可適應性,考慮實際應用中的各種可能的情況,在本次實驗中增加了測試用例的隨機性。從兩個方面對算法的優(yōu)化結果進行對比:

        一方面,加/減法器個數(num=4)不變;所有輸入端口的位寬在指定的范圍([1,bits])內隨機生成,bits取值范圍為[4,128];輸入端口的時序約束在[1ns,12ns]內隨機生成;測試隨著指定的位寬范圍(即bits值)增大時,其時序優(yōu)化結果將如何變化。其最終的優(yōu)化結果如圖1所示。

        另一方面,加/減法器的所有輸入端口的位寬在指定的位寬范圍([1,bits])內隨機生成,取bits=8;輸入端口的時序約束在[1ns,10ns]內隨機生成;測試隨著加/減法個數(hum)在[4,128]范圍內增長時,其時序優(yōu)化結果將如何變化。其最終的優(yōu)化結果如圖2所示。

        上述兩個方面的測試是在上海安路信息科技有限公司的FPGA軟件平臺TD3.0下完成的。從圖1和圖2中可以看出,slack(Timing)折線基本都在slack(Tree)折線之上,這表明在不同輸入端口的位寬或者不同加/減法器個數的情況下,基于輸入端口數據位時延的加/減法器優(yōu)化算法優(yōu)化后的最小slack普遍都要大于基于最短路徑的樹型加/減法器優(yōu)化算法優(yōu)化后的最小slack;而slack值越大說明電路模塊的時序優(yōu)化得越好。因此,基于輸入端口數據位時延的加/減法器優(yōu)化能得到更好的時序電路。

        4結束語

        本文針對EDA工具中的RTL綜合優(yōu)化問題展開研究。在加/減法器的時序優(yōu)化問題上,做出了以下貢獻。一方面,與針對單個加減法內部進行優(yōu)化的超前進位加法器、進位保留加法器、進位選擇加法器等優(yōu)化方法不同,本文提出的優(yōu)化方法是針對相關聯(lián)的一組加減法器進行優(yōu)化。另一方面,與一組加減法器進行輸入端口重新組合的樹型加法、Sklansk加法、Kogge-Stone加法、Brent-Kung加法等方法不同,本文提出的優(yōu)化方法是基于所有輸入端口中的每一個數據輸入位時序來驅動優(yōu)化的,同時利用了FPGA器件中的進位鏈延時短的優(yōu)點。在FP-GA公司軟件工具平臺上的算法實現和芯片測試結果顯示,這種正負矩陣優(yōu)化方法相比于傳統(tǒng)方法取得了很好的時序優(yōu)化效果。endprint

        麻豆AV无码久久精品蜜桃久久| 婷婷色婷婷开心五月四房播播| 亚洲伊人成综合网| 国产伦精品一区二区三区妓女| 国产精品久久久久电影网| 免费一区二区三区视频狠狠| 一区二区三区av资源网| 亚洲成av人片女在线观看| 在线观看免费人成视频| 亚州AV无码乱码精品国产| 亚洲大片一区二区三区四区| 手机看片自拍偷拍福利| 国产精品免费无遮挡无码永久视频| 国产精品成人国产乱| 国产精彩视频| 国产av三级精品车模| 国产精品视频永久免费播放| 亚洲av日韩av综合| 九九99久久精品午夜剧场免费| 免费国产不卡在线观看| 风情韵味人妻hd| 免费夜色污私人影院在线观看| 免费在线观看一区二区| av免费观看网站大全| 国产成人午夜无码电影在线观看 | 国产精品久久久久久久成人午夜 | 男女调情视频在线观看| 国产欧美日韩精品专区| 久久99欧美| 丰满人妻被猛烈进入中文字幕护士| 超碰国产精品久久国产精品99| 亚洲av永久无码国产精品久久 | 亚洲一区二区三区av色婷婷| 91精品亚洲成人一区二区三区| 青草视频在线播放| 亚洲熟女av中文字幕网站| 国产精品女主播在线播放| 久久天天躁狠狠躁夜夜躁2014| 五月婷一本到五月天| 亚洲在中文字幕乱码熟女| 亚洲中字幕日产av片在线|