亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于PCIe總線的多路實時傳輸系統(tǒng)設計*

        2015-12-07 09:22:03楊燦美杜學亮
        電子技術應用 2015年2期
        關鍵詞:系統(tǒng)設計

        高 俊,楊燦美,杜學亮

        (1.中國科學技術大學 信息科學技術學院,安徽 合肥230026;2.中國科學院自動化研究所,北京100190)

        基于PCIe總線的多路實時傳輸系統(tǒng)設計*

        高俊1,楊燦美1,杜學亮2

        (1.中國科學技術大學 信息科學技術學院,安徽 合肥230026;2.中國科學院自動化研究所,北京100190)

        針對多路圖像數據的傳輸及處理帶寬需求,使用Virtex-6 FPGA設計實現了基于PCIe總線的多路實時傳輸系統(tǒng)。該系統(tǒng)主要包括仲裁控制多設備對DDR3的訪問,采用PCIe Bus Master DMA方式實現與PC之間的高速傳輸,以及對全雙工傳輸過程中存在的擁堵問題進行優(yōu)化。實驗結果表明,該實時傳輸系統(tǒng)最高的傳輸速率可以達到單工寫1 632 MB/s,讀1 557 MB/s,全雙工寫1 478 MB/s,讀1 439 MB/s,并且性能穩(wěn)定,完全滿足多路圖像采集后的高速傳輸處理需求。

        PCIe;實時傳輸;仲裁;DMA

        0 引言

        利用PCIe總線的高帶寬優(yōu)勢,設計了一種基于PCIe總線的多路實時傳輸系統(tǒng),采用 Bus Master DMA方式實現與PC之間的高速傳輸,以滿足多路圖像數據實時采集后傳輸和處理的高帶寬需求。

        1 系統(tǒng)結構及工作原理

        基于可編程邏輯器件FPGA的設計相比 ASIC具有更好的靈活性和可配置性,因此本文所設計的基于PCIe總線的多路實時傳輸系統(tǒng)采用了 Xilinx XC6VLX240T FPGA來實現。本系統(tǒng)主要包括 PCI Express Core(EP)、DDR3 MIG模塊、PCIe Bus Master DMA(BMD)模塊以及DDR3讀寫控制模塊四部分,結構如圖1所示。

        圖1 系統(tǒng)結構圖

        本系統(tǒng)的主要工作原理是由DDR3緩存相機采集PC處理后的圖像數據,通過PCIe總線實現與PC之間高速數據傳輸。兩路相機采集后的圖像數據經相機接口模塊前期處理后傳入DDR3讀寫控制模塊,由MIG模塊存入DDR3,然后DDR3中的數據被讀入發(fā)送緩存,同時PCIe BMD模塊發(fā)送MSI報文給PC使其配置BMD相應寄存器,BMD模塊會讀取發(fā)送緩存中的數據組成存儲器寫請求報文經PCIe總線傳給PC。對兩路圖像數據進行基于對象的特征提取后,PC配置BMD相應寄存器使其發(fā)送存儲器讀請求報文,然后PC端將處理后的圖像數據組成CPLD數據包發(fā)向PCIe EP Core,BMD模塊會將收到的 CPLD TLP中的有效數據存入接收緩存,最后DDR3讀寫控制模塊讀取接收緩存中的數據,存入DDR3以待DVI接口模塊讀取輸出顯示。結構圖中FIFO除了緩存的作用外主要是解決位寬及跨時鐘域的問題[3],而DMA FIFO接口模塊的作用主要是負責 BMD模塊與FIFO間的信號連接及控制。

        2 主要模塊設計

        本系統(tǒng)的設計主要是 DDR3讀寫控制模塊和 PCIe BMD模塊的設計,而 PCI Express Core(EP)和 MIG可以通過 Xilinx CORE Generator按需求的配置生成,其中PCIe配置成×4、gen2,利用 Virtex6集成的PCIe IP實現,MIG配置成DDR3控制器、400 MHz。

        2.1DDR3讀寫控制模塊

        DDR3讀寫控制模塊由讀寫控制模塊和仲裁模塊兩部分組成,如圖2所示。

        圖2 DDR3讀寫控制模塊結構及仲裁原理圖

        讀寫控制模塊通過UI接口與MIG連接,按照MIG的時序要求進行讀寫操作。并且為了讀寫管理方便,將DDR3按容量劃分為兩份,分別用于存儲采集的兩路源圖像數據和經PC處理后用于輸出的圖像數據。

        (2)低起動電流,高起動轉矩:起動轉矩達到額定轉矩的150%時,起動電流僅為額定電流的30%;過載能力強;避免對電網的沖擊;

        仲裁模塊主要負責多個設備訪問DDR3時的總線切換。由于本系統(tǒng)不同設備讀寫DDR3所用時間不同,為避免采用輪詢機制所帶來的帶寬利用率的降低,采取仲裁機制,負責對各個設備的訪問請求做出應答和總線的切換,效率更高[4],原理如圖2所示。設計時,為避免幾個設備同時請求帶來不確定性,仲裁模塊采用Round Robin仲裁模式,使得各設備能公平得到響應機會。綜合考慮帶寬利用率和實時性,將十行以內圖像像素點的讀寫時間作為時間寬度,保證本系統(tǒng)的高效可靠。

        2.2PCIe BMD模塊

        PCIe BMD模塊主要由三部分構成,包括DMA控制/狀態(tài)模塊、發(fā)送模塊以及接收模塊,結構如圖3所示。

        圖3 PCIe BMD結構

        2.2.1DMA控制/狀態(tài)模塊

        DMA控制/狀態(tài)模塊包括控制/狀態(tài)寄存器和控制模塊??刂?狀態(tài)寄存器主要寄存BMD模塊的控制及狀態(tài)信息。PC端采用數據包的形式將配置需求通過PCIe總線傳輸到EP端,BMD接收模塊識別配置數據包(有效數據大小為1DW的存儲器寫請求TLP),并根據TLP的地址段將數據寫入相應的控制寄存器。PC端也可以發(fā)送讀控制/狀態(tài)寄存器的請求,接收模塊識別到該類數據包(請求數據大小為1DW的存儲器讀請求TLP)后,產生CPLD請求,發(fā)送模塊將根據該TLP的地址讀取對應控制/狀態(tài)寄存器的值,生成CPLD TLP發(fā)向PC端。

        控制模塊根據控制/狀態(tài)寄存器的配置值發(fā)送相應的控制信號給發(fā)送及接收模塊,還與DDR3讀寫控制模塊相連,控制原圖像數據的讀取和處理后圖像數據的寫入,并配合讀取操作發(fā)送MSI請求[5],使PC配置BMD模塊相應的控制寄存器以進行存儲器寫請求TLP的發(fā)送。

        2.2.2發(fā)送/接收模塊

        發(fā)送模塊作為BMD模塊的發(fā)送部分,主要負責在接收模塊收到讀寫控制/狀態(tài)寄存器的請求后完成報文的發(fā)送,在發(fā)送模塊收到MSI請求后MSI TLP的發(fā)送,以及根據PC端所配置的寄存器參數進行存儲器讀/寫請求TLP的發(fā)送,其中存儲器寫請求TLP的有效數據來自TX FIFO。

        接收模塊主要負責接收各種數據包并作出相應操作:當收到配置數據包時,將有效數據寫入對應控制寄存器;當收到讀控制/狀態(tài)寄存器的請求,通知發(fā)送模塊讀取對應控制/狀態(tài)寄存器值組成 CPLD TLP發(fā)向 PC端;當收到CPLD TLP,其中的數據段就是發(fā)送模塊發(fā)送的存儲器讀請求TLP所請求的數據,然后對這些數據進行校驗并讀入RX FIFO等待存入DDR3。

        2.2.3PCIe BMD全雙工模式

        對于本系統(tǒng)與PC之間的數據傳輸,單一時間段內只進行讀或者寫比較簡單,但為了滿足系統(tǒng)需要以及傳輸效率的提高,大部分情況下,需要讀寫數據同時進行。對于發(fā)送模塊而言,則需要合理安排存儲器寫請求TLP和存儲器讀請求TLP的發(fā)送,這里采用動態(tài)加權循環(huán)調度算法(Dynamic Weighted Round Robin,DWRR)。普通的加權循環(huán)調度算法(Weighted Round Robin,WRR)是通過設置兩個計數器分別記錄當前寫請求和讀請求已經發(fā)送的個數,并根據傳輸特性給兩者配置相應的權重值。傳輸開始后,當某一請求次數達到它的權重值,則將該請求的計數器清零,再跳轉到另一請求,如此循環(huán)往復直到傳輸結束。由于讀請求的周期數要遠小于寫請求,如果讀寫請求的權值設置好后就保持不變,讀請求的過快發(fā)送會快速消耗PCIe EP CORE的發(fā)送緩存從而造成擁堵,使發(fā)送模塊長期處于等待狀態(tài),降低傳輸速率。本系統(tǒng)根據這一特性對WRR算法進行了優(yōu)化,開始階段由于發(fā)送緩存為空,為了充分利用總線,將讀請求權值設為發(fā)送緩存大小3/4,寫請求設為其1/4,優(yōu)先發(fā)送讀請求,再發(fā)送寫請求,然后根據寫請求個數達到權值后發(fā)送緩存的可用數設置讀請求的權值,當發(fā)送緩存的可用數小于寫請求權值一半時,重新設讀寫請求權值都為1,使讀寫請求逐個間隔發(fā)送直到讀請求優(yōu)先完成,再發(fā)送剩余的寫請求。在這過程中讀寫請求權重值根據發(fā)送緩存的可用數動態(tài)變化,調整讀寫請求的發(fā)送組合,在保證讀取速率的情況下盡量減少了擁堵時間,從而提高整體傳輸速率。

        3 設計實現及測試驗證

        本設計采用 Xilinx XC6VLX240T FPGA定制開發(fā)板作為開發(fā)平臺,并結合對應的驅動程序和處理程序進行測試驗證。

        3.1設計實現

        整個設計采用 Xilinx ISE14.7作為 FPGA的開發(fā)工具,利用Verilog HDL進行程序設計。根據圖1的結構圖在頂層模塊中例化各個模塊,并進行相應的優(yōu)化。為了滿足測試驗證的需求,頂層模塊中還需要例化 Chip-Scope測試核。設計完成后,通過ISE綜合、映射、布局布線,最后生成可供下載的 bit文件。綜合后整個設計占用Register資源 9 317(3%),占用 LUT資源 11 214(7%),占用Bram資源12(2%)。

        3.2測試驗證

        將開發(fā)板與 PC主板的 PCIe插槽相連接,下載 bit文件,結合 ChipScope軟件進行測試。兩路相機參數同為1 920×1 080,60 FPS,DVI顯示參數也為1 920×1 080,60 FPS。DDR3 SDRAM時鐘400 MHz,物理位寬64 bit,讀寫控制時鐘200 MHz,數據位寬256 bit。PCIe配置成×4,gen2。理論上,DDR3的讀寫速率和 PCIe的傳輸速率滿足多路圖像的采集和輸出要求。根據仲裁模塊的設計,測試時間寬度分別為 1、2、4、8行圖像像素點讀寫時間下的性能,其中7.5 KB對應一行圖像像素點的數據量。PCIe BMD單工情況下的測試結果如表1所示,并將表1的測試結果換算為 gen1×8模式,與文獻[6]的結果進行對比,如圖4所示。

        表1 PCIe BMD單工傳輸速率

        圖4 DMA單工傳輸測試結果

        對比測試結果,文獻[6]在 gen1×8模式時的最高傳輸速率為寫1 311 MB/s,讀1 002 MB/s,而本傳輸系統(tǒng)在相同模式下能達到的最高傳輸速率為寫 1 632 MB/s,讀1 557 MB/s,相比文獻[6]寫入速率提高 24.5%,讀取速率提高 55.4%,并且表現出傳輸數據量越大,傳輸速率越高,超過60 KB之后趨于穩(wěn)定。如果PCIe BMD一直工作在單工模式,是不能滿足每秒寫入和讀取900 MB數據量的要求,因此本系統(tǒng)中PCIe BMD只在每幀圖像的開始和結束像素行傳輸時工作在單工模式,其余時間工作在全雙工模式。對于PCIe BMD的全雙工方式,發(fā)送模塊采用WRR算法和DWRR算法的測試結果如圖5所示。

        圖5 PCIe BMD全雙工傳輸測試結果

        對比該測試結果,可以看出對于不同數據量的傳輸,采用DWRR的傳輸速率都高于WRR,寫入速率最大提高3.4%,讀取速率最大提高9.6%,最高傳輸速率能達到寫1 478 MB/s,讀1 438 MB/s,保證了圖像數據傳輸到PC后有充足的時間進行運算處理,滿足本系統(tǒng)的傳輸需求。根據PCIe BMD單雙工測試結果,綜合考慮整個系統(tǒng)的傳輸效率、總線切換頻率及實時性,傳輸系統(tǒng)仲裁模塊中的時間寬度設為4行圖像像素點的讀寫時間為佳。

        4 結論

        大數據量采集后的高速傳輸對于一個采集系統(tǒng)而言至關重要,高性能的傳輸系統(tǒng)能為大數據量的存儲、處理等后期各種操作提供保障。本文設計了一種基于PCIe總線的多路實時傳輸處理系統(tǒng),并且通過FPGA驗證了該系統(tǒng)的可行性。實際測試表明該系統(tǒng)能達到單工寫1 632 MB/s、讀1 557 MB/s和全雙工寫 1 478 MB/s、讀 1 438 MB/s的傳輸速率,完全滿足本系統(tǒng)高速數據傳輸的需求,并且對于其他高速傳輸系統(tǒng)的設計有一定的借鑒作用。

        [1]PCI express base specification revision 2.1[S].PCI-SIG.,Mar 4,2009.

        [2]KAVIANIPOUR H,BOHM C.High performance FPGA-based scatter/gather DMA interface for PCIe[C].IEEE NSS/MIC,2012,N19-3,1517-1520.

        [3]LI H,LIU Y A,YUAN D M,et al.A wrapper of PCI express with FIFO interfaces based on FPGA[C].IEEE ICICEE,2012,145,525-529.

        [4]樊博,王延杰,孫宏海,等.FPGA實現高速實時多端口圖像處理系統(tǒng)的研究[J].液晶與顯示,2013,28(4):620-625.

        [5]雷雨,任國強,孫健,等.基于 PCIE的高速光纖圖像實時采集系統(tǒng)設計[J].電子技術應用,2013,39(10):136-138.

        [6]侯杭呈,王憶文,李輝.一種基于PCI Express總線的DMA高速傳輸系統(tǒng)[J].微電子學,2013,43(3):383-386.

        Design of multi-channel real-time transmission system based on PCIe bus

        Gao Jun1,Yang Canmei1,Du Xueliang2
        (1.School of Information Science and Technology,University of Science and Technology of China,Hefei 230026,China;2.Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China)

        Acorrding to the requirements of transmission and processing bandwidth of multi-channel image data,a multi-channel real-time transmission system based on PCIe bus which uses Virtex-6 FPGA is designed.The system includes a arbitration controling multiple devices to access DDR3,a high-speed transmission way to PC which uses PCIe Bus Master DMA mode.And the congestion problems exist in the full-duplex transmission are optimized.Experimental results show that the maximum transmission rate of this real-time transmission system can reach 1 632 MB/s of writing,1 557 MB/s of reading in simplex mode and 1 478 MB/s of writing,1 439 MB/s of reading in full duplex mode,which fully meets the needs of high-speed transmission and processing of multi-channel image data after acquisition with stable performance.

        PCIe;real-time transmission;arbitration;DMA

        TN919.64

        A

        0258-7998(2015)02-0065-03

        10.16157/j.issn.0258-7998.2015.02.014

        中國科學院戰(zhàn)略性先導科技專項(XDA06010402)

        2014-08-29)

        高俊(1990-),男,碩士研究生,主要研究方向:數字SoC、高速互聯傳輸。

        楊燦美(1965-),男,博士,研究員,主要研究方向:通信數字基帶系統(tǒng)設計、低功耗與高密度SoC架構設計。

        杜學亮(1982-),男,博士,高級工程師,主要研究方向:SoC芯片設計。

        猜你喜歡
        系統(tǒng)設計
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        何為設計的守護之道?
        現代裝飾(2020年7期)2020-07-27 01:27:42
        《豐收的喜悅展示設計》
        流行色(2020年1期)2020-04-28 11:16:38
        基于PowerPC+FPGA顯示系統(tǒng)
        半沸制皂系統(tǒng)(下)
        瞞天過海——仿生設計萌到家
        藝術啟蒙(2018年7期)2018-08-23 09:14:18
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        設計秀
        海峽姐妹(2017年7期)2017-07-31 19:08:17
        国产视频嗯啊啊啊| 欧美性猛交xxxx富婆| a国产一区二区免费入口| 综合色区亚洲熟妇另类| 真实国产乱啪福利露脸| 99久久精品一区二区三区蜜臀| 久久久精品久久久国产| 色大全全免费网站久久| 99re8这里有精品热视频免费| 国产欧美精品一区二区三区,| 少妇裸淫交视频免费看| 久久一道精品一区三区| 人妻少妇不满足中文字幕| 日韩在线免费| 免费女同毛片在线不卡| 91在线视频在线视频| 狠狠做深爱婷婷久久综合一区| 国产亚洲精品成人无码精品网站| 亚洲国产精品成人av| 91成人自拍国语对白| 少妇无码一区二区三区免费| 国产精品福利小视频| 国产成人美涵人妖视频在线观看| 色综合天天综合欧美综合| 乱人伦视频中文字幕| 亚欧乱色束缚一区二区三区| 国产午夜福利小视频在线观看 | 国产人妖视频一区二区| 国产视频精品一区白白色| 在线国产激情视频观看| 中文字幕在线精品视频入口一区| 超91精品手机国产在线| 久久网站在线免费观看| 色偷偷色噜噜狠狠网站30根 | 国产免费又爽又色又粗视频| a在线观看免费网站大全| 胳膊肘上有白色的小疙瘩| 亚洲av日韩一卡二卡| 骚片av蜜桃精品一区| 草草影院国产| 久草中文在线这里只有精品|