亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FPGA的功率譜分析系統(tǒng)

        2020-09-17 05:39:38付恩孫秀男
        關鍵詞:信號系統(tǒng)

        付恩 琪 ,孫秀男 ,梁 昊

        (1.中國科學技術大學 核探測與核電子國家重點實驗室,安徽 合肥230026;2.中國科學技術大學 近代物理系,安徽 合肥 230026)

        0 引言

        功率譜估計是信號分析的重要方法,廣泛應用于雷達信號處理、語音識別、無線通信等領域[1-3]。針對激光雷達的微弱信號探測,由于單個脈沖功率譜強度較低,通常需要將多個脈沖功率譜進行分段累加以提高探測性能[4]。經(jīng)典譜估計建立在快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)基礎之上,目前常用的基于MATLAB的功率譜估計運算耗時長、效率低,無法滿足實時數(shù)據(jù)處理的需求。隨著現(xiàn)場可編程門陣列(Field Programmable Gate Array,F(xiàn)PGA)集成度進一步提高,其內部資源豐富,性能強大,設計更加靈活,并具有很好的兼容性和可移植性,成為理想的解決方案。

        本文設計了一種基于FPGA的功率譜分析系統(tǒng),在上位機軟件控制下對關鍵參數(shù)進行配置,實現(xiàn)了數(shù)據(jù)采集、硬件觸發(fā)、DDR3存取、功率譜估計、結果上傳等系列功能。重點研究了兩種功率譜估計方案:方案一不加窗,由單精度浮點的并行FFT模塊實現(xiàn),計算結果精度高;方案二增加了實時加窗處理,由24 bit定點的流水線FFT模塊實現(xiàn),在降低頻譜泄露的同時進一步提升處理速度。系統(tǒng)通過分段累加處理提高了對微弱信號的探測性能。

        1 系統(tǒng)總體結構

        1.1 硬件總體結構

        圖1 系統(tǒng)硬件總體結構

        功率譜分析系統(tǒng)的硬件總體結構如圖1所示,包括數(shù)據(jù)采集子板和數(shù)據(jù)處理母板,兩者通過FPGA夾層卡(FPGA Mezzanine Card,F(xiàn)MC)連接。子板負責前端模擬信號采樣,以1 GS/s的 12位 ADC芯片ADC12D500RF為核心,數(shù)字信號以250 MHz、48 bit的4路并行模式輸出。母板負責整體系統(tǒng)控制及信號處理,使用Xilinx公司的Virtex-6 FPGA芯片XC6VLX240T完成數(shù)據(jù)觸發(fā)采樣、DDR3存取、功率譜估計。最后,通過千兆以太網(wǎng)將計算結果上傳至上位機。

        1.2 邏輯總體結構

        功率譜分析系統(tǒng)的邏輯結構主要可分為數(shù)據(jù)接收、功率譜估計以及結果上傳三部分。數(shù)據(jù)接收部分包括ADC數(shù)據(jù)接口、硬件觸發(fā)和DDR3接口模塊;功率譜估計部分包括FFT前置接口、FFT處理和分段累加模塊;結果上傳部分包括上位機命令解析、千兆以太網(wǎng)接口模塊,總體結構如圖2所示。

        圖2 系統(tǒng)邏輯總體結構

        數(shù)據(jù)采集由外部硬件觸發(fā)控制,觸發(fā)頻率為10 kHz,采集總時間為1 s。系統(tǒng)通過上位機配置的參數(shù)如下:(1)觸發(fā)采樣點數(shù) L,范圍是 20 000~67 000點;(2)觸發(fā)延時 t,范圍是 0~1 000 ns,每次觸發(fā)后延遲 t ns再采集 L個采樣點;(3)距離門點數(shù) M,范圍是 200~1 024點,以 M為節(jié)點對采樣點數(shù)L進行分段,每段都需要進行FFT處理,F(xiàn)FT模塊變換長度為固定的1 024點,其中輸入FFT模塊的前M點為采樣數(shù)據(jù)點,后(1 024-M)點做補零操作;(4)累加次數(shù)P,范圍是 1 000~10 000次,每次觸發(fā)分段的FFT結果需要與之前保存的相同段結果累加,當P設置為10 000次時對應連續(xù)采集1 s。

        系統(tǒng)的工作流程如下:(1)上位機軟件完成參數(shù)的設置后,各指令通過千兆以太網(wǎng)接口下發(fā)至相應的功能模塊;(2)對信號進行觸發(fā)采樣,當 FIFO中達到一定數(shù)據(jù)量就開始向DDR3中寫入數(shù)據(jù),直至寫完P次觸發(fā)的數(shù)據(jù)量;(3)將數(shù)據(jù)從DDR3中讀出進行功率譜估計,每次觸發(fā)采樣信號分為floor(L/M)段,即向下取整,進行FFT計算,求模平方后保留前一半結果,最后將每次觸發(fā)對應段結果累加P次存入相應的RAM中;(4)將功率譜估計結果上傳至上位機。

        2 系統(tǒng)邏輯設計

        2.1 數(shù)據(jù)接收部分

        ADC數(shù)據(jù)接口使用Xilinx器件原語IBUFGDS和IBUFDS[5]將隨路時鐘和采樣信號由差分LVDS信號轉換為單端信號,同時注意將接收采樣信號的寄存器固定在FPGA的IO單元上,否則可能造成數(shù)據(jù)錯位。原信號寬度為48 bit,利用四個寄存器緩存串并轉換后信號寬度為192 bit,剩下64 bit做補零處理,與256 bit的DDR3數(shù)據(jù)存儲位寬匹配。

        硬件觸發(fā)模塊負責控制采樣信號的觸發(fā)寫入、每次觸發(fā)的采樣點數(shù)以及觸發(fā)延時。系統(tǒng)工作時,模塊時鐘頻率為62.5 MHz,收到觸發(fā)信號后,利用計數(shù)器控制觸發(fā)延時t,在t/16個周期內禁止FIFO的寫入。同理,對采樣點數(shù) L,在 L/16個周期內允許FIFO寫入,之后禁止寫入直至下一次觸發(fā)。觸發(fā)延時的控制精度為16 ns,觸發(fā)采樣點數(shù)的控制精度為16個采樣點。

        DDR3接口由Xilinx公司提供的IP核與用戶控制模塊構成[6],根據(jù)上位機指令,與讀寫FIFO配合,完成信號存取操作。

        2.2 功率譜估計部分

        針對兩種功率譜估計方法,方案一采用32 bit單精度浮點的并行FFT模塊,保證了譜分析的精度;另一方面,F(xiàn)PGA實時生成的漢寧窗系數(shù)無法達到很高的精度,為提高數(shù)據(jù)處理速度,方案二采用24 bit定點的流水線FFT模塊。

        2.2.1 FFT前置接口

        FFT前置接口的功能是根據(jù)距離門點數(shù)M進行分段取數(shù)、補零操作以及數(shù)據(jù)格式轉換。DDR3讀出的采樣信號經(jīng)兩級FIFO緩沖后送入FFT前置接口,通過控制FIFO讀使能每次讀出M個采樣點,其余(1 024-M)點做補零處理。對于并行處理FFT模塊利用Floating-point IP核將12 bit的采樣信號轉換為32 bit單精度浮點。

        為了降低頻譜泄露[7],為流水線 FFT處理模塊提供了實時硬件加窗處理,已知漢寧窗時域表達式為:

        其中,n=0,1,…,N-1,而距離門點數(shù) M就對應著式中的N。當M設置完成后,上位機同時發(fā)送系數(shù) 1/(M-1),利用乘法器、CORDIC IP核及減法器實時生成18 bit漢寧窗系數(shù),與原信號相乘后結果保留24 bit作為流水線FFT模塊輸入。

        另外,對于分段后多余的采樣點,需要讀出并丟棄。圖3展示了FFT前置接口工作狀態(tài)轉移圖。

        圖3 FFT前置接口工作狀態(tài)轉移圖

        2.2.2 FFT處理模塊

        并行FFT處理模塊的設計主要參考了蘇斌[8]等提出的方案,采用按時間抽取(Decimation In Time,DIT)的基-2 FFT算法實現(xiàn)32 bit單精度浮點的快速傅里葉變換,通過四個蝶形單元并行計算提升處理速度,其結構如圖4所示。模塊中主要包含雙端口RAM、蝶形運算單元、旋轉因子ROM及地址產生控制單元等。

        圖4 并行FFT處理模塊的總體結構

        模塊中存儲器較多,在實現(xiàn)過程中為了降低地址控制復雜度,根據(jù)FFT計算規(guī)律,將RAM0、RAM2、RAM4、RAM6 分 為 一 組 ,其 讀 寫 地 址用一對寄存器 ram_up_wr_addr、ram_up_rd_addr控制,而 RAM1、RAM3、RAM5、RAM7 為另一組 , 讀寫地址用另一對寄存器ram_down_wr_addr、ram_down_rd_addr控制。同時利用多路選擇器控制四個蝶形單元與RAM的連接,在FFT計算的不同階段進行切換,最終以較少的信號實現(xiàn)對16個RAM的控制。

        流水線FFT處理模塊采用按頻率抽取(Decimation In Frequency,DIF)的基-2 FFT 算法,通過單路延時反 饋(Single-path Delay Feedback,SDF)架 構[9-10]實 現(xiàn)24 bit定點的快速傅里葉變換,其結構如圖5所示。流水線結構在FFT變換的每一級都有單獨的處理模塊,每個模塊中都包含蝶形運算單元、延時緩存單元、旋轉因子ROM及信號控制單元。

        圖5 流水線FFT處理模塊的總體結構

        蝶形運算單元由24 bit有符號的乘法器和加減法器構成,定點運算需要考慮截斷和溢出。對于截斷,將乘法器輸出從高位開始向下截取24位作為計算結果。另一方面,為了防止加減計算發(fā)生溢出,設計在每一級的輸入端將信號大小減半。

        根據(jù)流水線處理的特點,延時緩存單元由FIFO實現(xiàn),當需要緩存的數(shù)據(jù)少于16點時,使用移位寄存器作為延時緩存單元。信號控制單元主要負責控制FIFO的讀寫使能、選通信號以及旋轉因子ROM的讀地址。通過控制選通信號,延時緩存單元一方面可以存儲輸入信號,另一方面也存儲蝶形運算的輸出結果,分時復用的策略保證了信號的流水線處理。

        2.2.3 分段累加模塊

        分段累加模塊主要包括雙端口RAM、加法器及控制邏輯,結構如圖6所示,其功能是根據(jù)累加次數(shù)P將對應段的功率譜結果累加并保存。第一次觸發(fā)的分段FFT結果直接存入RAM中,之后每次觸發(fā)處理后的結果到來時取出RAM中對應段數(shù)據(jù)送入加法器,并把結果存回RAM直至完成P次累加。

        圖6 分段累加模塊結構

        2.3 結果上傳部分

        千兆以太網(wǎng)接口負責控制命令收發(fā)以及結果上傳,由Xilinx公司提供的 IP核產生MAC層,結合物理層芯片88E1111實現(xiàn)。最終需要上傳的數(shù)據(jù)大小為 floor(L/M)×512×32 bit,將自定義數(shù)據(jù)幀的數(shù)據(jù)長度設置為1 024 B,收到一次上傳命令則上傳2幀,如此循環(huán)floor(L/M)次即可將所有數(shù)據(jù)上傳。

        3 系統(tǒng)測試

        功率譜分析系統(tǒng)的測試內容包括并行FFT處理模塊的仿真、流水線FFT處理模塊的仿真、整體系統(tǒng)的功能驗證和處理速度測試。

        3.1 并行FFT處理模塊的仿真

        利用MATLAB生成波形數(shù)據(jù),作為FFT模塊測試信號。圖7是并行FFT處理模塊仿真結果與MATLAB運算結果的對比,觀察發(fā)現(xiàn),兩者處理結果一致,頻譜峰值在 105量級,絕對誤差在 10-2量級,故單精度浮點處理的相對誤差為10-7量級。

        圖7 并行FFT處理模塊誤差分析

        綜合結果表明模塊最高工作頻率為250.2 MHz,系統(tǒng)采用200 MHz作為工作頻率,完成1 024點FFT計算共耗時17.41μs,除去信號輸入輸出后變換時間為7.17μs。表1展示了硬件資源占用情況。

        表1 并行FFT處理模塊硬件資源消耗

        3.2 流水線FFT處理模塊仿真

        圖8是流水線FFT處理模塊仿真結果與MATLAB運算結果的對比,其中,頻譜峰值在105量級,絕對誤差在100量級,故 24 bit定點處理的相對誤差為10-5量級。FFT前置接口模塊生成的漢寧窗系數(shù)精度為10-5量級,將信號加窗后再進行FFT計算,此時整體的相對誤差為10-4量級。

        圖8 流水線FFT處理模塊誤差分析

        綜合結果表明模塊最高工作頻率為394.3 MHz,在200 MHz頻率下完成1 024點FFT計算耗時10.65μs。表 2展示了流水線FFT處理模塊硬件資源占用情況。

        表2 流水線FFT處理模塊硬件資源消耗

        3.3 功率譜分析系統(tǒng)測試

        上位機指令下發(fā)后,通過ChipScope抓取各模塊中收到的參數(shù)數(shù)據(jù),對比發(fā)現(xiàn)各命令正確下發(fā)。利用控制變量法,分別改變輸入信號頻率、每次觸發(fā)采樣點數(shù)及累加次數(shù)等參數(shù),進行數(shù)據(jù)采集、分段FFT處理并上傳,利用MATLAB程序分析上傳結果,驗證了各個功能的正確性。

        通過分段累加的方式,保留了大量信號的基本特征,同時改善了功率譜估計的性能。圖9展示了系統(tǒng)分段累加 1、10、100、1 000次處理后功率譜的對比,可以看出,隨著累加次數(shù)的增加,功率譜逐漸平滑。

        圖9 不同累加次數(shù)下功率譜對比

        將觸發(fā)采樣點數(shù)L設置為20 000,距離門點數(shù)M為 1 024,即每次觸發(fā)完成19次FFT運算,通過改變累加次數(shù)改變整體運算量。以信號開始輸入為計時起點,結果開始輸出為計時終點,分別測試兩種方案進行功率譜估計消耗的時間,結果如表3所示。

        表3 兩種功率譜估計方案耗時

        表4是本文功率譜估計方案與其他方案的比較。本文系統(tǒng)的優(yōu)勢是采樣頻率高,可根據(jù)需求靈活配置關鍵參數(shù),頻率分辨合適,并提供了實時硬件加窗處理。另一方面,由于數(shù)據(jù)量較大,本文采取先緩存后處理方式,整體消耗時間相對偏長,接下來將嘗試采用多路并行FFT方案進一步提升速度。

        表4 功率譜估計方案性能比較

        4 結論

        本文設計了一種基于FPGA的功率譜分析系統(tǒng),通過硬件平臺和邏輯算法的結合,靈活實現(xiàn)了數(shù)據(jù)采集、觸發(fā)、緩存、功率譜估計、結果上傳等系列功能。測試結果表明,兩種FFT處理方案均達到較高的精度和速度。在上位機軟件的控制下,系統(tǒng)能夠實現(xiàn)實時功率譜估計,并通過分段多次累加改善功率譜估計的性能,提高了激光雷達對微弱信號的探測處理能力。

        猜你喜歡
        信號系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        完形填空二則
        基于PowerPC+FPGA顯示系統(tǒng)
        半沸制皂系統(tǒng)(下)
        孩子停止長個的信號
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        基于LabVIEW的力加載信號采集與PID控制
        亚洲av综合色区久久精品天堂| gv天堂gv无码男同在线观看| 吃奶摸下的激烈视频| 国产爆乳无码一区二区在线| 久久精品国产亚洲av热九| 日本免费一区二区在线视频播放| 中文字幕无码av波多野吉衣| 亚洲成色在线综合网站| 国产精品欧美亚洲韩国日本 | 午夜精品久久99蜜桃| 日日天干夜夜狠狠爱| 成人无码视频| 中文字幕日本熟妇少妇| 日本av天堂一区二区三区| 亚洲国产精品一区二区www| 极品尤物高潮潮喷在线视频| 亚洲av色香蕉一区二区蜜桃| 久久国产精品婷婷激情| 色吊丝中文字幕| 国产欧美精品一区二区三区,| 国内人妖一区二区在线播放| 蜜桃精品人妻一区二区三区| 乱人伦人妻中文字幕无码| 国产精品无码无片在线观看3D| 免费人成网站在线观看| 精品午夜福利在线观看| 欧美丰满熟妇aaaaa片| 99国产综合精品-久久久久| 精品少妇人妻av一区二区蜜桃| 鲁丝片一区二区三区免费| 爱a久久片| 一区二区三区精品偷拍| 成人日韩精品人妻久久一区| 亚洲日韩精品无码专区网站| 亚洲精品6久久久久中文字幕| 日本一区二区三区一级片| 亚洲av成人无码一区二区三区在线观看| 欧美三级乱人伦电影| 91国产自拍视频在线| 二区三区三区视频在线观看| 亚洲精品字幕|