劉春雅
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西 西安 710300)
數(shù)字信號處理領(lǐng)域內(nèi)較為典型的應(yīng)用為ADC高速數(shù)據(jù)采集及處理,由中端或高端FPGA 完成若干通道的ADC 接口邏輯,數(shù)據(jù)接收后進(jìn)入FPGA 邏輯,之后再進(jìn)行諸如FIR 濾波、FFT 運算等數(shù)字信號處理。處理后的一些相關(guān)信息及運算結(jié)果需要通過支持TCP/IP 協(xié)議的以太網(wǎng)GE 口、USB、CAN 等接口發(fā)送至上位機、存儲單元或其他設(shè)備,而支持TCP/IP 協(xié)議的以太網(wǎng)GE 口、USB、CAN 等接口都帶有協(xié)議解析部分的處理,這在傳統(tǒng)的純FPGA 邏輯內(nèi)很難實現(xiàn)對這部分協(xié)議的解析和處理。在很多對小型化、低功耗等一些設(shè)計指標(biāo)約束條件較高的場合,傳統(tǒng)的單FPGA 架構(gòu)的方案就會顯得難以適從。
CycloneV SoC FPGA 是Intel PSG 推出的一款在單芯片上集成了ARM 雙核Cortex-A9 處理器和FPGA 邏輯的真正意義上的SoC 芯片。它的出現(xiàn)正好能夠解決上述問題,單芯片ARM+FPGA 的架構(gòu)不僅能夠完成以前FPGA 所擅長的ADC 接口及數(shù)字信號處理等功能,還可以通過片上內(nèi)部的ARM來實現(xiàn)以太網(wǎng)GE 口、USB、CAN 等不太好使用FPGA 去實現(xiàn)的一些接口,不僅如此還能夠利用ARM 運行嵌入式操作系統(tǒng)完成復(fù)雜的單板事務(wù)流程控制及管理、人機交互界面等。單芯片的SoC 方案對設(shè)備小型化、低功耗化的設(shè)備發(fā)展方向提供了有力的幫助。
SoC FPGA 內(nèi)部的ARM 側(cè)和FPGA 側(cè)的數(shù)據(jù)通信是由3 個橋?qū)崿F(xiàn)的,分別是H2F_AXI_Master橋,用于完成HPS(即Hard Processor System,HSP 為包含了ARM 雙核Cortex-A9 處理器、FLASH 及SDRAM 控制器及諸多外設(shè)接口等在內(nèi)的一整套完整的硬核CPU 系統(tǒng))向FPGA 發(fā)起數(shù)據(jù)讀寫操作;F2H_AXI_Slave 橋,用于完成FPGA 向HPS 發(fā)起數(shù)據(jù)讀寫操作;H2F_LW_AXI_Master 橋,用于HPS 向FPGA 發(fā)起一些控制指令或較小帶寬數(shù)據(jù)讀寫。
對于之前提到的典型應(yīng)用為高速ADC 數(shù)據(jù)采集及處理來講,需要確保FPGA 側(cè)處理完的數(shù)據(jù)等信息能夠最終送往HPS 側(cè)才能讓SoC FPGA 發(fā)揮出應(yīng)有的作用。
Avalon MM Master Templates 實現(xiàn)了Avalon MM Master 功能。通過這個Avalon Master 接口,用戶能夠向?qū)?yīng)的Avalon Slave 設(shè)備寫入數(shù)據(jù),也能夠從對應(yīng)的Avalon Slave 設(shè)備讀出數(shù)據(jù)。
該Templates 在使用時需要區(qū)分讀或?qū)憙蓚€模式,也就是說在使用時需要指定其工作模式是讀或?qū)懼械囊环N,一個Instance 無法同時支持讀寫雙向,如果需要讀寫雙向,可以在系統(tǒng)搭建的時候例化兩個Avalon MM Master Templates 并分別指定為讀和寫模式。
Avalon MM Master Templates 讀和寫模式頂層結(jié)構(gòu),(如圖1 和圖2 所示):
圖1 Master 讀模式
圖2 Master 寫模式
對于Master Templates 的讀或?qū)懩J絹碚f,都是由四個基本模塊構(gòu)成的,分別是時鐘復(fù)位、讀/寫Master 邏輯、控制邏輯及FIFO 邏輯。
時鐘復(fù)位考慮到同步設(shè)計一般在Platform Designer 系統(tǒng)中保持與整個HPS 系統(tǒng)一致。
讀/寫Master 邏輯部分的接口是與對應(yīng)的Slave設(shè)備對接的,使用時在Platform Designer 中需要進(jìn)行連接。
添加Master Templates 到系統(tǒng)并修改其配置參數(shù),需要將Master Direction 設(shè)置為“Write”,即FPGA 主動發(fā)起寫操作到HPS 側(cè)。Data Width 選為32bit,其有8、16、32、64、128、256、512 和1024 共計8 個選項。Address Width 選為32bit,與ARM 位寬匹配。打開burst 使能,并設(shè)置最大的burst 長度為128,可以根據(jù)實際的數(shù)據(jù)吞吐量進(jìn)行設(shè)置。按照這個設(shè)置,一次burst 最大可以傳輸32×128bit=4096bit的數(shù)據(jù)。配置FIFO 深度為256,使用memory based方式,即使用FPGA 內(nèi)部的Block RAM 搭建FIFO,按照這個設(shè)置,32×256 會占用FPGA 內(nèi)部的一個M10K 做FIFO。最后將master_template 的控制端口和FIFO 端口Export 出來,以便用戶進(jìn)行控制和數(shù)據(jù)寫入。
為了方便后面的測試,還需要編寫一個Avalon MM Slave的模塊,將該模塊掛在HPS 的h2f_lw_axi_master 這個輕量級總線橋上,在測試過程中可以通過ARM 運行的應(yīng)用程序來控制master_template 的寫入。該模塊可以設(shè)計含有3 個寄存器,分別用于控制master_template 的control_go,control_write_base 及control_write_length。編寫完成的代碼需要在Platform Designer 工具中添加為一個元件進(jìn)來并掛在h2f_lw_axi_master 這個輕量級總線橋上了。
之后在 Platform Designer 工具中將這個write_ctrl 作為一個模塊添加到HPS 系統(tǒng)中,連接好時鐘及復(fù)位信號,將HPS 的h2f_lw_axi_master 連接到該元件的as(即Avalon MM Slave)端口。最終連接好的整個HPS 系統(tǒng)如圖3 所示:
圖3 添加并連接write_ctrl 模塊到HPS 系統(tǒng)
對搭建好的HPS 系統(tǒng)分配基地址,Generate HDL 后得到HPS 部分的HDL 代碼。至此,HPS 側(cè)的硬件系統(tǒng)搭建完成。
硬件部分完成后,需要在SoC EDS 工具中生成Linux 軟件和驅(qū)動所需包含的hps_0.h 頭文件,該頭文件包含了HPS 側(cè)全部的外設(shè)及接口IP 寄存器定義等。
其命令為:sopc-create-header-files“./soc_system.sopcinfo”--single hps_0.h--module hps_0
生成設(shè)備樹dts 并轉(zhuǎn)換為Linux 系統(tǒng)啟動所需的dtb。
其命令為:make dtb
由于dtb 文件中包含的信息是與一個具體的Quartus 工程對應(yīng)的,在啟動時,Linux 操作系統(tǒng)會根據(jù)dtb 文件中的硬件描述去初始化FPGA 側(cè)添加的各種IP。
開始Linux 應(yīng)用程序設(shè)計之前,需要先為Avalon MM Master Templates 編寫相應(yīng)的驅(qū)動程序,否則Linux 內(nèi)核無法識別該外設(shè)。驅(qū)動程序中:
(1)amm_wr_init(viod)為驅(qū)動模塊入口,Linux在加載設(shè)備驅(qū)動時會首先執(zhí)行該函數(shù)并獲取到該設(shè)備的主設(shè)備號。其中:
①ret=alloc_chrdev_region(&devno,minor,1,"amm_wr");獲取設(shè)備號,設(shè)備節(jié)點命名為"amm_wr"。
②my_kernel_buffer=dma_alloc_coherent(NULL,dma_size,(void *)&(my_kernel_buffer_phy),GFP_K ERNEL);為DMA 內(nèi)存申請,申請內(nèi)存大小為dma_size。my_kernel_buffer_phy 為申請到的內(nèi)存物理首地址,F(xiàn)PGA 使用的就是該實際的物理地址。my_kernel_buffer 為DMA 內(nèi)存空間虛擬地址指針。
(2)amm_wr_read 函數(shù)實現(xiàn)從內(nèi)核空間讀取數(shù)據(jù)到用戶空間,copy_to_user (buf,my_kernel_buffer,count)為從my_kernel_buffer 中拷貝count 個數(shù)據(jù)到用戶空間buf 中。
(3)amm_wr_ioctl 函數(shù)是設(shè)備驅(qū)動程序中對設(shè)備的I/O 通道進(jìn)行管理的函數(shù)。所謂對I/O 通道進(jìn)行管理,就是對設(shè)備的一些特性進(jìn)行控制。put_user(data,(unsigned int *)arg)可將my_kernel_buffer_phy物理地址拷貝到用戶空間。應(yīng)用程序在調(diào)用ioctl 函數(shù)時,就能夠得到該物理地址,并通過寫write_ctrl這個Slave 模塊其中的base 寄存器操作,將FPGA發(fā)起寫傳輸所需的物理地址告知FPGA。
(4)fops 定義部分:
其余部分主要為amm_wr_open 打開函數(shù),amm_wr_release 關(guān)閉函數(shù),amm_wr_exit 驅(qū)動出口函數(shù)及一些聲明等。
將此驅(qū)動的源碼上傳至Ubuntu 系統(tǒng)下,使用root 賬戶登錄Ubuntu,設(shè)置好處理器架構(gòu),設(shè)置好交叉編譯工具,并在Makefile 中指定好linux-soc fpga源碼路徑,之后就可以編譯得到后綴為.ko 的驅(qū)動模塊文件。應(yīng)用程序開始執(zhí)行之前,需要先使用insmod 命令安裝這個驅(qū)動模塊。
應(yīng)用程序的功能主要是為了測試整個HPS 底層的硬件系統(tǒng),檢驗是否能夠完成FPGA 邏輯側(cè)的數(shù)據(jù)寫入HPS 側(cè)的DDR 中,并可將最終寫入DDR的數(shù)據(jù)讀取到Linux 的用戶空間并打印顯示出來。
該應(yīng)用程序通過寫模式的Avalon MM Master Templates,將FPGA 邏輯代碼生成的16384 個數(shù)據(jù)從邏輯側(cè)寫入到了HPS 側(cè)的DDR 中儲存,再通過read 函數(shù)讀取到用戶空間的read_buffer 中,最后為了顯示方便,僅打印出了前1024 個數(shù)據(jù)。
應(yīng)用程序中:
(1)periph_vir_base=mmap(NULL,HW_REGS_SPAN,(PROT_READ|PROT_WRITE),MAP_SHARED,fd,HW_REGS_BASE);為通過mmap 函數(shù)將以地址(HW_REGS_BASE)為起始的一段空間(HW_REGS_SPAN)進(jìn)行虛擬地址映射,得到了HPS 全部外設(shè)的虛擬地址,其中也包括了HPS 側(cè)的h2f_lw_axi_master 總線橋的虛擬地址。
(2)write_ctrl_vir_base=periph_vir_base+((unsigned long)(ALT_LWFPGASLVS_OFST+MASTER_CTRL BASE)&(unsigned long)(HW_REGS_MASK));可得到write_ctrl 自定義元件的基地址,其基地址由外設(shè)虛擬基地址+h2f_lw 總線橋的偏移地址+write_ctrl 元件相對于h2f_lw 總線橋的偏移地址得到。
(3)int trans_init(void)函數(shù)為通過ioctl 系統(tǒng)調(diào)用得到申請到的DMA 的一段地址空間,并將這段空間的基地址寫入FPGA 側(cè)write_ctrl 元件的寄存器,同樣的方式,也寫入了數(shù)據(jù)長度參數(shù)。FPGA 得到這兩個參數(shù)就能夠向這個地址寫入此數(shù)據(jù)長度的一段數(shù)據(jù)了。
(4)main 函數(shù)內(nèi),先對整個系統(tǒng)做了復(fù)位,以清除Avalon MM Master Templates 內(nèi)FIFO 的多余數(shù)據(jù),確保FIFO 不會有殘存數(shù)據(jù)影響本次測試。之后軟件通過寫寄存器的方式向write_ctrl 元件寫入控制指令,控制go 發(fā)一次脈沖來啟動傳輸過程。之后調(diào)用read 函數(shù)將16384 個數(shù)據(jù)讀取到用戶空間的read_buffer 儲存,最后通過for 循環(huán),將儲存 的16384 個數(shù)據(jù)打印出來,為了方便顯示,只打印出了前1024 個數(shù)據(jù)。
(5)程序退出時需要取消虛擬地址映射并關(guān)閉打開的文件描述符。
在SoC EDS 中輸入“eclipse &”打開DS-5 并新建軟件工程,添加源代碼和必要的文件包含路徑后編譯工程,得到二進(jìn)制程序文件,再為該文件添加可執(zhí)行權(quán)限。運行應(yīng)用程序得到的結(jié)果(如圖4 所示)。
圖4 應(yīng)用程序運行結(jié)果
從該FPGA to HPS 數(shù)據(jù)通信系統(tǒng)設(shè)計最終的測試結(jié)果來看,完全達(dá)到了芯片內(nèi)部FPGA 側(cè)到ARM 側(cè)的數(shù)據(jù)通信的目標(biāo)。如FPGA 邏輯側(cè)接的是ADC 數(shù)據(jù)或是用戶經(jīng)過數(shù)字信號處理運算后的數(shù)據(jù),通過此方案就可以達(dá)到將數(shù)據(jù)送往ARM 側(cè)的目的。之后再通過相應(yīng)的嵌入式軟件開發(fā),就可以完成將數(shù)據(jù)最終通過TCP/IP 協(xié)議的GE 口,USB,CAN 等接口送出的任務(wù)。故該方案可以成為通用的SoC FPGA 數(shù)據(jù)交互通信方案,具備較強的參考價值。