亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        TigerSHARC 系列DSP 鏈路口結(jié)構(gòu)分析與應(yīng)用

        2021-06-17 06:53:32王甜
        電子制作 2021年1期
        關(guān)鍵詞:寄存器移位時(shí)鐘

        王甜

        (北京信息職業(yè)技術(shù)學(xué)院電子與自動(dòng)化學(xué)院,北京,100018)

        0 引言

        隨著超大規(guī)模集成電路(VLSI)技術(shù)的發(fā)展,數(shù)字信號(hào)處理器(DSP)的性能不斷提高,DSP的單片處理能力已經(jīng)十分強(qiáng)大。但是,在某些應(yīng)用領(lǐng)域中,如:無線基站和高性能雷達(dá)信號(hào)處理機(jī)等,由于需要對(duì)多通道的數(shù)據(jù)做實(shí)時(shí)處理,其運(yùn)算速度要求達(dá)到每秒幾百億、甚至上千億次運(yùn)算,這時(shí)只有利用多片DSP,做并行處理,才能滿足這種需求。

        在由多DSP組成的信號(hào)處理系統(tǒng)中,多片DSP間的數(shù)據(jù)傳送是影響系統(tǒng)性能的關(guān)鍵之一。ADI公司的Tiger SHARC系列DSP為用戶提供了設(shè)計(jì)大規(guī)模并行系統(tǒng)的硬件基礎(chǔ),基于其專門用于DSP間通信的鏈路口,可以設(shè)計(jì)出高速的松耦合分布式并行系統(tǒng)。

        1 TigerSHARC 系列DSP概述

        TigerSHARC系列DSP是美國ADI公司基于其SHARC系列DSP的下一代高性能芯片。該系列 DSP是具有極高性能的靜態(tài)超標(biāo)量處理器,專為大的信號(hào)處理任務(wù)和通信應(yīng)用進(jìn)行了結(jié)構(gòu)上的優(yōu)化。該處理器具有非常寬的存儲(chǔ)器帶寬和雙運(yùn)算模塊(支持32-bit浮點(diǎn)和8-,16-,32-,64-bit定點(diǎn)處理)。靜態(tài)超標(biāo)量結(jié)構(gòu)使其每周期能夠執(zhí)行多達(dá)4條指令,24個(gè)16-bit定點(diǎn)運(yùn)算或6個(gè)浮點(diǎn)運(yùn)算。目前,該系列的產(chǎn)品包括:ADSP-TS101S和ADSP-TS201S、TS202S、TS203S等,其中ADSP-TS20xS是最近推出的芯片。目前應(yīng)用較多的為ADSP-TS101S,有250M和300M兩種主頻。

        ADSP-TS101S的片內(nèi)資源主要有:(1)雙運(yùn)算模塊,每個(gè)運(yùn)算模塊有一個(gè)ALU、一個(gè)乘法器、一個(gè)移位器及通信加速器;(2)雙整數(shù)ALU,提供數(shù)據(jù)尋址和指針操作;(3)6Mbits SRAM,分為M0、M1和M2共3部分;(4)3套相互獨(dú)立的32位地址、128位數(shù)據(jù)內(nèi)部總線,分別對(duì)應(yīng)連接內(nèi)部SRAM的M0、M1和M2;(5)程序控制器、中斷控制器和SDRAM控制器;(6)DMA控制器,共有14個(gè)DMA通道;(7)32位地址、64位數(shù)據(jù)的外部端口和4個(gè)鏈路口。

        剛推出的ADSP-TS20xS相對(duì)于TS101S的主要改進(jìn)與提高包括:(1)運(yùn)行頻率提升到了600MHz;(2)運(yùn)算塊中的通信加速器增強(qiáng)為單獨(dú)的通訊邏輯單元;(3)內(nèi)部總線增加為4 套;(4)內(nèi)部RAM改為24Mbit的嵌入式DRAM。

        2 TigerSHARC 系列DSP鏈路口的結(jié)構(gòu)、工作方式及使用方法

        ■2.1 TigerSHATC系列DSP鏈路口概述

        TigerSHARC系列DSP的鏈路口是除外部口外,專門用于系統(tǒng)中TigerSHARC系列DSP之間通信的額外通道,另外,也可以與滿足鏈路口通信協(xié)議的其它設(shè)備實(shí)現(xiàn)無縫連接(如:可以通過在FPGA中構(gòu)建鏈路口控制器實(shí)現(xiàn)DSP與FPGA間高速的點(diǎn)到點(diǎn)數(shù)據(jù)傳輸)。

        TigerSHARC系列DSP的鏈路口都以雙倍速率工作,即在時(shí)鐘的上升沿和下降沿都鎖存數(shù)據(jù)。對(duì)于300MHz的TS101S來說,鏈路口時(shí)鐘最高可以為內(nèi)核時(shí)鐘的一半,即150MHz,每個(gè)鏈路口提供300Mbyte/S的傳送速率,4個(gè)鏈路口就可以實(shí)現(xiàn)1.2Gbyte/S的峰值速率。而對(duì)600MHz的TS201S來說,鏈路口時(shí)鐘的最高可以達(dá)到內(nèi)核時(shí)鐘,即600MHz,每個(gè)鏈路口可以實(shí)現(xiàn)1200Mbyte/S的傳輸速率,4個(gè)鏈路口就可以實(shí)現(xiàn)4.8Gbyte/S的峰值速率。由此,可以看出,利用鏈路口,可以實(shí)現(xiàn)TigerSHARC系列DSP間高速地?cái)?shù)據(jù)傳送,從而可以大大提高整個(gè)并行系統(tǒng)的性能。

        ■2.2 TigerSHARC系列DSP鏈路口結(jié)構(gòu)

        ADSP-TS101S的鏈路口為半雙工外部接口,每個(gè)鏈路口有8條雙向數(shù)據(jù)線和3條控制線:LxDAT[7:0]提供了8位數(shù)據(jù)總線的輸入/輸出;LxCLKOUT和LxCLKIN執(zhí)行時(shí)鐘/確認(rèn)握手協(xié)議;LxDIR表明傳輸?shù)姆较蚯抑划?dāng)對(duì)LxDAT信號(hào)進(jìn)行緩沖的時(shí)候使用。其典型的外部連接方式如圖1所示。

        TS101S鏈路口內(nèi)部由收發(fā)兩部分組成,并且為雙緩沖結(jié)構(gòu),其中發(fā)送緩沖寄存器(LBUFTXx)和接收緩沖寄存器(LBUFRXx)為存儲(chǔ)器映射寄存器,發(fā)送移位寄存器和接收移位寄存器不能被軟件訪問,這四個(gè)寄存器都是128bit寄存器。鏈路口數(shù)據(jù)傳輸必須為4字的整倍數(shù),也就是說最小傳輸單元為4字(128 bit)。

        圖1 典型的鏈路口外部連接方式

        TS20xS的鏈路口為全雙工外部接口,并且采用低壓差分信號(hào)(LVDS)。每個(gè)鏈路口都有一對(duì)收發(fā)通道,最多可有4bit分別用于收發(fā),可以同時(shí)操作,實(shí)現(xiàn)全雙工通訊。每一個(gè)通道包括4位數(shù)據(jù)、一個(gè)時(shí)鐘和兩個(gè)控制信號(hào),其中數(shù)據(jù)和時(shí)鐘為L(zhǎng)VDS信號(hào)。

        ■2.3 TigerSHARC系列DSP鏈路口的工作方式及使用方法

        雖然,TS101S與TS20xS的鏈路口在外部電氣特性和內(nèi)部結(jié)構(gòu)上有較大的區(qū)別,但它們的工作方式和使用方式基本一致,所以,在本節(jié)以TS101S為例,討論鏈路口的工作方式和使用方法。

        TigerSHARC系列DSP鏈路口的數(shù)據(jù)傳輸由鏈路口內(nèi)部的通信協(xié)議保證,應(yīng)用程序只需在傳輸前對(duì)鏈路口的控制寄存器(LCTLx)進(jìn)行正確設(shè)置即可,該寄存器的結(jié)構(gòu)如表1所示。

        推薦理由:文化的歷史,說到底是人類的歷史?,F(xiàn)代人是如何從十萬年前的東非小部落,成長(zhǎng)為如今超過70億人口并遍布整個(gè)世界的?在人類進(jìn)化早期,基因?qū)ξ幕鸬經(jīng)Q定性作用;而在 “走出非洲”的擴(kuò)張階段,文化演進(jìn)才是現(xiàn)代人成功的最大秘密。本書講述了人類偉大的遷移史、人類基因的秘密以及基因與文化的深刻互動(dòng)和相互影響,以生物進(jìn)化理論為基礎(chǔ),為讀者呈現(xiàn)了一幅宏大的人類文化演進(jìn)的歷史畫卷。所有這些內(nèi)容會(huì)幫助我們重新認(rèn)識(shí)種族差異、文化差異和人類本身。

        表1 LCTLx寄存器結(jié)構(gòu)

        具體各個(gè)控制位的描述如表2所示。

        表2 LCTLx寄存器控制位描述

        使用鏈路口進(jìn)行數(shù)據(jù)傳輸有兩種方法,一種是DSP內(nèi)核通過直接寫鏈路口的發(fā)送緩沖寄存器和讀鏈路口的接收緩沖寄存器來傳輸數(shù)據(jù);另一種是片內(nèi)的DMA控制器可以通過8個(gè)專用的鏈路口DMA通道(4個(gè)發(fā)送通道,4個(gè)接收通道)來傳輸數(shù)據(jù)。

        對(duì)于第一種方式,可以直接將要發(fā)送數(shù)據(jù)寫入發(fā)送緩沖,當(dāng)發(fā)送移位寄存器為空時(shí),發(fā)送緩沖中的數(shù)據(jù)被送入發(fā)送移位寄存器進(jìn)行發(fā)送;當(dāng)發(fā)送緩沖中的數(shù)據(jù)送入發(fā)送移位寄存器后,才可以將新的數(shù)據(jù)寫入發(fā)送緩沖。當(dāng)接收移位寄存器為空時(shí),開始接收數(shù)據(jù);接收完全部4 字后,且接收緩沖為空時(shí),將數(shù)據(jù)送入接收緩沖,DSP內(nèi)核可以通過內(nèi)部總線讀取數(shù)據(jù)。這種方式傳輸數(shù)據(jù)需要DSP內(nèi)核進(jìn)行操作,在數(shù)據(jù)量大時(shí)效率不高,所以下面重點(diǎn)針對(duì)DMA方式,詳細(xì)闡述基于鏈路口的DSP間的數(shù)據(jù)傳輸。

        TigerSHARC系列DSP的每個(gè)鏈路口都分配兩個(gè)DMA通道,分別用于發(fā)送和接收。這兩個(gè)DMA通道可以連接任意的內(nèi)部或外部存儲(chǔ)器。當(dāng)發(fā)送緩沖為空且此DMA通道使能時(shí),鏈路口發(fā)出DMA傳輸請(qǐng)求;當(dāng)接收緩沖滿且DMA通道使能時(shí),鏈路口發(fā)出DMA接收請(qǐng)求;當(dāng)這個(gè)DMA通道變成激活狀態(tài)時(shí),DMA請(qǐng)求馬上執(zhí)行。

        每一個(gè)DMA通道都有一個(gè)固定的TCB寄存器(DMA傳輸控制塊寄存器),其中DCx為鏈路口DMA通道TCB寄存器,應(yīng)用程序中通過寫DCx來建立和使能鏈路口DMA通道的DMA傳輸。表3給出了DCx與鏈路口DMA通道的對(duì)應(yīng)關(guān)系。每一個(gè)TCB寄存器由4個(gè)32位的寄存器組成:

        索引寄存器(DI),存放需要傳輸數(shù)據(jù)的地址。

        X方向計(jì)數(shù)和增量寄存器(DX),高低16位分別存放DMA的計(jì)數(shù)值和地址增量。

        Y方向計(jì)數(shù)和增量寄存器(DY),高低16位分別存放DMA的計(jì)數(shù)值和地址增量。

        控制和鏈指針寄存器(DP),存放DMA的控制信息和DMA鏈的指針,DP中控制信息的詳細(xì)用法可查看相關(guān)技術(shù)文檔。

        表3 DCx與鏈路口DMA通道對(duì)應(yīng)關(guān)系

        下面以圖1所示連接關(guān)系,具體給出TigerSHARC系列DSP鏈路口DMA數(shù)據(jù)傳送的程序設(shè)計(jì)方法。假設(shè)現(xiàn)在編程將TS1內(nèi)部存儲(chǔ)器中地址link_tx_int開始的1K字的數(shù)據(jù)通過鏈路口傳送到TS2的外部存儲(chǔ)器中,地址為link_rx_ext。此處不使用二維DMA,所以不用填寫DY寄存器。鏈路口DMA傳輸完成后會(huì)觸發(fā)相應(yīng)DMA通道的中斷。

        TS1中通過寫DC4啟動(dòng)鏈路口0的DMA傳送,匯編程序如下:

        XR0 = link_tx_int;(DI寄存器)

        XR1 = 0x04000004;(DX寄存器)

        XR2 = 0x00000000;(DY寄存器)

        圖2 三種典型的鏈路口拓?fù)浣Y(jié)構(gòu)

        XR3 = 0x47000000;(DP寄存器)

        DC4 = XR3:0;

        TS2中通過寫DC9啟動(dòng)鏈路口1的DMA接收,匯編程序如下:

        XR4 = link_rx_ext;DI寄存器)

        XR5 = 0x04000004;(DX寄存器)

        XR6 = 0x00000000;(DY寄存器)

        XR7 = 0x87000000;(DP寄存器)

        DC4 = XR7:4;

        3 基于TigerSHARC系列DSP鏈路口的并行系統(tǒng)設(shè)計(jì)

        基于TigerSHARC系列DSP的4個(gè)鏈路口可以設(shè)計(jì)出具有不同的拓?fù)浣Y(jié)構(gòu)的高速松耦合分布式并行系統(tǒng)。圖2 給出了常用的三種多處理器拓?fù)浣Y(jié)構(gòu)?;谶@三種常用的拓?fù)浣Y(jié)構(gòu),可以連接多片TigerSHARC DSP,組成規(guī)模巨大的處理器陣列,滿足各種特定的對(duì)計(jì)算能力要求很高的應(yīng)用需求。

        4 結(jié)束語

        TigerSHARC系 列DSP是ADI公司的高性能浮點(diǎn)數(shù)字信號(hào)處理器,其特有的鏈路口互聯(lián)技術(shù),為由多DSP組成高速實(shí)時(shí)信號(hào)處理系統(tǒng)提供了很好的解決方案。本文詳細(xì)介紹了TigerSHARC系列DSP鏈路口的結(jié)構(gòu)特點(diǎn)和使用方法,并給出了典型的并行系統(tǒng)設(shè)計(jì)方法。

        猜你喜歡
        寄存器移位時(shí)鐘
        別樣的“時(shí)鐘”
        古代的時(shí)鐘
        Lite寄存器模型的設(shè)計(jì)與實(shí)現(xiàn)
        再生核移位勒讓德基函數(shù)法求解分?jǐn)?shù)階微分方程
        大型總段船塢建造、移位、定位工藝技術(shù)
        Σ(X)上權(quán)移位算子的不變分布混沌性
        分簇結(jié)構(gòu)向量寄存器分配策略研究*
        有趣的時(shí)鐘
        時(shí)鐘會(huì)開“花”
        多指離斷手指移位再植拇指25例
        最近中文av字幕在线中文| 久久精品日本不卡91| 日韩精品无码一区二区三区| 摸进她的内裤里疯狂揉她动图视频| 精品人妻少妇一区二区三区不卡| 亚洲不卡无码高清视频| 中文字幕精品一区二区日本 | 偷拍视频这里只有精品| 中文字幕人妻饥渴浪妇| 四虎影视成人永久免费观看视频| 亚洲色欲久久久久综合网 | 日本一区二区不卡二区| 丝袜人妻一区二区三区| 日夜啪啪一区二区三区| a观看v视频网站入口免费| 一本大道久久精品一本大道久久| 中文字幕高清视频婷婷| 新婚少妇无套内谢国语播放| 成人毛片一区二区| 粉嫩极品国产在线观看| 日本在线一区二区三区观看| 中文国产乱码在线人妻一区二区 | 亚洲成片在线看一区二区| 麻豆精品在线视频观看| 中文字幕亚洲综合久久| 亚洲色丰满少妇高潮18p| 精品无码av一区二区三区| 亚洲精品网站在线观看你懂的| 欧美日韩国产另类在线观看| 天堂精品人妻一卡二卡| 黄片视频免费在线观看国产| 在线高清理伦片a| 国产亚洲第一精品| 亚洲国产综合久久精品| 一级r片内射视频播放免费| 午夜色大片在线观看| 亚洲国产精品久久久久久网站| 亚洲免费看三级黄网站| 精品国产亚洲级一区二区| 亚洲精品国产suv一区88| 亚洲欧洲精品成人久久曰影片|