亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu)

        2016-08-12 05:48:17黎建華胡永良張肖強(qiáng)
        電子學(xué)報(bào) 2016年6期
        關(guān)鍵詞:有線功耗路由器

        黎建華,吳 寧,胡永良,張肖強(qiáng)

        (1.南京航空航天大學(xué)電子信息工程學(xué)院,江蘇南京 210016; 2.臺(tái)州學(xué)院計(jì)算機(jī)應(yīng)用研究所,浙江臨海 317000)

        ?

        一種自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu)

        黎建華1,2,吳寧1,胡永良2,張肖強(qiáng)1

        (1.南京航空航天大學(xué)電子信息工程學(xué)院,江蘇南京 210016; 2.臺(tái)州學(xué)院計(jì)算機(jī)應(yīng)用研究所,浙江臨海 317000)

        針對(duì)傳統(tǒng)大規(guī)模片上網(wǎng)絡(luò)(Network-on-Chip,NoC)遠(yuǎn)距離核間多跳通信所帶來(lái)的高能耗與延時(shí)問(wèn)題,提出了一種基于虛Torus的自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu)(VT-AWiNoC).該結(jié)構(gòu)通過(guò)引入鏈路擁塞測(cè)度作為感知參數(shù),基于此采用熱點(diǎn)無(wú)線鏈路自動(dòng)探測(cè)與帶寬動(dòng)態(tài)分配機(jī)制,并設(shè)計(jì)實(shí)現(xiàn)發(fā)送器動(dòng)態(tài)分配的控制電路模塊,以達(dá)到根據(jù)不同的通信流量模型,于片內(nèi)自適應(yīng)地調(diào)整拓?fù)浣Y(jié)構(gòu)及鏈路帶寬的目的.通過(guò)建立混合型無(wú)線NoC的延時(shí)與功耗評(píng)估模型,對(duì)該結(jié)構(gòu)的無(wú)線NoC進(jìn)行性能評(píng)估.實(shí)驗(yàn)結(jié)果表明,該自適應(yīng)拓?fù)渑c其它混合型無(wú)線NoC相比,在隨機(jī)流量模型下,網(wǎng)絡(luò)平均延時(shí)降低了16.52~23.27%;在20%的熱點(diǎn)流量模型下,包平均能耗節(jié)省了39.19%;以真實(shí)應(yīng)用FFT作為基準(zhǔn)測(cè)試,平均延時(shí)降低了17.20%~21.68%,并節(jié)省了23.49%的包平均能耗.該結(jié)構(gòu)以較小的面積開(kāi)銷獲得了更優(yōu)的性能.

        無(wú)線片上網(wǎng)絡(luò);自適應(yīng)拓?fù)?;擁塞測(cè)度

        1 引言

        片上網(wǎng)絡(luò)(Network-on-Chip,NoC)作為復(fù)雜SoC的一種新的互連與通信架構(gòu)[1],當(dāng)向更大規(guī)模和更復(fù)雜化方向發(fā)展時(shí),其本身存在的延時(shí)與能耗問(wèn)題嚴(yán)重限制了SoC性能的進(jìn)一步提升[2].為從根本上解決傳統(tǒng)大規(guī)模有線NoC的金屬導(dǎo)線的布線限制及多跳通信引起的延時(shí)與功耗問(wèn)題,近年來(lái),應(yīng)用片上微型天線實(shí)現(xiàn)片內(nèi)無(wú)線通信,將NoC中多跳有線金屬鏈路替換成長(zhǎng)無(wú)線鏈路,一種無(wú)線NoC(Wireless NoC,WiNoC)應(yīng)運(yùn)而生[2~5].

        自D.Zhao等人基于UWB技術(shù)提出無(wú)線NoC架構(gòu)以來(lái)[6],涌現(xiàn)出了大量相關(guān)的研究成果[7~10].文獻(xiàn)[7]針對(duì)專用無(wú)線NoC拓?fù)涞脑O(shè)計(jì)方法,給出了一種基于啟發(fā)式的無(wú)線鏈路靜態(tài)分配算法.文獻(xiàn)[8]以網(wǎng)絡(luò)架構(gòu)的處理器陣列NePA為基礎(chǔ),構(gòu)建了一個(gè)有線/無(wú)線混合的混合型無(wú)線NoC(NePA-WiNoC).文獻(xiàn)[9]充分利用小世界(Small-World)網(wǎng)絡(luò)具有較短的平均路徑長(zhǎng)度的特點(diǎn),構(gòu)建了一個(gè)具有Small-World結(jié)構(gòu)的混合網(wǎng)絡(luò)(SW-WiNoC).文獻(xiàn)[10]綜合考慮無(wú)線節(jié)點(diǎn)、無(wú)線鏈路數(shù)及其分布等因素,提出了一個(gè)基于無(wú)線多跳的混合無(wú)線NoC拓?fù)?-Level Hybrid Mesh(2LHM-WiNoC).上述各種拓?fù)涞臒o(wú)線NoC,雖在性能方面得到了明顯提升,但其無(wú)線鏈路均采用靜態(tài)的信道分配機(jī)制,即不管鏈路上有無(wú)數(shù)據(jù)傳輸及實(shí)際傳輸?shù)臄?shù)據(jù)量大小,始終為其分配固定的鏈路帶寬,造成信道帶寬的浪費(fèi).特別是在無(wú)線NoC中無(wú)線信道數(shù)及總帶寬受限的條件下,如何根據(jù)通信流量模型于片內(nèi)自適應(yīng)地調(diào)整拓?fù)浣Y(jié)構(gòu)與鏈路帶寬,對(duì)提高無(wú)線NoC的性能是至關(guān)重要的.

        本文綜合考慮無(wú)線鏈路具有低能耗和互連可變的內(nèi)在特性[9,11],以及鏈路擁塞等因素,提出了一種基于虛Torus的、低延時(shí)低能耗的自適應(yīng)混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu)(Virtual Torus-Based Adaptive Wireless NoC,VT-AWiNoC).該結(jié)構(gòu)采用基于改進(jìn)擁塞測(cè)度參數(shù)的發(fā)送器動(dòng)態(tài)分配控制電路模塊(Dynamic Allocation Control Circuit Module,DACCM),將發(fā)送器與信道動(dòng)態(tài)分配到最擁塞的熱點(diǎn)無(wú)線鏈路上,于片內(nèi)完成無(wú)線NoC拓?fù)浼版溌穾挼淖赃m應(yīng)調(diào)整,實(shí)現(xiàn)面向不同流量模型的帶寬按需分配.實(shí)驗(yàn)表明,該結(jié)構(gòu)在可接受的面積成本開(kāi)銷下,在吞吐量、延時(shí)和功耗等方面獲得了更優(yōu)的通信性能.

        2 自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu)

        無(wú)線NoC的拓?fù)渲谐擞芯€節(jié)點(diǎn)、鏈路的布局和互連方式外,其無(wú)線節(jié)點(diǎn)、鏈路的數(shù)目及其位置分布對(duì)無(wú)線NoC的性能影響也至關(guān)重要.綜合考慮以上因素,本文所提出的自適應(yīng)拓?fù)銿T-AWiNoC如圖1所示.

        現(xiàn)假定有一規(guī)模為n*n的2D Mesh結(jié)構(gòu)的純有線NoC網(wǎng)絡(luò),因無(wú)線NoC主要解決大規(guī)模純有線NoC的多跳通信與布線問(wèn)題,故假設(shè)n為大于6的整數(shù)(圖1中n等于18),則該自適應(yīng)拓?fù)浣Y(jié)構(gòu)的構(gòu)建規(guī)則如下:

        (1)簇與塊的劃分:考慮可用信道數(shù)、網(wǎng)絡(luò)擴(kuò)展性與規(guī)則性等因素,以降低網(wǎng)絡(luò)擁塞、減小硬件開(kāi)銷為原則,基于對(duì)現(xiàn)有子網(wǎng)劃分方法的理論分析[2,10,11],先將整個(gè)網(wǎng)絡(luò)劃分成若干個(gè)6*6的簇(cluster),之后將每個(gè)簇劃分成若干個(gè)3*3的塊(block),當(dāng)網(wǎng)絡(luò)規(guī)模不滿足此劃分條件時(shí),在后續(xù)討論;如圖1中共有9個(gè)6*6的簇(Cluster0~Cluster8),每個(gè)簇內(nèi)包含4個(gè)3*3的塊(Block0~Block3);路由器用R(cn,bn,zn)標(biāo)記,其中變量cn表示該路由器所在的簇號(hào),bn表示該路由器在簇cn中的塊的序號(hào)(bn∈[0,3]),zn表示該路由器在塊bn中的路由器編號(hào).

        (2)路由器編號(hào):將每個(gè)塊中心的有線路由器R替換成無(wú)線路由器WR,并在水平或垂直方向上的任意相鄰塊的兩個(gè)WR間插入一條靜態(tài)無(wú)線鏈路;則每個(gè)無(wú)線路由器WR的編號(hào)為WR(cn,bn,4),為簡(jiǎn)化在圖中的描述,WR(cn,bn,4)視為對(duì)(cn,bn)四進(jìn)制編號(hào),記為WRn,這里n=(cn,bn)4,如WR(1,2,4) 記為WR6,以此類推.

        (3)對(duì)面簇與對(duì)面WR(或塊):現(xiàn)將物理上分布在一個(gè)維度兩端的兩個(gè)簇,互稱為對(duì)面簇;同理,物理上分布在一個(gè)維度兩端的兩個(gè)WR(或塊),互稱為對(duì)面WR(或?qū)γ鎵K);如圖1,Cluster0的對(duì)面簇為其水平方向上的簇Cluster2、垂直方向上的簇Cluster6;WR0的對(duì)面WR為其水平方向上的WR9、垂直方向上的WR26;而WR1只在垂直方向上存在對(duì)面WR(WR27),在水平方向上不存在對(duì)面WR.

        (4)無(wú)線鏈路插入:在每個(gè)簇中均另設(shè)置了一個(gè)自適應(yīng)簇發(fā)送器(Cluster Transmitter,CT),CT采用有線鏈路與簇內(nèi)的Max(bn)+1個(gè)WR直接相連(這里Max(bn)表示某簇內(nèi)變量bn的最大值,圖1中的Max(bn)=3),簇內(nèi)的Max(bn)+1個(gè)WR共享使用該CT,并在水平或垂直方向上的相鄰CT間或?qū)γ鍯T間插入一條自適應(yīng)無(wú)線鏈路,這里將對(duì)面CT間所插入的跨越整個(gè)拓?fù)涞淖赃m應(yīng)無(wú)線鏈路簡(jiǎn)記為長(zhǎng)鏈路;若某簇內(nèi)的塊Block數(shù)目等于1,則該簇內(nèi)僅有1個(gè)WR獨(dú)占該簇的CT.

        (5)CT分配規(guī)則:為減少遠(yuǎn)距離IP核間通信跳數(shù),降低相鄰簇間的相鄰WR間的擁塞程度,在提高簇發(fā)送器CT利用率,又避免CT的流量負(fù)載過(guò)重而出現(xiàn)局部擁塞的同時(shí),限制共享CT及其信道只能用于相鄰簇間的相鄰WR間或?qū)γ鎃R間的通信,而不能將其用于簇內(nèi)的WR間通信;因此圖1中的CT0根據(jù)不同的通信流量模型,被自適應(yīng)地動(dòng)態(tài)分配給WR0-WR9(長(zhǎng)鏈路)、WR0-WR26(長(zhǎng)鏈路)、WR1-WR4、WR1-WR27(長(zhǎng)鏈路)、WR2-WR12、WR2-WR11(長(zhǎng)鏈路)、WR3-WR6或WR3-WR13共8條鏈路動(dòng)態(tài)復(fù)用,CT的動(dòng)態(tài)分配機(jī)制由后續(xù)所討論的鏈路擁塞測(cè)度參數(shù)決定.

        按照上述構(gòu)建規(guī)則,當(dāng)所有的CT均未分配給對(duì)面WR間通信時(shí),上層無(wú)線鏈路構(gòu)成了Mesh網(wǎng)絡(luò);而當(dāng)邊緣CT均用于與其對(duì)面WR通信時(shí),上層靜態(tài)無(wú)線鏈路和自適應(yīng)無(wú)線鏈路一起構(gòu)成類似于Torus結(jié)構(gòu)的虛擬環(huán)網(wǎng).正是通過(guò)自適應(yīng)簇發(fā)送器CT的動(dòng)態(tài)分配,于片內(nèi)實(shí)現(xiàn)上層無(wú)線拓?fù)浼版溌穾掚S不同流量模型的自適應(yīng)變化,故稱之為基于虛Torus的自適應(yīng)的混合型無(wú)線NoC(VT-AWiNoC).

        對(duì)于n*n的2D Mesh純有線NoC,若無(wú)法滿足上述劃分條件,即當(dāng)某個(gè)簇的規(guī)模不足6*6(n不為6的整數(shù)倍)或某個(gè)塊的規(guī)模不足3*3,這里不采取添加冗余路由節(jié)點(diǎn)的方法,而是將其視為一個(gè)完整的簇或塊.此規(guī)則既不影響自適應(yīng)拓?fù)涞臉?gòu)建,又可避免因添加冗余路由節(jié)點(diǎn)而帶來(lái)的面積與功耗開(kāi)銷.

        網(wǎng)絡(luò)直徑是影響NoC性能的一個(gè)重要指標(biāo),本文VT-AWiNoC結(jié)構(gòu)的上層無(wú)線網(wǎng)絡(luò)的直徑同Torus結(jié)構(gòu),網(wǎng)絡(luò)直徑為 4+2?n/6」,其中?·」表示向下取整.網(wǎng)絡(luò)直徑隨網(wǎng)絡(luò)規(guī)模變化關(guān)系如圖2所示,本文提出的拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò)直徑隨節(jié)點(diǎn)數(shù)的變化比較平緩,當(dāng)節(jié)點(diǎn)數(shù)目超過(guò)392時(shí),VT-WiNoC的網(wǎng)絡(luò)直徑明顯小于其它三種結(jié)構(gòu).這從理論上證明了當(dāng)網(wǎng)絡(luò)規(guī)模較大時(shí),該結(jié)構(gòu)具有更小的網(wǎng)絡(luò)直徑,以此減小路由平均跳數(shù)與網(wǎng)絡(luò)延時(shí).

        無(wú)線路由器WR及其與發(fā)送器CT互連結(jié)構(gòu)如圖3所示,包含5個(gè)有線輸入/輸出端口(E、S、W、N和L)和4個(gè)無(wú)線輸入/輸出端口(BW-E、BW-S、BW-W、BS-N,分別面向東南西北的WR).雖然端口BW-E、BW-S、BW-W或BS-N與CT間本質(zhì)上是采用有線鏈路相連,但這些端口的數(shù)據(jù)是利用所連接的發(fā)送器,以無(wú)線方式與下一個(gè)路由器間傳輸?shù)?,故從功能上將這些端口稱為無(wú)線輸入/輸出端口.路由器WR內(nèi)部包括路由仲裁器(Routing Arbitrator,RA)、基于仲裁計(jì)數(shù)器和流量計(jì)數(shù)器的本地?fù)砣麥y(cè)度單元(Local Congestion Measure Unit,LCMU).LCMU用于統(tǒng)計(jì)該WR的每條無(wú)線輸出鏈路的擁塞情況,并將擁塞測(cè)度數(shù)據(jù)送給帶有比較器的全局擁塞測(cè)度單元GCMU(Global Congestion Measure Unit),GCMU通過(guò)1~ Max(bn)號(hào)端口分別獲取簇內(nèi)其它WR的LCMU輸出數(shù)據(jù).

        WR的每個(gè)無(wú)線輸出端口均各自連接1個(gè)靜態(tài)發(fā)送器Tx,邊緣WR的邊緣端口除外.如圖3中的WR0只有非邊緣端口BW-S-out和BW-E-out各自連接了1個(gè)Tx,而WR3的四個(gè)輸出端口均各自連接了1個(gè)Tx.采用文獻(xiàn)[9]的FDMA技術(shù)進(jìn)行子信道劃分,讓每個(gè)發(fā)送器Tx工作在不同的載波頻率上(f1~f4),負(fù)責(zé)實(shí)現(xiàn)垂直或水平方向上與其相鄰WR間的靜態(tài)無(wú)線互連.按照前述的自適應(yīng)拓?fù)錁?gòu)建規(guī)則,對(duì)于每個(gè)WR,只有其中2個(gè)方向的無(wú)線輸出端口采用有線鏈路同時(shí)與1個(gè)發(fā)送器CT相連,具體由WR在網(wǎng)絡(luò)中的位置所決定.如圖3中的WR0,只有BW-N-out和BW-W-out同時(shí)與CT0連接,其中BW-N-out與CT0連接,與其對(duì)面簇中的WR26實(shí)現(xiàn)遠(yuǎn)距離通信;BW-W-out與CT0連接,與其對(duì)面簇中的WR9實(shí)現(xiàn)遠(yuǎn)距離通信.同理,對(duì)于WR3,只有其BW-S-out和BW-E-out同時(shí)與CT0連接.若將CT動(dòng)態(tài)分配給不同的WR使用,其上層無(wú)線拓?fù)湟苍诟鶕?jù)不同的通信流量模型于片內(nèi)自適應(yīng)調(diào)整.

        3 擁塞測(cè)度與鏈路帶寬動(dòng)態(tài)分配機(jī)制

        如何根據(jù)鏈路帶寬需求,把空閑信道動(dòng)態(tài)分配給高流量的鏈路上以解決擁塞問(wèn)題,將對(duì)無(wú)線NoC的總體性能提升產(chǎn)生重要影響.為便以描述擁塞測(cè)度與鏈路帶寬動(dòng)態(tài)分配機(jī)制,現(xiàn)給出若干相關(guān)定義.

        定義1無(wú)線NoC體系結(jié)構(gòu)圖(WiNoC Architecture Graph,WAG)WAG(A,E,L)是由多個(gè)無(wú)線路由節(jié)點(diǎn)a(?a∈A)互連構(gòu)成的有向圖,A表示具有m*m個(gè)無(wú)線路由節(jié)點(diǎn)構(gòu)成的集合,|A|=m*m,其中m=(n+5)/6;邊e(?e∈E)表示兩個(gè)無(wú)線路由節(jié)點(diǎn)間的有線鏈路;邊lab(?lab∈L,?b∈A,b=(a±1)mod(m))表示兩個(gè)相鄰的無(wú)線路由節(jié)點(diǎn)a與b之間互連的無(wú)線鏈路.

        定義2無(wú)線路由節(jié)點(diǎn)端口(Wireless Router Port,WRP)集合P(U,V,I,J),端口u(?u∈U)和v(?v∈V)分別表示無(wú)線路由節(jié)點(diǎn)的有線輸入端口和有線輸出端口,端口i(?i∈I)和j(?j∈J)分別表示無(wú)線路由節(jié)點(diǎn)的無(wú)線輸入端口和無(wú)線輸出端口;其中|U|=|V|,|I|=|J|,用a(j)表示無(wú)線路由節(jié)點(diǎn)a的無(wú)線輸出端口j.

        定義3時(shí)間觀察窗口(Window,W)W(t)是一段連續(xù)觀察時(shí)刻點(diǎn)的集合,|W|為觀察窗口的時(shí)間大小(一般用時(shí)鐘周期數(shù)表示),其中t∈[0,|W|-1].

        通常用鏈路的帶寬利用率來(lái)預(yù)測(cè)網(wǎng)絡(luò)中鏈路在下一時(shí)刻的擁塞程度.在NoC中,從路由器a到其鄰居路由器b之間的鏈路la(j)b(i)的帶寬利用率記為ra(j)b(i),它與統(tǒng)計(jì)窗口W內(nèi)已通過(guò)的流量C成正比,與帶寬B成反比:

        (1)

        但在NoC中,存在多個(gè)輸入端口爭(zhēng)用同一輸出端口的情況,此信息更能體現(xiàn)出下一時(shí)刻的鏈路擁塞情況.仿真分析發(fā)現(xiàn),單純的鏈路帶寬利用率只反映了在觀察時(shí)間窗W內(nèi),該輸出端口上過(guò)去已通過(guò)的流量狀況,無(wú)法反映正等待通過(guò)該輸出端口的流量情況.而正在等待通過(guò)的流量更能反映出下一時(shí)刻鏈路的帶寬需求與擁塞狀況.根據(jù)無(wú)線NoC網(wǎng)絡(luò)的通信特點(diǎn),為更準(zhǔn)確地度量某鏈路在下一時(shí)間段的擁塞程度,將兩相鄰無(wú)線路由節(jié)點(diǎn)間無(wú)線鏈路的擁塞測(cè)度CM定義為:

        (2)

        gt,a(j)表示路由器a中,在時(shí)刻t有流量等待通過(guò)該路由器輸出端口j的輸入端口總個(gè)數(shù).Qt,a(j)表示在觀察窗口W內(nèi)的某時(shí)刻t,路由器a中等待通過(guò)該路由器的輸出端口j的所有輸入端口(輸入端口j除外)的流量之和,體現(xiàn)了下一時(shí)間窗口W內(nèi)鏈路上的流量信息,其定義如下:

        (3)

        為簡(jiǎn)化電路復(fù)雜度,在無(wú)線鏈路la(j)b(i)的理論帶寬B及觀察時(shí)間窗口W大小一定時(shí),可直接使用硬件流量計(jì)數(shù)器統(tǒng)計(jì)路由器a的輸出端口j所輸出的比特流來(lái)作為Ca(j)b(i)的值.此外,輸入端口k的流量qt,a(k)a(j)在與其成正比的數(shù)據(jù)平均包長(zhǎng)及微片寬度一定時(shí),Qt,a(j)可看成是路由仲裁(RA)階段等待使用輸出端口j的輸入端口個(gè)數(shù),因此簡(jiǎn)化為使用硬件仲裁計(jì)數(shù)器統(tǒng)計(jì)等待輸出的輸入端口個(gè)數(shù),此統(tǒng)計(jì)在路由仲裁階段同步完成.可見(jiàn),對(duì)無(wú)線路由器中用于求解擁塞測(cè)度CM值的電路原理簡(jiǎn)化后,只需額外增加如圖3所表示的仲裁計(jì)數(shù)器和流量計(jì)數(shù)器,這些硬件部分相對(duì)于整個(gè)無(wú)線路由器的電路開(kāi)銷十分微小.

        由于只允許CTx用于相鄰簇間的相鄰WR間或?qū)γ鎃R間的通信,故CTx的自適應(yīng)信道Acx可供簇內(nèi)的4個(gè)WR的8條無(wú)線鏈路動(dòng)態(tài)復(fù)用.對(duì)CT進(jìn)行動(dòng)態(tài)分配的控制電路DACCM是實(shí)現(xiàn)片內(nèi)自適應(yīng)拓?fù)浼版溌穾拕?dòng)態(tài)調(diào)整的關(guān)鍵模塊,按照自適應(yīng)拓?fù)涞臉?gòu)建規(guī)則,其電路結(jié)構(gòu)如圖4所示,具體工作流程如下:

        (1)設(shè)定觀察時(shí)間窗口W,各LCMU在時(shí)間窗口W內(nèi)開(kāi)始統(tǒng)計(jì)流量及鏈路利用率情況.

        (2)GCMU發(fā)送鏈路擁塞測(cè)度數(shù)據(jù)請(qǐng)求信息給簇內(nèi)的每個(gè)LCMU.

        (3)在時(shí)間窗口W結(jié)束時(shí),每個(gè)LCMU根據(jù)式(2)計(jì)算本地WR在其中2個(gè)方向上的無(wú)線輸出鏈路的擁塞測(cè)度CM值,并將CM值以數(shù)據(jù)包的形式返還給GCMU,返還成功的同時(shí)復(fù)位鏈路擁塞測(cè)度的數(shù)據(jù)域.

        (4)GCMU對(duì)接收到的4個(gè)WR的鏈路擁塞測(cè)度數(shù)據(jù)包分別進(jìn)行解析,經(jīng)由比較器比較分析,以構(gòu)建Torus環(huán)網(wǎng)的跳數(shù)最小化為原則,無(wú)論CM值大小,將自適應(yīng)信道優(yōu)先分配給長(zhǎng)鏈路;當(dāng)有多條長(zhǎng)鏈路時(shí),則將其分配給具有最大CM值的長(zhǎng)鏈路;如果沒(méi)有長(zhǎng)鏈路,則將自適應(yīng)信道分配給具有最大CM值的無(wú)線鏈路,通過(guò)鏈路聚合,將具有靜態(tài)信道的鏈路與動(dòng)態(tài)信道的鏈路合并成一條邏輯鏈路,在提高鏈路帶寬的同時(shí),實(shí)現(xiàn)片內(nèi)上層無(wú)線拓?fù)涞淖赃m應(yīng)調(diào)整;由數(shù)據(jù)選擇器完成CT在簇內(nèi)WR間的動(dòng)態(tài)切換.

        (5)若在一個(gè)時(shí)間窗口W內(nèi),某長(zhǎng)鏈路已完成了數(shù)據(jù)流通信,則該長(zhǎng)鏈路將主動(dòng)放棄該自適應(yīng)信道,并將該自適應(yīng)信道重新分配給該WR內(nèi)的另一無(wú)線鏈路,直至?xí)r間窗口W結(jié)束.

        4 混合型VT-AWiNoC通信機(jī)制

        所提出的混合型VT-AWiNoC架構(gòu),是由下層有線2D Mesh及上層無(wú)線2D Torus所構(gòu)成的分層網(wǎng)絡(luò).在下層有線2D Mesh拓?fù)鋬?nèi)部,采用無(wú)死鎖的確定性XY維序路由算法[2].對(duì)于上層靜態(tài)無(wú)線鏈路和自適應(yīng)無(wú)線鏈路構(gòu)成的虛Torus結(jié)構(gòu)的環(huán)網(wǎng),其內(nèi)部采用添加有向虛通道的TXY路由算法以解決死鎖[12].盡管XY和TXY路由均具有避免死鎖的能力,但對(duì)于分層網(wǎng)絡(luò),所存在的間接依賴關(guān)系會(huì)導(dǎo)致更復(fù)雜的路由死鎖[2,13].對(duì)于這種情況,采用通常打破環(huán)路的方法以避免死鎖是非常困難的,路由算法的邏輯將變得復(fù)雜,使得網(wǎng)絡(luò)性能下降,因此虛通道成為解決死鎖的一種通用方法[2,10].這里直接使用文獻(xiàn)[2]的方法以解決此問(wèn)題,即在每個(gè)有線輸入端口設(shè)置兩個(gè)虛通道供不同方向的數(shù)據(jù)使用.

        當(dāng)VT-AWiNoC中的某兩個(gè)PE間需要傳遞數(shù)據(jù)時(shí),包可能會(huì)通過(guò)有線鏈路,無(wú)線鏈路或二者的混合.為避免源節(jié)點(diǎn)所在塊的多個(gè)PE因通過(guò)同一個(gè)無(wú)線路由器WR而導(dǎo)致?lián)砣?,這里通過(guò)設(shè)置擁塞控制因子,避免過(guò)度使用無(wú)線鏈路導(dǎo)致WR出現(xiàn)熱區(qū),以緩和WR的擁塞問(wèn)題.同文獻(xiàn)[8]的NePA-WiNoC拓?fù)渌捎玫穆酚伤惴?,本文仿真時(shí)將擁塞控制因子值固定為4,即以靜態(tài)方式調(diào)節(jié)上層無(wú)線網(wǎng)絡(luò)和下層有線網(wǎng)絡(luò)的流量分布.

        5 性能分析模型

        文獻(xiàn)[14]針對(duì)基于射頻傳輸線互連(RF-I)的無(wú)線NoC架構(gòu),建立了精確的功耗與延時(shí)模型,顯然不適用于本文采用片上天線互連的無(wú)線NoC架構(gòu).為對(duì)本文所提出的VT-AWiNoC拓?fù)涞男阅苓M(jìn)行準(zhǔn)確評(píng)估,需在仔細(xì)研究片上天線互連的信道傳播模型基礎(chǔ)上,建立完整的基于片上天線互連的無(wú)線NoC架構(gòu)的功耗與延時(shí)模型.

        5.1延時(shí)分析模型

        延時(shí)通常定義為源節(jié)點(diǎn)的頭微片注入時(shí)間與目的節(jié)點(diǎn)接收到尾微片的時(shí)鐘周期長(zhǎng)度.一般來(lái)說(shuō),數(shù)據(jù)包從源節(jié)點(diǎn)至目的節(jié)點(diǎn)的延時(shí)可用節(jié)點(diǎn)平均距離Ψ,也即為全局的包平均延時(shí)來(lái)表示:

        (4)

        (5)

        這里HR、HWR分別表示包到達(dá)目的節(jié)點(diǎn)所經(jīng)過(guò)的有線和無(wú)線路由器的平均跳數(shù),其值主要由拓?fù)浣Y(jié)構(gòu)和路由算法所決定,tR、tWR分別表示有線和無(wú)線路由器的延時(shí),tL、tWL分別為導(dǎo)線連線的有線鏈路延時(shí)和天線對(duì)之間的無(wú)線鏈路延時(shí),LR表示以比特為單位的數(shù)據(jù)包長(zhǎng)度,BWR、BWWL分別為有線鏈路和無(wú)線鏈路帶寬.

        5.2功耗分析模型

        對(duì)無(wú)線NoC而言,功耗可從系統(tǒng)級(jí)和電路級(jí)兩個(gè)層面考慮.系統(tǒng)級(jí)功耗是針對(duì)某一特定拓?fù)浣Y(jié)構(gòu),經(jīng)過(guò)最短路徑收發(fā)所有數(shù)據(jù)包所消耗的功耗單元數(shù)目,通常使用單一性連接矩陣δ來(lái)表示一個(gè)包所經(jīng)過(guò)的跳數(shù)[15].

        鏈路的導(dǎo)線功耗在深亞微米電路中占據(jù)主要成分,而來(lái)自開(kāi)關(guān)的動(dòng)態(tài)功耗又是電路級(jí)功耗的主要部分.與純有線NoC相比,對(duì)于混合型無(wú)線NoC,電路級(jí)功耗分為有線鏈路和無(wú)線鏈路功耗兩部分.其中電路級(jí)有線鏈路功耗Pr-link又包括導(dǎo)線連線的鏈路功耗Pw-link和有線路由器PR的功耗,而有線鏈路的開(kāi)關(guān)功耗Pw-link與數(shù)據(jù)鏈路翻轉(zhuǎn)因子α、端口數(shù)據(jù)寬度Nwire、負(fù)載電容c、供電電壓Vdd和時(shí)鐘頻率f直接相關(guān)[1],故可表示為:

        (6)

        電路級(jí)無(wú)線鏈路功耗Pwi-link主要包含天線對(duì)之間無(wú)線鏈路損耗PL和收發(fā)器功耗Ptransceiver,可表示為:

        (7)

        這里M表示無(wú)線鏈路分配的頻率信道數(shù),PLi和Ptransceiver,i是無(wú)線鏈路中第i個(gè)頻率信道的片上天線和收發(fā)器電路的功耗.對(duì)于實(shí)現(xiàn)片內(nèi)無(wú)線互連的片上天線,采用基于三維笛卡爾坐標(biāo)及射線跟蹤原理所建立的WiNoC片內(nèi)無(wú)線信道傳播損耗模型[16].與文獻(xiàn)[17]的信道模型相比,該模型綜合考慮了無(wú)線NoC所處物理環(huán)境的電導(dǎo)率σ、介電常數(shù)ε和磁導(dǎo)率μ等物理參數(shù),本文的VT-AWiNoC結(jié)構(gòu)中天線對(duì)的損耗PLG表示為[16]:

        PLG=

        (8)

        假設(shè)無(wú)線NoC拓?fù)浣Y(jié)構(gòu)中針對(duì)有線鏈路的單一性連接矩陣為δr-link,無(wú)線鏈路的單一性連接矩陣為δwi-link.采用包平均能耗,即平均每個(gè)包從源節(jié)點(diǎn)路由至目的節(jié)點(diǎn)產(chǎn)生的功耗來(lái)衡量特定拓?fù)湎鹿男阅躘9],則混合型無(wú)線NoC的包平均能耗Ppkt可表示為:

        (9)

        式(9)中Nij表示數(shù)據(jù)包從源節(jié)點(diǎn)i至目的節(jié)點(diǎn)j的以包為單位的通信量,δr-link,ij和δwi-link,ij分別表示單個(gè)數(shù)據(jù)包從源節(jié)點(diǎn)i至目的節(jié)點(diǎn)j所經(jīng)過(guò)的有線鏈路跳數(shù)和無(wú)線鏈路跳數(shù).值得注意的是,若混合WiNoC拓?fù)浣Y(jié)構(gòu)中任何數(shù)據(jù)包從i至j都未經(jīng)過(guò)無(wú)線鏈路,即所有的δwi-link,ij取零時(shí),式(9)則等價(jià)于純有線NoC的包平均能耗.

        6 性能評(píng)估

        為進(jìn)行準(zhǔn)確的功耗性能評(píng)估,混合型WiNoC的有線鏈路功耗Pr-link,包括5*5路由器、有線金屬導(dǎo)線的動(dòng)態(tài)功耗、泄露功耗均通過(guò)配置Orion2.0功耗模型來(lái)獲取[18].對(duì)于20mm*20mm的晶圓片,假設(shè)采用高阻抗硅基底(ρ=5kΩ-cm)以及633μm厚的氮化鋁(AIN)作為絕緣層,根據(jù)式(8),天線對(duì)間距取最大20mm時(shí)的傳播路徑損耗PLG約為32dB(天線對(duì)間距1mm時(shí)約為9dB).無(wú)線NoC中支持16Gbps數(shù)據(jù)速率的收發(fā)器功耗約為36.7mW[19],對(duì)應(yīng)能耗約為2.3pJ/bit.若采用THz的光頻率天線,在最長(zhǎng)的通信距離23mm下,無(wú)線鏈路(包括天線對(duì)和收發(fā)器)的能耗為0.33pJ/bit[9].采用SMIC 90nm工藝庫(kù)在Synopsys Design Compiler中對(duì)圖4中的發(fā)送器動(dòng)態(tài)分配控制電路模塊DACCM進(jìn)行綜合,以評(píng)估實(shí)現(xiàn)自適應(yīng)拓?fù)渌a(chǎn)生的額外能耗與面積開(kāi)銷,同時(shí),各路由器的面積與功耗在45nm下通過(guò)Orion 2.0獲取.DACCM及其它部件的能耗與面積如表1所示.

        基于上述功耗參數(shù),對(duì)基于SystemC的時(shí)鐘級(jí)片上網(wǎng)絡(luò)仿真器Noxim進(jìn)行修改,分別搭建SW-WiNoC、NePA-WiNoC、2LHM-WiNoC以及VT-AWiNoC四種拓?fù)浣Y(jié)構(gòu)的交易級(jí)模型,并嵌入所建立的延時(shí)與功耗分析模型.為保證性能評(píng)估的公平性,實(shí)驗(yàn)中網(wǎng)絡(luò)規(guī)模和通信流圖均采用完全相同的應(yīng)用,分別映射到不同的拓?fù)浣Y(jié)構(gòu)中.資源節(jié)點(diǎn)數(shù)分別為144、324和576.有線鏈路用1GHz的時(shí)鐘驅(qū)動(dòng),設(shè)置無(wú)線鏈路帶寬為16Gbps,為保證兩節(jié)點(diǎn)間無(wú)線與有線鏈路帶寬相等的公平性,設(shè)置微片寬度為16比特,數(shù)據(jù)包長(zhǎng)度在3~7個(gè)微片間隨機(jī)選擇.每個(gè)無(wú)線/有線輸入端口的虛通道數(shù)設(shè)置為3,每個(gè)虛通道緩存深度為4個(gè)微片大小,仿真時(shí)間設(shè)置為10000個(gè)有線時(shí)鐘周期.圖5顯示了四種混合型無(wú)線NoC拓?fù)浜图冇芯€2DMesh NoC在隨機(jī)流量、20%的熱點(diǎn)流量及FFT(Fast Fourier Transform)真實(shí)應(yīng)用下的吞吐率與注入率的關(guān)系.

        表1 DACCM及相關(guān)部件的能耗與面積

        文獻(xiàn)[10]的2LHM-WiNoC實(shí)際上等價(jià)于本文提出的未使用自適應(yīng)信道的拓?fù)浣Y(jié)構(gòu),仿真表明,當(dāng)網(wǎng)絡(luò)規(guī)模為144時(shí),在均勻隨機(jī)流量模型下(如圖5(a)),VT-AWiNoC在注入率在0.4時(shí)接近飽和,純有線2D Mesh拓?fù)湓谧⑷肼蕿?.2時(shí)網(wǎng)絡(luò)就達(dá)到了飽和.在20%的熱點(diǎn)模型流量下(如圖5(b)),VT-AWiNoC在注入率為0.25時(shí)才接近飽和,而純有線2D Mesh拓?fù)湓谧⑷肼蕿?.1時(shí)就接近飽和.采用FFT真實(shí)應(yīng)用作為基準(zhǔn)測(cè)試,將1024點(diǎn)FFT變換的真實(shí)應(yīng)用分解到其中的128個(gè)處理器節(jié)點(diǎn)PE上,每個(gè)PE分別執(zhí)行一個(gè)8點(diǎn)的基-2FFT運(yùn)算,F(xiàn)FT真實(shí)應(yīng)用的評(píng)估發(fā)現(xiàn)(如圖5(c)),VT-AWiNoC的吞吐率比2LHM-WiNoC平均高出15.60%.

        圖6顯示了在不同網(wǎng)絡(luò)規(guī)模下,注入率為0.2時(shí)五種拓?fù)涞钠骄訒r(shí)和包平均能耗對(duì)比.隨機(jī)流量模型下(如圖6(a)),當(dāng)網(wǎng)絡(luò)規(guī)模為144和324時(shí),VT-AWiNoC的平均延時(shí)低于2D Mesh拓?fù)?,但略高于SW-WiNoC拓?fù)涞难訒r(shí),原因在于當(dāng)網(wǎng)絡(luò)規(guī)模較小時(shí),SW-WiNoC得益于更小的網(wǎng)路直徑與平均跳數(shù),但當(dāng)網(wǎng)絡(luò)規(guī)模達(dá)到576或更大時(shí),VT-AWiNoC表現(xiàn)出了更優(yōu)的性能,其平均延時(shí)比SW-WiNoC和2LHM-WiNoC分別低16.52%和23.27%.將1024點(diǎn)FFT變換分解到不同網(wǎng)絡(luò)規(guī)模的128~512個(gè)處理器節(jié)點(diǎn)PE上,每個(gè)PE分別執(zhí)行一個(gè)2~8點(diǎn)的基-2FFT運(yùn)算,F(xiàn)FT應(yīng)用的評(píng)估發(fā)現(xiàn)(如圖6(b)),當(dāng)網(wǎng)絡(luò)規(guī)模達(dá)到576或更大時(shí),VT-AWiNoC的性能增益更明顯,其平均延時(shí)比SW-WiNoC和2LHM-WiNoC分別低17.20%和21.68%.

        不同流量模型與真實(shí)應(yīng)用下的包平均能耗如圖6(c)所示,實(shí)驗(yàn)表明VT-AWiNoC在能耗方面均優(yōu)于其它拓?fù)浣Y(jié)構(gòu).特別是在熱點(diǎn)流量模型下,VT-AWiNoC比2LHM-WiNoC節(jié)省39.19%的能耗,這是因?yàn)闊狳c(diǎn)模型中存在更多的遠(yuǎn)距離通信節(jié)點(diǎn),VT-AWiNoC構(gòu)成了具有更少跳數(shù)的Torus環(huán)網(wǎng),節(jié)省了更多的能耗.此外,采用FFT真實(shí)應(yīng)用作為基準(zhǔn)測(cè)試,針對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)為576的無(wú)線NoC拓?fù)?,?024點(diǎn)FFT變換的真實(shí)應(yīng)用分解到其中的512個(gè)處理器節(jié)點(diǎn)PE上,每個(gè)PE分別執(zhí)行一個(gè)2點(diǎn)的基-2FFT運(yùn)算.通過(guò)FFT真實(shí)應(yīng)用評(píng)估發(fā)現(xiàn)VT-AWiNoC的能耗比2LHM-WiNoC拓?fù)涔?jié)省23.49%.

        自適應(yīng)無(wú)線NoC拓?fù)渑c其它無(wú)線NoC拓?fù)湎啾龋饕黾恿薈T及實(shí)現(xiàn)發(fā)送器動(dòng)態(tài)分配的控制電路模塊DACCM.以節(jié)點(diǎn)數(shù)目為324的網(wǎng)絡(luò)規(guī)模為例,自適應(yīng)拓?fù)渲懈髂K的面積成本開(kāi)銷比重如表2所示.相對(duì)于其它無(wú)線NoC而言,CT與DACCM的面積開(kāi)銷之和所占用的面積成本開(kāi)銷比重為3.41%~7.49%,若將處理單元PE和Cache考慮在內(nèi),其增加的面積開(kāi)銷是可忽略的.實(shí)驗(yàn)表明,一方面以較小的面積成本開(kāi)銷為代價(jià),換來(lái)了NoC性能方面的高增益;另一方面也避免了Torus中長(zhǎng)金屬連線的面積開(kāi)銷與布線限制.

        表2 自適應(yīng)拓?fù)渲懈髂K的面積成本開(kāi)銷比重(節(jié)點(diǎn)數(shù)=324)

        實(shí)驗(yàn)分析證明,所提出的自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu),在性能方面遠(yuǎn)優(yōu)于傳統(tǒng)的有線2D Mesh片上網(wǎng)絡(luò).與其它混合型無(wú)線NoC拓?fù)湎啾?,是一種能獲得更高增益的架構(gòu).這是由于VT-AWiNoC采用基于擁塞測(cè)度與熱點(diǎn)無(wú)線鏈路感知的鏈路帶寬動(dòng)態(tài)分配機(jī)制.與純有線2D Mesh結(jié)構(gòu)相比,通過(guò)引入具有更低能耗的長(zhǎng)無(wú)線鏈路,使包傳輸避開(kāi)了大量中間有線路由節(jié)點(diǎn)和金屬導(dǎo)線;與純有線Torus結(jié)構(gòu)相比,無(wú)需使用較多的跨越整個(gè)拓?fù)涞慕饘匍L(zhǎng)連線,既兼顧了Torus環(huán)網(wǎng)的優(yōu)點(diǎn)又極大地降低了布線難度;與2LHM-WiNoC相比,其上層無(wú)線網(wǎng)絡(luò)可根據(jù)網(wǎng)絡(luò)流量模型自適應(yīng)地調(diào)整發(fā)送器的分配,構(gòu)建虛Torus環(huán)網(wǎng)進(jìn)一步減少了跳數(shù).且當(dāng)網(wǎng)絡(luò)規(guī)模越大時(shí),性能提升愈明顯.

        7 結(jié)論

        本文提出了一種基于虛Torus的自適應(yīng)的混合型無(wú)線NoC拓?fù)浣Y(jié)構(gòu),該結(jié)構(gòu)利用基于擁塞測(cè)度的熱點(diǎn)無(wú)線鏈路自動(dòng)探測(cè)及帶寬動(dòng)態(tài)分配機(jī)制,達(dá)到了根據(jù)不同的通信流量模型自適應(yīng)地調(diào)整鏈路帶寬與拓?fù)浣Y(jié)構(gòu)的目的.實(shí)驗(yàn)結(jié)果表明,該結(jié)構(gòu)與純有線2DMesh NoC相比,以較低的面積開(kāi)銷獲得了近似成倍的性能提升,同時(shí)避免了長(zhǎng)金屬連線的面積開(kāi)銷與布線限制;以其它混合型無(wú)線NoC相比,也獲得了明顯的性能增益.

        [1]楊盛光,李麗,高明倫,等.面向能耗和延時(shí)的NoC映射方法[J].電子學(xué)報(bào),2008,36(5):937-942.

        Yang Sheng-guang,Li Li,Gao Ming-lun,et al.An energy and delay-aware mapping method of NoC[J].Acta Electronica Sinica,2008,36(5):937-942.(in Chinese)

        [2]Wen-Hsiang Hu,Chifeng Wang,Nader Bagherzadeh.Design and analysis of a mesh-based wireless network-on-chip[A].International Conference on PDP[C].Garching,Germany:IEEE,2012.483-490.

        [3]Deb S,Ganguly A,Pande P P,et al.Wireless NoC as interconnection backbone for multicore chips:promises and challenges[J].IEEE Journal on Emerging & Selected Topics in Circuits & Systems,2012,2(2):228-239.

        [4]Bialkowski M,Abbosh A.Wireless intrachip-interchip interconnections utilising tapered slot antennas for ultra-large-scale integration technology[J].IET Microw,Antennas Propagation,2010,4(10):1665-1671.

        [5]Mahmoud S F,Alajmi A R.Characteristics of a new carbon nanotube antenna structure with enhanced radiation in the sub-terahertz range[J].IEEE Transactions on Nanotechnology,2012,11(3):640-646.

        [6]Zhao D,Wang Y.SD-MAC:Design and synthesis of a hardwareefficient collision-free qos-aware MAC protocol for wireless network-onchip[J].IEEE Transactions on Computers,2008,57(9):1230-1245.

        [7]Shouyi Yin,Yang Hu,Zhen Zhang,et al.Hybrid wired/wireless on-chip network design for application-specific SoC[J].IEICE Transactions on Electronics,2012,95(4):495-505.

        [8]Chifeng W,Wen-hsiang H,Bagherzadeh N.A wireless network-on-chip design for multicore platforms[A].Proceedings of the 19th Euromicro International Conference on PDP[C].Ayia Napa,Cyprus:IEEE,2011.409-416.

        [9]Ganguly A,Chang K,Deb S,et al.Scalable hybrid wireless network-on-chip architectures for multicore systems[J].IEEE Transactions on Computers,2011,60(10):1485-1502.

        [10]Ling Wang,Zhihai Guo,Peng Lv,et al.On an overlaid hybrid wire/wireless interconnection architecture for network-on-chip[J].International Journal of Advanced Computer Science and Applications,2014,5(4):168-174.

        [11]Suk-Bok Lee,Saiwang Tam,Loannis Pefkianakis,et al.A scalable micro wireless interconnect structure for CMPs[A].Proceedings of the 15th Annual International Conference on Mobile Computing and Networking[C].New York,USA:ACM,2009.217-228.

        [12]Lu Z,Jantsch A.Flit admission in on-chip wormhole-switched networks with virtual channels[A].International Symposium on System-on-chip[C].Tampere,Finland:IEEE,2004.21-24.

        [13]Fu B,Xu S,Bao W,et al.Dandelion:A locally-high-performance and globally-high-scalability hierarchical data center network[A].International Conference on Computer Communications and Networks[C].Shanghai,China:IEEE,2014.1-8.

        [14]Yiou Chen,Jianhao Hu,Xiang Ling.Topology and mapping co-design for complex communication systems on wireless noc platforms[A].Conference on Industrial Electronics and Applications[C].Melbourne,VIC:IEEE,2013.1442-1447.

        [15]Elmiligi H,Morgan A A,El-Kharashi M W,et al.Power-aware topology optimization for networks-on-chips[A].International Symposium on Circuits and Systems[C].Seattle,WA:IEEE,2008.360-363.

        [16]Jianhua Li,Ning Wu,Yongliang Hu.Modeling and simulation of intra-chip wireless propagation channels for hybrid WiNoC[J].Sensors & Transducers Journal,2013,155(8):86-97.

        [17]Matolak D W,Kaya S,Kodi A.Channel modeling for wireless networks-on-chips[J].IEEE Communications Magazine,2013,51(6):180-186.

        [18]Kahng A B,Li B,Peh L S,et al.ORION 2.0:A power-area simulator for interconnection networks[J].IEEE Transactions on VLSI Systems,2012,20(1):191-196.

        [19]Sujay Deb,Kevin Chang,Xinmin Yu,et al.Design of an energy efficient CMOS compatible noc architecture with millimeter-wave wireless interconnects[J].IEEE Transactions on Computers,2013,62(12):2382-2396.

        黎建華(通信作者)男,1980年生于湖北宜昌.現(xiàn)為南京航空航天大學(xué)博士研究生.主要研究方向?yàn)闊o(wú)線片上網(wǎng)絡(luò)、SoC系統(tǒng)與專用集成電路設(shè)計(jì).

        E-mail:ljh2007@tzc.edu.cn

        吳寧女,1956年生于安徽淮南,碩士,南京航空航天大學(xué)教授,博士生導(dǎo)師.主要研究方向數(shù)字系統(tǒng)理論與技術(shù)、電子系統(tǒng)集成與專用集成電路設(shè)計(jì).

        E-mail:wunee@nuaa.edu.cn

        An Adaptive Hybrid Wireless NoC Topology Structure

        LI Jian-hua1,2,WU Ning1,HU Yong-liang2,ZHANG Xiao-qiang1

        (1.CollegeofElectronicandInformationEngineering,NanjingUniversityofAeronauticsandAstronautics,Nanjing,Jiangsu210016,China;2.InstituteofComputerApplication,TaizhouUniversity,Linhai,Zhejiang317000,China)

        Aimed at the high energy consumption and communication delay due to multi-hop wired links between distant cores of traditional and large-scale network-on-chip(NoC),a virtual Torus-based adaptive wireless NoC(VT-AWiNoC) structure is proposed.The automatic detection and dynamic bandwidth allocation mechanism to hot wireless link based on the sensing parameter for link congestion measurement is adopted.Moreover,the dynamic allocation circuit for transmitter is designed to realize adaptive adjustment of the intra-chip topology and link bandwidth as different traffic patterns.We compare the performance of our proposed VT-AWiNoC to other hybrid wireless NoC topologies by setting up the energy consumption and delay estimate models.Experimental results show that the proposed topology obtains a delay improvement of 16.52% to 23.27% under random traffic pattern,an energy saving per packet of 39.19% under hotspot traffic pattern,a delay improvement of 17.20% to 21.68% and energy saving per packet of 23.49% on real application such benchmark as FFT(Fast Fourier Transform).The proposed topology achieves higher performance gains with small additional area cost.

        wireless network-on-chip(WiNoC);adaptive topology;congestion measurement

        2014-12-29;修回日期:2015-06-24;責(zé)任編輯:覃懷銀

        國(guó)家自然科學(xué)基金(No.61376025);江蘇省產(chǎn)學(xué)研前瞻性聯(lián)合研究項(xiàng)目(No.BY2013003-11);浙江省自然科學(xué)基金(No.LY13F020012)

        TN47

        A

        0372-2112 (2016)06-1420-09

        猜你喜歡
        有線功耗路由器
        買千兆路由器看接口參數(shù)
        通信工程中有線傳輸技術(shù)的改進(jìn)分析
        東方有線點(diǎn)播排行榜
        電影故事(2017年10期)2017-07-18 11:39:14
        揭開(kāi)GPU功耗的面紗
        數(shù)字電路功耗的分析及優(yōu)化
        電子制作(2016年19期)2016-08-24 07:49:54
        通信工程中有線傳輸技術(shù)的改進(jìn)研究
        有線數(shù)字電視網(wǎng)絡(luò)雙向化改造
        “功耗”說(shuō)了算 MCU Cortex-M系列占優(yōu)
        電子世界(2015年22期)2015-12-29 02:49:44
        你所不知道的WIFI路由器使用方法?
        IGBT模型優(yōu)化及其在Buck變換器中的功耗分析
        男人扒开女人双腿猛进视频| 亚洲精彩视频一区二区| 亚洲精品国产av成拍色拍| 国产香蕉视频在线播放| 国产97在线 | 亚洲| 久久尤物AV天堂日日综合| 熟女人妻一区二区在线观看| 国产性感丝袜在线观看| 日本女优免费一区二区三区| 亚洲精品无码av人在线观看国产| 柠檬福利第一导航在线| 国产日韩A∨无码免费播放| 区二区三区亚洲精品无| 亚洲成熟女人毛毛耸耸多 | 伊人久久五月丁香综合中文亚洲 | 国成成人av一区二区三区| 全免费a级毛片免费看无码| 成全高清在线播放电视剧| 岛国精品一区二区三区| 亚洲中文乱码在线观看| 成人免费无码大片a毛片| 国产真实乱人偷精品人妻| 久久无码一一区| 国产精品亚洲av一区二区三区| 四虎影在永久在线观看| 丰满熟妇乱又伦| 污污污国产免费网站| 男女动态视频99精品| 亚洲精品成人无限看| 狠狠色狠狠色综合日日不卡| 高跟丝袜一区二区三区| 少妇人妻字幕精品毛片专区| 最近在线更新8中文字幕免费| 国产精品天堂avav在线| 一区二区三区一片黄理论片| 色欲网天天无码av| 久久久久99精品成人片试看| 女优视频一区二区三区在线观看 | 丰满多毛少妇做爰视频| 亚洲愉拍自拍视频一区| 91久久精品国产综合另类专区|