王曉蕾 胡 巧 杜高明 張多利 歐陽一鳴
(合肥工業(yè)大學(xué)微電子設(shè)計(jì)研究所, 合肥 230009)(合肥工業(yè)大學(xué)教育部IC設(shè)計(jì)網(wǎng)上合作研究中心, 合肥 230009)
三維集成技術(shù)日漸成熟,以它為基礎(chǔ)的三維片上網(wǎng)絡(luò)(3D NoC)成為片上網(wǎng)絡(luò)領(lǐng)域研究中的主要方向[1-2].與二維片上網(wǎng)絡(luò)(NoC)相比,3D NoC具有全局互連短、封裝密度高、體積小等優(yōu)勢(shì),在降低芯片功耗的同時(shí)提高了網(wǎng)絡(luò)的平均通信性能[3].
對(duì)于NoC上的實(shí)時(shí)應(yīng)用而言,不僅需要保證其平均通信性能,而且需要保證最差情形(如網(wǎng)絡(luò)擁塞時(shí))下的通信性能.但由于窮舉、仿真等方法耗時(shí)耗力,且無法得到有效延遲上界,因此片上網(wǎng)絡(luò)延遲上界研究成為NoC研究中的難點(diǎn)之一.李洋[4]針對(duì)不同業(yè)務(wù),在確保網(wǎng)絡(luò)服務(wù)質(zhì)量的基礎(chǔ)上分析優(yōu)化了網(wǎng)絡(luò)的通信延遲.Ahmed等[5]提出了一種新型的LA-XYZ路由算法.虞瀟等[6]提出了一種面向功耗的免死鎖三維全動(dòng)態(tài)3D NoC路由算法,通過引入三維空間中6個(gè)方向的功耗比較,實(shí)現(xiàn)三維全動(dòng)態(tài)路由功能,大大降低了整個(gè)系統(tǒng)的功耗.上述文獻(xiàn)通過改進(jìn)路由算法來優(yōu)化通訊延遲、吞吐量和功耗等,取得了較好的效果,但是其考慮的延遲為平均延遲,而在很多領(lǐng)域,最差性能時(shí)延才是產(chǎn)品性能和可靠性的關(guān)鍵保障.
錢悅等[7]對(duì)比分析了k-ary-2-mesh網(wǎng)絡(luò)及其對(duì)應(yīng)的三維網(wǎng)絡(luò)在最差情形下的通信性能,發(fā)現(xiàn)三維網(wǎng)絡(luò)的平均通信性能雖然更優(yōu),但受垂直信道影響,其最差情形下的通信性能可能劣于其對(duì)應(yīng)的二維網(wǎng)絡(luò),且指出垂直通道(即硅通孔)是影響性能(如延遲上界)的關(guān)鍵因素,但未提出解決方案.文獻(xiàn)[8]采用一種沖突矩陣來表征網(wǎng)絡(luò)的擁堵情況,提出了一種二維片上網(wǎng)絡(luò)延遲上界的分析方法,但所用沖突矩陣復(fù)雜度高,對(duì)沖突的表達(dá)不夠直觀.
針對(duì)上述問題,本文提出了一種硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法.根據(jù)低復(fù)雜度的基于度的沖突矩陣,采用硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法,優(yōu)化業(yè)務(wù)流延遲上界,提升網(wǎng)絡(luò)性能.
圖1為4×3×3大小的3D-NoC結(jié)構(gòu)示意圖.主體為二維網(wǎng)格結(jié)構(gòu),分為3層,每層包含4×3個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)包含路由節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn).其中,每個(gè)路由節(jié)點(diǎn)最多由東(E)、南(S)、西(W)、北(N)、上(U)、下(D)和本地(L)7個(gè)通道組成,上下通道采用TSV進(jìn)行通信[9],其余通道采用片上互連線.
TSV成品率隨著TSV數(shù)目的增多而顯著降低.圖1中TSV數(shù)量相對(duì)較少,成品率較高.但對(duì)于更大的網(wǎng)絡(luò)規(guī)模,TSV需求較多,成品率會(huì)顯著下降,垂直帶寬可能會(huì)成為3D-NoC的通訊瓶頸.因此,進(jìn)行性能分析時(shí)必須考慮垂直鏈路特殊性.
圖1 3D-NoC結(jié)構(gòu)示意圖
目前,基于片上網(wǎng)絡(luò)的性能分析方法大多采用比較簡(jiǎn)單的路由算法,例如單路采用XY方式、隨機(jī)路由等.這些路由算法設(shè)計(jì)簡(jiǎn)單,資源消耗較小,但是數(shù)據(jù)在網(wǎng)絡(luò)傳輸效率較低,擁塞情況嚴(yán)重,會(huì)導(dǎo)致延遲上界增大、存儲(chǔ)緩存空間增大、局部熱點(diǎn)等問題[10].
圖2給出了一個(gè)簡(jiǎn)化的3×3×3大小的三維網(wǎng)格.將節(jié)點(diǎn)分別標(biāo)記為v1~v27.圖中共有f1,f2兩條業(yè)務(wù)流,且f1,f2均流向同一個(gè)目的節(jié)點(diǎn)v26.若采用單路徑路由,則業(yè)務(wù)流沖突明顯,網(wǎng)路延遲較大.針對(duì)此問題,本文對(duì)業(yè)務(wù)流采取全拆分策略,以分散負(fù)載,分析業(yè)務(wù)流延遲上界,優(yōu)化網(wǎng)絡(luò)性能.
圖2 3×3×3結(jié)構(gòu)的多路徑路由示意圖
基于廣泛采用的三維網(wǎng)絡(luò)結(jié)構(gòu)NoC,研究硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法,建立三維坐標(biāo)系,其中X方向和Y方向?yàn)樗狡矫娣较?Z方向?yàn)榇怪狈较?并且Z方向?yàn)楣柰椎某橄螅?/p>
3D NoC中目標(biāo)流定義為所需要研究的業(yè)務(wù)流,沖突流定義為對(duì)目標(biāo)流造成沖突的業(yè)務(wù)流,子流為全拆分情況下所產(chǎn)生的所有子流.全拆分是指在每個(gè)路由節(jié)點(diǎn)都進(jìn)行拆分,且業(yè)務(wù)流拆分后可能方向上的流量是均勻的,規(guī)定業(yè)務(wù)流在源節(jié)點(diǎn)未拆分時(shí)的流量總和為1.網(wǎng)絡(luò)中的業(yè)務(wù)流采用最小多路徑路由的傳輸方式,即業(yè)務(wù)流從源節(jié)點(diǎn)到目的節(jié)點(diǎn)經(jīng)過路由節(jié)點(diǎn)最少的路徑.
以網(wǎng)絡(luò)演算工具[8,11]為網(wǎng)絡(luò)性能模型分析基礎(chǔ),提出硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法.圖3為該優(yōu)化方法流程圖,根據(jù)該流程圖完成三維片上網(wǎng)絡(luò)的延遲上界優(yōu)化問題.
圖3 硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方 法流程圖
采用業(yè)務(wù)流均勻拆分策略,搜索整個(gè)網(wǎng)絡(luò),找出網(wǎng)絡(luò)中所有業(yè)務(wù)流的源節(jié)點(diǎn)和目的節(jié)點(diǎn)之間所有可行路徑.從源節(jié)點(diǎn)開始,在X,Y,Z三個(gè)方向上開始拆分,給定每個(gè)方向的業(yè)務(wù)流拆分比,即節(jié)點(diǎn)拆分比.業(yè)務(wù)流流經(jīng)所有節(jié)點(diǎn)的節(jié)點(diǎn)拆分比的乘積即為鏈路拆分比.定義每條子流的到達(dá)曲線為主流到達(dá)曲線乘以該子流的鏈路拆分比.
以圖2網(wǎng)絡(luò)中的2條流f1,f2為例,f1從源節(jié)點(diǎn)v2流向目的節(jié)點(diǎn)v26,f2從源節(jié)點(diǎn)v5流向目的節(jié)點(diǎn)v26.進(jìn)行業(yè)務(wù)流全拆分時(shí),首先優(yōu)化業(yè)務(wù)流f1,將其設(shè)為目標(biāo)流,則f2為沖突流.采用樹的遍歷算法分別搜索業(yè)務(wù)流f1,f2源節(jié)點(diǎn)到目的節(jié)點(diǎn)的所有可行路徑.如圖4所示,目標(biāo)流f1共有6條可行路徑,沖突流f2共有3條可行路徑,每條路徑對(duì)應(yīng)1條子流,目標(biāo)子流與沖突子流經(jīng)過相同的鏈路節(jié)點(diǎn),即目標(biāo)流和沖突流在路徑1,2,3上產(chǎn)生沖突.
(a)f1(目標(biāo)流)
(b)f1可行路徑
(c)f2(沖突流)
(d)f2可行路徑
圖4路徑搜索
2.3.1基于度的鄰接矩陣
通過樹的遍歷算法,不僅能夠求出每條業(yè)務(wù)流所有子流的到達(dá)曲線,也可得到每條子流需要流經(jīng)的所有鏈路.由此便可推出每條子流在每條鏈路上的節(jié)點(diǎn)拆分比,得到業(yè)務(wù)流基于度的鄰接矩陣.
對(duì)于圖1中的三維片上網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)中路由節(jié)點(diǎn)的度為6,即網(wǎng)絡(luò)中的節(jié)點(diǎn)最多和6個(gè)方向的節(jié)點(diǎn)相鄰,分別為東(E)、西(W)、南(S)、北(N)、上(U)、下(D).按上述方向順序,鄰接矩陣的每一列對(duì)應(yīng)一個(gè)方向,建立基于度的鄰接矩陣Asi,di為
(1)
式中,si,di分別為業(yè)務(wù)流i的源節(jié)點(diǎn)和目的節(jié)點(diǎn);v為網(wǎng)絡(luò)的路由節(jié)點(diǎn)總數(shù);w為網(wǎng)絡(luò)中路由節(jié)點(diǎn)的度;pmn為業(yè)務(wù)流i在第m個(gè)節(jié)點(diǎn)n方向上的節(jié)點(diǎn)拆分比,且
(2)
式中,pav為該業(yè)務(wù)流到達(dá)路由節(jié)點(diǎn)v的所有拆分比之和;pv_w為該業(yè)務(wù)流在節(jié)點(diǎn)v的w方向上的流量與該業(yè)務(wù)流從節(jié)點(diǎn)v流出的總流量的比值.
2.3.2基于度的沖突矩陣
通過基于度的鄰接矩陣建立基于度的沖突矩陣,以表征網(wǎng)絡(luò)的沖突情況.若網(wǎng)絡(luò)中存在k條業(yè)務(wù)流,則每條業(yè)務(wù)流都有一個(gè)屬于自己的鄰接矩陣.遍歷所有業(yè)務(wù)流,可得到整個(gè)網(wǎng)絡(luò)的業(yè)務(wù)流分配信息.定義目標(biāo)流l基于度的沖突矩陣Csl,dl為
(As1,d1+As2,d2+…+Ask,dk)∧Asl,dl-Asl,dl
(3)
式中,cmn為路由節(jié)點(diǎn)m指向n方向的相鄰節(jié)點(diǎn)的路徑鏈路沖突系數(shù),利用鏈路沖突系數(shù)可以描述整個(gè)網(wǎng)絡(luò)中的路徑?jīng)_突大小;∧運(yùn)算定義為
假設(shè)矩陣A,B均為2×2大小的矩陣,且
則有
(4)
圖2中沖突流f2源節(jié)點(diǎn)為v5,其在節(jié)點(diǎn)v5上的總拆分比為1.在節(jié)點(diǎn)v5進(jìn)行均勻拆分,則北(N)和上(U)方向的拆分比均為0.5.采用最小多路徑路由方式,沖突流f2在節(jié)點(diǎn)v8處只能流向上(U)方向,因此,沖突流在節(jié)點(diǎn)v8的U方向上拆分比為0.5.同理可得其他節(jié)點(diǎn)的拆分比.定義業(yè)務(wù)流在不經(jīng)過節(jié)點(diǎn)方向上的拆分比為0,便可得出該沖突流基于度的鄰接矩陣,如圖5(a)所示.根據(jù)式(3),進(jìn)而得到基于度的沖突矩陣,如圖5(b)所示.
圖5基于度的沖突矩陣實(shí)例
由已得的沖突矩陣,依次求出每條目標(biāo)子流的TSV沖突系數(shù).以圖5(b)中的沖突矩陣為例,對(duì)于目標(biāo)流f1,它共有6條子流.路徑1經(jīng)過2條TSV鏈路,即v8→v17和v17→v26,這2條鏈路在目標(biāo)流基于度的沖突矩陣中分別對(duì)應(yīng)于節(jié)點(diǎn)v8的上(U)方向和節(jié)點(diǎn)v17的上(U)方向.而在沖突矩陣中,這2個(gè)位置的元素值分別為0.50和0.75,因此可以得到2條鏈路的TSV沖突系數(shù)分別為0.50和0.75.選擇較大的數(shù)值,得出路徑1的TSV沖突系數(shù)為0.75.同理可以求出其余5條鏈路的TSV沖突系數(shù),即路徑2~路徑6的TSV沖突系數(shù)分別為0.50,0.75, 0.75, 0.25和0.
得到每條目標(biāo)子流對(duì)應(yīng)的TSV沖突系數(shù)后,選擇TSV沖突系數(shù)最小的路徑作為最優(yōu)路徑,其次為次優(yōu)路徑,以此類推.按照路徑的TSV沖突系數(shù)大小把目標(biāo)流的流量分配到部分最優(yōu)路徑上,沖突系數(shù)大的路徑流量分配少,沖突系數(shù)小路徑流量分配多.此例中路徑6的TSV沖突系數(shù)最小為0,對(duì)應(yīng)路徑為最優(yōu)路徑,路徑5為次優(yōu)路徑,以此類推,路徑3和路徑4的TSV沖突系數(shù)相同且都為最大值,因而對(duì)應(yīng)路徑均為最差路徑.由此可知,目標(biāo)流流量按路徑v2→v11→v20→v23→v26分配,其余路徑不分配流量.
由此便可完成目標(biāo)流f1的優(yōu)化.隨后,變換目標(biāo)流,將業(yè)務(wù)流f2作為目標(biāo)流,根據(jù)圖3對(duì)f2進(jìn)行優(yōu)化.本例中,優(yōu)化業(yè)務(wù)流f1后,業(yè)務(wù)流f2中所有子流的TSV沖突系數(shù)都為0,已經(jīng)是最優(yōu)路徑,故無需進(jìn)行流量再分配.
假設(shè)子流fp經(jīng)過的節(jié)點(diǎn)總數(shù)為j,網(wǎng)絡(luò)中所有業(yè)務(wù)流(包括沖突流和目標(biāo)流)經(jīng)過的節(jié)點(diǎn)總數(shù)為r,則計(jì)算單條目標(biāo)子流的等價(jià)服務(wù)曲線的時(shí)間復(fù)雜度為O((j(j+1)/2)r).設(shè)h為目標(biāo)子流數(shù),則計(jì)算目標(biāo)流的延遲上界的時(shí)間復(fù)雜度為O(h(j(j+1)/2)r).
通過實(shí)驗(yàn)驗(yàn)證3D NoC中延遲上界與業(yè)務(wù)流拆分比的關(guān)系,證明所提方法的正確性和有效性.
以SoCLib[12]中的DSPIN片上網(wǎng)絡(luò)為基礎(chǔ),搭建了一個(gè)3×3×3大小的3D NoC仿真模型(見圖6).網(wǎng)絡(luò)中所有路由器是統(tǒng)一的,具有相同的服務(wù)性能.設(shè)路由節(jié)點(diǎn)均提供延遲-速率函數(shù)的服務(wù)曲線β(t)=0.33(t-3)+,其中t表示時(shí)間.該服務(wù)曲線表示路由節(jié)點(diǎn)每3個(gè)時(shí)鐘周期轉(zhuǎn)發(fā)1個(gè)微包,路由器進(jìn)行路由轉(zhuǎn)發(fā)時(shí)有3個(gè)時(shí)鐘周期的最大處理延遲.配置網(wǎng)絡(luò)中的流發(fā)包器每40個(gè)周期發(fā)送4個(gè)微包,且這4個(gè)數(shù)據(jù)包是被連續(xù)發(fā)送的.根據(jù)漏桶模型[8],目標(biāo)流和沖突流都滿足到達(dá)曲線α(t)=0.1t+3.7.設(shè)該3D NoC中有3條業(yè)務(wù)流,業(yè)務(wù)流f1為目標(biāo)流,則f2和f3為沖突流,目標(biāo)流和沖突流都采用全拆分策略.
圖6 3×3×3三維片上網(wǎng)絡(luò)目標(biāo)流優(yōu)化示例
3.2.1延遲與沖突流拆分比的關(guān)系
采用控制變量法,將目標(biāo)流拆分比設(shè)為固定值,設(shè)目標(biāo)流X方向拆分比為0.3,Y,Z方向拆分比分別為0.3和0.4,實(shí)驗(yàn)結(jié)果見圖7.其中,沖突流在X,Y,Z方向的流量總拆分比為1.
圖7 延遲與沖突流拆分比的關(guān)系
由圖7可知,當(dāng)X方向拆分比或Y方向拆分比為0,或者兩者都為0時(shí),目標(biāo)流延遲上界較小;當(dāng)它們均不為0時(shí),目標(biāo)流延遲上界較大,但比較穩(wěn)定.X方向拆分比和Y方向拆分比變化時(shí),延遲上界變化較小,即在沖突流全拆分情況下,延遲上界對(duì)拆分比不敏感.
3.2.2延遲與目標(biāo)流拆分比例的關(guān)系
固定沖突流的拆分比,設(shè)X,Y方向拆分比均為0.3,Z方向拆分比為0.4,實(shí)驗(yàn)結(jié)果見圖8.
圖8 延遲與目標(biāo)流拆分比的關(guān)系
由圖8可知,當(dāng)目標(biāo)流X,Y方向拆分比至少有一個(gè)為0時(shí),目標(biāo)流延遲上界較?。?dāng)X,Y方向拆分比均不為0時(shí),目標(biāo)流延遲上界較大,但較穩(wěn)定.當(dāng)X,Y方向拆分比總和為1時(shí),延遲上界偏大,這是因?yàn)榇藭r(shí)Z方向拆分比為0,所有目標(biāo)子流通過同一條TSV通道,加大了此通道的負(fù)擔(dān),同時(shí)此TSV通道的沖突也較大,導(dǎo)致延遲上界偏大.
對(duì)圖9中目標(biāo)流f1進(jìn)行優(yōu)化.假設(shè)對(duì)于每個(gè)路由節(jié)點(diǎn),非優(yōu)化情況下目標(biāo)流X,Y方向拆分比都為0.3,Z方向拆分比為0.4.對(duì)于優(yōu)化和非優(yōu)化情況,沖突流X方向拆分比設(shè)為0.1.
圖9 目標(biāo)流f1的子流
采用樹的遍歷法搜索目標(biāo)流和沖突流中每一條子路徑,得到?jīng)_突流f2共包含90條子流,沖突流f3共包含6條子流,目標(biāo)流共包含12條子流,搜索路徑見圖6,具體路徑見圖9.根據(jù)TSV沖突系數(shù)分配目標(biāo)流流量,改變沖突流Y方向上的拆分比,分析利用本文方法優(yōu)化前、后的延遲上界,結(jié)果見圖10和圖11.
圖10 優(yōu)化對(duì)比實(shí)驗(yàn)
圖11 優(yōu)化效率
由圖10和圖11可知,對(duì)于任意的沖突流Y方向拆分比,優(yōu)化后的延遲上界均小于優(yōu)化前的延遲上界.但是對(duì)于不同的沖突流Y方向拆分比,利用本文方法對(duì)延遲上界的優(yōu)化效果卻差別很大.這是因?yàn)椴煌臎_突流Y方向拆分比會(huì)得到不同的TSV沖突系數(shù),導(dǎo)致每次選擇的流量分配路徑不相同,從而產(chǎn)生不同的優(yōu)化效果.實(shí)驗(yàn)結(jié)果表明,利用本文方法對(duì)延遲上界優(yōu)化效果明顯,且最大延遲上界優(yōu)化了58.9%.
與文獻(xiàn)[8]中方法相比,本文方法的主要優(yōu)勢(shì)在于:① 利用網(wǎng)絡(luò)演算將2D NoC拓展到3D NoC.② 提出的基于度的沖突矩陣不僅能直觀地表現(xiàn)網(wǎng)絡(luò)的沖突狀態(tài),還能大大降低空間存儲(chǔ)復(fù)雜度.以3×3×3大小的網(wǎng)絡(luò)為例,利用文獻(xiàn)[8]中的沖突矩陣,最多需要使用(3×3×3)2=729個(gè)元素來表現(xiàn)網(wǎng)絡(luò)中的沖突狀態(tài),而本文方法只需要使用(3×3×3)×6=162個(gè)元素,所占存儲(chǔ)空間僅為原沖突矩陣的22.2%,存儲(chǔ)復(fù)雜度從O(n2)降為O(n),大大減少了所需的存儲(chǔ)空間.
1) 針對(duì)3D NoC中的硅通孔特殊結(jié)構(gòu),提出一種負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法.
2) 所提的基于度的沖突矩陣可以清晰直觀地表現(xiàn)出業(yè)務(wù)流在網(wǎng)絡(luò)中的沖突情況.對(duì)于3×3×3大小的網(wǎng)絡(luò),采用基于度的沖突矩陣可將存儲(chǔ)空間降低為文獻(xiàn)[8]中沖突矩陣的22.2%,存儲(chǔ)復(fù)雜度從O(n2)降為O(n).
3) 實(shí)驗(yàn)結(jié)果表明,采用硅通孔負(fù)載全局均衡的3D NoC延遲上界優(yōu)化方法可以有效減少傳輸延遲、優(yōu)化業(yè)遲上界,最大的優(yōu)化效果將延遲上界減小了58.9%.
參考文獻(xiàn)(References)
[1] Gaur M S, Laxmi V, Zwolinski M, et al. Network-on-chip: Current issues and challenges[C]//2015IEEEComputerSociety,InternationalSymposiumonVlSIDesignandTest. Ahmedabad, India, 2015:1-3.
[2] Katabami H, Saito H, Yoneda T. Design of a GALS-NoC using soft-cores on FPGAs[C]//2013IEEE7thInternationalSymposiumonEmbeddedMulticoreSocs. Tokyo, Japan, 2013:31-36. DOI:10.1109/mcsoc.2013.35.
[3] Khayambashi M, Yaghini P M, Eghbal A, et al. Analytical reliability analysis of 3D NoC under TSV failure[J].JEmergTechnolComputSyst, 2015,11(4): 1-16. DOI:10.1145/2700236.
[4] 李洋. 基于QoS保證的2D-mesh片上網(wǎng)絡(luò)延時(shí)評(píng)價(jià)與性能優(yōu)化研究[D]. 長(zhǎng)春:吉林大學(xué)通信工程學(xué)院,2015.
[5] Ahmed A B, Abdallah A B. LA-XYZ: Low latency, high throughput look-ahead routing algorithm for 3D network-on-chip (3D-NoC) architecture[C]//2012IEEEInternationalSymposiumonEmbeddedMulticoreSoCs. Aizu-Wakamatsu, Japan, 2012:167-174. DOI:10.1109/mcsoc.2012.24.
[6] 虞瀟,李麗,張宇昂,等.一種面向功耗免死鎖三維全動(dòng)態(tài)3D NoC路由算法[J]. 電子學(xué)報(bào),2013,41(2):329-334. DOI: 10.3969/j.issn.0372-2112.2013.02.019.
Yu Xiao, Li Li, Zhang Yu’ang, et al. A power-aware dead lock avoid three-dimensional full-adaptive routing algorithm for 3D NoC[J].ActaElectronicaSinica, 2013,41(2):329-334.DOI: 10.3969/j.issn.0372-2112.2013.02.019.(in Chinese)
[7] 錢悅,魯中海,竇強(qiáng),等. 片上網(wǎng)絡(luò)二維和三維結(jié)構(gòu)的通信性能分析[J].計(jì)算機(jī)工程與科學(xué), 2011, 33(3):34-40.DOI: 10.3969/j.issn.1007-130X.2011.03.007.
Qian Yue, Lu Zhonghai, Dou Qiang, et al. Communication performance analysis of the NoCs in 2D and 3D architectures[J].ComputerEngineering&Science, 2011,33(3):34-40. DOI: 10.3969/j.issn.1007-130X.2011.03.007.(in Chinese)
[8] Du G, Zhang C, Lu Z, et al. Worst-case performance analysis of 2-D mesh NoCs using multi-path minimal routing[C]//ACMInternationalConferenceonHardware/SoftwareCodesignandSystemSynthesis. Tampere, Finland, 2012:123-132. DOI:10.1145/2380445.2380469.
[9] 歐陽一鳴,袁吳鈴,梁華國(guó),等. 3D NoC的冗余雙向TSV容錯(cuò)設(shè)計(jì)[J].電子測(cè)量與儀器學(xué)報(bào),2013,27(4):326-333.DOI:10.3724/SP.J.1187.2013.00326.
Ouyang Yiming, Yuan Wuling, Liang Huaguo, et al. Fault-tolerant design of redundant bidirectional TSV on 3D NoC[J].JournalofElectronicMeasurement&Instrument, 2013,27(4):326-333. DOI:10.3724/SP.J.1187.2013.00326.(in Chinese)
[10] 秦光. 多路徑路由網(wǎng)絡(luò)負(fù)載均衡算法研究[J]. 計(jì)算機(jī)仿真, 2011, 28(11):118-121.DOI:10.3969/j.issn.1006-9348.2011.11.028.
Qin Guang. Research of load balance algorithm over multipath network[J].ComputerSimulation, 2011,28(11):118-121. DOI:10.3969/j.issn.1006-9348.2011.11.028.(in Chinese)
[11] Viswanathan N, Paramasivam K, Somasundaram K. Performance comparison of 3D NoC topologies using network calculus[J].LifeScienceJournal, 2013,10(3):4379-4385.
[12] SoClib. Soclib simulation environment [EB/OL]. (2016-10-31)[2018-01-18]. http://soclib.lip6.fr/.