為突破顯示存儲(chǔ)器的技術(shù)瓶頸,采用創(chuàng)新堆疊方案的高帶寬存儲(chǔ)器應(yīng)運(yùn)而生,它不僅擁有更寬的數(shù)據(jù)傳輸通道、比普通的圖形存儲(chǔ)器擁有更高的效率,而且更節(jié)能。
絕大部分電腦組件的技術(shù)都存在一定的技術(shù)限制,例如存儲(chǔ)器的大小、性能、容量受到存儲(chǔ)單元存儲(chǔ)電荷的技術(shù)和連接方式的限制。因而,為了在固態(tài)硬盤上存儲(chǔ)更多的數(shù)據(jù),業(yè)界需要尋找突破這些技術(shù)瓶頸的方法。三星公司首家采用堆疊技術(shù)突破存儲(chǔ)單元存儲(chǔ)的技術(shù)限制,將閃存單元的存儲(chǔ)密度從每芯片32GB提高到256GB,并推出容量高達(dá)2TB的固態(tài)硬盤。而通過(guò)這種堆疊的方案,高帶寬存儲(chǔ)器(High Bandwidth Memory,簡(jiǎn)稱HBM)不僅擁有更高的存儲(chǔ)密度,還可以提供更高的數(shù)據(jù)傳輸通道,擁有更快的傳輸速率,而且更節(jié)能。
AMD的R9 Fury X是第一個(gè)使用HBM顯存的顯示卡,它所使用的HBM顯存通過(guò)4層存儲(chǔ)芯片堆疊而成。因而,R9 Fury X比普通配備GDDR5顯存的顯示卡更節(jié)能,同時(shí),擁有更快的傳輸速率。
除了AMD,韓國(guó)內(nèi)存制造商SK Hynix也是HBM顯存技術(shù)的推動(dòng)者,他們計(jì)劃在2016年推出第二代的HBM顯存,有望能夠進(jìn)一步提高顯示卡的性能,而在同一時(shí)間,使用GDDR5顯存的顯示卡在性能上并沒(méi)有顯著的改進(jìn)。
目前,顯存占據(jù)顯示卡的大部分空間,而且它們的能耗占顯示卡能耗的1/3。由于4K分辨率和虛擬現(xiàn)實(shí)技術(shù)的發(fā)展對(duì)顯示卡存儲(chǔ)器的需求不斷提高,所以在使用GDDR5顯存的顯示卡上,AMD公司為其高端顯示卡配備了8GB的顯存,16組存儲(chǔ)器芯片圍繞著GPU。由于每個(gè)存儲(chǔ)器芯片需要經(jīng)由32條線路連接到GPU,16個(gè)芯片將需要512條連接線路,形成512位(最大)的接口,所以在顯示卡的印刷電路板中,已經(jīng)無(wú)法容納更多的存儲(chǔ)芯片,無(wú)論是空間還是能耗都已經(jīng)達(dá)到了極限。如果要進(jìn)一步地增加顯存,那么只能縮小存儲(chǔ)芯片的尺寸或者增加存儲(chǔ)芯片的存儲(chǔ)密度。
高帶寬存儲(chǔ)器可以解決上述問(wèn)題,并可以兩倍于普通GDDR5顯存的1024位接口與GPU連接。這里,硅通孔(Through Silicon Via,簡(jiǎn)稱TSV)垂直互連技術(shù)和中介層(Interposer)兩項(xiàng)重要的技術(shù)創(chuàng)新是關(guān)鍵。HBM由多個(gè)存儲(chǔ)芯片堆疊而成,每一層包含多個(gè)存儲(chǔ)體,也就是多個(gè)存儲(chǔ)單元的分組。而TSV是一種用于堆疊芯片互連的技術(shù),通過(guò)在硅晶圓上以蝕刻或激光的方式鉆出直徑約為10μm的小孔,再填充銅等金屬,TSV可以實(shí)現(xiàn)多層芯片的連接。1024 TSV將垂直通過(guò)HBM的4個(gè)層,最終通過(guò)小觸點(diǎn)利用微凸點(diǎn)(micro-bumps)技術(shù)與較低級(jí)別的邏輯控制系統(tǒng)連接,它們將組成每個(gè)具有128位帶寬的8個(gè)通道,負(fù)責(zé)存儲(chǔ)器堆棧與GPU或者顯示卡其他輸出端口(例如HDMI顯示器端口或者主板的PCI-E)之間的數(shù)據(jù)傳輸。
HBM與GPU之間的數(shù)據(jù)傳輸是無(wú)法通過(guò)普通的數(shù)據(jù)線來(lái)實(shí)現(xiàn)的,因?yàn)槊總€(gè)HBM與GPU的連接線多達(dá)1 024條,當(dāng)4塊HBM環(huán)繞著GPU時(shí),連接線將超過(guò)4 000條,再加上地址與控制命令的數(shù)據(jù)線,連接線約為5 000條。為此,一個(gè)被稱為中介層的新元件將負(fù)責(zé)HBM與GPU的連接:中介層位于HBM模塊與GPU的下方,原則上,中介層將會(huì)是一個(gè)不用于計(jì)算的芯片,只是負(fù)責(zé)簡(jiǎn)單的連接和引導(dǎo)。數(shù)以千計(jì)的TSV被連接到中介層,通過(guò)小觸點(diǎn)連接,并由中介層導(dǎo)向GPU。
在HBM的架構(gòu)中,中介層要求GPU和HBM彼此相鄰,確保它們盡可能地接近,方可獲得最佳的通信效果,TSV可以良好地散熱。接口方面,每一個(gè)HBM 1024位的連接是普通GDDR5顯存的兩倍,因而,可以以一個(gè)較低的時(shí)鐘頻率實(shí)現(xiàn)每秒512GB的數(shù)據(jù)吞吐量。對(duì)于顯存來(lái)說(shuō)這是一個(gè)新的記錄,而在上述各種因素的影響下,使用HBM顯存的顯示卡可以擁有更低的功耗以及產(chǎn)生更少的熱量。不過(guò),HBM也并不是沒(méi)有缺點(diǎn)的,對(duì)于第一代HBM來(lái)說(shuō),重要的缺點(diǎn)是最大容量只有4GB,對(duì)于游戲或者4K分辨率的內(nèi)容來(lái)說(shuō),這樣的容量是足以應(yīng)付的,但是一些特殊的圖形功能,例如一個(gè)精心設(shè)計(jì)的抗鋸齒系統(tǒng),則需要更多的內(nèi)存。為了滿足未來(lái)的需求,SK Hynix目前正在開(kāi)發(fā)2.0版本的HBM顯存,2016年新一代的HBM將可能用于英偉達(dá)的下一個(gè)顯示卡平臺(tái)Pascal上。每個(gè)2.0版本HBM顯存模塊容量將可以達(dá)到8GB,并且與GPU的數(shù)據(jù)傳輸速率將翻一翻,達(dá)到1TB/s。