張平 袁怡男
英特爾將旗下NAND閃存業(yè)務(wù)出售給SK海力士無(wú)疑是2020年底業(yè)內(nèi)影響最大的消息之一。一直以來(lái),英特爾在存儲(chǔ)產(chǎn)業(yè)上都占據(jù)著相當(dāng)重要的地位,無(wú)論是NAND產(chǎn)品還是傲騰產(chǎn)品,英特爾的競(jìng)爭(zhēng)優(yōu)勢(shì)都是非常出色的??紤]到英特爾近年來(lái)的發(fā)展?fàn)顩r、人事變動(dòng)以及在產(chǎn)品和生產(chǎn)線方面的調(diào)整,出售NAND從而專精于計(jì)算產(chǎn)業(yè),應(yīng)該是英特爾考慮長(zhǎng)遠(yuǎn)后做出的慎重決策。作為一個(gè)獨(dú)立的部門,無(wú)論是在英特爾還是未來(lái)交由SK海力士運(yùn)營(yíng),英特爾的NAND部門依舊擁有業(yè)內(nèi)一流的影響力和技術(shù)研發(fā)能力。為了進(jìn)一步說(shuō)明有關(guān)英特爾出售NAND部門后的一些變化以及NAND部門自己在技術(shù)和產(chǎn)品上的新進(jìn)展,2021年4月,英特爾在上海召開了NAND產(chǎn)品技術(shù)溝通會(huì)議,就這些內(nèi)容做出了詳細(xì)的解釋,并給出了一些新的技術(shù)路線圖和最新的產(chǎn)品信息。
英特爾NAND部門未來(lái)的一些變化
首先英特爾在會(huì)議.上表示,NAND部門從英特爾并入到SK海力士目前分為兩個(gè)階段。第一個(gè)階段的時(shí)間節(jié)點(diǎn)是2021年底,包括NAND SSD相關(guān)知識(shí)產(chǎn)權(quán)和銷售、市場(chǎng)等團(tuán)隊(duì)和員工;第二個(gè)階段,預(yù)計(jì)在2025年3月份最終交割時(shí), SK海力士將支付20億美元余款,并從英特爾收購(gòu)其余相關(guān)資產(chǎn),包括NAND閃存晶圓的生產(chǎn)及設(shè)計(jì)相關(guān)的知識(shí)產(chǎn)權(quán)、研發(fā)人員以及大連工廠的員工。
據(jù)悉,在并入SK海力士后,英特爾NAND業(yè)務(wù)部分會(huì)依舊維持目前全球運(yùn)營(yíng)的模式,并將繼續(xù)之前對(duì)客戶的承諾,同時(shí)不斷推動(dòng)行業(yè)領(lǐng)先的存儲(chǔ)與解決方案創(chuàng)新和落地。
30年的經(jīng)驗(yàn):面向企業(yè)級(jí)的NAND產(chǎn)品
從歷史來(lái)看,英特爾在閃存發(fā)展上是非常有沉淀的。從商業(yè)角度來(lái)看的話,英特爾和三星、SK海力士等廠商不同的是,英特爾的發(fā)展重點(diǎn)并不是消費(fèi)級(jí)市場(chǎng),而是企業(yè)級(jí)市場(chǎng),英特爾的存儲(chǔ)產(chǎn)業(yè)專注數(shù)據(jù)中心客戶端與部分消費(fèi)級(jí)市場(chǎng),完全不介入移動(dòng)端市場(chǎng)。這也是英特爾后期專注于浮柵技術(shù)的原因之一,因?yàn)橛⑻貭栒J(rèn)為,相比其他的技術(shù)路線,浮柵技術(shù)能夠更好地在企業(yè)級(jí)市場(chǎng)中發(fā)揮作用。
在這種市場(chǎng)目標(biāo)之下,英特爾劃分了內(nèi)存和存儲(chǔ)層級(jí)結(jié)構(gòu),也就是我們?nèi)粘?吹降拇鎯?chǔ)金字塔架構(gòu)。在塔頂端的是CPU緩存,接下來(lái)是內(nèi)存。其中內(nèi)存的容量一般為10GB級(jí),其延遲小于0.1微秒。在一般的PC系統(tǒng)中,內(nèi)存后會(huì)跟著使用NAND閃存,其容量一般為10TB級(jí),延遲小于100微秒。但是英特爾在這里加入了2個(gè)層級(jí),分別是傲騰持久內(nèi)存和傲騰存儲(chǔ)。其中前者的容量為大約100GB級(jí),延遲為小于1微秒,后者的容量為TB級(jí),延遲小于10微秒。新加入的兩個(gè)層級(jí)很好地彌補(bǔ)了內(nèi)存到NAND閃存之間存在的巨大延遲鴻溝(從0.1微秒級(jí)別直接提升至100微秒級(jí)別),形成了比較均衡和平滑的存儲(chǔ)等級(jí)陣列。從內(nèi)存到傲騰內(nèi)存、傲騰存儲(chǔ)、NAND SSD,延遲等級(jí)分別為小于0.1微秒、小于1微秒、小于10微秒、小于100微秒,每一個(gè)等級(jí)都以一個(gè)數(shù)量級(jí)的方式向下延伸,很好地降低了系統(tǒng)延遲。
通過(guò)英特爾給出的這個(gè)存儲(chǔ)層級(jí)金字塔,我們可以看出,存儲(chǔ)系統(tǒng)在不同的層級(jí)除了各自的性能參數(shù)外,還有各自的市場(chǎng)目標(biāo)。比如內(nèi)存就是需要高速度和高穩(wěn)定性,目前對(duì)其非易失性等沒(méi)有要求。傲騰內(nèi)存就是通過(guò)非易失性特性和高速度來(lái)彌補(bǔ)內(nèi)存在某些場(chǎng)合下的不足。接下來(lái),傲騰存儲(chǔ)提供的是更高速度的存儲(chǔ)性能,其容量相對(duì)較大,適合于經(jīng)常使用的熱數(shù)據(jù)存儲(chǔ)。在更次一級(jí)的3D NAND SSD等級(jí),因?yàn)榍捌诘男阅芤蠖家呀?jīng)被基本釋放完成。所以在這個(gè)等級(jí)人們需要更高效率、更大容量和更為耐久的存儲(chǔ)設(shè)備。
因此,如何生產(chǎn)更為高效、大容量和耐久的存儲(chǔ)設(shè)備就是英特爾的研發(fā)重點(diǎn)。在這里,英特爾認(rèn)為,浮柵(float gate)技術(shù)生產(chǎn)的NAND產(chǎn)品,可以兼顧這幾個(gè)特點(diǎn)。首先是英特爾對(duì)閃存技術(shù)有持續(xù)30年的投資,形成了非常穩(wěn)定和牢固的技術(shù)體系。其次是采用浮柵搭配CMOS技術(shù)可以實(shí)現(xiàn)目前最高的NAND面密度,也可以搭配QLC技術(shù)實(shí)現(xiàn)每單元容量的提升。第三則是可靠性方面,英特爾認(rèn)為自己的垂直浮柵單元是專門為高可靠性設(shè)計(jì)的,并且從64層TLC到144層QLC,英特爾采用的可靠的單元設(shè)計(jì)也可以使得耐久性實(shí)現(xiàn)跨代提升。
在產(chǎn)品方面,英特爾給出了2021年重點(diǎn)推廣的一些產(chǎn)品,包括面向企業(yè)級(jí)服務(wù)器的英特爾D7-P5500和D7-P5600 (2020年已發(fā)售),新的采用144層QLC技術(shù)面向云存儲(chǔ)的DP-P5510以及同樣采用144層QLC面向溫存儲(chǔ)的D5-P5316,用于傳統(tǒng)服務(wù)器應(yīng)用的144層TLC產(chǎn)品D3-S4520、D3-S4620。在消費(fèi)級(jí)產(chǎn)品方面,英特爾推出了英特爾660p和采用144層QLC技術(shù)的英特爾670p。我們?cè)诤笪倪€對(duì)這些產(chǎn)品和技術(shù)有更深入的解釋。
浮柵技術(shù):英特爾在NAND上的堅(jiān)持和專注
英特爾在非易失性存儲(chǔ)設(shè)備上是有很久的研發(fā)歷史的。根據(jù)英特爾的介紹,從1985年開始英特爾就開始介入非易失性閃存的開發(fā),從1985年到2004年,英特爾推出了數(shù)代NOR閃存。2005年開始介入NAND閃存,從平面時(shí)代開始,生產(chǎn)工藝從65nm一直進(jìn)步至16nm,然后轉(zhuǎn)型推出3D NAND,層數(shù)從32層起步,包括32層TLC、64層TLC一直到2018年的64層QLC、96層TLC以及現(xiàn)在最新的144層QLC或TLC產(chǎn)品。
在過(guò)往的所有開發(fā)歷程中,英特爾一直專注于浮柵技術(shù),即使是在同行轉(zhuǎn)移至電荷陷阱技術(shù)之后,英特爾依舊在浮柵技術(shù)上持續(xù)發(fā)力。那么,什么是浮柵技術(shù)呢?
所謂浮柵技術(shù),是指Float GateMOSFET,簡(jiǎn)稱FGMOS,也被稱為浮動(dòng)?xùn)艠O管或者浮柵晶體管,它是金屬氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管的一種類型。FGMOS的最大的特點(diǎn)在于,柵極首先采用絕緣物質(zhì)和底層隔離,就像漂浮在硅底層之上一樣,因此被稱為浮柵。其他的一些次級(jí)柵極或者控制柵極被沉積在浮柵之上,也通過(guò)絕緣材料與之隔離。由于浮柵在上方、下方都被絕緣材料所阻隔,因此存在其中的電荷能夠在很長(zhǎng)一段時(shí)間內(nèi)保持不變。當(dāng)人們?cè)诟派霞?jí)的控制柵極施加電壓后,由于量子隧道效應(yīng),電子可以通過(guò)絕緣層進(jìn)入浮柵中并被存儲(chǔ)起來(lái),在施加反向電壓后,電荷又可以流出,控制極為方便。
浮柵技術(shù)出現(xiàn)后,由于其存儲(chǔ)電荷和操控電荷的特性,很快就被應(yīng)用在數(shù)據(jù)存儲(chǔ)中。不過(guò)浮柵技術(shù)也并非沒(méi)有缺點(diǎn)。隨著制造工藝不斷縮小,在10nm左右,浮柵技術(shù)所使用的MOSFET中起到絕緣作用的隧道氧化層已經(jīng)變得很薄了,考慮到類似的物質(zhì)耐久性是有限的,大約每厘米1000萬(wàn)伏特,因此在10nm左右的微縮工藝下,浮柵大約只能忍受約10V左右的電壓就會(huì)被擊穿,在這種情況下,電壓和電場(chǎng)的存在,以及電子持續(xù)量子隧道效應(yīng)進(jìn)出,會(huì)破壞絕緣物質(zhì)氧化物中的原子鍵,并降低絕緣物質(zhì)的絕緣能力。這個(gè)過(guò)程被稱為“磨損”。降低了絕緣性的隧道氧化層,會(huì)導(dǎo)致電子從浮柵中泄露出來(lái),從而降低浮柵類型的MOSFET存儲(chǔ)數(shù)據(jù)和表示電壓的能力。
由于浮柵技術(shù)存在一些缺陷(并非不能改進(jìn)),因此三星、SK海力士等廠商選擇了另外一條技術(shù)路線來(lái)實(shí)現(xiàn)自己的多層堆疊NAND的生產(chǎn),這種技術(shù)被稱為電荷陷阱(Chargetrap flash,簡(jiǎn)稱CTF)。從基本架構(gòu)來(lái)看,電荷陷阱技術(shù)是浮柵技術(shù)基于材料的改進(jìn),其最大的特點(diǎn)在于將傳統(tǒng)浮柵MOSFET技術(shù)中制造浮柵使用的摻雜多晶硅改成了氮化硅膜。相比摻雜多晶硅這種接近于導(dǎo)體的材料,氮化硅膜更接近于絕緣體,因此電子流入空穴后會(huì)持續(xù)停滯在里面。三星在介紹電荷陷阱技術(shù)的時(shí)候,將傳統(tǒng)浮柵比喻為“水”,將絕緣層比喻為裝水的“盒子”,當(dāng)“盒子”被磨損的時(shí)候,“水”就會(huì)流出。相比之下,三星將電荷陷阱技術(shù)的氮化硅膜比喻為“奶酪”,當(dāng)電子進(jìn)入“奶酪”后,就被基本固定在其中,即使“奶酪”邊緣的絕緣層破損,那也只有邊緣部分的電子流失,大部分電子還是老老實(shí)實(shí)待在“奶酪”中,持續(xù)釋放自己的電場(chǎng)。電荷陷阱技術(shù)在一定程度上解決了浮柵技術(shù)的隧道氧化層磨損問(wèn)題,同時(shí)還帶來(lái)了一些別的優(yōu)點(diǎn),比如制造工藝更簡(jiǎn)單,存儲(chǔ)單元的間距可以更小一些,隧道氧化層磨損速度更低、產(chǎn)能更高等。不過(guò)電荷陷阱技術(shù)也并非十全十美,由于其結(jié)構(gòu)和材料問(wèn)題,電荷陷阱技術(shù)制造的NAND顆粒,相比傳統(tǒng)的浮柵NAND顆粒,在抗讀取干擾、長(zhǎng)期斷電數(shù)據(jù)保存以及最受人關(guān)注的高溫下存儲(chǔ)耐久性方面存在顯著劣勢(shì)。
在了解了有關(guān)浮柵、電荷陷阱技術(shù)的差異之后,可以看出,考慮到客戶主要面向企業(yè)級(jí)用戶,英特爾持續(xù)采用浮柵技術(shù)是有道理的。從英特爾給出的存儲(chǔ)金字塔來(lái)看,NAND在存儲(chǔ)中處于比較靠后的位置,大量的熱數(shù)據(jù)不會(huì)存儲(chǔ)在NAND中,而是由傲騰接管,這樣一來(lái),NAND中存儲(chǔ)的數(shù)據(jù)應(yīng)該是大量溫?cái)?shù)據(jù)甚至冷數(shù)據(jù),這部分?jǐn)?shù)據(jù)在很長(zhǎng)的時(shí)間內(nèi)可能都不會(huì)讀寫,因此對(duì)存儲(chǔ)穩(wěn)定性是有比較高的要求。另外,在抗讀取干擾和高溫下存儲(chǔ)耐久性方面,浮柵技術(shù)都相對(duì)電荷陷阱技術(shù)有一定的優(yōu)勢(shì),更適合企業(yè)級(jí)用戶使用。
那么,浮柵技術(shù)的磨損又如何改進(jìn)呢?在前文中提到浮柵技術(shù)的磨損主要來(lái)自越來(lái)越先進(jìn)的制造工藝帶來(lái)的越來(lái)越薄的隧道氧化層,其解決問(wèn)題也很簡(jiǎn)單,使用線寬較寬的工藝,同時(shí)在制造中對(duì)隧道氧化層給予一定程度的改善即可。英特爾在發(fā)布會(huì)中提到,他們使用的工藝“要比10nm寬很多”,并且對(duì)閃存產(chǎn)品來(lái)說(shuō),工藝寬度在目前并不是最重要的,因?yàn)檫€有更多的方法可以提高存儲(chǔ)密度。
持續(xù)改進(jìn)的浮柵技術(shù):最高面密度和高可靠性
在發(fā)布會(huì)上,英特爾提到了自己的產(chǎn)品具有最高的面密度,并且能夠?qū)崿F(xiàn)最好的經(jīng)濟(jì)效益。英特爾介紹了一些比較重要的提升存儲(chǔ)密度的技術(shù),比如改善結(jié)構(gòu),使用更小的浮柵單元、使用CuA技術(shù)也就是陣列下CMOS,這個(gè)技術(shù)將NAND的控制電路部分放置在存儲(chǔ)陣列的正下方,從而騰出更多的空間來(lái)給存儲(chǔ)單元,實(shí)現(xiàn)更高的存儲(chǔ)密度。其他的一些關(guān)鍵技術(shù)還包括采用更多的堆疊層數(shù),比如144層堆疊,在數(shù)據(jù)存儲(chǔ)方式上采用QLC,也就是每個(gè)浮柵存儲(chǔ)4bit數(shù)據(jù),相比之前的3bit又帶來(lái)了比較大的存儲(chǔ)密度增長(zhǎng)。
具體到詳細(xì)對(duì)比方面,英特爾使用了美光的置換柵極技術(shù)予以對(duì)比。美光的置換柵極技術(shù)實(shí)際上也是針對(duì)浮柵技術(shù)的結(jié)構(gòu)進(jìn)行了調(diào)整,根據(jù)美光的描述,傳統(tǒng)的浮柵技術(shù)中,通過(guò)絕緣體將每個(gè)單元分開,這帶來(lái)了單元之間的電容效應(yīng)。因此,美光采用的置換柵極技術(shù)將多個(gè)單元構(gòu)建為一個(gè)絕緣體結(jié)構(gòu),消除了單元間的電容,還可以提高耐久性、功率和性能。不過(guò)美光暫時(shí)沒(méi)有給出可量化的參考數(shù)據(jù)。英特爾在這里提出,自己的浮柵技術(shù)由于結(jié)構(gòu)比較簡(jiǎn)單,因此數(shù)據(jù)存儲(chǔ)密度更高一些,此外CuA技術(shù)的應(yīng)用也減少了單元所占的面積。英特爾給出的數(shù)據(jù)是,他們的技術(shù)能夠帶來(lái)最多10%的面密度提升,以及每片晶圓更高的每GB存儲(chǔ)量。
另外,英特爾還給出了垂直浮柵單元的一些技術(shù)細(xì)節(jié),并繼續(xù)對(duì)比了替換柵極技術(shù)的優(yōu)劣。英特爾提到,他們的浮動(dòng)?xùn)艠O技術(shù)擁有良好的編程/擦除閾值電壓窗口,各個(gè)存儲(chǔ)單元之間也有良好的電荷隔離/保留,更適合高密度裸片/驅(qū)動(dòng)器。相比之下,替換柵極技術(shù)需要不斷地對(duì)抗漏電和單元之間的干擾,因此更適合低密度的裸片或者驅(qū)動(dòng)器,性能密度也比較低。另外,英特爾的垂直浮柵閃存單元采用了離散單元隔離的方式,能夠?qū)⒖鐔卧母蓴_風(fēng)險(xiǎn)降低至最低——有意思的是,美光在這里認(rèn)為離散的單元帶來(lái)了電容效應(yīng),目前尚不清楚這里英特爾是否有額外處理。英特爾還特別提到,自己產(chǎn)品的垂直單元中的電子數(shù)量提高了6倍,控制能力也得以大大提升。
在壽命方面,英特爾給出了一個(gè)數(shù)據(jù)示意圖,浮柵對(duì)比電荷陷阱技術(shù)在0天、2天、5年后的總讀取窗口,所謂讀取窗口,是指在數(shù)據(jù)存儲(chǔ)時(shí),不同狀態(tài)下的信號(hào)之間的差異度。比如MLC一次存儲(chǔ)2bit數(shù)據(jù),那么就擁有4種狀態(tài),這4種狀態(tài)之間的差異就是讀取窗口,較低的讀取窗口會(huì)導(dǎo)致數(shù)據(jù)難以讀出??梢钥闯觯姾上葳寮夹g(shù)在5年后的數(shù)據(jù)讀取是遠(yuǎn)低于浮柵技術(shù)的,這對(duì)很多冷存儲(chǔ)數(shù)據(jù)的企業(yè)來(lái)說(shuō)是至關(guān)重要的,因此數(shù)據(jù)中心和企業(yè)級(jí)存儲(chǔ)選擇浮柵技術(shù)的英特爾產(chǎn)品可能會(huì)更有優(yōu)勢(shì)。
在發(fā)布會(huì)上,英特爾還對(duì)有關(guān)NAND閃存的制造過(guò)程做了一些解釋。比如英特爾提到,目前閃存最重要的問(wèn)題并不是光刻工藝,而是刻蝕工藝。正如前文提到的那樣,更先進(jìn)、線寬更窄的光刻技術(shù)對(duì)NAND實(shí)際上并未起到更好的作用,尤其是在壽命、電子容量方面,在TLC、QLC這種多電壓狀態(tài)下,電子容量更是非常重要,因此英特爾雖然沒(méi)有明確提及工藝線寬,但是可能會(huì)采用32nm/28nm級(jí)別的工藝制造,甚至更寬。在刻蝕方面,英特爾明確體積刻蝕過(guò)程主導(dǎo)了目前的3D NAND制造,其制造速度慢、精度要求高,英特爾舉了個(gè)例子:目前的刻蝕工藝是要求人們從埃菲爾鐵塔頂上丟一個(gè)球下去,確保這個(gè)球和目標(biāo)之間的偏移度是厘米級(jí)別的,因此目前英特爾的144層NAND,是通過(guò)3個(gè)48層的顆粒堆疊起來(lái),形成144層NAND,在數(shù)據(jù)存儲(chǔ)模式上采用的QLC。具體到產(chǎn)品上,英特爾在發(fā)布會(huì)上詳細(xì)介紹了有關(guān)D5-P531 6的內(nèi)容。這款SSD是英特爾推出的144層QLC產(chǎn)品中最新的型號(hào)。D5-P5316采用PCIe 4.0接口,最高讀取速度高達(dá)7GB/s,相比第一代QLC產(chǎn)品讀取延遲降低了48%,耐久性提高了5倍。它的4K隨機(jī)讀取為800K、64K隨機(jī)寫入為最高510MBps,128KB隨機(jī)讀/寫為最高7000MB/s和3600MB/s, 4K隨機(jī)QD1的讀寫延遲為120微秒和180微秒,支持U.2接口或者E1.L接口,容量分別為15.36TB和30.72TB兩種,非常適合數(shù)據(jù)中心使用。
在功能方面,D5-P5316支持NVMe的相關(guān)功能,比如熱插拔、內(nèi)監(jiān)測(cè)、外監(jiān)測(cè)、數(shù)據(jù)日志等,其預(yù)期年化故障率低于0.44%,支持端到端數(shù)據(jù)保護(hù),支持?jǐn)嚯姳Wo(hù),數(shù)據(jù)可靠性方面則擁有業(yè)內(nèi)最高的總體讀取窗口等。在使用場(chǎng)景方面,英特爾也給出了一些解釋,比如云存儲(chǔ)(可能需要配合傲騰)、高性能計(jì)算、CND、大數(shù)據(jù)等場(chǎng)合都是非常符合D5-P5316的設(shè)計(jì)和基本特性的。另外,由于D5-P5316的數(shù)據(jù)存儲(chǔ)密度非常高,英特爾給出的數(shù)據(jù)是1U機(jī)架內(nèi)就可以存儲(chǔ)1PB數(shù)據(jù),空間可以減少最多20倍。
總的來(lái)看,作為一個(gè)在存儲(chǔ)業(yè)界摸爬滾打30多年的廠商,英特爾存儲(chǔ)產(chǎn)品在技術(shù)、規(guī)格和性能上依舊是非常出色的,尤其是它根據(jù)企業(yè)及市場(chǎng)的特性和要求,量身定做地推出了大量新的產(chǎn)品和技術(shù),推動(dòng)了企業(yè)級(jí)存儲(chǔ)的發(fā)展。希望未來(lái)(原)英特爾的NAND部門,能夠在新東家和新的商業(yè)環(huán)境下越來(lái)越好,給消費(fèi)者和企業(yè)級(jí)用戶帶來(lái)更多的創(chuàng)新技術(shù)和高品質(zhì)產(chǎn)品。