楊 雪,劉 飛,霍宗亮
(1.中國科學(xué)院 微電子研究所,北京 100029;2.中國科學(xué)院大學(xué) 北京 100864)
鎖相技術(shù)在時鐘系統(tǒng)、通信系統(tǒng)、存儲器中有著重要的應(yīng)用[1-2]。延遲鎖相環(huán)(Delay Locked Loop,DLL)因其能實現(xiàn)鎖相且穩(wěn)定輸出多相時鐘的特性[3-4],廣泛應(yīng)用于存儲器DDR接口電路,以調(diào)整數(shù)據(jù)選通(Data Quantity Strobe,DQS)與數(shù)據(jù)(Data Quantity,DQ)的相位關(guān)系[5]。開放NAND閃存接口標(biāo)準(zhǔn)(Open NAND Flash Interface specification,ONFI)是連接NAND Flash存儲器和控制芯片的國際接口標(biāo)準(zhǔn)[6],其對雙倍速率非易失性存儲器(NonVolatile-Double Data Rate,NV-DDR、NV-DDR2/3)為代表的高速數(shù)據(jù)傳輸做出嚴(yán)格的時序規(guī)定。延遲鎖相環(huán)具有低噪聲特性,很適合用于NAND Flash接口的高速時鐘產(chǎn)生電路。目前最新的ONFI 4.2國際標(biāo)準(zhǔn)下NV-DDR2/3接口的數(shù)據(jù)傳輸速率為66 MT/s~ 1600 MT/s,由于DQS的雙邊沿均觸發(fā)數(shù)據(jù)傳輸,所以要求延遲鎖相環(huán)的工作范圍需至少覆蓋[33 MHz,800 MHz]。而且高數(shù)據(jù)傳輸速率時,對延遲鎖相環(huán)的鎖定精度也有較高要求,因此延遲鎖相環(huán)設(shè)計必須兼顧寬頻率范圍和高精度。
ONFI標(biāo)準(zhǔn)規(guī)定NAND Flash寫操作下,DQS邊沿對齊DQ的中間區(qū)域以保證數(shù)據(jù)采樣的準(zhǔn)確性;讀操作時DQS與DQ沿同步。因此延遲鎖相環(huán)需要為讀寫通道提供不同相位延遲,這可通過四相輸出延遲鏈實現(xiàn)[4]。四相輸出延遲鏈的結(jié)構(gòu)如圖1所示,由4個相同的延遲塊組成。當(dāng)輸出時鐘CLK360恰好為輸入時鐘CLKin延遲一個TCLKin得到的時鐘時,延遲鏈產(chǎn)生均勻的四相時鐘CLK90、CLK180、CLK270、CLK360。
圖1 四相輸出延遲鏈
延遲鎖相環(huán)的工作頻率范圍和鎖定精度受延遲鏈的總長度和最小單位延遲限制,通常采用粗延遲鏈與精延遲鏈相結(jié)合的延遲鏈結(jié)構(gòu)來實現(xiàn)寬鎖頻和精鎖相[7-10]。但是受延遲鏈長度有限和功耗約束的影響,延遲鎖相環(huán)的設(shè)計必須在寬范圍和高精度之間折中。比如文獻(xiàn)[7-8]為實現(xiàn)寬鎖頻范圍(能在低頻下鎖定),延遲鏈的單位延遲設(shè)計得較大,從而降低了鎖定精度;文獻(xiàn)[9-10]采用單位延遲小的延遲鏈以實現(xiàn)高精度,但是鎖定范圍有限,無法在100 MHz以下的頻段內(nèi)實現(xiàn)鎖定。傳統(tǒng)的四相位延遲鎖相環(huán)電路無法兼顧寬頻鎖定和高精度的要求,這是目前亟需解決的設(shè)計挑戰(zhàn)。
筆者提出了一種能自適應(yīng)調(diào)整帶寬的可配置延遲鏈結(jié)構(gòu)延遲鎖相環(huán),通過可配置延遲鏈和自適應(yīng)輸入時鐘頻率的控制方法,具有高精度和寬鎖頻范圍的優(yōu)點,可滿足ONFI 4.2對NV-DDR接口的時鐘產(chǎn)生要求。
筆者設(shè)計的延遲鎖相環(huán)的整體結(jié)構(gòu)如圖2所示,由鑒相器、粗/精碼發(fā)生器、可配置數(shù)控延遲鏈和自適應(yīng)模塊組成。圖中可配置延遲鏈由4個相同的可配置粗鏈(Coarse Delay Line,CDL)和精鏈(Fine Delay Line,F(xiàn)DL)組成,鎖定時產(chǎn)生均勻的四相輸出時鐘。
延遲鎖相環(huán)的典型工作過程為先粗鎖后精鎖的兩步鎖定[7]:首先,基于時數(shù)轉(zhuǎn)換器(Time-to-Digital Converter,TDC)結(jié)構(gòu)的粗碼發(fā)生器調(diào)整粗延遲鏈,快速完成鎖頻;然后鑒相器比較經(jīng)過粗鎖得到的輸出時鐘與參考時鐘的相位關(guān)系,精碼發(fā)生器根據(jù)鑒相器產(chǎn)生的控制信息進(jìn)一步調(diào)整精延遲鏈,完成鎖相。
增加自適應(yīng)控制和可配置延遲鏈后,延遲鎖相環(huán)先配置延遲鏈的工作范圍,再執(zhí)行兩步鎖定:自適應(yīng)模塊首先測量CLKin的頻率,并輸出控制碼S
圖2 延遲鎖相環(huán)整體電路結(jié)構(gòu)
數(shù)控延遲鏈(Digital Control Delay Line,DCDL)的延遲范圍決定延遲鎖相環(huán)能鎖定的頻率范圍,其由4組粗鏈(CDL)和精鏈(FDL)串聯(lián)構(gòu)成。其中CDL由M個粗延遲單元(Coarse Delay Unit,CDU)級聯(lián)得到,F(xiàn)DL由N個精延遲單元(Fine Delay Unit,F(xiàn)DU)級聯(lián)組成,如圖3所示。因此DCDL總共包含4M級CDU和4N級FDU。
圖3 CDL和FDL的結(jié)構(gòu)原理圖
TCDL,min和TFDL,min分別定義CDL和FDL的最短延遲,tCDU和tFDU分別表示CDL和FDL的單位延遲。所以DCDL的最短延遲TDCDL,min應(yīng)滿足
TDCDL,min=4TFDL,min+TFDL,min。
(1)
DCDL的最長延遲TDCDL,max應(yīng)滿足
TDCDL,min=TDCDL,min+(4MtCDU+4NtFDU。
(2)
因此,延遲鎖相環(huán)能工作的最高頻率為
1.3.2 葡萄糖標(biāo)準(zhǔn)曲線的繪制。精密稱取干燥恒重的標(biāo)準(zhǔn)葡萄糖10 mg,定容于100 mL容量瓶中,配制成濃度為0.1 mg/mL的葡萄糖標(biāo)準(zhǔn)溶液。精密移取0.2、0.4、0.6、0.8、1.0、1.2 mL的葡萄糖標(biāo)準(zhǔn)品溶液,分別置于具塞試管中,依次加水定容至2 mL,另取2.0 mL蒸餾水作空白對照。然后加入1.0 mL濃度5%的苯酚溶液,搖勻,迅速加入5 mL濃硫酸,搖勻后待試管冷卻至室溫即可。在波長490 nm處測定吸光值,以所測吸光值為縱坐標(biāo),標(biāo)準(zhǔn)葡萄糖濃度為橫坐標(biāo),繪制標(biāo)準(zhǔn)曲線,并求出線性回歸方程及相關(guān)系數(shù)。
(3)
最低頻率為
(4)
其中,Tint為延遲鏈中其他控制電路固有延遲的總和。
延遲鎖相環(huán)為了能在更低頻率下鎖定,應(yīng)減小fmin,依據(jù)式(4),需要增大TDCDL,max。依據(jù)式(2),可以通過增加CDU/FDU串聯(lián)的級數(shù)(M、N)或者單位延遲(tCDU和tFDU)實現(xiàn)提高TDCDL,max。若直接增加CDU和tFDU,則會導(dǎo)致DCDL的最小單位延遲變大,從而降低延遲鎖相環(huán)的鎖定精度。
傳統(tǒng)的CDU結(jié)構(gòu)[8]如圖4(a)所示,tCDU固定為2tNAND(tNAND為NAND門延遲),且TCDL,min= 2tNAND=tCDU。因此,如果簡單增大tCDU,則可以得到更大的TDCDL,max,但會增大TCDL,min。依據(jù)式(1)和式(3),fmax隨之下降,導(dǎo)致延遲鎖相環(huán)無法在高頻下精準(zhǔn)鎖定。因此只能增加級聯(lián)個數(shù)(M,N)來擴(kuò)展鎖頻范圍,給實際物理設(shè)計帶來困難。為解決這一設(shè)計難題,筆者提出如圖4(b)所示結(jié)構(gòu)的可配置延遲單元。在輸入端插入多條延遲路徑,單位延遲擴(kuò)展為2(tNAND+tVAR),其中tVAR為插入的延遲,該延遲是可變的。因此單位延遲是可配置的。延遲單元由此可以根據(jù)不同時鐘頻率選擇不同的延遲時間,在低頻下配置大單位延遲,在高頻下配置小單位延遲,因而能同時滿足延遲鎖相環(huán)寬頻鎖定和高鎖定精度的要求。
如圖4(b)所示,可配置延遲單元由多路徑buffer通路和Sel個選擇開關(guān)組成,控制信號S
圖4 基礎(chǔ)和可配置的CDU結(jié)構(gòu)
延遲鎖相環(huán)執(zhí)行先粗鎖后精鎖的鎖定過程,因此FDL的總長度(TFDL,max)需要覆蓋CDL的單位延遲(tCDU)才能保證鎖定過程的邏輯正確性,即
tCDU≤NtFDU=TFDL,min,
(5)
其中,tFDU為FDL的單位延遲,同時為DCDL的最小單位延遲。由于延遲鏈為四相輸出結(jié)構(gòu),所以DLL的鎖定精度Tstep應(yīng)為
Tstep=4tFDU。
(6)
圖5 電容器結(jié)構(gòu)的FDU
為滿足式(5),在CDU采用圖4(b)的可配置延遲單元結(jié)構(gòu)后,F(xiàn)DL同樣需要為可配置結(jié)構(gòu)。在高頻下,tCDU約為2tNAND,此時FDU選擇電容器結(jié)構(gòu)[11]以實現(xiàn)更小的tFDU,提高鎖定精度。電容器為CMOS傳輸門結(jié)構(gòu),如圖5所示。在F=1和F=0的情況下,CMOS傳輸門的等效電容和電阻值不相同,即相當(dāng)于F開關(guān)導(dǎo)通和關(guān)斷下CLK經(jīng)過FDU的傳播延遲不同。因此,tFDU等于這兩種情況下的延遲差。
合理地設(shè)計不同配置下延遲鏈的延遲時間范圍是確保延遲鎖相環(huán)電路強(qiáng)壯性的必要條件。為防止切換過程中受到工藝偏差、電壓和溫度變化(PVT)等外界因素影響而出現(xiàn)無法鎖定的頻點,相鄰的延遲范圍需要相互覆蓋。由于可配置延遲單元有Sel種配置情況,所以可配置延遲鏈也有Sel種配置情況,由S
TDCDL,max|S=1>TDCDL,min|S=1。
(7)
所以,基于可配置數(shù)控延遲鏈結(jié)構(gòu)的延遲鎖相環(huán)可以大大降低能鎖定的最低頻率,擴(kuò)展延遲鎖相環(huán)的鎖頻范圍。除此之外,在高頻時鐘輸入時,選擇電容器結(jié)構(gòu)的FDU來實現(xiàn)小單位延遲,從而滿足高精度的要求。
自適應(yīng)控制電路用于產(chǎn)生可配置延遲鏈的選擇信號,將輸入時鐘的頻率轉(zhuǎn)換為數(shù)字碼的形式,從而選擇延遲鏈的配置。TDC電路能快速衡量時間間隔,并以數(shù)字形式輸出,非常適用于鑒頻電路[12]。在TDC結(jié)構(gòu)鑒頻器的基礎(chǔ)上,復(fù)用可配置數(shù)控延遲鏈衡量CLKin的周期長度,實現(xiàn)自適應(yīng)控制電路。
自適應(yīng)控制電路的具體結(jié)構(gòu)如圖6(a)所示,由移位邏輯、D觸發(fā)器、MUX組成。在衡量輸入時鐘CLKin的周期長度時,可配置延遲鏈的粗碼和精碼均為全1狀態(tài),保持延遲鏈?zhǔn)冀K處于最大延遲狀態(tài)。另外,延遲鏈的輸入端增加1個多路選擇器(MUltipleXer,MUX),用來選擇可配置延遲鏈的輸入信號。
圖6 自適應(yīng)控制的電路結(jié)構(gòu)和時序圖
當(dāng)延遲鎖相環(huán)啟動后,進(jìn)入自適應(yīng)控制產(chǎn)生過程。此時CLKin經(jīng)過2個D觸發(fā)器得到相隔1個TCLKin的CLKstart和CLKend信號。在Mux信號為低時,CLKstart進(jìn)入延遲鏈傳播,CLKend采樣CLK360的電平信息,得到CLKs,通過CLKs采樣值,判定此時延遲鏈的配置是否能覆蓋CLKin的周期長度。如果延遲鏈的延遲時間覆蓋CLKin的周期長度,則此時延遲鏈的配置合理;否則選擇下一個更長的延遲鏈的配置,直到能覆蓋為止。
如圖6(b)所示,配置選擇信號S
自適應(yīng)控制電路能根據(jù)輸入時鐘頻率產(chǎn)生相應(yīng)的控制信號,自動選擇合適的延遲鏈偏置,能自動跟蹤輸入時鐘頻率并進(jìn)行切換,而不需要片外輸入控制信號,從而實現(xiàn)自適應(yīng)帶寬。另外,自適應(yīng)控制電路可以自動調(diào)整延遲鏈的延遲路徑配置,能適應(yīng)PVT環(huán)境變化,提高電路的強(qiáng)壯性。
基于SMIC 28nm HKCMOS工藝,進(jìn)行帶寬自適應(yīng)式延遲鏈的延遲鎖相環(huán)的設(shè)計和驗證??紤]寬范圍和高精度多相位時鐘產(chǎn)生的要求,選擇CDU和FDU的級數(shù)為16(M=N=16)。為減少面積,加快鎖定速度,并降低控制電路復(fù)雜度,延遲線的配置情況優(yōu)化設(shè)計為2種(Sel=2),即依靠S=1和S=0來選擇快鏈和慢鏈。
在不同PVT環(huán)境和配置情況下延遲鏈的設(shè)計需要滿足式(5)的要求,即FDL的總長度(TFDL,max)需要覆蓋CDL的單位延遲(tCDU)才能保證粗鎖和精鎖的兩步鎖定過程的精度要求。如圖7所示,仿真驗證結(jié)果表明,快鏈和慢鏈在不同PVT條件下的TFDL,max均大于tCDU,符合設(shè)計要求。另外,在25 ℃、0.9 V電源電壓、tt工藝角下,高頻輸入(輸入時鐘頻率為250 MHz~1.6 GHz)時,快FDL鏈的總延遲TFDL,max|S=1為67.2 ps,依據(jù)式(5)~(6),延遲鎖相環(huán)的鎖定精度A= 4tFDU= 4(TFDL,max|S=1/N)= 4(67.2 ps/16)=17 ps,符合延遲鎖相環(huán)高精度4相位產(chǎn)生的要求。
圖8顯示不同PVT條件下快鏈和慢鏈的延遲范圍,慢鏈的最小延遲在不同PVT環(huán)境下均大于快鏈的最大延遲,符合式(7)的要求。在-40℃、1.0 V電源電壓、ff工藝角(最快情況)下,延遲鏈的最長延遲(TDCDL,max)能達(dá)到31 ns;在125 ℃、0.8 V電源電壓、ss工藝角(最慢情況)下,延遲鏈的最短延遲(TDCDL,min)能達(dá)到1 ns;依據(jù)式(3)~(4)可知,在各種PVT下延遲鎖相環(huán)的鎖頻范圍均覆蓋[33 MHz,800 MHz],滿足ONFI 4.2下NAND Flash高速接口對延遲鎖相環(huán)電路的鎖頻范圍要求。
圖7 TFDL,max與tCDU在不同配置和 PVT條件下的仿真結(jié)果 圖8 DCDL的延遲范圍在不同配置和PVT條件下的仿真結(jié)果
綜上所示,仿真結(jié)果表明,筆者采用的可配置延遲鏈結(jié)構(gòu)能實現(xiàn)延遲鎖相環(huán)所需求的寬范圍和高精度,符合ONFI 4.2標(biāo)準(zhǔn)下NAND Flash高速接口的應(yīng)用需求。
圖9為在典型25 ℃、0.9 V電源電壓、tt工藝角下延遲鎖相環(huán)整體電路的關(guān)鍵信號仿真結(jié)果。延遲鏈在初始時均配置為快鏈,即選擇信號S=1。圖9(a)所示為1.6 GHz高頻輸入時延遲鎖相環(huán)的鎖定過程,此時延遲鏈配置為快鏈鎖定,S保持高電平,且粗碼C<16∶1>為全0,控制延遲鏈處于最短延遲狀態(tài)。圖9(b)所示為22 MHz低頻時延遲鎖相環(huán)的鎖定過程,此時延遲鏈配置自動切換為慢鏈鎖定,即S自動從‘1’狀態(tài)切換為‘0’。此時自動控制電路跟蹤C(jī)LKin頻率,自動從快鏈切換為慢鏈,與理論分析一致。且粗碼C<16∶1>為全1,控制延遲鏈處于最長延遲狀態(tài)。仿真驗證結(jié)果表明,該延遲鎖相環(huán)在典型下的鎖頻范圍為[22 MHz,1.6 GHz],且鎖定后能產(chǎn)生均勻的四相時鐘。
(a) CLKin頻率為1.6 GHz
(b) CLKin頻率為22 MHz
筆者設(shè)計的延遲鎖相環(huán)性能參數(shù)與參考文獻(xiàn)的結(jié)果對比如表1所示。從表1中可以看出,筆者設(shè)計的延遲鎖相環(huán)能實現(xiàn)寬鎖頻范圍和高鎖定精度,適用于ONFI 4.2國際協(xié)議標(biāo)準(zhǔn)的NAND Flash高速接口電路。
表1 DLL關(guān)鍵指標(biāo)與參考文獻(xiàn)[7]和[10]對比
針對ONFI 4.2協(xié)議對NAND Flash高速接口時序的要求,基于SMIC 28nm HKCMOS工藝,筆者設(shè)計了一種具有帶寬自適應(yīng)式延遲鏈結(jié)構(gòu)的四相輸出全數(shù)字。該延遲鎖相環(huán)通過自適應(yīng)式控制電路和可配置延遲鏈結(jié)構(gòu),可根據(jù)輸入時鐘的頻率自適應(yīng)地調(diào)整延遲鏈的帶寬,實現(xiàn)寬范圍和高精度的鎖定。驗證結(jié)果表明,該延遲鎖相環(huán)能實現(xiàn)[22 MHz,1.6 GHz]的寬頻鎖定,鎖定精度為17 ps,滿足基于ONFI 4.2國際標(biāo)準(zhǔn)的NAND Flash接口時鐘同步電路的設(shè)計要求。