費(fèi)躍哲
(中國(guó)電子科技集團(tuán)公司第四十七研究所,沈陽(yáng)110032)
隨著信息技術(shù)的不斷發(fā)展,近年來(lái)大數(shù)據(jù)、云計(jì)算等技術(shù)的應(yīng)用開始變得愈加廣泛,這對(duì)數(shù)字集成電路的可靠性提出了更高的要求。
受諸多因素影響,數(shù)字集成電路在應(yīng)用過(guò)程中很容易出現(xiàn)老化問(wèn)題,這不僅會(huì)使電路成本大大增加,同時(shí)還會(huì)直接影響到集成電路的穩(wěn)定性與可靠性。如果老化問(wèn)題未能得到及時(shí)處理,甚至還有可能會(huì)引發(fā)嚴(yán)重的安全事故。而要想對(duì)這一問(wèn)題進(jìn)行有效預(yù)防,提高數(shù)字集成電路得可靠性,則需要對(duì)電路老化進(jìn)行準(zhǔn)確測(cè)試。
數(shù)字集成電路老化通常是指集成電路在長(zhǎng)時(shí)間使用后,其電路性能在各種因素的影響下逐漸下降,并對(duì)電路可靠性與穩(wěn)定性造成影響。
一般來(lái)說(shuō),集成電路在出現(xiàn)老化問(wèn)題后,工作頻率出現(xiàn)下降,信號(hào)延遲問(wèn)題隨之產(chǎn)生,老化問(wèn)題越嚴(yán)重,工作頻率下降與信號(hào)延遲問(wèn)題就越嚴(yán)重[1]。而從故障現(xiàn)象上來(lái)看,老化主要體現(xiàn)在信息采集的延遲上,數(shù)字集成電路由組合邏輯電路、觸發(fā)器等部分組成,其中邏輯電路負(fù)責(zé)輸出穩(wěn)定信號(hào),而觸發(fā)器則負(fù)責(zé)捕捉這一穩(wěn)定信號(hào)。正常情況下,由于邏輯電路的輸出信號(hào)能夠在一段時(shí)間內(nèi)持續(xù)保持穩(wěn)定,因此觸發(fā)器能夠輕易捕捉到該信號(hào),但在老化的情況下,邏輯電路的輸出信號(hào)不斷退化,使觸發(fā)器無(wú)法完成信號(hào)捕捉,而輸出信號(hào)則會(huì)在觸發(fā)器開始工作之前發(fā)生跳變,進(jìn)而引發(fā)時(shí)序故障。如圖1 所示,當(dāng)SW2 開關(guān)出現(xiàn)故障時(shí),SW3 開關(guān)會(huì)繼續(xù)工作,從而跳過(guò)了SW2 開關(guān),使整個(gè)電路出現(xiàn)時(shí)序故障。
圖1 集成電路故障示意圖
數(shù)字集成電路老化的影響因素有很多,其中影響較大的主要有負(fù)偏置溫度不穩(wěn)定性效應(yīng)、經(jīng)時(shí)擊穿、電遷移、熱載流子注入等幾種。
(1) 負(fù)偏置溫度不穩(wěn)定性效應(yīng)
負(fù)偏置溫度不穩(wěn)定性效應(yīng)主要出現(xiàn)在PMOS 管上,在集成電路運(yùn)行過(guò)程中,PMOS 管的閾值很容易出現(xiàn)電壓漂移的情況,進(jìn)而導(dǎo)致漏極電壓降低,PMOS 管的性能因此下降[2]。PMOS 管導(dǎo)通過(guò)程會(huì)出現(xiàn)一定程度的延緩,信號(hào)傳播時(shí)間也會(huì)延長(zhǎng),這些都會(huì)使集成電路芯片的故障發(fā)生機(jī)率大大增加,并使電路老化現(xiàn)象變得愈發(fā)嚴(yán)重,負(fù)偏置溫度不穩(wěn)定性效應(yīng)示意圖如圖2 所示。
圖2 動(dòng)態(tài)負(fù)偏置溫度不穩(wěn)定效應(yīng)
另外,負(fù)偏置溫度不穩(wěn)定性效應(yīng)的出現(xiàn)還受到很多其他因素的影響,例如溫度、占空比、工作負(fù)載、受壓時(shí)間等。一般來(lái)說(shuō),數(shù)字集成電路所產(chǎn)生的負(fù)偏置溫度不穩(wěn)定性效應(yīng)具有動(dòng)態(tài)化特點(diǎn),整個(gè)效應(yīng)的周期通常可分為應(yīng)力期與恢復(fù)期兩個(gè)階段,在這樣的情況下,要想對(duì)負(fù)偏置溫度不穩(wěn)定性效應(yīng)進(jìn)行可靠性分析,其難度往往會(huì)比較高,計(jì)算工作也比較復(fù)雜。
例如在動(dòng)態(tài)模式下,數(shù)字集成電路閾值的電壓變化會(huì)比較大,在靜態(tài)模式下,數(shù)字集成電路的閾值電壓變化則會(huì)相對(duì)較??;而如果將數(shù)字集成電路的占空比與輸入模式確定下來(lái),則大多數(shù)負(fù)偏置溫度不穩(wěn)定性效應(yīng)都可以通過(guò)偏置PMOS 柵極電源電壓的方式來(lái)解決??梢?,對(duì)于負(fù)偏置溫度不穩(wěn)定性效應(yīng)所導(dǎo)致的一系列老化問(wèn)題,必須要對(duì)數(shù)字集成電路展開全面測(cè)試,并且依據(jù)測(cè)試中的結(jié)果將負(fù)偏置溫度不穩(wěn)定性效應(yīng)恢復(fù)期確定下來(lái),然后對(duì)于負(fù)偏置溫度不穩(wěn)定性效應(yīng)所引起的退化情況進(jìn)行測(cè)量。
(2) 經(jīng)時(shí)擊穿
經(jīng)時(shí)擊穿(TDDB)是與時(shí)間相關(guān)電介質(zhì)擊穿。通常情況下,晶體管的柵氧層具有絕緣特性,但在集成電路運(yùn)行過(guò)程中,由于正電荷的不斷累積,在超過(guò)一段時(shí)間后,累積的正電荷會(huì)擊穿柵氧層,使之失去絕緣性,對(duì)集成電路的正常運(yùn)行造成直接影響[3],導(dǎo)致數(shù)字集成電路的老化。
(3) 電遷移
電遷移是指在高溫環(huán)境下,數(shù)字集成電路的金屬線因電流作用而出現(xiàn)金屬遷移,是數(shù)字集成電路的一種十分常見的老化故障問(wèn)題。
數(shù)字集成電路的精密性非常高,內(nèi)部的互連引線密集,直徑也都非常小,這使得電路內(nèi)部的電流密度相對(duì)較大,在高頻率變化的情況下,很多金屬原子都會(huì)在電流的影響下沿著電子運(yùn)動(dòng)方向而持續(xù)運(yùn)動(dòng),如果某處的金屬原子遷移較多,那么本身就非常細(xì)的金屬線就很可能出現(xiàn)斷裂的情況。
從整體上來(lái)看,電遷移故障的形成原因并不多,通常僅在電源、時(shí)鐘線等處的互連引線上出現(xiàn),引線電流密度與變化頻率越高,出現(xiàn)電遷移現(xiàn)象的機(jī)率也就越高,針對(duì)這一故障,通常都會(huì)通過(guò)增加互連引線寬度的方式來(lái)進(jìn)行規(guī)避,具體寬度需要根據(jù)數(shù)字集成電路的電流密度標(biāo)準(zhǔn)值而定。
(4) 熱載流子注入
熱載流子注入是指電子脫離硅襯底而進(jìn)入柵氧化層,并且會(huì)導(dǎo)致閾值電壓發(fā)生改變。如今電子產(chǎn)品的尺寸越來(lái)越小,而設(shè)備內(nèi)部供電電壓與工作電壓無(wú)法再縮小,這就造成其內(nèi)部集成電路的電場(chǎng)強(qiáng)度與電子運(yùn)動(dòng)速率隨之不斷增加,當(dāng)電子的能量足夠高的時(shí)候,電子會(huì)脫離硅襯底,隧穿進(jìn)入到柵氧化層,從而改變閾值電壓。MOS 器件中熱載流子注入(Hot Carrier Injection, HCI)效應(yīng)的發(fā)生,是源于器件工藝尺寸改變導(dǎo)致的工作異常,因?yàn)闇系乐械臋M向和縱向電場(chǎng)增加,所以在強(qiáng)電場(chǎng)作用下,載流子能量迅速的提高,于是載流子變成熱載流子,并導(dǎo)致一系列的熱載流子效應(yīng)。在深亞微米尺度下,這種效應(yīng)會(huì)減小PMOS 管的閾值電壓,同時(shí)增加NMOS 管的閾值電壓,并影響一些關(guān)鍵的工藝參數(shù),產(chǎn)生長(zhǎng)期的可靠性問(wèn)題。
數(shù)字集成電路老化測(cè)試技術(shù)方法較多,從總體上來(lái)看,可大致分為老化檢測(cè)技術(shù)與老化預(yù)測(cè)技術(shù)兩類[4]。
老化檢測(cè)技術(shù)簡(jiǎn)單來(lái)說(shuō)就是在數(shù)字集成電路出現(xiàn)老化問(wèn)題后,技術(shù)人員利用感知單元對(duì)組合邏輯電路進(jìn)行全面檢測(cè),采集其生成的輸出信號(hào),并對(duì)感知單元與觸發(fā)器的輸出值進(jìn)行比對(duì)分析,以判斷邏輯電路所輸出的信號(hào)是否正確。
在正常情況下,感知單元捕捉到的邏輯電路輸出值會(huì)與觸發(fā)器輸出值相匹配,一旦發(fā)現(xiàn)邏輯電路輸出值與觸發(fā)器輸出值存在差異,則可以判斷該數(shù)字集成電路出現(xiàn)了老化現(xiàn)象[5]。一種典型故障檢測(cè)電路如圖3 所示,當(dāng)電流經(jīng)過(guò)電阻R1 或R2 時(shí),該電路中的小燈泡全部點(diǎn)亮。當(dāng)電流經(jīng)過(guò)R3 時(shí),小燈泡不亮。但如果電流流經(jīng)R3 時(shí)有燈泡點(diǎn)亮,則說(shuō)明該集成電路出現(xiàn)問(wèn)題,需要對(duì)故障進(jìn)行排除。
圖3 故障檢測(cè)專用集成電路
與老化檢測(cè)技術(shù)相比,老化預(yù)測(cè)技術(shù)主要是用于對(duì)數(shù)字集成電路老化的預(yù)測(cè),即在數(shù)字集成電路發(fā)生老化之前,通過(guò)對(duì)電路相關(guān)數(shù)據(jù)參數(shù)的檢測(cè)與比對(duì)分析,來(lái)判斷其是否存在即將老化的跡象。
由于老化必然會(huì)導(dǎo)致集成電路本身性能的下降,因此即便在老化現(xiàn)象發(fā)生后對(duì)其進(jìn)行準(zhǔn)確的老化檢測(cè),也只能夠降低電路老化的影響[6]。而老化預(yù)測(cè)技術(shù)則可以在幫助技術(shù)人員在老化問(wèn)題發(fā)生之前進(jìn)行有效預(yù)防,且不會(huì)對(duì)集成電路造成影響,在優(yōu)化電路性能、大幅度降低電路成本等方面有著非常顯著的優(yōu)勢(shì),因此其應(yīng)用價(jià)值是非常高的[7]。
一般來(lái)說(shuō),對(duì)于數(shù)字集成電路老化的預(yù)測(cè)主要是通過(guò)觀察信號(hào)跳變情況來(lái)實(shí)現(xiàn)。正常運(yùn)行的數(shù)字集成電路會(huì)按順序完成信號(hào)輸出、捕捉、識(shí)別等一系列程序,但在電路老化的情況下,由于信號(hào)捕捉會(huì)出現(xiàn)延遲,因此信號(hào)跳變就會(huì)頻繁出現(xiàn),在測(cè)試過(guò)程中,只需預(yù)先確定可能老化問(wèn)題的區(qū)域,并將其設(shè)置為測(cè)試范圍,就可以通過(guò)持續(xù)觀察進(jìn)行老化預(yù)測(cè),一旦該區(qū)域信號(hào)出現(xiàn)了,那么就說(shuō)明電路具有潛在老化問(wèn)題,接下來(lái)就可以為電路制定針對(duì)性的老化預(yù)防措施[8]。當(dāng)然,由于老化預(yù)測(cè)技術(shù)依賴于信號(hào)跳變現(xiàn)象的觀察,因此比較適用于負(fù)偏置溫度不穩(wěn)定性效應(yīng)所引起的老化問(wèn)題,而對(duì)于其他原因引起的老化,則存在一定的限制。
電路老化本身是一個(gè)比較漫長(zhǎng)的過(guò)程,數(shù)字集成電路在長(zhǎng)時(shí)間使用后,其性能才會(huì)因各種因素的影響而逐漸降低,并可能會(huì)出現(xiàn)老化故障。因此在電路出現(xiàn)時(shí)序故障之前,通常都需要對(duì)電路老化情況進(jìn)行預(yù)測(cè),但當(dāng)數(shù)字集成電路出現(xiàn)較為嚴(yán)重的老化故障時(shí),則需要通過(guò)老化檢測(cè)技術(shù)對(duì)老化故障的原因、嚴(yán)重程度等進(jìn)行深入分析。因此,數(shù)字集成電路老化預(yù)測(cè)技術(shù)和老化檢測(cè)技術(shù)在整體上并不存在著優(yōu)劣之分,實(shí)際應(yīng)用中必須根據(jù)具體情況來(lái)對(duì)兩種技術(shù)進(jìn)行選擇。
從總體上來(lái)看,老化預(yù)測(cè)技術(shù)與老化檢測(cè)技術(shù)的差別體現(xiàn)在以下幾方面。第一,在應(yīng)用時(shí)間方面來(lái)看,老化檢測(cè)技術(shù)只能在數(shù)字集成電路的老化故障發(fā)生后才能夠應(yīng)用,而老化預(yù)測(cè)技術(shù)則必須要在故障發(fā)生前進(jìn)行應(yīng)用;第二,從數(shù)字集成電路的狀態(tài)來(lái)看,老化檢測(cè)過(guò)程中,數(shù)字集成電路的數(shù)據(jù)與狀態(tài)基本已經(jīng)被破壞,而在老化預(yù)測(cè)過(guò)程中,電路中的數(shù)據(jù)或狀態(tài)則并未發(fā)生變動(dòng);第三,在價(jià)格方面,老化檢測(cè)需要對(duì)數(shù)字集成電路的實(shí)際故障進(jìn)行深入分析,所以檢測(cè)成本是非常高的,相比之下老化預(yù)測(cè)在成本上會(huì)更低;第四,老化檢測(cè)對(duì)于檢測(cè)準(zhǔn)確性要求較高,如出現(xiàn)長(zhǎng)期的錯(cuò)誤檢測(cè),其潛在的數(shù)據(jù)的完整性必然會(huì)受到影響,而老化預(yù)測(cè)則只需在預(yù)測(cè)失效前收集到數(shù)據(jù)即可,就能夠保證預(yù)測(cè)結(jié)果的有效性;第五,在實(shí)用性上,老化檢測(cè)與老化預(yù)測(cè)的相關(guān)技術(shù)都可以有效的結(jié)合到其他電路之中,但在老化預(yù)測(cè)的應(yīng)用會(huì)存在一定的限制。
數(shù)字集成電路的工藝尺寸向微型化的方向不斷發(fā)展,對(duì)電路的魯棒性與可靠性產(chǎn)生了很大的影響,老化故障問(wèn)題成為影響數(shù)字集成電路性能、可靠性、穩(wěn)定性的主要原因。面對(duì)數(shù)字集成電路所存在的各種老化故障問(wèn)題,要對(duì)影響因素做多方面的了解和研究,分析研究探討負(fù)偏置溫度不穩(wěn)定性效應(yīng)、經(jīng)時(shí)擊穿、電遷移等老化影響因素的原理與規(guī)律,并在此基礎(chǔ)上對(duì)電路老化預(yù)測(cè)與檢測(cè)技術(shù)進(jìn)行更加靈活的應(yīng)用,實(shí)現(xiàn)對(duì)電路老化問(wèn)題的有效預(yù)防與處理。