曾慶鍇,崔帥,陸宇歷,衡婷,張逸凡,張愛麗
(1.中科院微小衛(wèi)星創(chuàng)新研究院,上海 201203; 2.上海復(fù)旦微電子集團(tuán)股份有限公司,上海 201203)
隨著微電子技術(shù)的發(fā)展,單個(gè)集成電路的功能越來(lái)越強(qiáng)大,與之伴隨的是對(duì)外引腳密度的要求越來(lái)越高。其中,外引線呈面陣式排列的球柵陣列(BGA, Ball Grid Array)封裝結(jié)構(gòu)在引腳超細(xì)間距指標(biāo)上具有極大的優(yōu)勢(shì)[1]。然而,由于焊球高度所限,元器件與印制板間距較小,BGA在長(zhǎng)壽命、極端溫度應(yīng)力、惡劣機(jī)械應(yīng)力等應(yīng)用環(huán)境下存在風(fēng)險(xiǎn)[2]。為滿足軍用、宇航等高可靠應(yīng)用場(chǎng)景,柱柵陣列(CGA, Column Grid Array)作為一種加強(qiáng)型BGA封裝隨之產(chǎn)生。CGA采用焊柱作為外引線,有效提高了物理高度,使外引線具有更好的柔韌性。相比于BGA封裝,CGA封裝在散熱和焊點(diǎn)疲勞等技術(shù)問題上做出有效的優(yōu)化,成為高可靠領(lǐng)域的理想方案[3]。
本文對(duì)型號(hào)研制過(guò)程中某CGA封裝集成電路的失效案例進(jìn)行了電性分析、材料分析和故障復(fù)現(xiàn)驗(yàn)證。試驗(yàn)結(jié)果表明非密封型金屬-陶瓷封裝結(jié)構(gòu)會(huì)發(fā)生與塑封器件類似的popcorn效應(yīng)從而導(dǎo)致器件失效。通過(guò)本案例的分析,為加強(qiáng)器件固有可靠性和電裝質(zhì)量提供了思路。
上海微小衛(wèi)星工程中心承研的某批產(chǎn)衛(wèi)星M9、M10單機(jī)在地面整機(jī)測(cè)試階段,發(fā)現(xiàn)某型號(hào)規(guī)格FPGA器件執(zhí)行回讀刷新功能時(shí)報(bào)回讀錯(cuò)誤,除回讀錯(cuò)誤外其它系統(tǒng)功能正常。發(fā)生回讀錯(cuò)誤的器件分別位于M9單機(jī)2號(hào)位置(下文簡(jiǎn)稱“M9_#2”)和M10單機(jī)1號(hào)位置(下文簡(jiǎn)稱“M10_#1”),并確認(rèn)兩只問題器件為同一批次產(chǎn)品。
經(jīng)定位,回讀異常區(qū)域在die左上角接近IO bank5位置,回讀錯(cuò)誤發(fā)生在相同位線(BL_580)。針對(duì)M9_#2和M10_#1的FPGA中回讀錯(cuò)誤的位,測(cè)試CLB中邏輯功能,回讀失效區(qū)域。通過(guò)對(duì)涉及的CLB模塊進(jìn)行測(cè)試,發(fā)現(xiàn)M9_#2最左邊第一個(gè)CLB、M10_#1最左邊兩個(gè)CLB在實(shí)現(xiàn)配置SRAM寫0功能時(shí)輸出異常,如圖1所示。
圖1 回讀異常區(qū)域所在die物理位置示意圖
從芯片測(cè)試定位到同一位線上的所有配置SRAM讀錯(cuò)誤,以及該讀錯(cuò)區(qū)域部分SRAM輸出控制功能錯(cuò)誤,判斷局部故障SRAM區(qū)域發(fā)生寫讀錯(cuò)誤,初步判斷位線存在弱上拉到電源的情況,SRAM內(nèi)部電路可能存在異常。因系統(tǒng)板上供給電源測(cè)試正常,以及電源阻抗測(cè)試,除2.5 V電源存在異常外,其他電源測(cè)試正常,初步判斷排除SRAM供電電源問題,另因未出現(xiàn)同一字線上的SRAM讀寫錯(cuò)誤,所以排除SRAM字線異常?,F(xiàn)場(chǎng)分析故障樹如圖2所示,灰色框?yàn)橐雅懦录?/p>
對(duì)現(xiàn)場(chǎng)故障定位后的失效樣品進(jìn)行解焊和鏟柱處理,通過(guò)ATE機(jī)臺(tái)進(jìn)行出廠功能性能測(cè)試分析。測(cè)試報(bào)錯(cuò)結(jié)果詳細(xì)信息如表1、表2所示。
圖2 現(xiàn)場(chǎng)分析故障樹
通過(guò)表1、表2對(duì)比可知,兩只失效樣品存在VCCO_5靜電電流、bank5區(qū)域的直流參數(shù)、配置功能失效等相同錯(cuò)誤,與此同時(shí)M10_#1樣品還存在bank9區(qū)域參數(shù)、IO功能失效等錯(cuò)誤。從而說(shuō)明M10_#1樣品報(bào)錯(cuò)區(qū)域大于M9_#2樣品。
通過(guò)酒精浸泡使導(dǎo)熱膠變軟的方法去除失效樣品的頂部散熱片。然后分別對(duì)die區(qū)域進(jìn)行微光顯微鏡(EMMI)和超聲波掃描顯微鏡(C-SAM)分析。
圖3是M9_#2和M10_#1樣品5倍放大倍數(shù)下的EMMI照片。從圖中可以看到在die的左上角位置有明顯的異常亮點(diǎn)。圖3(a)中M9_#2樣品的亮點(diǎn)與eFA發(fā)現(xiàn)的ROW2 BL_1037位置接近。圖3(b)異常點(diǎn)與M10_#1樣品eFA結(jié)果中BL_1053位置接近。
異常亮點(diǎn)基本處于同一水平線位置并略有分散,這與故障定位時(shí)發(fā)現(xiàn)的BL金屬線弱連接到電源的現(xiàn)象一致。對(duì)于在同一水平位置區(qū)域出現(xiàn)斷續(xù)多處亮點(diǎn)的現(xiàn)象,被認(rèn)為是底層SRAM器件因bl或bln金屬線短路到高壓VCCO(3.3 V)導(dǎo)致的底層晶體管失效。晶體管失效產(chǎn)生的漏電區(qū)域即為被EMMI顯微鏡捕獲的異常亮點(diǎn)。
圖4為M9_#2和M10_#1樣品C-scan模式下的聲掃結(jié)果。兩只樣品在die的左上角區(qū)域焊球(solder-ball)有明顯異常,多個(gè)焊點(diǎn)呈現(xiàn)“黑圈白心”同心圓現(xiàn)象。C-scan模式下倒裝芯片出現(xiàn)的該缺陷通常判定為die表面出現(xiàn)裂紋(dielectric crack)。
M9_#2樣品異常區(qū)域面積較小,M10_#1異常區(qū)域較大,這與eFA發(fā)現(xiàn)的M10_#1樣品較M9_#2樣品失效block更多的現(xiàn)象相符。與此同時(shí)C-SAM結(jié)果的缺陷位置與EMMI缺陷位置都出現(xiàn)在die的左上角相關(guān)位置。說(shuō)明兩種不同的材料分析手段較好的將外觀缺陷和電學(xué)失效定位在同一范圍。
圖5為器件封裝結(jié)構(gòu)示意圖,die與基座采用倒裝焊(flip-chip)工藝進(jìn)行互聯(lián),焊膏選用SAC305材料(錫96.5 %,銀3 %,銅0.5 %)。焊球間的空隙使用填充膠(underfill)進(jìn)行填充。芯片背面和散熱板間通過(guò)4450導(dǎo)熱膠粘接固化。引腳焊柱為Sn10Pb90材料(無(wú)涂覆)。
表1 M9_#2的eFA匯總
表2 M10_#1的eFA匯總
圖3 M9_#2和M10_#1樣品5倍放大倍數(shù)下的EMMI照片
圖4 M9_#2和M10_#1樣品C-scan模式下的聲掃結(jié)果
圖5 器件封裝結(jié)構(gòu)示意圖
圖6 C-scan模式die邊緣對(duì)應(yīng)IO處出現(xiàn)“黑圈白心”同心圓現(xiàn)象
該型號(hào)規(guī)格FPGA產(chǎn)品屬于非密封性金屬-陶瓷封裝結(jié)構(gòu)。經(jīng)測(cè)定器件濕敏等級(jí)為MSL 3,因此需按照J(rèn)STD-020標(biāo)準(zhǔn)對(duì)貯存環(huán)境和電裝工藝進(jìn)行管控。經(jīng)核實(shí)單機(jī)方在器件電裝前已進(jìn)行80 ℃+4 h烘烤,但不滿足標(biāo)準(zhǔn)規(guī)定的125 ℃+24 h的烘烤條件,因此存在濕氣未完全排出風(fēng)險(xiǎn)。器件在后續(xù)電裝過(guò)程中,填充膠內(nèi)部殘留的水汽因高溫應(yīng)力產(chǎn)生膨脹,局部膨脹應(yīng)力過(guò)大,會(huì)導(dǎo)致die表面產(chǎn)生裂紋,最終造成器件失效。
基于此FPGA器件為非密封性封裝結(jié)構(gòu),器件因吸濕后未充分烘烤,在經(jīng)受高溫后產(chǎn)生popcorn效應(yīng)導(dǎo)致失效的假設(shè),選取3只同型號(hào)規(guī)格樣品先后按照J(rèn)ESD22-A110、JESD22-A113標(biāo)準(zhǔn)進(jìn)行uHAST(130 ℃+85 %,96 h)和預(yù)處理(pre-condition)驗(yàn)證試驗(yàn)。
驗(yàn)證試驗(yàn)后對(duì)3只樣品進(jìn)行電性能測(cè)試,結(jié)果全為fail。電性能測(cè)試顯示3只樣品均有die邊緣位置IO失效,且其中2只樣品出現(xiàn)了die附近VCCO電流失效。對(duì)VCCO電流失效的2只樣品進(jìn)行C-SAM掃描分析,C-scan模式同樣發(fā)現(xiàn)die邊緣對(duì)應(yīng)IO處出現(xiàn)“黑圈白心”同心圓現(xiàn)象(如圖6所示),與裝機(jī)失效器件結(jié)果吻合。
通過(guò)故障復(fù)現(xiàn)試驗(yàn)的驗(yàn)證結(jié)果,我們認(rèn)為M9_#2、M10_#1兩只器件的失效原因符合非密封封裝產(chǎn)生popcorn效應(yīng)的失效機(jī)理。
本文針對(duì)某型號(hào)用FPGA發(fā)生的失效問題進(jìn)行了分析。器件故障定位確定為配置回讀錯(cuò)誤。經(jīng)eFA分析,認(rèn)為die內(nèi)部配置SRAM的位線與VCCO電源線相鄰,可能發(fā)生物理關(guān)聯(lián)故障,導(dǎo)致同一位線上的配置SRAM讀寫錯(cuò)誤,進(jìn)而導(dǎo)致其配置的功能錯(cuò)誤。經(jīng)EMMI和C-SAM兩種pFA分析方法,雙重印證了die物理缺陷位置與eFA分析的推論。根據(jù)實(shí)際工藝情況提出了器件在電裝工藝中由于水汽未完全排出,導(dǎo)致popcorn效應(yīng)產(chǎn)生失效的假設(shè)。通過(guò)uHAST + pre-condition的快速試驗(yàn)方法對(duì)假設(shè)進(jìn)行了驗(yàn)證,得到與裝機(jī)器件相同的失效現(xiàn)象與結(jié)果,從而證明了失效機(jī)理和正確性。
針對(duì)以上分析,筆者提出改進(jìn)建議:
1)針對(duì)非密封封裝器件電裝工藝應(yīng)嚴(yán)格按照J(rèn)STD-020標(biāo)準(zhǔn)管控;
2)國(guó)內(nèi)應(yīng)盡快形成適用于宇航應(yīng)用的非密封封裝元器件鑒定、篩選、安裝行業(yè)標(biāo)準(zhǔn)指導(dǎo)工程應(yīng)用;
3)針對(duì)FPGA等高性能器件,應(yīng)加大對(duì)用戶未調(diào)用資源的測(cè)試覆蓋性,消除潛在風(fēng)險(xiǎn)。