許鴻偉,張 潔+,呂佑龍,鄭 鵬
(1.東華大學 機械工程學院智能制造研究所,上海 201620;2.上海交通大學 機械與動力工程學院智能制造與信息工程研究所,上海 200240)
我國集成電路產(chǎn)業(yè)發(fā)展迅速,現(xiàn)在已形成產(chǎn)品設計、芯片制造、電路封裝共同發(fā)展的態(tài)勢。晶圓良率是完成所有工藝步驟后測試合格的芯片的數(shù)量與整片晶圓上的有效芯片的比值[1],由于集成電路產(chǎn)品生產(chǎn)投入大、損失代價高,提前預知晶圓生產(chǎn)的良率情況,對提升晶圓生產(chǎn)工藝、降低晶圓生產(chǎn)損失具有重要意義。
傳統(tǒng)的晶圓良率預測方法主要考慮晶圓的缺陷來源、缺陷數(shù)目、缺陷聚集程度與良率之間的關系,如:Raghavachari等[2]從統(tǒng)計學的角度,通過對晶圓單位面積的平均缺陷數(shù)進行分析,建立基于泊松分布的良率預測方法,但該方法未考慮晶圓缺陷的群聚特性,對于不同批次生產(chǎn)的晶圓,模型適用性低;許文輝等[3]在統(tǒng)計模型的基礎上,通過對晶格面積和缺陷密度信息進行分析,建立基于神經(jīng)網(wǎng)絡模型的缺陷識別與良率預測方法,但在面對多維輸入變量時易出現(xiàn)梯度消失的情況,預測模型穩(wěn)定性不足;劉亭宜等[4]在晶格面積基礎上添加了缺陷數(shù)和缺陷群聚程度變量,建立基于廣義回歸神經(jīng)網(wǎng)絡(General Regression Neural Network,GRNN)模型的良率預測方法,該方法在添加了更多變量的同時,抑制了預測模型的學習能力。上述方法根據(jù)晶圓的缺陷信息,實現(xiàn)了晶圓良率的準確預測,但是由于沒有考慮與良率直接相關的晶圓電性能情況,難以幫助晶圓加工工藝進行持續(xù)地改進。
近年來,更多文獻集中于利用晶圓電性測試(Wafer Acceptance Test,WAT)參數(shù)替代缺陷來源、缺陷群聚特性等相關參數(shù)作為預測晶圓良率的輸入?yún)?shù),構建晶圓良率預測模型。由于WAT對象多、參數(shù)間關聯(lián)性強,使得WAT參數(shù)的多重共線性突出,從而導致晶圓良率預測模型難以建立且預測準確性不足,因而在利用WAT參數(shù)對晶圓良率進行預測時,有學者通過研究提出了相應的解決方法,如:林瑞山等[5]提出利用WAT參數(shù)作為輸入,構建基于反向傳播神經(jīng)網(wǎng)絡(Back Propagation Neural Network, BPNN)的良率預測模型,該方法需要在原先幾百維的WAT變量中挑選出幾個用于模型輸入的變量,輸入變量的可靠性需要進一步確定;張秉裕等[6]在分析了WAT參數(shù)與晶圓良率之間相關性的基礎上,篩選出影響晶圓良率的關鍵WAT參數(shù),并提出了基于廣義回歸神經(jīng)網(wǎng)絡的晶圓良率預測模型,而該方法主要考慮單個變量與晶圓良率的相關性,對于多個組合變量對晶圓良率的相關性并未考慮;康盛[7]在對晶圓電性測試參數(shù)進行主成分分析的基礎上,提出基于統(tǒng)計規(guī)律的多元分段晶圓良率預測模型,該方法利用特征離散化的分類方法進行良率預測,預測模型的準確性不足。以上方法實現(xiàn)了利用WAT參數(shù)進行多種晶圓產(chǎn)品的良率預測,但是在應對高維WAT輸入變量時,輸入變量之間多重共線性問題突出、輸入變量與輸出量之間映射關系難以準確建立,且模型易受輸入噪聲影響[8],難以獲得較高的預測準確率。因此,在這種高維數(shù)據(jù)且變量間具有復雜關聯(lián)關系的約束條件下,亟需建立具有可靠精度與準確率的良率預測模型。
針對晶圓良率預測問題中WAT參數(shù)之間的多重共線性問題、WAT參數(shù)與晶圓良率之間的復雜非線性映射關系問題,本文提出基于改進的連續(xù)型深度信念網(wǎng)絡(Improved Continuous Deep Belief Network, ICDBN)的晶圓良率預測模型。首先進行主成分分析得到模型輸入?yún)?shù);再利用深度學習模型的特征提取功能,對晶圓電性測試參數(shù)與晶圓良率之間的復雜非線性關系進行挖掘,實現(xiàn)晶圓良率的準確預測。
基于ICDBN的晶圓良率預測方法框架如圖1所示。首先,針對晶圓WAT參數(shù)存在的缺失值、異常點等情況以及WAT參數(shù)之間存在的多重共線性關系,設計基于數(shù)據(jù)清洗與主成分分析的兩階段數(shù)據(jù)預處理方法,獲取預測模型的輸入?yún)⒘俊H缓?,設計由多個改進的連續(xù)型受限制的玻爾茲曼機(Improved Continuous Restricted Boltzmann Machine,ICRBM)與BPNN構成的晶圓良率預測模型,通過晶圓電性測試參數(shù)的無監(jiān)督特征提取與晶圓良率數(shù)據(jù)的有監(jiān)督回歸分析,實現(xiàn)晶圓良率的準確預測。
(1)晶圓電性測試參數(shù)的缺失值處理 在實際工況下,由于設備故障、電流過大等,造成部分晶圓電性測試參數(shù)缺失。通過對采集到的數(shù)據(jù)進行統(tǒng)計分析可知,僅存在少數(shù)的缺失情況,因而剔除該部分晶圓的電性測試參數(shù)與其對應的良率值。
(2)晶圓良率的異常點處理 常見數(shù)據(jù)異常點的處理方法有:通過對屬性值進行描述性統(tǒng)計的統(tǒng)計分析法、統(tǒng)計數(shù)據(jù)分布的3δ原則法以及通過百分比計算統(tǒng)計分析的箱型圖法[7]。其中,箱型圖法由于不受數(shù)據(jù)分布的限制,能直觀表現(xiàn)數(shù)據(jù)分布的本來面貌,具有較強的魯棒性特點。因此,對各WAT參數(shù)中存在的異常點,利用箱型圖法進行篩選和剔除。
(3)晶圓電性測試參數(shù)間的量綱不一致處理 考慮到晶圓電性測試過程中各項參數(shù)指標之間的量綱差異大,如:電性測試中晶圓漏電流參數(shù)的測試單位僅有10-9次方安培,而部分電阻參數(shù)的測試量級則會有幾百歐姆,因此需要對所有的電性測試參數(shù)值進行標準化處理。本文中將晶圓電性測試參數(shù)值進行最大—最小值歸一化:
(1)
在晶圓實際生產(chǎn)過程中采集到的WAT數(shù)據(jù)通常以某個參數(shù)的均值、最大值、最小值、標準差的形式進行存儲,且數(shù)據(jù)本身體量大、維度高,數(shù)據(jù)之間表現(xiàn)出較強的關聯(lián)性,使得晶圓電性測試參數(shù)之間的多重共線性關系顯著[9],造成數(shù)據(jù)冗余,導致晶圓電性測試參數(shù)與實際晶圓良率之間的關系模型難以建立、預測模型不穩(wěn)定。針對晶圓實際生產(chǎn)過程中關鍵WAT參數(shù)存在的多重共線性問題,本文利用主成分分析方法[10]進行處理。
主成分分析法是一種利用線性變換將一組相關變量轉換成另一組不相關變量的統(tǒng)計方法[10]。首先,計算多維WAT輸入變量的相關系數(shù)矩陣,將具有強相關性的WAT參數(shù)以特征值與特征向量的形式表示,使得高維WAT參數(shù)轉化為低維不相關的WAT綜合指標[11];其次,計算各WAT變量的成分方差,得到各變量對應的方差貢獻率,并以方差遞減的順序輸出各WAT變量對晶圓良率的影響程度;最后,選擇累計貢獻率達到85%的k個主成分[7],并用這k個主成分反映全局的變量特征信息,以降低輸入WAT參數(shù)的相關性和冗余度[12],達到利用少數(shù)綜合指標反映所有指標的效果。
本文設計如圖2所示的ICDBN模型,用以建立晶圓WAT參數(shù)和良率之間的復雜非線性映射關系。ICDBN模型由多個ICRBM模型與BPNN回歸分析模型構成,其中:ICRBM模型實現(xiàn)對輸入?yún)?shù)的無監(jiān)督特征提??;BPNN模型調整所提取到的權重特征信息并輸出預測良率值。
(1)受限制的玻爾茲曼機(Restricted Boltzmann Machine, RBM) 如圖3所示,RBM模型采用數(shù)據(jù)離散化的方法對輸入樣本進行特征提取,使得隱藏層與可見層得到不連續(xù)的二值形式[14]。
RBM是一種基于能量理論的概率模型[15],當網(wǎng)絡結構中存在m個可視節(jié)點與n個隱藏節(jié)點時,RBM模型的能量函數(shù)定義如下:
(2)
式中θ={bj,ci,wij}是RBM的參數(shù)。由于RBM中可視層與隱層單元的狀態(tài)相互獨立,由貝葉斯定理可知,當已知某層單元狀態(tài)時,可求出與其相鄰層單元的狀態(tài)[16],如下所示:
(3)
(4)
即當已知RBM中任意層單元的狀態(tài)時,可分別求出其鄰近層單元激活的概率。
隱層單元被激活的概率
(5)
可視層單元被激活的概率
(6)
式中σ(x)=1/(1+e-x),為sigmoid激活函數(shù)。
RBM對隱藏層單元進行概率求取時是將結果離散為二值形式,主要通過下式進行求?。?/p>
(7)
式中ri表示第i個隱層單元在[0,1]之間所產(chǎn)生的隨機數(shù)。
(2)改進的連續(xù)型受限制玻爾茲曼機 原始RBM模型主要采用數(shù)據(jù)離散化的方式,以數(shù)據(jù)特征提取的精度為代價,提高特征提取的效率。而晶圓良率預測值以及訓練測試的WAT參數(shù)值都遵循連續(xù)型數(shù)據(jù)分布,因而RBM模型無法對其進行更精準的特征提取、輸出,因此對RBM結構進行如下改進:
1)基于RBM結構,在可見層與隱層神經(jīng)元中增加一個均值為0,方差為1的高斯變量N(0,1)。
2)針對連續(xù)型輸入、輸出數(shù)據(jù)設計改進的連續(xù)型激活函數(shù),利用連續(xù)型的激活函數(shù)對各神經(jīng)元的狀態(tài)進行激活。
3)去除RBM中離散化為0~1二值形式的過程。
通過上述3個步驟可以得到ICRBM模型,用于接收連續(xù)型數(shù)據(jù)類型的輸入?yún)?shù)、提取關鍵WAT參數(shù)與晶圓良率間復雜非線性關系的特征信息、輸出連續(xù)型數(shù)據(jù)類型的良率預測值。在經(jīng)過上述對神經(jīng)元的激活函數(shù)以及各層神經(jīng)元狀態(tài)的改進之后,此時式(5)中隱藏層單元的狀態(tài)被重新定義為:
(8)
式(6)中可見層單元的狀態(tài)被重新定義為:
(9)
式(8)和式(9)中α為0~1之間的常數(shù),且
(10)
為Sigmoid激活函數(shù)的改進形式,即為所設計的能夠處理連續(xù)型輸入、輸出數(shù)據(jù)的改進的連續(xù)型激活函數(shù),φL與φH分別為神經(jīng)元狀態(tài)數(shù)值的下界與上界,λ用以控制上述連續(xù)型激活函數(shù)的傾斜程度。進而,ICRBM模型能夠更精準地處理數(shù)字向量標準化至0~1之間的小數(shù)值,提升模型對關鍵WAT數(shù)據(jù)與晶圓良率之間特征關系的提取能力。
通過多層串聯(lián)的ICRBM結構對輸入數(shù)據(jù)進行貪婪的無監(jiān)督特征提取,將所提取到的權重特征信息作為回歸分析的初始化參數(shù),為后期的回歸分析提供初始條件。
(11)
改進的連續(xù)型激活函數(shù)在一定條件下增強了模型的特征提取能力,卻也使得模型對輸入?yún)?shù)中的噪聲更為敏感,因而在晶圓良率的回歸分析中易造成梯度消失、陷入局部最優(yōu),從而導致晶圓良率預測模型不能準確處理輸入輸出之間的復雜映射關系。因此,對式(11)中的殘差損失函數(shù)進行改進,將最后一層神經(jīng)網(wǎng)絡權重向量中的各個元素進行平方求和,并添加在原殘差損失函數(shù)之后,從而得到帶有權重懲罰因子的損失函數(shù)L′(e),通過每次對損失函數(shù)的迭代更新,不斷地調整特征值的權重因子,得到偏差值與方差值都較小的穩(wěn)定模型結構。
(12)
式中β為正則化系數(shù),用以對權值異常偏大的參數(shù)進行懲罰。通過對原始殘差損失函數(shù)添加懲罰項,能夠有效控制權值大小,得到所有模型參數(shù)都較小的穩(wěn)定模型,在一定程度上具有縮小權重值、避免過擬合的效果。最后,通過一定次數(shù)的循環(huán)迭代,模型輸出符合晶圓良率連續(xù)型數(shù)據(jù)類型的預測值。
本實驗數(shù)據(jù)來源于上海市某300 mm晶圓生產(chǎn)線,該生產(chǎn)線主要生產(chǎn)3種不同工藝路線、不同類型的晶圓產(chǎn)品,通常晶圓生產(chǎn)以一個Lot為單位,且每個Lot中包含25片晶圓。本文對其中一種晶圓產(chǎn)品進行良率預測試驗,該晶圓產(chǎn)品的電性測試對象包含430個,同期生產(chǎn)的晶圓有16 000多片,而WAT是分別對每片晶圓的相關電性能進行檢測的過程,其中430維輸入變量均為電性測試對象,所對應的物理含義包括:與MOS管性能相關的開啟電壓、飽和電流、漏電流、擊穿電壓,與柵氧層特性相關的有柵氧電性厚度、柵氧擊穿電壓,與電阻電容類相關的有片電阻、接觸電阻等,并且WAT的結果以MEAN、MIN、MAX、STD形式進行存儲。最后,通過針測機對每片晶圓進行抽測檢驗,并進行統(tǒng)計分析,從而得到實際良率值。選取16 000多組數(shù)據(jù)集中90%的晶圓WAT測試數(shù)據(jù)與其對應的實際良率值作為訓練集,進行有監(jiān)督回歸訓練,利用剩余10%的數(shù)據(jù)作為測試集進行測試。
(1)模型層數(shù)設定 針對晶圓關鍵WAT測試值連續(xù)型的數(shù)據(jù)類型特點,設計ICDBN晶圓良率預測模型。分別設計具有單隱層、雙隱層以及更多隱藏層的ICDBN模型,通過對比試驗發(fā)現(xiàn),當隱藏層設計三層ICRBM結構時,所提取到的良率特征信息與真實良率情況最為接近。
(2)模型節(jié)點設定 對原始WAT參數(shù)進行主成分分析后,選取方差累計貢獻率達85%的特征參數(shù),將原先430維的原始WAT數(shù)據(jù)由主成分分析過后的51維數(shù)據(jù)表征,并以此作為ICDBN模型起始輸入層的節(jié)點個數(shù)。由于ICDBN是通過不斷學習上一層結構、特征的深度學習模型,且最終輸出層僅輸出晶圓預測良率值的一維數(shù)據(jù),因此,各層之間神經(jīng)元節(jié)點數(shù)按等差數(shù)列格式逐層遞減設置,并通過正交試驗驗證發(fā)現(xiàn)每層節(jié)點按表1設計時,預測效果最接近于真實良率。
表1 ICDBN模型各節(jié)點個數(shù)
(4)迭代次數(shù)與學習率設定 采用學習率指數(shù)衰減的方法對參數(shù)的更新速度進行控制,指數(shù)學習率αe由初始學習率α0、全局迭代次數(shù)I、衰減速度v、衰減率a構成:
αe=α0·a(I/v)。
(13)
通過正交對比試驗發(fā)現(xiàn),當選取初始學習率α0=0.1,全局迭代次數(shù)I=4 000,衰減速度v=100、衰減率a=0.96時,模型預測效果與晶圓良率真實值最接近。
(1)預測結果對比試驗 將ICDBN晶圓良率預測模型與臺灣學者林瑞山[5]提出的BPNN晶圓良率預測模型,以及通過對輸入數(shù)據(jù)進行離散化處理的DBN預測模型[14]進行對比,將 WAT輸入數(shù)據(jù)與對應的實際良率信息作為模型的訓練樣本,分別代入3種模型中進行訓練。輸出測試集數(shù)據(jù)的良率預測值,且在這10%的測試集數(shù)據(jù)中隨機選取各模型的200組晶圓良率預測值,用于與實際晶圓良率值進行對比分析,實際良率值與各模型的預測良率值如表2所示,各模型良率預測值與實際良率值偏差情況如圖4所示。
由表2可知,ICDBN模型的晶圓良率預測值相比DBN模型以及BPNN模型更接近實際的晶圓良率值,且由圖4可知ICDBN模型的輸出良率值與實際晶圓良率值之間的整體與局部偏差值小于另外兩個模型,因次所提出的ICDBN模型獲得了比DBN、BPNN模型更高的預測準確率。
表2 模型實例對比驗證
(2)預測誤差對比試驗 在實際生產(chǎn)過程中,良率許可的絕對誤差控制在0%~3%之間是可接受的尺度[7],分別統(tǒng)計3種模型在訓練過程中和測試集數(shù)據(jù)中所預測的晶圓良率值與實際晶圓良率值之間實際絕對誤差值小于1.0 %、2.0%、3.0%的晶圓個數(shù),并計算各模型預測的晶圓良率值的均方根誤差值以及平均相對誤差值,用以評價模型精度,各模型預測誤差區(qū)間及評價誤差值如表3所示。由表3可知,在3種模型的訓練過程中,各模型絕對誤差小于3.0%的訓練集數(shù)據(jù)比例都達到95%以上,表明各模型已充分訓練完成,符合實際生產(chǎn)可接受良率尺度。但在測試集中,本文所提出的ICDBN模型的測試效果優(yōu)于其他兩種模型,不同誤差區(qū)間的可接受良率預測值同比高于另外兩種模型,且ICDBN模型的均方根誤差以及平均相對誤差都要小于另外兩種模型,R2得分值都高于另外兩個模型,因而ICDBN模型擁有更穩(wěn)定的預測效果。
表3 各模型預測值誤差區(qū)間與評價誤差
上述實驗結果表明:ICDBN模型、DBN模型、BPNN模型同時達到了較好的預測精度,且所提出的ICDBN模型獲得了更高的預測準確性和穩(wěn)定性。
針對晶圓WAT參數(shù)之間的多重共線性關系以及WAT參數(shù)與晶圓良率之間的復雜非線性映射關系,本文在設計兩階段數(shù)據(jù)預處理方法的基礎上,提出一種基于ICDBN模型的晶圓良率預測方法。首先對WAT參數(shù)進行主成分分析,獲得預測模型的關鍵輸入?yún)?shù);然后對DBN模型進行了以下改進:①對RBM模型的神經(jīng)元結構、神經(jīng)元狀態(tài)以及整體的模型結構進行改進,得到能夠處理連續(xù)型輸入?yún)?shù)的ICRBM模型,提高了模型的特征提取能力;②對反向傳播過程的損失函數(shù)添加權重懲罰因子,減小了模型對輸入?yún)?shù)中噪聲的敏感性,避免了過擬合現(xiàn)象的產(chǎn)生。最后,以上海市某晶圓加工企業(yè)的實際生產(chǎn)數(shù)據(jù)為例,驗證了所提方法的有效性。
下一步的研究內容將集中于以下兩方面:①本文主要通過PCA方法對高維WAT數(shù)據(jù)進行了維度縮減,但PCA方法在高維質量參數(shù)轉化為低維不相關的線性綜合指標的同時,丟失了原有質量數(shù)據(jù)的物理信息,難以從源頭對質量原因進行分析調控,因此將進一步研究WAT參數(shù)特征選擇方法,以挑選出影響晶圓良率的關鍵參數(shù);②晶圓良率是衡量晶圓產(chǎn)品質量的重要指標,實現(xiàn)其穩(wěn)定優(yōu)化能夠有效控制生產(chǎn)成本,因此將進一步研究晶圓良率優(yōu)化方法,以在合理的調控參量范圍內實現(xiàn)晶圓良率優(yōu)化。