姚曉童,李 林
(上海理工大學 管理學院,上海 200093)
成品率是半導體制造過程中一項重要的工藝性能指標,精準預測晶圓成品率對于改進生產(chǎn)工藝、減少晶圓制造損失具有重要意義。
目前成品率建模大多基于影響成品率的關(guān)鍵參數(shù),如缺陷數(shù)量、大小、電性參數(shù)等。文獻[1]考慮缺陷概率密度分布建立了經(jīng)典的泊松成品率預測模型,由于模型結(jié)構(gòu)簡單,應用最為廣泛,但預測準確度較低。文獻[2]考慮缺陷分布存在過度分散性,對文獻[1]進行了改進,建立了廣義泊松分布模型預測晶圓成品率,提高了成品率的預測精度。文獻[3]基于缺陷類型、大小、位置等基本信息建立因果統(tǒng)計模型,進行成品率的預測,并提出了成品率優(yōu)化策略,但由于缺陷數(shù)據(jù)量龐大,模型求解困難。文獻[4 -5]考慮晶圓電性測試的關(guān)鍵參數(shù),以最小化測試參數(shù)和預測誤差為目標,選取顯著特征向量,進而預測晶圓成品率,但電氣參數(shù)數(shù)據(jù)對象多,對象間關(guān)聯(lián)性強,導致模型預測準確度較低。文獻[6]基于成品率歷史數(shù)據(jù)提出一種混合聚合–熵–共識的模糊協(xié)同智能算法,首先得到成品率預測區(qū)間,然后用反向傳播網(wǎng)絡(luò)去模糊化得到成品率的預測值,具有較好的預測精度。影響晶圓成品率因素眾多,數(shù)據(jù)量大且關(guān)系復雜,但缺陷數(shù)據(jù)仍然是成品率建模最具影響力的因素[7]。
為提高預測精度以及確定晶圓缺陷來源,部分學者考慮晶圓缺陷的聚集性建立成品率預測模型。文獻[8]考慮晶圓缺陷的鄰近效應,利用缺陷模式建立成品率模型,具有較高的預測精度。文獻[9 -10]通過分析晶圓圖,識別缺陷模式,幫助管理者確定減少缺陷任務(wù)的優(yōu)先級以提高晶圓成品率。以上研究表明,考慮晶圓缺陷聚集特性,不僅可以快速查找缺陷來源,且模型預測精度高。但以上成品率模型均是在晶圓水平進行建模,僅考慮晶圓缺陷的一種模式。晶圓生產(chǎn)過程復雜,一片晶圓通常會存在多種缺陷模式,在晶圓水平進行建模在一定程度上降低了模型的預測準確度,難以獲得全面的缺陷損失來源。實際生產(chǎn)過程中,缺陷數(shù)據(jù)存在嵌套結(jié)構(gòu)[11],即同組晶片缺陷模式具有相似性,現(xiàn)有文獻大多都沒有考慮缺陷數(shù)據(jù)嵌套結(jié)構(gòu)特性。
本文考慮缺陷聚集性和數(shù)據(jù)的嵌套結(jié)構(gòu),首先用基于噪聲的密度聚類(density-based spatial clustering of applications with noise,DBSCAN)算法識別缺陷模式,將缺陷計量數(shù)據(jù)按缺陷模式在晶片水平匯總,基于缺陷模式和缺陷數(shù)量建立多水平邏輯回歸(Hierarchical Logit,HL)晶片失效概率模型,研究引起晶片失效的主要缺陷模式、關(guān)鍵工序,進而完成成品率的預測。
在半導體行業(yè)中,計算機輔助制造會產(chǎn)生海量數(shù)據(jù)集,通常每個數(shù)據(jù)集不能直接用來預測成品率,需要對不同數(shù)據(jù)集進行有效整合,如何獲得可行數(shù)據(jù)是成品率建模復雜的原因之一。本文所用數(shù)據(jù)集為產(chǎn)線缺陷監(jiān)控系統(tǒng)數(shù)據(jù)和電氣參數(shù)測量數(shù)據(jù)。缺陷監(jiān)控系統(tǒng)有兩種:一種是以缺陷為單位的缺陷記錄數(shù)據(jù)庫,該系統(tǒng)主要記錄了缺陷的大小、缺陷的類型以及缺陷的位置等基本信息;另一種為缺陷分析工程師使用光學顯微鏡掃描晶圓得到晶圓圖(wafermap),分析晶圓圖可以識別不同的缺陷模式,例如線性缺陷、團狀缺陷等,幫助工程師定位缺陷來源。電氣參數(shù)測量數(shù)據(jù)指在晶圓加工完成后,對晶圓上每個晶片進行針測,以檢查晶片的性能,根據(jù)針測結(jié)果將晶片劃分為不同的bin值??紤]晶圓缺陷聚集特性,本文用DBSCAN算法對晶圓缺陷進行聚類獲取晶片缺陷模式;將在線缺陷檢測系統(tǒng)中的缺陷在晶片水平進行匯總,即獲得每個晶片缺陷數(shù)量;根據(jù)晶圓針測數(shù)據(jù)集獲取每個晶片bin值,最后將晶片缺陷模式、晶片缺陷數(shù)量以及晶片bin值3個數(shù)據(jù)集進行整合,得到適用于成品率建模的數(shù)據(jù)集。
基于缺陷計量數(shù)據(jù)成品率建模通常會假設(shè)缺陷數(shù)據(jù)是獨立的,但在晶圓實際生產(chǎn)過程中,缺陷數(shù)據(jù)是呈嵌套結(jié)構(gòu)存在的,例如晶片嵌套在晶圓上,晶圓組合在批次中。因此,不同批次或者不同晶圓上的晶片并不是相互獨立的,晶圓嵌套結(jié)構(gòu)數(shù)據(jù)如圖1所示。圖中:ynijkt表示第t個產(chǎn)品、第k個批次、第j個晶圓、第i個組別的失效晶片;nj表示第j個晶圓失效晶片的數(shù)量;N表示失效晶片總數(shù)。在該結(jié)構(gòu)中,不同組的缺陷數(shù)據(jù)呈差異性,同組缺陷數(shù)據(jù)呈聚集性,HL模型可以解決嵌套結(jié)構(gòu)數(shù)據(jù)組間非獨立性與組內(nèi)聚集性[12]。為此,本文建立了HL成品率預測模型,該模型還可幫助企業(yè)識別顯著性批次、組別,以快速定位關(guān)鍵工序。
圖1 多層次晶圓結(jié)構(gòu)Fig.1 Multi-level wafer structure
晶圓缺陷聚集性表現(xiàn)為具有明顯的簇、缺陷點集中和簇中點密度大。晶圓缺陷模式主要分為隨機缺陷、局部團狀缺陷、線性缺陷、邊緣環(huán)狀缺陷以及粒子缺陷。5種缺陷模式劃分[13]的主要依據(jù)如表1所示。
表1 5種缺陷模式主要特點及劃分依據(jù)Tab.1 Main characteristics and classification basis of 5 defect modes
基于噪聲的密度聚類算法可由密度可達關(guān)系找出最大密度相連的集合,不需要指定聚類個數(shù),在有噪聲的情況下可識別出任意形狀的簇。
假設(shè)鄰域為ε,聚類密度閾值為 minPts,缺陷點集為T={oi},i=1,2,···,6,對缺陷點進行相關(guān)定義。
a.鄰域:缺陷點o1,o2∈T,如果點o2與o1的距離不大于ε,則o1的 領(lǐng)域可表示為Nε(o1)={o2∈T|d(o1,o2)≤ε},d為缺陷點之間的距離。
b.核心對象:如果缺陷點o1的鄰域內(nèi)至少存在minPts個缺陷點,則o1是一個核心對象。
c.密度直達:如果缺陷點o2在 缺陷點o1的鄰域內(nèi),且o1點 為核心對象,則稱o2由o1的密度直達。
d.密度可達:存在缺陷點序列o1,o2,o3,o4,o5,o6。在這個序列中,每一個缺陷點都與它前一個缺陷點密度直達,則稱o1與o6密度可達。
e.密度相連:如果缺陷點o1與缺陷點o6密度可達,缺陷點o2與缺陷點o6密度可達,則o1與o2密度相連。
f.簇:由所有密度可達的缺陷點導出的最大密度相連的點集合為一個簇。對于不屬于任何一個核心對象鄰域的缺陷點標示為噪音點。
通過實驗法調(diào)整鄰域 ε與密度閾值 minPts完成晶圓圖所有缺陷點聚類,形成分類簇。將分類簇根據(jù)表1劃分缺陷模式(將小于密度閾值的缺陷點劃分為粒子缺陷),獲得各個缺陷點分類。
邏輯回歸模型常用于晶圓成品率建模,但它的基本假設(shè)為數(shù)據(jù)是相互獨立的??紤]晶圓缺陷數(shù)據(jù)嵌套結(jié)構(gòu)和聚集性,本文使用多水平邏輯回歸構(gòu)建晶圓成品率模型。多水平邏輯回歸是廣義混合線性模型的一種。
廣義混合線性模型主要由抽樣模型、結(jié)構(gòu)模型和連接函數(shù)3部分組成。抽樣模型是指反應變量服從某一指數(shù)族分布,本文晶圓成品率為二分類問題(晶片pass/fail),定義 φnijkt為第t個產(chǎn)品、第k個批次、第j個晶圓、第i個組別、第n個晶片的失效概率,yj代 表第j個晶圓上有mj個缺陷晶片的失效晶片數(shù)量,則yj服 從有mj次實驗、每次實驗成功概率為 φn的二項分布
采用Logit連接函數(shù),即
式中,ηnijkt為晶片失效概率的對數(shù)發(fā)生比,ηnijkt=。 φnijkt取值范圍為(0,1),當φnijkt>0.5時,晶片失效。
結(jié)構(gòu)模型是解釋變量與自然參數(shù)的線性表達式,與廣義線性模型不同的是,廣義混合線性模型的結(jié)構(gòu)模型包括隨機效應與固定效應兩部分。當不定義隨機效應時,廣義混合線性模型變?yōu)閺V義線性模型。通過晶片組合在晶圓上,晶圓嵌套在批次上,批次嵌套在產(chǎn)品層建立嵌套變量,假設(shè)不同層次不同組別的晶片是相互獨立的,同組內(nèi)晶片具有相似性。在批次層、晶圓層和組別層建立嵌套變量的隨機截距模型,在產(chǎn)品層引入晶片大小變量,構(gòu)建非隨機變化斜率與截距模型。
多層次晶圓晶片失效概率的對數(shù)發(fā)生比綜合線性模型為[12]
式中:wt表示晶圓特征尺寸;xnijkt表示晶片缺陷數(shù) 量;π00000為 截 距 項,πl(wèi)0000(l=1,2,3,4,5)表 示 第l個缺陷模式的自然參數(shù);π00001表示產(chǎn)品大小的自然參數(shù); πl(wèi)0001(l=1,2,3,4,5)表示產(chǎn)品層與個體層交互效應的自然參數(shù);r0ijkt,e00jkt,u000kt分別表示失效概率對數(shù)發(fā)生比在批次層、晶圓層、組別層的隨機效應參數(shù)。
第j個晶圓成品率Yj可表示為
式中, E(φj)表示在第j個晶圓上晶片失效概率的期望值。
使用SAS 9.1軟件NLMIXED過程構(gòu)建模型。選用極大似然估計算法與對偶擬牛頓優(yōu)化算法進行模型求解,使用比值比(odds ratio)解釋特征向量對晶片失效概率的影響,如式(5)所示。比值比代表當晶片為第l個缺陷模式時,缺陷數(shù)量增加一個單位會影響晶片失效概率的增加值。選用Pearson卡方統(tǒng)計量與AIC信息準則指標評價模型擬合優(yōu)度[13]。
式中:QOR表示被檢驗的解釋變量的比值比;odds表示晶片失效發(fā)生概率與不失效概率之比。
本文缺陷數(shù)據(jù)樣本選自某晶圓廠實際生產(chǎn)線監(jiān)測系統(tǒng),包含 3種不同工藝尺寸產(chǎn)品,15個批次,30個晶圓。3種不同工藝尺寸產(chǎn)品分別可劃分出2480,848,533個晶片。首先對30個晶圓圖進行密度聚類,共識別出4578個缺陷晶片。將產(chǎn)品1與產(chǎn)品2作為訓練集,產(chǎn)品3作為測試集。訓練集數(shù)據(jù)共包括3599個缺陷晶片,測試集數(shù)據(jù)共包含979個缺陷晶片。
基于DBSCAN對每個晶圓圖進行聚類,根據(jù)實驗法確定鄰域ε,聚類密度閾值 minPts,部分晶圓缺陷晶片聚類結(jié)果如坐標圖圖2所示。
圖2 晶圓聚類結(jié)果Fig.2 Wafer clustering results
每張晶圓圖具有多種缺陷模式,結(jié)合表1可知:圖2(a)屬于環(huán)狀缺陷與隨機缺陷;圖2(b)屬于線性缺陷;圖2(c)屬于隨機缺陷和局部團狀缺陷。根據(jù)晶圓圖獲取每個缺陷晶片的坐標、缺陷模式、到中心的徑向距離,并根據(jù)徑向距離對晶片分組,分組界限為半徑的一半。
本文將在線缺陷測量數(shù)據(jù)與晶片針測數(shù)據(jù)基于晶片缺陷模式進行整合,以獲取適用于缺陷建模的數(shù)據(jù)。部分缺陷原始數(shù)據(jù)如表2所示,加粗部分為位于同一晶片上的不同缺陷的數(shù)據(jù)。利用Excel數(shù)據(jù)透視表功能對其進行聚合,缺陷測試數(shù)據(jù)與晶片針測數(shù)據(jù)整合后的數(shù)據(jù)如表3所示。根據(jù)晶片聚類結(jié)果,對表3數(shù)據(jù)進行整合,整合后的數(shù)據(jù)為HL模型的輸入數(shù)據(jù),如表4所示。
為了提高預測精度,對數(shù)據(jù)進行分析與預處理,將異常值在數(shù)據(jù)中剔除。對訓練數(shù)據(jù)集進行統(tǒng)計分析,每個晶片中存在缺陷均值為2.8,中位數(shù)為1,分位數(shù)為1,分位數(shù)為2,最小值為1,最大值為144??梢?,在訓練數(shù)據(jù)集中存在大量異常值。為消除異常值對模型的影響,采用one-side trimmed均值異常值檢測方法剔除異常值。該方法統(tǒng)一了數(shù)據(jù)集中的均值與中值,其效率優(yōu)于中值法異常值檢測[14]。本文設(shè)置p值為5%,根據(jù)統(tǒng)計分析結(jié)果,95%的晶片缺陷數(shù)在5以內(nèi),所以將晶片缺陷數(shù)大于5的晶片樣本在訓練集中刪除。為驗證模型方法的有效性對測試集數(shù)據(jù)不作處理。
表2 缺陷原始數(shù)據(jù)Tab.2 Defect raw data
4.3.1 Logit回歸
表3 聚合后數(shù)據(jù)Tab.3 Aggregated data
為了探討該數(shù)據(jù)集是否需要使用多水平Logit回歸,首先對訓練集數(shù)據(jù)作一般Logit回歸分析。模型輸入?yún)?shù)為產(chǎn)品編號、批次編號、晶圓編號、組別、晶圓特征尺寸以及缺陷模式,其中晶圓特征尺寸為標準化后的數(shù)值。實驗結(jié)果表明,模型擬合優(yōu)度檢驗Pearson卡方p值為0.009,但預測準確率達90.83%,表明模型沒有充分利用樣本數(shù)據(jù),模型擬合優(yōu)度表現(xiàn)不優(yōu),AIC指標值為2423.61。Logit模型顯示晶圓1、晶圓2、組別3、組別7、組別9、組別15、組別19、組別23、隨機缺陷模式、團狀缺陷模式、線性缺陷模式、環(huán)狀缺陷模式以及粒子缺陷模式因子具有顯著性(p<0.1)。
表4 模型分析數(shù)據(jù)Tab.4 Model analysis data
4.3.2 Nested Logit回歸
考慮缺陷數(shù)據(jù)嵌套結(jié)構(gòu),在Logit回歸模型中加入嵌套變量,Nested Logit模型輸入?yún)?shù)為產(chǎn)品編號(批次編號)、批次編號(晶圓編號)、晶圓編號(組別)、晶圓特征尺寸以及缺陷模式,輸入數(shù)據(jù)集為剔除異常值后的訓練集。與Logit模型相比,Nested Logit模型給出了更加精確的信息,不僅識別出重要的批次、晶圓信息,同時給出產(chǎn)品1的批次1與其他批次有顯著差異,批次1中的晶圓1、晶圓2有顯著差異。對于同一片晶圓,不同組別晶片失效概率差異較大,這些信息可以幫助企業(yè)工程師找出潛在的質(zhì)量偏差,進而在制造過程中進行故障排除。在顯著性水平 α=0.1下,Nested Logit回歸模型識別出產(chǎn)品1(批次1)、批次1(晶圓1)、批次1(晶圓2)、晶圓1(組別2)、隨機缺陷、團狀缺陷、線性缺陷、環(huán)狀缺陷以及粒子缺陷解釋變量具有顯著性。Nested Logit回歸模型的Pearson卡方p值為0.128,表明Nested Logit 模型對數(shù)據(jù)擬合較優(yōu),AIC指標值為1902.191。該模型AIC指標值小于Logit 回歸模型的AIC指標值,p值更加顯著,表明Nested Logit回歸模型優(yōu)于一般Logit回歸模型。
根據(jù)Nested Logit回歸模型顯著性因子構(gòu)建晶片失效概率模型,由于產(chǎn)品編號、批次編號、晶圓編號、組別等變量對于每個數(shù)據(jù)樣本都是不同的,因此利用隨機缺陷、團狀缺陷、線性缺陷、環(huán)狀缺陷以及粒子缺陷因子構(gòu)造晶片失效概率模型為
式中,ηn=?4.4321+1.4199xn+1.4203xn+1.377xn+1.1566xn+0.8149xn。
4.3.3 Hierarchical Logit回歸
Nested Logit回歸模型的基本假設(shè)為同組內(nèi)的晶片是相互獨立的,但在晶圓生產(chǎn)過程中所產(chǎn)生的系統(tǒng)缺陷通常是集群存在的,且Nested Logit回歸模型沒有考慮產(chǎn)品層與個體層的交互效應,在實現(xiàn)多產(chǎn)品的混合預測方面有待進一步考察。
本文所構(gòu)建的HL回歸模型的固定效應參數(shù)包括晶圓特征尺寸、缺陷模式、晶圓特征尺寸與缺陷模式交互變量,隨機截距模型參數(shù)為產(chǎn)品編號(批次編號)、批次編號(晶圓編號)、晶圓編號(組別)。結(jié)果顯示:隨機效應參數(shù)中晶圓編號(組別)和產(chǎn)品編號(批次編號)具有顯著性,協(xié)方差估計分別為(0.2584,0.1053),表明缺陷模式斜率受產(chǎn)品層和組別層(晶片失效概率組均數(shù))影響較大;但批次編號(晶圓編號)不具有顯著性,表明在批次層和晶圓層晶片失效概率組間差異不大。在顯著性水平 α=0.1下,HL模型識別出產(chǎn)品1(批次1)、晶圓1(組別2)、晶圓2(組別2)、隨機缺陷、團狀缺陷、線性缺陷、環(huán)狀缺陷以及粒子缺陷、晶圓特征尺寸、晶圓特征尺寸以及隨機缺陷、晶圓特征尺寸以及團狀缺陷、晶圓特征尺寸以及線性缺陷、晶圓特征尺寸以及環(huán)狀缺陷解釋變量具有顯著性(p<0.1)。 Pearson卡方p值為0.79,模型的擬合優(yōu)度提高,在顯著性0.05下,該模型基于缺陷數(shù)據(jù)擬合晶片失效概率是合適的。AIC指標值為1692.5,小于Logit 回歸模型AIC指標值與Nested Logit回歸模型AIC指標值,因此,HL回歸模型擬合更優(yōu)。
在顯著性水平 α =0.1下,使用固定效應參數(shù)因子構(gòu)建晶片失效概率,模型為
式中,ηnt=?4.4155+0.553wt+1.5424xn?0.2498wt·xn+1.3376xn?0.2159wtxn+1.3267xn?0.2433wtxn+1.138xn?0.1694wtxn+0.6889xn。
根據(jù)模型(6)與模型(7)預測測試集晶片失效概率,通過式(4)計算每個晶圓成品率。HL回歸模型、Nested Logit回歸模型與Seed’s模型對測試集中每一個晶圓的缺陷晶片pass數(shù)預測值,如圖3所示。圖4展示了HL回歸模型、Nested Logit回歸模型與傳統(tǒng)成品率預測模型Seed’s模型[1]對測試集中每個晶圓成品率的預測情況。
圖3 晶圓預測通過數(shù)Fig.3 Number of wafers predicted to pass
圖4 測試集晶圓成品率預測值Fig. 4 Predicted yield of the test set
由圖3和圖4可以看出Seed’s模型成品率預測值低于成品率實際值,而低估成品率會增加廠商缺陷分析成本。Nested Logit回歸模型的成品率預測值比真實值高,預測偏差比Seed’s模型低,預測準確率較高。因此,考慮晶圓生產(chǎn)過程的嵌
套結(jié)構(gòu)可以提高成品率預測精度,同時可輔助工程師決策,但未考慮產(chǎn)品層與個體層的交互效應和缺陷數(shù)據(jù)的組內(nèi)聚集性,可適用于單一產(chǎn)品的預測。本文提出的HL模型成品率預測值與實際值最為接近,預測偏差遠小于Seed’s模型,比Nested Logit回歸模型預測更加精確,可適用于不同產(chǎn)品成品率預測,具有更高的預測能力與可行性。
根據(jù)HL模型實驗結(jié)果得出,缺陷分析工程師應重點關(guān)注產(chǎn)品1的批次1。分析產(chǎn)品1批次1,晶圓缺陷模式多為團狀缺陷且晶片缺陷數(shù)量多,團狀缺陷主要發(fā)生在刻蝕工藝和光刻工藝,可檢查各工藝步驟,通過實驗排除法確定缺陷來源。根據(jù)缺陷模式比值比,團狀缺陷模式對晶圓受缺陷限制的成品率影響最大,晶片缺陷數(shù)量每增加一單位,缺陷失效概率增加4.27,其次為線性缺陷模式、環(huán)狀缺陷模式與粒子缺陷模式。晶圓特征尺寸與受缺陷限制的成品率呈負相關(guān),即晶圓特征尺寸越小,對缺陷控制要求越高。
基于缺陷計量數(shù)據(jù)構(gòu)建晶片失效概率模型,進而預測成品率。首先采用基于噪聲的密度聚類算法對缺陷點聚類,獲得缺陷模式;考慮缺陷聚集性與缺陷數(shù)據(jù)的嵌套結(jié)構(gòu),構(gòu)建HL模型預測晶片失效概率。該模型考慮了晶片水平更加具體的信息,違背了更少的Logit回歸模型的假設(shè),具有更高的預測精度。同時考慮了產(chǎn)品層與個體層的交互效應,可適用于不同產(chǎn)品的混合預測。
下一階段研究可以考慮更多的影響因素提高模型的預測能力,如缺陷大小、缺陷類型等,并針對各缺陷模式對成品率影響進行更深入的研究,提出指導半導體生產(chǎn)線加工與調(diào)度決策的可行性策略,提高芯片質(zhì)量,降低芯片成本。