徐圣哲,高德東,王 珊,吳昊昊,張西亞,韓永龍,李麗榮
(1.青海大學(xué)機(jī)械工程學(xué)院,西寧 810016;2.陽光能源(青海)有限公司,西寧 810007)
發(fā)展太陽能光伏發(fā)電是實現(xiàn)國家“雙碳”目標(biāo)、優(yōu)化能源結(jié)構(gòu)和提高能源占有量的強(qiáng)有力措施。硅由于具有儲量大、化學(xué)性質(zhì)不活潑、電化學(xué)和熱穩(wěn)定性好等優(yōu)點(diǎn)被廣泛應(yīng)用于光伏發(fā)電領(lǐng)域[1]。在直拉法硅單晶直徑控制中,比例積分微分(proportion integration differentiation, PID)控制對于非線性、大滯后和不確定性等問題的控制效果不佳[2-3]。因此,許多學(xué)者提出在直拉硅單晶生長過程控制中應(yīng)用基于模型的控制方法[4]。
在機(jī)理建模方面,Winkler等[5]采用集總參數(shù)法,建立了適合于控制的晶體直徑和晶體生長速度模型、固體-液體界面熱關(guān)系模型和彎月面質(zhì)量計算模型。Rahmanpour等[6]建立了非線性的狀態(tài)空間模型并對晶體的實際直徑和彎月面高度進(jìn)行了分析。Derby等[7]提出了一種在時變空間域上進(jìn)行偏導(dǎo)的晶體傳熱模型。張妮等[8]建立了一種二維軸對稱浸入邊界熱格子Boltzmann模型來研究晶體生長中的相變問題。Chen等[9]在橫向磁場下建立了硅熔體流動、熱場分布、氧含量濃度三維模型。張晶等[10]基于拋物型偏微分方程對時變空間域的對流擴(kuò)散過程建立了溫度模型來研究等徑階段晶體直徑波動。在數(shù)據(jù)驅(qū)動建模中,等徑階段晶體直徑控制分為單特征參數(shù)和多特征參數(shù)兩方面。在單特征參數(shù)方面,王春陽[11]在粒子群優(yōu)化算法的基礎(chǔ)上建立了加熱器功率-晶體直徑支持向量回歸模型,并根據(jù)預(yù)測模型設(shè)計無模型自適應(yīng)預(yù)測控制算法。王可[12]運(yùn)用多模型策略和分段線性法,建立“加熱-升溫”模型,并設(shè)計模型控制器對單晶爐晶體生長過程中的各主要過程進(jìn)行了分段和模擬。李欣鴿[13]基于帶外源輸入的非線性自回歸(nonlinear autoregressive with exogeneous inputs, NARX)神經(jīng)網(wǎng)絡(luò)建立等徑階段加熱器溫度-晶體直徑非線性模型并設(shè)計預(yù)測控制算法。上述基于數(shù)據(jù)驅(qū)動的模型控制方法的研究中均采用單一的特征參數(shù)即加熱器-晶體直徑,未考慮其他特征參數(shù)的影響。在多特征參數(shù)方面,劉聰聰?shù)萚14]建立了基于混合變量加權(quán)堆棧自編碼隨機(jī)森林的軟測量模型并利用灰狼優(yōu)化算法對其進(jìn)行優(yōu)化,實現(xiàn)了晶體直徑控制及V/G值的實時在線監(jiān)控,其研究主要目的為控制硅單晶缺陷。高德東等[15]建立了基于數(shù)據(jù)驅(qū)動的BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測模型,并采用遺傳算法對其進(jìn)行優(yōu)化。上述研究未從機(jī)理方面考慮,未探究特征參數(shù)對等徑階段晶體直徑的時延影響。
由于直拉法硅單晶生長過程中存在多種機(jī)理假設(shè),多場耦合下邊界條件不明確和化學(xué)變化交錯且相互影響等問題,導(dǎo)致機(jī)理建模困難[16]?;跀?shù)據(jù)驅(qū)動的模型控制方法采用單一的特征參數(shù)或未考慮特征參數(shù)對等徑階段晶體直徑的時延影響。NARX動態(tài)神經(jīng)網(wǎng)絡(luò)是一種具有記憶功能、結(jié)構(gòu)簡單和使用范圍廣的神經(jīng)網(wǎng)絡(luò),在處理時間序列的建模和預(yù)測等各種非線性問題上效果良好[17-20]。因此,本文提出一種多輸入單輸出的NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的等徑階段晶體直徑預(yù)測模型,為晶體直徑的控制提供了一種更準(zhǔn)確的辨識模型,同時為實現(xiàn)晶體高質(zhì)量、大尺寸生長控制提供了一種有效的手段。
基于神經(jīng)元的晶體直徑預(yù)測模型如圖1所示,具體分為數(shù)據(jù)準(zhǔn)備、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)計算三部分。在數(shù)據(jù)準(zhǔn)備部分,對單晶爐拉晶車間晶體直徑生長數(shù)據(jù)中的關(guān)鍵特征參數(shù)通過最大信息系數(shù)(maximal information coefficient, MIC)算法進(jìn)行分析,確定對等徑階段影響最大的特征參數(shù),并將選取的數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù)兩部分,分別用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)的可靠性驗證。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練部分,首先構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并對其進(jìn)行初始化。然后,導(dǎo)入訓(xùn)練數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,通過訓(xùn)練調(diào)整神經(jīng)網(wǎng)絡(luò)各層間的權(quán)值,得到精度滿足要求的神經(jīng)網(wǎng)絡(luò),并通過驗證數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進(jìn)行驗證。最后將得到的神經(jīng)網(wǎng)絡(luò)用于后續(xù)計算。
圖1 基于神經(jīng)元的晶體直徑預(yù)測模型Fig.1 Crystal diameter prediction model based on neuron
直拉硅單晶等徑階段特征參數(shù)與晶體直徑的相關(guān)性分析屬于特征降維,應(yīng)采用過濾式特征選擇的方法。該方法中的MIC是基于互信息理論提出的一種特征選擇算法,具有普適性和均衡性的特點(diǎn),能夠有效度量兩變量的線性或非線性關(guān)系,以及不同類型數(shù)據(jù)間的相關(guān)性[21-22]。因此,本文通過MIC分析特征參數(shù)與晶體直徑的相關(guān)性。兩隨機(jī)變量的 MIC 表達(dá)式為:
(1)
式中:Ω(nx,ny)表示大小為nx×ny的二維網(wǎng)格集合;B(n)=nα為最大網(wǎng)格數(shù),n為數(shù)據(jù)樣本個數(shù),α為常數(shù),α∈(0,1),其具體取值可根據(jù)經(jīng)驗或數(shù)據(jù)規(guī)格設(shè)置。
MIC算法的核心思想是在兩個變量散點(diǎn)圖的基礎(chǔ)上,將散點(diǎn)圖上的觀測點(diǎn)利用劃分網(wǎng)格柵G的方法分割成nx×ny
加熱功耗和主泵功耗二者散點(diǎn)圖如圖2所示,圖2(a)為加熱功耗-晶體直徑散點(diǎn)圖,圖2(b)為主泵功耗-晶體直徑散點(diǎn)圖,二者散點(diǎn)圖基本相同,計算加熱功耗和主泵功耗的MIC為0.998 8,二者具有極強(qiáng)的線性關(guān)系,可認(rèn)為加熱功耗和主泵功耗相互冗余。去除冗余參數(shù)主泵功耗和拉晶過程數(shù)值恒定的特征參數(shù)晶轉(zhuǎn)速度和紅外液溫,對剩余16個特征參數(shù)按照MIC值從高到低排列,按照順序逐漸增加模型輸入特征參數(shù)數(shù)量并試算,結(jié)果如圖3所示。隨著模型輸入特征參數(shù)數(shù)量的增加,模型運(yùn)算速度降低。當(dāng)模型輸入特征參數(shù)數(shù)量小于7時,隨著數(shù)量的增加預(yù)測值與測試值之間的均方根誤差(root-mean-square error, RMSE) 逐漸減??;當(dāng)模型輸入特征參數(shù)數(shù)量大于7時,隨著數(shù)量的增加預(yù)測值與測試值之間的RMSE逐漸增大;當(dāng)模型輸入特征參數(shù)數(shù)量為7時,預(yù)測值與測試值之間的RMSE最小??紤]模型訓(xùn)練速度和精度,選取與晶體直徑相關(guān)性較高的7個特征參數(shù)(加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速、爐壁測溫)作為模型輸入。優(yōu)化調(diào)節(jié)這7個特征參數(shù)將最大程度調(diào)節(jié)直拉硅單晶等徑階段晶體直徑。
圖2 MIC散點(diǎn)圖。(a)加熱功耗-晶體直徑散點(diǎn)圖;(b)主泵功耗-晶體直徑散點(diǎn)圖Fig.2 MIC scatter plots. (a) Heating power consumption-crystal diameter scatter plot; (b) main pump power consumption-crystal diameter scatter plot
圖3 不同數(shù)量模型輸入和均方根誤差的關(guān)系Fig.3 Relationship between different number of model inputs and root mean square error
在多指標(biāo)評價體系中,由于各種評價指標(biāo)的尺度和尺度單位都不盡相同,在不同指標(biāo)之間存在巨大差異,若不對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(歸一化)處理,指標(biāo)的數(shù)值高低將會影響分析結(jié)果,導(dǎo)致后續(xù)訓(xùn)練精度不佳。因此,為了消除指標(biāo)之間的量綱影響,提高數(shù)據(jù)可靠性和訓(xùn)練精度,在使用數(shù)據(jù)前對其進(jìn)行標(biāo)準(zhǔn)化處理。將所選用7個模型輸入特征參數(shù)和1個模型輸出特征參數(shù)進(jìn)行min-max標(biāo)準(zhǔn)化(min-max normalization)處理,對原始數(shù)據(jù)的線性變換使結(jié)果值映射到[0,1]。轉(zhuǎn)換函數(shù)如下:
(2)
式中:xmax為樣本數(shù)據(jù)的最大值;xmin為樣本數(shù)據(jù)的最小值;x*為數(shù)據(jù)標(biāo)準(zhǔn)化后參數(shù)。本文采用標(biāo)準(zhǔn)化之后的特征參數(shù)組成的7元組Xi(i=1,2,3,…,6,7)作為模型輸入,晶體直徑Y(jié)作為模型輸出,如表2所示。
表2 模型輸入輸出特征參數(shù)Table 2 Inputs and outputs characteristic parameters of model
NARX模型是基于線性ARX模型發(fā)展而來,常用于時間序列建模。NARX 動態(tài)神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層三部分組成,其結(jié)構(gòu)如圖4所示。
圖4 NARX動態(tài)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.4 Structure model of NARX dynamic neural network
NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的輸入分為外部輸入和反饋輸入兩部分,兩部分均含有時間延遲結(jié)構(gòu)。這表明NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的輸出不僅由當(dāng)前的外部輸入所決定,還受外部輸入時間延遲和反饋輸出時間延遲的影響。該結(jié)構(gòu)能夠提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能和對歷史數(shù)據(jù)的敏感度,可以更好地捕捉到系統(tǒng)的動態(tài)特性。NARX模型的定義方程是:
y(t)=f[u(t-1),u(t-2),…,u(t-nu),y(t-1),
y(t-2),…,y(t-ny)]+e(t)
(3)
(4)
(5)
式中:u(t)表示為在t時刻的輸入時序數(shù)據(jù);y(t)表示為在t時刻的輸出時序數(shù)據(jù);nu表示輸入的時延階數(shù);ny表示輸出的時延階數(shù);e(t)表示模型誤差;Hk(t)表示第k個隱含層神經(jīng)元輸出層的輸出;ωik表示連接第i個外生輸入和第k個隱含層的神經(jīng)元;ωjk表示第j個反饋輸入和第k個隱含層神經(jīng)元;ωok表示隱含層和輸出層的權(quán)值;bk、bo表示偏置;f(·)表示非線性激活函數(shù);g(·)為線性激活函數(shù)。
神經(jīng)網(wǎng)絡(luò)中的隱含層不直接同輸入輸出連接,它通過處理輸入數(shù)據(jù)的特征來更好地進(jìn)行數(shù)據(jù)處理和劃分,因此隱含層數(shù)很大程度影響神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的處理能力。隱含層數(shù)為1層時,神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)。綜合考慮模型精度及復(fù)雜程度,選取隱含層數(shù)為1。隱含層中神經(jīng)元數(shù)也稱為節(jié)點(diǎn)數(shù),通常由經(jīng)驗法或反復(fù)實驗法選取,如神經(jīng)元數(shù)目過少會無法匹配數(shù)據(jù)全部特征,出現(xiàn)欠擬合的情況,影響訓(xùn)練精度。如神經(jīng)元數(shù)目過多,訓(xùn)練過程將會增加,甚至?xí)霈F(xiàn)過擬合的情況,同樣影響訓(xùn)練精度。通過試算,當(dāng)隱含層中神經(jīng)元數(shù)為10時,預(yù)測值與測試值之間的RSME最小。因此,隱含層神經(jīng)元數(shù)為10。加熱功耗與晶體直徑的MIC為0.529 4,對直拉硅單晶等徑階段直徑影響最大。由硅晶體生長理論可知,實際拉晶生產(chǎn)中加熱功耗對晶體直徑影響很慢,經(jīng)驗滯后時間約為8 min[13]。根據(jù)模型時延參數(shù)計算:
(6)
在晶體直徑測量數(shù)據(jù)中采樣時間Δt=60 s,經(jīng)驗滯后時間t=8 min,計算晶體直徑時延參數(shù)d=8。因此,輸入時延階數(shù)和輸出時延階數(shù)均取8。
NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法會極大地影響到它的預(yù)測性能,常見的訓(xùn)練算法指標(biāo)對比如表3所示。Bayesian Regularization算法需要更大的內(nèi)存和更多的收斂時間,但對于困難或嘈雜等特殊的數(shù)據(jù)集,具有良好的泛化效果。Scaled Conjugate Gradient算法需要較少的內(nèi)存,適用于求解線性方程組和無約束優(yōu)化問題。LM(Levenberg-Marquardt)算法需要內(nèi)存較多,收斂時間較短,該算法將最速下降法與高斯-牛頓法相結(jié)合,根據(jù)離最優(yōu)解的距離選用不同的算法,既可以克服最速下降法離最優(yōu)解的距離較近時收斂速度慢的問題,又可以克服 Hessian矩陣無法迭代不滿秩的問題。考慮收斂速度和訓(xùn)練精度,本文選取LM算法作為訓(xùn)練算法。綜上所述,NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的模型參數(shù)為隱含層數(shù)為1,隱含層神經(jīng)元數(shù)為10,輸入時延階數(shù)和輸出時延階數(shù)為8,訓(xùn)練算法為LM算法。
表3 常見的訓(xùn)練算法指標(biāo)Table 3 Common training algorithm indicators
采用來源于拉晶車間提供的三臺單晶爐等徑階段8輪生產(chǎn)數(shù)據(jù),將預(yù)處理后的完整數(shù)據(jù)80%劃分為訓(xùn)練集(train set)、10%劃分為驗證集(validation set)、10%劃為測試集(test set),用于模型的訓(xùn)練、篩選和評估。訓(xùn)練后NARX動態(tài)神經(jīng)網(wǎng)絡(luò)測試集的誤差直方圖如圖5所示,圖5中橫坐標(biāo)誤差為標(biāo)準(zhǔn)化后晶體直徑相對誤差,其誤差值為標(biāo)準(zhǔn)化后晶體直徑真實值與預(yù)測值差值 (Post-standardization error=Post-standardization target-Post-standardization prediction),縱坐標(biāo)為測試集的數(shù)量。圖5(a)所示的No.1單晶爐測試集誤差分布集中在0誤差線附近,處于-0.03~-0.01之間的誤差的數(shù)量最多。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.10~0.07之間。圖5(b)所示的No.2單晶爐測試集誤差分布集中在0誤差線附近,處于0~0.01之間的誤差的數(shù)量最多,較其他區(qū)間誤差數(shù)量比較突出。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.05~0.06之間。圖5(c)所示的No.3單晶爐測試集誤差大部分集中于-0.03~0.04之間。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.08~0.07之間。由圖5所知,三臺單晶爐誤差數(shù)值和誤差分布均較為理想,滿足預(yù)測要求。
圖5 NARX動態(tài)神經(jīng)網(wǎng)絡(luò)誤差直方圖。(a)No.1單晶爐;(b)No.2單晶爐;(c)No.3單晶爐Fig.5 Error histogram of NARX dynamic neural network. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace
通過縮小訓(xùn)練數(shù)據(jù)可驗證NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的有效性[23]。針對No.3單晶爐,縮小訓(xùn)練數(shù)據(jù),采用5輪單晶爐等徑階段生產(chǎn)數(shù)據(jù),其余NARX動態(tài)神經(jīng)網(wǎng)絡(luò)模型設(shè)定不變,訓(xùn)練結(jié)果如圖6所示。5輪數(shù)據(jù)的No.3單晶爐測試集誤差大部分集中于-0.04~0.04,有相當(dāng)一部分?jǐn)?shù)據(jù)誤差處于-0.14~-0.05,其所有誤差處于-0.14~0.07,同圖5(c)相比預(yù)測誤差明顯增大。在縮小訓(xùn)練數(shù)據(jù)的情況下,可以獲得較好的直徑預(yù)測結(jié)果,驗證了NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的有效性。然而,隨著訓(xùn)練數(shù)據(jù)的減少,預(yù)測誤差逐漸增大。
圖6 No.3單晶爐誤差直方圖(5輪)Fig.6 Error histogram of No.3 single crystal furnace (5 rounds)
BP神經(jīng)網(wǎng)絡(luò),也稱為反向傳播神經(jīng)網(wǎng)絡(luò),是一種靜態(tài)前饋神經(jīng)網(wǎng)絡(luò),具有結(jié)構(gòu)簡單,應(yīng)用廣泛,非線性映射能力強(qiáng)與泛化能力強(qiáng)等優(yōu)點(diǎn)[24]。在實際生產(chǎn)中,每臺單晶爐因組裝和生產(chǎn)工藝優(yōu)化調(diào)整等原因存在差異,在生產(chǎn)前需對每臺單晶爐參數(shù)進(jìn)行調(diào)整,導(dǎo)致加熱特性不同。因此,采用上述相同數(shù)據(jù)集,基于BP神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測模型,并對No.1、No.2、No.3單晶爐分別進(jìn)行訓(xùn)練。將NARX動態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果進(jìn)行對比分析,兩種神經(jīng)網(wǎng)絡(luò)預(yù)測值與真實值對比圖如圖7所示,預(yù)測結(jié)果如表4所示。
圖7 預(yù)測值與真實值對比圖。(a)No.1單晶爐;(b)No.2單晶爐;(c)No.3單晶爐Fig.7 Comparison of predicted and real values. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace
表4 兩種神經(jīng)網(wǎng)絡(luò)預(yù)測模型性能Table 4 Performance of two neural network prediction models
圖7(a)所示的No.1單晶爐中NARX動態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測等徑階段晶體直徑,其預(yù)測均方誤差MSE 為0.000 797 72,相關(guān)系數(shù)R為96.744%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測直徑波動范圍小,不能實時反映晶體直徑的無規(guī)則變化,只能大致反映晶體直徑變化趨勢,其預(yù)測均方誤差MSE為0.006 498,相關(guān)系數(shù)R為75.428%,可見在No.1單晶爐中,NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(b)所示的No.2單晶爐中,NARX動態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測等徑階段晶體直徑,其預(yù)測均方誤差MSE為0.000 948 81,相關(guān)系數(shù)R為98.907%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測直徑波動范圍小,同直徑真實值差距較大,預(yù)測值變化趨勢明顯滯后于真實值,其預(yù)測均方誤差MSE 為0.004 389,相關(guān)系數(shù)R為89.129%,可見在No.2單晶爐中,NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(c)所示的No.3單晶爐中NARX動態(tài)神經(jīng)網(wǎng)絡(luò)可以精確地預(yù)測等徑階段晶體直徑,其預(yù)測均方誤差MSE 為0.000 575 47,相關(guān)系數(shù)R為99.594%。BP神經(jīng)網(wǎng)絡(luò)在前期直徑波動較小時預(yù)測誤差較小,當(dāng)晶體直徑波動較大時,預(yù)測值明顯偏離于真實值,誤差較大,其預(yù)測均方誤差MSE 為0.006 487 9,相關(guān)系數(shù)R為96.254%,可見在No.3單晶爐中,NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
在3臺單晶爐中,BP神經(jīng)網(wǎng)絡(luò)的均方誤差MSE平均值為0.005 792,相關(guān)系數(shù)R平均值為86.937%, NARX動態(tài)神經(jīng)網(wǎng)絡(luò)均方誤差MSE平均值為0.000 774,相關(guān)系數(shù)R平均值為98.415%。以平均均方誤差MSE作為評估標(biāo)準(zhǔn),NARX動態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度提高了86.64%。以平均相關(guān)系數(shù)R作為評估標(biāo)準(zhǔn),NARX動態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度提高了13.20%。
根據(jù)No.1、2、3三臺單晶爐的拉晶車間生產(chǎn)數(shù)據(jù),基于NARX動態(tài)神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測模型,其預(yù)測晶體直徑誤差數(shù)值和誤差分布均較為理想。當(dāng)縮小訓(xùn)練數(shù)據(jù)的情況下,該模型仍獲得較好的直徑預(yù)測結(jié)果。將建立的NARX動態(tài)神經(jīng)網(wǎng)絡(luò)同BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對比,三臺單晶爐的NARX動態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測精度均明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。上述結(jié)果表明, NARX動態(tài)神經(jīng)網(wǎng)絡(luò)為晶體直徑的控制提供了一種更準(zhǔn)確的辨識模型。
本文針對直拉法在制備硅單晶的過程中存在多種機(jī)理假設(shè)、多場耦合下邊界條件不明確和化學(xué)變化交錯且相互影響等問題,探究了與晶體直徑的相關(guān)的特征參數(shù),建立了一種多輸入單輸出的NARX動態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測模型,并分析驗證了該模型預(yù)測效果,結(jié)論如下:
(1)通過MIC算法分析特征參數(shù)與晶體直徑的相關(guān)性,得到加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速以及爐壁測溫7個與晶體直徑的相關(guān)性最高的特征參數(shù)。
(2)所建立NARX 動態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測模型對晶體直徑預(yù)測的均方誤差MSE平均值為0. 000 774。
(3)通過NARX動態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對比分析,在以平均均方誤差MSE作為評估標(biāo)準(zhǔn)下,所用神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度提高了86.64%,驗證了NARX動態(tài)神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。