楊文晉,李永東,曹 猛,王洪廣,劉純亮
(西安交通大學(xué) 電子物理與器件教育部重點(diǎn)實(shí)驗(yàn)室 電子與信息學(xué)部電子科學(xué)與工程學(xué)院,西安 710049)
二次電子發(fā)射是指電子或離子轟擊材料表面,引發(fā)電子從材料表面逸出的現(xiàn)象。在航天大功率微波器件中,二次電子發(fā)射可能引發(fā)電子倍增,進(jìn)而產(chǎn)生微放電,導(dǎo)致器件燒蝕或擊穿[1-4]。因此,在航天微波器件的設(shè)計(jì)過(guò)程中,針對(duì)器件微放電閾值的研究非常重要??紤]到實(shí)驗(yàn)成本較高且設(shè)計(jì)周期較長(zhǎng)的缺點(diǎn),一般會(huì)首先基于理論分析和數(shù)值模擬開(kāi)展微放電閾值研究[5-8]。在微放電數(shù)值模擬中,得到用于描述材料二次電子發(fā)射特性的數(shù)值模型至關(guān)重要。已有研究成果表明,材料二次電子發(fā)射特性對(duì)微放電閾值影響巨大[9-11]。另外,更精確的二次電子發(fā)射模型還可以應(yīng)用于沿面閃絡(luò)、加速器、光電倍增管等二次電子倍增問(wèn)題的研究中。因此,建立精度更高的二次電子發(fā)射模型是很有必要的。
在開(kāi)展二次電子發(fā)射相關(guān)的數(shù)值模擬研究前,一般需要先利用實(shí)驗(yàn)手段測(cè)量材料真實(shí)的二次電子發(fā)射特性。然后,參照實(shí)驗(yàn)結(jié)果對(duì)已有理論公式進(jìn)行參數(shù)修正,用于描述材料真實(shí)的二次電子發(fā)射特性。較為常用的二次電子發(fā)射模型有Vaughan、Furman、復(fù)合唯象模型等[12-14]。
但是,受理論公式可調(diào)參數(shù)的限制,僅通過(guò)修正公式參數(shù),無(wú)法確保模型與實(shí)驗(yàn)數(shù)據(jù)完全匹配,且參數(shù)修正過(guò)程復(fù)雜繁瑣。同時(shí),受限于實(shí)驗(yàn)條件、實(shí)驗(yàn)成本和實(shí)驗(yàn)精度等,實(shí)驗(yàn)測(cè)試得到的材料二次電子發(fā)射特性是強(qiáng)離散的,這種離散的實(shí)驗(yàn)數(shù)據(jù)會(huì)導(dǎo)致部分物理規(guī)律缺失。因此,如果拋棄理論公式,僅針對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行擬合,則容易產(chǎn)生過(guò)擬合現(xiàn)象,導(dǎo)致生成的擬合公式缺乏普適性,甚至產(chǎn)生非物理錯(cuò)誤。
本文基于機(jī)器學(xué)習(xí)和深度人工神經(jīng)網(wǎng)絡(luò),提出了一種二次電子發(fā)射唯象模型及分步訓(xùn)練的方法。針對(duì)銀和鋁合金材料的測(cè)試結(jié)果表明,本文提出的基于機(jī)器學(xué)習(xí)的二次電子發(fā)射唯象模型較Vaughan模型、Furman模型和復(fù)合唯象模型均能夠更好地描述材料真實(shí)的二次電子發(fā)射特性。
Vaughan模型[12]是一種經(jīng)典的二次電子發(fā)射唯象模型,該模型描述的二次電子發(fā)射系數(shù)(secondary emission yield,SEY)為:
(1)
其中δmax0是電子垂直入射時(shí)的最大SEY,ks是材料表面光滑度因子,f(w,k)為基于經(jīng)驗(yàn)參數(shù)的擬合函數(shù)。
(2)
(3)
本文利用Vaughan模型生成先驗(yàn)知識(shí)數(shù)據(jù)集,用于訓(xùn)練二次電子發(fā)射ANN模型,生成二次電子發(fā)射先驗(yàn)知識(shí)ANN模型。
本文提出的二次電子發(fā)射ANN模型指利用人工神經(jīng)網(wǎng)絡(luò)描述材料二次電子發(fā)射特性的唯象模型。
近年來(lái),新的人工神經(jīng)網(wǎng)絡(luò)模型不斷被提出,如用于圖像分類的AlexNet、VGGNet、GoogleNet、ResNet等[15-18];用于目標(biāo)檢測(cè)的R-CNN、YOLO、SSD等[19-21];用于圖像區(qū)域分割的FCN、DeepLab、PSPNet等[22-24];用于OCR識(shí)別的CTPN、CRNN等[25-26];用于語(yǔ)音識(shí)別的DNN-HMM、RNN-CTC、FSMN、LSTM-DNN等[27-31]。由于二次電子發(fā)射建模問(wèn)題較上述應(yīng)用場(chǎng)景包含的信息量少,不適于使用復(fù)雜的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。因此,本文提出的ANN模型是一種由輸入層、5層隱含層和輸出層組成的全連接人工神經(jīng)網(wǎng)絡(luò)。二次電子發(fā)射ANN模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)為入射能量(E)、入射角度(θ)、垂直入射時(shí)最大SEY(δmax0)和δmax0對(duì)應(yīng)的電子入射能量(Emax0),輸出結(jié)果為SEYδ(E,θ),神經(jīng)元激勵(lì)函數(shù)為Relu函數(shù)。
圖1 二次電子發(fā)射ANN模型Fig.1 SEY ANN model
針對(duì)二次電子發(fā)射ANN模型采用分步訓(xùn)練方法。首先,利用經(jīng)過(guò)預(yù)先驗(yàn)證的二次電子發(fā)射特性數(shù)據(jù)作為樣本集訓(xùn)練神經(jīng)網(wǎng)絡(luò),生成二次電子發(fā)射先驗(yàn)知識(shí)ANN模型,用于描述二次電子發(fā)射一般規(guī)律。然后,利用實(shí)驗(yàn)測(cè)得的某種材料的SEY實(shí)驗(yàn)數(shù)據(jù)作為樣本集,對(duì)二次電子發(fā)射先驗(yàn)知識(shí)ANN模型進(jìn)行二次訓(xùn)練,生成針對(duì)該材料的特異ANN模型。上述特異ANN模型用于描述具體材料的二次電子發(fā)射特性,是二次電子發(fā)射ANN模型的具象化實(shí)例。
分步訓(xùn)練方式將先驗(yàn)知識(shí)預(yù)先引入模型,在確保模型與實(shí)驗(yàn)數(shù)據(jù)擬合精度的前提下,提高了二次電子發(fā)射ANN模型對(duì)小樣本的適應(yīng)性,同時(shí)避免了只針對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行擬合而可能導(dǎo)致的過(guò)擬合現(xiàn)象。
先驗(yàn)知識(shí)ANN模型指利用預(yù)先驗(yàn)證的二次電子發(fā)射特性數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練二次電子發(fā)射ANN模型,生成的一種隱含了二次電子發(fā)射一般規(guī)律的ANN模型。
本文利用Vaughan模型生成二次電子發(fā)射特性先驗(yàn)數(shù)據(jù)集,集合形式如式(4)所示:
{Ein,θin,δmax0,Emax0,δ}
(4)
其中Ein為電子入射能量,θin為電子入射角度,δmax0為電子垂直入射時(shí)最大SEY,Emax0為δmax0對(duì)應(yīng)的電子入射能量,δ為利用Vaughan模型計(jì)算得到的SEY。參數(shù)取值范圍如式(5)所示。
(5)
本文在參數(shù)取值范圍內(nèi)采用均勻采樣方式生成包含2 000萬(wàn)組數(shù)據(jù)的樣本集。其中,用于訓(xùn)練和測(cè)試的樣本數(shù)量比例為7:3。
(6)
(7)
模型訓(xùn)練收斂判據(jù)為:
(8)
先驗(yàn)知識(shí)模型訓(xùn)練收斂過(guò)程如圖2所示。其中,橫軸為訓(xùn)練迭代次數(shù),縱軸為損失函數(shù),Train MSE代表訓(xùn)練數(shù)據(jù)集的損失函數(shù)變化,Test MSE代表測(cè)試數(shù)據(jù)集的損失函數(shù)變化。
圖2 訓(xùn)練收斂結(jié)果Fig.2 Training convergence result(color online)
在不同參數(shù)條件下(詳見(jiàn)圖題內(nèi)容),Vaughan模型與二次電子發(fā)射先驗(yàn)知識(shí)ANN模型的對(duì)比結(jié)果如圖3所示。其中,橫軸為電子入射能量,縱軸為SEY,圖例中ANN Model為先驗(yàn)知識(shí)ANN模型的計(jì)算結(jié)果,Vaughan為Vaughan模型的計(jì)算結(jié)果。
圖3 ANN模型計(jì)算結(jié)果Fig.3 Prediction results of ANN model(color online)
上述驗(yàn)證結(jié)果表明,先驗(yàn)知識(shí)ANN模型在不同參數(shù)條件下均能很好地?cái)M合Vaughan模型。為了進(jìn)一步提升先驗(yàn)知識(shí)ANN模型的性能,還可以利用Furman模型、復(fù)合唯象模型、實(shí)驗(yàn)數(shù)據(jù)等擴(kuò)充先驗(yàn)知識(shí)數(shù)據(jù)集,訓(xùn)練生成綜合性能更優(yōu)的先驗(yàn)知識(shí)ANN模型。
二次電子發(fā)射特異ANN模型是指利用某種具體材料的真實(shí)二次電子發(fā)射特性數(shù)據(jù)作為訓(xùn)練集,對(duì)先驗(yàn)知識(shí)ANN模型進(jìn)行二次訓(xùn)練,生成的一種僅用于描述該材料的二次電子發(fā)射模型。由于影響材料二次電子發(fā)射特性的因素非常多,僅利用上述先驗(yàn)知識(shí)ANN模型不能準(zhǔn)確描述待研究具體材料的真實(shí)二次電子發(fā)射特性,因此,提出二次電子發(fā)射特異ANN模型是必要的。
利用文獻(xiàn)[14]中銀材料SEY實(shí)驗(yàn)數(shù)據(jù)修正先驗(yàn)知識(shí)ANN模型,生成針對(duì)該種銀材料的特異ANN模型。銀材料SEY實(shí)驗(yàn)數(shù)據(jù)共有120組,模型訓(xùn)練方法、參數(shù)設(shè)置及收斂條件同先驗(yàn)知識(shí)ANN模型。
特異ANN模型的訓(xùn)練收斂過(guò)程如圖4所示。其中,橫軸為訓(xùn)練迭代次數(shù),縱軸為損失函數(shù)變化趨勢(shì),損失函數(shù)為MSE。
圖4 訓(xùn)練收斂結(jié)果Fig.4 Training convergence
將該特異ANN模型與文獻(xiàn)[14]中的修正Vaughan模型、修正Furman模型、復(fù)合唯象模型和實(shí)驗(yàn)數(shù)據(jù)進(jìn)行對(duì)比,結(jié)果如圖5所示。其中,橫軸代表電子入射能量,縱軸代表SEY。圖5中圖例所示分別代表特異ANN模型計(jì)算結(jié)果、復(fù)合唯象模型計(jì)算結(jié)果、修正Furman模型計(jì)算結(jié)果、修正Vaughan模型計(jì)算結(jié)果和實(shí)驗(yàn)結(jié)果。
4種模型與銀材料SEY實(shí)驗(yàn)數(shù)據(jù)對(duì)比的平均絕對(duì)誤差(mean absdute error,MAE)結(jié)果如表1所列。ANN模型的MAE相對(duì)于Vaughan模型、Furman模型和復(fù)合唯象模型分別平均降低了84.1%、74.8%和62.1%。
表1 二次電子發(fā)射模型MAE對(duì)比結(jié)果(銀)Tab.1 Comparison of SEY models MAE for silver
利用文獻(xiàn)[14]中鋁合金材料SEY實(shí)驗(yàn)數(shù)據(jù)修正先驗(yàn)知識(shí)ANN模型,生成針對(duì)該鋁合金材料的特異ANN模型。鋁合金材料SEY實(shí)驗(yàn)數(shù)據(jù)共有114組,模型訓(xùn)練方法、參數(shù)設(shè)置及收斂條件同先驗(yàn)知識(shí)ANN模型。
將該特異ANN模型與文獻(xiàn)[14]中的修正Vaughan模型、修正Furman模型、復(fù)合唯象模型和實(shí)驗(yàn)數(shù)據(jù)進(jìn)行對(duì)比,結(jié)果如圖6所示。其中,橫軸代表電子入射能量,縱軸代表SEY,圖例意義同圖5。
圖5 二次電子發(fā)射模型對(duì)比(銀)Fig.5 Comparison of SEY models for silver(color online)
圖6 二次電子發(fā)射模型對(duì)比(鋁合金)Fig.6 Comparison of SEY models for aluminum alloy(color online)
4種模型與鋁合金材料SEY實(shí)驗(yàn)數(shù)據(jù)對(duì)比的MAE結(jié)果如表2所列。ANN模型的MAE相對(duì)于Vaughan模型、Furman模型和復(fù)合唯象模型分別平均降低了78.8%、32.5%和-0.7%。
表2 二次電子發(fā)射模型MAE對(duì)比結(jié)果(鋁合金)Tab.2 Comparison of SEY models MAE for aluminum alloy
本文提出的二次電子發(fā)射ANN模型是基于機(jī)器學(xué)習(xí)生成的,因此其準(zhǔn)確性與樣本數(shù)量強(qiáng)相關(guān)。本文結(jié)合文獻(xiàn)[14]中的銀材料實(shí)驗(yàn)數(shù)據(jù),進(jìn)一步測(cè)試了在小樣本條件下,二次電子發(fā)射模型的準(zhǔn)確性。
只選取電子垂直入射時(shí)銀材料的20組SEY實(shí)驗(yàn)數(shù)據(jù)作為樣本集,用于訓(xùn)練ANN先驗(yàn)知識(shí)模型,生成針對(duì)該種銀材料的特異ANN模型,模型訓(xùn)練方法、參數(shù)設(shè)置及收斂條件同先驗(yàn)知識(shí)ANN模型。
由于缺少不同角度入射的SEY實(shí)驗(yàn)數(shù)據(jù),不適于使用Furman模型和復(fù)合唯象模型。因此,在小樣本條件下僅對(duì)比特異ANN模型與Vaughan模型,結(jié)果如圖7所示。其中,橫軸代表電子入射能量,縱軸代表SEY,圖7中圖例所示分別代表特異ANN模型計(jì)算結(jié)果、修正Vaughan模型計(jì)算結(jié)果和實(shí)驗(yàn)結(jié)果。
圖7 二次電子發(fā)射模型對(duì)比(銀)Fig.7 Comparison of SEY models for silver(color online)
兩種模型與銀材料SEY實(shí)驗(yàn)數(shù)據(jù)對(duì)比的MAE結(jié)果如表3所列。通過(guò)與表1結(jié)果進(jìn)行對(duì)比可得出結(jié)論,當(dāng)訓(xùn)練樣本減少時(shí),二次電子發(fā)射ANN模型的準(zhǔn)確度下降,但相比于Vaughan模型依然獲得了相當(dāng)或更高的精度。ANN模型的MAE相對(duì)于Vaughan模型平均降低了32.2%。
表3 二次電子發(fā)射模型MAE對(duì)比結(jié)果(銀)Tab.3 Comparison of SEY models MAE for silver
本文基于機(jī)器學(xué)習(xí)和深度人工神經(jīng)網(wǎng)絡(luò),提出了一種參數(shù)易修正,且精度更高的二次電子發(fā)射唯象模型。在針對(duì)該模型的訓(xùn)練過(guò)程中,采用分步訓(xùn)練方式先后生成先驗(yàn)知識(shí)ANN模型和特異ANN模型。
在不同參數(shù)條件下比對(duì)了先驗(yàn)知識(shí)ANN模型和Vaughan模型,驗(yàn)證了先驗(yàn)知識(shí)ANN模型的正確性。分別利用銀和鋁合金材料的實(shí)驗(yàn)數(shù)據(jù)修正先驗(yàn)知識(shí)ANN模型,生成針對(duì)兩種材料的特異ANN模型,并通過(guò)與修正后的Vaughan模型、Furman模型和復(fù)合唯象模型進(jìn)行對(duì)比,驗(yàn)證了特異ANN模型的準(zhǔn)確性。在小樣本條件下,對(duì)比了特異ANN模型和Vaughan模型,驗(yàn)證了二次電子發(fā)射ANN模型對(duì)于小樣本的適應(yīng)性。
二次電子發(fā)射ANN模型的優(yōu)勢(shì)不僅體現(xiàn)在與實(shí)驗(yàn)數(shù)據(jù)的擬合精度上,而且體現(xiàn)在模型使用方面。二次電子發(fā)射ANN模型的訓(xùn)練方法具有普適性,無(wú)需人為過(guò)多干預(yù)。避免了傳統(tǒng)方法需要人為主觀進(jìn)行參數(shù)修正的繁瑣過(guò)程,且對(duì)于小樣本情況適應(yīng)性較好,更適于在數(shù)值模擬中使用。
在下一步的研究工作中,擬利用Furman模型、復(fù)合唯象模型和高能二次電子發(fā)射模型[33]擴(kuò)充先驗(yàn)知識(shí)訓(xùn)練數(shù)據(jù)集,用于訓(xùn)練性能更優(yōu)的先驗(yàn)知識(shí)ANN模型。然后,擬將基于機(jī)器學(xué)習(xí)的二次電子發(fā)射唯象模型應(yīng)用于粒子模擬微放電閾值計(jì)算中,進(jìn)一步驗(yàn)證該模型的正確性和優(yōu)勢(shì)。