馬季, 郝琛, 謝曉芹, 生義
(1.哈爾濱工程大學(xué) 核安全與仿真技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,黑龍江 哈爾濱 150001; 2.哈爾濱工程大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)
針對(duì)某些堆芯關(guān)鍵參數(shù)(如功率分布)的不確定性分析需要采用抽樣統(tǒng)計(jì)的方法,不可避免地需要進(jìn)行大量重復(fù)計(jì)算,使得分析過(guò)程面臨計(jì)算量巨大、耗時(shí)很長(zhǎng)的問(wèn)題,需要得到精確不確定性分析結(jié)果的同時(shí)減少計(jì)算量。作為人工智能的核心,機(jī)器學(xué)習(xí)在近幾年來(lái)得到了迅速的發(fā)展,眾多成果已用到反應(yīng)堆工程計(jì)算領(lǐng)域,其中以機(jī)器學(xué)習(xí)預(yù)測(cè)模型替代數(shù)值求解過(guò)程[1-3]及經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)[4-5]的應(yīng)用最廣泛。其優(yōu)勢(shì)在于通過(guò)分析輸入數(shù)據(jù)與輸出參數(shù)的關(guān)系訓(xùn)練機(jī)器學(xué)習(xí)模型,訓(xùn)練后的模型在給定輸入?yún)?shù)后可快速得到目標(biāo)輸出參數(shù)。當(dāng)實(shí)際計(jì)算過(guò)程所需的計(jì)算代價(jià)較大時(shí),采用訓(xùn)練完備的機(jī)器學(xué)習(xí)預(yù)測(cè)模型替代傳統(tǒng)計(jì)算過(guò)程,可以獲得精度和效率的雙重收益。采用高保真技術(shù)的反應(yīng)堆精細(xì)化中子輸運(yùn)計(jì)算由于能群、計(jì)算網(wǎng)格劃分更加精細(xì),需要較長(zhǎng)的計(jì)算時(shí)間,基于抽樣統(tǒng)計(jì)方法使用此計(jì)算工具開(kāi)展針對(duì)堆芯關(guān)鍵參數(shù)的不確定性分析必然會(huì)耗費(fèi)不可接受的計(jì)算時(shí)間。因此采用機(jī)器學(xué)習(xí)預(yù)測(cè)模型替代精細(xì)化中子輸運(yùn)計(jì)算以實(shí)現(xiàn)進(jìn)一步不確定性分析是解決上述問(wèn)題的一種可行方案。
本文開(kāi)展了通過(guò)訓(xùn)練機(jī)器學(xué)習(xí)模型替代精細(xì)化中子輸運(yùn)計(jì)算的方法研究及分析,以實(shí)現(xiàn)對(duì)堆芯關(guān)鍵參數(shù)的準(zhǔn)確、快速預(yù)測(cè)。構(gòu)建2D、3D C5G7基準(zhǔn)算例預(yù)測(cè)模型,實(shí)現(xiàn)以宏觀核截面為輸入的堆芯有效增殖因子預(yù)測(cè);以C5G7單組件瞬態(tài)問(wèn)題宏觀核截面及瞬態(tài)參數(shù)為輸入的全局功率、全局反應(yīng)性、中子代時(shí)間和緩發(fā)中子份額預(yù)測(cè)。同時(shí),選擇平均絕對(duì)誤差、平均標(biāo)準(zhǔn)誤差及方差偏離矩陣為評(píng)價(jià)指標(biāo)檢驗(yàn)預(yù)測(cè)模型的預(yù)測(cè)效果。從計(jì)算精度、計(jì)算時(shí)間2個(gè)角度對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),同時(shí)從訓(xùn)練樣本數(shù)目及機(jī)器學(xué)習(xí)模型2個(gè)角度分析預(yù)測(cè)效果的影響因素。
本文建立的預(yù)測(cè)模型為集成學(xué)習(xí)模型,即通過(guò)構(gòu)建、結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù),以達(dá)到預(yù)測(cè)能力和魯棒性明顯優(yōu)于單一學(xué)習(xí)器的學(xué)習(xí)性能。
堆疊法[6]是一種分層模型集成學(xué)習(xí)框架。以2層堆疊為例,第1層由多個(gè)基學(xué)習(xí)器組成,它的輸入為原始訓(xùn)練集,每個(gè)基學(xué)習(xí)器進(jìn)行K折訓(xùn)練;第2層模型以第1層基學(xué)習(xí)器的輸出作為訓(xùn)練集進(jìn)行再訓(xùn)練,最終得到完整的堆疊法模型。圖1為單個(gè)基學(xué)習(xí)器采用5折交叉驗(yàn)證的堆疊法模型示意圖,簡(jiǎn)要過(guò)程為:
圖1 堆疊法示意Fig.1 Sketch map of stacking framework
1) 使用一個(gè)基礎(chǔ)模型作為Model進(jìn)行5折交叉驗(yàn)證,5折交叉驗(yàn)證的含義為取4折作為訓(xùn)練數(shù)據(jù),另外1折作為測(cè)試數(shù)據(jù)。交叉驗(yàn)證過(guò)程為:基于訓(xùn)練數(shù)據(jù)模型,隨后基于訓(xùn)練數(shù)據(jù)訓(xùn)練生成的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)。在第1次交叉驗(yàn)證完成后會(huì)得到關(guān)于當(dāng)前測(cè)試數(shù)據(jù)的預(yù)測(cè)值,記為a1;
2) 對(duì)數(shù)據(jù)集自身的測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)得到預(yù)測(cè)值,這部分預(yù)測(cè)值將作為第2層模型測(cè)試數(shù)據(jù)的一部分,記為b1。5折交叉驗(yàn)證即為將以上過(guò)程實(shí)施5次,最終生成針對(duì)測(cè)試數(shù)據(jù)a1、a2、a3、a4、a5,對(duì)測(cè)試數(shù)據(jù)的預(yù)測(cè)結(jié)果為數(shù)據(jù)b1、b2、b3、b4、b5。
3) 在完成對(duì)Model1的整個(gè)步驟之后,得到的a1、a2、a3、a4、a5,即為對(duì)整個(gè)訓(xùn)練數(shù)據(jù)的預(yù)測(cè)值,將它們的組合記為矩陣A1;將b1、b2、b3、b4、b5相加取平均值,得到矩陣B1。則A1即為第2層模型的訓(xùn)練數(shù)據(jù),B1為第2層模型的測(cè)試數(shù)據(jù)。
以上為單個(gè)基學(xué)習(xí)器的stacking模型實(shí)施流程,通常情況下stacking模型的第1層包含多個(gè)基學(xué)習(xí)器,即可能存在Model2至ModelN,對(duì)于這些模型可重復(fù)以上步驟,在整個(gè)流程結(jié)束之后將得到A2,A3,…,AN,B2,B3,…,BN矩陣,隨后將A2,A3,…,AN合并為N列的矩陣作為訓(xùn)練數(shù)據(jù),B2,B3,…,BN合并為N列的矩陣作為測(cè)試數(shù)據(jù),并讓第2層模型基于新的訓(xùn)練數(shù)據(jù)及測(cè)試數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試。
本文采用的集成學(xué)習(xí)中的堆疊模型分為2層:第1層采用的基學(xué)習(xí)器為彈性網(wǎng)絡(luò)模型和梯度推進(jìn)模型,每個(gè)基學(xué)習(xí)器采用5折交叉驗(yàn)證:彈性網(wǎng)絡(luò)是一種同時(shí)使用L1范數(shù)和L2范數(shù)作為先驗(yàn)正則項(xiàng)訓(xùn)練的線性回歸模型,能實(shí)現(xiàn)輸入?yún)?shù)數(shù)量遠(yuǎn)小于輸出參數(shù)數(shù)量時(shí)的精確預(yù)測(cè);梯度推進(jìn)模型屬于集成學(xué)習(xí)中的boosting算法,在大樣本、復(fù)雜非線性系統(tǒng)中具有較大的優(yōu)勢(shì)[7];第2層采用的元學(xué)習(xí)器為最小絕對(duì)值選擇與收縮算子模型,它是一種有偏估計(jì)方法,由于在模型中加入了懲罰項(xiàng),使變量集合簡(jiǎn)化、稀疏,從而使模型更加精煉[8]。本文構(gòu)建的堆疊融合模型,可以集中各基學(xué)習(xí)器的優(yōu)勢(shì),在實(shí)現(xiàn)精確預(yù)測(cè)的同時(shí)保持計(jì)算的穩(wěn)定性。
本文采用開(kāi)源Python發(fā)行版本Anaconda 4.9.2中的科學(xué)包Jupyter 6.2.0進(jìn)行以上算法建模及運(yùn)行。
機(jī)器學(xué)習(xí)模型的預(yù)測(cè)結(jié)果可能受到多種因素影響而導(dǎo)致學(xué)習(xí)率不高、預(yù)測(cè)結(jié)果不準(zhǔn)確等問(wèn)題,通常情況下,隨著訓(xùn)練數(shù)據(jù)的增加,模型預(yù)測(cè)結(jié)果的準(zhǔn)確率會(huì)接近于1,最終在一定范圍內(nèi)將不再變化[9]。為了更好地對(duì)學(xué)習(xí)效果進(jìn)行評(píng)價(jià),應(yīng)當(dāng)選擇恰當(dāng)?shù)脑u(píng)價(jià)指標(biāo),本文使用的評(píng)價(jià)指標(biāo)為均方誤差MSE、平均絕對(duì)值誤差MAE及回歸平方和與總平方和之比Q2分別為:
(1)
變量含義同均方誤差,MAE值越小表明訓(xùn)練效果越好。
方差偏離矩陣Q2為:
(2)
對(duì)于通量分布、堆芯棒功率等分布量,以誤差分布作為評(píng)價(jià)指標(biāo),即計(jì)算堆芯每個(gè)棒位置處的均方根誤差,最后給出均方根誤差的分布。均方根誤差為:
(3)
式中r為棒在堆芯中的位置。
本文選擇的驗(yàn)證問(wèn)題為由經(jīng)濟(jì)合作與發(fā)展組織核能機(jī)構(gòu)發(fā)布的確定論中子輸運(yùn)計(jì)算驗(yàn)證基準(zhǔn)題C5G7問(wèn)題。采用建立的訓(xùn)練模型針對(duì)上述計(jì)算問(wèn)題開(kāi)展輸入?yún)?shù)和輸出響應(yīng)的特征捕捉,可以學(xué)習(xí)得到代替精細(xì)化物理計(jì)算過(guò)程的預(yù)測(cè)模型。本節(jié)將就C5G7的3個(gè)計(jì)算問(wèn)題,對(duì)預(yù)測(cè)模型的計(jì)算精確性、計(jì)算效率進(jìn)行驗(yàn)證,并開(kāi)展訓(xùn)練效果影響因素分析。
2.1.1 C5G7穩(wěn)態(tài)問(wèn)題
C5G7穩(wěn)態(tài)問(wèn)題[10]包括2D、3D問(wèn)題?;鶞?zhǔn)問(wèn)題是由16個(gè)燃料組件構(gòu)成的小型水堆全堆芯問(wèn)題,因此它可以簡(jiǎn)化為由4個(gè)燃料組件構(gòu)成的1/4堆芯。2D模型的規(guī)模為64.26 cm×64.26 cm,組件寬度為21.42 cm,下、右邊界采用真空邊界條件,上、左邊界采用全反射邊界條件以實(shí)現(xiàn)堆芯的對(duì)稱結(jié)構(gòu)。單個(gè)燃料組件采用17×17方形柵元布置,其中包括264個(gè)燃料柵元,24個(gè)導(dǎo)向管柵元(用于插拔控制棒)和1個(gè)位于中心的測(cè)量通道。對(duì)于UO2燃料組件,僅有一種燃料類型,而MOX燃料組件則包括4.3%、7.0%和8.7% 3種富集度的燃料。2D C5G7模型的幾何布置如圖2所示。
圖2 C5G7柵元排布及2D堆芯布置Fig.2 Fuel pin configuration and 2D layout of C5G7
3D C5G7模型則是在2D模型的基礎(chǔ)上將燃料區(qū)延伸至軸向高度為128.52 cm,同時(shí)堆芯的上部和下部增加厚度均為21.42 cm軸向反射材料,最終構(gòu)成規(guī)模為64.26 cm×64.26 cm×171.36 cm的三維計(jì)算問(wèn)題。3D C5G7模型的幾何布置如圖3所示。
圖3 3D C5G7布置Fig.3 3D configuration of C5G7 problem
本文對(duì)2D/3D C5G7問(wèn)題進(jìn)行訓(xùn)練所采用的輸入數(shù)據(jù)為堆芯材料宏觀截面,輸出數(shù)據(jù)為全堆芯有效增殖因子。
2.1.2 3D C5G7單組件瞬態(tài)問(wèn)題
C5G7單組件瞬態(tài)問(wèn)題描述了單個(gè)UO2組件在0.1 s內(nèi),由控制棒插入深度為20 cm變?yōu)槎研净钚詤^(qū)不插棒狀態(tài)的過(guò)程。堆芯四周采用全反射邊界條件,堆芯上下由于布置了反射材料因此采用真空邊界條件,3D C5G7單組件瞬態(tài)問(wèn)題的幾何描述如圖4所示。為了實(shí)現(xiàn)動(dòng)態(tài)過(guò)程的精確模擬,需要對(duì)事件發(fā)生時(shí)間進(jìn)行時(shí)間步的精確劃分,本文選擇的時(shí)間步長(zhǎng)為5 ms。
圖4 3D C5G7單組件幾何布置Fig.4 Geometry layout of 3D C5G7 single assembly
不同于穩(wěn)態(tài)問(wèn)題,本文對(duì)3D C5G7單組件瞬態(tài)問(wèn)題進(jìn)行訓(xùn)練所采用的輸入數(shù)據(jù)除了堆芯材料宏觀截面外,還包括中子速度、緩發(fā)中子份額、緩發(fā)中子能譜及緩發(fā)中子衰變常數(shù);輸出數(shù)據(jù)包括堆芯相對(duì)功率、反應(yīng)性、有效緩發(fā)中子份額、中子代時(shí)間。
穩(wěn)態(tài)及瞬態(tài)問(wèn)題的輸入?yún)?shù)和輸出參數(shù)均不一致,本文對(duì)2種問(wèn)題進(jìn)行訓(xùn)練和驗(yàn)證時(shí)采用的訓(xùn)練樣本和測(cè)試樣本數(shù)目也不相同。表1展示了不同計(jì)算問(wèn)題的輸入、輸出參數(shù)規(guī)模及訓(xùn)練、測(cè)試數(shù)目設(shè)置情況。對(duì)于訓(xùn)練樣本和測(cè)試樣本的選擇目前尚無(wú)定論,一般按照8∶2或7∶3的比例進(jìn)行設(shè)置,本文根據(jù)7∶3并結(jié)合實(shí)際產(chǎn)生的總樣本數(shù)設(shè)置了不同問(wèn)題的訓(xùn)練參數(shù)。
表1 訓(xùn)練規(guī)模及參數(shù)設(shè)置Table 1 Lists of parameters used in training and testing for cases
對(duì)于2D及3D C5G7穩(wěn)態(tài)問(wèn)題,其輸入-輸出關(guān)系為:
1) 材料宏觀截面(輸入):包括7個(gè)能群結(jié)構(gòu)的UO2、富集度分別為4.3%、7.0%、8.7%的MOX燃料、導(dǎo)向管、測(cè)量通道、慢化劑及控制棒等棒束的材料總截面Σt、吸收截面Σa、裂變截面Σf、中子產(chǎn)出截面υΣf、群-群的散射截面Σg→g′、裂變譜χ,共672個(gè)參數(shù)(值為0也包含在內(nèi));
2) HNET-穩(wěn)態(tài)模塊(計(jì)算模型):自主開(kāi)發(fā)的高保真精細(xì)化穩(wěn)態(tài)中子輸運(yùn)計(jì)算程序[11];
3) 有效增殖因子keff(輸出):有限大增殖介質(zhì)的中子增殖過(guò)程中,某代中子數(shù)與相鄰前一代中子數(shù)之比,用于描述堆芯鏈?zhǔn)椒磻?yīng)的狀態(tài)。
對(duì)于3D C5G7單組件瞬態(tài)問(wèn)題,其輸入-輸出關(guān)系為:
1) 材料宏觀截面及瞬態(tài)參數(shù)(輸入):包括7個(gè)能群結(jié)構(gòu)的UO2、富集度分別為4.3%、7.0%、8.7%的MOX燃料、導(dǎo)向管、測(cè)量通道、慢化劑及控制棒等棒束的材料總截面Σt、吸收截面Σa、裂變截面Σf、中子產(chǎn)出截面υΣf、群-群的散射截面Σg→g′、裂變譜χ、中子速度v;8個(gè)能群結(jié)構(gòu)的緩發(fā)中子份額、緩發(fā)中子能譜及緩發(fā)中子衰變常數(shù),共1 248個(gè)參數(shù)(值為0也包含在內(nèi));
2) HNET-瞬態(tài)模塊(計(jì)算模型):自主開(kāi)發(fā)的高保真精細(xì)化瞬態(tài)中子輸運(yùn)計(jì)算程序[12];
3) 輸出數(shù)據(jù)為各時(shí)間步下堆芯相對(duì)功率、反應(yīng)性、有效緩發(fā)中子份額、中子代時(shí)間,共128個(gè)參數(shù)。
2.3.1 2D C5G7穩(wěn)態(tài)問(wèn)題
2D C5G7穩(wěn)態(tài)問(wèn)題的輸入?yún)?shù)為7個(gè)宏觀截面,輸出參數(shù)為有效增殖因子。訓(xùn)練集樣本數(shù)目為108個(gè),測(cè)試集樣本數(shù)目為60個(gè)。圖5直觀地展示了由預(yù)測(cè)模型得到的預(yù)測(cè)值與精細(xì)化物理計(jì)算結(jié)果對(duì)比,可以看到,2種計(jì)算方法得到的結(jié)果基本一致,這在一定程度上表明了建立的機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)了對(duì)2D C5G7穩(wěn)態(tài)問(wèn)題輸入、輸出關(guān)系的特征捕捉,具有實(shí)現(xiàn)替代精細(xì)化計(jì)算的可能性。
圖5 2D C5G7堆芯有效增殖因子預(yù)測(cè)驗(yàn)證Fig.5 Prediction test for keff of 2D C5G7 problem
通過(guò)引入評(píng)價(jià)指標(biāo)可以定量判斷模型的訓(xùn)練效果。針對(duì)2D C5G7穩(wěn)態(tài)問(wèn)題堆芯有效增殖因子預(yù)測(cè)結(jié)果的MAE、MSE及Q23種評(píng)價(jià)指標(biāo)計(jì)算結(jié)果分別為1.537 60×10-5及1.104 93×10-9,Q2值為0.999 59。文獻(xiàn)[3]中開(kāi)展的反應(yīng)堆物理計(jì)算替代模型研究針對(duì)65個(gè)少群宏觀截面,采用200組訓(xùn)練樣本及100組驗(yàn)證樣本對(duì)組件無(wú)限增殖因子進(jìn)行預(yù)測(cè),評(píng)價(jià)指標(biāo)MAE及Q2分別為4.11×10-4及0.993。
與文獻(xiàn)[3]預(yù)測(cè)效果對(duì)比可以發(fā)現(xiàn),本文建立的訓(xùn)練模型針對(duì)2D C5G7穩(wěn)態(tài)問(wèn)題實(shí)現(xiàn)了多輸入?yún)?shù)、少訓(xùn)練樣本下對(duì)計(jì)算結(jié)果的精確預(yù)測(cè)。
2.3.2 3D C5G7穩(wěn)態(tài)問(wèn)題
3D C5G7穩(wěn)態(tài)問(wèn)題的輸入?yún)?shù)同樣為7群宏觀截面,輸出參數(shù)為有效增殖因子。訓(xùn)練集樣本數(shù)目及測(cè)試集樣本數(shù)目與2D問(wèn)題一直,分別為108和60。圖6展示了3D問(wèn)題下由預(yù)測(cè)模型得到的有效增殖因子預(yù)測(cè)值與精細(xì)化物理計(jì)算結(jié)果的對(duì)比,2種計(jì)算方法得到的結(jié)果同樣基本一致。
圖6 3D C5G7堆芯有效增殖因子預(yù)測(cè)驗(yàn)證Fig.6 Prediction test for keff of 3D C5G7 problem
3D C5G7穩(wěn)態(tài)問(wèn)題有效增殖因子預(yù)測(cè)結(jié)果的MAE、MSE及Q23種評(píng)價(jià)指標(biāo)計(jì)算結(jié)果分別為1.546 68×10-5、1.103 19×10-9、0.999 56。結(jié)果表明本文所建立的訓(xùn)練模型針對(duì)3D C5G7穩(wěn)態(tài)問(wèn)題同樣能實(shí)現(xiàn)堆芯有效增殖因子的精確預(yù)測(cè)。
2.3.3 3D C5G7單組件瞬態(tài)問(wèn)題
對(duì)于3D C5G7單組件瞬態(tài)問(wèn)題,利用預(yù)測(cè)模型實(shí)現(xiàn)了堆芯在不同時(shí)間下的相對(duì)功率、反應(yīng)性、有效緩發(fā)中子份額及中子代時(shí)間的預(yù)測(cè)。圖7展示了預(yù)測(cè)結(jié)果與高保真瞬態(tài)計(jì)算程序的相對(duì)誤差,可以看到,堆芯功率的相對(duì)誤差小于1.2%,反應(yīng)性的相對(duì)誤差小于0.014%,有效緩發(fā)中子份額相對(duì)誤差小于0.065%,中子代時(shí)間相對(duì)誤差小于0.59%,誤差均處于可接受范圍內(nèi)。這也表明了本文所建立的訓(xùn)練模型同樣實(shí)現(xiàn)了3D C5G7瞬態(tài)問(wèn)題堆芯關(guān)鍵參數(shù)的精確預(yù)測(cè)。
圖7 瞬態(tài)參數(shù)預(yù)測(cè)相對(duì)誤差Fig.7 Relative error of transient parameters prediction results
基于機(jī)器學(xué)習(xí)的替代模型代替?zhèn)鹘y(tǒng)高保真計(jì)算需要保證精度和計(jì)算時(shí)間的雙重收益,本節(jié)對(duì)計(jì)算時(shí)間進(jìn)行測(cè)試。表4列出了不同計(jì)算問(wèn)題使用傳統(tǒng)計(jì)算方式與預(yù)測(cè)模型的計(jì)算時(shí)間對(duì)比,可以看到對(duì)于2D、3D C5G7問(wèn)題訓(xùn)練模型進(jìn)行60組結(jié)果預(yù)測(cè)所需的計(jì)算時(shí)間在70 s以內(nèi),遠(yuǎn)低于采用高保真計(jì)算使用的時(shí)間;對(duì)于瞬態(tài)問(wèn)題而言,由于輸出參數(shù)增多,因此時(shí)間收益相較于穩(wěn)態(tài)問(wèn)題有所減少,但相比于傳統(tǒng)計(jì)算仍有33倍的計(jì)算時(shí)間收益。這表明采用基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型代替高保真計(jì)算所帶來(lái)的計(jì)算時(shí)間收益十分可觀,也表明了預(yù)測(cè)模型達(dá)到了精度與計(jì)算時(shí)間的雙重收益,滿足了開(kāi)展進(jìn)一步不確定性分析的2項(xiàng)基本前提。
表2 計(jì)算時(shí)間對(duì)比Table 2 Comparison of computational time
值得一提的是,訓(xùn)練時(shí)間應(yīng)當(dāng)包含訓(xùn)練樣本產(chǎn)生的時(shí)間,即進(jìn)行多次高保真計(jì)算的時(shí)間,這也帶來(lái)了一定的計(jì)算代價(jià)。然而,以訓(xùn)練模型開(kāi)展后續(xù)分析相比采用高保真計(jì)算仍能減少大量計(jì)算時(shí)間。綜合考慮,采用訓(xùn)練模型替代高保真計(jì)算的方案仍是可以采納的。
訓(xùn)練樣本數(shù)是模型訓(xùn)練過(guò)程中非常重要的參數(shù),它對(duì)模型的訓(xùn)練效果具有很大影響。通常情況下,訓(xùn)練樣本數(shù)越大,模型訓(xùn)練效果越好,但無(wú)限制的增加訓(xùn)練樣本數(shù)勢(shì)必會(huì)增加很多不必要的訓(xùn)練時(shí)間;同時(shí),采用數(shù)量不足的訓(xùn)練樣本數(shù)則達(dá)不到好的訓(xùn)練效果,因此有必要進(jìn)行訓(xùn)練樣本數(shù)目對(duì)訓(xùn)練效果影響的分析。
表3列出了在不同訓(xùn)練樣本數(shù)目下,對(duì)2D C5G7問(wèn)題keff的預(yù)測(cè)模型評(píng)價(jià)指標(biāo)的計(jì)算值,測(cè)試樣本數(shù)均為60。隨著樣本數(shù)目增加,MAE、MSE值逐漸減小,Q2值逐漸增大,結(jié)果符合預(yù)期。從圖8可以更直觀的看到這樣的變化趨勢(shì),但在訓(xùn)練樣本數(shù)目為20時(shí),Q2值大于采用30、40個(gè)訓(xùn)練樣本。事實(shí)上,這并不能說(shuō)明樣本數(shù)目為20時(shí)即可得到合理的預(yù)測(cè)結(jié)果。雖然Q2在訓(xùn)練樣本數(shù)目為20時(shí)較大,但預(yù)測(cè)結(jié)果與實(shí)際計(jì)算結(jié)果的方差相對(duì)誤差為11%,這對(duì)后續(xù)的不確定性分析結(jié)果會(huì)帶來(lái)負(fù)面的影響。同時(shí),從圖8中可以發(fā)現(xiàn)當(dāng)訓(xùn)練樣本數(shù)大于100時(shí),Q2值已經(jīng)很接近于1,此時(shí)預(yù)測(cè)結(jié)果和實(shí)際計(jì)算結(jié)果的方差相對(duì)誤差為1%,即采用大于等于100個(gè)訓(xùn)練樣本時(shí),模型的訓(xùn)練效果是符合要求的。因此,在評(píng)價(jià)訓(xùn)練效果時(shí),應(yīng)綜合考慮預(yù)測(cè)精度與方差分布,避免由訓(xùn)練模型引入新的不確定度。
表3 訓(xùn)練集數(shù)目對(duì)訓(xùn)練效果的影響Table 3 Effect of training data number on prediction accuracy
圖8 訓(xùn)練樣本數(shù)目對(duì)預(yù)測(cè)效果的影響Fig.8 Prediction accuracy change with number of training sets
本文采用2層堆疊的集成學(xué)習(xí)模型開(kāi)展針對(duì)堆芯關(guān)鍵參數(shù)的預(yù)測(cè),第1層計(jì)算模型分別為ENet、GBoost及KRR,第2層計(jì)算模型為lasso。事實(shí)上,不同模型可以單獨(dú)完成訓(xùn)練、預(yù)測(cè)工作,因此本節(jié)將分別單獨(dú)使用以上4種模型對(duì)2D C5G7問(wèn)題的堆芯keff進(jìn)行訓(xùn)練和測(cè)試,訓(xùn)練樣本數(shù)均為100,測(cè)試樣本數(shù)均為60。表4展示了采用以上模型單獨(dú)預(yù)測(cè)的評(píng)價(jià)指標(biāo)計(jì)算值??梢园l(fā)現(xiàn),KRR及GBoost方法建立的預(yù)測(cè)模型預(yù)測(cè)效果較差,但基于ENet、lasso方法的預(yù)測(cè)模型可以得到很好的預(yù)測(cè)結(jié)果。
表4 訓(xùn)練模型對(duì)訓(xùn)練效果的影響Table 4 Effect of training model on prediction accuracy
單就結(jié)果而言,采用單一方法建立的預(yù)測(cè)模型也可以得到精確的預(yù)測(cè)結(jié)果,但堆疊模型相比單一模型具有更顯著的優(yōu)勢(shì),如不需要太多的調(diào)參和特征選擇,模型魯棒性更強(qiáng)等。因此,堆疊模型仍是推薦的訓(xùn)練模型。
1) 本文開(kāi)展的樣本數(shù)目對(duì)預(yù)測(cè)效果的分析結(jié)果表明,當(dāng)訓(xùn)練樣本數(shù)目為100時(shí)可以得到滿足要求的預(yù)測(cè)結(jié)果,堆疊模型在實(shí)現(xiàn)精確預(yù)測(cè)的同時(shí)能保證其魯棒性。
2) 以基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型替代抽樣統(tǒng)計(jì)過(guò)程中大量重復(fù)的精細(xì)化物理計(jì)算開(kāi)展不確定性分析是可行的研究方案。
本文建立的堆疊模型為進(jìn)一步實(shí)現(xiàn)以核截面為不確定性來(lái)源的堆芯關(guān)鍵參數(shù)不確定性量化與分析提供了良好的工具基礎(chǔ)。該模型的應(yīng)用范圍并不限于此,進(jìn)一步可開(kāi)展共振計(jì)算、燃耗計(jì)算、物理熱工耦合計(jì)算的替代計(jì)算。同時(shí),在開(kāi)展規(guī)模更大、耗時(shí)更長(zhǎng)的計(jì)算結(jié)果預(yù)測(cè)時(shí),本文建立的替代模型將獲得更大的時(shí)間收益。