叢雨桐 吳鵬 王輔 竹含真 董麗媛 廖其龍 康昭 代云雅
(1.西南科技大學(xué) 環(huán)境友好能源材料國(guó)家重點(diǎn)實(shí)驗(yàn)室 綿陽 621010;2.西南科技大學(xué) 材料與化學(xué)學(xué)院 綿陽 621010;3.東華理工大學(xué) 江西省質(zhì)譜科學(xué)與儀器重點(diǎn)實(shí)驗(yàn)室 南昌 330013;4.東華理工大學(xué) 核科學(xué)與工程學(xué)院 南昌 330013;5.電子科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 611731)
核電、核科學(xué)的發(fā)展在為人類帶來益處的同時(shí)會(huì)產(chǎn)生放射性廢物,放射性廢物中的高放廢物(HLW)包含錒系元素和99T c等裂變產(chǎn)物[1],具有極高的毒性,處置不當(dāng)極易對(duì)人體健康和社會(huì)穩(wěn)定造成損害[2]。目前唯一投入工業(yè)應(yīng)用且發(fā)展成熟的技術(shù)是將高放廢物固化在玻璃基質(zhì)中并進(jìn)行深地質(zhì)處置[3,4]。玻璃固化體經(jīng)過若干年的地質(zhì)處置,流動(dòng)的地下水可能與其直接接觸,使其發(fā)生化學(xué)反應(yīng)并溶解,進(jìn)而導(dǎo)致放射性核素的浸出。因此,對(duì)玻璃固化體的浸出行為進(jìn)行研究和預(yù)測(cè),是核安全評(píng)價(jià)工作中的重要內(nèi)容[5]。
為了掌握高放核廢物玻璃固化體的浸出行為,眾多研究人員設(shè)計(jì)開發(fā)了多種玻璃固化體浸出描述模型,如溶液分析模型[6]、地球化學(xué)模型[7]、 熱力學(xué)模型[8]、 蒙特卡洛方法[9]等,但由于玻璃組分及溶解機(jī)制的復(fù)雜性,現(xiàn)有模型難以表現(xiàn)出玻璃固化體浸出行為的復(fù)雜性。機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)模型是基于現(xiàn)有數(shù)據(jù)庫開發(fā)的半經(jīng)驗(yàn)?zāi)P?,相比傳統(tǒng)模型,它更關(guān)注數(shù)據(jù)間的關(guān)系[10],減少了對(duì)溶解機(jī)理假設(shè)條件的需要,為玻璃固化體浸出行為的研究提供新的思路。目前機(jī)器學(xué)習(xí)模型已在各個(gè)領(lǐng)域得到了廣泛應(yīng)用[11,12],并已引入到玻璃浸出預(yù)測(cè)的研究中。研究人員采用人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)模型對(duì)磷酸鹽玻璃和鋁硅酸鹽玻璃的溶解行為進(jìn)行預(yù)測(cè),人工神經(jīng)網(wǎng)絡(luò)均給出了具有極佳吻合度的預(yù)測(cè)結(jié)果[13-16]。但是,人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等傳統(tǒng)的人工智能方法存在對(duì)大規(guī)模數(shù)據(jù)的處理能力不足、梯度消失和過擬合等問題,因此往往預(yù)測(cè)精度有限[17]。而以卷積神經(jīng)網(wǎng)絡(luò)(CNN)和時(shí)序卷積網(wǎng)絡(luò)(TCN)為代表的深度學(xué)習(xí)算法具有較強(qiáng)的數(shù)據(jù)特征提取和擬合能力,近年來已在材料的力學(xué)性能預(yù)測(cè)等研究中取得了成功[18,19]。
因此,本研究采用國(guó)際大型高放核廢物玻璃浸出數(shù)據(jù)庫ALTGLASS對(duì)人工神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和時(shí)序卷積網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練、預(yù)測(cè)。通過對(duì)比不同模型在預(yù)測(cè)高放玻璃固化體浸出行為上的準(zhǔn)確性,探究深度學(xué)習(xí)算法模型在高放玻璃固化體浸出行為預(yù)測(cè)上的潛力,為高放玻璃固化體化學(xué)穩(wěn)定性的預(yù)測(cè)提供新的思路。
本研究采用ALTGLASS數(shù)據(jù)庫對(duì)高放玻璃固化體浸出行為的ANN[14]、CNN[20]和TCN[21]模型進(jìn)行訓(xùn)練和測(cè)試。在模型結(jié)構(gòu)上,本研究將模型結(jié)構(gòu)分為輸入層、中間層和輸出層,輸入層將43維與實(shí)驗(yàn)和樣品有關(guān)的數(shù)據(jù)作為輸入值,元素的浸出預(yù)測(cè)值作為輸出層全連接層的輸出值,數(shù)據(jù)的處理由中間層負(fù)責(zé),ANN、CNN和TCN模型的中間層結(jié)構(gòu)設(shè)計(jì)及相關(guān)參數(shù)設(shè)置:
對(duì)于ANN模型,Si、B和Mg元素浸出模型均以一個(gè)全連接層作為中間層,分別含30、20和80個(gè)神經(jīng)元。Li、Cr和K元素浸出模型的中間層包含兩個(gè)全連接層,第一層分別含150、80和80個(gè)神經(jīng)元,第二層分別含80、50和50個(gè)神經(jīng)元。Na、Mo、Al、Fe和Ca元素浸出模型的中間層均包含三個(gè)全連接層,Na和Mo元素的第一層、第二層和第三層均分別含100、80和50個(gè)神經(jīng)元;Al、Fe和Ca元素的第一層、第二層和第三層均分別含100、80和50個(gè)神經(jīng)元。
CNN模型中間層包含一個(gè)或多個(gè)卷積層和一個(gè)flatten層。卷積層用于提取數(shù)據(jù)的特征,激活函數(shù)都為ReLu;flatten層將多維的輸入一維化,用于卷積層到全連接層的過渡。Si、Li、Cr、Na和K元素浸出模型分別使用一個(gè)包含30、20、80、25和100個(gè)卷積核的卷積層;Mo元素浸出模型的第一層和第二層卷積層,分別含80和50個(gè)卷積核;B元素浸出模型的第一層、第二層和第三層卷積層,分別含100、50和30個(gè)卷積核;Al、Fe、Mg和Ca元素浸出模型的第一層、第二層和第三層卷積層,均分別有100、80和50個(gè)卷積核。
11種元素的TCN模型均使用Keras包的tcn層,且均采用43個(gè)時(shí)間步。
ALTGLASS數(shù)據(jù)庫3.0[22]收集了包含高放廢物玻璃固化體和低放廢物玻璃固化體總計(jì)約450種不同組分玻璃的2600次靜態(tài)玻璃溶解數(shù)據(jù)。包括浸出持續(xù)時(shí)間、玻璃組分、溫度、滲濾液pH等42類 因 素 影 響 下Si、B、Ca、Cr、Li、Na、K、Al、Fe、Mo和Mg在內(nèi)的11種元素的浸出數(shù)據(jù)。所有實(shí)驗(yàn)均根據(jù)產(chǎn)品一致性測(cè)試(PCT, ASTM C1285 A和B)方法[23]獲得。該數(shù)據(jù)庫由國(guó)際研究人員提供實(shí)驗(yàn)數(shù)據(jù)檔案,并由美國(guó)薩凡納河國(guó)家實(shí)驗(yàn)室(SRNL)的研究人員維護(hù)和更新。
數(shù)據(jù)集選擇在90 ℃±2 ℃下的去離子水中獲得的高放玻璃固化體靜態(tài)浸出數(shù)據(jù),其包含113種不同組分,總計(jì)638條數(shù)據(jù)。根據(jù)元素在浸出液中的濃度通過式(1)計(jì)算元素歸一化質(zhì)量損失Qi:
式中:Qi為 元素歸一化質(zhì)量損失,g/m2;Ci為元素在浸出液中的濃度,g/L;fi為元素在玻璃樣品中的質(zhì)量分?jǐn)?shù);SA/V為樣品表面積與浸出液體積之比,m2/L。
以浸出持續(xù)時(shí)間、SA/V、樣品密度、浸出液pH、樣品組分作為特征。為了處理不同量綱的輸入量,需采用式(2)對(duì)數(shù)據(jù)進(jìn)行歸一化處理:
式中:Yi為 歸一化結(jié)果;xi為 當(dāng)前數(shù)據(jù);xmin和xmax分別為數(shù)據(jù)的最小值和最大值。
在訓(xùn)練開始前,分別隨機(jī)劃分64%、16%和20%的數(shù)據(jù)作為訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集作為輸入數(shù)據(jù)集對(duì)元素浸出模型進(jìn)行訓(xùn)練,訓(xùn)練過程中使用驗(yàn)證集對(duì)權(quán)重值進(jìn)行優(yōu)化以避免過擬合,訓(xùn)練好的元素浸出模型對(duì)元素歸一化浸出值進(jìn)行預(yù)測(cè),并與測(cè)試集數(shù)據(jù)進(jìn)行對(duì)比以評(píng)估模型的預(yù)測(cè)準(zhǔn)確性。
為了對(duì)測(cè)試結(jié)果定量分析,采用平均絕對(duì)誤差(MAE,和決定系數(shù)(R2,1-來評(píng)估模型準(zhǔn)確性。MAE越接近0,表示模型預(yù)測(cè)準(zhǔn)確性越好;R2越趨近1,表示模型預(yù)測(cè)準(zhǔn)確性越好。因此,當(dāng)R2值越接近1且MAE值越低,則認(rèn)為模型預(yù)測(cè)性能越好。
ANN、CNN、TCN三種模型對(duì)11種元素測(cè)試集預(yù)測(cè)結(jié)果的R和MAE誤差值如圖1所示。
圖1 利用人2工神經(jīng)網(wǎng)絡(luò)、時(shí)序卷積網(wǎng)絡(luò)、卷積神 經(jīng)網(wǎng)絡(luò)預(yù)測(cè)獲得的測(cè)試集R2 和MAE
由圖1可知,對(duì)于Al元素,其TCN模型的R2值約為0.95,明顯高于CNN和ANN模型的0.82和0.21,此外TCN、ANN和CNN模型的MAE誤差值分別為0.0120、0.0121和0.0248。因此對(duì)Al元素浸出行為的預(yù)測(cè),TCN模型準(zhǔn)確度最高,其次為ANN模型,CNN模型準(zhǔn)確度最差。B、Cr和Li元素的TCN模型R2值分別為0.91、0.94和0.95,明顯高于ANN模型的0.81、0.64和0.86,且高于CNN模型的0.61、0.72和0.72。三種元素的TCN模型的MAE值分別為0.0272、0.0160和0.0251,ANN模型的MAE值分別為0.0362、0.0273和0.0320,CNN模型的MAE值分別為0.0518、0.0290和0.0409。三種元素的TCN模型MAE值均低于其ANN模型和CNN模型的MAE值,說明TCN模型對(duì)這三種元素浸出行為預(yù)測(cè)的吻合度優(yōu)于ANN模型和TCN模型。對(duì)于Ca元素,TCN、ANN和CNN模型的R2和MAE值 分 別 為0.42和0.0182、0.41和0.019以 及0.11和0.0197,因此,TCN模型預(yù)測(cè)準(zhǔn)確性略微優(yōu)于ANN模型并明顯優(yōu)于CNN模型。
K、Mo、Na元 素 的ANN模 型 的R2值 分 別 為0.84、0.89和0.93,明顯高于CNN模型的0.60、0.60和0.65以及TCN模型的0.67、0.86和0.63。三種元素的ANN模型的MAE值分別為0.0031、0.0229和0.0241, 低 于 三 種 元 素 的TCN模 型0.0071、0.0256和0.0658和CNN模 型 的0.0035、0.0286和0.0482。三種元素的ANN模型在ANN、CNN、TCN三種模型中均表現(xiàn)出最高的R2值和最低的MAE值,表示ANN模型對(duì)于K、Mo、Na元素浸出行為有較好吻合度。Si元素的ANN模型和TCN模 型 的R2均 為0.96,CNN模 型R2為0.84。而TCN模 型 的MAE為0.0022, 低 于ANN模 型 的0.0044和CNN模型的0.0029,因此,TCN模型能夠?qū)i元素浸出行為獲得吻合度更高的預(yù)測(cè)效果。
Fe元素的CNN模型在三種模型中表現(xiàn)出最低的R2值和最高的MAE值,說明CNN模型對(duì)于Fe元素浸出行為的預(yù)測(cè)能力較差。Fe元素的ANN模型相較TCN模型同時(shí)表現(xiàn)出較低的R2和MAE值。由于R2值受元素浸出實(shí)驗(yàn)值的平均值的影響,而平均值受歸一化浸出實(shí)驗(yàn)值分布均勻度、訓(xùn)練集和測(cè)試集隨機(jī)劃分的影響,不能直接體現(xiàn)實(shí)驗(yàn)值與計(jì)算值的吻合度。因此以MAE作為Fe元素的ANN和TCN模型預(yù)測(cè)吻合度評(píng)估標(biāo)準(zhǔn)。Fe元素的ANN模型MAE為0.0212,低于TCN模型的0.0239和CNN模型的0.049,因此對(duì)于Fe元素浸出行為,ANN模型表現(xiàn)出更優(yōu)的預(yù)測(cè)吻合度。Mg元素三種模型的R2和MAE結(jié)果與Fe元素類似,出現(xiàn)了R2和MAE同時(shí)低或高的情況。ANN模型獲得的R2和MAE分別為0.78和0.0066,TCN模型獲得的R2和MAE值分別為0.75和0.0056,CNN模型獲得R2和MAE值分別為0.71和0.0060。 在R2上, ANN>TCN>CNN。 在MAE值上,ANN>CNN>TCN。由于R2不能直接體現(xiàn)實(shí)驗(yàn)值與計(jì)算值之間的吻合度,因此根據(jù)MAE值大小,對(duì)于Mg元素,TCN模型預(yù)測(cè)準(zhǔn)確性高于ANN模型和CNN模型。
綜上所述,TCN模型對(duì)Al、B、Cr、Li、Ca、Mg、Si元素的浸出行為的預(yù)測(cè)在三種模型中具有最優(yōu)準(zhǔn)確度。ANN模型對(duì)Fe、K、Na、Mo元素的浸出行為在三種模型中具有最優(yōu)準(zhǔn)確度。而CNN模型對(duì)11種元素浸出行為的預(yù)測(cè)吻合度較差。
為了更具體地對(duì)比分析三種模型對(duì)高放核廢物玻璃中各元素歸一化浸出值的計(jì)算值與實(shí)驗(yàn)值值的散點(diǎn)圖如圖2所示。
圖2 Si、B、Li、Cr、Al、Mg元素的ANN、CNN、TCN計(jì)算值與實(shí)驗(yàn)值散點(diǎn)對(duì)比
Na、K、Mo和Fe元素的ANN、CNN和TCN模型的訓(xùn)練和預(yù)測(cè)過程中的計(jì)算值和實(shí)驗(yàn)值的散點(diǎn)圖如圖3所示。
圖3 Na、K、Mo、Fe元素的ANN、CNN、TCN計(jì)算值與實(shí)驗(yàn)值散點(diǎn)對(duì)比
Ca元素的ANN、CNN和TCN模型的訓(xùn)練和預(yù)測(cè)過程中的計(jì)算值和實(shí)驗(yàn)值的散點(diǎn)圖如圖4所示。
圖4 Ca元素浸出的實(shí)驗(yàn)值與計(jì)算值對(duì)比
在圖2~圖4中,分別以叉形和球形表示訓(xùn)練集和測(cè)試集,虛線是表示實(shí)驗(yàn)值和計(jì)算值完全吻合的理想擬合線。數(shù)據(jù)點(diǎn)越靠近該線,代表該點(diǎn)計(jì)算值和實(shí)驗(yàn)值吻合得越好,數(shù)據(jù)集中靠近該線的點(diǎn)越多,說明該數(shù)據(jù)集預(yù)測(cè)準(zhǔn)確度越高。
根據(jù)圖2(a)~(c),采用508個(gè)數(shù)據(jù)點(diǎn)對(duì)Si元素的TCN、CNN和ANN模型分別進(jìn)行訓(xùn)練,訓(xùn)練過程中TCN模型的計(jì)算值和實(shí)驗(yàn)值吻合度最優(yōu),其次為ANN模型,CNN模型的計(jì)算值和實(shí)驗(yàn)值吻合度最差。在測(cè)試過程中根據(jù)126個(gè)實(shí)驗(yàn)值和預(yù)測(cè)值的對(duì)比可以發(fā)現(xiàn),TCN模型數(shù)據(jù)點(diǎn)分布相比ANN和CNN模型更加接近理想擬合線,這表示TCN模型的計(jì)算值與實(shí)驗(yàn)值吻合度優(yōu)于ANN模型和CNN模型。結(jié)合圖1中Si元素TCN模型R2達(dá)到0.96,歸一化浸出計(jì)算MAE為0.0022,說明TCN模型對(duì)Si元素浸出行為的預(yù)測(cè)準(zhǔn)確度較高。此外,ANN模型R2等于TCN模型并高于CNN模型,但ANN模型的MAE值在三種模型中最高,因此表現(xiàn)出R2和MAE值均較高的情況。由散點(diǎn)圖可以發(fā)現(xiàn),在三種模型中,CNN和TCN模型預(yù)測(cè)集數(shù)據(jù)點(diǎn)劃分較為集中,而ANN模型測(cè)試集中有兩個(gè)數(shù)據(jù)點(diǎn)偏離大部分?jǐn)?shù)據(jù)點(diǎn)較遠(yuǎn)。由R2計(jì)算公式可知,R2值受實(shí)驗(yàn)值的平均值的影響。因此ANN測(cè)試集中處于0.4~0.8 g/m2歸一化浸出實(shí)驗(yàn)值區(qū)域的兩個(gè)數(shù)據(jù)點(diǎn)導(dǎo)致實(shí)驗(yàn)值的平均值升高,使Si元素ANN模型的R2升高。而MAE值僅計(jì)算實(shí)驗(yàn)值與模型計(jì)算值之間的誤差,因而更能反映模型預(yù)測(cè)準(zhǔn)確性。根據(jù)ANN模型和CNN模型的MAE值,CNN模型對(duì)于Si元素浸出行為的預(yù)測(cè)準(zhǔn)確性優(yōu)于ANN模型。因此在Si元素浸出行為的預(yù)測(cè)上,TCN模型的準(zhǔn)確性優(yōu)于CNN模型優(yōu)于ANN模型。此外,ANN模型的訓(xùn)練集和測(cè)試集以及CNN模型的訓(xùn)練集數(shù)據(jù)點(diǎn)在高于0.1 g/m2的歸一化實(shí)驗(yàn)浸出值范圍內(nèi)均出現(xiàn)偏離理想擬合線的情況,這可能是由于數(shù)據(jù)集在高于0.1 g/m2的歸一化實(shí)驗(yàn)浸出值區(qū)域數(shù)據(jù)較少,使ANN模型和CNN模型不能獲得充分訓(xùn)練導(dǎo)致模型對(duì)該區(qū)域浸出行為的計(jì)算出現(xiàn)較大的偏差。
由圖2(d)~(f)所示,采用508個(gè)數(shù)據(jù)點(diǎn)對(duì)B元素的TCN、CNN和ANN模型分別進(jìn)行訓(xùn)練。TCN模型的訓(xùn)練集數(shù)據(jù)點(diǎn)最接近理想擬合線,ANN模型其次,CNN模型訓(xùn)練集數(shù)據(jù)點(diǎn)分布與理想擬合線的吻合最差。表明TCN的訓(xùn)練集計(jì)算值和實(shí)驗(yàn)值吻合度最優(yōu),其次為ANN模型,CNN的計(jì)算值和實(shí)驗(yàn)值吻合度最差。采用126個(gè)數(shù)據(jù)點(diǎn)對(duì)B元素的三種模型進(jìn)行測(cè)試,由圖可以發(fā)現(xiàn),B元素的TCN模型數(shù)據(jù)點(diǎn)分布相比ANN模型和CNN模型同樣表現(xiàn)出更吻合的擬合趨勢(shì),說明TCN模型在三種模型中對(duì)B元素浸出行為的預(yù)測(cè)性能最優(yōu)。CNN模型的訓(xùn)練集和預(yù)測(cè)集數(shù)據(jù)點(diǎn)相比理想擬合線均出現(xiàn)較大的偏差,其在歸一化實(shí)驗(yàn)浸出值的整體區(qū)域內(nèi)計(jì)算值和實(shí)驗(yàn)值吻合度相對(duì)較差,說明模型訓(xùn)練過程中出現(xiàn)欠擬合現(xiàn)象,表明了CNN模型對(duì)B元素浸出行為預(yù)測(cè)的適用性較差。
如圖2(g)~(i)所示,分別采用412和102個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)Li元素的ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。Li元素的TCN模型的訓(xùn)練集和測(cè)試集數(shù)據(jù)點(diǎn)均較好地沿理想擬合線分布,而CNN模型和ANN模型均有部分?jǐn)?shù)據(jù)點(diǎn)偏離理想擬合線較遠(yuǎn),表示TCN模型對(duì)訓(xùn)練集實(shí)驗(yàn)值和計(jì)算值表現(xiàn)出最優(yōu)的吻合度,CNN和ANN模型次之。對(duì)于測(cè)試集,TCN模型的計(jì)算值同樣表現(xiàn)出最優(yōu)的吻合度,其測(cè)試集數(shù)據(jù)點(diǎn)緊密分布于理想擬合線上,其次為ANN模型,CNN模型對(duì)于計(jì)算值和實(shí)驗(yàn)值的吻合度最差,其數(shù)據(jù)點(diǎn)分布較理想擬合線最分散。結(jié)合圖1中,Li元素的TCN模型R2達(dá)到0.95且MAE值為0.0251,表明TCN模型能對(duì)Li元素浸出行為提供可靠的預(yù)測(cè)結(jié)果。TCN模型僅在無訓(xùn)練集數(shù)據(jù)的1.0 g/m2左右的歸一化實(shí)驗(yàn)浸出值處對(duì)計(jì)算值表現(xiàn)出了較明顯的誤差,且該誤差隨著歸一化實(shí)驗(yàn)浸出值的增加而增加,說明TCN模型對(duì)于未訓(xùn)練的區(qū)域,其計(jì)算值和實(shí)驗(yàn)值的吻合度降低。Li元素的ANN模型和CNN模型在高于0.5~1.0 g/m2的歸一化實(shí)驗(yàn)浸出值區(qū)域內(nèi)的訓(xùn)練集和測(cè)試集計(jì)算值與實(shí)驗(yàn)值吻合度較差,這說明ANN模型和CNN模型在訓(xùn)練過程中出現(xiàn)了欠擬合現(xiàn)象。
如圖2(j)~(l)所示,分別采用314和77個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)Cr元素的ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試,可以發(fā)現(xiàn)TCN模型的訓(xùn)練集與測(cè)試集數(shù)據(jù)點(diǎn)最靠近理想擬合線,說明TCN模型對(duì)于Cr元素訓(xùn)練集和測(cè)試集的計(jì)算值和實(shí)驗(yàn)值吻合度最好,CNN模型次之,ANN模型對(duì)訓(xùn)練集和測(cè)試集的計(jì)算值和實(shí)驗(yàn)值吻合度最差。但在0.6 ~1.0 g/m2區(qū)域,TCN模型的訓(xùn)練集和測(cè)試集均表現(xiàn)出較明顯的計(jì)算值誤差,這可能是由于0.6~1.0 g/m2區(qū)域?qū)嶒?yàn)數(shù)據(jù)較少且分布不均勻?qū)е隆G覝y(cè)試集中位于1.0 g/m2的歸一化實(shí)驗(yàn)浸出值處的數(shù)據(jù)其計(jì)算值相比實(shí)驗(yàn)值偏差較大,這是由于該區(qū)域無訓(xùn)練集數(shù)據(jù),導(dǎo)致模型未在此區(qū)域獲得訓(xùn)練。這與Li元素的TCN模型情況相似。
如圖2(m)~(o)所示,分別采用507和126個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)Al元素的ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。Al元素的ANN模型和CNN模型訓(xùn)練集數(shù)據(jù)點(diǎn)分布與理想擬合線較遠(yuǎn),說明這兩種模型對(duì)于Al元素浸出實(shí)驗(yàn)值和計(jì)算值的吻合度較差,而TCN模型訓(xùn)練集計(jì)算值在三種模型中表現(xiàn)出與實(shí)驗(yàn)值最優(yōu)的吻合度,其訓(xùn)練集數(shù)據(jù)點(diǎn)分布于理想擬合線周圍。Al元素的TCN模型對(duì)測(cè)試集的計(jì)算值與實(shí)驗(yàn)值吻合較好,但在歸一化實(shí)驗(yàn)浸出值為0.0處計(jì)算值相比實(shí)驗(yàn)值偏差較大,這表示在該區(qū)域內(nèi)模型對(duì)于Al元素浸出計(jì)算值往往高估。由圖中可以發(fā)現(xiàn),TCN模型對(duì)于歸一化實(shí)驗(yàn)浸出值為0.0處的Al元素浸出行為預(yù)測(cè)準(zhǔn)確性較弱,而對(duì)其他區(qū)域的Al元素浸出行為預(yù)測(cè)適用性更佳。ANN模型對(duì)Al元素測(cè)試集計(jì)算值和實(shí)驗(yàn)值吻合度較TCN模型差,但優(yōu)于CNN模型。
如圖2(p)~(r)所示,Mg元素浸出數(shù)據(jù)集分別劃分為405和100個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集并對(duì)ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。對(duì)于訓(xùn)練集,TCN模型訓(xùn)練集數(shù)據(jù)點(diǎn)的分布與理想擬合線分布最吻合,而ANN模型和CNN模型均有部分?jǐn)?shù)據(jù)點(diǎn)偏離理想擬合線較遠(yuǎn)。因此TCN模型計(jì)算值與實(shí)驗(yàn)值吻合度優(yōu)于CNN模型和ANN模型。在測(cè)試集上,TCN模型的測(cè)試集數(shù)據(jù)點(diǎn)分布與理想擬合線最吻合,表示TCN模型獲得的計(jì)算值與實(shí)驗(yàn)浸出值具有較好吻合度,說明TCN模型對(duì)Mg元素浸出行為具有較好預(yù)測(cè)能力。而ANN模型和CNN模型對(duì)于歸一化實(shí)驗(yàn)浸出值為0.0~0.1 g/m2區(qū)域的計(jì)算值與實(shí)驗(yàn)值吻合度較好,對(duì)于其他區(qū)域的計(jì)算值與實(shí)驗(yàn)值吻合度較差。由圖中可以發(fā)現(xiàn),Mg元素的歸一化浸出實(shí)驗(yàn)值大多聚集于0.0~0.1 g/m2,而0.1~1.0 g/m2區(qū)域的數(shù)據(jù)較少。這說明ANN模型和CNN模型對(duì)于Mg元素的預(yù)測(cè)性能可能受數(shù)據(jù)數(shù)的影響。由圖1可以發(fā)現(xiàn),與CNN模型和TCN模型相比,Mg元素的ANN模型出現(xiàn)R2和MAE均較高的現(xiàn)象,是由于實(shí)驗(yàn)值的平均值較高導(dǎo)致R2偏高,這與Si元素類似。
綜上所述,結(jié)合圖1和圖2可以發(fā)現(xiàn),TCN模型對(duì)于Si、B、Li、Cr、Al、Mg這六種元素的浸出行為可以提供較優(yōu)預(yù)測(cè)效果。ANN模型預(yù)測(cè)準(zhǔn)確性弱于TCN模型。其在對(duì)Li、Cr、Al、Mg元素浸出行為訓(xùn)練的過程中出現(xiàn)欠擬合現(xiàn)象,導(dǎo)致ANN模型對(duì)于這四類元素的預(yù)測(cè)準(zhǔn)確性較差。CNN模型對(duì)于這六種元素計(jì)算值與實(shí)驗(yàn)值吻合度均較差,且往往低估計(jì)算值,這可能是由于CNN模型對(duì)于訓(xùn)練集數(shù)據(jù)量需求較高,現(xiàn)有數(shù)據(jù)庫浸出數(shù)據(jù)無法使CNN模型獲得充分訓(xùn)練。
如圖3(a)~(c)所示,分別采用508和126個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)Na元素的ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。Na元素的CNN模型訓(xùn)練集和測(cè)試集中部分?jǐn)?shù)據(jù)點(diǎn)分布離理想擬合線較遠(yuǎn),而ANN模型和TCN模型對(duì)Na元素訓(xùn)練集和測(cè)試集數(shù)據(jù)點(diǎn)與理想擬合線的吻合度優(yōu)于CNN模型。表示ANN模型和TCN模型對(duì)Na元素浸出行為的預(yù)測(cè)準(zhǔn)確性優(yōu)于CNN模型。結(jié)合圖1中三種模型對(duì)Na元素的R2和MAE值,ANN模型可以對(duì)Na元素浸出行為提供更準(zhǔn)確的預(yù)測(cè)。但ANN模型和CNN模型在0.5~1.0 g/m2區(qū)域時(shí)計(jì)算值更易被嚴(yán)重低估,這可能是由于Na元素的擴(kuò)散速率受生長(zhǎng)蝕變層限制[24]而導(dǎo)致其釋放過程的預(yù)測(cè)對(duì)模型的非線性關(guān)系處理能力提出了更高的要求。
如圖3(d)~(f)所示,K元素浸出數(shù)據(jù)集分別劃分為282和70個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。對(duì)于訓(xùn)練集,ANN模型數(shù)據(jù)點(diǎn)與理想擬合線的吻合度優(yōu)于TCN模型和CNN模型,CNN模型訓(xùn)練集數(shù)據(jù)點(diǎn)與理想擬合線吻合度最差,表明在模型計(jì)算值與實(shí)驗(yàn)值的吻合度上,ANN模型優(yōu)于TCN模型優(yōu)于CNN模型。對(duì)于測(cè)試集,K元素的ANN模型數(shù)據(jù)點(diǎn)沿理想擬合線分布較CNN模型和TCN模型更加緊密,這表示ANN模型對(duì)于K元素浸出行為準(zhǔn)確性更優(yōu)。ANN、CNN和TCN模型在歸一化實(shí)驗(yàn)浸出值為0.0處計(jì)算值相比實(shí)驗(yàn)值偏差較大,說明模型無法對(duì)歸一化實(shí)驗(yàn)浸出值約為0.0處的浸出行為做出較準(zhǔn)確的預(yù)測(cè)。此外,三種模型均對(duì)歸一化實(shí)驗(yàn)浸出值位于0.1~1.0 g/m2區(qū)域的兩個(gè)數(shù)據(jù)點(diǎn)的計(jì)算值嚴(yán)重低估,這可能是由于該區(qū)域內(nèi)數(shù)據(jù)過少,導(dǎo)致模型對(duì)該區(qū)域內(nèi)的訓(xùn)練集和預(yù)測(cè)集數(shù)據(jù)的計(jì)算值和實(shí)驗(yàn)值吻合度較差。
如圖3(g)~(i)所示,Mo元素浸出數(shù)據(jù)集分別劃分為148和36個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。Mo元素的ANN模型訓(xùn)練集和測(cè)試集數(shù)據(jù)點(diǎn)與理想擬合線均表現(xiàn)出較好的吻合度,說明ANN模型對(duì)于訓(xùn)練集和測(cè)試集的計(jì)算值均與實(shí)驗(yàn)值具有較好吻合度,表明ANN模型對(duì)于Mo元素浸出行為預(yù)測(cè)具有較好的準(zhǔn)確性。TCN模型表現(xiàn)其次,CNN模型對(duì)于訓(xùn)練集和測(cè)試集計(jì)算值與實(shí)驗(yàn)值吻合度最差。三種模型對(duì)于Mo元素浸出計(jì)算值在1.0 g/m2左右的歸一化實(shí)驗(yàn)浸出值處均被低估,這是因?yàn)镸o元素?cái)?shù)據(jù)集的歸一化浸出實(shí)驗(yàn)值集中在0~0.7 g/m2范圍,處于0.7~1.0 g/m2區(qū)域數(shù)據(jù)較少,模型訓(xùn)練不足,導(dǎo)致在該區(qū)域的計(jì)算值被低估。TCN模型數(shù)據(jù)點(diǎn)分布較ANN模型偏離理想擬合線更大,且在0.5~1.0 g/m2的歸一化實(shí)驗(yàn)浸出值區(qū)域內(nèi)的計(jì)算值往往被低估。CNN模型在0.3 g/m2的歸一化實(shí)驗(yàn)浸出值區(qū)域內(nèi)的計(jì)算值同樣被嚴(yán)重低估。這可能是由于訓(xùn)練集提供的數(shù)據(jù)量不足,無法使CNN和TCN模型獲得足夠的訓(xùn)練的緣故。在預(yù)處理過程中,剔除不添加Mo元素的數(shù)據(jù)后其數(shù)據(jù)集僅剩184條數(shù)據(jù),之后劃分148條數(shù)據(jù)作為訓(xùn)練集和36條數(shù)據(jù)作為測(cè)試集。CNN模型和TCN模型對(duì)數(shù)據(jù)量的依賴程度較ANN模型高,較少的數(shù)據(jù)量會(huì)導(dǎo)致模型無法獲得充分的訓(xùn)練,而ANN模型則可以在數(shù)據(jù)量較少的情況下提供較優(yōu)的預(yù)測(cè)準(zhǔn)確性,這在現(xiàn)有文獻(xiàn)中也被印證過[13]。
如圖3(j)~(l)所示,F(xiàn)e元素浸出數(shù)據(jù)集分別劃分為507和126個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。對(duì)于訓(xùn)練集,TCN模型數(shù)據(jù)點(diǎn)與理想擬合線最吻合,表示計(jì)算值與實(shí)驗(yàn)值吻合度最優(yōu),ANN模型其次,CNN模型計(jì)算值與實(shí)驗(yàn)值吻合度最差。對(duì)于測(cè)試集,ANN模型和TCN模型計(jì)算值和實(shí)驗(yàn)值吻合度均較優(yōu)。由圖1可以發(fā)現(xiàn),TCN模型的R2和MAE值與ANN模型相比均較高,這是由于TCN模型測(cè)試集數(shù)據(jù)點(diǎn)的歸一化實(shí)驗(yàn)值相比ANN模型更加分散,導(dǎo)致實(shí)驗(yàn)值的平均值較高而使R2偏大。因此根據(jù)MAE值,ANN模型可以為Fe元素的浸出行為提供更可靠的預(yù)測(cè)。
如圖4所示,Ca元素浸出數(shù)據(jù)集分別劃分為368和91個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集和測(cè)試集對(duì)ANN、CNN和TCN模型進(jìn)行訓(xùn)練和測(cè)試。由圖4可以發(fā)現(xiàn),三種模型對(duì)于Ca元素訓(xùn)練集和測(cè)試集在歸一化浸出實(shí)驗(yàn)值為0.0處計(jì)算值與實(shí)驗(yàn)值吻合度均較差且普遍高估。而在其他區(qū)域,數(shù)據(jù)點(diǎn)分布于理想擬合線下方,說明該區(qū)域內(nèi)三種模型均傾向于低估Ca元素浸出值。根據(jù)圖1中三種模型的R2和MAE值,TCN模型對(duì)Ca元素浸出行為提供了最高的R2和最低的MAE值,表明相比ANN模型和CNN模型,TCN模型對(duì)Ca元素浸出行為預(yù)測(cè)性能更優(yōu),但其R2值僅為0.42,這表明三種模型對(duì)Ca元素浸出行為的預(yù)測(cè)能力有限。這可能是由于Ca與玻璃中其他元素的相互作用及其pH依賴的特性使其浸出機(jī)理更加復(fù)雜[25,26],使這三種模型無法準(zhǔn)確描述Ca元素浸出的非線性關(guān)系。
本研究利用大型國(guó)際核廢物玻璃浸出數(shù)據(jù)庫ALTGLASS中42類因素作為輸入特征對(duì)高放核廢物玻璃元素浸出行為的ANN、CNN、TCN三種機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。通過ANN、CNN和TCN模型對(duì)11種元素浸出行為的預(yù)測(cè)集誤差和散點(diǎn)圖可以發(fā)現(xiàn),TCN模型對(duì)高放玻璃固化體中元素浸出行為的綜合預(yù)測(cè)準(zhǔn)確性優(yōu)于ANN模型和CNN模型,尤其在對(duì)Cr、Si、Li和Al元素的浸出行為預(yù)測(cè)上表現(xiàn)出較高的預(yù)測(cè)準(zhǔn)確度。這四種元素的TCN模型MAE決定系數(shù)均在0.9以上,其中Al、Si元素測(cè)試集決定系數(shù)達(dá)到0.95以上。ANN模型對(duì)11種元素的綜合預(yù)測(cè)準(zhǔn)確性略弱于TCN模型,但對(duì)Fe、K、Na和Mo元素浸出行為預(yù)測(cè)準(zhǔn)確度最高,其中Mo元素測(cè)試集決定系數(shù)約為0.93。且ANN模型在訓(xùn)練集數(shù)據(jù)較少的情況下能提供準(zhǔn)確性較優(yōu)的預(yù)測(cè)結(jié)果;CNN模型對(duì)本研究中11種元素浸出行為的預(yù)測(cè)吻合度最差。本研究結(jié)果表明,TCN和ANN浸出預(yù)測(cè)模型結(jié)合能較好且全面的預(yù)測(cè)玻璃固化體中各元素的浸出行為,本研究為高放玻璃固化體服役過程中化學(xué)穩(wěn)定性的預(yù)測(cè)提供了新的技術(shù)方法。