陳俊杰,胡文慧,肖建元,郭筆豪,肖炳甲,
1(中國(guó)科學(xué)技術(shù)大學(xué) 物理學(xué)院 工程與應(yīng)用物理系,合肥 230026)
2(中國(guó)科學(xué)院 合肥物質(zhì)科學(xué)研究院 等離子體物理研究所,合肥 230031)
托卡馬克磁約束聚變裝置是實(shí)現(xiàn)熱核聚變最具有前景的手段.EAST (Experimental Advanced Superconducting Tokamak) 核聚變裝置是我國(guó)自主要發(fā)的全超導(dǎo)托卡馬克[1].托卡馬克裝置放電時(shí)由于磁流體不穩(wěn)定性、約束性能下降和儲(chǔ)能快速損失會(huì)導(dǎo)致等離子體電流瞬間熄滅,即破裂(disruption)[2-4].等離子體破裂會(huì)對(duì)裝置造成嚴(yán)重?fù)p害,限制可達(dá)到的運(yùn)行參數(shù).目前EAST主要的破裂避免和緩解系統(tǒng)是大量氣體注入(Massive Gas Injection,MGI)、散彈彈丸注入.EAST 的MGI 系統(tǒng)從響應(yīng)到氣體到達(dá)破裂區(qū)的時(shí)間大約10 ms[5].而破裂預(yù)測(cè)是破裂避免和緩解的前提,因此對(duì)破裂進(jìn)行預(yù)測(cè)尤為重要.
實(shí)驗(yàn)中已觀察到多種破裂類型,如鎖模破裂、垂直位移破裂、密度極限破裂等.等離子體密度是托卡馬克裝置3 大運(yùn)行極限之一[3],高密度運(yùn)行有利于達(dá)到聚變點(diǎn)火條件且是實(shí)現(xiàn)聚變的必要條件,如國(guó)際熱核聚變實(shí)驗(yàn)堆(ITER) 將以0.85nGW(nGW為Greenwald密度極限[6]) 的高密度作為基本的運(yùn)行模式[7],然而給定一個(gè)等離子體電流,密度存在安全運(yùn)行極限值,當(dāng)超過(guò)這個(gè)密度上限后.就會(huì)發(fā)生密度極限破裂(density limit disruption)[6,8-10].EAST 的運(yùn)行參數(shù)都較接近下一代托卡馬克,如ITER、中國(guó)聚變工程實(shí)驗(yàn)堆(CFTER),EAST 的密度極限破裂炮占所有的破裂炮的16.3%(972 炮),因此,EAST 密度極限破裂預(yù)測(cè)的研究對(duì)于下一代聚變裝置的穩(wěn)定運(yùn)行具有重要意義.
通常,等離子體破裂分為3 個(gè)階段:先兆階段(1 ms~100 ms)、熱猝滅階段(~0.1 ms)、電流猝滅階段(~10 ms),這3 個(gè)階段的時(shí)間與裝置尺寸有關(guān),且有的破裂沒(méi)有先兆或先兆時(shí)間極短[6,11].此外,破裂是一個(gè)非常復(fù)雜的非線性物理過(guò)程,其物理機(jī)制復(fù)雜,破裂原因、種類、先兆繁多,這些原因通常不是單一而是相互耦合在一起的,所以僅依靠先兆活動(dòng)或者物理理論模型的研究遠(yuǎn)達(dá)不到預(yù)測(cè)的目的[12].
因此,在各大裝置上進(jìn)行了數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測(cè)的探索,Cannas 等[13]在2004年利用MLP 對(duì)JET 裝置進(jìn)行破裂預(yù)測(cè),成功預(yù)測(cè)率達(dá)85%;同樣是Cannas 等[14]利用自組織映射(SOM)對(duì)JET 裝置提取出破裂炮中屬于非破裂階段的樣本,再利用MLP 進(jìn)行訓(xùn)練;Ratta 等[15]在2013年利用遺傳算法對(duì)診斷信號(hào)進(jìn)行特征提取;文獻(xiàn)[16,17]利用SVM 對(duì)JET進(jìn)行破裂預(yù)測(cè),成功預(yù)測(cè)率達(dá)82%;馬瑞等[18]利用MLP 對(duì)HL-2A 進(jìn)行破裂預(yù)測(cè),但是使用的標(biāo)簽是0 或者1,不能很好地反映破裂發(fā)生的情況;Cannas 等[19]利用SOM 和MLP 對(duì)ASDEX 裝置進(jìn)行不區(qū)分種類的預(yù)測(cè),成功預(yù)測(cè)率為80%;文獻(xiàn)[20,21]利用隨機(jī)森林對(duì)Alcator C-MOD、DIII-D 以及EAST 進(jìn)行破裂預(yù)測(cè)的研究和對(duì)比,對(duì)EAST 的破裂炮成功預(yù)測(cè)率為91%;以上破裂預(yù)測(cè)的研究都是不區(qū)分某種破裂類型的,也就是只把放電炮分為破裂炮和非破裂炮,而不區(qū)分破裂種類.譚勝均等[22]利用雙變量分析方法對(duì)EAST 垂直位移不穩(wěn)定破裂進(jìn)行破裂預(yù)測(cè)的研究,其中垂直位移破裂炮僅有2016年內(nèi)72 炮.Sengupta 等[8]利用MLP對(duì)ADITY 裝置的密度極限值進(jìn)行預(yù)測(cè),但訓(xùn)練集僅12 炮放電.王紳陽(yáng)等[9]對(duì)J-TEXT 裝置用MLP 進(jìn)行密度極限值的預(yù)測(cè),在提前5 ms 預(yù)測(cè)的前提下成功預(yù)測(cè)率為80%;胡斐然等[10]利用MLP 對(duì)J-TEXT 進(jìn)行密度極限破裂的預(yù)測(cè),受文獻(xiàn)[13]啟發(fā),使用的輸出是在破裂前的固定時(shí)間內(nèi)才開(kāi)始上升的Sigmoid 函數(shù),最終在至少提前30 ms 觸發(fā)預(yù)警的前提下成功預(yù)測(cè)率為90%,錯(cuò)誤預(yù)測(cè)率為10%.但目前沒(méi)有關(guān)于EAST 密度極限破裂預(yù)測(cè)的研究.
基于以上,本文首次對(duì)EAST 密度極限破裂進(jìn)行離線預(yù)測(cè)算法的研究,離線算法是實(shí)時(shí)在線預(yù)測(cè)的前提.除MLP,LSTM[23-26]也被用于預(yù)測(cè)器的構(gòu)建,LSTM專用于時(shí)間序列數(shù)據(jù)的處理,被廣泛的應(yīng)用于自然語(yǔ)言處理領(lǐng)域,而EAST 每次放電的數(shù)據(jù)是長(zhǎng)時(shí)脈沖,屬于典型的時(shí)序數(shù)據(jù).
文章組織如下:第1 節(jié)介紹密度極限破裂預(yù)測(cè)的意義以及目前的研究現(xiàn)狀;第2 節(jié)簡(jiǎn)要的介紹密度極限破裂、數(shù)據(jù)庫(kù)的建立;第3 節(jié)闡述診斷信號(hào)的選擇和數(shù)據(jù)預(yù)處理;第4 節(jié)介紹模型的大致原理,數(shù)據(jù)集的劃分、模型輸出以及評(píng)價(jià)指標(biāo);第5 節(jié)介紹相關(guān)結(jié)果;第6 節(jié)總結(jié).
根據(jù)勞森判據(jù),為了達(dá)到聚變點(diǎn)火條件,等離子體溫度、密度以及能量約束時(shí)間的乘積需要達(dá)到一定值[3,6],然而給定一個(gè)等離子體電流,密度存在最大的安全運(yùn)行值,當(dāng)超過(guò)這個(gè)密度上限后.就會(huì)發(fā)生密度極限破裂.
密度極限破裂的物理機(jī)制尚不明確[6],經(jīng)過(guò)長(zhǎng)期的實(shí)驗(yàn)研究與數(shù)據(jù)統(tǒng)計(jì),目前有多種計(jì)算密度極限的定標(biāo)關(guān)系,最廣泛認(rèn)同的是Greenwald 定標(biāo)律[6]:
其中,nGW是Greenwald 密度極限,IP為等離子體電流,a為等離子體半徑.但這些定標(biāo)率是經(jīng)驗(yàn)定理,所以,僅僅依靠這些定標(biāo)律無(wú)法做出有效的預(yù)測(cè).
Zheng 等[7]對(duì)EAST 密度極限運(yùn)行做了詳盡研究.EAST 通過(guò)持續(xù)的較強(qiáng)甚至正常充氣就可能實(shí)現(xiàn)高密度極限放電.EAST 的密度極限與Greenwald 定標(biāo)率吻合.這為密度極限破裂數(shù)據(jù)庫(kù)的篩選提供了重要的指導(dǎo)意義.
圖1是典型的密度極限破裂炮,1.7 s 后電流進(jìn)入平頂段,而電子密度持續(xù)增加,在7.2 s 時(shí)開(kāi)始出現(xiàn)不穩(wěn)定性先兆,密度達(dá)到0.8nGW,直到7.954 s 時(shí)發(fā)生密度極限破裂.破裂時(shí)刻td的數(shù)值被定義為:等離子體電流一階導(dǎo)數(shù)最大值出現(xiàn)的時(shí)刻[9,13].
圖1 典型密度極限破裂炮(#67039)
本文根據(jù)Greenwald 定標(biāo)率建立EAST 密度極限破裂數(shù)據(jù)庫(kù),分為3 步:
(1) 首先區(qū)分出破裂炮和非破裂炮.這主要依賴于診斷信號(hào)It,It為等離子體控制系統(tǒng)(PCS)[27]中的預(yù)設(shè)電流值,對(duì)于非破裂炮,It有爬升、平頂段、下降階段,而對(duì)于破裂炮,It只有爬升和平頂段;
(2) 其次是從破裂炮中區(qū)分出密度極限破裂炮.篩選標(biāo)準(zhǔn)是根據(jù)實(shí)際密度和Greenwald 密度極限的比值ne/nGW是否大于0.8;
(3) 最后剔除缺失了對(duì)預(yù)測(cè)任務(wù)重要的診斷信號(hào)的放電炮.
根據(jù)以上3 步,設(shè)計(jì)自動(dòng)篩選程序,最終篩選出EAST 聚變裝置2014年到2019年、炮號(hào)分布在45 000~88 299 之間的972 炮平頂段破裂的密度極限破裂炮.
EAST 裝置有上百種診斷信號(hào),選出最能表征破裂的診斷信號(hào)對(duì)于破裂預(yù)測(cè)任務(wù)至關(guān)重要,一方面:過(guò)多的信號(hào)會(huì)造成過(guò)大的計(jì)算量,另一方面:過(guò)少的診斷信號(hào)不能很好地表征破裂.本文選取了電子密度(ne)、等離子體電流(IP)、磁擾動(dòng)(Bθ)、環(huán)電壓(Vloop)、軟X 射線(S XR)、極向比壓(βP)、q95安 全因子(q95)、內(nèi)感(li)、邊緣輻射(Pedge)、中心輻射(Pcore)、垂直位移(DV)、快控線圈電流(IC)、韌致輻射(Pbrem) 這13 種診斷信號(hào)作為神經(jīng)網(wǎng)絡(luò)的輸入,這些信號(hào)在相關(guān)的研究中也被采用.選取這些信號(hào)考慮了考慮物理機(jī)制、兼顧信號(hào)的實(shí)時(shí)可測(cè)性、等離子的全局測(cè)量參數(shù).4.3 節(jié)將對(duì)這些信號(hào)的有效性做出敏感度分析.
由于這13 種診斷信號(hào)的原始采樣率不一致,因此本文對(duì)原始信號(hào)進(jìn)行插值重采樣,且重采樣時(shí)間間隔為1 ms (破裂3 個(gè)階段的時(shí)間尺度).
此外,不同診斷系統(tǒng)的診斷信號(hào)的數(shù)量級(jí)相差很大,這巨大差異會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)權(quán)值的差異不是反映模型輸入的相對(duì)重要性而是反映數(shù)量級(jí)的差異,且會(huì)降低神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,因此還需對(duì)各信號(hào)做歸一化:
其中,Mj、mj分別為所有訓(xùn)練炮中第j種診斷信號(hào)的最大最小值[14,19].為了更具有實(shí)時(shí)性,需要用此最值對(duì)驗(yàn)證集,測(cè)試集歸一化[19].
人工神經(jīng)網(wǎng)絡(luò)(ANN)源自生物學(xué)上神經(jīng)系統(tǒng),其最重要的功能是實(shí)現(xiàn)復(fù)雜的、多維度的非線性映射.采用不同的數(shù)學(xué)模型就會(huì)得到不同的神經(jīng)網(wǎng)絡(luò)方法.其中最為經(jīng)典的是MLP[8-10,13],一般由輸入層、隱藏層、輸出層組成,它的輸入是一個(gè)個(gè)樣本點(diǎn),且認(rèn)為每個(gè)樣本點(diǎn)是獨(dú)立的.
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是用來(lái)處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它克服了傳統(tǒng)MLP 對(duì)序列數(shù)據(jù)處理的低效,RNN相當(dāng)于多個(gè)MLP 橫向連接,相鄰MLP 之間的隱藏層之間全連接,使得信息不僅可以向下一層傳遞信號(hào),而且可以向相鄰MLP 傳遞信號(hào)[23,24].作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM 通過(guò)輸入門、輸出門、遺忘門不僅克服了RNN 梯度消失和爆炸的問(wèn)題,而且還可以保持網(wǎng)絡(luò)的長(zhǎng)期記憶狀態(tài),其誤差反向傳播由通過(guò)時(shí)間的反向傳播算法(BTPP)來(lái)解決.LSTM 有多種形式,考慮到計(jì)算量以及輸入輸出在時(shí)間上的相關(guān)性,本文采用many-to-many 形式,其具體結(jié)構(gòu)如圖2所示.
LeakRelu 激活函數(shù)[26]相比于其他激活函數(shù)具有收斂速度快、解決梯度消失問(wèn)題、緩解過(guò)擬合等優(yōu)點(diǎn)因而近年來(lái)受到廣泛的關(guān)注,本文的隱藏層采用LeakRelu激活函數(shù),輸出層采用Sigmoid 函數(shù),優(yōu)化算法為Nadam[26].
本文中LSTM 的時(shí)間步選為100,LSTM 和MLP的輸入層和輸出層神經(jīng)元個(gè)數(shù)分別為13、1,而隱藏層層數(shù)和每層神經(jīng)元個(gè)數(shù)通過(guò)經(jīng)過(guò)網(wǎng)格搜索[26]的方法試驗(yàn)了30 個(gè)模型,發(fā)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)(13:200:200:1) 的結(jié)構(gòu)相對(duì)較好,為了便于比較,因此MLP 和LSTM 都采用這一結(jié)構(gòu).
圖2中的重復(fù)單元的數(shù)學(xué)原理如下:
其中,ft、it、ot分別為遺忘門、輸入門、輸出門,xt為時(shí)間步t時(shí)刻的輸入,σ、tanh 分別為Sigmoid、tanh激活函數(shù),W為權(quán)重矩陣,?代表向量間按元素點(diǎn)乘,為當(dāng)前輸入的當(dāng)前狀態(tài),ct為當(dāng)前時(shí)刻的輸入狀態(tài),ht為在第t步的輸出.
本文訓(xùn)練集包括密度極限破裂炮和非破裂炮,在每個(gè)時(shí)刻,神經(jīng)網(wǎng)絡(luò)的輸入為一個(gè)具有13 個(gè)特征的樣本.數(shù)據(jù)集的劃分如表1所示.
表1 數(shù)據(jù)集的劃分
模型訓(xùn)練時(shí),對(duì)于每炮密度極限破裂炮,本文選取時(shí)間窗口[tflat,td]內(nèi)的樣本點(diǎn)作為輸入,其中tflat為平頂段開(kāi)始時(shí)刻,td為破裂時(shí)刻;對(duì)于非破裂炮,采樣點(diǎn)所在的時(shí)間窗口為[tflat,tfe],tfe為平頂段結(jié)束時(shí)刻.至于模型訓(xùn)練時(shí)的輸出,文獻(xiàn)[8,9]以每炮的密度極限最大值為輸出,但這種方法存在缺陷[10].文獻(xiàn)[18]以0 或1為輸出,但這樣不能反映破裂的概率大小,本文中:
(1) 對(duì)于密度極限破裂炮,文獻(xiàn)[10,13]中使用的輸出是在破裂前的固定時(shí)刻才開(kāi)始上升的Sigmoid,本文使用的Sigmoid 開(kāi)始上升時(shí)刻并不是在破裂前的固定時(shí)間而是取決于實(shí)際密度達(dá)到0.5 倍Greenwald 密度極限的時(shí)刻,如圖3所示.
圖3 訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)密度極限破裂炮的輸出
其中,tne/nGW=0.5為 實(shí)際密度ne達(dá)到0.5 倍的Greenwald密度極限的時(shí)刻,b為縮放因子(無(wú)量綱),最終定為25.
(2) 對(duì)于非破裂炮,訓(xùn)練時(shí)的輸出恒為0,即認(rèn)為破裂的概率為0.
預(yù)測(cè)器的最終目的是能對(duì)即將發(fā)生破裂的放電炮在破裂前發(fā)出預(yù)警,本質(zhì)上是一個(gè)時(shí)序樣本的分類問(wèn)題,但神經(jīng)網(wǎng)絡(luò)在實(shí)際使用時(shí)對(duì)于每炮放電的輸出都是一個(gè)取值范圍為0 到1 之間的時(shí)間序列,因此在使用模型時(shí)需要選取一個(gè)閾值(th,0 ≤th≤1).一旦模型的輸出第一次等于或者超過(guò)這個(gè)閾值(可能為0 到1 之間的任何值),就會(huì)觸發(fā)破裂預(yù)警,此時(shí)刻記為tpred.為了對(duì)模型進(jìn)行客觀評(píng)價(jià),根據(jù)相關(guān)研究[9,10,13,14,28],定義如下概念、數(shù)量、指標(biāo):
對(duì)于每炮放電脈沖,預(yù)測(cè)結(jié)果可以分為以下:
(1)若為密度極限破裂炮(正例):
① 成功預(yù)測(cè)(successful alarm):預(yù)測(cè)器至少在破裂發(fā)生前 Δtalarmms 觸發(fā)預(yù)警,即tpred∈[tflat,td?Δtalarm],該炮在機(jī)器學(xué)習(xí)中稱為“真正例(True Positive)”,其中Δtalarm為預(yù)警時(shí)間臨界值;
② 遺漏預(yù)測(cè)(missed alarm):在破裂前Δtalarmms 內(nèi)觸發(fā)預(yù)警,即tpred∈[tflat?Δtalarm,td],此時(shí)破裂緩解系統(tǒng)沒(méi)有足夠的時(shí)間避免或者緩解破裂.或模型在破裂前始終沒(méi)有觸發(fā)預(yù)警.該炮在機(jī)器學(xué)習(xí)中稱為“假反例(false negative)”.
(2)若為非破裂炮(反例):
錯(cuò)誤預(yù)測(cè)(false alarm):如果模型在任意時(shí)刻觸發(fā)預(yù)警,則此非破裂炮被判定為密度極限破裂炮,因此為錯(cuò)誤預(yù)警.也稱為“假正例(False Positive)”.
將密度極限破裂炮總數(shù)記為Ndisr,非破裂炮總數(shù)記為Nnondisr,成功預(yù)測(cè)炮的總數(shù)記為Nsucc,遺漏預(yù)測(cè)炮的總數(shù)記為Nmiss,Ndisr=Nsucc+Nmiss;錯(cuò)誤預(yù)測(cè)炮的總數(shù)為Nfalse.模型性能指標(biāo)為:
(1) 成功預(yù)測(cè)率(Rsucc):被成功預(yù)測(cè)的密度極限破裂炮總數(shù)占密度極限破裂炮總數(shù)的比例,Rsucc=Nsucc/Ndisr;
(2) 遺漏預(yù)測(cè)率(Rmiss):被遺漏預(yù)測(cè)的密度極限破裂炮總數(shù)占密度極限破裂炮總數(shù)的比例,Rmiss=Nmiss/Ndisr;
(3) 錯(cuò)誤預(yù)測(cè)率(Rfalse):被錯(cuò)誤預(yù)測(cè)的非破裂炮總數(shù)占非破裂炮總數(shù)的比例,Rfalse=Nfalse/Nnondisr.
(4) 平均預(yù)警時(shí)間(Talarm):被成功預(yù)測(cè)的密度極限破裂炮的預(yù)警提前時(shí)間(td?tpred)的平均值.
本文采用ROC(Receiver Operation Characteristic)曲線面積,即AUC(Area Under ROC Curve)值作為閾值的選擇標(biāo)準(zhǔn),AUC值越大說(shuō)明模型的分類性能越好[23,26].ROC曲線的橫軸為假正例率FPR=FP/(FP+TN),縱軸為真正例率TPR=TP/(TP+FN),其中TP、FP、FN、TN定義如表2所示.可知,FPR=Rfalse,而TRP=Rsucc,每個(gè)Δtalarm都對(duì)應(yīng)一個(gè)最佳閾值th?:
表2 混淆矩陣
本文采取“留一法”對(duì)診斷信號(hào)的敏感度進(jìn)行分析,具體如下:每次移除一種診斷信號(hào),將剩余的12 種診斷信號(hào)作為特征輸入模型并在相同的訓(xùn)練集上進(jìn)行訓(xùn)練,接著在相同的測(cè)試集上進(jìn)行測(cè)試.同時(shí),計(jì)算模型實(shí)際輸出和理論輸出間的均方誤差,誤差越大,說(shuō)明破裂預(yù)測(cè)對(duì)此診斷越敏感越,即此診斷信號(hào)越重要.最終的計(jì)算結(jié)果如圖4,可以看出,等離子體電流(IP)和密度(ne)是最重要的診斷信號(hào),環(huán)電壓(Vloop)是反映等離子體運(yùn)行的基本參量,軟X 射線(SXR)反映電子溫度,而中心輻射(Pcore)、邊緣輻射(Pedge)、韌致輻射(Pbrem)都是重要的輻射信號(hào).
圖4 留一法對(duì)診斷信號(hào)的敏感度分析結(jié)果
圖5是模型訓(xùn)練過(guò)程中模型損失的變化,LSTM和MLP 在訓(xùn)練集上的損失均是逐漸減小然后趨于穩(wěn)定,在驗(yàn)證集上損失整體也是呈現(xiàn)逐漸減小直至在一定范圍內(nèi)波動(dòng),且LSTM 的損失波動(dòng)較小.
至于實(shí)時(shí)性,在測(cè)試過(guò)程中,LSTM 和MLP 預(yù)測(cè)每個(gè)輸入樣本所需時(shí)間分別為0.000 654 ms、0.010 815 ms,均小于樣本之間的間隔時(shí)間(1 ms),且測(cè)試過(guò)程中使用的是Python 程序,實(shí)際部署時(shí)會(huì)將模型轉(zhuǎn)換為C 語(yǔ)言,運(yùn)算速度更快,更易滿足實(shí)時(shí)預(yù)測(cè)需求.
圖5 實(shí)驗(yàn)過(guò)程中LSTM 和MLP 的損失變化
為了全面衡量模型的性能,本文將Δtalarm以20 ms為間隔依次取[20 ms,200 ms]中的10 個(gè)值,分別評(píng)估LSTM 和MLP 的性能,結(jié)果如圖6所示,可以看出,在不同 Δtalarm下LSTM 的成功預(yù)測(cè)率都高于MLP,而錯(cuò)誤預(yù)測(cè)率都低于MLP,因此,LSTM 對(duì)密度極限破裂測(cè)預(yù)測(cè)性能明顯優(yōu)于MLP.
圖6 成功和錯(cuò)誤預(yù)測(cè)率比較
接下來(lái)令Δtalarm=20 ms來(lái)分析成功預(yù)測(cè)率、錯(cuò)誤預(yù)測(cè)率隨閾值的變化,以LSTM 為例,如圖7(a)所示,灰色區(qū)域的閾值為 0.67 ≤th≤0.78,此區(qū)間的成功預(yù)測(cè)率Rsucc≥0.9 且 錯(cuò)誤預(yù)測(cè)率Rfalse≤0.1,從圖7(b)(c) 可以看出,當(dāng)閾值為0.73 時(shí),AUC值達(dá)到最大0.948,平均預(yù)警時(shí)間為2.142 s.同理,對(duì)于MLP,當(dāng)Δtalarm=20 ms時(shí),MLP 的最佳閾值為0.73,此時(shí)AUC值為0.899.
圖7 Δtalarm=20 ms 時(shí),LSTM 各項(xiàng)評(píng)價(jià)指標(biāo)隨閾值的變化
MLP 和LSTM 總體預(yù)測(cè)結(jié)果如表3所示.從中可以看出,LSTM 和MLP 在所有數(shù)據(jù)上對(duì)密度極限破裂炮的正確預(yù)測(cè)率分別為95.37%和86.21%,對(duì)于非破裂炮的錯(cuò)誤預(yù)測(cè)率分別為8.21%和7.75%.
表3 Δtalarm=20 ms時(shí),LSTM 和MLP 的預(yù)測(cè)結(jié)果
圖8展示的是#66972 炮密度極限破裂炮的預(yù)測(cè)結(jié)果.可以看出,該炮在td=3.948 s 發(fā)生破裂,MLP 的輸出在3.931 s 時(shí)超過(guò)閾值,提前17 ms 觸發(fā)預(yù)警,導(dǎo)致破裂緩解系統(tǒng)沒(méi)有足夠的時(shí)間采取措施,因此為“遺漏預(yù)測(cè)”;LSTM 在3.588 s 觸發(fā)預(yù)警,提前360 ms 觸發(fā)預(yù)警,被LSTM 成功預(yù)測(cè).
圖8 #66972 炮密度極限破裂炮的預(yù)測(cè)結(jié)果
圖9展示的是#69104 炮密度極限破裂炮的預(yù)測(cè)結(jié)果.可以看出,該炮在td=6.84 s 發(fā)生破裂,MLP 的輸出始終沒(méi)有超過(guò)閾值,導(dǎo)致沒(méi)有觸發(fā)破裂緩解系統(tǒng),因此為“遺漏預(yù)測(cè)”;LSTM 在6.38 s 觸發(fā)預(yù)警,提前460 ms觸發(fā)預(yù)警,被LSTM 成功預(yù)測(cè).
圖10展示的是被LSTM 和MLP 成功預(yù)測(cè)的密度極限破裂炮的提前預(yù)警時(shí)間(tpred?td)分布圖,可以看出LSTM 的提前預(yù)警時(shí)間柱較MLP 的明顯緊密,經(jīng)過(guò)計(jì)算,LSTM 和MLP 平均提前預(yù)警時(shí)間分別為2.21 s和2.47 s,等離子體控制系統(tǒng)有足夠的時(shí)間采取措施緩解破裂帶來(lái)的危害.
高密度運(yùn)行對(duì)于未來(lái)的裝置具有重要意義,本文首次針對(duì)EAST 采用神經(jīng)網(wǎng)絡(luò)進(jìn)行密度極限破裂預(yù)測(cè)研究.首先建立了EAST 密度極限破裂數(shù)據(jù)庫(kù),其次將MLP 和LSTM 分別建立離線模型,模型輸出為更具實(shí)際意義的考慮了實(shí)際密度和Greenwald 密度極限相對(duì)大小的Sigmoid 函數(shù),最后離線測(cè)試結(jié)果表明,對(duì)于密度極限破裂炮,在至少提前20 ms 觸發(fā)預(yù)警的前提下,LSTM 和MLP 對(duì)密度極限破裂炮的成功預(yù)測(cè)率分別為95.37%和86.21%,對(duì)于非破裂炮的錯(cuò)誤預(yù)測(cè)率分別為8.21%和7.75%.本研究說(shuō)明利用神經(jīng)網(wǎng)絡(luò)建立密度極限破裂離線預(yù)測(cè)算法的可行性,下一步研究計(jì)劃是在EAST 托卡馬克上實(shí)現(xiàn)破裂預(yù)警的實(shí)時(shí)在線計(jì)算.
圖9 #69104 炮密度極限破裂炮的預(yù)測(cè)結(jié)果
圖10 被LSTM 和MLP 正確預(yù)測(cè)的密度極限破裂炮的預(yù)警提前時(shí)間(t pred?td)的分布柱狀圖.