郭宗斌 李健*
(1、山東省地震局聊城地震監(jiān)測(cè)中心站,山東聊城 252000 2、海南省地震局,海南???570203)
磁暴是空間天氣擾動(dòng)的一種主要形式之一,對(duì)衛(wèi)星、地面通訊、電力系統(tǒng)[1]、油氣管道[2]等均有嚴(yán)重的影響。磁暴在形態(tài)上分為初相、主相、恢復(fù)相三個(gè)階段。受行星際激波影響,磁場(chǎng)水平分量H 在數(shù)分鐘內(nèi)出現(xiàn)高于暴前水平的起伏變化,稱作初相,初相后磁場(chǎng)迅速下降并劇烈抖動(dòng),這個(gè)過(guò)程稱為主相,初相和主相的突然變化對(duì)現(xiàn)代通訊、管道等系統(tǒng)有很大的沖擊,隨后磁場(chǎng)緩慢恢復(fù),這個(gè)過(guò)程稱為恢復(fù)相。
除對(duì)磁暴機(jī)理作出研究外[1-2]。從磁場(chǎng)及磁暴對(duì)實(shí)際生產(chǎn)生活(如電網(wǎng)、通信等)的影響角度出發(fā),如何快速識(shí)別磁暴并進(jìn)行提早防范至關(guān)重要。
近年來(lái),一些學(xué)者應(yīng)用傳統(tǒng)機(jī)器學(xué)習(xí)方法通過(guò)人工提取地磁數(shù)據(jù)能量特征實(shí)現(xiàn)對(duì)磁暴過(guò)程識(shí)別[3-4]。易世華(2007)應(yīng)用小波包分析技術(shù)提取了地磁水平分量序列的能量特征,用Fisher方法進(jìn)行識(shí)別,研究了磁暴與非磁暴的識(shí)別率在不同時(shí)間長(zhǎng)度t 下的變化規(guī)律,平均識(shí)別率83.8%[5]??等鹎澹?013)提出一種基于Fisher 和核Fisher 組合的磁暴識(shí)別方法,該方法對(duì)于磁暴與非磁暴的平均識(shí)別率達(dá)到了85%以上[6]。
由于磁暴定義為具有明顯初相- 主相- 恢復(fù)相完整形態(tài)且最低點(diǎn)Dst 不大于-30nT 的磁擾,磁暴屬于一種特殊的磁擾,針對(duì)能量特征識(shí)別的算法并不能有效區(qū)分磁暴與磁擾。以上研究均只是針對(duì)急始磁暴的某一項(xiàng)或某幾項(xiàng)單一特征進(jìn)行的識(shí)別,人為對(duì)數(shù)據(jù)進(jìn)行降維使用,并未保證數(shù)據(jù)的全面性,勢(shì)必難以實(shí)現(xiàn)磁暴識(shí)別的普適性判斷。同時(shí)對(duì)特征的人為提取也增加了數(shù)據(jù)處理的時(shí)間成本。為實(shí)現(xiàn)對(duì)急始磁暴的快速高效自動(dòng)識(shí)別,在前人研究的基礎(chǔ)上,本文融合Adam 優(yōu)化算法、dropout 技術(shù)等方法,設(shè)計(jì)出可以自動(dòng)提取并可組合底層特征的一維卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行監(jiān)督學(xué)習(xí),實(shí)現(xiàn)對(duì)事件磁暴數(shù)據(jù)的訓(xùn)練識(shí)別。
研究中,選取包含事件記錄全部信息的磁場(chǎng)數(shù)據(jù)作為模型的訓(xùn)練與測(cè)試的輸入數(shù)據(jù),而不是預(yù)先提取若干判據(jù)或部分?jǐn)?shù)據(jù)進(jìn)行降維使用。隨后,使用訓(xùn)練數(shù)據(jù)集基于卷積神經(jīng)網(wǎng)絡(luò)建立識(shí)別磁暴事件的分類器,然后用訓(xùn)練好的分類器對(duì)測(cè)試數(shù)據(jù)集以事件為識(shí)別單元進(jìn)行識(shí)別以2008 -2018 年期間發(fā)生磁暴事件以及疑似磁暴的磁擾事件分別構(gòu)建訓(xùn)練集、驗(yàn)證集和測(cè)試集。
卷積神經(jīng)網(wǎng)絡(luò)是本研究采用的關(guān)鍵框架,它是人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)相結(jié)合,通過(guò)反向傳播算法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)中的權(quán)重,從而實(shí)現(xiàn)深度學(xué)習(xí)的方法。
它由卷積層、池化層、激活層等組成。卷積運(yùn)算是最基本也是最重要的操作,在卷積層中,一個(gè)可學(xué)習(xí)的卷積核與上一層輸出的特征圖像進(jìn)行卷積操作,加上一個(gè)偏置項(xiàng)后通過(guò)激活函數(shù)后輸出。
當(dāng)圖像輸入卷積網(wǎng)絡(luò)后,首先進(jìn)入卷積層,通過(guò)卷積運(yùn)算提取圖像的局部特征,對(duì)于磁場(chǎng)水平分量數(shù)據(jù),磁暴發(fā)生時(shí)擁有初相、主相、恢復(fù)相的變化階段,通過(guò)不同的卷積核后具有不同特征的區(qū)域?qū)⒈患せ?。第一次卷積后較低層次的特征被提取出來(lái)經(jīng)過(guò)池化層降維后進(jìn)入更深的卷積層,這些特征被重新組合得到更高層次的特征,經(jīng)過(guò)一步步濃縮,最后經(jīng)過(guò)全連接層實(shí)現(xiàn)分類的任務(wù)。
圖1 二維卷積映射過(guò)程
本研究力圖借助卷積神經(jīng)網(wǎng)絡(luò)的泛化能力,實(shí)現(xiàn)在數(shù)據(jù)收集或積累不充分的情況下,通過(guò)對(duì)部分地磁水平分量數(shù)據(jù)的學(xué)習(xí)挖掘隱含的磁暴信號(hào)特征,從而實(shí)現(xiàn)對(duì)其他磁場(chǎng)異?;顒?dòng)的識(shí)別。
針對(duì)磁暴數(shù)據(jù),由于是一維數(shù)據(jù),設(shè)計(jì)出相應(yīng)的一維卷積神經(jīng)網(wǎng)絡(luò)模型(圖2)。輸入數(shù)據(jù)取磁暴數(shù)據(jù)3 天的長(zhǎng)度。本網(wǎng)絡(luò)結(jié)構(gòu)由輸入層,卷積層1,池化層1,卷積層2,池化層2,dropout層,全連接層1,全連接層2,softmax 層組成。
圖2 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
采用relu 激活函數(shù),損失函數(shù)采用交叉熵,輸出為2 分類問(wèn)題采用獨(dú)熱編碼,10 代表磁暴,01 代表非磁暴。Adam。學(xué)習(xí)速率為0.0001。
本文的磁暴事件采用國(guó)家地磁臺(tái)網(wǎng)中心發(fā)布的磁暴目錄,及ISGI(International Service of Geomagnetic Indices)發(fā)布的SSC目錄。地磁數(shù)據(jù)來(lái)自國(guó)家地磁臺(tái)網(wǎng)中心,Dst 數(shù)據(jù)來(lái)自ISGI。(http://isgi.unistra.fr/indices_dst.php)。
首先,需對(duì)2008-2018 年的磁暴事件進(jìn)行統(tǒng)計(jì),由于ISGI 與國(guó)家地磁臺(tái)網(wǎng)中心提供的事件有所不同,故需對(duì)磁暴事件進(jìn)行篩選,本文采用的篩選規(guī)則如下:
2.1 國(guó)家地磁臺(tái)網(wǎng)中心與ISGI 收錄的同類型同時(shí)間均記錄的事件,確認(rèn)為磁暴事件,選取進(jìn)入本文的數(shù)據(jù)集。
2.2 只要是ISGI 收錄的SI(sudden impulse)事件或國(guó)家臺(tái)網(wǎng)中心收錄的GC(緩始磁暴)事件均排除,認(rèn)為其不是磁暴事件,均進(jìn)行排除,不選取進(jìn)入本文的數(shù)據(jù)集。
2.3 ISGI 和國(guó)家地磁臺(tái)網(wǎng)中心單方收錄且磁暴形態(tài)較為明顯,Dst 指數(shù)小于-30nT 的事件,均認(rèn)為其為磁暴事件,選取進(jìn)入本文的數(shù)據(jù)集。
最終,共選取2008-2018 年期間的55 個(gè)磁暴事件與42 個(gè)磁擾事件,于國(guó)家地磁臺(tái)網(wǎng)中心獲取上述事件發(fā)生期間泉州、武漢、瓊中三臺(tái)記錄的地磁H 分量數(shù)據(jù)。
將所有磁暴事件以及非磁暴事件中隨機(jī)選取50%作為訓(xùn)練集,25%作為驗(yàn)證集,剩下25%作為測(cè)試集。分類完畢后,每個(gè)事件截取長(zhǎng)度為3 天的數(shù)據(jù)。將數(shù)據(jù)中少量缺數(shù)的位置采用三次樣條插值,對(duì)于大面積缺數(shù)的數(shù)據(jù)采取刪除處理。隨后進(jìn)行歸一化處理,本文采用比較簡(jiǎn)單的歸一化方式歸一化特征值等于(特征值- 訓(xùn)練集最小值)/(訓(xùn)練集最大值- 訓(xùn)練集最小值)。最終形成數(shù)據(jù)集并生成訓(xùn)練集和測(cè)試集;其中:訓(xùn)練集中磁暴數(shù)據(jù)樣本量為615,非磁暴數(shù)據(jù)樣本量為430,測(cè)試集中磁暴數(shù)據(jù)數(shù)據(jù)量為130,非磁暴數(shù)據(jù)數(shù)據(jù)量為120 個(gè)。
隨后,以預(yù)處理好的地磁數(shù)據(jù)集為輸入,設(shè)定磁暴事件SoftMax 層輸出為[1,0],磁擾事件輸出為[0,1],初始化相關(guān)參數(shù),進(jìn)行系統(tǒng)的訓(xùn)練,每30 次訓(xùn)練計(jì)算一次測(cè)試集Loss(代價(jià)函數(shù))和準(zhǔn)確率。通過(guò)調(diào)整超參數(shù)得到最佳的訓(xùn)練效果,最終確定超參數(shù)如下:在一維卷積神經(jīng)網(wǎng)絡(luò)中,訓(xùn)練輪數(shù)為200,訓(xùn)練批大小為50,訓(xùn)練速率恒定為0.0001.Dropout 幾率為50%。
隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集和驗(yàn)證集準(zhǔn)確率逐漸上升并超越90%,與此同時(shí),從訓(xùn)練集和驗(yàn)證集的代價(jià)函數(shù)曲線也可明顯看出,一維卷積網(wǎng)絡(luò)在350 次迭代時(shí)驗(yàn)證集準(zhǔn)確率不再上升,之后驗(yàn)證集的準(zhǔn)確率和代價(jià)函數(shù)大小幾乎不再發(fā)生變化,如圖3 所示。
圖3 一維卷積網(wǎng)絡(luò)訓(xùn)練過(guò)程
表1 為一維卷積神經(jīng)網(wǎng)絡(luò)的詳細(xì)訓(xùn)練結(jié)果情況。由表可知,驗(yàn)證集對(duì)磁暴識(shí)別的準(zhǔn)確率在約為90%左右,識(shí)別結(jié)果誤差與人工識(shí)別的誤差相差不大,驗(yàn)證集LOSS 略大于測(cè)試集LOSS。因此,利用人工智能深度學(xué)習(xí)可以很好的實(shí)現(xiàn)急始磁暴的自動(dòng)識(shí)別。
表1 訓(xùn)練結(jié)果
本文針對(duì)性的設(shè)計(jì)了磁暴非磁暴自動(dòng)判別算法。采用基于卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)的方法以及設(shè)計(jì)一維卷積神經(jīng)網(wǎng)絡(luò)對(duì)磁暴和磁擾事件進(jìn)行訓(xùn)練識(shí)別,結(jié)果表明,一維卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果有不錯(cuò)的表現(xiàn),與人工標(biāo)注引發(fā)的誤差較為接近,且一維卷積神經(jīng)網(wǎng)絡(luò)由于參數(shù)少結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練速度最快,適合用于磁暴自動(dòng)識(shí)別。值得注意的是,本文只是針對(duì)特定數(shù)據(jù)的遷移學(xué)習(xí)測(cè)試并不能用來(lái)評(píng)判網(wǎng)絡(luò)性能的好壞。同時(shí),由于訓(xùn)練樣本和測(cè)試樣本較少,本次結(jié)果并不一定能代表神經(jīng)網(wǎng)絡(luò)的真實(shí)表現(xiàn)。因此有待于盡可能多的獲取磁暴數(shù)據(jù)進(jìn)行訓(xùn)練。
致謝
感謝ISGI 以及國(guó)家地磁臺(tái)網(wǎng)中心的數(shù)據(jù),感謝編輯老師及匿名審稿專家提出的各類建議。