亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        核動力裝置運行數(shù)據(jù)的特征提取方法研究

        2020-05-07 05:53:50彭彬森朱少民彭敏俊劉永闊馬心童
        原子能科學技術 2020年3期
        關鍵詞:特征提取案例特征

        彭彬森,夏 虹,朱少民,彭敏俊,劉永闊,馬心童

        (哈爾濱工程大學 核安全與仿真技術國防重點學科實驗室,黑龍江 哈爾濱 150001)

        隨著中國能源供給側(cè)進行深入的改革,核能在能源結構中的占比越來越高。與此同時,大眾對核設施安全性的關注也越來越高,尤其是在日本福島核事故后,如何保障核動力裝置的安全性已成為影響核能發(fā)展的重要因素[1-2]。核動力裝置是一個非常復雜的動態(tài)時變系統(tǒng),主要是因其運行條件復雜可變[3]。一旦發(fā)生異常,操縱員需對異常情況進行分析,找出異常的原因,并及時采取措施降低事故的影響,確保核動力裝置的安全運行,否則將造成巨大的損失和影響,因此狀態(tài)監(jiān)測系統(tǒng)在保障核動力裝置安全性方面扮演著重要的角色。核動力裝置在運行過程中,監(jiān)測系統(tǒng)需對許多參數(shù)進行監(jiān)控,主要有溫度、壓力、水位等熱工參數(shù)以及機械振動參數(shù),同時同一過程中的不同變量間往往互相關聯(lián),這些運行數(shù)據(jù)主要有以下特點[4]:1) 來源多重性,數(shù)據(jù)源是多種多樣的,且大小不一的系統(tǒng)并存;2) 空間分布性,數(shù)據(jù)源在空間中的分布各不相同;3) 時間多尺度性,數(shù)據(jù)時間跨度大、差別很大;4) 實時交互性,各系統(tǒng)及設備的運行數(shù)據(jù)等可實時反映核動力裝置的運行狀態(tài);5) 數(shù)據(jù)的價值密度低,多數(shù)數(shù)據(jù)均是正常數(shù)據(jù),故障數(shù)據(jù)少。大量復雜的過程變量給操縱員對系統(tǒng)狀態(tài)的判斷帶來了困難。因此需將較多的過程變量壓縮為少數(shù)獨立的變量,智能特征提取方法自動編碼器是一種高維數(shù)據(jù)分析的有效手段,通過分析得到的低維特征變量很好地保留了原始數(shù)據(jù)的特征信息,摒棄了冗余信息,不僅降低了計算量,同時也提高了數(shù)據(jù)的識別精度[5]。因此本文采用稀疏自動編碼器(SAE)對核動力裝置產(chǎn)生的高維信號進行特征提取,并對提取后的數(shù)據(jù)進行異常識別。

        1 SAE數(shù)據(jù)特征提取

        1.1 自動編碼器(AE)

        AE是一種人工神經(jīng)網(wǎng)絡,采用無監(jiān)督的學習方式從原始數(shù)據(jù)中提取特征信息[6]。AE作為構建深度神經(jīng)網(wǎng)絡的基本結構,其特征之一是輸入節(jié)點的值等于輸出節(jié)點的值。另一個特征是隱藏層中的神經(jīng)元數(shù)量通常小于輸出層的,因此它具有通過非線性變換將輸入特性轉(zhuǎn)換到少量隱藏層神經(jīng)元中的優(yōu)點。使用自動編碼算法,不僅可減少數(shù)據(jù)維數(shù),省去了手動提取特征的麻煩,同時還能降低計算復雜度,減少計算資源的占用[7]。

        AE由編碼器和解碼器組成,其結構如圖1所示。輸入數(shù)據(jù)首先通過編碼器映射到低維空間,然后再通過解碼器將數(shù)據(jù)還原,還原的數(shù)據(jù)與原始數(shù)據(jù)的誤差越小,說明AE的效果越好。AE可從未標記的數(shù)據(jù)中提取特征值,并提供原始特征的表示。解碼器用于對原始輸入進行重構,原始輸入可視為編碼器的逆輸入[8]。

        圖1 AE的簡化結構Fig.1 Simplified structure of AE

        如果輸入到AE的是矢量x,則編碼器可將矢量x映射到另一個矢量z,如下所示:

        z=h(1)(w(1)x+b(1))

        (1)

        (2)

        式中:上標(2)表示第2層;h(2):h(z)=z,為解碼器的線性傳遞函數(shù)(purelin函數(shù))。

        為優(yōu)化AE的訓練效果,引入損失函數(shù)作為訓練的目標函數(shù),損失函數(shù)包括重構誤差項和L2正則化項,如式(3)所示。

        JAE(w,b)=err+λΩweights

        (3)

        式中:err為輸出的重構值與輸入的實際值之間的均方誤差,其表達式如式(4)所示;Ωweights為L2正則化項,用于減少w(1),增加z(1),從而防止模型過度擬合;λ為式(5)中給出的L2正則化項的系數(shù)。

        (4)

        (5)

        式中:L為隱藏層的層數(shù);N為訓練樣本的數(shù)據(jù)個數(shù);K為訓練數(shù)據(jù)中包含的參數(shù)個數(shù)。

        1.2 SAE

        大量研究表明,當生物視覺系統(tǒng)的主要處理區(qū)域?qū)π盘栠M行分析時,僅有少數(shù)神經(jīng)元處于激活狀態(tài),而大多數(shù)神經(jīng)元處于抑制狀態(tài),并且獲得的稀疏表達通常較其他表達更有效[8]。SAE是通過在AE的基礎上引入稀疏限制而建立的,其結構如圖2所示[9]。如果激活函數(shù)為sigmoid函數(shù),當隱藏層神經(jīng)元的值接近1時,該神經(jīng)元被激活;當隱藏層神經(jīng)元的值接近0時,該神經(jīng)元被抑制。

        圖2 SAE結構簡圖Fig.2 Structure schematic of SAE

        (6)

        式中:n為訓練樣本的總數(shù);xj為第j個訓練樣本。

        通過在式(3)中添加稀疏性正則化項,可得SAE損失函數(shù)為:

        JSAE(w,b)=JAE(w,b)+βΩsparsity

        (7)

        (8)

        1.3 訓練SAE

        在SAE的訓練中,通常利用反向傳播(BP)算法來優(yōu)化神經(jīng)網(wǎng)絡的參數(shù),當代價函數(shù)達到誤差限值或迭代次數(shù)達到最大值時,停止訓練。其中權重和偏差在訓練過程中的迭代更新如下[12]:

        (9)

        (10)

        1.4 核動力裝置數(shù)據(jù)特征提取

        圖3 核動力裝置運行數(shù)據(jù)特征提取流程圖Fig.3 Flow chart of feature extraction for nuclear power plant operation data

        根據(jù)核動力裝置的特點,設計如圖3所示的特征提取流程圖,主要包括3個階段:數(shù)據(jù)采集階段、數(shù)據(jù)處理階段和特征提取階段。首先在數(shù)據(jù)采集階段獲取不同設備的主要參數(shù)值,然后在數(shù)據(jù)處理階段對數(shù)據(jù)進行必要的預處理使數(shù)據(jù)符合要求,最后在特征提取階段將原始數(shù)據(jù)壓縮至低維特征空間,從而得到相應的特征值。

        2 仿真測試與結果

        為驗證該方法的可行性,將其應用到核動力裝置的狀態(tài)監(jiān)測中,狀態(tài)監(jiān)測方法為孤立森林方法[13]。為此用核動力裝置仿真軟件PCTRAN模擬了9種不同的運行工況(正常工況和異常工況),并獲得了相應的時間序列參數(shù)[14-15]。表1列出了工況類型與樣本數(shù)量。訓練數(shù)據(jù)樣本由4 000個數(shù)據(jù)組成,共包含64個參數(shù),其中異常數(shù)據(jù)有1 000個(故障程度范圍為5%~50%,破口事故故障程度為破口面積與總截面積比值,甩負荷事故故障程度為負荷與滿功率比值),100%滿功率下的正常數(shù)據(jù)有1 000個,90%滿功率下的正常數(shù)據(jù)有1 000個,80%滿功率下的正常數(shù)據(jù)有1 000個。為驗證該方法在單一正常工況下和多種正常工況下狀態(tài)監(jiān)測的有效性,考慮到實際情況下正常數(shù)據(jù)較異常數(shù)據(jù)多,按正常數(shù)據(jù)與異常數(shù)據(jù)的比例為9∶2從總樣本集中抽取1 100個數(shù)據(jù)組成訓練樣本。測試過程中共抽取了3組訓練樣本,第1組包含200個異常數(shù)據(jù),900個100%滿功率正常數(shù)據(jù);第2組包含200個異常數(shù)據(jù),450個100%滿功率正常數(shù)據(jù),450個90%滿功率正常數(shù)據(jù);第3組包含200個異常數(shù)據(jù),300

        表1 工況類型與樣本數(shù)量Table 1 Condition type and sample count

        個100%滿功率正常數(shù)據(jù),300個90%滿功率正常數(shù)據(jù),300個80%滿功率正常數(shù)據(jù)。

        為體現(xiàn)SAE的優(yōu)勢,同時用不含稀疏項的AE作為對照,對相同的數(shù)據(jù)進行測試,相關參數(shù)設置列于表2。

        表2 參數(shù)設置Table 2 Parameter setting

        2.1 數(shù)據(jù)預處理

        為更有效地提取特征和訓練狀態(tài)監(jiān)測模型,需對數(shù)據(jù)進行歸一化處理,通過歸一化既能消除量綱的影響同時又能保留數(shù)據(jù)的原始特征信息,本文采用極差歸一化法對原始數(shù)據(jù)進行預處理,其表達式為:

        i=1,2,…,n,xi(t)∈[0,1]

        (11)

        式中,ximax(t)和ximin(t)分別為xi(t)的最大值和最小值。經(jīng)歸一化后,所有參數(shù)值均被限制在[0,1]范圍內(nèi),然后就能被用來訓練SAE模型和狀態(tài)監(jiān)測模型。

        2.2 評價指標

        通過設置SAE隱藏層神經(jīng)元的數(shù)量,可獲得與隱藏層神經(jīng)元數(shù)量對應的提取特征的維數(shù)。為評價提取特征的質(zhì)量,使用SAE訓練迭代收斂到相同誤差精度的迭代次數(shù)和受試者工作特性(ROC)曲線下的面積(AUC)作為評估標準。在優(yōu)先保證AUC足夠大的情況下,迭代次數(shù)越少,說明所提取特征的質(zhì)量越好。

        2.3 特征提取結果

        1) 案例1

        該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),900個100%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖4為案例1 AUC和訓練迭代次數(shù)與特征維度的關系。從圖4a可看出,AE的AUC在不同特征維度下的取值波動較大,且最大精度不超過96%,而SAE的AUC在不同特征維度下的取值比較穩(wěn)定,并能保持較高精度。從圖4b可看出,AE的收斂次數(shù)少,SAE的收斂次數(shù)較多,且隨特征維度的增加而明顯增加,結合圖4a的AUC,可認為AE易提前陷入局部最小值,而SAE盡管訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解。通過觀察圖4a中SAE的AUC與特征維度關系曲線可發(fā)現(xiàn),當特征維度取1時,AUC下降較明顯;當特征維度大于6時,AUC呈下降趨勢。當特征維度為3、4、5或6時,AUC能取到最大值1,這說明狀態(tài)監(jiān)測模型此時能有最大識別率。考慮到迭代次數(shù)應越小越好,因此當特征維度取3時,可認為是最佳情況。

        圖5為特征維度分別為1、2和3時的可視化結果,可視化結果由等高線圖和散點圖組成。其中藍色區(qū)域為正常狀態(tài)區(qū)域,當異常分數(shù)接近于0時,藍色程度加深,這意味著該區(qū)域的數(shù)據(jù)為正常數(shù)據(jù)的可能性更高。黃色區(qū)域為異常區(qū)域,當異常分數(shù)接近于1時,黃色程度加深,這意味著該區(qū)域的數(shù)據(jù)為異常數(shù)據(jù)的可能性更高。如圖5a所示,為使可視化效果更好,當提取特征維度取1時,用極坐標圖對結果進行展示,半徑為特征參數(shù)的取值。圖5b、c的坐標軸參數(shù)為相應特征維度下的特征參數(shù)。

        特征提取結果顯示經(jīng)特征提取后,正常數(shù)據(jù)都集中在原點區(qū)域,異常數(shù)據(jù)以離散形式分布在正常數(shù)據(jù)周圍。通過局部放大圖可發(fā)現(xiàn),當特征維度取1和2時,在正常數(shù)據(jù)周圍有一部分數(shù)據(jù)被錯誤分類,當特征維度取3時,無數(shù)據(jù)被誤判。因此可認為將數(shù)據(jù)壓縮至3維特征空間,可作為最佳維度去訓練狀態(tài)監(jiān)測模型。

        圖4 案例1 AUC和訓練迭代次數(shù)與特征維度的關系Fig.4 AUC and training iteration under different feature dimensions for case 1

        圖5 案例1當特征維度為1(a)、2(b)、3(c)時的可視化結果Fig.5 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 1

        2) 案例2

        該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),450個100%滿功率正常數(shù)據(jù),450個90%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖6為案例2 AUC和訓練迭代次數(shù)與特征維度的關系。從圖6a可看出,該結果與案例1類似,AE的AUC在不同特征維度下的取值波動較大,而SAE的AUC在不同特征維度下的取值較穩(wěn)定,并能保持較高精度。從圖6b可看出,AE的收斂次數(shù)少,SAE的收斂次數(shù)較多,且隨特征維度的增加而明顯增加,結合圖6a的AUC,可認為AE易提前陷入局部最小值,而SAE盡管訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解。通過觀察SAE的訓練迭代次數(shù)與特征維度關系曲線可看出,提取特征維度越小,訓練迭代的次數(shù)越少,當提取特征維度小于16時,迭代次數(shù)有一明顯的下降趨勢。通過觀察SAE的AUC與提取特征維度關系曲線可發(fā)現(xiàn),當特征維度取1時,AUC下降較明顯;當特征維度大于7時,AUC呈下降趨勢。當特征維度為4時,AUC能取到最大值0.994 9,這說明狀態(tài)監(jiān)測模型此時具有最大識別率,同時又能取得較低的迭代次數(shù),因此當特征維度取4時,可認為是最佳的情況。

        圖7為特征維度分別為1、2和3時的可視化結果。當特征維度取1時,在異常分數(shù)接近于0的區(qū)域,存在明顯的誤判,這說明1維特征不能反映數(shù)據(jù)的本質(zhì)特征。圖7b、c可發(fā)現(xiàn),正常數(shù)據(jù)主要集中在兩個區(qū)域,這說明了數(shù)據(jù)中包含兩類正常數(shù)據(jù),異常數(shù)據(jù)主要分布在正常數(shù)據(jù)周圍。通過局部放大圖可發(fā)現(xiàn),在正常數(shù)據(jù)周圍存在一些誤判。

        3) 案例3

        該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),300個100%滿功率正常數(shù)據(jù),300個90%滿功率正常數(shù)據(jù),300個80%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖8為案例3 AUC和訓練迭代次數(shù)與特征維度的關系。從圖8可知,第3組數(shù)據(jù)集的結果與前兩組數(shù)據(jù)的結果基本類似,即SAE訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解;當特征維度取11時,AUC能取到最大值0.992 2,此時監(jiān)測精度為97.1%。因此可認為該組數(shù)據(jù)集的最佳特征維度為11。

        圖9為特征維度分別為1、2和3時的可視化結果。當特征維度取1時,在異常分數(shù)接近于0的區(qū)域,存在明顯的誤判,這說明1維特征不能反映數(shù)據(jù)的本質(zhì)特征。圖9b、c可發(fā)現(xiàn),正常數(shù)據(jù)主要集中在3個區(qū)域,這說明了數(shù)據(jù)中包含3類正常數(shù)據(jù),異常數(shù)據(jù)主要分布在正常數(shù)據(jù)周圍,并且誤判主要集中在正常數(shù)據(jù)附近。

        圖6 案例2 AUC和訓練迭代次數(shù)與特征維度的關系Fig.6 AUC and training iteration under different feature dimensions for case 2

        圖7 案例2當特征維度為1(a)、2(b)、3(c)時的可視化結果Fig.7 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 2

        圖8 案例3 AUC和訓練迭代次數(shù)與特征維度的關系Fig.8 AUC and training iteration under different feature dimensions for case 3

        圖9 案例3當特征維度為1(a)、2(b)、3(c)時的可視化結果Fig.9 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 3

        3 結論

        本文提出了基于SAE的特征提取方法,并將其應用于核動力裝置狀態(tài)監(jiān)測中。在保證較高的狀態(tài)監(jiān)測精度和較低的訓練迭代次數(shù)的條件下,實現(xiàn)對原始數(shù)據(jù)的特征提取。在案例1中,將包含1種正常工況的原始數(shù)據(jù)壓縮成3維數(shù)據(jù),此時AUC可取到最大值1,并實現(xiàn)100%狀態(tài)監(jiān)測精度。在案例2中,將包含兩種正常工況的原始數(shù)據(jù)壓縮成4維數(shù)據(jù),此時AUC取到最大值0.994 9,并實現(xiàn)98%的監(jiān)測精度。在案例3中,將包含3種正常工況的原始數(shù)據(jù)壓縮成11維數(shù)據(jù),此時AUC取到最大值0.992 2,并實現(xiàn)97%的監(jiān)測精度。通過將3個案例中SAE與AE的特征提取結果進行對比可發(fā)現(xiàn),SAE得到的結果相對較穩(wěn)定,不易陷入局部最優(yōu)解。同時,通過可視化作圖,將降維結果與狀態(tài)監(jiān)測結果結合,可直觀分辨特征提取結果優(yōu)劣。綜上所述,基于SAE的特征提取方法的優(yōu)勢主要體現(xiàn)在:1) 可提取原始數(shù)據(jù)在低維空間中的特征,實現(xiàn)高維數(shù)據(jù)向低維空間的轉(zhuǎn)換,從而節(jié)約計算資源;2) 訓練過程中不易陷入局部最優(yōu)解;3) 將樣本的本質(zhì)特征信息凝聚到低維空間,從而提高狀態(tài)監(jiān)測的精確度。

        猜你喜歡
        特征提取案例特征
        案例4 奔跑吧,少年!
        少先隊活動(2021年2期)2021-03-29 05:40:48
        如何表達“特征”
        基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        隨機變量分布及統(tǒng)計案例拔高卷
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        發(fā)生在你我身邊的那些治超案例
        中國公路(2017年7期)2017-07-24 13:56:38
        一種基于LBP 特征提取和稀疏表示的肝病識別算法
        一個模擬案例引發(fā)的多重思考
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        日本变态网址中国字幕| 久久久久久久人妻无码中文字幕爆| 日韩无码视频淫乱| 久久精品视频按摩| 亚洲一区二区三区视频免费看| 韩国三级大全久久网站| 色婷婷欧美在线播放内射| 色yeye在线观看| 国产精品成人午夜久久| 手机av在线观看视频| 国产最新女主播福利在线观看| 日本久久高清一区二区三区毛片| 欧美极品第一页| 中文字幕精品乱码一二三区| 少妇无套裸按摩呻吟无呜| 九九精品国产亚洲av日韩| 老熟妇Av| 亚洲综合小综合中文字幕| 国产极品视觉盛宴| 久久婷婷国产剧情内射白浆| 中文字幕高清无码不卡在线| 久久久精品国产免费看| 最新国产精品久久精品| 亚洲成a人片在线观看久| 亚洲av乱码一区二区三区观影 | 国产爆乳美女娇喘呻吟久久| 日本不卡视频一区二区| 狼人青草久久网伊人| 国产nv精品你懂得| 福利视频自拍偷拍视频| 狠狠cao日日橹夜夜十橹| 国产成人精品av| 成人国产精品免费网站| 亚洲最大一区二区在线观看| 9 9久热re在线精品视频| 欧美在线成人午夜网站| 亚洲视频在线免费观看一区二区| 欲求不満の人妻松下纱荣子| 国产精品无码日韩欧| 日本一区二区在线播放观看| 蜜桃精品人妻一区二区三区|