張達(dá),高君宇,丁騰歡,谷士鵬,李學(xué)龍
(1.西北工業(yè)大學(xué) 光電與智能研究院,陜西 西安 710072; 2.中國飛行試驗(yàn)研究院,陜西 西安 710089)
航空安全在航空運(yùn)輸和軍事等領(lǐng)域中具有重要地位,也是臨地安防領(lǐng)域研究的關(guān)鍵課題[1]。航空傳感器用于實(shí)時(shí)監(jiān)測航空器的飛行參數(shù),其詳細(xì)記錄了飛行時(shí)溫度、壓力、迎角等方面的時(shí)序信息,對航空器的安全運(yùn)行至關(guān)重要[2]。雖然航空傳感器具有較高的設(shè)計(jì)可靠性,但由于長期運(yùn)行在空間環(huán)境中,其故障無法完全避免。一旦航空傳感器發(fā)生故障,將嚴(yán)重影響航空器的飛行狀態(tài),甚至造成飛行事故。因此,在飛機(jī)交付前通過飛行試驗(yàn)校準(zhǔn)傳感器測量精度進(jìn)而判斷傳感器是否發(fā)生故障,對于航空器的安全平穩(wěn)運(yùn)行具有重要意義[3]。
航空傳感器故障是指由于各種因素(包括環(huán)境條件、物理損壞和人為錯(cuò)誤)導(dǎo)致傳感器性能退化,在校準(zhǔn)時(shí)其輸出數(shù)據(jù)與真實(shí)數(shù)據(jù)出現(xiàn)較大偏差或者錯(cuò)誤的現(xiàn)象[4]。傳感器的故障檢測是指通過對傳感器的時(shí)序數(shù)據(jù)進(jìn)行分析,判斷其性能是否在正常范圍內(nèi)工作[5]。航空傳感器故障檢測的難點(diǎn)在于:①航空傳感器時(shí)序數(shù)據(jù)長度極長,通常包含數(shù)十萬時(shí)間點(diǎn),不易直接進(jìn)行挖掘;②傳統(tǒng)的故障檢測方法需要繁瑣的人工檢驗(yàn),且難以覆蓋到數(shù)據(jù)的全局信息,缺乏對上下文語義信息的有效建模;③由于不同的試飛任務(wù)和條件,每次試飛產(chǎn)生的數(shù)據(jù)長度不一致,模型訓(xùn)練和測試極為困難。針對航空傳感器的故障檢測任務(wù),本文通過對傳感器數(shù)據(jù)進(jìn)行有效挖掘,提出一種基于時(shí)序二維化的航空傳感器故障檢測方法。該方法能及時(shí)判斷傳感器是否發(fā)生故障,并降低人工校準(zhǔn)傳感器的成本,確保航空器飛行過程中數(shù)據(jù)的有效性。
航空傳感器的故障檢測主要分為傳統(tǒng)方法和基于深度學(xué)習(xí)的方法。傳統(tǒng)方法利用數(shù)學(xué)手段對傳感器數(shù)據(jù)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型。例如,于廣偉等[6]通過對多尺度遷移符號動(dòng)力學(xué)熵方法的參數(shù)進(jìn)行優(yōu)選,將其輸入支持向量機(jī)(support vector machine,SVM)中,從而提升數(shù)據(jù)驅(qū)動(dòng)故障診斷模型的泛化能力,在少量樣本下準(zhǔn)確識別不同故障位置。Cui等[7]基于動(dòng)態(tài)時(shí)間歸整(dynamic time warping,DTW)方法對衛(wèi)星時(shí)間序列中的故障樣本進(jìn)行過采樣,結(jié)合K近鄰(k-nearest neighbor,KNN)分類方法提高對異常樣本的檢測精度,但處理其他故障數(shù)據(jù)時(shí)效果不佳。Wang等[8]通過帶有移項(xiàng)因子的分段聚合近似(piece-wise aggregation approximation,PAA)數(shù)據(jù)降維方法來降低單元電壓時(shí)間序列的維度,然后使用聚類算法和異常機(jī)制剔除故障樣本從而達(dá)到檢測目的。雖然傳統(tǒng)的故障檢測方法可以對一些簡單的故障進(jìn)行分析和判斷,但對更復(fù)雜的故障則需要更先進(jìn)的技術(shù)和方法來進(jìn)行檢測。
相比于傳統(tǒng)方法,基于深度學(xué)習(xí)的方法采用多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),具備出色的特征提取和學(xué)習(xí)能力,在樣本分類方面顯示出獨(dú)特優(yōu)勢[9]。近年來,此類方法已廣泛應(yīng)用于航空傳感器的故障檢測研究中[10-13]。例如,王志凱等[14]利用神經(jīng)網(wǎng)絡(luò)對燃燒室排放進(jìn)行監(jiān)測和控制以確保航空器的安全和穩(wěn)定運(yùn)行,為燃燒室排放性能指標(biāo)的快速評估和精確預(yù)測提供了新思路。Zhang等[15]將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和長短期記憶(long short-term memory,LSTM)深度神經(jīng)網(wǎng)絡(luò)結(jié)合,提出一種慣性測量單元的檢測方法。但此種方法可遷移性差,針對不同異構(gòu)的數(shù)據(jù)需要進(jìn)行不同的網(wǎng)絡(luò)設(shè)計(jì)。Dong[16]提出擬圖數(shù)據(jù)堆疊方法,并結(jié)合經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)[17-18]來執(zhí)行故障檢測任務(wù)。李忠智等[19]將傳感器測量數(shù)據(jù)堆疊為灰度格式的圖像,采用VGG16網(wǎng)絡(luò)判斷灰度圖的異常區(qū)域,然而灰度圖只能表示像素點(diǎn)強(qiáng)度,無法表達(dá)數(shù)據(jù)的時(shí)間關(guān)系,可能會(huì)丟失重要的特征信息。Micjail等[20]利用Vision Transformer[9]對衛(wèi)星圖像時(shí)間序列進(jìn)行檢測,但缺乏對上下文語義信息的有效建模,模型性能受到較大影響。
基于上述問題,本文提出一種基于時(shí)序二維化的航空傳感器故障檢測方法(time-series to 2D fault detection,T2D),并在民機(jī)仿真試飛數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證所提出方法的有效性。具體來說:
1) 針對航空傳感器超長時(shí)序數(shù)據(jù),提出一種基于信息熵的分段聚合近似方法(information entropy piece-wise aggregate approximation,IEPAA),充分保留時(shí)序特征的同時(shí)實(shí)現(xiàn)對數(shù)據(jù)的有效壓縮,提高數(shù)據(jù)挖掘的魯棒性;
2) 引入格拉姆角場(gramian angular field,GAF),將降維后的一維數(shù)據(jù)編碼為二維圖像,從而把故障檢測任務(wù)轉(zhuǎn)換為圖像分類問題,同時(shí)又能夠保持原始序列的長程時(shí)間依賴性;
3) 設(shè)計(jì)一種靈活的卷積模塊(convolutional block,ConvB)并插入檢測網(wǎng)絡(luò)視覺Transformer編碼器中,增強(qiáng)對上下文語義信息的編碼能力,提高模型的檢測精度。
本文旨在研究航空傳感器的超長時(shí)序問題,提出T2D架構(gòu),如圖1所示。首先,針對極長數(shù)據(jù)的挑戰(zhàn),提出一種改進(jìn)的基于分段聚合近似的數(shù)據(jù)挖掘方法IEPAA(見1.1節(jié));其次,引入格拉姆角場將一維時(shí)序數(shù)據(jù)二維化,把故障檢測任務(wù)轉(zhuǎn)換為圖像分類問題(見1.2節(jié));最后設(shè)計(jì)一種靈活的卷積映射模塊并插入到檢測網(wǎng)絡(luò)中,既增強(qiáng)上下文語義信息建模,又提高模型的檢測精度(見1.3節(jié))。
圖1 T2D架構(gòu)圖
1.1.1 分段聚合近似
Keogh等[21]提出的分段聚合近似(piece-wise aggregation approximation,PAA)是一種時(shí)間序列分段表示方法。其思想是對任意時(shí)間序列S,利用大小為λ的滑動(dòng)窗口將其分成多個(gè)固定長度的子序列區(qū)間,計(jì)算各子序列區(qū)間內(nèi)數(shù)據(jù)的均值,最后將所有計(jì)算得到的均值按時(shí)間重新排列成新序列S′,用來近似表示原始序列。
(1)
PAA方法將長度為a的時(shí)間序列S轉(zhuǎn)變?yōu)殚L度為b的序列S′,實(shí)現(xiàn)超長數(shù)據(jù)壓縮過程。雖然降維后的S′能夠粗略地表示原始序列的基本形態(tài)和變化趨勢,但是PAA是均等地對待每個(gè)子序列,因此極易忽視局部的數(shù)據(jù)分布,可能造成較大誤差。
1.1.2 信息熵度量
信息熵(information entropy,IE)是指某一事件發(fā)生時(shí)包含信息量的數(shù)學(xué)期望,即信源的平均信息量。對于非平穩(wěn)的航空傳感器時(shí)序數(shù)據(jù),數(shù)據(jù)曲線的波動(dòng)程度可以用信息熵來衡量。假設(shè)傳感器某一時(shí)間段的子序列數(shù)據(jù)為D,其可能有n種取值,分別為d1,d2,…,dn,取值概率為P1,P2,…,Pn,則該時(shí)間段的傳感器數(shù)據(jù)D的信息熵值Hn為
(2)
信息熵值的大小能夠反映出傳感器數(shù)據(jù)曲線的波動(dòng)程度,熵值如果越大,則該段曲線波動(dòng)的程度越大,代表其復(fù)雜程度更高,信息量更多。當(dāng)每個(gè)取值概率都相同時(shí)P1=P2=…=Pn時(shí),此組傳感器數(shù)據(jù)的信息熵取得最大值,即Hmax=lnn。
平均信息熵可定義為
(3)
對于傳感器某時(shí)間段的數(shù)據(jù)波動(dòng)程度,定義νi為第i個(gè)波動(dòng)程度大小,當(dāng)νi=1時(shí)表示數(shù)據(jù)波動(dòng)程度大,不能用均值表示曲線波動(dòng)特征。
(4)
式中:i=1,2,…,m;m表示該段時(shí)間長度;ω是比例系數(shù),一般取1~2。定義α為傳感器某時(shí)間段數(shù)據(jù)波動(dòng)程度大的數(shù)量占該段時(shí)序數(shù)據(jù)的比值
(5)
如果α超過某一個(gè)閾值σ,則認(rèn)為該段時(shí)間內(nèi)曲線波動(dòng)程度較大,需要更多數(shù)據(jù)表示曲線特征。
1.1.3 基于信息熵的分段聚合近似方法
基于信息熵的分段聚合近似方法(information entropy piece-wise aggregate approximation,IEPAA)是對PAA算法的改進(jìn)。IEPAA首先對時(shí)間序列進(jìn)行劃分子序列處理,利用信息熵度量求出各子序列區(qū)間信息熵。信息熵值越大,表明該子序列區(qū)間復(fù)雜性越高,越不平穩(wěn)。按照熵值大小比重分配各區(qū)間段數(shù),熵值越大、越復(fù)雜的子序列分配數(shù)越多,在用PAA求取原序列的近似時(shí),對此區(qū)間的近似表示越精確。IEPAA的算法描述如下:
輸入:原始序列S={t1,t2,…,ta}。
1) 將序列S分成φ個(gè)子區(qū)間:
φk=[t(k-1)a/b,tka/b], 1≤k≤φ
2) 對每個(gè)子區(qū)間求信息熵:
3) 確定φk子序列的分段數(shù)Fk:
4) 用PAA方法將區(qū)間φk表示成長度為Fk的序列;
相比于普通的PAA方法,IEPAA方法可以發(fā)現(xiàn)時(shí)間序列中極端且短促的變化,對于突變信息能更好地捕捉,擬合原序列時(shí)更加逼近。
(6)
將所有值都縮放到[-1,1]中,之后利用極坐標(biāo)序列保留序列的絕對時(shí)間關(guān)系,從而維持原始序列的長程時(shí)間依賴性。將歸一化得到的數(shù)據(jù)進(jìn)行極坐標(biāo)系變換,得到每一個(gè)數(shù)據(jù)點(diǎn)對應(yīng)的半徑和角度
(7)
x?y=cos(θ1+θ2)
(8)
式中,θ1,θ2分別表示向量x,y在極坐標(biāo)系中對應(yīng)的角度,得到時(shí)間序列的格拉姆角場如下
G=
(9)
在GAF矩陣中,對角線由歸一化處理后的原始值構(gòu)成,且時(shí)間隨對角線依次增加,因此時(shí)間維度也被編碼到GAF矩陣中。由時(shí)序數(shù)據(jù)轉(zhuǎn)換成GAF的完整過程示意圖如圖2所示。
圖2 時(shí)間序列GAF轉(zhuǎn)換過程示意圖
1.3.1 視覺Transformer
視覺Transformer(vision transformer,ViT)[9]是第一個(gè)完全依賴Transformer結(jié)構(gòu)的計(jì)算機(jī)視覺模型。在ViT中,首先將圖像分割為離散且非重疊的像素塊,之后添加位置編碼并輸入到Transformer層中進(jìn)行分類。雖然ViT在大規(guī)模數(shù)據(jù)集上效果很好,但是對于航空傳感器此類少量數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),其效果仍低于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[23]。筆者認(rèn)為其原因是ViT可能缺乏CNN結(jié)構(gòu)固有的某些更適用于視覺任務(wù)的特性。同時(shí),CNN的模式能夠考慮到不同復(fù)雜程度的上下文信息,從簡單的邊緣和紋理到高階語義模式。
針對上述問題,將卷積引入ViT結(jié)構(gòu)中,如圖3所示,在保證較高效率的同時(shí)增強(qiáng)上下文語義信息的編碼能力,提高模型的檢測精度。
圖3 ConvB ViT結(jié)構(gòu)圖
1.3.2 ConvB ViT
1) 像素塊嵌入向量表示
給定具有高度H、寬度為W和通道C的圖像M∈RH×W×C,其被重塑為由N(N=HW/P2)個(gè)大小為P×P×C的像素塊MP組成的序列。之后通過可學(xué)習(xí)的線性投影將每個(gè)像素塊展平成D維的潛在向量,此過程稱為像素塊嵌入向量表示。最后可學(xué)習(xí)的位置嵌入Epos添加到嵌入向量序列一并送入ConvB ViT編碼器模塊中。嵌入公式為
(10)
2) ConvB ViT編碼器
ConvB ViT編碼器包括卷積映射層、多頭自注意力層(multi-head self-attention,MSA)、歸一化層和多層感知機(jī)(multi-layer perceptron,MLP)模塊。本文所提出的卷積映射層目標(biāo)是實(shí)現(xiàn)局部空間上下文的額外建模,并通過允許K和V矩陣的欠采樣來提高效率。如圖4所示,首先將每一個(gè)嵌入向量重塑為二維的矩陣映射。之后使用核大小為s的深度可分離卷積層實(shí)現(xiàn)卷積映射。最后,將映射矩陣展平為一維向量,用于后續(xù)處理。公式為
圖4 卷積映射示意圖
(11)
(12)
多層感知機(jī)公式為
(13)
式中,LN表示穩(wěn)定訓(xùn)練的層規(guī)范化[24]。
本文采用的數(shù)據(jù)集來自某民機(jī)試飛的仿真數(shù)據(jù),包含傳感器正常工作及發(fā)生故障2種類別,共計(jì)700個(gè)樣本。其中,訓(xùn)練集包含310個(gè)正常樣本和40個(gè)故障樣本,測試集包含310個(gè)正常樣本和40個(gè)故障樣本,樣本平均長度為254 067的時(shí)間序列。圖5展示出傳感器的2種狀態(tài)記錄,通過將原始數(shù)據(jù)降維并轉(zhuǎn)換成圖像的方式呈現(xiàn),清晰地觀察到傳感器在正常工作和發(fā)生故障時(shí)的特征高度相似,為了更為直觀地表示2種狀態(tài)差異,繪制出圖6所示的差異圖,可以看出相比正常傳感器,故障傳感器工作時(shí)總有偏差。
圖5 傳感器狀態(tài)記錄圖
圖6 傳感器狀態(tài)差異圖
本文采用混淆矩陣(confusion matrix,CM)模型性能評價(jià)方法,如表1所示。
表1 混淆矩陣
該方法在二分類問題中將樣本分為正類和負(fù)類,例如真正類α(true positive,TP)指實(shí)際為正類且被模型預(yù)測為正類的樣本,假負(fù)類σ(false negative,FN)指實(shí)際為負(fù)類但被模型預(yù)測為正類的樣本。對分類問題而言,評估分類器最直接的是分類精度γ(accuracy),即分類正確的樣本數(shù)占總樣本的比例。其他評價(jià)標(biāo)準(zhǔn)指標(biāo)有準(zhǔn)度κ(precision),表示在所有預(yù)測為正的樣本中實(shí)際為正樣本的數(shù)量;召回率ω(recall)表示在總體正樣本中預(yù)測為正樣本的數(shù)量;F1值μ表示精度和召回率的調(diào)和平均。
本文旨在驗(yàn)證T2D模型的性能,為此在同一平臺下進(jìn)行多組對比實(shí)驗(yàn),將所提算法與部分經(jīng)典算法和當(dāng)前主流模型進(jìn)行評估,并使用準(zhǔn)度故障檢測數(shù)據(jù)集作為評價(jià)基準(zhǔn),考察模型在精度、召回率和F1值等評價(jià)指標(biāo)上的表現(xiàn)。對比算法包括支持向量機(jī)(SVM)[25]、多層感知機(jī)(MLP)[26]、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[27]、BBN[28]以及GTDA[3]。對比算法是故障檢測領(lǐng)域中廣泛使用的模型,能夠全面客觀地評估T2D模型的性能。
本文采用ViT-B[9]作為T2D的骨干網(wǎng)絡(luò),并使用Pytorch工具包[29]在24G顯存的NVIDIA GeForce RTX 3090上訓(xùn)練T2D模型。首先將數(shù)據(jù)壓縮維度設(shè)置到500將原序列降維,通過GAF將訓(xùn)練集圖像短邊設(shè)置成256,按比例調(diào)整圖像大小,之后對圖像隨機(jī)水平翻轉(zhuǎn)并裁剪成224×224的大小。實(shí)驗(yàn)訓(xùn)練批數(shù)量為32,所有訓(xùn)練都使用帶有0.9動(dòng)量的Adam優(yōu)化器實(shí)現(xiàn),初始學(xué)習(xí)率設(shè)置為10-3,總訓(xùn)練的輪次設(shè)置為100。
2.3.1 對比實(shí)驗(yàn)
展示本文提出的T2D架構(gòu)數(shù)據(jù)降維及二維化模塊對于試飛仿真數(shù)據(jù)的格式轉(zhuǎn)換相關(guān)參數(shù)見表2。
表2 數(shù)據(jù)對比
表2展示出原始數(shù)據(jù)和圖像化后的數(shù)據(jù)對比信息。從中可以看出,T2D將超長試飛時(shí)序數(shù)據(jù)分段聚合近似之后再二維化,顯著降低了數(shù)據(jù)規(guī)模。具體來說,對于平均長度為254 076且平均占用內(nèi)存大小為2 032 735 bit的樣本,其轉(zhuǎn)換為500×500分辨率圖像的平均占用內(nèi)存大小為8 897 bit,數(shù)據(jù)壓縮為原來的0.43%。
表3通過分析不同算法在試飛仿真數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果來評估本文所提出T2D框架的性能,加粗字體表明結(jié)果最佳。從表中看出,T2D框架的準(zhǔn)度為91.33%,低于GTDA的92.67%和BBN的91.70%。但是T2D算法的精度、召回率以及F1值分別為88.28%,92.44%,91.88%,在F1值上略高于GTDA的91.75%,在精度和召回率上遠(yuǎn)高于GTDA的85.71%和90.84%,并且在精度、召回率以及F1值方面顯著高于BBN。在所有的指標(biāo)上,T2D結(jié)果都顯著高于其他經(jīng)典的故障檢測方法。
表3 不同模型對比結(jié)果
另外,通過實(shí)驗(yàn)可以看出,T2D框架和GTDA方法的實(shí)驗(yàn)結(jié)果都明顯高于SVM、MLP、RNN這些方法,類似后者的這些模型,對于數(shù)據(jù)集中超長時(shí)序數(shù)據(jù)的全局語義信息提取能力較弱,并且類似的網(wǎng)絡(luò)對于一些局部上下文信息編碼的水平較差,這可能是導(dǎo)致其性能差的原因。對于T2D的表現(xiàn),可以歸功于兩點(diǎn)。首先是在數(shù)據(jù)降維時(shí)以信息熵值的大小作為某一區(qū)間復(fù)雜程度的評價(jià)指標(biāo),能夠更高地保留這一區(qū)間的信息。通過IEPAA方法能夠發(fā)現(xiàn)序列中短促而異常的變化,對于非平穩(wěn)的突變信息能夠更好地捕捉,對于原時(shí)序數(shù)據(jù)擬合地更加逼近。此外,在進(jìn)行特征提取時(shí),本文提出的ConvB卷積映射模塊能夠通過局部感受野引入局部上下文,在ViT使用位置嵌入的同時(shí),能夠更好地適應(yīng)不同輸入分辨率大小,在保持模型高性能的同時(shí)又具有良好的泛化性。
2.3.2 消融實(shí)驗(yàn)
為了進(jìn)一步分析所提出的T2D框架,本文對超參數(shù)以及設(shè)計(jì)的模塊進(jìn)行了一些消融實(shí)驗(yàn)。
1) 各個(gè)模塊作用
為了進(jìn)一步了解所提出T2D方法中每個(gè)組件在整個(gè)模型的作用,在試飛仿真數(shù)據(jù)集上進(jìn)行逐步驗(yàn)證,配置如下:
(1) PAA+ViT:未改進(jìn)的分類聚合算法進(jìn)行數(shù)據(jù)降維,并使用最基礎(chǔ)的ViT進(jìn)行故障分類;
(2) IEPAA+ViT:使用基于信息熵的分類聚合算法壓縮數(shù)據(jù),并結(jié)合ViT對二維化后的數(shù)據(jù)分類,壓縮后的數(shù)據(jù)維度設(shè)置為500。
(3) PAA+ConvB ViT:使用未改進(jìn)的分類聚合算法將數(shù)據(jù)同樣壓縮至500維,使用帶有卷積映射的ViT,其中卷積核大小設(shè)置為3,即s×s=3×3。
(4) IEPAA+ConvB ViT:使用基于信息熵的分類聚合算法將數(shù)據(jù)壓縮至500維,同時(shí)使用帶有卷積核大小為3的卷積映射通過ViT進(jìn)行分類。
表4列出了每個(gè)模型通過不同模塊的配置在試飛仿真數(shù)據(jù)集上的結(jié)果。除了基礎(chǔ)模塊及改進(jìn)模塊不同外,其他基本設(shè)置全部相同。
表4 各個(gè)模塊作用
從表4中可以看出,基于不同配置的模型中,完整模型(IEPAA+ConvB ViT)與其他基線相比性能是最好的,其中精度、召回率、F1值分別達(dá)到88.28%,92.44%,91.88%,相對于基線模型(PAA+ViT)的精度、召回率、F1值分別提高了5.46%,6.99%,4.22%。雖然完整模型在準(zhǔn)度方面不是最高(距最高相差0.58%),但是相對于基線模型也提高1.48%。同時(shí)通過比較不同的改進(jìn)模塊看出,ConvB模塊相較于IEPAA方法在各方面的提升更為有效,前者在4個(gè)評價(jià)指標(biāo)方面都相對后者上升更多。說明模型對于傳感器數(shù)據(jù)的局部上下文信息更為敏感,通過對局部上下文的編碼對模型效果提升更為明顯。總之,T2D通過對PAA基于信息熵的改進(jìn)以及在ViT中添加卷積映射是有效的,從總體趨勢看引入新模塊后,模型針對故障分類的性能提高顯著。
2) IEPAA壓縮維度影響
為了研究IEPAA數(shù)據(jù)降維的維度對模型性能的影響,在其他參數(shù)或者模塊都保持不變的情況下,進(jìn)行了一系列實(shí)驗(yàn),實(shí)驗(yàn)過程中將降維后的數(shù)據(jù)維度從100~900分別進(jìn)行對比實(shí)驗(yàn),不同維度降維后實(shí)驗(yàn)結(jié)果如圖7所示。
圖7 不同降維維度結(jié)果圖
圖中,藍(lán)色、橙色、綠色、紅色分別代表精度、準(zhǔn)度、召回率和F1值,其總體趨勢大致都為先增加后減少。對于傳感器的超長時(shí)間序列數(shù)據(jù),如果數(shù)據(jù)降維的維度過短(例如圖中100和200),其在降維過程中丟失的信息過多,過短的時(shí)間序列經(jīng)過二維化之后形成的圖片同樣會(huì)丟失更多信息,因此模型不能更好地識別局部信息,導(dǎo)致模型的性能較差。然而,維度也不能過長,從圖中可以看到在維度超過500時(shí),各指標(biāo)都出現(xiàn)下降,這是因?yàn)檫^長的維度在增加序列長度的同時(shí),也帶來了更多的冗余信息,其在經(jīng)過二維化形成圖片之后會(huì)增加更多不必要識別的局部信息,這可能會(huì)使模型學(xué)習(xí)更多不必要的知識,從而導(dǎo)致模型性能下降??傊?在經(jīng)過充分的實(shí)驗(yàn)對比后,選擇500作為IEPAA的降維維度,模型在此時(shí)表現(xiàn)最佳。
3) ConvB卷積核大小影響
ConvB內(nèi)部的配置將會(huì)影響整個(gè)模型的性能,由于卷積核大小對卷積神經(jīng)網(wǎng)絡(luò)(CNN)的性能和特征提取能力有著顯著的影響,例如較小的卷積核可以更好地捕捉細(xì)節(jié)和局部特征,而較大的卷積核可以更好地捕捉全局特征和模式;同時(shí),卷積核的大小決定了每一層的感受野大小,其中較小的卷積核通過多次卷積操作可以增加感受野的范圍,從而捕捉更大范圍的信息,然而較大的卷積核可以更快地?cái)U(kuò)大感受野,但可能無法捕捉到更細(xì)節(jié)的信息。因此,在設(shè)計(jì)CNN時(shí),通常會(huì)結(jié)合不同大小的卷積核,以便同時(shí)捕捉不同級別的特征。針對ConvB ViT編碼器的卷積映射中不同卷積核大小進(jìn)行了實(shí)驗(yàn),其結(jié)果如表5所示。
表5 不同卷積核對比結(jié)果
表5給出上述具有不同卷積核大小的卷積映射操作結(jié)果,其中卷積核大小為3×3的卷積映射具有最佳性能,其精度、召回率、F1值分別達(dá)到88.28%,92.44%,91.88%。從結(jié)果來看,發(fā)現(xiàn)感受野過大過小都會(huì)降低模型的性能。前者可能會(huì)學(xué)習(xí)更多的上下文信息從而錯(cuò)過局部結(jié)構(gòu)的信息,而對于某些故障區(qū)間較小的情況,這種模型表現(xiàn)不佳。對于后者來說,會(huì)丟失更大范圍的特征,從而導(dǎo)致無法處理故障區(qū)間較長的情況。因此,本文選擇卷積核大小為3×3的窗口以實(shí)現(xiàn)最佳性能。
為了更直觀地驗(yàn)證對航空傳感器故障檢測任務(wù)中所提出的T2D框架的優(yōu)勢,本為采用了t-SNE方法[30]對原始數(shù)據(jù)、RNN、BBN、GTDA、T2D(IEPAA+ViT)以及T2D(IEPAA+ConvB ViT)多個(gè)方法進(jìn)行可視化(如圖8所示),并結(jié)合表3中的實(shí)驗(yàn)結(jié)果對T2D進(jìn)行定性和定量分析。
圖8 t-SNE可視化圖
圖8展示了試飛仿真數(shù)據(jù)集中5種算法的t-SNE可視化結(jié)果。圖8a)顯示了原始數(shù)據(jù)經(jīng)過t-SNE轉(zhuǎn)換后在二維空間中的分布,其中不同顏色的點(diǎn)表示傳感器的不同狀態(tài)(正常/故障)。圖8b)~8f)中點(diǎn)表示意義與圖8a)相同。在進(jìn)行t-SNE可視化時(shí),困惑度設(shè)置為10,學(xué)習(xí)率為100,迭代次數(shù)設(shè)置為1 000次。通過觀察圖8,可以發(fā)現(xiàn)T2D提取的特征相對于其他方法更為有效,其正常數(shù)據(jù)和故障數(shù)據(jù)能夠直接地區(qū)分開,而且分離數(shù)量更為明顯。結(jié)合表3可以看出,其對應(yīng)各模型檢測的精度,從數(shù)據(jù)上能夠定量地解釋可視化的結(jié)果。同時(shí),T2D相比其他方法能夠更好地捕捉故障數(shù)據(jù),這對應(yīng)其具有更高的召回率。
綜上所述,通過可視化結(jié)果和定量指標(biāo)分析,可以明確得出結(jié)論:所提出的T2D框架在航空傳感器故障檢測任務(wù)中表現(xiàn)最佳。T2D能夠更好地分離故障數(shù)據(jù),為航空傳感器故障檢測任務(wù)領(lǐng)域提供了一種有效的解決方案。這對于提升飛行安全性、減少事故風(fēng)險(xiǎn)具有重要意義,并為進(jìn)一步研究和應(yīng)用相關(guān)技術(shù)提供了有力支持。
本文從航空傳感器的試飛數(shù)據(jù)中挖掘傳感器自身的故障狀態(tài)信息,并提出了一套基于時(shí)序二維化的航空傳感器故障檢測架構(gòu)T2D,以提高對極長時(shí)序數(shù)據(jù)的故障檢測精度,得到以下結(jié)論:
1) 針對航空傳感器超長時(shí)序數(shù)據(jù),提出一種基于信息熵的分段聚合近似方法,在充分保留時(shí)序特征的同時(shí)實(shí)現(xiàn)對數(shù)據(jù)的有效壓縮,提高數(shù)據(jù)挖掘的魯棒性;
2) 引入的格拉姆角場將降維后的一維數(shù)據(jù)編碼為二維圖像,將故障檢測任務(wù)轉(zhuǎn)換為圖像分類問題,同時(shí)保持原始序列的長程時(shí)間依賴性;
3) 設(shè)計(jì)的卷積映射模塊能夠增強(qiáng)對上下文語義信息的編碼能力,提高模型的檢測精度。
本文的研究結(jié)果對于提高航空傳感器性能和可靠性等方面具有重要的理論和實(shí)際意義。在未來的工作中,將繼續(xù)完善數(shù)據(jù)處理方法和圖像化策略,擴(kuò)大研究范圍和深度,探索對于超長時(shí)序試飛數(shù)據(jù)更加有效的深度模型和故障檢測方法。