亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于插值-擬合-遷移學習算法的機載設備故障概率預測

        2018-01-15 05:35:36顧濤勇郭建勝李正欣王騰蛟
        關(guān)鍵詞:數(shù)據(jù)量插值復雜度

        顧濤勇, 郭建勝, 李正欣, 王 健, 王騰蛟

        (空軍工程大學裝備管理與安全工程學院, 陜西 西安 710051)

        0 引 言

        機載設備故障概率預測是航空維修保障的一個重要問題。對故障概率預測問題的研究,存在以下兩種主要的求解思路,即基于模型的故障概率預測與基于數(shù)據(jù)驅(qū)動的故障概率預測[1]。相對于基于模型的故障概率預測需要獲取研究對象的精確的故障概率模型,基于數(shù)據(jù)驅(qū)動的預測方法應用更為靈活,因此受到了廣泛的關(guān)注[2]。文獻[3-5]對常用算法在故障預測中的運用進行了分析,但是機載設備故障原因復雜、不確定性強、樣本不足等問題導致這些方法很難發(fā)揮其優(yōu)勢。

        在數(shù)據(jù)驅(qū)動的故障概率預測方法中,插值與擬合是最為高效的方法。而遷移學習[6],或稱歸納遷移,是機器學習中的一個重要研究問題,其目標是將某個領(lǐng)域或任務上學習到的知識或模式應用到不同但相關(guān)的領(lǐng)域或問題中[7]。遷移學習試圖實現(xiàn)人通過類比進行學習的能力,可以很好地解決樣本不足的問題。

        通過分析機載設備故障數(shù)據(jù),發(fā)現(xiàn)機載設備的故障概率不僅僅和飛行時次相關(guān),不同的工作環(huán)境也會對故障概率造成影響。單獨對各個工作環(huán)境的數(shù)據(jù)分析會引起樣本不足的問題,基于樣本特征的遷移學習[8]可以解決這一問題。本文在插值、擬合與遷移學習的基礎上,提出了一種針對于不同工作環(huán)境的機載設備故障概率預測算法。算法將插值、擬合與遷移學習通過自適應權(quán)重進行線性組合,在提升數(shù)據(jù)利用效率的同時規(guī)避遷移學習所帶來風險。

        1 問題描述

        在研究機載設備故障概率預測問題時,由于設備價格昂貴,通過實驗建立精確的設備故障概率模型是不現(xiàn)實的。那么歷史故障數(shù)據(jù)就成了預測其故障概率的主要依據(jù)。為了區(qū)分工作環(huán)境,即對不同的工作環(huán)境給出不同的故障概率分布函數(shù),數(shù)據(jù)量往往不充足并且不平衡。在樣本較少的情況下,插值、擬合方法都很難精確地描述故障概率,選擇類似數(shù)據(jù)進行遷移學習是有效的數(shù)據(jù)補充手段;而在樣本充足的情況下,遷移學習會稀釋其數(shù)據(jù)特征,造成負遷移現(xiàn)象。什么時候選擇遷移,選擇哪些數(shù)據(jù)進行遷移,如何遷移,是決定學習效果的3個關(guān)鍵問題[6]。針對以上3個問題,本文提出了自適應權(quán)重的插值-擬合-遷移學習(interpolation-fitting-transfer learning, IFT)算法。

        2 IFT算法

        IFT算法模仿了人對數(shù)據(jù)歸納、類比的能力,充分利用所掌握的信息,以減小數(shù)據(jù)量不充足、不平衡所帶來的預測誤差。該算法對插值、擬合、遷移學習賦予一定的權(quán)重進行線性組合。算法的主要公式為

        fr(x,t)=

        (1)

        式中,fr(x,t)表示工作環(huán)境為x,飛行時次為t的設備預測故障概率;α·IP(x,t)是故障頻率分布的插值;β·FIT(x,t)是根據(jù)分布函數(shù)的擬合;∑[θ(x,x′)·IP(x′,t)]是對其他工作環(huán)境故障數(shù)據(jù)的遷移學習,其中x′∈X-x。α、β、θ分別為插值、擬合與遷移學習權(quán)重。由于α、β、θ齊次,且次數(shù)為0,所以在工作環(huán)境x數(shù)據(jù)量不為0的情況下,默認α=1;當工作環(huán)境取值為x的數(shù)據(jù)量為0時,默認α=0。

        (2)

        式中,sim(IP(x,t),FIT(x,t))是擬合與插值的分布相似度;d(fitco)為擬合函數(shù)的參數(shù)數(shù)量;ds(x)為工作環(huán)境x的樣本數(shù)量。

        (3)

        式中,分布相似度sim(f(t),g(t))表示分布f(t)與g(t)的相似程度。由于故障預測是為了備件與維修工作,所以采用的相似度量與備件、維修風險度量相關(guān)。

        (4)

        式中,x′∈X-x,diff(x,x′)表示工作環(huán)境x與x′中取值不同的維,例如x1=(機型1,氣候條件1),x2=(機型1,氣候條件2),diff(x1,x2)={氣候條件}。

        ie(Xd)=-∑p(Xd)·log2(p(Xd))

        (5)

        式中,ie(Xd)表示維向量Xd的信息熵。

        對應于前文中所提及的遷移學習關(guān)鍵問題[6],IFT算法遵循以下兩個準則:①當前樣本數(shù)據(jù)越少,插值和擬合方法越難以趨近真實的概率分布,則遷移學習權(quán)重越高;②遷移學習數(shù)據(jù)與當前數(shù)據(jù)的相似度越高,則其權(quán)重越大。所以,遷移學習權(quán)重θ(x,x′)與分布相似度(根據(jù)式(3)計算)、信息熵(根據(jù)式(5)計算)和數(shù)據(jù)量相關(guān)。工作環(huán)境x數(shù)據(jù)量為0時,默認sim(IP(x),IP(x′))-1。

        3 算法理論分析

        本節(jié)將分析插值、擬合與遷移學習在預測結(jié)果中所占的比例,討論算法的復雜度和簡化方法,以驗證算法的合理性與可行性。

        3.1 IFT比例

        工作環(huán)境x的數(shù)據(jù)量為0時,α=β=0,有

        fr(x,t)=∑[θ(x,x′)·IP(x′,t)]/∑θ(x,x′)

        θ(x,x′)=[log2(1+ds(x′))]2/ie(diff(x,x′))

        預測只來自于遷移學習,遷移學習權(quán)重取決于數(shù)據(jù)量和信息熵。工作環(huán)境x的數(shù)據(jù)量為+∞時,α=1,β=0,θ(x,x′)=0,fr(x,t)=IP(x,t)預測只來自于插值。

        通常情況下,數(shù)據(jù)量介于以上兩種極端情況之間。為了直觀地顯示IFT比例,假設各個工作環(huán)境相互獨立并且均勻分布,平均每個變量的可取值數(shù)量都為5,默認擬合度為1。

        在這樣的條件下,IFT比例的變化趨勢如圖1所示。圖1中數(shù)據(jù)量是關(guān)于2的對數(shù),可以發(fā)現(xiàn)插值比例隨著數(shù)據(jù)量的增大而增大,擬合與遷移學習則相反。

        圖1 IFT的比例變化Fig.1 Change of IFT’s proportions

        3.2 算法復雜度

        為了驗證算法的可行性,需要對算法的時間復雜度進行分析。假設工作環(huán)境x的維數(shù)為m,各維的取值數(shù)量為n,各個維度相互獨立,并且數(shù)據(jù)量均勻分布,數(shù)據(jù)總量為D,那么對應于某個工作環(huán)境的數(shù)據(jù)量為d=D/nm。

        對于初次學習,采用線性插值,插值復雜度為O(dlog2d),插值次數(shù)為nm,總復雜度為O(nm·dlog2d)=O(Dlog2d);最小二乘法擬合指數(shù)分布,單項擬合數(shù)據(jù)量為d,擬合復雜度與精度有一定的關(guān)系,可以認為是O(kd),其中k是與指數(shù)函數(shù)計算精度有關(guān)的參數(shù),擬合次數(shù)為nm,總復雜度為O(kD)。關(guān)于擬合權(quán)重與遷移學習項權(quán)重的計算,擬合權(quán)重β的計算復雜度為O(lD),其中l(wèi)是與指數(shù)函數(shù)計算精度有關(guān)的參數(shù),擬合權(quán)重計算次數(shù)為nm,擬合權(quán)重計算總復雜度為O(lD)。遷移學習項權(quán)重θ(x,x′)的計算復雜度為O(2d),遷移項權(quán)重計算次數(shù)為n2m,遷移項權(quán)重計算總復雜度為O(n2m·D)。所以,初次學習的總復雜度的數(shù)量級為O(n2m·D)。

        3.3 簡化方法

        對于增量學習,每增加一條數(shù)據(jù),由于有遷移學習的存在,算法需要重新計算1次插值頻率、1次擬合頻率、1次擬合權(quán)重和nm次遷移項權(quán)重,總復雜度為O(nm·D)。在原有數(shù)據(jù)量D的基礎上新增數(shù)據(jù)量D′,復雜度為O(nm·D′2+nm·D·D′),在數(shù)據(jù)量大、維數(shù)多的情況下會導致組合爆炸,所以考慮對其進行簡化。根據(jù)算法特征,有3種簡化方法:

        (1) 新增數(shù)據(jù)積累到一定量后進行一次重計算;

        (2) 限制遷移學習范圍;

        (3) 對工作環(huán)境維度進行剪枝。

        4 仿真實例

        4.1 數(shù)據(jù)集

        仿真實例選擇某一段時間某型號機載設備的故障數(shù)據(jù)。數(shù)據(jù)格式為(搭載機型,氣候條件,飛行時次),其中搭載機型4種,氣候條件6種,數(shù)據(jù)量為249。一般認為該設備故障概率服從Weibull分布,之前采用的預測主要方法也是Weibull擬合。

        如圖2所示,對于全局故障數(shù)據(jù)(不區(qū)分工作環(huán)境),其擬合程度相當高。但是不同機型和氣候條件的故障概率分布存在一定差異,如圖3和圖4所示。針對各工作環(huán)境,采用同一個插值或是擬合函數(shù)不能區(qū)分工作環(huán)境所帶來的差異;而對每一種工作環(huán)境單獨進行插值或是擬合則會由于數(shù)據(jù)量不足而產(chǎn)生誤差。

        圖2 故障頻率與Weibull擬合Fig.2 Fault frequency and Weibull fitting

        圖3 各機型故障頻率Fig.3 Fault frequency distinguished by aircraft type

        圖4 各氣候條件故障頻率Fig.4 Fault frequency distinguished by climate condition

        由于真實的故障概率分布未知,需要保留一定量的數(shù)據(jù)作為校驗集,以預測概率和校驗集頻率的分布相似度來衡量算法效果。為了模擬真實情況,數(shù)據(jù)按輸入時間順序來劃分,前156條作為訓練集D,后93條數(shù)據(jù)作為校驗集D′。

        4.2 算法步驟

        步驟1根據(jù)式(5)計算工作環(huán)境差異信息熵值。

        步驟2計算頻率插值、分布擬合。實例選擇線型插值和最小二乘Weibull分布擬合[9-10]。

        步驟3計算擬合權(quán)重β、遷移學習項權(quán)重θ與IFT比例。其中積分步長大小取1,由于分布函數(shù)單調(diào)遞增,函數(shù)值取積分區(qū)間的中點值。

        步驟4計算預測概率分布。根據(jù)所得的α、β、θ,以及式(1)來計算各個工作環(huán)境下的故障概率分布。

        4.3 結(jié)果對比

        對于全局故障數(shù)據(jù)(不區(qū)分工作環(huán)境)的概率分布,對線型插值、Weibull分布擬合以及IFT 3種方法進行比較(見表1)。對于各工作環(huán)境故障概率分布,對線型插值(區(qū)分工作環(huán)境)、Weibull分布擬合(區(qū)分工作環(huán)境)、全局線型插值(不區(qū)分工作環(huán)境)、全局Weibull分布擬合(不區(qū)分工作環(huán)境)以及IFT 5種方法進行比較(見表2)。

        表1 全局預測準確度(不區(qū)分工作環(huán)境)比較

        如表1所示,對于全局故障數(shù)據(jù)而言,不論是插值、擬合還是IFT方法,都有很高的準確率。如表2和表3所示,在區(qū)分工作環(huán)境的情況下,IFT方法表現(xiàn)出了一定的優(yōu)勢(其中數(shù)據(jù)量為0的工作環(huán)境不進行檢驗,不在表格中出現(xiàn))。尤其對于數(shù)據(jù)量較少的工作環(huán)境,遷移學習能提高預測結(jié)果的穩(wěn)定性,避免數(shù)據(jù)量少而導致的極大誤差(如表2中的工作環(huán)境12、14)。在實例中,工作環(huán)境僅僅考慮了機型和氣候條件,向量維數(shù)較少,IFT方法的優(yōu)勢不明顯,但隨著工作環(huán)境維數(shù)的增加,IFT方法的優(yōu)勢會逐漸增大。

        表2 各工作環(huán)境預測準確度比較

        表3 各工作環(huán)境平均預測準確度比較

        5 結(jié) 論

        本文分析了IFT算法的復雜度,通過實例展現(xiàn)了其優(yōu)勢,論證了IFT方法是一種可行并且有效的機載設備故障概率預測方法。IFT算法的主要優(yōu)勢在于:

        (1) 算法體現(xiàn)了不同工作環(huán)境對機載設備故障概率預測的影響;

        (2) 算法根據(jù)數(shù)據(jù)量和數(shù)據(jù)特征自適應調(diào)整各部分比例,規(guī)避了數(shù)據(jù)貧化所帶來的預測風險,也減少了負遷移現(xiàn)象。

        為了能滿足大多數(shù)機載設備的故障概率預測需求,仍存在一些問題需要解決:

        (1) 除了工作環(huán)境(枚舉型),數(shù)據(jù)中還存在其他影響設備故障概率造成的因素,例如對于可修復件,有歷史故障次數(shù)(離散型)、歷史總飛行時次(連續(xù)型);

        (2) 數(shù)據(jù)的內(nèi)容、結(jié)構(gòu)不同;

        (3) 數(shù)據(jù)中存在大量的缺失值。

        對于這些問題,需要適用范圍更廣的相似度度量和數(shù)據(jù)特征遷移學習方法,這將在下一步工作中進行研究。

        [1] LUO J H, NAMBURU M, PATTIPATI K, et al. Model-based prognostic techniques[C]∥Proc.of the Autotestcon IEEE Systems Readiness Technology Conference, 2003: 330-340.

        [2] 張磊, 李行善, 于勁松, 等. 基于關(guān)聯(lián)向量機回歸的故障預測算法[J]. 系統(tǒng)工程與電子技術(shù), 2010, 32(7): 1540-1543.

        ZHANG L, LI X S, YU J S, et al. Fault prognostic algorithm based on relevance vector machine regression[J]. Systems Engineering and Electronics, 2010, 32(7): 1540-1543.

        [3] ZHANG C L, HE Y G, YUAN L F, et al. A novel approach for analog circuit fault prognostics based on improved RVM[J]. Journal of Electronic Testing Theory & Applications, 2014, 30(3): 343-356.

        [4] EKER O F, CAMCI F. State-based prognostics with state duration information[J]. Quality and Reliability Engineering International, 2013, 29: 465-476.

        [5] XIA F, ZHANG H, LONG J Q, et al. Fault diagnosis of turbine unit equipment based on data fusion and RBF neural network[J]. Lecture Notes in Computer Science, 2011, 7002(2): 74-81.

        [6] PAN S J, YANG Q. A survey on transfer learning[J]. IEEE Trans.on Knowledge & Data Engineering,2010,22(10):1345-1359.

        [7] 龍明盛. 遷移學習問題與方法研究[D]. 北京: 清華大學, 2015.

        LONG M S. Transfer learning: problems and methods[D]. Beijing: Tsinghua University, 2015.

        [8] 楊士準. 基于樣本和特征的遷移學習方法及應用[D]. 長沙: 國防科學技術(shù)大學, 2016.

        YANG S Z. Instance-based and feature-based transfer learning approaches with their applications[D]. Changsha: National University of Defense Technology, 2016.

        [9] LU H L, CHEN C H, WU J W, et al. A note on weighted least-squares estimation of the shape parameter of the Weibull distribution[J].Quality & Reliability Engineering International, 2004, 20(6): 579-586.

        [10] 魏星. 基于多組樣本和順序統(tǒng)計量的威布爾分布參數(shù)置信區(qū)間的估計[D]. 上海: 上海交通大學, 2016.

        WEI X. The confidence intervals for the Weibull parameters based on multi-sample and order statistic[D]. Shanghai: Shanghai Jiaotong University, 2016.

        猜你喜歡
        數(shù)據(jù)量插值復雜度
        基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
        計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
        高刷新率不容易顯示器需求與接口標準帶寬
        寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設計與研究
        電子制作(2019年13期)2020-01-14 03:15:18
        一種低復雜度的慣性/GNSS矢量深組合方法
        基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
        求圖上廣探樹的時間復雜度
        一種改進FFT多譜線插值諧波分析方法
        基于四項最低旁瓣Nuttall窗的插值FFT諧波分析
        某雷達導51 頭中心控制軟件圈復雜度分析與改進
        久久久久亚洲AV无码去区首| 亚洲国产成人片在线观看无码| 国产成人av免费观看| 欧洲女人性开放免费网站| 亚洲日韩专区在线视频| 国产亚洲精品综合99久久| 日本a级黄片免费观看| 亚洲av综合av成人小说| 成人免费视频在线观看| 国产久视频国内精品999| 国产区高清在线一区二区三区| 国产一级一厂片内射视频播放| 少妇连续高潮爽到抽搐| 亚洲精品无人区| 中国大陆一级毛片| 大伊香蕉精品视频一区| 亚洲精品在线一区二区| 激情综合五月开心婷婷| 亚洲老妈激情一区二区三区| 久久精品国产99精品国偷| 日韩精品成人一区二区三区| 青青草手机免费播放视频| 久久99热狠狠色精品一区| 亚洲日韩乱码中文无码蜜桃臀| 亚洲一码二码在线观看| 久久国内精品自在自线| 亚洲国产精品无码中文字 | 风韵丰满妇啪啪区老老熟女杏吧 | 人妻洗澡被强公日日澡电影| 激情欧美日韩一区二区| 久久久诱惑一区二区三区 | 久久亚洲av午夜福利精品一区| 99久久久无码国产aaa精品| 国产91精品丝袜美腿在线| 亚洲精彩av大片在线观看| 四虎国产精品永久在线| 欧美国产日产一区二区 | 色婷婷精品久久二区二区蜜桃| 中文字幕一区二区三区日韩精品| 欧美色图50p| 亚洲免费在线视频播放|