亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        遷移學(xué)習(xí)下的火箭發(fā)動(dòng)機(jī)參數(shù)異常檢測(cè)策略

        2020-09-29 06:57:06張晨曦
        計(jì)算機(jī)應(yīng)用 2020年9期
        關(guān)鍵詞:誤報(bào)率漏報(bào)發(fā)動(dòng)機(jī)

        張晨曦,唐 曙,唐 珂

        (1.中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,合肥 230000;2.中國(guó)文昌航天發(fā)射場(chǎng)指揮控制中心,海南文昌 571300;3.南方科技大學(xué)計(jì)算機(jī)科學(xué)與工程系,廣東深圳 518000)

        0 引言

        火箭發(fā)動(dòng)機(jī)是運(yùn)載火箭的飛行動(dòng)力核心,其組成復(fù)雜,工作環(huán)境惡劣,高頻振蕩、高溫低溫共存[1],因此任何細(xì)小的異常在這樣的條件下都易快速發(fā)展,極具破壞性,導(dǎo)致發(fā)射失敗,帶來(lái)巨大損失。在航天飛行史上,因發(fā)動(dòng)機(jī)故障導(dǎo)致的失敗次數(shù)超過(guò)總失敗次數(shù)的50%[2]。因此,對(duì)發(fā)動(dòng)機(jī)的異常檢測(cè)可以幫助人們:1)在研制階段發(fā)現(xiàn)設(shè)計(jì)或工藝的缺陷等潛在隱患;2)在測(cè)試階段防止火箭帶故障飛行,最大限度地規(guī)避發(fā)射風(fēng)險(xiǎn);3)在飛行階段挖掘發(fā)動(dòng)機(jī)運(yùn)行的異常和不足,為發(fā)動(dòng)機(jī)性能優(yōu)化改進(jìn)提供反饋,提高航天裝備試驗(yàn)鑒定能力。

        目前工程應(yīng)用中,常用的檢測(cè)方法以紅線法、專家系統(tǒng)法為主[3],但隨著大推力火箭、可回收等新技術(shù)的應(yīng)用,火箭信息化和復(fù)雜度大幅提升,這些方法顯露出了檢測(cè)誤差偏大、規(guī)則維護(hù)成本急劇增加、檢測(cè)時(shí)效滯后等局限性。近幾年來(lái),得益于積累的海量數(shù)據(jù),深度學(xué)習(xí)等新技術(shù)在不依賴專家知識(shí)的前提下將機(jī)器視覺、自然語(yǔ)言處理推向了工程化應(yīng)用[4-6]。反觀航天領(lǐng)域,火箭型號(hào)種類多,單型號(hào)尤其是新火箭樣本有限,數(shù)據(jù)積累及共享困難,嚴(yán)重制約了目前主流機(jī)器學(xué)習(xí)技術(shù)在航天領(lǐng)域的應(yīng)用。

        對(duì)于航天領(lǐng)域這樣的小樣本領(lǐng)域,只依靠領(lǐng)域?qū)<?,難以快速形成評(píng)估能力,只依靠數(shù)據(jù)又缺乏大規(guī)模用于表征學(xué)習(xí)的數(shù)據(jù)集。因此本文的研究動(dòng)機(jī)就是結(jié)合專家知識(shí)和數(shù)據(jù)驅(qū)動(dòng)來(lái)解決傳統(tǒng)方法的不足,具體是以發(fā)動(dòng)機(jī)為研究對(duì)象,通過(guò)領(lǐng)域知識(shí)構(gòu)建特征空間,利用遷移學(xué)習(xí)來(lái)處理樣本規(guī)模有限導(dǎo)致的評(píng)估模型性能低問(wèn)題。本文針對(duì)YF-75 和YF-77 液體發(fā)動(dòng)機(jī)飛行任務(wù)數(shù)據(jù),進(jìn)行預(yù)處理后構(gòu)建特征空間,選擇k最近鄰(k-Nearest Neighbors,kNN)與支持向量機(jī)(Support Vector Machine,SVM)兩種分類模型驗(yàn)證了實(shí)例遷移、模型遷移方法對(duì)YF-77發(fā)動(dòng)機(jī)參數(shù)異常檢測(cè)模型訓(xùn)練和優(yōu)化的有效性。

        1 背景及現(xiàn)狀

        1.1 火箭發(fā)動(dòng)機(jī)參數(shù)評(píng)估內(nèi)容

        火箭發(fā)動(dòng)機(jī)包括渦輪泵、燃燒室等部件,每個(gè)部件上安裝有不同傳感器,分別測(cè)量不同的指標(biāo)(如溫度、壓力、流量),業(yè)內(nèi)通常稱為遙測(cè)參數(shù)(或參數(shù)),通常一次飛行任務(wù)中與發(fā)動(dòng)機(jī)有關(guān)的參數(shù)個(gè)數(shù)在2 000~2 500。

        發(fā)動(dòng)機(jī)工作主要有三種過(guò)程(或狀態(tài)),分別為啟動(dòng)、額定工作(或滿工況)和關(guān)機(jī)過(guò)程。圖1 展示了三種過(guò)程的異常檢測(cè)步驟。

        圖1 在各個(gè)過(guò)程檢測(cè)發(fā)動(dòng)機(jī)參數(shù)狀態(tài)Fig.1 Checking engine parameter status in different processes

        其中啟動(dòng)、關(guān)機(jī)過(guò)程是十分復(fù)雜的瞬變過(guò)程,短時(shí)間內(nèi)大量參數(shù)會(huì)發(fā)生劇烈變化,實(shí)踐表明發(fā)動(dòng)機(jī)的大部分故障都發(fā)生在這樣的瞬變過(guò)程[7]。三類過(guò)程都有固有的關(guān)鍵指標(biāo)來(lái)描述其狀態(tài),以氧泵轉(zhuǎn)速的啟動(dòng)過(guò)程為例,表1 展示了其關(guān)鍵指標(biāo)、物理意義及指標(biāo)異常的潛在典型故障模式。

        表1 氧泵轉(zhuǎn)速啟動(dòng)過(guò)程的關(guān)鍵指標(biāo)Tab.1 Key indicators of oxygen pump speed in startup

        1.2 參數(shù)異常檢測(cè)方法現(xiàn)狀

        紅線法、專家系統(tǒng)和機(jī)器學(xué)習(xí)是火箭參數(shù)異常檢測(cè)中常用的三類方法:

        1)紅線法包括閾值法和包絡(luò)法,前者是不帶時(shí)間維的理論常量區(qū)間;后者根據(jù)歷史正常數(shù)據(jù)生成帶時(shí)間維度的包絡(luò)上下限。

        2)專家系統(tǒng),是由火箭領(lǐng)域?qū)<彝ㄟ^(guò)領(lǐng)域知識(shí)和經(jīng)驗(yàn)得到的狀態(tài)判決規(guī)則[8]。

        3)國(guó)內(nèi)從20 世紀(jì)90 年代開始至今,先后應(yīng)用SVM、神經(jīng)網(wǎng)絡(luò)和時(shí)間序列分析等方法開展對(duì)發(fā)動(dòng)機(jī)故障檢測(cè)與診斷的研究[9-10]。

        以上方法都有著各自的特點(diǎn)和適用情況。閾值法丟失了時(shí)間維,常用于檢測(cè)當(dāng)前時(shí)刻的狀態(tài),且精度不高[11];包絡(luò)法則受樣本規(guī)模和方法本身的制約,假陽(yáng)性和假陰性現(xiàn)象嚴(yán)重。紅線法還對(duì)噪聲敏感,難以適用于參數(shù)規(guī)模大或者樣本少等情況,檢測(cè)誤差一般較大:如果誤判會(huì)加重人工篩選的負(fù)擔(dān),提高了人力成本;如果漏判則降低了方法可信度,增加了飛行風(fēng)險(xiǎn)。

        專家系統(tǒng)則受制于專家知識(shí),發(fā)動(dòng)機(jī)系統(tǒng)覆蓋學(xué)科領(lǐng)域廣泛,知識(shí)表述困難。規(guī)則建立過(guò)程復(fù)雜耗時(shí),規(guī)則質(zhì)量受專家能力和經(jīng)驗(yàn)制約;規(guī)則對(duì)技術(shù)狀態(tài)變化敏感,導(dǎo)致了專家規(guī)則更新維護(hù)代價(jià)高昂。

        機(jī)器學(xué)習(xí)方法則主要受制于樣本規(guī)模和質(zhì)量[11],航天領(lǐng)域單型號(hào)尤其新型發(fā)動(dòng)機(jī)的樣本較少,而且數(shù)據(jù)的采集、分類和處理標(biāo)準(zhǔn)也不夠規(guī)范統(tǒng)一,導(dǎo)致預(yù)處理難度大,這些都嚴(yán)重阻礙了大規(guī)模的表征學(xué)習(xí)和模型訓(xùn)練[2]。

        2 基于遷移學(xué)習(xí)的參數(shù)異常檢測(cè)

        遷移學(xué)習(xí)的目的就是設(shè)法將相近或相似領(lǐng)域的數(shù)據(jù)、知識(shí)等信息實(shí)現(xiàn)共用,一般將遷移信息的來(lái)源稱為遷移領(lǐng)域,將遷移信息的去向稱為目標(biāo)領(lǐng)域,來(lái)解決目標(biāo)領(lǐng)域樣本規(guī)模不足給模型訓(xùn)練帶來(lái)的制約,從而有效解決小樣本領(lǐng)域應(yīng)用機(jī)器學(xué)習(xí)的困境[11-14]。按照遷移的信息內(nèi)容可以分為實(shí)例遷移、特征遷移、模型遷移、關(guān)系遷移[11]。目前遷移學(xué)習(xí)的有效性已經(jīng)在圖像檢索、語(yǔ)音識(shí)別、文本分類和語(yǔ)義分析等領(lǐng)域得到充分的驗(yàn)證[15-17],在航天領(lǐng)域應(yīng)用還處于起步階段。

        YF-77 液體火箭發(fā)動(dòng)機(jī)作為新型發(fā)動(dòng)機(jī),樣本規(guī)模太少,異常檢測(cè)分類模型無(wú)法進(jìn)行有效的訓(xùn)練,因此本文引入成熟型號(hào)YF-75發(fā)動(dòng)機(jī)的樣本數(shù)據(jù)和其異常檢測(cè)模型等信息遷移到Y(jié)F-77領(lǐng)域,實(shí)現(xiàn)發(fā)動(dòng)機(jī)參數(shù)異常檢測(cè),以完成火箭飛行階段的狀態(tài)監(jiān)測(cè),為指揮決策和故障診斷提供輔助的支撐信息。

        在具體遷移的實(shí)踐中,將面臨如下問(wèn)題:

        1)YF-75與YF-77兩型發(fā)動(dòng)機(jī)的相似性;

        2)如何處理兩個(gè)領(lǐng)域之間的差異;

        3)如何構(gòu)建有效的特征向量;

        4)選擇恰當(dāng)?shù)臋C(jī)器學(xué)習(xí)分類模型;

        5)使用何種遷移方法。

        本文將分別在2.1、2.2、2.3、2.4、3.1 節(jié)詳細(xì)論述以上問(wèn)題。

        2.1 兩型發(fā)動(dòng)機(jī)的相似性分析

        為面向現(xiàn)實(shí)應(yīng)用需求,本文以YF-75 和YF-77 型液體發(fā)動(dòng)機(jī)分別作為遷移領(lǐng)域和目標(biāo)領(lǐng)域,其中YF-75 型發(fā)動(dòng)機(jī)執(zhí)行任務(wù)次數(shù)較多,共有352 個(gè)樣本;而YF-77 是近年研制成熟的新型發(fā)動(dòng)機(jī),目前僅有24個(gè)樣本。

        根據(jù)這兩型發(fā)動(dòng)機(jī)的設(shè)計(jì)原理,它們都屬于氫氧發(fā)動(dòng)機(jī),燃燒方式都是燃?xì)獍l(fā)生器循環(huán),并且具有相同的分系統(tǒng)構(gòu)造,主要性能如比沖、推進(jìn)劑混合比等相近,二者的共有參數(shù)占YF-77 所有參數(shù)的58%,其中關(guān)鍵參數(shù)更是高達(dá)73%,且這些參數(shù)在啟動(dòng)、額定工作和關(guān)機(jī)三個(gè)過(guò)程中具有相同的變化趨勢(shì),只是在具體數(shù)值上有差別。

        以氧泵轉(zhuǎn)速為例,它是專家評(píng)估發(fā)動(dòng)機(jī)狀態(tài)時(shí)首要關(guān)注的參數(shù)之一,并常使用{啟動(dòng)時(shí)長(zhǎng),最終穩(wěn)定值,(最終穩(wěn)定值-起始數(shù)據(jù)值)/相應(yīng)時(shí)間差,相鄰數(shù)據(jù)點(diǎn)斜率之平均值,相鄰數(shù)據(jù)點(diǎn)斜率之標(biāo)準(zhǔn)差}五個(gè)特征值作為評(píng)價(jià)泵轉(zhuǎn)速的主要依據(jù),記為{T,R,d(R),E(d),S(d)}。其樣本已經(jīng)基于專家系統(tǒng)對(duì)其進(jìn)行正常與異常的二分類標(biāo)注,表2展示了兩型發(fā)動(dòng)機(jī)五個(gè)特征值在正常和異常下的區(qū)間變化情況(數(shù)據(jù)經(jīng)變換已脫密)。

        計(jì)算兩發(fā)動(dòng)機(jī)之間各特征值正常樣本區(qū)間的左邊界數(shù)值的差距除以兩個(gè)左邊界數(shù)值的平均值依次是17.74%、1.85%、6.62%、4.41%、17.16%,右邊界依次是2.11%、0.66%、1.07%、3.89%、12.40%;二者異常樣本區(qū)間的分布都明顯異于正常樣本,且各特征值異常樣本區(qū)間的左邊界差距除以兩個(gè)左邊界數(shù)值的平均值依次是9.22%、23.92%、11.35%、5.96%、20.56%,右邊界依次是6.90%、0.40%、5.47%、11.99%、7.92%。從原理、構(gòu)造和數(shù)據(jù)統(tǒng)計(jì)的角度都說(shuō)明了兩型發(fā)動(dòng)機(jī)的相似性,本文還將在第3 章的實(shí)驗(yàn)中充分驗(yàn)證遷移的有效性。

        表2 YF-75和YF-77氧泵轉(zhuǎn)速正常、異常樣本數(shù)值區(qū)間Tab.2 Value ranges of normal and abnormal samples of oxygen pump speed in YF-75 and YF-77

        2.2 針對(duì)數(shù)據(jù)差異進(jìn)行預(yù)處理

        2.2.1 時(shí)間對(duì)齊

        不同任務(wù)中各發(fā)動(dòng)機(jī)的T0(發(fā)動(dòng)機(jī)點(diǎn)火啟動(dòng)的時(shí)刻)是互不相同的,為了保證各時(shí)間序列的開始時(shí)刻對(duì)齊,需要將啟動(dòng)過(guò)程樣本中所有時(shí)間記錄值都減去對(duì)應(yīng)的T0,使得每個(gè)樣本都以0 s為開始。

        2.2.2 數(shù)據(jù)歸一化

        相同類型參數(shù)在不同發(fā)動(dòng)機(jī)中,其設(shè)計(jì)額定工作值可能存在差異;即使在同型號(hào)發(fā)動(dòng)機(jī)的不同飛行任務(wù)中,其實(shí)際額定工作值也不完全一致。為了關(guān)注變化趨勢(shì),本研究對(duì)每段數(shù)據(jù)樣本進(jìn)行歸一化處理:對(duì)同一型號(hào)發(fā)動(dòng)機(jī),首先篩選所有啟動(dòng)過(guò)程正常的參數(shù)樣本,去除噪聲后,獲取其中各樣本的最大值和最小值,分別記為MAXrated和MINrated;然后以“MINrated值轉(zhuǎn)換為0,MAXrated值轉(zhuǎn)換為1”作為縮放標(biāo)準(zhǔn),預(yù)處理所有樣本(包括正常和異常)啟動(dòng)過(guò)程的時(shí)間序列值,例如對(duì)于任意value值,它將被歸一化為:

        2.3 特征空間構(gòu)建

        本文希望找到恰當(dāng)?shù)奶卣飨蛄?,它既能區(qū)分正常與異常樣本的特征,又能同時(shí)刻畫出該參數(shù)在不同領(lǐng)域的變化趨勢(shì)。

        2.3.1 特征對(duì)正常與異常的區(qū)分性

        國(guó)內(nèi)研究人員曾對(duì)氫氧發(fā)動(dòng)機(jī)的故障模式做出分類和仿真[1],從已有故障模式中總結(jié)出與氧泵轉(zhuǎn)速有關(guān)的6種典型異常表征,如表3 所示,同時(shí)基于領(lǐng)域知識(shí)將異常表征現(xiàn)象與表1 中啟動(dòng)過(guò)程發(fā)動(dòng)關(guān)鍵指標(biāo)、專家系統(tǒng)的五個(gè)特征值做出關(guān)聯(lián)對(duì)應(yīng)。

        以YF-75 型發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速為例,針對(duì)每一類異常表征取一個(gè)異常樣本,同時(shí)取一個(gè)正常樣本作對(duì)比,如圖2所示。

        圖2 YF-75型啟動(dòng)過(guò)程氧泵轉(zhuǎn)速正常樣本與異常樣本之間的時(shí)間序列數(shù)據(jù)曲線對(duì)比Fig.2 Curve comparison of time series data of normal and abnormal samples of oxygen pump speed during YF-75 startup

        為進(jìn)一步驗(yàn)證專家常用的5 個(gè)特征值的有效性,本研究在此基礎(chǔ)上,再添加{平均值,最大值,最小值,(最大值-最小值)/相應(yīng)時(shí)間差,標(biāo)準(zhǔn)差}這些常見的統(tǒng)計(jì)特征,分別記作{E,Max,Min,d(M),S},共組成一個(gè)10 維向量,然后進(jìn)行偏最小二乘回歸(Partial Least Squares Regression,PLSR)分析,如圖3所示,得到不同特征與樣本標(biāo)注的相關(guān)性。

        圖3 YF-75發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速的PLSR結(jié)果Fig.3 PLSR results of YF-75 oxygen pump speed

        表3 典型的異常表征現(xiàn)象及對(duì)應(yīng)的啟動(dòng)關(guān)鍵指標(biāo)和專家特征值Tab.3 Classic abnormal representation phenomena and corresponding key indicators,expert feature values

        可以看出,對(duì)于氧泵轉(zhuǎn)速而言,{T,R,d(R),E(d),S(d)}確實(shí)與標(biāo)注結(jié)果的相關(guān)性更大;因此該特征向量滿足了物理意義和統(tǒng)一意義上的解釋,能夠區(qū)分正常與異常樣本的不同。

        2.3.2 刻畫兩個(gè)領(lǐng)域的趨勢(shì)

        目前仍需明確該特征向量是否能夠較好地同時(shí)刻畫出該參數(shù)在不同領(lǐng)域的變化趨勢(shì),從而確定這一特征向量在遷移過(guò)程中能否有效發(fā)揮作用。首先由表2可以看出,在YF-75和YF-77 發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速樣本集之間,用該特征向量表示的正常樣本區(qū)間是相似的,異常樣本區(qū)間也是相似的。

        而除了這些領(lǐng)域?qū)I(yè)知識(shí)和統(tǒng)計(jì)信息,本研究通過(guò)第3章設(shè)計(jì)的遷移實(shí)驗(yàn)來(lái)驗(yàn)證:如果有遷移的機(jī)器學(xué)習(xí)方法優(yōu)于無(wú)遷移的機(jī)器學(xué)習(xí)方法,則可以說(shuō)明這個(gè)特征向量能夠刻畫兩個(gè)領(lǐng)域的變化趨勢(shì)并有效地用于遷移學(xué)習(xí)中。

        2.4 異常檢測(cè)分類模型

        遷移學(xué)習(xí)的目的是解決傳統(tǒng)機(jī)器學(xué)習(xí)在小樣本領(lǐng)域的性能,因此依然需要選擇合適的機(jī)器學(xué)習(xí)算法,基于已有的研究[1,9],本文選用的是kNN和SVM算法。

        2.4.1kNN分類模型

        kNN算法的步驟如下所示:

        輸入:特征向量表示的氧泵轉(zhuǎn)速訓(xùn)練樣本集、測(cè)試樣本集;

        輸出:測(cè)試樣本集的kNN分類結(jié)果正確率。

        1)對(duì)某測(cè)試樣本,計(jì)算與各訓(xùn)練樣本的距離,按距離從小到大進(jìn)行排序;

        2)選取距離最小的k個(gè)訓(xùn)練樣本(本文實(shí)驗(yàn)中取k=3);

        3)確定前k個(gè)訓(xùn)練樣本中,兩個(gè)類別的出現(xiàn)頻率;

        4)將出現(xiàn)頻率最高的類別作為該測(cè)試樣本分類結(jié)果;

        5)重復(fù)步驟1)~4),得到測(cè)試集的所有分類結(jié)果,與已有標(biāo)注比對(duì)計(jì)算正確率。

        其中kNN 算法里的距離度量使用的是標(biāo)準(zhǔn)化歐氏距離,設(shè)樣本1 的特征向量為A=(a1,a2,a3,a4,a5),樣本2 的特征向量為B=(b1,b2,b3,b4,b5),si是樣本集的第i維特征值的標(biāo)準(zhǔn)差,其二者距離d(A,B)計(jì)算公式如下:

        2.4.2 SVM分類模型

        SVM算法的步驟如下所示:

        輸入:特征向量表示的氧泵轉(zhuǎn)速訓(xùn)練樣本集、測(cè)試樣本集;

        輸出:測(cè)試樣本集的SVM分類結(jié)果正確率。

        1)構(gòu)建SVM優(yōu)化函數(shù);

        2)使用SMO 算法基于訓(xùn)練集求解SVM 模型的二分類分界面參數(shù);

        3)對(duì)某測(cè)試樣本,通過(guò)已建立模型計(jì)算得到分類值;

        4)如果分類值大于0,則判定該測(cè)試樣本屬于第1 類,否則屬于第二類;

        5)重復(fù)步驟3)~4),得到測(cè)試集所有分類結(jié)果,與標(biāo)注并比對(duì)計(jì)算正確率。

        設(shè)訓(xùn)練樣本數(shù)量為n,特征矩陣為X=(x1,x2,…,xn),標(biāo)簽向量為Y=(y1,y2,…,yn),求解滿足式(2)中優(yōu)化函數(shù)的W和b,即可得到SVM的超分類平面XTW+b=0。

        3 實(shí)驗(yàn)及分析

        3.1 實(shí)驗(yàn)設(shè)置

        待研究對(duì)象是YF-77 型發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速,其樣本規(guī)模較小,是目標(biāo)領(lǐng)域;遷移領(lǐng)域是YF-75 型發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速樣本集,其規(guī)模較大。首先以傳統(tǒng)的包絡(luò)法為比較對(duì)象,驗(yàn)證kNN和SVM(本文使用的訓(xùn)練集與測(cè)試集均為噪聲較大的飛行實(shí)戰(zhàn)數(shù)據(jù),復(fù)現(xiàn)的SVM 實(shí)驗(yàn)精度略低于文獻(xiàn)[9]中采用仿真和試車數(shù)據(jù)的結(jié)果)算法在大樣本數(shù)據(jù)集中確實(shí)有優(yōu)于包絡(luò)法的表現(xiàn),見對(duì)照實(shí)驗(yàn)1 和2;然后觀察這兩個(gè)算法在小樣本領(lǐng)域是否優(yōu)于包絡(luò)法,見對(duì)照實(shí)驗(yàn)3和4,如果并不優(yōu)于,再使用遷移方法,觀測(cè)實(shí)驗(yàn)5和6對(duì)比遷移是否有效。

        在具體的遷移方法上,本文使用了基于實(shí)例、基于模型的遷移,其流程如圖4所示。實(shí)例遷移是將YF-75發(fā)動(dòng)機(jī)氧泵轉(zhuǎn)速的樣本實(shí)例作為信息,在YF-77 模型建立前作為異常檢測(cè)分類模型的數(shù)據(jù)輸入;模型遷移是將YF-75 已經(jīng)建立好的異常檢測(cè)分類模型作為信息,傳遞給YF-77領(lǐng)域使用;最終都需要通過(guò)測(cè)試集對(duì)比結(jié)果計(jì)算性能。

        圖4 基于實(shí)例和基于模型的遷移學(xué)習(xí)流程Fig.4 Flowcharts of transfer learning based on instance and transfer learning based on model

        圖5 直觀地展示了實(shí)驗(yàn)設(shè)置與流程,表4 和表5 詳細(xì)介紹了各實(shí)驗(yàn)組的內(nèi)容。為了通過(guò)對(duì)比檢驗(yàn)遷移策略的有效性,需要設(shè)定能夠合理評(píng)價(jià)模型異常檢測(cè)性能的標(biāo)準(zhǔn)。

        圖5 實(shí)驗(yàn)設(shè)置與流程Fig.5 Experimental setting and process

        為了更完備地發(fā)現(xiàn)所有異常狀態(tài),希望評(píng)估系統(tǒng)首先盡量不遺漏任何可能的異常,同時(shí)不應(yīng)隨意提示異常,否則會(huì)導(dǎo)致下一步耗費(fèi)大量人工篩選成本。因此實(shí)驗(yàn)以漏報(bào)率(Missing_Alarm)和誤報(bào)率(False_Alarm)作為“異常狀態(tài)篩選性能”的評(píng)判指標(biāo)。

        假設(shè)有NN個(gè)類別為Normal(正常)的樣本被分類為Normal,有AN個(gè)類別為Normal 的樣本被分類為Abnormal;有AA個(gè)類別為Abnormal(異常)的樣本被分類為Abnormal,有NA個(gè)類別為Abnormal的樣本被分類為Normal,漏報(bào)率和誤報(bào)率的計(jì)算公式分別如下:

        漏報(bào)率計(jì)算多少異常樣本被模型遺漏,誤報(bào)率關(guān)注多少正常樣本被模型誤認(rèn)為異常。理想情況下,這兩個(gè)指標(biāo)都等于零,但實(shí)際中二者是很難同時(shí)降低的,漏報(bào)率的降低一般帶來(lái)誤報(bào)率的增長(zhǎng),誤報(bào)率的降低往往導(dǎo)致漏報(bào)率的增長(zhǎng)。綜上,對(duì)于火箭發(fā)動(dòng)機(jī)而言,一個(gè)好的參數(shù)異常檢測(cè)系統(tǒng),應(yīng)首先滿足低漏報(bào)率,再盡量滿足低誤報(bào)率。

        表4 包絡(luò)法與無(wú)遷移機(jī)器學(xué)習(xí)在不同規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)設(shè)置對(duì)比Tab.4 Experimental setting comparison of envelope method and traditional machine learning on different scale datasets

        表5 包絡(luò)法、無(wú)遷移機(jī)器學(xué)習(xí)和遷移學(xué)習(xí)在目標(biāo)領(lǐng)域上的實(shí)驗(yàn)設(shè)置對(duì)比Tab.5 Experimental setting comparison of envelope method,traditional machine learning and transfer learning in target domain

        3.2 結(jié)果分析

        實(shí)驗(yàn)結(jié)果如表6 和表7 所示,通過(guò)觀察對(duì)比,由表6 可得到:

        1)在包絡(luò)法中,當(dāng)數(shù)據(jù)量增多時(shí),誤報(bào)率會(huì)降低,但漏報(bào)率會(huì)增長(zhǎng),說(shuō)明隨著標(biāo)注正常樣本的增多,包絡(luò)上限會(huì)升高,包絡(luò)下限會(huì)降低,導(dǎo)致可能更多的異常樣本被包絡(luò)涵蓋。

        2)當(dāng)數(shù)據(jù)規(guī)模較大時(shí),無(wú)遷移kNN、SVM 方法的漏報(bào)率(10.23%、12.50%)、誤報(bào)率(9.97%、9.31%),分別低于包絡(luò)法的漏報(bào)率(59.09%)、誤報(bào)率(26.88%),說(shuō)明提取的特征向量可以較好體現(xiàn)正常樣本與異常樣本的區(qū)別。

        3)當(dāng)數(shù)據(jù)規(guī)模較小時(shí),無(wú)遷移kNN、SVM 方法的漏報(bào)率(58.33%、41.67%)和誤報(bào)率(41.67%、60.83%),都比數(shù)據(jù)規(guī)模較大時(shí)相應(yīng)地要高,說(shuō)明無(wú)遷移的kNN、SVM方法受制于數(shù)據(jù)規(guī)模,當(dāng)數(shù)據(jù)集較小時(shí)難以發(fā)揮效果。

        4)即使表現(xiàn)最好的對(duì)照實(shí)驗(yàn)2,依然存在漏報(bào)和誤報(bào)的樣本,觀察每次kNN、SVM 的漏報(bào)和誤報(bào)樣本,都處在決策邊界附近,說(shuō)明當(dāng)前提取的特征未能完美區(qū)分出一些特殊樣本,后續(xù)實(shí)驗(yàn)可以嘗試通過(guò)修改特征權(quán)重調(diào)整決策邊界。

        由表7可以得到:

        5)觀測(cè)實(shí)驗(yàn)5 的漏報(bào)率(14.00%、18.00%)和觀測(cè)實(shí)驗(yàn)6的漏報(bào)率(12.50%、25.00%),都低于對(duì)照實(shí)驗(yàn)3、4 漏報(bào)率的最小值(33.33%);觀測(cè)實(shí)驗(yàn)5 的誤報(bào)率(17.68%、13.53%)和觀測(cè)實(shí)驗(yàn)6的誤報(bào)率(22.22%、14.29%),都低于對(duì)照實(shí)驗(yàn)3、4誤報(bào)率的最小值(41.67%);說(shuō)明基于實(shí)例和基于模型的遷移策略都能提高kNN、SVM模型的分類性能。

        6)兩個(gè)遷移學(xué)習(xí)組的漏報(bào)率和誤報(bào)率都略高于YF-75 的無(wú)遷移機(jī)器學(xué)習(xí)組,且基于實(shí)例的kNN 和SVM 表現(xiàn)略優(yōu)于基于模型的相應(yīng)方法。對(duì)于模型遷移而言,可能是沒有調(diào)整參數(shù),下一步可以比較調(diào)整不同參數(shù)對(duì)模型遷移的影響;對(duì)于實(shí)例遷移而言,原因可能是目標(biāo)領(lǐng)域和遷移領(lǐng)域樣本使用的是相同權(quán)重,下一步可以比較調(diào)整不同權(quán)重對(duì)實(shí)例遷移的影響。

        7)觀測(cè)實(shí)驗(yàn)5和6同樣存在漏報(bào)和誤報(bào)的樣本,其原因可能包括特征權(quán)重,以及遷移過(guò)程中的樣本權(quán)重或者模型參數(shù)。

        表6 包絡(luò)法與無(wú)遷移機(jī)器學(xué)習(xí)在不同規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比Tab.6 Experimental result comparison of envelope method and traditional machine learning on different scale datasets

        表7 包絡(luò)法、無(wú)遷移機(jī)器學(xué)習(xí)和遷移學(xué)習(xí)在目標(biāo)領(lǐng)域上的對(duì)比實(shí)驗(yàn)結(jié)果Tab.7 Experimental result comparison of envelope method,traditional machine learning and transfer learning in target domain

        3.3 結(jié)論

        由實(shí)驗(yàn)結(jié)果分析可以得出結(jié)論:

        1)包絡(luò)法在不同量級(jí)樣本的領(lǐng)域中都具有局限性;

        2)無(wú)遷移的機(jī)器學(xué)習(xí)方法適合大樣本集的參數(shù)異常檢測(cè),而在小樣本領(lǐng)域具有局限性;

        3)在數(shù)據(jù)量較少的YF-77 型發(fā)動(dòng)機(jī)小樣本領(lǐng)域,經(jīng)過(guò)時(shí)間對(duì)齊、數(shù)據(jù)歸一化得到樣本,經(jīng)過(guò)特征空間構(gòu)建得到特征向量后,使用基于實(shí)例遷移的kNN、SVM機(jī)器學(xué)習(xí)方法對(duì)氧泵轉(zhuǎn)速建立分類模型,在測(cè)試集的漏報(bào)率相比無(wú)遷移的kNN、SVM分別降低了44.33 個(gè)百分點(diǎn)、23.67 個(gè)百分點(diǎn),平均34.00 個(gè)百分點(diǎn),誤報(bào)率分別降低了23.99個(gè)百分點(diǎn)、47.30個(gè)百分點(diǎn),平均35.64 個(gè)百分點(diǎn);使用基于模型遷移的kNN、SVM 建立的模型,在測(cè)試集的漏報(bào)率相比無(wú)遷移的kNN、SVM分別降低了45.83 個(gè)百分點(diǎn)、16.67 個(gè)百分點(diǎn),平均31.25 個(gè)百分點(diǎn),誤報(bào)率分別降低了19.45 個(gè)百分點(diǎn)、46.54 個(gè)百分點(diǎn),平均32.99個(gè)百分點(diǎn)。圖6 使用直方圖更加直觀展示了實(shí)驗(yàn)結(jié)果,兩種遷移方法都比相應(yīng)無(wú)遷移的方法,在漏報(bào)率和誤報(bào)率上降低了30個(gè)以上的百分點(diǎn),模型性能得到較顯著的提升。

        圖6 無(wú)遷移、基于遷移的分類模型漏報(bào)率和誤報(bào)率Fig.6 Missing and false alarm rates of classification models without and based on transfer

        4 結(jié)語(yǔ)

        本文探索了YF-75 與YF-77 兩型氫氧發(fā)動(dòng)機(jī)之間的共性知識(shí)及可遷移性,通過(guò)構(gòu)建合適的特征空間,采用實(shí)例遷移和模型遷移的方法,以YF-75、YF-77 型發(fā)動(dòng)機(jī)啟動(dòng)過(guò)程氧泵轉(zhuǎn)速數(shù)據(jù)集為例,通過(guò)設(shè)置四組實(shí)驗(yàn)有效驗(yàn)證了相比包絡(luò)法和無(wú)遷移對(duì)照,遷移對(duì)照組的kNN、SVM分類器在異常檢測(cè)的精度上得到極大提高。

        雖然驗(yàn)證了遷移的有效性,但仍存在如下問(wèn)題亟待解決:

        1)目前只關(guān)注單個(gè)參數(shù)的異常檢測(cè),而沒有對(duì)發(fā)動(dòng)機(jī)的狀態(tài)進(jìn)行評(píng)估,發(fā)動(dòng)機(jī)狀態(tài)是由多個(gè)參數(shù)聯(lián)合決定的,因此需要采用分層的方式提取特征,下一步將嘗試在遷移的前提下利用神經(jīng)網(wǎng)絡(luò)來(lái)解決這一問(wèn)題。

        2)不同參數(shù)之間存在各類關(guān)聯(lián),例如因果、并發(fā)、冗余關(guān)系,下一步試圖通過(guò)關(guān)聯(lián)規(guī)則挖掘來(lái)獲得參數(shù)間的關(guān)聯(lián)關(guān)系,進(jìn)一步從數(shù)據(jù)的角度去發(fā)掘發(fā)動(dòng)機(jī)技術(shù)特點(diǎn)。

        3)遷移的內(nèi)容還包括特征向量、特征權(quán)重、參數(shù)權(quán)重、參數(shù)關(guān)系等,下一步將研究特征、關(guān)系的遷移學(xué)習(xí)對(duì)目標(biāo)領(lǐng)域的建模影響。

        猜你喜歡
        誤報(bào)率漏報(bào)發(fā)動(dòng)機(jī)
        基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測(cè)分析
        基于SSA-SVM的網(wǎng)絡(luò)入侵檢測(cè)研究
        家用燃?xì)鈭?bào)警器誤報(bào)原因及降低誤報(bào)率的方法
        煤氣與熱力(2021年6期)2021-07-28 07:21:40
        發(fā)動(dòng)機(jī)空中起動(dòng)包線擴(kuò)展試飛組織與實(shí)施
        各類氣體報(bào)警器防誤報(bào)漏報(bào)管理系統(tǒng)的應(yīng)用
        神經(jīng)網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)入侵檢測(cè)模型及系統(tǒng)中的應(yīng)用
        新一代MTU2000發(fā)動(dòng)機(jī)系列
        傳染病漏報(bào)原因分析及對(duì)策
        日本廠商在美漏報(bào)事故千余起被指管理疏漏
        歷次人口普查中低年齡組人口漏報(bào)研究
        国产乱子乱人伦电影在线观看| 亚洲天堂av一区二区| 欧洲美熟女乱又伦av影片| 国产sm调教视频在线观看| 久久无码精品精品古装毛片| 日本大胆人体亚裔一区二区| 日本一区二区在线高清观看| 精品无码久久久久久国产| 国产美女精品aⅴ在线| 久久精品国产亚洲av高清蜜臀 | 亚洲精品久久区二区三区蜜桃臀| 亚洲欧洲日产国码无码久久99| 无码伊人久久大杳蕉中文无码 | 亚洲youwu永久无码精品| 无码人妻av一区二区三区蜜臀 | 精品国产AⅤ一区二区三区V免费| 日本女同性恋一区二区三区网站| 人妻精品久久久久中文字幕| av无码久久久久久不卡网站| 无码伊人久久大蕉中文无码| 91偷自国产一区二区三区| 色综合久久精品亚洲国产| 日韩久久一级毛片| 区三区久久精品水蜜桃av| 99久久99久久精品国产片| 国产无遮挡裸体免费视频| 国产精品18久久久久久首页| 精品少妇人妻av一区二区蜜桃| 色视频综合无码一区二区三区| 亚洲91av| 精品自拍偷拍一区二区三区| 亚洲国产精品18久久久久久| 色婷婷久久一区二区三区麻豆 | 人妻露脸国语对白字幕| 成年美女黄的视频网站| 人妻被黑人粗大的猛烈进出| 国产小车还是日产的好| 女同视频一区二区在线观看| 亚洲av无码精品色午夜| 天天射色综合| 精品人妻av一区二区三区麻豆|