曾魁魁,鄭直,姜萬錄,馮立艷
(1.華北理工大學(xué)機(jī)械工程學(xué)院,河北唐山 063210;2.燕山大學(xué),河北省重型機(jī)械流體動(dòng)力傳輸與控制重點(diǎn)實(shí)驗(yàn)室,河北秦皇島 066004;3.燕山大學(xué),先進(jìn)鍛壓成形技術(shù)與科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,河北秦皇島 066004)
齒輪和滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械的核心元件,在整個(gè)設(shè)備的動(dòng)力傳動(dòng)中起著重要作用,被廣泛地應(yīng)用于汽車制造、船舶制造和航空航天等重要領(lǐng)域。然而由于工業(yè)生產(chǎn)的需要,其工作環(huán)境變得越來越復(fù)雜,長時(shí)間處于高溫高壓環(huán)境下加速了設(shè)備性能的退化。其失效不僅會引起重大的經(jīng)濟(jì)損失,甚至?xí)?dǎo)致人員傷亡。因此,對齒輪和滾動(dòng)軸承等元件進(jìn)行狀態(tài)檢測和故障診斷十分有必要[1-4]。
多任務(wù)學(xué)習(xí)作為深度學(xué)習(xí)方法的一種,通過共同訓(xùn)練實(shí)現(xiàn)信息共享,不僅可以同時(shí)解決多個(gè)任務(wù),還能夠利用不同任務(wù)間的相關(guān)信息提高模型的泛化能力。GUO等[5]將振動(dòng)信號、工作條件以及領(lǐng)域知識融合成一個(gè)三維的輸入信號,可以同時(shí)完成軸承故障的診斷和定位任務(wù)。LIU等[6]將速度識別任務(wù)和載荷識別任務(wù)作為2個(gè)輔助任務(wù),利用不同任務(wù)中包含的豐富關(guān)聯(lián)信息提高軸承故障診斷任務(wù)的性能。趙曉平等[7]提出了一種基于多任務(wù)學(xué)習(xí)的故障診斷方法,將齒輪箱的軸承和齒輪作為2個(gè)診斷任務(wù),通過共享層從同一信號中提取出不同目標(biāo)的特征。ZHAO等[8]將深度注意力和點(diǎn)注意力引入到改進(jìn)的可分離卷積模塊中,進(jìn)而提出一種新型的多任務(wù)神經(jīng)網(wǎng)絡(luò),并將齒輪的故障類型和損傷程度作為2個(gè)診斷任務(wù)。雖然多任務(wù)學(xué)習(xí)能夠利用不同任務(wù)間的相關(guān)信息來提高模型的泛化能力,但龐大的網(wǎng)絡(luò)模型和冗余的參數(shù)會導(dǎo)致診斷效率降低。因此,對多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行輕量化是十分有必要的。
利用輕量化方法設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),不僅可以減少模型參數(shù)量、降低計(jì)算復(fù)雜度,還能提高診斷的實(shí)時(shí)性。因此,許多學(xué)者基于輕量級卷積神經(jīng)網(wǎng)絡(luò)MobileNetV1、MobileNetV2和MobileNetV3等對滾動(dòng)軸承進(jìn)行故障診斷。YU、 LV[9]提出了一種基于MobileNetV1的故障診斷模型,實(shí)現(xiàn)了端到端的軸承智能故障分類和診斷應(yīng)用。YU等[10]提出一種基于MobileNetV2和Wasserstein距離的非對稱對抗域自適應(yīng)方法,并應(yīng)用于軸承的故障診斷。WU等[11]提出了一種新的自適應(yīng)對數(shù)歸一化方法用于數(shù)據(jù)預(yù)處理,并利用MobileNetV2、MobileNetV3等輕量級神經(jīng)網(wǎng)絡(luò)診斷軸承故障。YAO等[12]提出了一種基于改進(jìn)MobileNetV3的軸承故障診斷方法,并引入一種新的算法Deep SHAP,該模型在診斷的同時(shí)還能將故障特征可視化。
元學(xué)習(xí)作為解決少樣本問題的一種方法,旨在通過學(xué)習(xí)包含少量樣本的相關(guān)任務(wù)獲取先驗(yàn)知識,并利用此知識快速解決新的少樣本任務(wù)。因此,許多學(xué)者使用元學(xué)習(xí)解決少樣本學(xué)習(xí)問題。SU等[13]提出了一種新的數(shù)據(jù)重構(gòu)分層遞歸元學(xué)習(xí)方法,實(shí)現(xiàn)了軸承的少樣本故障診斷。余曉霞等[14]提出了一種基于元學(xué)習(xí)門控神經(jīng)網(wǎng)絡(luò)的齒輪小故障樣本診斷方法,通過門控神經(jīng)網(wǎng)絡(luò)提高了齒輪退化趨勢預(yù)測精度。FENG等[15]提出了一種基于領(lǐng)域?qū)瓜嗨菩缘脑獙W(xué)習(xí)網(wǎng)絡(luò),實(shí)現(xiàn)了軸承的少樣本故障診斷。HU等[16]提出了一種任務(wù)排序元學(xué)習(xí)方法用于軸承少樣本故障診斷,利用K均值聚類算法將元訓(xùn)練階段的任務(wù)從易到難進(jìn)行排序,階梯式的學(xué)習(xí)方式使得任務(wù)之間的適應(yīng)更加穩(wěn)定。
零樣本問題作為少樣本問題的一種特例,可以使模型診斷出從未見過的故障類別。它與少樣本學(xué)習(xí)的區(qū)別是:少樣本中的每種故障類型樣本都存在,但是樣本量少;在零樣本中,某些或者全部故障類型樣本根本不存在。因此,零樣本學(xué)習(xí)比少樣本學(xué)習(xí)更具有挑戰(zhàn)性。許多學(xué)者也對此展開了深入的研究。XING等[17]提出了一種標(biāo)簽描述空間的智能故障診斷方法,用于齒輪單一元件的未知復(fù)合故障零樣本診斷。LV等[18]提出了一種基于混合屬性條件對抗式降噪自編碼器的方法,實(shí)現(xiàn)了軸承單一元件的零樣本故障診斷。XU等[19]提出了一種用于軸承復(fù)合故障診斷的零樣本學(xué)習(xí)方法,實(shí)現(xiàn)了由已知單故障向零樣本復(fù)合故障的單一元件故障診斷。GAO等[20]提出了一種基于壓縮堆疊式自編碼器的零樣本學(xué)習(xí)方法,實(shí)現(xiàn)了軸承單一元件由已知工作負(fù)載向未知工作負(fù)載的零樣本故障診斷。以上關(guān)于零樣本問題的研究都是基于單一元件,而機(jī)械設(shè)備發(fā)生故障常常涉及多個(gè)元件,因此研究跨元件的零樣本問題是很有必要的。
基于上述分析可知,目前還存在如下問題需深入分析:(1)多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)量多大、結(jié)構(gòu)過于復(fù)雜、規(guī)模更為龐大,導(dǎo)致故障診斷實(shí)時(shí)性差;(2)基于多個(gè)故障元件的跨元件零樣本問題更為復(fù)雜,且尚未被研究。
針對上述問題,本文作者提出一種基于元學(xué)習(xí)優(yōu)化的輕量化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)?;贛obileNetV3構(gòu)建輕量化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò),引入元學(xué)習(xí)優(yōu)化上述輕量化網(wǎng)絡(luò)的訓(xùn)練方式,最后進(jìn)行齒輪和滾動(dòng)軸承多元件的實(shí)測故障分析。
多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)是一種可以同時(shí)有效地解決多個(gè)任務(wù)的深度學(xué)習(xí)方法。多任務(wù)學(xué)習(xí)的核心思想是信息共享,即它可以學(xué)習(xí)多個(gè)任務(wù)的共享特性,并且允許此共享信息用于其他任務(wù),從而提高網(wǎng)絡(luò)的泛化能力。
與單任務(wù)學(xué)習(xí)相比,多任務(wù)學(xué)習(xí)可以通過共享層有效地提取多個(gè)任務(wù)之間的共同信息,克服了由于訓(xùn)練樣本不足而導(dǎo)致的模型泛化能力不強(qiáng)的問題。而且多任務(wù)學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合后具有更強(qiáng)的特征學(xué)習(xí)能力,因此在人工智能領(lǐng)域日益流行。單任務(wù)學(xué)習(xí)網(wǎng)絡(luò)和多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)示意如圖1所示。
圖1 單任務(wù)(a)和多任務(wù)(b)學(xué)習(xí)網(wǎng)絡(luò)示意
在多任務(wù)學(xué)習(xí)框架中,一般通過硬參數(shù)共享機(jī)制或軟參數(shù)共享機(jī)制實(shí)現(xiàn)任務(wù)間的信息共享。硬參數(shù)共享是多任務(wù)學(xué)習(xí)中最常見的共享機(jī)制,它通過在共享層進(jìn)行參數(shù)共享、在子任務(wù)層使用獨(dú)有的參數(shù)來實(shí)現(xiàn)。因此,硬參數(shù)共享可以在很大程度上降低過擬合的風(fēng)險(xiǎn)。與硬參數(shù)共享不同,在軟參數(shù)共享中,每個(gè)任務(wù)都有自己模型和參數(shù),在訓(xùn)練過程中需要施加范數(shù)來約束任務(wù)的相似度。因此,軟參數(shù)共享會受到正則化技術(shù)的影響。硬參數(shù)共享和軟參數(shù)共享機(jī)制如圖2所示。
圖2 參數(shù)共享機(jī)制
隨著神經(jīng)網(wǎng)絡(luò)的深度和寬度不斷增加,其參數(shù)量、計(jì)算量以及儲存成本也會隨之增加。龐大的網(wǎng)絡(luò)模型、昂貴的設(shè)備資源使得深度學(xué)習(xí)很難應(yīng)用于移動(dòng)便攜設(shè)備。
MobileNetV1是谷歌提出的第一個(gè)輕量化神經(jīng)網(wǎng)絡(luò),它使用深度可分離卷積代替?zhèn)鹘y(tǒng)卷積,深度可分離卷積由深度卷積和逐點(diǎn)卷積組成,分別用于減少參數(shù)量和調(diào)整通道,進(jìn)而大大降低了參數(shù)量和計(jì)算的復(fù)雜度。MobileNetV2除了沿用MobileNetV1中的深度可分離卷積,還加入了線性瓶頸層和逆向殘差網(wǎng)絡(luò)結(jié)構(gòu),從而構(gòu)成了高效的基本模塊,解決了低維非線性映射的信息丟失問題。
MobileNetV3綜合了MobileNetV1的深度可分離卷積和MobileNetV2的具有線性瓶頸層的逆向殘差網(wǎng)絡(luò)結(jié)構(gòu),并修改了MobileNetV2的網(wǎng)絡(luò)末端,在不損失精度的同時(shí)降低了計(jì)算量。除此之外,還引入了MnasNet的基于壓縮激勵(lì)模塊的輕量化注意力模型和新的非線性激活函數(shù)h-swish,該激活函數(shù)可表示為
(1)
MobileNetV3的基本模塊如圖3所示。
圖3 MobileNetV3的基本模塊
元學(xué)習(xí),也稱學(xué)會學(xué)習(xí),旨在利用先驗(yàn)知識,在僅使用少樣本量的情況下完成新任務(wù)的學(xué)習(xí)。元學(xué)習(xí)是以任務(wù)為基本單元,注重的是學(xué)習(xí)過程而不是單個(gè)任務(wù)結(jié)果。
元學(xué)習(xí)的學(xué)習(xí)方式為:將給定服從P(T)的任務(wù)集劃分為元訓(xùn)練集和元測試集,它們都包含大量的N-wayK-shot任務(wù),N表示每個(gè)任務(wù)中包含的類別數(shù)量,K表示從每種類別中抽取的樣本數(shù)量。因此,每個(gè)任務(wù)中有N×K個(gè)樣本作為支持集并用于訓(xùn)練,另外從每種類別中抽取一定量的樣本作為查詢集并用于測試,元學(xué)習(xí)在訓(xùn)練階段和測試階段均以這種方式進(jìn)行小樣本學(xué)習(xí)。
模型無關(guān)元學(xué)習(xí)(Model-Agnostic Meta-Learning,MAML)是元學(xué)習(xí)中的優(yōu)秀算法之一,旨在找到任務(wù)分布Ti~P(T)中每個(gè)任務(wù)都比較敏感的初始化參數(shù)θ,當(dāng)模型面對新任務(wù)時(shí),通過梯度下降算法來微調(diào)參數(shù)θ,使模型的損失函數(shù)在很少步數(shù)內(nèi)快速收斂。
MAML模型由內(nèi)、外兩層循環(huán)構(gòu)成,形式上,將任務(wù)服從P(T)分布的模型fθ看作是由參數(shù)θ表示的函數(shù)。當(dāng)學(xué)習(xí)新任務(wù)Ti時(shí),模型的參數(shù)經(jīng)過一步或多步梯度下降最終由θ更新為θ′i。其一次梯度更新可表示為
(2)
其中:α代表內(nèi)部學(xué)習(xí)率。
在訓(xùn)練階段,通過優(yōu)化多個(gè)任務(wù)上的fθ′i來更新模型的初始參數(shù),元優(yōu)化目標(biāo)可表示為
(3)
在外循環(huán)中,跨任務(wù)的元優(yōu)化通過隨機(jī)梯度下降實(shí)現(xiàn),初始模型參數(shù)的更新過程可表示為
(4)
文中以MFS-MG實(shí)驗(yàn)臺的齒輪和滾動(dòng)軸承為研究對象。齒輪的轉(zhuǎn)速設(shè)定為2 100 r/min,在采樣頻率為50 kHz時(shí)分別采集缺齒、斷齒和正常的振動(dòng)信號。滾動(dòng)軸承的轉(zhuǎn)速設(shè)定為2 000 r/min,在采樣頻率為12 kHz時(shí)分別采集內(nèi)圈、滾動(dòng)體和正常的振動(dòng)信號。實(shí)驗(yàn)系統(tǒng)如圖4所示。
圖4 齒輪(a)和滾動(dòng)軸承(b)實(shí)驗(yàn)系統(tǒng)
將采集到的一維振動(dòng)信號轉(zhuǎn)換為二維圖像作為樣本數(shù)據(jù)。齒輪和滾動(dòng)軸承的6種故障共計(jì)1 500個(gè)樣本,每個(gè)樣本包含512個(gè)數(shù)據(jù)點(diǎn)。每種故障的樣本數(shù)量為250,按4∶1劃分為訓(xùn)練集和測試集。圖5和圖6分別展示了齒輪和軸承每種故障的樣本。
圖5 齒輪振動(dòng)圖像樣本
圖6 滾動(dòng)軸承振動(dòng)圖像樣本
所提方法的流程如圖7所示。
圖7 所提方法流程
此實(shí)驗(yàn)訓(xùn)練和測試的硬件環(huán)境為i7-9750 CPU、內(nèi)存為16 GB,軟件編程環(huán)境為Python3.7、Pytorch1.5.4。網(wǎng)絡(luò)訓(xùn)練輸入樣本為3通道的RGB圖像,尺寸大小為224像素×224像素。學(xué)習(xí)率為0.01、Batch-size設(shè)置為64,共迭代20個(gè)Epoch。
為了證明基于MobileNetV3構(gòu)建的輕量化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)模型(MT-MNV3)的有效性和優(yōu)越性,分別利用輕量化方法MobileNetV1和MobileNetV2構(gòu)建輕量化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò),將其分別記為MT-MNV1和MT-MNV2。圖8所示為各個(gè)多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)的診斷精度和損失函數(shù)值的變化曲線,表1給出了各個(gè)多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)的具體診斷結(jié)果。
表1 不同多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)模型的診斷結(jié)果
圖8 故障診斷結(jié)果
由圖8可知:MT-MNV3的診斷精度上升速度較快,且迭代到一定次數(shù)后精度最高、最穩(wěn)定。同時(shí),MT-MNV3的初始損失函數(shù)值最小、收斂速度快,并且穩(wěn)定性高。
由表1可知:MT-MNV3在各方面的表現(xiàn)都優(yōu)于MT-MNV1和MT-MNV2。其中,在診斷精度方面,MT-MNV3的平均訓(xùn)練精度較MT-MNV1和MT-MNV2分別提高2.3%、3.1%;平均測試精度較MT-MNV1和MT-MNV2分別提高1.9%、6.1%。
診斷效率方面,MT-MNV3的訓(xùn)練時(shí)間較MT-MNV1和MT-MNV2分別顯著降低42.7%、58.6%;預(yù)測時(shí)間較MT-MNV1和MT-MNV2分別顯著降低38.9%、51.1%。
參數(shù)量、計(jì)算量和模型尺寸方面,MT-MNV3的參數(shù)量較MT-MNV1和MT-MNV2分別顯著降低31.9%、8.9%;計(jì)算量較MT-MNV1和MT-MNV2分別顯著降低90.3%、81.3%;模型尺寸較MT-MNV1和MT-MNV2分別顯著降低31%、9.3%。
由上述可知,MT-MNV3可以同時(shí)實(shí)現(xiàn)齒輪和滾動(dòng)軸承的高精度、高效率的故障診斷,并且模型尺寸小、設(shè)備資源占用量小。實(shí)現(xiàn)了多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)模型的高精度化、輕量化和實(shí)時(shí)性。
受到生產(chǎn)現(xiàn)場和經(jīng)濟(jì)成本的限制,某些或者所有故障類型樣本無法采集,導(dǎo)致出現(xiàn)零樣本問題。
通過上述對比分析證明了MT-MNV3在診斷精度、效率以及輕量化方面的優(yōu)越性。因此,文中利用MAML元學(xué)習(xí)方法對MT-MNV3的訓(xùn)練方式進(jìn)行了改進(jìn),提出一種MT-MNV3-ML方法。
所提方法可根據(jù)以往任務(wù)學(xué)習(xí)經(jīng)驗(yàn),得到一個(gè)對任務(wù)變化敏感的初始參數(shù),從而在面對新的故障診斷任務(wù)時(shí),即使沒有訓(xùn)練樣本,對測試樣本進(jìn)行診斷時(shí),也能獲得較高診斷精度。所提MT-MNV3-ML模型如圖9所示。
圖9 所提MT-MNV3-ML方法
3.2.1 基于元學(xué)習(xí)數(shù)據(jù)集生成N-wayK-shot任務(wù)
將齒輪和滾動(dòng)軸承的6種運(yùn)行狀態(tài)劃分為不同形式的元訓(xùn)練集和元測試集,分別構(gòu)成數(shù)據(jù)集A、B、C和D。并基于各數(shù)據(jù)集的元訓(xùn)練集和元測試集分別生成N-wayK-shot訓(xùn)練任務(wù)和測試任務(wù),N為故障類別數(shù),K為每種故障的樣本數(shù),N越大、K越小說明N-wayK-shot的測試難度越大,可通過不同測試難度來評估診斷模型的泛化能力。在此研究中,齒輪和滾動(dòng)軸承分別有3種故障,N可以設(shè)置為1、2或3,但為了增加診斷難度和展示方法優(yōu)越性,N設(shè)置為3。從每種故障中選擇K個(gè)樣本作為任務(wù)支持集、選取15個(gè)新樣本作為查詢集,其中K分別設(shè)置為1、3、5、7和10。因此,數(shù)據(jù)集A、B、C、D分別都包含3-way 1-shot、3-way 3-shot、3-way 5-shot、3-way 7-shot和3-way 10-shot任務(wù)。
數(shù)據(jù)集A的元訓(xùn)練集缺失了齒輪所有運(yùn)行狀態(tài)樣本,數(shù)據(jù)集D的元訓(xùn)練集缺失了滾動(dòng)軸承所有運(yùn)行狀態(tài)樣本,都屬于嚴(yán)重零樣本問題;數(shù)據(jù)集B和C的元訓(xùn)練集和元測試集分別缺失了某一元件的某一種或多種運(yùn)行狀態(tài)樣本,屬于輕微零樣本問題。傳統(tǒng)零樣本問題基于1個(gè)元件進(jìn)行研究,而文中零樣本問題基于2個(gè)元件進(jìn)行研究,所以統(tǒng)稱為跨元件零樣本問題,文中研究的零樣本問題更具難度。數(shù)據(jù)集如表2所示。
表2 數(shù)據(jù)集劃分
在訓(xùn)練階段,N-wayK-shot任務(wù)的更新步數(shù)和批尺寸分別為5和4,訓(xùn)練步數(shù)為500。內(nèi)部和外部學(xué)習(xí)率分別為0.01和0.001。同時(shí),在給出N-wayK-shot任務(wù)的N和K之后,使用該訓(xùn)練集生成2 000個(gè)N-wayK-shot訓(xùn)練任務(wù)。每個(gè)任務(wù)中的支持集用于訓(xùn)練網(wǎng)絡(luò),然后將查詢集輸入到訓(xùn)練后的網(wǎng)絡(luò)用于測試。
在測試階段,首先利用測試集生成20個(gè)測試任務(wù),每個(gè)任務(wù)中的支持集用于微調(diào)網(wǎng)絡(luò),微調(diào)步數(shù)為10。然后,將查詢集輸入到微調(diào)后的網(wǎng)絡(luò),實(shí)現(xiàn)故障診斷。最后,將上述20個(gè)測試任務(wù)的平均精度作為測試精度。
3.2.2 基于所提方法解決跨元件零樣本問題
利用所提MT-MNV3-ML方法對上述數(shù)據(jù)集A、B、C和D進(jìn)行診斷分析,結(jié)果如表3所示。
表3 數(shù)據(jù)集A、B、C和D下3-way K-shot的故障診斷結(jié)果
由表3中數(shù)據(jù)集B和C的診斷結(jié)果可知:所提方法在解決輕微跨元件零樣本問題時(shí),在3-way 1-shot和3-way 10-shot任務(wù)下獲得的最低診斷精度和最高診斷精度,分別為91.99%和100%。這表明該模型在解決輕微跨元件零樣本問題時(shí),展現(xiàn)了很強(qiáng)的泛化能力,實(shí)現(xiàn)了高精度的故障診斷。
由表3中數(shù)據(jù)集A和D的診斷結(jié)果可知:所提方法在解決嚴(yán)重跨元件零樣本問題時(shí),也在3-way 1-shot和3-way 10-shot任務(wù)下獲得的最低診斷精度和最高診斷精度,分別為75.46%和96.46%。所提方法在解決某一元件缺失所有運(yùn)行狀態(tài)樣本的嚴(yán)重零樣本問題時(shí),依然能夠獲取較高的診斷精度。因此,所提方法具有很強(qiáng)的泛化能力。
綜上可知,所提方法MT-MNV3-ML方法在解決輕微和嚴(yán)重跨元件零樣本問題時(shí),都取得了較高的診斷精度,展現(xiàn)了很強(qiáng)的泛化能力。
3.2.3 所提MT-MNV3-ML的泛化能力分析
由表3的診斷結(jié)果可知,基于數(shù)據(jù)集C和A的診斷結(jié)果分別為最好和最差,而基于數(shù)據(jù)集D的診斷結(jié)果為中等。所以,基于數(shù)據(jù)集D的3-way 5-shot任務(wù),設(shè)置不同的微調(diào)步數(shù)和測試任務(wù)數(shù),進(jìn)一步驗(yàn)證所提MT-MNV3-ML的泛化性能。分析結(jié)果如表4和表5所示。
表4 不同微調(diào)步數(shù)的診斷結(jié)果
由表4中的結(jié)果可知:在僅微調(diào)1步時(shí),即可獲得87.68%的診斷精度;診斷精度隨著微調(diào)步數(shù)的增加而提高,而當(dāng)微調(diào)步數(shù)增加到一定值時(shí),模型精度受微調(diào)步數(shù)的影響就會變得很小。因此,所提MT-MNV3-ML通過少量微調(diào)步數(shù)即可獲取很高的診斷精度,具有很強(qiáng)的泛化能力。
由表5中的結(jié)果可知:診斷精度隨著測試任務(wù)數(shù)的增加而降低,即使在測試任務(wù)集增加到5倍甚至10倍的情況下,也能獲得高達(dá)94.46%的診斷精度。因此,所提MT-MNV3-ML具有很強(qiáng)泛化能力。
文中針對多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)的診斷實(shí)時(shí)性問題和跨元件零樣本問題,提出了一種基于MAML元學(xué)習(xí)優(yōu)化的輕量化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)模型(MT-MNV3-ML),通過對齒輪和滾動(dòng)軸承多元件的實(shí)測故障分析,得出如下結(jié)論:
(1)MobileNetV3有效地減小了網(wǎng)絡(luò)的參數(shù)量、計(jì)算量和模型尺寸,進(jìn)而降低了多任務(wù)診斷網(wǎng)絡(luò)結(jié)構(gòu)的規(guī)模,提高了網(wǎng)絡(luò)診斷實(shí)時(shí)性和準(zhǔn)確性。
(2)解決了跨元件間的零樣本問題。通過引入MAML元學(xué)習(xí)方法優(yōu)化多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練方式,大大提升了網(wǎng)絡(luò)的泛化能力,既可以有效地解決某個(gè)元件缺失某種故障樣本的輕微零樣本問題,又可以解決缺失某個(gè)元件所有故障樣本的嚴(yán)重零樣本問題。