何天放,王 鍇,徐皚冬,曾 鵬
(1.中國(guó)科學(xué)院網(wǎng)絡(luò)化控制系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,遼寧沈陽(yáng) 110016;2.中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所,遼寧沈陽(yáng) 110016;3.中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院,遼寧沈陽(yáng) 110016;4.中國(guó)科學(xué)院大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,北京 100049)
隨著科學(xué)技術(shù)發(fā)展與自動(dòng)化水平不斷提高,電力、化工等工業(yè)領(lǐng)域?qū)τ趦x表的性能要求不斷提升,然而實(shí)際應(yīng)用場(chǎng)景復(fù)雜多變,儀表受到灰塵、老化等因素影響導(dǎo)致其測(cè)量值逐漸偏離實(shí)際值即為漂移故障[1]。控制系統(tǒng)采用異常儀表數(shù)據(jù)進(jìn)行控制將影響正常生產(chǎn),甚至引起事故。因此,對(duì)于儀表輸出數(shù)值漂移故障進(jìn)行診斷具有重要的應(yīng)用與學(xué)術(shù)意義。
為解決溫度儀表漂移故障帶來(lái)的不良影響,工業(yè)領(lǐng)域與學(xué)術(shù)界都做出諸多嘗試,現(xiàn)有的解決方案是工廠運(yùn)維部門定期對(duì)儀表進(jìn)行離線標(biāo)定,此方法雖然能夠較好地保證儀表的精度,但需要工廠停止運(yùn)行,因此嚴(yán)重影響生產(chǎn)效率且費(fèi)時(shí)費(fèi)力。因此能夠?qū)τ跍囟葍x表漂移故障進(jìn)行在線診斷的方式成為學(xué)術(shù)界的關(guān)注焦點(diǎn),通常針對(duì)溫度儀表進(jìn)行漂移故障診斷有2類方式,一種為僅依靠待診斷儀表自身數(shù)據(jù)進(jìn)行診斷[2-3],利用小波變換、核Fisher特征提取進(jìn)行特征識(shí)別,并利用模糊模式識(shí)別進(jìn)行故障分類,然而由于此方法僅依據(jù)一個(gè)測(cè)點(diǎn)的信號(hào)對(duì)于故障情況進(jìn)行推斷導(dǎo)致該方法難以適應(yīng)工作環(huán)境的變化,對(duì)于變工況適應(yīng)能力較差。
利用待診斷傳感器所處系統(tǒng)中其他傳感器的數(shù)據(jù)對(duì)其進(jìn)行健康狀態(tài)評(píng)估的方法引起了學(xué)者注意。 通常發(fā)電機(jī)、電動(dòng)機(jī)、燃料電池等設(shè)備中采用分布于不同測(cè)點(diǎn)的多個(gè)傳感器對(duì)于設(shè)備工作狀態(tài)進(jìn)行監(jiān)測(cè),根據(jù)設(shè)備運(yùn)行原理可知各測(cè)點(diǎn)測(cè)量值具有相關(guān)性,因此各傳感器輸出數(shù)值也具有相關(guān)性。例如,發(fā)電機(jī)系統(tǒng)中線圈、軸承與齒輪等元件的各測(cè)點(diǎn)溫度呈正相關(guān)。因此,借助數(shù)據(jù)驅(qū)動(dòng)方法建立預(yù)測(cè)模型,利用設(shè)備中與待診斷傳感器相關(guān)的其他傳感器數(shù)據(jù)可實(shí)現(xiàn)漂移故障診斷,其基本過(guò)程為:利用與待診斷傳感器相關(guān)的其他傳感器測(cè)量值構(gòu)建數(shù)據(jù)驅(qū)動(dòng)模型,對(duì)于待診斷傳感器測(cè)量值進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)測(cè)值作差得到殘差,當(dāng)殘差超出故障閾值時(shí)則認(rèn)定為發(fā)生漂移故障。
基于此,數(shù)據(jù)驅(qū)動(dòng)方法被應(yīng)用于儀表漂移故障診斷,線性回歸、邏輯回歸等統(tǒng)計(jì)學(xué)習(xí)方法應(yīng)用于故障診斷中,此類方法簡(jiǎn)單易用且易于移植,但受限于模型原理,此類模型的診斷精度較低,隨著機(jī)器學(xué)習(xí)與深度學(xué)習(xí)理論的發(fā)展,更加復(fù)雜且精度更高的模型被應(yīng)用于儀表故障診斷中,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)被應(yīng)用于風(fēng)機(jī)系統(tǒng)中的溫度儀表的輸出數(shù)值進(jìn)行預(yù)測(cè),人工神經(jīng)網(wǎng)絡(luò)的輸入為待測(cè)傳感器所處風(fēng)機(jī)系統(tǒng)中其他溫度儀表的實(shí)測(cè)值,通過(guò)待診斷儀表實(shí)測(cè)值與預(yù)測(cè)值的殘差對(duì)其漂移故障狀態(tài)進(jìn)行評(píng)估[4];利用燃料電池系統(tǒng)中電流、溫度等傳感器數(shù)據(jù),配合深度隨機(jī)森林模型對(duì)于燃料電池中電壓傳感器健康狀態(tài)進(jìn)行監(jiān)測(cè),能夠更好適應(yīng)對(duì)于電壓傳感器可自恢復(fù)故障的診斷[5],改進(jìn)后的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory networks,LSTM)也被應(yīng)用于傳感器輸出數(shù)值序列的預(yù)測(cè),預(yù)測(cè)值和實(shí)測(cè)值作差得到的殘差序列輸入隨機(jī)森林(random forest,RF)模型后完成故障診斷,最終利用LSTM的預(yù)測(cè)值對(duì)于判定為故障的數(shù)據(jù)進(jìn)行數(shù)據(jù)重構(gòu)[6],基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法在各種場(chǎng)景的儀表與傳感器故障診斷中得到廣泛應(yīng)用[7-10],但此類方法因其復(fù)雜性較高,對(duì)于計(jì)算資源需求高,在工業(yè)現(xiàn)場(chǎng)應(yīng)用難度較大。綜上,儀表與傳感器的漂移故障診斷方法沿在線化、自動(dòng)化與高精度的方向不斷發(fā)展,但兼顧低時(shí)延、現(xiàn)場(chǎng)化與高精度的漂移故障診斷方法卻被忽略。
針對(duì)現(xiàn)有方法的局限性,文中提出基于邊云協(xié)同的溫度儀表漂移故障診斷方法,利用系統(tǒng)內(nèi)與待診斷儀表相關(guān)的儀表測(cè)量值進(jìn)行診斷,在邊緣端部署精度較低但計(jì)算量小的線性回歸模型進(jìn)行故障預(yù)檢;在云端部署計(jì)算量大但精度較高的集成學(xué)習(xí)模型進(jìn)行深度評(píng)估。邊云協(xié)同的運(yùn)行模式為:首先在邊緣端使用線性回歸模型進(jìn)行初步故障診斷,故障預(yù)檢中疑似故障數(shù)據(jù)交由云端的集成學(xué)習(xí)模型進(jìn)行深度評(píng)估,文中所提出方法創(chuàng)新點(diǎn)在于:
(1)將邊云協(xié)同方式引入溫度儀表漂移故障診斷之中,在保證診斷準(zhǔn)確性基本不受損失的同時(shí)提高了漂移故障診斷效率;
(2)使用集成學(xué)習(xí)模型進(jìn)行儀表漂移故障診斷,相比于采用單一模型具有更高的泛化性能,提升診斷準(zhǔn)確性與穩(wěn)定性;
(3)提出了考慮應(yīng)用場(chǎng)景的預(yù)檢閾值確定方式,使故障診斷方法能夠更好兼顧診斷效率與準(zhǔn)確性。
邊緣計(jì)算是自動(dòng)化技術(shù)發(fā)展過(guò)程中的困難與挑戰(zhàn)催生出的理論與技術(shù),雖然當(dāng)今云計(jì)算技術(shù)蓬勃發(fā)展,但云計(jì)算在實(shí)時(shí)性、通訊流量等方面無(wú)法滿足計(jì)算需求,因此邊緣計(jì)算概念應(yīng)運(yùn)而生,邊緣計(jì)算是在網(wǎng)絡(luò)邊緣執(zhí)行計(jì)算的一種新型計(jì)算模型[11-12]。然而由于邊緣計(jì)算概念較為寬泛且其被資本熱捧,導(dǎo)致邊緣計(jì)算概念被濫用,即便是簡(jiǎn)單的邊緣側(cè)計(jì)算后上傳計(jì)算結(jié)果也被包裝為邊緣計(jì)算,然而這種概念上的包裝對(duì)于解決實(shí)際問(wèn)題意義有限,因此將邊緣計(jì)算與云計(jì)算有機(jī)結(jié)合,提高計(jì)算過(guò)程中實(shí)時(shí)性、數(shù)據(jù)流量、運(yùn)算量、運(yùn)算精度等指標(biāo)具有較高的學(xué)術(shù)價(jià)值與應(yīng)用價(jià)值。
通常應(yīng)用于工業(yè)故障診斷的典型邊緣計(jì)算架構(gòu)自上至下主要包括云計(jì)算層、邊緣層、現(xiàn)場(chǎng)層[13],各層分擔(dān)作用不同、復(fù)雜度各異的計(jì)算任務(wù),各層之間通過(guò)路由器、網(wǎng)關(guān)等各類設(shè)備進(jìn)行通訊,各層的構(gòu)成與工作如下:
(1)現(xiàn)場(chǎng)層:本層主要用于連接儀表、機(jī)器人、汽車電控系統(tǒng)等待診斷現(xiàn)場(chǎng)設(shè)備,負(fù)責(zé)采集數(shù)據(jù)進(jìn)行基本的信號(hào)處理、通訊校驗(yàn)工作后將數(shù)據(jù)上傳至邊緣層,現(xiàn)場(chǎng)節(jié)點(diǎn)通過(guò)工業(yè)以太網(wǎng)/現(xiàn)場(chǎng)總線與邊緣層的邊緣網(wǎng)關(guān)相連,從而實(shí)現(xiàn)現(xiàn)場(chǎng)層與邊緣層的通訊,在邊緣層可應(yīng)用時(shí)間敏感網(wǎng)絡(luò)(time sensitive networking,TSN)和OPC統(tǒng)一架構(gòu)[14-15],以保證數(shù)據(jù)的低延遲、高可靠傳輸。
(2)邊緣層:本層用于快速感知現(xiàn)場(chǎng)層設(shè)備的工作狀態(tài)與進(jìn)行初步健康評(píng)估,主要由邊緣節(jié)點(diǎn)和邊緣管理器構(gòu)成,其中邊緣節(jié)點(diǎn)為硬件,包括用于運(yùn)算的邊緣服務(wù)器以及用于通訊的邊緣網(wǎng)關(guān)、邊云控制器等設(shè)備,主要執(zhí)行時(shí)間敏感、復(fù)雜度較低的計(jì)算任務(wù),邊緣管理器為軟件,能夠?qū)τ谌蝿?wù)進(jìn)行調(diào)用與調(diào)度。邊緣層可通過(guò)對(duì)等比較或復(fù)雜度較低的模型進(jìn)行初步的故障診斷,初步診斷中認(rèn)定異常后可將設(shè)備的運(yùn)行數(shù)據(jù)上傳至云計(jì)算層,進(jìn)行更全面深層次的健康狀態(tài)評(píng)估。
(3)云計(jì)算層:本層主要負(fù)責(zé)存儲(chǔ)與高性能計(jì)算,主要包括云服務(wù)器、數(shù)據(jù)中心等計(jì)算與存儲(chǔ)設(shè)備,相對(duì)于邊緣層具有更強(qiáng)的計(jì)算能力,因此能夠進(jìn)行更為準(zhǔn)確的故障診斷。本層可在接收到邊緣層上傳的疑似故障信號(hào)后,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)、生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN)等較復(fù)雜而精準(zhǔn)的模型進(jìn)行深度檢測(cè),并依據(jù)診斷結(jié)果報(bào)警。
文中提出了如圖1所示的溫度儀表漂移故障診斷架構(gòu),包括現(xiàn)場(chǎng)層、邊緣層、云計(jì)算層?,F(xiàn)場(chǎng)層包括各類溫度儀表與傳感器,其內(nèi)部運(yùn)行基本的信號(hào)濾波等程序,將處理后的數(shù)據(jù)通過(guò)工業(yè)以太網(wǎng)或現(xiàn)場(chǎng)總線上傳;邊緣層和云計(jì)算層分別承擔(dān)故障預(yù)檢和深度評(píng)估2部分溫度儀表漂移故障診斷任務(wù),且故障預(yù)檢和深度評(píng)估任務(wù)相互協(xié)同。故障預(yù)檢過(guò)程中通過(guò)線性回歸模型獲取待診斷儀表輸出預(yù)測(cè)值及其與實(shí)測(cè)值的殘差,并與預(yù)檢閾值比較判定是否疑似發(fā)生故障;疑似故障樣本交由云計(jì)算層進(jìn)行深度評(píng)估,由集成學(xué)習(xí)模型獲取預(yù)測(cè)值后,殘差與故障閾值比較獲得診斷結(jié)果。通過(guò)故障預(yù)檢與深度評(píng)估的協(xié)同工作,計(jì)算任務(wù)得以分配至邊緣層和云計(jì)算層,云端計(jì)算負(fù)載減小,邊緣側(cè)算力得到充分利用,診斷時(shí)延降低。
圖1 基于邊云協(xié)同的溫度儀表漂移故障診斷架構(gòu)
本節(jié)詳細(xì)闡述故障預(yù)檢和深度評(píng)估算法的設(shè)計(jì)與實(shí)現(xiàn)過(guò)程。
在某時(shí)刻包含n個(gè)儀表的一組儀表測(cè)量值為
X={x1,x2,x3,…,xj,…,xn}
(1)
式中xj為儀表j在該時(shí)刻的測(cè)量值。
假定待診斷儀表為第i個(gè)儀表,其實(shí)測(cè)值為xi,則除儀表i之外的n-1個(gè)儀表的實(shí)測(cè)值可表示為Xi:
Xi={x1,x2,x3,…,xi-1,xi+1,…,xn}
(2)
(3)
故障預(yù)檢模塊運(yùn)行于邊緣端,由于考慮到邊緣端計(jì)算資源有限且邊緣設(shè)備種類多并缺乏通用的計(jì)算框架,因此故障預(yù)檢算法的設(shè)計(jì)必須考慮復(fù)雜度和可移植性問(wèn)題。線性回歸模型形式簡(jiǎn)單、易于建模且模型參數(shù)較少,在訓(xùn)練得到模型參數(shù)后無(wú)需機(jī)器學(xué)習(xí)框架即可移植,文中選用線性回歸模型作為故障預(yù)檢算法。
深度評(píng)估用于對(duì)故障進(jìn)行更加精確的診斷,云計(jì)算設(shè)備通常計(jì)算能力強(qiáng),因此可在云端構(gòu)建更復(fù)雜而準(zhǔn)確的模型用于故障診斷,RF、ANN等模型都曾被應(yīng)用[4-5],集成學(xué)習(xí)模型能夠融合多個(gè)模型取得比單一模型更好的診斷效果,且能夠充分發(fā)揮云服務(wù)器計(jì)算性能,文中選用集成學(xué)習(xí)模型進(jìn)行深度評(píng)估,充分發(fā)揮云服務(wù)器的計(jì)算性能,文中使用stacking方法構(gòu)建集成學(xué)習(xí)模型作為深度評(píng)估中對(duì)于儀表測(cè)量值進(jìn)行預(yù)測(cè)的模型。
圖2為集成學(xué)習(xí)模型的結(jié)構(gòu),集成學(xué)習(xí)模型中包括初級(jí)模型和次級(jí)模型,其中初級(jí)模型包括人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN),隨機(jī)森林(random forest,RF),K近鄰算法(K-nearest neighbor,KNN),線性回歸(linear regression,LR)4種初級(jí)模型。
圖2 集成學(xué)習(xí)模型結(jié)構(gòu)
利用集成學(xué)習(xí)模型對(duì)于儀表進(jìn)行故障診斷流程如下:儀表i實(shí)測(cè)值為xi,除儀表i之外各傳感器的實(shí)測(cè)值為Xi,各初級(jí)模型都以Xi作為各自的輸入得到各自對(duì)于儀表i測(cè)量值的預(yù)測(cè)值Pi,可表示為
(4)
文中以stacking算法為基礎(chǔ)構(gòu)建集成學(xué)習(xí)模型,stacking算法能夠?qū)Χ喾N不同初級(jí)模型的預(yù)測(cè)結(jié)果進(jìn)行融合,且當(dāng)初級(jí)模型準(zhǔn)確性較相近而原理相差較大時(shí)融合效果較好。在stacking的集成學(xué)習(xí)模型訓(xùn)練過(guò)程中需要用到交叉驗(yàn)證,基于stacking的集成學(xué)習(xí)模型訓(xùn)練過(guò)程如圖3所示,流程如下:
(1)將原始訓(xùn)練集隨機(jī)劃分為5個(gè)子數(shù)據(jù)集,各子訓(xùn)練集樣本數(shù)量一致且不重合;
(2)選取其中4個(gè)子數(shù)據(jù)集作為訓(xùn)練集對(duì)于初級(jí)模型進(jìn)行訓(xùn)練,訓(xùn)練完成后,將另外1個(gè)被保留的子數(shù)據(jù)集與測(cè)試集分別輸入訓(xùn)練后的初級(jí)模型,得到該子數(shù)據(jù)集和測(cè)試集的預(yù)測(cè)結(jié)果;
(3)重復(fù)執(zhí)行步驟(2),需執(zhí)行步驟(2)共5次,每次選取不同的4個(gè)子數(shù)據(jù)集,每次被保留的子數(shù)據(jù)集預(yù)測(cè)結(jié)果拼接為次級(jí)模型訓(xùn)練所需特征,每次測(cè)試集的預(yù)測(cè)結(jié)果求平均值作為次級(jí)模型推理所需特征;
(4)重復(fù)執(zhí)行步驟(1)~(3),對(duì)于ANN、RF、KNN、LR 4種初級(jí)模型都需執(zhí)行步驟(1)~(3)1次,4種初級(jí)模型對(duì)于訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果分別成為次級(jí)模型在訓(xùn)練與推理過(guò)程中的輸入特征;
(5)通過(guò)RF模型建立次級(jí)模型,通過(guò)各初級(jí)模型對(duì)于訓(xùn)練集的預(yù)測(cè)值作為輸入特征對(duì)于次級(jí)模型進(jìn)行訓(xùn)練,并在訓(xùn)練完成后,以測(cè)試集經(jīng)各初級(jí)模型5次預(yù)測(cè)的平均值輸入模型得到對(duì)于測(cè)試集的最終預(yù)測(cè)結(jié)果。
圖3 基于stacking的集成學(xué)習(xí)模型訓(xùn)練流程
文中采用LR、KNN、RF、ANN 4種模型作為初級(jí)模型,集成學(xué)習(xí)模型與故障預(yù)檢模型共用參數(shù)相同的LR模型;KNN是一種典型的“懶學(xué)習(xí)”算法,通過(guò)最接近的K個(gè)歷史樣本結(jié)果進(jìn)行預(yù)測(cè),方法易于實(shí)現(xiàn),無(wú)需估計(jì)參數(shù);文中所采用RF模型基于bagging算法進(jìn)行構(gòu)建[16],多個(gè)分類樹的結(jié)果投票得到最終結(jié)果,具有較為優(yōu)秀的泛化能力和訓(xùn)練速度;ANN通過(guò)多個(gè)神經(jīng)元連接為網(wǎng)絡(luò),能夠較好地逼近非線性函數(shù),具有強(qiáng)大的容錯(cuò)性和泛化能力,在ANN訓(xùn)練過(guò)程中應(yīng)用Adam等方法以提高訓(xùn)練效果[17]。
由于風(fēng)電資源分布等原因,風(fēng)力發(fā)電機(jī)通常安置于較偏遠(yuǎn)的地區(qū),因此對(duì)于風(fēng)力發(fā)電機(jī)進(jìn)行檢修較困難,且風(fēng)力發(fā)電機(jī)工作環(huán)境較惡劣,易導(dǎo)致其溫度儀表等部件出現(xiàn)故障,因此文中選取風(fēng)力發(fā)電機(jī)作為溫度儀表漂移故障診斷模型的驗(yàn)證對(duì)象,風(fēng)力發(fā)電機(jī)的基本組成結(jié)構(gòu)如圖4所示。
圖4 風(fēng)機(jī)基本組成結(jié)構(gòu)
風(fēng)力發(fā)電機(jī)中,機(jī)電部分主要包括槳距系統(tǒng)、傳動(dòng)系統(tǒng)、發(fā)電機(jī)及變頻器[18],風(fēng)帶動(dòng)槳葉后,機(jī)械能依次經(jīng)過(guò)以上系統(tǒng)最終傳遞至發(fā)電機(jī),除機(jī)電系統(tǒng)外,控制系統(tǒng)依據(jù)各傳感器反饋的數(shù)值對(duì)于機(jī)械系統(tǒng)進(jìn)行控制,而風(fēng)機(jī)的數(shù)據(jù)監(jiān)視與采集(supervisory control and data acquisition,SCADA)系統(tǒng)負(fù)責(zé)對(duì)于分布于各處的傳感器數(shù)值進(jìn)行采集、保存與上傳[19],模型驗(yàn)證過(guò)程中采用的溫度變量及其物理意義如表1所示。
表1 實(shí)驗(yàn)所采用溫度儀表變量
文中選用實(shí)際使用的風(fēng)機(jī)中由SCADA系統(tǒng)采集的溫度儀表數(shù)據(jù)進(jìn)行實(shí)驗(yàn),溫度儀表在采集期間未發(fā)生故障,數(shù)據(jù)采集時(shí)間跨度為2年,采樣周期為10 min,每次采樣的數(shù)據(jù)構(gòu)成一個(gè)樣本。
全部數(shù)據(jù)共劃分為訓(xùn)練集、測(cè)試集、驗(yàn)證集3部分,所有數(shù)據(jù)中前90%部分依據(jù)4∶1的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集,后10%部分(約連續(xù)3 498 h)的數(shù)據(jù)被保留為驗(yàn)證集。
故障分類準(zhǔn)確性驗(yàn)證需要故障注入后的樣本,文中選用驗(yàn)證集中數(shù)據(jù)進(jìn)行故障注入,對(duì)于約3 498 h內(nèi)的待診斷儀表數(shù)據(jù)添加隨時(shí)間線性增長(zhǎng)的5%漂移故障,隨時(shí)間推移漂移比例不斷線性遞增,溫度數(shù)值漂移大于等于漂移故障閾值3%的樣本視為已經(jīng)發(fā)生漂移故障,小于漂移故障閾值的樣本視為未發(fā)生故障,故障注入后的數(shù)據(jù)如圖5所示。
圖5 漂移故障注入后的溫度信號(hào)
文中采用平均絕對(duì)誤差(mean absolute error,MAE)與均方根誤差(root mean square error,MSE)對(duì)于線性回歸模型和集成學(xué)習(xí)模型的回歸預(yù)測(cè)準(zhǔn)確性進(jìn)行評(píng)價(jià),其定義如下:
(5)
(6)
采用F1分?jǐn)?shù)(F1-Score)對(duì)于故障預(yù)檢與深度評(píng)估的儀表故障分類準(zhǔn)確性進(jìn)行評(píng)價(jià),其定義如下:
(7)
(8)
式中:TP為真正樣本,表示對(duì)正樣本預(yù)測(cè)為正的樣本數(shù)量;FP為假正樣本,表示對(duì)負(fù)樣本預(yù)測(cè)為正樣本的樣本數(shù)量;FN為假負(fù)樣本,表示對(duì)正樣本預(yù)測(cè)為負(fù)的樣本數(shù)量。
為評(píng)估故障診斷過(guò)程的運(yùn)算效率,文中以故障預(yù)檢與深度評(píng)估全過(guò)程的時(shí)間作為評(píng)價(jià)指標(biāo)。
為保證充分驗(yàn)證文中所提出的方法效果,表1中的8個(gè)儀表被依次選取為待診斷儀表進(jìn)行以上驗(yàn)證,且以上驗(yàn)證均基于驗(yàn)證集樣本。
3.2.1 故障預(yù)檢準(zhǔn)確性驗(yàn)證
表2給出了利用線性回歸模型對(duì)各儀表測(cè)量值進(jìn)行預(yù)測(cè)時(shí)的準(zhǔn)確性指標(biāo)。結(jié)果表明:所有儀表的測(cè)量值均可以由線性回歸模型得到準(zhǔn)確預(yù)測(cè),平均MAE小于1.5,線性回歸模型對(duì)于測(cè)量值的準(zhǔn)確預(yù)測(cè)為故障預(yù)檢中利用閾值比較篩選出疑似樣本進(jìn)行深度評(píng)估提供保證。
表2 故障預(yù)檢中回歸預(yù)測(cè)準(zhǔn)確性指標(biāo)
故障預(yù)檢過(guò)程需要通過(guò)將殘差與預(yù)檢閾值比較從而確定樣本是否需要進(jìn)行深度診斷,而預(yù)檢閾值的取值將影響故障預(yù)檢與深度評(píng)估整體準(zhǔn)確性與效率,預(yù)檢閾值選取規(guī)則置于3.3中討論。
3.2.2 深度評(píng)估準(zhǔn)確性驗(yàn)證
表3為用于深度評(píng)估的集成學(xué)習(xí)模型及其各初級(jí)模型進(jìn)行回歸預(yù)測(cè)時(shí)的準(zhǔn)確性指標(biāo),集成學(xué)習(xí)模型溫度預(yù)測(cè)平均MAE小于1,集成學(xué)習(xí)模型相對(duì)其各初級(jí)模型尤其是用于故障預(yù)檢的線性回歸模型準(zhǔn)確性提升顯著。
儀表漂移率超過(guò)故障閾值3%時(shí)認(rèn)定其發(fā)生漂移故障,表4為集成學(xué)習(xí)模型及其各初級(jí)模型漂移診斷分類時(shí)的F1-Score,僅應(yīng)用集成學(xué)習(xí)模型進(jìn)行漂移故障診斷時(shí)平均F1-Score可達(dá)0.954,相較于其他初級(jí)模型F1-Score較高,集成學(xué)習(xí)模型能夠較好地完成儀表漂移故障診斷任務(wù)。
表3 集成模型及其各初級(jí)模型回歸預(yù)測(cè)準(zhǔn)確性指標(biāo)
表4 集成模型及其各初級(jí)模型故障診斷分類F1-Score
文中應(yīng)用故障預(yù)檢與深度評(píng)估協(xié)同的方式進(jìn)行漂移故障診斷,故障預(yù)檢中的預(yù)檢閾值對(duì)于診斷算法整體的運(yùn)行效率與診斷精度具有重要影響。預(yù)檢閾值的取值將影響故障預(yù)檢的效率與模型準(zhǔn)確性,預(yù)檢閾值提高將使更少的樣本進(jìn)行深度評(píng)估,因此診斷過(guò)程整體效率提升,但也將導(dǎo)致更多的故障樣本被遺漏,因此需要根據(jù)應(yīng)用場(chǎng)景選定合適的閾值。
表5為采用不同預(yù)檢閾值(0.5%、1.0%、1.5%、2.0%、2.5%)時(shí)故障診斷的F1-Score與診斷時(shí)間。
表5 采用不同預(yù)檢閾值時(shí)的故障預(yù)檢指標(biāo)
通過(guò)不同閾值下的診斷時(shí)間和Fl-score繪制得到診斷時(shí)間和Fl-score隨閾值變化的趨勢(shì),如圖6所示。
圖6 診斷時(shí)間與F1-Score隨閾值變化趨勢(shì)圖
由表5與圖6分析可知,預(yù)檢閾值的提升將減少故障預(yù)檢與深度評(píng)估整體過(guò)程的運(yùn)算時(shí)間,但也將導(dǎo)致F1-Score下降,因此應(yīng)當(dāng)針對(duì)不同場(chǎng)景選擇適當(dāng)?shù)念A(yù)檢閾值。在裝備安全性要求較高時(shí)應(yīng)降低預(yù)檢閾值從而保證更高的故障診斷準(zhǔn)確性;而在運(yùn)算與通信性能受限時(shí)應(yīng)提高預(yù)檢閾值以降低計(jì)算與通信壓力。
針對(duì)風(fēng)機(jī)故障診斷場(chǎng)景,采用2%作為預(yù)檢閾值時(shí)相比于無(wú)故障預(yù)檢環(huán)節(jié)節(jié)省了43.2%的運(yùn)算時(shí)間,而F1-Score僅下降約0.002,因此故障預(yù)檢與深度評(píng)估協(xié)同運(yùn)作的方式能夠在保證診斷精度的同時(shí)大幅降低運(yùn)算負(fù)載。綜合考慮F1-Score與診斷時(shí)間的方式相比于以PR曲線[20]為代表的模型篩選方法能夠使得故障診斷方法更好地適應(yīng)安全性要求不同場(chǎng)景。
文中針對(duì)溫度儀表漂移故障診斷問(wèn)題,提出了基于邊云協(xié)同架構(gòu)的診斷方法。文中采用數(shù)據(jù)驅(qū)動(dòng)模型,采用故障預(yù)檢與深度評(píng)估協(xié)同診斷的方式,將故障預(yù)檢和深度評(píng)估任務(wù)分配于邊云協(xié)同架構(gòu)中的不同設(shè)備。為了驗(yàn)證文中所提出方法的準(zhǔn)確性,以風(fēng)力發(fā)電機(jī)中的溫度儀表作為研究對(duì)象進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明文中所提出方法在具有較高診斷準(zhǔn)確性的前提下大幅降低了故障診斷的運(yùn)算量。文中所提出方法對(duì)于數(shù)據(jù)驅(qū)動(dòng)的溫度儀表漂移故障診斷算法在工業(yè)場(chǎng)景中的易用性做出一定貢獻(xiàn)。