□ 談宏志
上海電氣集團(tuán)股份有限公司 中央研究院 上海 200070
故障預(yù)測與健康管理技術(shù)的內(nèi)涵是采用先進(jìn)的傳感器,借助各種算法和智能模型來預(yù)測、監(jiān)控和管理資產(chǎn)系統(tǒng)的健康狀態(tài),實現(xiàn)預(yù)測性維修,保證設(shè)備始終處于可靠受控狀態(tài),提供較優(yōu)的運(yùn)維策略,大幅降低維護(hù)保養(yǎng)費(fèi)用。故障預(yù)測與健康管理技術(shù)的核心是預(yù)測未來一段時間內(nèi)系統(tǒng)失效的可能性,以及采取適當(dāng)維護(hù)措施,具備數(shù)據(jù)采集與歸納、狀態(tài)監(jiān)測、故障診斷、故障預(yù)測、健康管理和部件壽命追蹤等能力。
故障預(yù)測與健康管理技術(shù)應(yīng)用的雛形源于軍隊,如直升機(jī)健康與使用監(jiān)測系統(tǒng)[1-2]、飛機(jī)狀態(tài)監(jiān)測系統(tǒng)[3]、美國陸軍診斷改進(jìn)計劃。20世紀(jì)90年代,在美軍、英軍等聯(lián)合攻擊戰(zhàn)斗機(jī)項目中,提出了視情維修要求,故障預(yù)測與健康管理技術(shù)正式被提出[4-5]。在軍事領(lǐng)域,目前故障預(yù)測與健康管理技術(shù)的應(yīng)用效果及技術(shù)水平最高。其中最具代表性的是美軍F-35戰(zhàn)斗機(jī)故障預(yù)測與健康管理系統(tǒng),維修人力減少了20%~40%,出動架次率提高了25%,總后勤保障成本降低了50%[6]。
故障預(yù)測與健康管理技術(shù)在軍工、民航領(lǐng)域的普及應(yīng)用,不僅大大降低了后勤保障成本,而且提高了設(shè)備可靠性指數(shù)[7]。如何將故障預(yù)測與健康管理技術(shù)應(yīng)用到一般民用領(lǐng)域,如軌交、船舶、工程機(jī)械、風(fēng)力發(fā)電、機(jī)床、鋼鐵、電梯等,是筆者研究的重點(diǎn)。
軍工、民航領(lǐng)域與一般民用領(lǐng)域有五方面區(qū)別。
(1) 復(fù)雜程度。軍工和民航設(shè)備子系統(tǒng)繁多,屬于全學(xué)科系統(tǒng),復(fù)雜程度遠(yuǎn)高于一般民用領(lǐng)域。
(2) 使用頻次。戰(zhàn)斗機(jī)等軍工設(shè)備出勤頻次遠(yuǎn)低于民用領(lǐng)域設(shè)備,而且后勤保障時長一般大于出勤時間。
(3) 單體價值。軍工設(shè)備單體價值高,但不產(chǎn)生直接收益,民用領(lǐng)域設(shè)備產(chǎn)生價值收益。
(4) 傳統(tǒng)運(yùn)維模式。軍工設(shè)備多采用保障性維護(hù),民用領(lǐng)域設(shè)備多采用定期和事后維護(hù)維修。
(5) 維保投入成本。受經(jīng)濟(jì)指標(biāo)考核要求,相比軍工設(shè)備,民用領(lǐng)域設(shè)備維保的投入需要一定的性價比。
一般民用領(lǐng)域設(shè)備具有復(fù)雜度較高、設(shè)備使用壽命長、綜合運(yùn)維成本高等特點(diǎn),故障預(yù)測與健康管理技術(shù)應(yīng)用潛力巨大,但是單體價值、投入成本的能力相比軍工設(shè)備存在差距。
軍工領(lǐng)域設(shè)備的成功應(yīng)用模式不能照搬,需要結(jié)合行業(yè)特點(diǎn)制訂最合適的故障預(yù)測與健康管理技術(shù)民用領(lǐng)域應(yīng)用體系與推廣模式。
故障預(yù)測與健康管理技術(shù)研究與應(yīng)用的目標(biāo)是開發(fā)一套經(jīng)過認(rèn)證的多學(xué)科交叉健康管理與故障預(yù)測系統(tǒng)或工具,實現(xiàn)基于人工智能與數(shù)字化技術(shù)的設(shè)備智能運(yùn)行維護(hù)。張寶珍等[8]介紹了故障預(yù)測與健康管理計劃的設(shè)立背景、研究框架和特點(diǎn)。根據(jù)民用領(lǐng)域及故障預(yù)測與健康管理技術(shù)的特點(diǎn),參考美國國家航空航天局的飛行器綜合健康管理計劃總體技術(shù)途徑,筆者梳理出故障預(yù)測與健康管理技術(shù)在一般民用領(lǐng)域應(yīng)用的研究架構(gòu),如圖1所示。
▲圖1 故障預(yù)測與健康管理技術(shù)民用領(lǐng)域應(yīng)用研究架構(gòu)
第一層基礎(chǔ)層是支撐故障預(yù)測與健康管理技術(shù)有效開展的基石,涵蓋了物理與機(jī)理知識、材料與傳感器、感知與數(shù)據(jù)采集、開發(fā)流程、數(shù)學(xué)建模方法、驗證與評估方法、軟件集成設(shè)計方法等七方面工作。機(jī)理知識是基石中的核心,因為基于故障預(yù)測與健康管理技術(shù)的一般工業(yè)監(jiān)測、診斷、預(yù)測、緩解、優(yōu)化應(yīng)用的特點(diǎn)通用性弱,不同行業(yè)甚至同一行業(yè)不同工況下痛點(diǎn)和訴求均不一樣,豐富的失效模型庫是故障預(yù)測與健康管理技術(shù)應(yīng)用的核心競爭力。針對故障預(yù)測與健康管理技術(shù)應(yīng)用的開發(fā)流程同樣至關(guān)重要,通過標(biāo)準(zhǔn)化指標(biāo)需求、數(shù)據(jù)要求、可行性驗證、算法選取、驗證測試、模型發(fā)布等開發(fā)過程,形成一套可行評估、中途監(jiān)管與中止、結(jié)果驗證的研究閉環(huán)流程。
第二層功能模塊層包含監(jiān)測、健康評估、診斷、預(yù)測、緩解與運(yùn)維優(yōu)化等技術(shù)功能。
第三層系統(tǒng)層實現(xiàn)電子電氣部件、機(jī)械部件、子系統(tǒng)、系統(tǒng)不同層次的故障預(yù)測與健康管理技術(shù)應(yīng)用。
第四層驗證與應(yīng)用層實現(xiàn)從歷史數(shù)據(jù)驗證、實驗室驗證、樣機(jī)應(yīng)用到廣泛采用的進(jìn)階,最終對系統(tǒng)產(chǎn)生實質(zhì)性影響。
故障預(yù)測與健康管理技術(shù)在民用領(lǐng)域應(yīng)用的研究架構(gòu)涉及材料、傳感器、人工智能、數(shù)字化等多學(xué)科技術(shù)領(lǐng)域,其中基礎(chǔ)層涵蓋內(nèi)容最多,對故障預(yù)測與健康管理技術(shù)研究的效果起決定性作用。
(1) 材料與傳感器技術(shù)。傳感器用于系統(tǒng)信號與狀態(tài)數(shù)據(jù)獲取,包括集成傳感器、無線傳感器、薄膜傳感器等。傳感器技術(shù)與傳感、高分子材料、先進(jìn)制造密切相關(guān)。目前,傳感器技術(shù)朝兩個方向發(fā)展,一是傳感器精度、穩(wěn)定性、復(fù)用性、方向性,二是傳感器尺寸的優(yōu)化,便于與工程結(jié)構(gòu)集成。
(2) 數(shù)學(xué)建模技術(shù)。研究形成基于系統(tǒng)可靠性、物理邏輯機(jī)理和數(shù)據(jù)驅(qū)動的建模技術(shù)。基于數(shù)據(jù)驅(qū)動的建模技術(shù)包含單一機(jī)器學(xué)習(xí)、機(jī)理與數(shù)據(jù)驅(qū)動融合、多算法融合,以及監(jiān)督、非監(jiān)督、半監(jiān)督學(xué)習(xí)融合等。
(3) 驗證與評估技術(shù)。目前故障預(yù)測與健康管理技術(shù)的研究熱點(diǎn)主要集中在建立健康評估模型、故障預(yù)警與預(yù)測模型、剩余使用壽命預(yù)測模型等方面,如何對健康指標(biāo)、模型進(jìn)行驗證和評估是極具挑戰(zhàn)的問題,驗證與評估方法的優(yōu)異程度決定了故障預(yù)測與健康管理技術(shù)的應(yīng)用價值。驗證與評估主要可以分為驗證方法與性能評估、原型驗證系統(tǒng)、不確定性管理三大支撐技術(shù)[9]。
(4) 系統(tǒng)集成技術(shù)。健康評估模型、故障預(yù)警與預(yù)測模型是數(shù)學(xué)模型,如何與實時系統(tǒng)集成并使模型結(jié)論顯性化,需要軟件系統(tǒng)與算法模型的集成,包含中臺技術(shù)、容器技術(shù)等。
(1) 健康評估技術(shù)。健康評估一般分為訓(xùn)練階段和驗證階段,訓(xùn)練階段主要基于健康狀態(tài)下的歷史數(shù)據(jù),如列舉n個特征、m組數(shù)據(jù),將m×n矩陣作為訓(xùn)練數(shù)據(jù),通過監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)均可生成健康評估模型,如圖2所示。其中,健康特征包含量化物理量、統(tǒng)計指標(biāo)、虛擬指標(biāo)三大類。
▲圖2 健康評估模型
(2) 診斷技術(shù)?;跉v史數(shù)據(jù)、機(jī)理知識建立故障診斷模型,結(jié)合健康基準(zhǔn)模型實現(xiàn)對影響裝備安全可靠運(yùn)行的異常和重要報警的定位、原因分析,輔助人員縮小故障范圍,提高故障排除效率。故障診斷研究路線如圖3所示。故障診斷模型作為監(jiān)控系統(tǒng)的后臺模型,實時對系統(tǒng)的運(yùn)行狀態(tài)進(jìn)行監(jiān)測,追溯故障原因,實現(xiàn)故障診斷功能,提高故障定位效率,并有效提高設(shè)備管理水平。
▲圖3 故障診斷研究路線
(3) 預(yù)測技術(shù)。預(yù)測技術(shù)包含故障預(yù)測及剩余使用壽命預(yù)測,如圖4所示。故障預(yù)測可實現(xiàn)對已知故障進(jìn)行有效預(yù)測,在故障發(fā)生之前進(jìn)行主動干預(yù),避免非計劃性停機(jī),逐步實現(xiàn)設(shè)備的智能化管理。剩余使用壽命預(yù)測評估部件或者系統(tǒng)的剩余使用壽命。實現(xiàn)預(yù)測的技術(shù)路線有基于可靠性、基于物理機(jī)理、基于數(shù)據(jù)驅(qū)動三種?;诳煽啃约夹g(shù)路線通過概率統(tǒng)計進(jìn)行定性預(yù)測,精度較低?;谖锢頇C(jī)理技術(shù)路線根據(jù)全生命周期試驗得到的機(jī)理模型,建立衰退模型,準(zhǔn)確預(yù)判失效模式與發(fā)生時間?;跀?shù)據(jù)驅(qū)動技術(shù)路線通過數(shù)學(xué)方式,對連續(xù)信號、離散數(shù)據(jù)進(jìn)行擬合,形成模型,可結(jié)合機(jī)理知識提高模型精度。
▲圖4 故障預(yù)測與剩余使用壽命預(yù)測技術(shù)路線
故障預(yù)測與健康管理技術(shù)的應(yīng)用與行業(yè)場景、數(shù)據(jù)基礎(chǔ)、傳感技術(shù)、算法精度息息相關(guān)。故障預(yù)測與健康管理技術(shù)在各行各業(yè)的發(fā)展進(jìn)程各不相同,根據(jù)技術(shù)生命周期的方法,筆者制訂了研究、工程、應(yīng)用、社會影響四個階段。故障預(yù)測與健康管理技術(shù)應(yīng)用階段與評估指標(biāo)如圖5所示。
▲圖5 故障預(yù)測與健康管理技術(shù)應(yīng)用階段與評估指標(biāo)
根據(jù)故障預(yù)測與健康管理技術(shù)應(yīng)用階段的評價指標(biāo),梳理出軌道交通、船舶、工程機(jī)械、風(fēng)力發(fā)電、機(jī)床、鋼鐵、電梯等一般民用領(lǐng)域的應(yīng)用階段[10-23],如圖6所示。
▲圖6 故障預(yù)測與健康管理技術(shù)民用領(lǐng)域應(yīng)用階段
故障預(yù)測與健康管理技術(shù)在風(fēng)力發(fā)電領(lǐng)域的發(fā)展之所以最為成熟,與數(shù)據(jù)基礎(chǔ)、網(wǎng)絡(luò)基礎(chǔ)相關(guān)。在陸上風(fēng)力發(fā)電發(fā)展初期,關(guān)鍵部件的遠(yuǎn)程監(jiān)控、風(fēng)力發(fā)電場數(shù)字化運(yùn)營是標(biāo)配,為故障預(yù)測與健康管理技術(shù)發(fā)揮作用奠定了基礎(chǔ)。目前,風(fēng)力發(fā)電場業(yè)主主動要求主機(jī)廠商提供關(guān)鍵部件的故障預(yù)警服務(wù)。
軌道交通行業(yè)涉及車輛、供電系統(tǒng)、通信信號三大專業(yè),是多學(xué)科融合的產(chǎn)業(yè),與民眾出行安全息息相關(guān),傳統(tǒng)的維保模式成本高,無法滿足行業(yè)的高速發(fā)展需求?;跀?shù)據(jù)驅(qū)動的故障預(yù)測與健康管理技術(shù)可以實現(xiàn)關(guān)鍵部件的故障定位、故障預(yù)警功能,并可實現(xiàn)三專業(yè)融合的維保,解決關(guān)聯(lián)故障跨專業(yè)不定位導(dǎo)致的問題。目前,車輛專業(yè)發(fā)展較快,如上海申通地鐵正在建立車輛智能運(yùn)維系統(tǒng)平臺,部分車門、道岔、制動系統(tǒng)等零部件供應(yīng)商開始提供關(guān)鍵部件故障診斷、亞健康評估等增值服務(wù)。
從縱向領(lǐng)域分析,單體價值越高,領(lǐng)域的發(fā)展階段越領(lǐng)先。對于軌道交通、船舶、工程機(jī)械、鋼鐵等行業(yè)而言,隨著工程師數(shù)字化能力、算法機(jī)理知識理解能力的提升,故障預(yù)測與健康管理技術(shù)將逐步進(jìn)入廣泛應(yīng)用階段。目前已有部分成熟產(chǎn)品及服務(wù),如寶武集團(tuán)成立寶武裝備智能科技有限公司,以智能運(yùn)維為主線,為鋼鐵制造提供智慧服務(wù)。
針對機(jī)床、電梯、液壓等行業(yè),雖然單體價值較低,但是在數(shù)量上有絕對優(yōu)勢。目前,機(jī)床的主軸、頭架、刀具最受關(guān)注,市場上已有部分刀具監(jiān)控與預(yù)警系統(tǒng)產(chǎn)品。隸屬于特種設(shè)備行業(yè)的電梯,隨著故障預(yù)測與健康管理技術(shù)的發(fā)展,部分法律法規(guī)同步更新中,基于故障預(yù)測與健康管理技術(shù)的按需維保則進(jìn)行了試點(diǎn)。
故障預(yù)測與健康管理技術(shù)主要實現(xiàn)了遠(yuǎn)程監(jiān)控、健康評估、故障診斷等功能。附加值最高的故障預(yù)警預(yù)測、剩余使用壽命預(yù)測等功能則尚未替換現(xiàn)有技術(shù)及推廣應(yīng)用,原因主要有三方面。
(1) 投資回報率難以計算。我國工業(yè)體系經(jīng)過多年發(fā)展已相當(dāng)成熟,機(jī)械維護(hù)維修自身的利潤空間有限,預(yù)測性維護(hù)驗證周期長,經(jīng)濟(jì)收益測算時間長,前期投入成本高。
(2) 固化的思維限制商業(yè)模式改變。
(3) 故障預(yù)警及剩余使用壽命預(yù)測精度達(dá)不到生產(chǎn)環(huán)境級應(yīng)用。原因一方面是基礎(chǔ)數(shù)據(jù)量不足,傳感器及運(yùn)行歷史數(shù)據(jù)不夠多;另一方面是失效模式的多樣性,沒有充足機(jī)理知識積累,無法建立環(huán)境級的失效模型。
隨著人工智能、物聯(lián)網(wǎng)、網(wǎng)絡(luò)技術(shù)的發(fā)展,故障預(yù)測與健康管理技術(shù)成熟度將越來越高,但國內(nèi)目前還處于發(fā)展初期,除應(yīng)關(guān)注故障預(yù)測與健康管理標(biāo)準(zhǔn)化體系、故障預(yù)測與健康管理驗證系統(tǒng)的建設(shè)外,還應(yīng)重視工業(yè)可靠性及物理機(jī)理的研究,重視工業(yè)現(xiàn)場數(shù)據(jù)感知及數(shù)據(jù)信息化、知識化技術(shù),并重視提升預(yù)測精度方法的研究[24]。
總而言之,故障預(yù)測與健康管理技術(shù)在一般民用領(lǐng)域的應(yīng)用與軍工設(shè)備、航天航空領(lǐng)域存在較大差距。隨著投入資源的增加、研究體系的完善、示范應(yīng)用的成功,故障預(yù)測與健康管理技術(shù)將顛覆民用領(lǐng)域傳統(tǒng)的運(yùn)營與維護(hù)方式,智能化運(yùn)維時代即將到來。