潘 鵬, 王廷銀, 潘健鴻, 吳海燕, 金曉磊, 樊明輝, 吳允平
1(福建師范大學(xué) 光電與信息工程學(xué)院, 福州 350007)
2(福建省特種設(shè)備檢驗研究院, 福州 350008)
3(福建師范大學(xué) 數(shù)學(xué)與信息學(xué)院, 福州 350007)
4(數(shù)字福建環(huán)境監(jiān)測物聯(lián)網(wǎng)實驗室, 福州 350007)
5(福州大學(xué) 物理與信息工程學(xué)院, 福州 350108)
電梯作為現(xiàn)代人類活動最后50米的交通工具, 已成為與城市居民生活密切相關(guān)的重要基礎(chǔ)設(shè)施之一.過去十年間, 國內(nèi)電梯保有量迅速增加, 到2016年已達到493.69萬臺[1].電梯的構(gòu)成要素多, 事故的發(fā)生既有一定的隨機性和突發(fā)性, 又有一些必然性, 僅2016年國內(nèi)就發(fā)生電梯事故48起, 死亡41人[2];據(jù)統(tǒng)計, 電梯構(gòu)成要素中發(fā)生的事故概率分別為:廳門事故占 80% 左右, 井道內(nèi)事故占 15% 左右, 其他占 5%;引發(fā)事故的原因主要有設(shè)備缺陷、作業(yè)違章、管理缺陷[3].
目前, 電梯的安全主要靠定期維護或年檢的方式,維保公司依據(jù)規(guī)程對電梯的各構(gòu)成要素進行固定項目的檢修[4,5], 雖然且該方式存在“過修”或者“欠修”的情況[6], 對可能發(fā)生的異常難以檢測, 但在過去10年間它為我國萬臺電梯事故率由1.56起降至0.15起發(fā)揮了重要作用[7].
但隨著電梯保有量的持續(xù)增長, 電梯使用頻率的快速提高, 影響電梯安全運行的隱患隨之進一步加大,傳統(tǒng)管理方式面臨巨大挑戰(zhàn).毫無疑問, 將電梯聯(lián)網(wǎng)實現(xiàn)監(jiān)管已成為該行業(yè)重要舉措, 如在上海地區(qū), 將新一代電梯運行狀態(tài)安全監(jiān)控系統(tǒng)鋪開, 到2018年預(yù)增至10萬臺以上[8].2016年, 《質(zhì)檢總局2016年電梯安全攻堅戰(zhàn)工作方案》首次明確要求運用大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù), 多措并舉以提升電梯應(yīng)急能力和監(jiān)管效能[9].
國內(nèi)已有專家圍繞電梯安全積極探索評價方法.慶光蔚等選取與電梯安全相關(guān)的指標(biāo)并計算權(quán)重, 通過模糊綜合評價法評估電梯安全, 模糊綜合評價方法能夠較為準(zhǔn)確的反映和衡量電梯運行情況及安全性能,指出群體性電梯管理提升點, 指標(biāo)體系的建立仍有待完善, 缺乏動態(tài)檢測、評估[10].陳國華等分析電梯歷史故障信息, 采用基于故障率修正的模糊綜合評價方法評估電梯系統(tǒng)風(fēng)險, 在模糊評估過程中引入故障率修正系數(shù), 故障率修正系數(shù)的引入有利于實現(xiàn)電梯系統(tǒng)風(fēng)險動態(tài)評價[11], 該方法具有較好的適應(yīng)性, 能夠隨電梯安全技術(shù)、安全管理水平修正評價系數(shù), 但評估因素的權(quán)重需要不同專業(yè)領(lǐng)域的專家依據(jù)問卷調(diào)查表進行主觀評分, 主觀性強.李剛通過故障原因分析, 研究整機性能與各部件間的關(guān)系建立電梯安全評價數(shù)學(xué)模型, 提出了針對長期服役電梯的安全評價項目、內(nèi)容、要求及流程, 為長期服役電梯部件及整機報廢、維修、改造提供了技術(shù)支撐, 有利于長期服役電梯安全管理及安全水平的提升, 但評價程序的智能化程度差, 僅能根據(jù)輸入進行風(fēng)險值的計算, 無法實現(xiàn)邏輯算法較為復(fù)雜的部件及整機判廢[12].這些研究方法為電梯故障分析、監(jiān)管、改進等方面提出了建設(shè)性建議,但如何將事后評估變?yōu)閷﹄娞莸膶崟r評估, 快速實現(xiàn)對電梯健康狀態(tài)預(yù)警, 特別是減少評估過程的人為主觀性和加快評估過程, 無疑是一項具有挑戰(zhàn)性的研究.
毫無疑問, 大數(shù)據(jù)的出現(xiàn)為各個行業(yè)帶來了巨大變化[13], 它可以更有效地表征數(shù)據(jù)、解釋數(shù)據(jù)[14].電梯的物聯(lián)網(wǎng)發(fā)展已積累了海量的數(shù)據(jù), 如何應(yīng)用新的智能技術(shù), 例如Logistic回歸等適用于大數(shù)據(jù)的人工智能算法, 發(fā)揮這些數(shù)據(jù)的作用, 挖掘電梯健康狀況與運行數(shù)據(jù)間的關(guān)聯(lián)性, 針對運行中電梯進行健康評估并預(yù)警、減少評估時間, 無疑是一項很有意義的研究.
電梯設(shè)備健康評估, 涉及到實時數(shù)據(jù)(物聯(lián)網(wǎng)技術(shù)監(jiān)控電梯運行數(shù)據(jù))、靜態(tài)數(shù)據(jù)(設(shè)備的型號、廠商等)、維保數(shù)據(jù)和歷史運行數(shù)據(jù), 如圖1所示, 時間跨度長、數(shù)據(jù)量大, 且電梯設(shè)備健康需及時評估, 因此需要一種運算時間短, 適用于大數(shù)據(jù)的評估算法.
圖1 電梯設(shè)備的健康評估數(shù)據(jù)組成框圖
Logistic回歸模型作為一種有效的數(shù)據(jù)處理方法在很多領(lǐng)域都有廣泛的應(yīng)用[15–18], 是公認(rèn)的最常用數(shù)據(jù)科學(xué)研究方法[19].方案最后選定Logistic回歸模型作為最終方案, 一方面由于Logistic回歸假定數(shù)據(jù)服從二項式分布, 電梯數(shù)據(jù)量大, 符合二項分布的基礎(chǔ)條件,另一方面, Logistic回歸利用統(tǒng)計學(xué)手段, 對數(shù)據(jù)進行預(yù)測分析, 提供后驗概率, 相對于傳統(tǒng)機器學(xué)習(xí)或深度學(xué)習(xí)算法其運算速度快, 在數(shù)據(jù)量較大時效果優(yōu)異, 適用于大數(shù)據(jù)環(huán)境下電梯健康評估.
評價方案主要包括數(shù)據(jù)清洗、特征篩選、特征處理、模型訓(xùn)練和設(shè)備評估等, 如圖2.
電梯健康運行需要每部分有機協(xié)調(diào), 缺一不可.從功能上看, 電梯可劃分成六部分[12].結(jié)合目前的相關(guān)研究[4,5,10,12,20]結(jié)果, 選取相關(guān)的整體特征和局部特征.整體特征是評價電梯各部分共同包含的特征, 局部特征是根據(jù)各部分的特點篩選的特有特征.篩選發(fā)現(xiàn), 現(xiàn)有條件無法針對對重系統(tǒng)、導(dǎo)向系統(tǒng)、轎廂系統(tǒng)篩選出適宜的局部特征, 如圖3.
圖2 設(shè)備健康評估方案流程
圖3 電梯健康評價特征
電梯特征原始數(shù)據(jù)不符合評估模型要求, 因此需要借助數(shù)據(jù)清洗、預(yù)處理等方法使其符合要求, 結(jié)果如表1、表2.
電梯健康評估是評估模型根據(jù)電梯運行數(shù)據(jù)得出的結(jié)果, 因此評估模型是整個系統(tǒng)核心.優(yōu)化評估模型,是提高評估系統(tǒng)泛化能力最關(guān)鍵的步驟.
機器學(xué)習(xí)分類方法對平衡數(shù)據(jù)集分類取得了良好的效果, 但對于基于總體分類精度為學(xué)習(xí)目標(biāo)的分類器而言, 樣本不均衡勢必會導(dǎo)致分類器過多關(guān)注多數(shù)類樣本, 從而使少數(shù)類樣本分類性能下降[21,22].
表1 電梯整體特征處理后參數(shù)
表2 電梯局部特征處理后參數(shù)
樣本數(shù)據(jù)庫中包括發(fā)生故障電梯和正常運行電梯的數(shù)據(jù), 但正常運行電梯的樣本量遠(yuǎn)大于故障電梯樣的數(shù)據(jù)量, 所有在訓(xùn)練分類前需要解決樣本不均衡問題.同時, 由于故障樣本數(shù)據(jù)量級不大, 所以在解決樣本不均衡的前提下需要合理利用樣本.SMOTE算法根據(jù)已有的樣本生成新樣本點, 擴大樣本個數(shù)[23].但SMOTE可能引入新的噪聲, 使用SMOTE過采樣算法結(jié)合KMeans++聚類降采樣, 既避免了為樣本集引入較多的噪聲, 又有效地解決了訓(xùn)練集樣本稀疏的問題[24,25].
Logistic回歸通過擬合系數(shù), 建立評價模型.但樣本指標(biāo)單位不一致、不同的量綱, 影響訓(xùn)練模型參數(shù),降低模型泛化能力.數(shù)據(jù)的標(biāo)準(zhǔn)化將數(shù)據(jù)約束到同一標(biāo)尺,降低了單位與量綱對模型的影響[26,27].
標(biāo)準(zhǔn)分?jǐn)?shù)(Z-score)是一種常見的標(biāo)準(zhǔn)化法, 將數(shù)值變準(zhǔn)化到Z分?jǐn)?shù), 公式如下:
模型通過標(biāo)準(zhǔn)分?jǐn)?shù)法將不同單位的數(shù)據(jù), 統(tǒng)一到同一尺度, 降低了屬性間的關(guān)聯(lián)度, 同時壓縮了數(shù)據(jù)中的噪聲, 提高了模型泛化能力.
在電梯評價模型中, 需要對所有的特征數(shù)據(jù)進行標(biāo)準(zhǔn)化處理.模型訓(xùn)練時, 每個特征的所有訓(xùn)練數(shù)據(jù)計算“平均值”和“方差”, 后根據(jù)公式對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理.在評估中, 所有數(shù)據(jù)的標(biāo)準(zhǔn)化參數(shù), 使用訓(xùn)練模型中“平均值”和“方差”參數(shù)帶入公式中進行標(biāo)準(zhǔn)化.
結(jié)合本文的需要, 先對相關(guān)原理進行分析.Logistic回歸將預(yù)測值映射到“Sigmod”函數(shù)上并將預(yù)測值轉(zhuǎn)化成預(yù)測概率, 函數(shù)形式為:
在二分類問題中, 定義屬于“1”的概率表示為P(y=1|x,θ)=f(x), 定 義 屬 于 “0”的 概 率 是P(y=0|x,w)=1-f(x), 可以寫成:
對式(1)求最大似然估計可解得參數(shù)wT, 計算概率得:
求解的關(guān)鍵在于求解參數(shù)wT, 但本質(zhì)上是仍線性.
線性回歸通過學(xué)習(xí)、計算, 擬合出結(jié)果與特征參數(shù)間的線性數(shù)量關(guān)系:f(x)=wTx.線性回歸試圖完成使得f(xi)?yi. 即yi=f(xi)+εi, 使得εi最小.由中心極限定理可知, 誤差是獨立同分布的, 服從均值為 0, 方差為σ2的高斯分布.
根據(jù)極大似然估計法可得:
若使得式L(w)最大, 即使得式(2)最小:
利用梯度下降算法或者最小二乘法都可求解[15,28].
Logistic回歸的本質(zhì)是線性回歸, 線性回歸是變量的一階形式, 一階模型對樣本的學(xué)習(xí)不充分.將f(x)=wTx變成形如:
在變量設(shè)計上將x1與x12看作是兩個變量, 這樣就人為的將f(x)變成高級回歸, 本質(zhì)上仍是線性回歸[29].階數(shù)高時擬合效果較好, 但是存在過擬合的情況.因此使用交叉驗證, 測試不同階數(shù)在測試數(shù)據(jù)上的準(zhǔn)確度,選擇合適的模型適合的階數(shù).
求解式(1)的最大似然估計時, 解得的wT可能造成評價模型學(xué)習(xí)過擬合.為降低過擬合程度, 引入L1/L2懲罰因子[30]:
但在數(shù)學(xué)推導(dǎo)上仍舊無法推算λ 最優(yōu)解.
交叉驗證將原始數(shù)據(jù)進行分組, 一部分作為訓(xùn)練集, 另一部分作為驗證集.首先用訓(xùn)練集對模型進行訓(xùn)練, 再將相關(guān)參數(shù)回帶入目標(biāo)函數(shù)選擇適合的參數(shù).通過交叉驗證法, 如圖4, 利用測試數(shù)據(jù)以式(3)損失函數(shù)為評價標(biāo)準(zhǔn), 選取合適的 λ.
電梯健康評估系統(tǒng)主要包括離線模型訓(xùn)練和電梯設(shè)備實時評估兩個部分.
圖4 交叉驗證
離線模型訓(xùn)練部分包括, 使用離線數(shù)據(jù), 借助統(tǒng)計算法, 數(shù)據(jù)的規(guī)整, 預(yù)處理等方法整理原始數(shù)據(jù), 利用整理后的數(shù)據(jù)學(xué)習(xí)訓(xùn)練logistic回歸模型關(guān)鍵參數(shù), 建立評價模型.
實時評估系統(tǒng)將實時上傳的數(shù)據(jù)整合后放入訓(xùn)練后的模型, 達到對電梯健康實時評估、預(yù)警, 如圖5.
圖5 電梯健康評估系統(tǒng)
評估模型計算每部分發(fā)生故障的概率Pi, 帶入公式:F(x)=100(1-Pi), 計算各部得分.將電梯各部分得分的均值作為電梯最后得分, 完成電梯健康評估, 如圖6.
圖6 評估結(jié)果
電梯是一個復(fù)雜系統(tǒng), 具有構(gòu)成要素多、供應(yīng)商多, 生命周期長等特點;從安裝、維保到維修, 影響其運行狀態(tài)的要素很多.本文從電梯組成、影響或可以用于評價電梯健康因素入手, 選取評價參數(shù).借助現(xiàn)象與故障之間的聯(lián)系, 在歷史數(shù)據(jù)的基礎(chǔ)上建立數(shù)學(xué)模型, 利用現(xiàn)有數(shù)據(jù), 使用大數(shù)據(jù)分析方法建立評估模型.引入數(shù)據(jù)預(yù)處理、懲罰因子、交叉驗證方法, 針對實際業(yè)務(wù)優(yōu)化評估模型.該模型評估時間周期短, 模型動態(tài)調(diào)整, 達到了對電梯健康實時監(jiān)控并預(yù)警.
評估階段取平均值作為電梯最后評價結(jié)果, 但電梯各部分對電梯重要并不對等, 因此評價電梯各部分的比重系數(shù)可作為下階段的研究重點.
在整個研究設(shè)計過程中, 由于缺乏統(tǒng)一的規(guī)范和標(biāo)準(zhǔn), 各廠商的數(shù)據(jù)獲取難度大, 信息孤島現(xiàn)象還比較嚴(yán)重.隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展, 應(yīng)盡快實施電梯物聯(lián)網(wǎng)的協(xié)議和接口標(biāo)準(zhǔn)化, 加快提升行業(yè)的活力和發(fā)展態(tài)勢.