李益波1 肖炳林1 何威譽1 李 恒 張 氫
1 廣州港集團有限公司 2 同濟大學
港口機械是目前集裝箱碼頭的主要設備,一旦發(fā)生突發(fā)故障,會影響碼頭作業(yè)生產(chǎn),造成巨大的經(jīng)濟損失,甚至造成人員傷亡。港口機械融合了數(shù)字技術、現(xiàn)代控制技術、通訊技術的機電液一體化設備,其復雜程度高,出現(xiàn)突發(fā)故障后維修難度較大,如果碰到?jīng)]有備件等情況,維修時間也不可控。當前大多數(shù)碼頭企業(yè)還在采用計劃維修的方式,定期對起重機設備進行檢查和保養(yǎng),沒有考慮設備的實際使用情況及真實的健康狀態(tài),造成了時間和人力物力的浪費。
隨著碼頭自動化進程加快,越來越多的人工操作逐漸被替代,傳統(tǒng)的人工巡檢嚴重影響碼頭的作業(yè)效率,需要一種更加智能化的狀態(tài)監(jiān)測方法。港口機械的特點是載貨量大,長期處于頻繁啟停、換向等非平穩(wěn)工況,不僅設備容易出現(xiàn)故障,而且會對監(jiān)測信號帶來干擾,加大故障診斷的難度。碼頭企業(yè)迫切需要一種能夠?qū)Ω劭跈C械關鍵部件進行在線實時監(jiān)測的平臺,以應對不斷增長的全球貿(mào)易。
隨著物聯(lián)網(wǎng)及人工智能等領域新技術的興起與發(fā)展,故障診斷領域也進入了“大數(shù)據(jù)”時代。通過高效快速的數(shù)據(jù)采集、存儲、傳遞、處理,實現(xiàn)對更大數(shù)量、更多測點設備的監(jiān)測,由此產(chǎn)生的海量數(shù)據(jù)給港口機械智能狀態(tài)監(jiān)測的深入研究和應用提供了新的機遇。國家自然科學基金“十三五”發(fā)展規(guī)劃中,將面向大數(shù)據(jù)的深度學習理論與方法、基于大數(shù)據(jù)的趨勢預測和決策、面向領域大數(shù)據(jù)的人機物融合系統(tǒng)示范應用作為優(yōu)先發(fā)展領域[1]。
目前,基于大數(shù)據(jù)的狀態(tài)監(jiān)測已經(jīng)應用于多個領域。通用電氣航空(GEAviation)公司對旗下生產(chǎn)的飛機發(fā)動機安裝智能傳感裝置來進行實時監(jiān)測,并將故障信息可視化在移動設備上,供客戶實時參考[2]。阿爾斯通(ALSTOM)公司開發(fā)的產(chǎn)品TrainTracer,為軌道交通車輛與設備提供遠程監(jiān)控、數(shù)據(jù)采集及在線的故障診斷服務[3]。在起重機領域,日本小松(KOMATSU)制作所和美國卡特彼勒(CAT)公司針對該難點,將先進的數(shù)據(jù)采集及分析方法嵌入旗下大型工程機械的狀態(tài)監(jiān)測與故障診斷的售后服務中,增加產(chǎn)品競爭力[4]。三一重工、中聯(lián)重科和徐工集團也進行了智能監(jiān)控系統(tǒng)的開發(fā),將設備遠程監(jiān)控、數(shù)據(jù)采集模塊整合到一個可視化系統(tǒng)中,實現(xiàn)設備的全球定位、實時信息監(jiān)控、故障診斷、遠程維護和報警等功能。GE等大公司的成功案例多是針對工況較為平穩(wěn)或在一個較長時期內(nèi)平穩(wěn)的設備,具有積累大量的包含各類故障特征的大數(shù)據(jù)優(yōu)勢。但是,面對非平穩(wěn)運行的設備,以及缺乏標記數(shù)據(jù)積累的行業(yè)仍然存在巨大的應用困境。
本文結合廣州港的實際需要,針對大數(shù)據(jù)的獲取、學習和應用提出可行的技術路線,建立狀態(tài)監(jiān)測平臺,實現(xiàn)如下功能:①設備管理人員可以通過客戶端及時了解關鍵部件在起重機作業(yè)時的實際狀態(tài),監(jiān)視監(jiān)測點的數(shù)據(jù)異常情況,監(jiān)視關鍵部件的故障前期特征;②利用分析軟件對采集的信號及數(shù)據(jù)進行故障診斷和分析,針對性地安排部件檢修計劃;③利用積累的歷史數(shù)據(jù),結合機器學習等大數(shù)據(jù)分析工具,對起重機故障預警模型進行建模及優(yōu)化,從而對起重機關鍵部件的狀態(tài)、剩余壽命以及起重機健康狀態(tài)進行準確的評估及預測。
圖1 港口大數(shù)據(jù)監(jiān)測平臺總體方案
集裝箱碼頭機械設備多、種類多,且工作狀態(tài)不同,是典型離散事件動態(tài)系統(tǒng)。以廣州港三期碼頭為例,對碼頭上幾十臺岸邊集裝箱起重機和輪胎式集裝箱起重機進行監(jiān)測會產(chǎn)生海量的數(shù)據(jù),采集這些數(shù)據(jù)并進行分析是狀態(tài)監(jiān)測平臺的主要任務。圖1為大數(shù)據(jù)監(jiān)測平臺的總體方案。整個方案分為3個部分:
(1)數(shù)據(jù)采集。從單機監(jiān)測系統(tǒng)獲取單機起重機狀態(tài)信息、關鍵部件監(jiān)測點狀態(tài)信息、關鍵部件報警信息、關鍵部件監(jiān)測點傳感器原始信號和操作日志數(shù)據(jù),利用物聯(lián)網(wǎng)IoT數(shù)據(jù)采集技術、網(wǎng)絡總線技術進行數(shù)據(jù)的傳輸。
(2)數(shù)據(jù)中心。數(shù)據(jù)中心將采集的數(shù)據(jù)以及數(shù)據(jù)分析過程中產(chǎn)生的中間數(shù)據(jù)、模型進行存儲、傳輸。原始數(shù)據(jù)庫負責保存原始數(shù)據(jù),根據(jù)數(shù)據(jù)來源及其不同結構類型,分別存入InfluxDB、MongoDB以及MySQL數(shù)據(jù)庫。數(shù)據(jù)內(nèi)容包括原始傳感器物理信號、起重機故障數(shù)據(jù)、起重機運行相關數(shù)據(jù)、起重機設備參數(shù)等。監(jiān)測模型數(shù)據(jù)庫負責從原始數(shù)據(jù)庫中提取實時故障監(jiān)測相關特征數(shù)據(jù),并存入實時監(jiān)測模型數(shù)據(jù)庫,由起重機故障診斷分析模塊讀取并處理。機器學習模型數(shù)據(jù)庫從原始數(shù)據(jù)庫中提取起重機故障預測建模相關數(shù)據(jù),經(jīng)過數(shù)據(jù)預處理后存入機器學習模型數(shù)據(jù)庫,由起重機故障預測建模軟件模塊負責讀取并處理。
(3)監(jiān)控平臺。布置在云端提供遠程監(jiān)測與決策服務,包括港口機械故障診斷、故障預測、數(shù)據(jù)可視化平臺(見圖2)。整個監(jiān)測系統(tǒng)可分為6個層次:①數(shù)據(jù)源層,包括起重機機構傳感器數(shù)據(jù)、起重機運行數(shù)據(jù)、設備參數(shù)數(shù)據(jù)、維護日志數(shù)據(jù)等;②數(shù)據(jù)采集層,通過各種網(wǎng)絡協(xié)議和數(shù)據(jù)存儲分發(fā)協(xié)議,將采集到的數(shù)據(jù)傳輸?shù)椒掌骱蛿?shù)據(jù)庫中進行分別存儲;③數(shù)據(jù)存儲層,對采集的各種數(shù)據(jù)進行清洗、解析和分類,并進行結構化/非結構化混合和分布式存儲,并與上層數(shù)據(jù)分析層對接,提供高性能的數(shù)據(jù)存取服務;④數(shù)據(jù)分析層,在時域分析、頻域分析、時頻分析等傳統(tǒng)分析方法基礎上,采用AI及機器學習方法,包括分類回歸、貝葉斯網(wǎng)絡、人工神經(jīng)網(wǎng)絡、深度學習等,實現(xiàn)對故障的診斷與預測;⑤業(yè)務層,利用各分析方法實現(xiàn)狀態(tài)監(jiān)視、信號異常監(jiān)視、故障識別、故障預測、維護決策制定等業(yè)務;⑥展示層,利用WEB監(jiān)視門戶網(wǎng)站形式,把各類原始數(shù)據(jù)、統(tǒng)計結果、分析結果等以報表形式在終端進行可視化。
圖2 監(jiān)測平臺邏輯層次圖
集裝箱碼頭作為離散事件動態(tài)系統(tǒng),對其中的離散單元(港口機械設備)進行監(jiān)測數(shù)據(jù)采集存在3個難點:傳感器的安裝與配置、傳感器數(shù)據(jù)遠程傳輸和采集策略的制定。
根據(jù)廣州港的歷史維護記錄,港口機械的故障多發(fā)生于傳動系統(tǒng),常見故障有:齒輪箱的齒輪磨損、偏心、局部磨損裂紋、斷齒等故障;軸承的滾子、內(nèi)外圈故障;電機的定、轉(zhuǎn)子故障;滑輪故障;機械不平衡故障等。因此監(jiān)測平臺的重點為集裝箱起重機起升機構、小車機構和俯仰機構的傳動系統(tǒng)。
振動信號作為傳動系統(tǒng)狀態(tài)監(jiān)測的重要手段,廣泛應用于風電、航空等領域[8-9]。對于港口機械,選擇合適的振動傳感器安裝位置尤為重要。通過實地調(diào)研碼頭的常見故障頻次,確定了岸邊集裝箱起重機傳感器測點安裝位置(見圖3)。
圖3 岸邊集裝箱起重機傳動系統(tǒng)振動傳感器安裝位置
在每臺港口機械上布置眾多的振動傳感器將產(chǎn)生海量的數(shù)據(jù),如何對這些數(shù)據(jù)進行收取傳輸,并保持實時性,是建立監(jiān)測平臺的關鍵技術難題。結合TCP/IP通信方式和消息隊列遙測傳輸技術(MQTT),可保障數(shù)據(jù)的穩(wěn)定實時傳輸。如圖4所示,數(shù)據(jù)采集外部接口采用MQTT服務器,保證外部接口的靈活性;內(nèi)部采用Kafka消息中間件,保證內(nèi)部軟件模塊之間的連接的靈活性,同時具有很強的可擴展性,實現(xiàn)大批量數(shù)據(jù)點的實時采集及傳輸。為滿足不同數(shù)據(jù)類型數(shù)據(jù)的存儲需求,采集系統(tǒng)提供了MySQL數(shù)據(jù)庫,主要用于保存設備信息、人員信息、故障記錄、維修信息以及工單信息等關系型數(shù)據(jù)及記錄。InfluxDB主要用于設備運行產(chǎn)生的各個信號變量的實時數(shù)據(jù)及歷史數(shù)據(jù)記錄。MongoDB則主要用于保存各種傳感器信息的高頻原始信號。數(shù)據(jù)庫按照不同使用階段及調(diào)用關系又分為平臺原始數(shù)據(jù)庫、實時監(jiān)測模型數(shù)據(jù)庫以及機器學習模型數(shù)據(jù)庫,供各個軟件模塊查詢調(diào)用及處理后存儲使用。
圖4 大數(shù)據(jù)傳輸與存儲方案
岸邊集裝箱起重機一直處于非平穩(wěn)工況中,頻繁啟停且伴有沖擊,在傳感器信號采集過程中會引入干擾信號,影響后續(xù)的故障診斷與預測。因此,傳統(tǒng)的定周期采集方法不再適用,需要制定新的采集策略來應對這種狀況。本文提出采用轉(zhuǎn)速觸發(fā)方式進行數(shù)據(jù)采集,將PLC中的轉(zhuǎn)速信息提取出來,在達到某一數(shù)值后觸發(fā)采集儀進行數(shù)據(jù)采集。這種策略可以有效避免因工況變化帶來的干擾。圖5為轉(zhuǎn)速觸發(fā)采集策略前后的振動速度值的對比圖,從圖中可以看出轉(zhuǎn)速觸發(fā)前采集的信號雜亂,很多啟停所造成的沖擊都會引起誤報警,而在采用轉(zhuǎn)速觸發(fā)采集策略后,可以明顯地去除這些設備操作上的干擾。
圖5 轉(zhuǎn)速觸發(fā)采集策略實施前后對比
利用采集得到的傳感器數(shù)據(jù)對港口機械設備進行故障診斷是監(jiān)測平臺的主要任務之一,該任務被分成2個階段實施:基于實時數(shù)據(jù)的故障檢測和基于歷史數(shù)據(jù)的故障模型。如圖6所示,第一階段的主要任務是通過實時監(jiān)測數(shù)據(jù)提取故障特征,進行特征匹配,完成故障報警,確定大致的故障位置后告知工作人員進行維修,然后將故障模式存入歷史數(shù)據(jù)庫。第二階段的主要任務是利用機器學習方法建立故障診斷模型,用歷史數(shù)據(jù)不斷更新模型,最終實現(xiàn)故障的準確識別,包括位置、程度以及維修建議。
圖6 大數(shù)據(jù)故障診斷技術路線圖
實時故障檢測的一個重要特點是及時,能夠應對早期故障及突發(fā)故障,這意味著基于大量計算的故障模型不再適用。因此,監(jiān)測平臺采用故障特征匹配的方法快速診斷,并進行預警。表1列舉了部分常用振動信號故障特征。
表1 實時故障檢測特征參數(shù)
其中,峰值(PV)是所測數(shù)據(jù)的最大幅值,用來指示軸承磨損程度,有效值(RMS)取決于信號能量,能夠有效指示軸承退化狀況。峰值因子(PF)是峰值和有效值的比值。缺陷因子(DEF)綜合上述指標的優(yōu)點,不受轉(zhuǎn)速、載荷、尺寸等參數(shù)影響,便于設定報警值,容易使用且能快速地評價軸承的健康狀況。具體公式為:
DEF=a×PF+b×RMS
(1)
以起升電機軸承故障為例,在實際的監(jiān)測平臺運行過程中,發(fā)現(xiàn)碼頭一臺輪胎吊的電機驅(qū)動端測點的DEF值和振動加速度值存在報警。在圖7a中,振動信號時域波形出現(xiàn)明顯的沖擊,沖擊能量較大(見圖7b),通過進一步分析認為電機驅(qū)動端軸承存在磨損跡象。檢修發(fā)現(xiàn)該軸承出現(xiàn)明顯的磨損故障,對其更換之后,DEF值、振動速度和加速度值均下降到正常范圍內(nèi)(見圖7c)。
圖7 輪胎吊起身電機故障報警
簡單的通過故障特征匹配進行故障檢測雖然具有良好的實時性,但是不能準確判斷故障發(fā)生的位置與程度,同時容易造成誤報和漏報,帶來嚴重的后果。狀態(tài)監(jiān)測平臺結合大數(shù)據(jù)和機器學習算法,特別是深度學習算法,建立起由數(shù)據(jù)驅(qū)動的故障診斷模型,提出更加準確的故障診斷和維護建議。
隨著歷史故障數(shù)據(jù)的不斷積累,有更多的數(shù)據(jù)對故障診斷模型進行訓練,模型的精度會不斷提高,判斷更加準確。圖8為基于深度學習的故障診斷模型框架。
圖8 基于深度學習的故障診斷模型框架
故障預測包括健康狀態(tài)預報和壽命預測。健康狀態(tài)預報用于確定當前部件或者系統(tǒng)處于其健康退化過程中的哪一種健康狀態(tài),即正常狀態(tài)、性能下降狀態(tài)或者功能失效狀態(tài)等。當部件或系統(tǒng)處于性能下降狀態(tài)時,判斷是由于何種故障原因引起其健康水平的下降,并且評價當前健康狀態(tài)偏離其正常狀態(tài)程度的大小。剩余壽命預測是指依據(jù)部件或系統(tǒng)的當前健康狀態(tài)、歷史狀態(tài)等信息,采用合適的預報模型,確定部件或系統(tǒng)的剩余使用壽命[5]。目前故障預測所遇到的最主要難題是數(shù)據(jù)不足,難以建立準確的模型。
港口機械狀態(tài)監(jiān)測平臺在完善實時數(shù)據(jù)采集和歷史數(shù)據(jù)存儲的功能上,利用機器學習在大數(shù)據(jù)中進行知識獲取,最終建立針對港口機械關鍵設備的故障預測模型。圖9為基于振動監(jiān)測信號港口機械軸承故障預測技術路線圖。
圖9 基于機器學習的故障預測模型技術路線圖
結合廣州港南沙三期碼頭實際情況,研究大數(shù)據(jù)驅(qū)動的港口機械狀態(tài)監(jiān)測平臺的搭建。針對集裝箱碼頭在數(shù)據(jù)采集、數(shù)據(jù)存儲、故障診斷和故障預測等方面所遇到的難點進行詳細闡述,并提供了相應的解決方法和技術路線:
(1)結合網(wǎng)絡技術、數(shù)據(jù)采集技術和數(shù)據(jù)庫技術,解決了海量數(shù)據(jù)實時獲取與存儲的難題。
(2)將故障診斷分為2個階段,首先通過故障特征匹配實現(xiàn)故障的實時檢測;其次結合歷史數(shù)據(jù)和機器學習算法建立更加準確的故障診斷模型。
(3)狀態(tài)監(jiān)測平臺在廣州港南沙三期碼頭的應用驗證了其有效性。隨著數(shù)據(jù)的不斷積累,基于機器學習的故障診斷和預測模型將不斷完善。