摘 要:隨著信息化技術(shù)的不斷發(fā)展,大數(shù)據(jù)技術(shù)正以驚人的速度融入到人們的日常工作和生活中,推動著工業(yè)4.0時代的到來。本文利用大數(shù)據(jù)技術(shù)在數(shù)據(jù)管理優(yōu)化方面的優(yōu)勢,根據(jù)直升機制造生產(chǎn)活動的特點構(gòu)建了一個面向工業(yè)4.0的直升機制造大數(shù)據(jù)平臺,平臺主要由生產(chǎn)過程監(jiān)測與管理、直升機制造大數(shù)據(jù)平臺和直升機制造生產(chǎn)環(huán)境三層結(jié)構(gòu)組成。此平臺不僅能夠應用于直升機零部件加工生產(chǎn)的環(huán)節(jié)中,而且在產(chǎn)品創(chuàng)新、產(chǎn)品供應鏈的分析與優(yōu)化等環(huán)節(jié)也會發(fā)揮更大作用。
關(guān)鍵詞:直升機制造;大數(shù)據(jù);工業(yè)4.0
中圖分類號:TP311.13 文獻標識碼:A
1 引言(Introduction)
早在2013年,德國就提出了“工業(yè)4.0”生產(chǎn)模式的概念,思科、通用電氣和英特爾等企業(yè)紛紛響應組建了“工業(yè)互聯(lián)網(wǎng)聯(lián)盟”,為制造業(yè)賦予了智能化、信息化和個性化生產(chǎn)的新特性,促進了數(shù)據(jù)資源的利用?!肮I(yè)4.0”生產(chǎn)模式以大數(shù)據(jù)技術(shù)為基礎,實現(xiàn)降低對勞動力的依賴、滿足用戶的個性化需求和減少流通成本的目的,其包括智慧工廠、智能生產(chǎn)和智能物流三大部分,其中智慧生產(chǎn)是關(guān)鍵核心。
直升機制造大體分為零件制造、部件裝配、機身鉚裝和全機總裝四大部分,但包括多個生產(chǎn)環(huán)節(jié),每個環(huán)節(jié)都有各自的生產(chǎn)規(guī)律,屬于典型的離散型生產(chǎn)活動,其特點包括:(1)產(chǎn)品規(guī)格多、結(jié)構(gòu)復雜、技術(shù)難度大;(2)品種多、采用中小批量、混線生產(chǎn)模式;(3)產(chǎn)品物料需求量大而雜,物流管理復雜;(4)過程中大量數(shù)據(jù)及信息分散在各部門技術(shù)人員、管理人員、甚至工人手中,部門之間的信息交流不暢,從而導致生產(chǎn)及質(zhì)量問題不能及時得到反饋、解決,造成大量的生產(chǎn)計劃延期,生產(chǎn)效率低下。
自我國工業(yè)4.0戰(zhàn)略推行以來,物聯(lián)網(wǎng)技術(shù)和互聯(lián)網(wǎng)等信息技術(shù)與直升機制造業(yè)的不斷融合,直升機制造企業(yè)在生產(chǎn)過程中積累了大量的數(shù)據(jù),不僅包括指令、生產(chǎn)編號、圖號等文本格式的數(shù)據(jù),還包括圖片、聲音、視頻等復雜格式的信息,這些數(shù)據(jù)的產(chǎn)生有規(guī)模性、多樣性等特點。如何高效的獲取、存儲、分析處理海量數(shù)據(jù),并最大化地從這些數(shù)據(jù)資源中提煉價值成為直升機制造行業(yè)普遍關(guān)注的熱點。
大數(shù)據(jù)技術(shù)是目前公認的處理海量數(shù)據(jù)的有效方法,被譽為是助推實體經(jīng)濟邁向“工業(yè)4.0”的“核動力”。利用大數(shù)據(jù)管理技術(shù)和分布式計算計算分別實現(xiàn)對直升機加工數(shù)據(jù)的存儲和計算,然后利用大數(shù)據(jù)分析技術(shù)對這些數(shù)據(jù)進行挖掘,從中獲取對生產(chǎn)決策有價值的信息,幫助企業(yè)合理安排生產(chǎn)計劃,從而有效提高企業(yè)的綜合競爭力[1]。
2 國內(nèi)外發(fā)展現(xiàn)狀(The development situation at
home and abroad)
近年來,直升機在國防建設中扮演角色的重要性日益凸顯,直升機產(chǎn)業(yè)的發(fā)展已經(jīng)被各國提升到戰(zhàn)略高度。發(fā)達國家西科斯基直升機公司在產(chǎn)品制造與設計領(lǐng)域目前處于世界領(lǐng)先地位,其利用數(shù)字化制造技術(shù)不僅完成了從傳統(tǒng)的大批量生產(chǎn)向精益生產(chǎn)模式的轉(zhuǎn)變,而且創(chuàng)新了管理模式,實現(xiàn)了對成本的透明性和作業(yè)流程的標準化管理。此外,西科斯基公司S92項目中,利用CATIA軟件將來自六個不同國家和地區(qū)供應商的部件實現(xiàn)了高效化無紙整合,建立了一個設計組件整合的“虛擬直升機”模擬系統(tǒng),縮短了生產(chǎn)進度。
歐直公司在數(shù)字化技術(shù)方面的應用水平實際上并不亞于西科斯基公司,該公司在企業(yè)資源策劃、數(shù)字化電子樣機模擬等方面均達到了很高的水平。歐直公司采用了商務與決策公司同SAP公司聯(lián)合為其推出的商務智能平臺,主要用于績效管理與知識管理。
隨著“中國制造2025”戰(zhàn)略的提出,中國制造業(yè)迎來了一次新的改革浪潮,我國直升機制造企業(yè)紛紛建立了一系列的企業(yè)信息化系統(tǒng)來為公司的經(jīng)營決策、資源配置提供支撐,其中包括資源的優(yōu)化配置和目視化管理等,基本實現(xiàn)了生產(chǎn)過程的數(shù)字化管理。但與發(fā)達國家相比,中國直升機制造現(xiàn)在還是以低端制造為主,主要表現(xiàn)在以下兩個方面:
(1)沒有充分利用數(shù)據(jù)資源,將數(shù)據(jù)資源的價值資源挖掘出來,例如:若能從海量的數(shù)據(jù)中提取設備故障相關(guān)征兆數(shù)據(jù),采用預測與相關(guān)管理算法生成該設備將要或已經(jīng)發(fā)生故障的相關(guān)信息,使得設備元件具備“自我感知”能力,分析預測自身狀態(tài),就能采取措施進行預防。
(2)缺乏面向產(chǎn)品制造的“知識庫”管理,若能根據(jù)大數(shù)據(jù)技術(shù)分析不同生產(chǎn)環(huán)節(jié)的當前需求,通過推理將不同產(chǎn)品狀態(tài)、設備信息相關(guān)聯(lián)并呈現(xiàn)給管理層,就能對企業(yè)科學、有效的決策提供有力的技術(shù)支持。
總之,直升機制造生產(chǎn)活動是建立在精密、有序的生產(chǎn)工序的基礎上,通過各工序之間的密切配合,在確保直升機制造質(zhì)量的同時提升直升機生產(chǎn)效率。大數(shù)據(jù)在數(shù)據(jù)管理優(yōu)化方面具有極強的優(yōu)勢,除了能夠應用在直升機零部件的加工生產(chǎn)中外,還能夠在產(chǎn)品創(chuàng)新、產(chǎn)品供應鏈的分析與優(yōu)化,以及工業(yè)物聯(lián)網(wǎng)的應用中發(fā)揮出更大作用。將大數(shù)據(jù)技術(shù)與數(shù)字化和檢測等技術(shù)相結(jié)合,能夠提前對直升機生產(chǎn)環(huán)節(jié)中的各關(guān)鍵要素進行分析與預測,從而更好地提高產(chǎn)品的質(zhì)量與生產(chǎn)效率[2]。
3 直升機制造大數(shù)據(jù)平臺的總體框架(The overall
framework of helicopter manufacturing big date
platform)
直升機制造過程中產(chǎn)生的數(shù)據(jù)具有規(guī)模性、多樣性等特點,為了從這些數(shù)據(jù)資源中挖掘有用價值,首先要確保這些數(shù)據(jù)的存儲的完整性和處理的高效性,本文構(gòu)建了一個面向工業(yè)4.0的直升機制造大數(shù)據(jù)平臺,平臺的框架圖如圖1所示。
從圖1可以看出,直升機制造大數(shù)據(jù)平臺主要由生產(chǎn)過程監(jiān)測與管理、直升機制造大數(shù)據(jù)平臺和直升機制造生產(chǎn)環(huán)境三層結(jié)構(gòu)組成[3],本文主要研究前兩層。
直升機制造大數(shù)據(jù)平臺的主要功能是大數(shù)據(jù)存儲和分布式計算,大數(shù)據(jù)存儲平臺通過傳統(tǒng)關(guān)系型數(shù)據(jù)庫與大數(shù)據(jù)庫技術(shù)相結(jié)合的方式實現(xiàn)對直升機制造生產(chǎn)環(huán)境中所產(chǎn)生數(shù)據(jù)的存儲與管理。在直升機制造過程中,有關(guān)系型數(shù)據(jù)庫對實時性要求較高的數(shù)據(jù)進行處理,同時定期利用數(shù)據(jù)遷移技術(shù)將關(guān)系型數(shù)據(jù)中的數(shù)據(jù)同步到大數(shù)據(jù)庫中,實現(xiàn)直升機制造海量數(shù)據(jù)的存儲。
隨著時間的推移,直升機制造企業(yè)會積累大量的生產(chǎn)相關(guān)數(shù)據(jù),傳統(tǒng)的集中式處理方法已經(jīng)無法滿足數(shù)據(jù)快速處理的要求,本平臺通過搭建分布式計算環(huán)境將處理任務分解到不同的服務器上,用“分治”的思想將大規(guī)模任務分解為若干個規(guī)模較小的任務,分解任務完成后匯總到同一個服務器上,分布式計算的實現(xiàn)不僅提高了數(shù)據(jù)處理的效率,數(shù)據(jù)備份的機制也避免了單個服務器崩潰導致整個系統(tǒng)癱瘓的危險[4]。
生產(chǎn)過程的監(jiān)測與管理主要是建立在對直升機制造海量歷史數(shù)據(jù)分析的基礎上,此層不僅能夠幫助生產(chǎn)執(zhí)行單位根據(jù)生產(chǎn)設備的運行狀況、原材料的數(shù)量和產(chǎn)品的交付期等信息選擇合適的生產(chǎn)方案,對生產(chǎn)設備的任務和產(chǎn)品的生產(chǎn)順序分別進行合理分配和排序,充分利用生產(chǎn)環(huán)境中的資源進行優(yōu)化排產(chǎn),而且還能對產(chǎn)品的質(zhì)量進行預測分析,為企業(yè)領(lǐng)導層的決策提供數(shù)據(jù)支持。
4 關(guān)鍵技術(shù)(The key technology)
4.1 大數(shù)據(jù)存儲技術(shù)
大數(shù)據(jù)下,直升機制造業(yè)對于海量數(shù)據(jù)的存儲將面臨如下挑戰(zhàn):(1)存儲數(shù)據(jù)量大,直升機制造工序復雜,積累的數(shù)據(jù)將達到PB級別甚至更高;(2)直升機制造數(shù)據(jù)來源廣泛,數(shù)據(jù)形式和數(shù)據(jù)結(jié)構(gòu)均比較復雜;(3)要滿足數(shù)據(jù)的完整性、可擴展性。直升機制造大數(shù)據(jù)存儲采用分布式文件系統(tǒng)HDFS和按列存儲數(shù)據(jù)庫HBase。
傳統(tǒng)的數(shù)據(jù)存儲方式已經(jīng)不能滿足業(yè)務的需求,分布式文件系統(tǒng)是被國內(nèi)外一致認可的存儲大數(shù)據(jù)最好的工具,比較有代表性的分布式文件系統(tǒng)當屬Hadoopz的 HDFS(Hadoop Distributed File System)。HDFS采用master/slave主從架構(gòu),即一個控制節(jié)點和若干個數(shù)據(jù)節(jié)點組成[5]。一個文件信息通常被切分為若干部分分別存放在不同的數(shù)據(jù)節(jié)點,控制節(jié)點相當于整個集群的目錄,用來存儲數(shù)據(jù)節(jié)點的文件元數(shù)據(jù)。
HBase是基于HDFS是一種分布式的非關(guān)系型數(shù)據(jù)庫,其本質(zhì)是一張面向列的分布式多維映射表。傳統(tǒng)的MySQL等關(guān)系型數(shù)據(jù)庫通常被部署在一臺服務器上,而HBase數(shù)據(jù)庫是在多臺服務器上分布存儲的,如表1所示數(shù)據(jù)在Hbase的存儲方式[6]。
如表1所示,HBase主要由Row Key(行鍵)、Time Stamp(時間戳)和Column Family(列族)組成,Row Key由任意部大于64kB的字符串組成[7];Time Stamp是主要是用于記錄數(shù)據(jù)的版本,當有新的數(shù)據(jù)插入,系統(tǒng)會自動添加時間戳;Column Family必須在使用表之前預先定義,但列族成員可以根據(jù)需要隨時添加。
4.2 大數(shù)據(jù)分析技術(shù)
Map/Reduce則是Hadoop的唯一分布式程序設計模型,主要用于海量數(shù)據(jù)集的并行處理。Map、Reduce來源于函數(shù)式編程模型中的“Map”“Reduce”兩個核心操作。
當進行大數(shù)據(jù)分析時,此模型先對輸入的文件進行切割,然后分發(fā)給Map函數(shù),Map函數(shù)將其映射成另外一組中間文件,Reduce函數(shù)主要作用是整合Map函數(shù)映射成的中間文件,Map函數(shù)的映射規(guī)則和Reduce函數(shù)的整合處理是開發(fā)人員通過編寫代碼實現(xiàn)的。
4.3 大數(shù)據(jù)可視化技術(shù)
大數(shù)據(jù)可視化包括兩層含義,不僅指利用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中挖掘有用的信息,而且還要將得到的信息向用戶直觀地展示。大數(shù)據(jù)可視化的主要步驟包括獲取數(shù)據(jù)、分析數(shù)據(jù)、過濾數(shù)據(jù)、挖掘數(shù)據(jù)、展示數(shù)據(jù)和數(shù)據(jù)總結(jié)等。
將數(shù)據(jù)挖掘應用于直升機制造企業(yè)[8],一方面可以更加精準地把握產(chǎn)品的加工、質(zhì)量和安全管理等方面的情況,另一方面可以預測未來可能遇到的生產(chǎn)和管理上的問題。數(shù)據(jù)挖掘常用的算法是關(guān)聯(lián)分析法,通過分析數(shù)據(jù)和系統(tǒng)之間的關(guān)聯(lián),然后進行數(shù)據(jù)的分類和聚類,最后有目標型的挖掘數(shù)據(jù)潛在的價值。
可視化展示是建立在數(shù)據(jù)挖掘的基礎上,將數(shù)據(jù)中的信息形象化展示出來,常用的方法是多維智能分析法,該方法可以對分析對象進行時間、空間和邏輯關(guān)系等多個維度進行分析。
5 大數(shù)據(jù)平臺的實踐應用(The practical application
of big date platform)
5.1 系統(tǒng)功能簡介
直升機制造大數(shù)據(jù)平臺的有些功能是需要在后臺做處理的,而這些功能對于實時性的要求并不高,比如企業(yè)每月都要進行的加工數(shù)據(jù)宏觀分析、預測企業(yè)加工效率增長趨勢、直升機制造關(guān)鍵設備的健康管理等功能都屬于后臺數(shù)據(jù)處理,本文以直升機制造關(guān)鍵設備的健康管理為例進行說明[9]。
A公司已經(jīng)構(gòu)建了一套具有狀態(tài)感知、實時分析、自主決策特征的旋翼系統(tǒng)部件生產(chǎn)及裝配的智能制造生產(chǎn)線執(zhí)行系統(tǒng),通過實時監(jiān)控發(fā)現(xiàn)生產(chǎn)過程中的問題,及時采取應對措施。若能從海量的歷史數(shù)據(jù)中提取故障征兆數(shù)據(jù),采用預測與相關(guān)管理算法進行計算,從而生成該設備將要或已經(jīng)發(fā)生故障的相關(guān)信息,分析預測自身狀態(tài),就能更有效提高產(chǎn)品加工效率。
系統(tǒng)由設備數(shù)據(jù)采集、設備專項體檢、設備健康評估和建議、設備健康風險預警四大模塊組成,如圖2所示。
設備數(shù)據(jù)采集模塊主要是針對設備的基本信息和歷史狀態(tài)數(shù)據(jù)進行管理,設備的基本信息包括設備編號、購買時間、加工零件類型、使用年限等;設備專項體檢模塊中的“專項”包括生產(chǎn)數(shù)量、產(chǎn)品種類、工藝難度、原料供應、廢品率、產(chǎn)品要求精度、員工效率、設備生產(chǎn)率、設備故障率等,通過此模塊可以根據(jù)設備和產(chǎn)品的特點,有針對性分析影響設備利用率低下的原因;設備健康評估和建議模塊能夠?qū)m椫械乃兄笜诉M行評估,并根據(jù)評估結(jié)果給予一定的建議,針對生產(chǎn)管控系統(tǒng)某個關(guān)鍵設備利用率低的問題,可以通過此模塊進行分析,并采取措施;風險預警模塊主要是對設備的近期若干次的健康體檢報告的數(shù)據(jù)進行管理,若發(fā)現(xiàn)嚴重影響設備運行率的指標超低,會進行紅色預警。
5.2 開發(fā)工具及環(huán)境
硬件工具及環(huán)境:本項目的Hadoop集群由五臺普通的PC機組成,其中兩臺用作控制節(jié)點和第二控制節(jié)點,其余三臺用作數(shù)據(jù)節(jié)點。
軟件工具及環(huán)境:本項目基于Java EE開發(fā)模式和B/S架構(gòu),后臺采用Struts、Spring和Hibernate混合框架,前臺采用ExtJS框架;所有節(jié)點采用Linux操作系統(tǒng)、Java Web服務器采用Tomcat。
5.3 大數(shù)據(jù)存儲
Hadoop集群搭建好后,通過MyEclipse平臺開發(fā)大數(shù)據(jù)平臺存儲功能,主要包括的類如表2所示。
5.4 大數(shù)據(jù)挖掘和設備健康狀態(tài)預測
本文在數(shù)據(jù)挖掘階段采用神經(jīng)網(wǎng)絡、非結(jié)構(gòu)數(shù)據(jù)關(guān)聯(lián)分析、模糊識別等算法,形成了算法工具庫。以非結(jié)構(gòu)數(shù)據(jù)關(guān)聯(lián)分析為例,直升機制造關(guān)鍵設備健康管理系統(tǒng)可以通過兩種方式定義關(guān)聯(lián)算法的規(guī)則,一種是對非結(jié)構(gòu)數(shù)據(jù)庫中的數(shù)據(jù)進行分析發(fā)現(xiàn)潛在的關(guān)聯(lián),另一種是根據(jù)直升機制造過程中積累的經(jīng)驗自定義關(guān)聯(lián)規(guī)則[10,11]。
本文采用回歸分析法進行設備健康狀態(tài)的預測,目的是根據(jù)重要數(shù)據(jù)的變化趨勢,對未來一定時期內(nèi)關(guān)鍵設備的健康狀況進行推測,提前采取應對措施。
5.5 大數(shù)據(jù)的可視化分析
直升機制造關(guān)鍵設備健康的大數(shù)據(jù)可視化分析主要分為三個步驟[12],如圖3所示。
如圖3所示,直升機制造關(guān)鍵設備健康的大數(shù)據(jù)可視化分析的處理流程如下:
步驟1:收集數(shù)據(jù)。將直升機制造關(guān)鍵設備的原始數(shù)據(jù)序列化到hadoop中的HDFS中,并持久化到HBase非結(jié)構(gòu)化數(shù)據(jù)庫。
步驟2:根據(jù)業(yè)務需求在算法工具箱中選用相應的算法對數(shù)據(jù)進行挖掘。
步驟3:將數(shù)據(jù)挖掘算法輸出的結(jié)果集映射到可視化模塊中成為圖形信息,可視化引擎將結(jié)果集與場景集成,將可視化效果圖反饋給用戶。
6 結(jié)論(Conclusion)
大數(shù)據(jù)是實現(xiàn)工業(yè)4.0的技術(shù)基礎,在直升機制造中的應用中,通過建立大數(shù)據(jù)存儲、數(shù)據(jù)分析等模型,能夠?qū)χ鄙龣C零部件生產(chǎn)加工全工序質(zhì)量信息進行自動化采集、集成管理與質(zhì)量預警。充分發(fā)揮了大數(shù)據(jù)技術(shù)在數(shù)據(jù)處理能力中的優(yōu)勢,有效完善了直升機制造和裝配中的建模,以及數(shù)據(jù)的處理,從而確保了直升機制造的加工效率和產(chǎn)品質(zhì)量。
參考文獻(References)
[1] Baesens,B.,Bapna,R.,Marsden,et al.Transformational issues of big data and analytics in networked business[J].MIS Quarterly,2016,40(4):807-818.
[2] Robert Thorstad,Phillip Wolff.A big data analysis of the relationship between future thinking and decision-making[J].PNAS February 20,2018,115(8):E1740-E1748.
[3] Chaowei Yang,Qunying Huang,Zhenlong Li,et al.Big Data and cloud computing: innovation opportunities and challenges[J].International Journal of Digital Earth,2016,10(1):13-53.
[4] Alexandros Labrinidis,H.V.Jagadish.Challenges and opportunities with big data[J].Proceedings of the VLDB Endowment,2012,152(10):2032-2033.
[5] Chang F,Dean J,Ghemawat S,et al.Big Table:A distributed storage system for structured data[J].ACM Transactions on Computer Systems,2008,26(2):1-26.
[6] Ghemawat S,Gob IOFF H,Leung P T.The Google file system[C].Proceedings of the 19th ACM Symposium on Operating Systems Principles.New York:ACM Press,2003,29(8):29-43.
[7] Dean J,Ghemawat S.Map/Reduce:Simplied data processing on large clusters[C].OSD Ip04:Proceedings of the 6th Symposium on Operating System Design and Implementation.New York:ACM Press,2004,19(6):137-150.
[8] 黃陽華.德國“工業(yè)4.0”計劃及其對我國產(chǎn)業(yè)創(chuàng)新的啟示[J].經(jīng)濟社會體制比較,2015(2):1-10.
[9] 劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學學報:工學版,2014(06):957-972.
[10] Zhang Guanglan,Sun Jing,Chitkushev L,et al.Big data analytics in immunology:a knowledge-based approach[J].Biomed Research International,2014(1):9-18.
[11] 李德仁,李德毅.論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論與方法[J].武漢大學學報:信息科學版,2002(03):221-233.
[12] Wu Yingbin,Guo Fuliang.Visualization technology based on the treatment of complicated data[J].Computer & Digital Engineering,2015,43(11):1985-1989.
作者簡介:
張貝貝(1991-),女,碩士,工程師.研究領(lǐng)域:大數(shù)據(jù),人工智能及云計算.