王建民
清華大學(xué)軟件學(xué)院,北京 100084
工業(yè)大數(shù)據(jù)技術(shù)綜述
王建民
清華大學(xué)軟件學(xué)院,北京 100084
工業(yè)大數(shù)據(jù)是工業(yè)數(shù)據(jù)的總稱,包括信息化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及跨界數(shù)據(jù),是工業(yè)互聯(lián)網(wǎng)的核心要素。分析了工業(yè)大數(shù)據(jù)的發(fā)展背景和主體來源,剖析了工業(yè)大數(shù)據(jù)、企業(yè)信息化和工業(yè)互聯(lián)網(wǎng)之間的相互關(guān)系,闡述了工業(yè)大數(shù)據(jù)“多模態(tài)、高通量、強(qiáng)關(guān)聯(lián)”的數(shù)據(jù)特點(diǎn)以及“跨尺度、產(chǎn)業(yè)鏈、跨界”多源數(shù)據(jù)融合的應(yīng)用特點(diǎn),探討了工業(yè)大數(shù)據(jù)軟件系統(tǒng)架構(gòu),給出了制造環(huán)節(jié)的大數(shù)據(jù)應(yīng)用實(shí)例。
工業(yè)大數(shù)據(jù);工業(yè)互聯(lián)網(wǎng);大數(shù)據(jù)軟件;系統(tǒng)架構(gòu)
當(dāng)前,以大數(shù)據(jù)、云計(jì)算、移動(dòng)物聯(lián)網(wǎng)等為代表的新一輪科技革命席卷全球,正在構(gòu)筑信息互通、資源共享、能力協(xié)同、開放合作的制造業(yè)新體系,極大擴(kuò)展了制造業(yè)創(chuàng)新與發(fā)展空間。新一代信息通信技術(shù)的發(fā)展驅(qū)動(dòng)制造業(yè)邁向轉(zhuǎn)型升級(jí)的新階段——工業(yè)大數(shù)據(jù)驅(qū)動(dòng)的新階段,這是在新技術(shù)條件下制造業(yè)生產(chǎn)全流程、全產(chǎn)業(yè)鏈、產(chǎn)品全生命周期數(shù)據(jù)可獲取、可分析、可執(zhí)行的必然結(jié)果。
工業(yè)互聯(lián)網(wǎng)正處在高速發(fā)展時(shí)期,國(guó)際工業(yè)和軟件龍頭企業(yè)正在迅速布局工業(yè)互聯(lián)網(wǎng)技術(shù)與產(chǎn)品。2015年8月,美國(guó)通用電氣公司率先宣布推出首個(gè)面向工業(yè)數(shù)據(jù)和分析的云平臺(tái)Predix①https://www.predix.io/,如圖1所示。2016年2月,Predix正式對(duì)開發(fā)者開放;在2016年4月的漢諾威工業(yè)博覽會(huì)上,西門子公司宣布將推出云平臺(tái)MindSphere②https://www.siemens.com/global/en/home/products/software/mindsphere.html,到了2017年4月的漢諾威工業(yè)博覽會(huì),MindSphere成為西門子公司展區(qū)最核心的展出內(nèi)容,如圖2所示。
圖1 通用電氣Predix平臺(tái)MRO 5.0
在2017年漢諾威工業(yè)博覽會(huì)上,總部位于瑞士的ABB集團(tuán)宣布推出產(chǎn)品ABB Ability③http://new.abb.com/abb-ability,它集成了ABB集團(tuán)從設(shè)備到邊緣計(jì)算再到云服務(wù)的跨行業(yè)、一體化的數(shù)字化能力??偛课挥诜▏?guó)的施耐德電氣有限公司也推出了EcoStruxure平臺(tái)④https://www.schneiderelectric.com/,它綜合了施耐德電氣有限公司的互聯(lián)互通產(chǎn)品、邊緣控制以及應(yīng)用、分析和服務(wù)。
國(guó)內(nèi)三一重工股份有限公司、海爾集團(tuán)、中國(guó)航天科工集團(tuán)公司等企業(yè)也開始打造自己的平臺(tái),分別推出了三一樹根物聯(lián)平臺(tái)⑤http://www.rootcloud.com/、COSMO平臺(tái)⑥http://www.hannovermesse.de/product/cosmoplat/2399901/R567621、航天云網(wǎng)平臺(tái)⑦h(yuǎn)ttp://www.casicloud.com/等工業(yè)互聯(lián)網(wǎng)平臺(tái)產(chǎn)品,如圖3所示。
工業(yè)大數(shù)據(jù)是工業(yè)互聯(lián)網(wǎng)的核心要素。《中國(guó)制造2025》規(guī)劃中明確指出,工業(yè)大數(shù)據(jù)是我國(guó)制造業(yè)轉(zhuǎn)型升級(jí)的重要戰(zhàn)略資源,需要針對(duì)我國(guó)工業(yè)自己的特點(diǎn)有效利用工業(yè)大數(shù)據(jù)推動(dòng)工業(yè)升級(jí)。一方面,我國(guó)是世界工廠,實(shí)體制造比重大,但技術(shù)含量低、勞動(dòng)密集、高資源消耗制造的比重也大,實(shí)體工廠和實(shí)體制造升級(jí)迫在眉睫;另一方面,我國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展具有領(lǐng)先優(yōu)勢(shì),過去十多年消費(fèi)互聯(lián)網(wǎng)的高速發(fā)展使互聯(lián)網(wǎng)技術(shù)得到長(zhǎng)足發(fā)展,互聯(lián)網(wǎng)思維深入人心,需要充分發(fā)揮這一優(yōu)勢(shì),并將其與制造業(yè)緊密結(jié)合,促進(jìn)制造業(yè)升級(jí)和生產(chǎn)性服務(wù)業(yè)的發(fā)展。
因此,我國(guó)在推進(jìn)工業(yè)大數(shù)據(jù)的應(yīng)用過程中,要突出智能互聯(lián)產(chǎn)品創(chuàng)新[1],同時(shí)兼顧智能制造和制造服務(wù),用數(shù)據(jù)驅(qū)動(dòng)制造全生命周期從設(shè)計(jì)、制造到交付、服務(wù)、回收各個(gè)環(huán)節(jié)的智能化升級(jí),推動(dòng)制造全產(chǎn)業(yè)鏈智能協(xié)同,優(yōu)化生產(chǎn)要素配置和資源利用,消除低效中間環(huán)節(jié),整體提升中國(guó)制造業(yè)發(fā)展水平和世界競(jìng)爭(zhēng)力。
圖2 西門子MindSphere平臺(tái)
圖3 工業(yè)互聯(lián)網(wǎng)技術(shù)與產(chǎn)品舉例
如圖4所示,工業(yè)大數(shù)據(jù)即工業(yè)數(shù)據(jù)的總和,其來源主要包括企業(yè)信息化數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、“跨界”數(shù)據(jù)⑧http://www.aii-alliance.org/[2,3]。
企業(yè)信息系統(tǒng)存儲(chǔ)了高價(jià)值密度的核心業(yè)務(wù)數(shù)據(jù),積累的產(chǎn)品研發(fā)數(shù)據(jù)、生產(chǎn)制造數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)以及客戶服務(wù)數(shù)據(jù)存在于企業(yè)或產(chǎn)業(yè)鏈內(nèi)部,是工業(yè)領(lǐng)域傳統(tǒng)數(shù)據(jù)資產(chǎn)。近年來,物聯(lián)網(wǎng)技術(shù)快速發(fā)展,工業(yè)物聯(lián)網(wǎng)成為工業(yè)大數(shù)據(jù)新的、增長(zhǎng)最快的來源之一,它能實(shí)時(shí)自動(dòng)采集設(shè)備和裝備運(yùn)行狀態(tài)數(shù)據(jù),并對(duì)它們實(shí)施遠(yuǎn)程實(shí)時(shí)監(jiān)控?;ヂ?lián)網(wǎng)也促進(jìn)了工業(yè)與經(jīng)濟(jì)社會(huì)各個(gè)領(lǐng)域的深度融合,人們開始關(guān)注氣候變化、生態(tài)約束、政治事件、自然災(zāi)害、市場(chǎng)變化等因素對(duì)企業(yè)經(jīng)營(yíng)產(chǎn)生的影響,因此外部跨界數(shù)據(jù)已成為工業(yè)大數(shù)據(jù)不可忽視的來源。
人和機(jī)器是產(chǎn)生工業(yè)大數(shù)據(jù)的主體。人產(chǎn)生的數(shù)據(jù)是指由人輸入計(jì)算機(jī)中的數(shù)據(jù),例如設(shè)計(jì)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等;機(jī)器數(shù)據(jù)是指由傳感器、儀器儀表和智能終端等采集的數(shù)據(jù)。近年來,由人產(chǎn)生的數(shù)據(jù)規(guī)模的比重正逐步降低,企業(yè)信息化和工業(yè)物聯(lián)網(wǎng)中機(jī)器產(chǎn)生的海量時(shí)序數(shù)據(jù)是工業(yè)數(shù)據(jù)規(guī)模變大的主要來源,機(jī)器數(shù)據(jù)所占據(jù)的比重將越來越大。
圖4 工業(yè)大數(shù)據(jù)的來源
工業(yè)大數(shù)據(jù)作為對(duì)工業(yè)相關(guān)要素的數(shù)字化描述和在賽博空間的映像,首先符合大數(shù)據(jù)的4V特征[4],即大規(guī)模(volume)、速度快(velocity)、類型雜(variety)、低質(zhì)量(veracity)。相對(duì)于其他類型大數(shù)據(jù),工業(yè)大數(shù)據(jù)還具有反映工業(yè)邏輯的多模態(tài)、強(qiáng)關(guān)聯(lián)、高通量等新特征。
多模態(tài)是指工業(yè)大數(shù)據(jù)必須反映工業(yè)系統(tǒng)的系統(tǒng)化特征及其各方面要素,包括工業(yè)領(lǐng)域中“光、機(jī)、電、液、氣”等多學(xué)科、多專業(yè)信息化軟件產(chǎn)生的不同種類的非結(jié)構(gòu)化數(shù)據(jù)。比如三維產(chǎn)品模型文件不僅包含幾何造型信息,還包含尺寸、工差、定位、物性等其他信息;同時(shí),飛機(jī)、風(fēng)機(jī)、機(jī)車等復(fù)雜產(chǎn)品的數(shù)據(jù)又涉及機(jī)械、電磁、流體、聲學(xué)、熱學(xué)等多學(xué)科、多專業(yè)。
強(qiáng)關(guān)聯(lián)反映的是工業(yè)的系統(tǒng)性及其復(fù)雜動(dòng)態(tài)關(guān)系,不是數(shù)據(jù)字段的關(guān)聯(lián),本質(zhì)是指物理對(duì)象之間和過程的語義關(guān)聯(lián)。包括產(chǎn)品部件之間的關(guān)聯(lián)關(guān)系,生產(chǎn)過程的數(shù)據(jù)關(guān)聯(lián),產(chǎn)品生命周期設(shè)計(jì)、制造、服務(wù)等不同環(huán)節(jié)數(shù)據(jù)之間的關(guān)聯(lián)以及在產(chǎn)品生命周期的統(tǒng)一階段涉及的不同學(xué)科不同專業(yè)的數(shù)據(jù)關(guān)聯(lián)。
高通量即工業(yè)傳感器要求瞬時(shí)寫入超大規(guī)模數(shù)據(jù)。嵌入了傳感器的智能互聯(lián)產(chǎn)品已成為工業(yè)互聯(lián)網(wǎng)時(shí)代的重要標(biāo)志,用機(jī)器產(chǎn)生的數(shù)據(jù)代替人產(chǎn)生的數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)的感知。從工業(yè)大數(shù)據(jù)的組成體量上來看,物聯(lián)網(wǎng)數(shù)據(jù)已成為工業(yè)大數(shù)據(jù)的主體。以風(fēng)機(jī)裝備為例,根據(jù)IEC61400-25標(biāo)準(zhǔn),持續(xù)運(yùn)轉(zhuǎn)風(fēng)機(jī)的故障狀態(tài),其數(shù)據(jù)采樣頻率為50 Hz,單臺(tái)風(fēng)機(jī)每秒產(chǎn)生225 KB傳感器數(shù)據(jù),按2萬臺(tái)風(fēng)機(jī)計(jì)算,如果全量采集,則寫入速率為4.5 GB/s??傮w而言,機(jī)器設(shè)備產(chǎn)生的時(shí)序數(shù)據(jù)的特點(diǎn)包括海量的設(shè)備與測(cè)點(diǎn)、數(shù)據(jù)采集頻度高(產(chǎn)生速度快)、數(shù)據(jù)總吞吐量大、7×24 h持續(xù)不斷,呈現(xiàn)出“高通量”的特征。
企業(yè)信息化數(shù)據(jù)是工業(yè)領(lǐng)域傳統(tǒng)數(shù)據(jù)資產(chǎn),也是工業(yè)大數(shù)據(jù)的第一個(gè)來源。在傳統(tǒng)制造業(yè)企業(yè)信息化系統(tǒng)中,廣義產(chǎn)品生命周期管理(product lifecycle management,PLM)系統(tǒng)主要支持產(chǎn)品開發(fā),企業(yè)資源計(jì)劃(enterprise resource planning,ERP)系統(tǒng)負(fù)責(zé)“人財(cái)物、產(chǎn)供銷”,供應(yīng)鏈管理(supply chain management,SCM)系統(tǒng)協(xié)調(diào)供應(yīng)鏈,客戶關(guān)系管理(customer relationship management,CRM)系統(tǒng)服務(wù)于企業(yè)客戶和用戶,制造企業(yè)生產(chǎn)過程執(zhí)行系統(tǒng)(manufacturing execution system,MES)負(fù)責(zé)制造執(zhí)行,維護(hù)、維修和運(yùn)營(yíng)(maintenance,repair and operations,MRO)系統(tǒng)支持售后服務(wù)⑨http://mro.thss.tsinghua.edu.cn/等。這些企業(yè)信息化系統(tǒng)積累的產(chǎn)品研發(fā)數(shù)據(jù)、生產(chǎn)制造數(shù)據(jù)、物流供應(yīng)數(shù)據(jù)以及客戶服務(wù)數(shù)據(jù)多以結(jié)構(gòu)化數(shù)據(jù)的形態(tài)存儲(chǔ)在企業(yè)數(shù)據(jù)庫(kù)系統(tǒng)中,計(jì)算機(jī)輔助設(shè)計(jì)(computer aided design,CAD)、仿真等研發(fā)軟件產(chǎn)生的非結(jié)構(gòu)化工程數(shù)據(jù)則通過文件方式管理。
圖5 波音公司“以過程為中心”與“以數(shù)據(jù)為中心”信息化對(duì)比分析
在企業(yè)信息化領(lǐng)域,信息系統(tǒng)是數(shù)據(jù)和流程的綜合體,二者聯(lián)系緊密。圖5是波音公司20多年前“以數(shù)據(jù)為中心”的信息化架構(gòu)。20世紀(jì)90年代,隨著空中客車公司的崛起,波音公司危機(jī)四伏,訂單下降,美譽(yù)度也隨之下降。危難之際,波音公司當(dāng)時(shí)新上任的董事長(zhǎng)武達(dá)德特別注重波音公司信息系統(tǒng)建設(shè),成功解決了“信息孤島”問題,極大地改善了波音公司業(yè)績(jī)。具體方法就是以數(shù)據(jù)為中心,把產(chǎn)品數(shù)據(jù)、工藝數(shù)據(jù)、項(xiàng)目數(shù)據(jù)等有機(jī)融合在一起,構(gòu)成邏輯上的單一產(chǎn)品數(shù)據(jù)源,然后在數(shù)據(jù)集上重構(gòu)業(yè)務(wù)流程。從客服到客戶,提供端到端的服務(wù)模式,讓業(yè)務(wù)流程圍著數(shù)據(jù)轉(zhuǎn)。由此可見,流程是產(chǎn)生數(shù)據(jù)的來源,也是消費(fèi)數(shù)據(jù)的歸宿,數(shù)據(jù)是支持流程無縫、高效運(yùn)行的原材料,二者不可分離。
從數(shù)據(jù)流動(dòng)的視角來看,企業(yè)信息化解決了工業(yè)領(lǐng)域“有數(shù)據(jù)”的問題,網(wǎng)絡(luò)化解決了“能流動(dòng)”的問題,工業(yè)大數(shù)據(jù)要解決數(shù)據(jù)“智能化”的問題?!靶畔⒒蹦軌虬颜_的數(shù)據(jù)在正確的時(shí)間以正確的方式傳遞給正確的人和機(jī)器,“智能化”則把海量的工業(yè)數(shù)據(jù)轉(zhuǎn)化為信息,信息轉(zhuǎn)化為知識(shí),知識(shí)轉(zhuǎn)化為科學(xué)決策,以應(yīng)對(duì)和解決制造過程的復(fù)雜性和不確定性等問題,其目標(biāo)在于不斷提高制造資源的配置效率。
企業(yè)信息化主要解決的是數(shù)據(jù)單元傳遞問題,工業(yè)大數(shù)據(jù)則主要是基于數(shù)據(jù)集合分析問題。如圖6所示,這是一個(gè)制造業(yè)復(fù)雜裝備階段活動(dòng)示意[5],業(yè)務(wù)活動(dòng)沿實(shí)線部分從上游往下游傳遞,它主要反映了訂單、票據(jù)等數(shù)據(jù)是否正確,這是信息化過程中需要解決的核心問題。虛線主要是反饋部分,通過分析數(shù)據(jù)集發(fā)現(xiàn)業(yè)務(wù)規(guī)律和決策準(zhǔn)則,然后反饋給前面的各個(gè)環(huán)節(jié)使用,從而形成數(shù)據(jù)全生命周期的閉環(huán),這就是信息化和大數(shù)據(jù)智能化的區(qū)別,然而兩者又是不可分割的。
工業(yè)互聯(lián)網(wǎng)可以從網(wǎng)絡(luò)、數(shù)據(jù)和安全3個(gè)方面理解。其中,網(wǎng)絡(luò)是基礎(chǔ),即通過工業(yè)全系統(tǒng)的互聯(lián)互通,促進(jìn)工業(yè)數(shù)據(jù)的無縫集成;數(shù)據(jù)是核心,即通過工業(yè)數(shù)據(jù)全周期的應(yīng)用,實(shí)現(xiàn)機(jī)器彈性生產(chǎn)、運(yùn)營(yíng)管理優(yōu)化、生產(chǎn)協(xié)同組織與商業(yè)模式創(chuàng)新,推動(dòng)工業(yè)智能化發(fā)展;安全是保障,即通過構(gòu)建涵蓋工業(yè)全系統(tǒng)的安全防護(hù)體系,保障工業(yè)智能化的實(shí)現(xiàn)。工業(yè)互聯(lián)網(wǎng)的發(fā)展體現(xiàn)了多個(gè)產(chǎn)業(yè)生態(tài)系統(tǒng)的融合,是構(gòu)建工業(yè)生態(tài)系統(tǒng)、實(shí)現(xiàn)工業(yè)智能化發(fā)展的必由之路。
工業(yè)大數(shù)據(jù)是智能制造與工業(yè)互聯(lián)網(wǎng)的核心,其本質(zhì)是通過促進(jìn)數(shù)據(jù)的自動(dòng)流動(dòng)解決控制和業(yè)務(wù)問題,減少?zèng)Q策過程帶來的不確定性,并盡量克服人工決策的缺點(diǎn)。隨著互聯(lián)網(wǎng)與工業(yè)的深度融合,機(jī)器數(shù)據(jù)的傳輸方式由局域網(wǎng)絡(luò)走向廣域網(wǎng)絡(luò),從管理企業(yè)內(nèi)部的機(jī)器拓展到管理企業(yè)外部的機(jī)器,支撐人類和機(jī)器邊界的重構(gòu)、企業(yè)和社會(huì)邊界的重構(gòu),釋放工業(yè)互聯(lián)網(wǎng)的價(jià)值。
工業(yè)大數(shù)據(jù)的應(yīng)用主要是實(shí)現(xiàn)制造業(yè)企業(yè)生命周期的智能化水平提升,以智能化生產(chǎn)為核心,涵蓋了從設(shè)計(jì)研發(fā)、生產(chǎn)制造、經(jīng)營(yíng)管理到售后服務(wù)的整個(gè)流程,實(shí)現(xiàn)提質(zhì)增效。隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展,企業(yè)的數(shù)據(jù)從內(nèi)部數(shù)據(jù)實(shí)現(xiàn)了跨界,應(yīng)用也隨之拓展到“互聯(lián)網(wǎng)+用戶”“互聯(lián)網(wǎng)+產(chǎn)業(yè)鏈”“互聯(lián)網(wǎng)+服務(wù)”等場(chǎng)景。工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟發(fā)布的《工業(yè)互聯(lián)網(wǎng)體系架構(gòu)》對(duì)此進(jìn)行了總結(jié),將其分成了4類典型場(chǎng)景:智能化生產(chǎn)、個(gè)性化定制、網(wǎng)絡(luò)化協(xié)同、服務(wù)化延伸。
圖6 信息化與大數(shù)據(jù):數(shù)據(jù)單元傳遞與數(shù)據(jù)集合分析
以采礦為例,圖7是未來智慧礦山的場(chǎng)景。傳統(tǒng)礦山經(jīng)營(yíng)過程中有很多裝備,一般是按照數(shù)月前擬定的計(jì)劃生產(chǎn),不能很好地滿足市場(chǎng)的實(shí)際需求,經(jīng)常會(huì)存在過度生產(chǎn)或者生產(chǎn)不足的問題[6]。未來可以通過工業(yè)大數(shù)據(jù)直接感知市場(chǎng)需求,通過市場(chǎng)分析可以知道哪一種鐵礦石配比在當(dāng)前市場(chǎng)上適銷,據(jù)此確定各種鐵礦石的生產(chǎn)需求,并制定生產(chǎn)計(jì)劃,然后實(shí)時(shí)將操作命令下達(dá)到相應(yīng)的智能化工程裝備,指揮這些工程裝備協(xié)同工作,這就是跨尺度的信息集成和優(yōu)化。也就是說,把當(dāng)天的市場(chǎng)需求通過大數(shù)據(jù)挖掘出來,直接傳達(dá)到設(shè)備上,變成設(shè)備的行動(dòng)和操作。還可以通過設(shè)備網(wǎng)絡(luò)化,實(shí)時(shí)獲取裝備工況數(shù)據(jù)。當(dāng)工程裝備出現(xiàn)問題或異常時(shí),及時(shí)地發(fā)現(xiàn)問題,找到問題的原因。另外,還可以通過大數(shù)據(jù)構(gòu)建基于規(guī)則或案例的故障預(yù)測(cè)系統(tǒng),對(duì)裝備狀態(tài)進(jìn)行預(yù)測(cè),更好地保障設(shè)備健康。
由此可見,工業(yè)大數(shù)據(jù)是提升工業(yè)生產(chǎn)效率,降低能耗,轉(zhuǎn)變高耗能、低效率、勞動(dòng)密集的粗放型生產(chǎn)面貌的必要手段。結(jié)合數(shù)控機(jī)床、工業(yè)機(jī)器人等自動(dòng)生產(chǎn)設(shè)備的使用,并建立從經(jīng)營(yíng)到生產(chǎn)系統(tǒng)貫通融合的數(shù)據(jù)流,做到數(shù)據(jù)全打通和數(shù)據(jù)流通不落地,可以提升企業(yè)整體生產(chǎn)效率,降低勞動(dòng)力投入,有效管理并優(yōu)化各種資源的流轉(zhuǎn)與消耗。大數(shù)據(jù)也是實(shí)現(xiàn)工業(yè)企業(yè)從制造向服務(wù)轉(zhuǎn)型的關(guān)鍵支撐技術(shù)。工業(yè)領(lǐng)域智能服務(wù)的本質(zhì)就是智能產(chǎn)品加上感知控制能力和大數(shù)據(jù)分析,通過對(duì)產(chǎn)品使用過程中的自身工作狀況、周邊環(huán)境、用戶操作行為等數(shù)據(jù)進(jìn)行采集和分析,可以提供在線健康檢測(cè)、故障診斷預(yù)警等服務(wù)以及支持在線租用、按使用付費(fèi)等新的服務(wù)模型。
圖7 未來智慧礦山的場(chǎng)景
圖8是基于數(shù)據(jù)庫(kù)視角的大數(shù)據(jù)系統(tǒng)軟件技術(shù)架構(gòu),涉及物聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)、數(shù)據(jù)處理、流處理、數(shù)據(jù)分析、批處理和機(jī)器學(xué)習(xí)等技術(shù)。關(guān)系數(shù)據(jù)庫(kù)存放的是結(jié)構(gòu)化的關(guān)系數(shù)據(jù),是企業(yè)信息化支撐技術(shù),數(shù)據(jù)庫(kù)是先有模式后有數(shù)據(jù),即先定義數(shù)據(jù)庫(kù)表,然后才能插入數(shù)據(jù);與數(shù)據(jù)庫(kù)不同,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等產(chǎn)生的大多是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)往往是設(shè)備產(chǎn)生的,先有數(shù)據(jù),后有模式。
在工業(yè)的ERP、PLM、SCM、CRM等系統(tǒng)中,20%的“SQL小數(shù)據(jù)”具有80%的價(jià)值密度,而物聯(lián)網(wǎng)或互聯(lián)網(wǎng)中,80%的“非結(jié)構(gòu)化大數(shù)據(jù)”密度只有20%的價(jià)值密度,甚至更低。因此,工業(yè)數(shù)據(jù)中20%的工業(yè)“小數(shù)據(jù)”需要“引爆”80%的工業(yè)“大數(shù)據(jù)”的價(jià)值。工業(yè)大數(shù)據(jù)應(yīng)用本質(zhì)上就是要綜合利用結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),從中提煉出隱含的模式,形成知識(shí),從而使工業(yè)制造和服務(wù)更加智能化。
工業(yè)大數(shù)據(jù)更關(guān)注數(shù)據(jù)源的“完整性”,而不僅僅是數(shù)據(jù)的規(guī)模,因此對(duì)數(shù)據(jù)管理有較高要求。工業(yè)大數(shù)據(jù)應(yīng)用需要實(shí)現(xiàn)數(shù)據(jù)在物理信息、產(chǎn)業(yè)鏈、跨界3個(gè)層次的融合。由于“信息孤島”的存在,這些數(shù)據(jù)源通常是離散和非同步的,這與其他領(lǐng)域大數(shù)據(jù)集成具有明顯差異,因此不僅需要從數(shù)據(jù)模型,更需要從制造過程、層次化物料表(bill of material,BOM)結(jié)構(gòu)、運(yùn)行環(huán)境等多類型工業(yè)語義層面對(duì)工業(yè)大數(shù)據(jù)進(jìn)行一體化整合管理,其中BOM是產(chǎn)品全生命周期數(shù)據(jù)集成的關(guān)鍵手段。
圖8 基于數(shù)據(jù)庫(kù)視角的大數(shù)據(jù)系統(tǒng)軟件技術(shù)架構(gòu)
工業(yè)大數(shù)據(jù)生命周期包括采集、管理、處理、分析和應(yīng)用5個(gè)環(huán)節(jié)。工業(yè)大數(shù)據(jù)處理是一個(gè)數(shù)據(jù)集到另一個(gè)數(shù)據(jù)集的“物理”過程。工業(yè)大數(shù)據(jù)分析就是要利用機(jī)器學(xué)習(xí)、深度網(wǎng)絡(luò)等人工智能算法,從訓(xùn)練數(shù)據(jù)集里學(xué)習(xí)未知的模型,這個(gè)模型就是一個(gè)基于數(shù)據(jù)集(X,Y),求Y=F(X)計(jì)算式中F函數(shù)的過程。簡(jiǎn)而言之,工業(yè)大數(shù)據(jù)分析是從訓(xùn)練數(shù)據(jù)集到模型的“化學(xué)”過程。
工業(yè)大數(shù)據(jù)應(yīng)用在工業(yè)互聯(lián)網(wǎng)中的應(yīng)用可分為4個(gè)層次:監(jiān)視、控制、優(yōu)化、自主。監(jiān)視就是要能遠(yuǎn)程實(shí)時(shí)監(jiān)測(cè)裝備的運(yùn)行狀態(tài);控制就是要實(shí)現(xiàn)操作者對(duì)機(jī)器的遠(yuǎn)程遙控,讓機(jī)器能夠執(zhí)行操作者遠(yuǎn)程下達(dá)的操作指令;優(yōu)化就是要基于海量工業(yè)大數(shù)據(jù)發(fā)現(xiàn)知識(shí),提供在線運(yùn)行調(diào)度、健康檢測(cè)、故障診斷預(yù)警等裝備在線運(yùn)維服務(wù);自主就是要實(shí)現(xiàn)裝備的自主決策和裝備集群的自主協(xié)同,通過“機(jī)器換人”實(shí)現(xiàn)生產(chǎn)運(yùn)維的少人化和無人化。
圖9是一個(gè)服務(wù)器主板生產(chǎn)流程。上料之后,第一個(gè)業(yè)務(wù)環(huán)節(jié)是錫膏印刷,然后是貼裝電子元組件,之后是回流焊,看起來是一個(gè)比較簡(jiǎn)短的流程,但生產(chǎn)過程中會(huì)出現(xiàn)器件偏移、立碑、覆蓋件漏印、爬錫短路等故障。電子器件因此將會(huì)出現(xiàn)質(zhì)量問題,會(huì)給生產(chǎn)廠商造成嚴(yán)重的經(jīng)濟(jì)和聲譽(yù)損失。
為了解決這個(gè)問題,在生產(chǎn)線流程中增加了兩個(gè)自動(dòng)化質(zhì)量檢測(cè)環(huán)節(jié),如圖10所示。
相比于圖9,圖10增加了錫膏印刷檢測(cè)(solder paste inspection,SPI)和自動(dòng)光學(xué)檢測(cè)(automatic optic inspection,AOI)環(huán)節(jié)。增加這兩個(gè)檢測(cè)環(huán)節(jié)后,需增加人工復(fù)判環(huán)節(jié),而由于人工復(fù)判存在不穩(wěn)定的問題,質(zhì)量檢測(cè)成功率并未達(dá)到預(yù)期要求,企業(yè)為此付出了較大的人力成本,甚至經(jīng)濟(jì)損失。
圖9 電子元器件表面貼裝生產(chǎn)流程
基于積累的主板焊點(diǎn)SPI質(zhì)量檢測(cè)數(shù)據(jù)和主板AOI質(zhì)量數(shù)據(jù),采用基于機(jī)器學(xué)習(xí)的智能復(fù)判算法,判定焊點(diǎn)質(zhì)量合格率。由于這些不同類型故障的數(shù)據(jù)是相互交織在一起的,需要用機(jī)器學(xué)習(xí)的辦法進(jìn)行復(fù)雜的數(shù)據(jù)集分類,然后采用隨機(jī)森林的辦法形成了一個(gè)基于人工智能的電子器件表面貼裝“故障復(fù)判機(jī)器人”。該算法只需要把5個(gè)參數(shù)輸入,就可以判斷服務(wù)器主板每個(gè)焊點(diǎn)是否合格,極大提升了服務(wù)器主板制造的品質(zhì)穩(wěn)定性與合格率⑩http://video.e-works.net.cn/Video/Video Detail.aspx?vid=3277amp;sid=268。
圖10 加入檢測(cè)環(huán)節(jié)后的電子器件表面貼裝生產(chǎn)流程
工業(yè)大數(shù)據(jù)創(chuàng)造價(jià)值的過程才剛剛開始,工業(yè)大數(shù)據(jù)的價(jià)值不僅在于對(duì)現(xiàn)有業(yè)務(wù)的優(yōu)化,更在于支撐企業(yè)、行業(yè)乃至全社會(huì)的創(chuàng)新、轉(zhuǎn)型和發(fā)展。伴隨著工業(yè)互聯(lián)網(wǎng)的不斷普及,工業(yè)大數(shù)據(jù)應(yīng)用價(jià)值將逐步釋放,智能制造也將得到長(zhǎng)足發(fā)展。當(dāng)前,工業(yè)大數(shù)據(jù)仍處在高速發(fā)展的歷史階段,其概念內(nèi)涵、技術(shù)方法、價(jià)值創(chuàng)造模式還在不斷創(chuàng)新演化之中,需要努力和大膽地創(chuàng)新實(shí)踐。應(yīng)該針對(duì)智能制造和工業(yè)互聯(lián)網(wǎng)的創(chuàng)新需求,把工業(yè)大數(shù)據(jù)的應(yīng)用與工業(yè)自身提高質(zhì)量、降低成本、提升管理水平的需求結(jié)合起來,特別要與中國(guó)工業(yè)的發(fā)展階段和結(jié)構(gòu)特點(diǎn)結(jié)合起來,走出有中國(guó)特色的工業(yè)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)創(chuàng)新路線,助力中國(guó)工業(yè)彎道取直與加速騰飛。
感謝清華大學(xué)軟件學(xué)院、大數(shù)據(jù)系統(tǒng)軟件國(guó)家工程實(shí)驗(yàn)室、北京工業(yè)大數(shù)據(jù)創(chuàng)新中心和工業(yè)大數(shù)據(jù)系統(tǒng)與應(yīng)用北京市重點(diǎn)實(shí)驗(yàn)室的同事們。
[1] PORTER M E, HEPPELMANN J E.How smart connected products are transforming competition[J]. Harvard Business Review, 2014(11): 65-88.
[2] 工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟工業(yè)大數(shù)據(jù)特設(shè)組. 工業(yè)大數(shù)據(jù)技術(shù)與應(yīng)用實(shí)踐(2017)[M]. 北京:電子工業(yè)出版社, 2017.Industrial Big Data Task Group of Alliance of Industrial Internet. Technology and application practice of industrial big data(2017)[M]. Beijing: Publishing House of Electronics Industry, 2017.
[3] 王建民. 工業(yè)大數(shù)據(jù)技術(shù)[J]. 電信網(wǎng)技術(shù),2016(8): 1-5.WANG J M. Technology of industrial big data[J]. Telecommunications Network Technology, 2016(8): 1-5.
[4] MANYYIKA J, CHUI M, BROWN B, et al.Big data: the next frontier for innovation,competition, and productivity[M]. [S.l:s.n.], 2011.
[5] 莫欣農(nóng). 跨生命周期數(shù)據(jù)管理平臺(tái)助力中國(guó)制造服務(wù)轉(zhuǎn)型[J]. 科技縱覽, 2015(8): 58-60.MO X N. Cross lifecycle data management platform promotes transformation of manufacturing services in China[J]. IEEE Spectrum, 2015(8): 58-60.
[6] DAYAL U, GUPTA C, VENNELAKANTI R,et al. An approach to benchmarking industrial big data applications[C]// WBDB 2014, August 5-6, 2014, Potsdam,Germany. Berlin: Springer International Publishing, 2014: 45-60.
Survey on industrial big data
WANG Jianmin
School of Software, Tsinghua University, Beijing 100084, China
Industrial big data is a collection of data in the industry application, which consist of business data in the information system,machine data in the industrial IoT system, and related data in the related websites. Industrial big data is a very important component of industrial internet. The main resources of the industrial big data were analyzed with introduction of the industrial internet. Then the relationships among “industrial big data, enterprise digitalization and industrial internet” were discussed. The“multi-typed, high-throughput, and strong-correlated” characteristics of industrial big data were presented. A typical industrial big data application scenario with “cross-time-scale, cross-supply-chain, and cross-organization” was shown. Furthermore,Industrial big data software architecture was discussed and a real-life application case was shown.
industrial big data, industrial internet, big data software, system architecture
The National Key Research and Development Program of China (No.2016YFB1000700)
TP399
A
10.11959/j.issn.2096-0271.2017057
王建民(1968-),男,博士,清華大學(xué)軟件學(xué)院教授、博士生導(dǎo)師、院長(zhǎng),信息學(xué)院副院長(zhǎng),數(shù)據(jù)科學(xué)研究院副院長(zhǎng)、管理委員會(huì)副主任,大數(shù)據(jù)系統(tǒng)軟件國(guó)家工程實(shí)驗(yàn)室執(zhí)行主任,工業(yè)大數(shù)據(jù)系統(tǒng)與應(yīng)用北京市重點(diǎn)實(shí)驗(yàn)室主任。主要研究方向?yàn)榇髷?shù)據(jù)系統(tǒng)軟件、工業(yè)大數(shù)據(jù)、產(chǎn)品全生命周期管理、業(yè)務(wù)過程管理等。
2017-10-18
“十三五”國(guó)家重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2016YFB1000700)