摘 要:當(dāng)前傳感器、多媒體、數(shù)據(jù)庫(kù)和無線網(wǎng)絡(luò)技術(shù)得到了快速發(fā)展和普及,并已經(jīng)在工業(yè)生產(chǎn)中得到了廣泛應(yīng)用,由此開發(fā)了工業(yè)生產(chǎn)監(jiān)控系統(tǒng)、工業(yè)設(shè)備維護(hù)系統(tǒng)、工業(yè)生產(chǎn)流程處理系統(tǒng)等,這些自動(dòng)化系統(tǒng)在運(yùn)行中積累了海量的數(shù)據(jù)資源。為了提高數(shù)據(jù)資源利用成效,發(fā)現(xiàn)數(shù)據(jù)中潛在的有價(jià)值的信息,亟需引入大數(shù)據(jù)挖掘技術(shù),主要包括K均值算法、BP神經(jīng)網(wǎng)絡(luò)、遺傳算法、關(guān)聯(lián)規(guī)則等,以便能夠提高工業(yè)大數(shù)據(jù)挖掘分析能力,建立一個(gè)先進(jìn)的數(shù)據(jù)挖掘模式,具有較強(qiáng)的應(yīng)用環(huán)境。
關(guān)鍵詞:工業(yè)大數(shù)據(jù);關(guān)聯(lián)規(guī)則;設(shè)備維護(hù);BP神經(jīng)網(wǎng)絡(luò)
1 概述
目前工業(yè)設(shè)計(jì)、生產(chǎn)制造等環(huán)節(jié)中引入了自動(dòng)化系統(tǒng),系統(tǒng)運(yùn)行積累了海量的數(shù)據(jù)資源,如何從海量數(shù)據(jù)中挖掘有價(jià)值、有用的信息,幫助工業(yè)生產(chǎn)作出正確的決策,已經(jīng)成為許多學(xué)者研究的熱點(diǎn)[1]。大數(shù)據(jù)挖掘分析可以從海量的、帶有噪聲數(shù)據(jù)的、不完全的數(shù)據(jù)記錄中發(fā)現(xiàn)隱含的模式,可以為工業(yè)數(shù)據(jù)挖掘提供契機(jī)。大數(shù)據(jù)挖掘可以使用相關(guān)的算法尋找隱藏的數(shù)據(jù)知識(shí),其功能主要包括關(guān)聯(lián)分析、聚類分析、分類預(yù)測(cè)、偏差檢測(cè)等[2]。
(1)關(guān)聯(lián)分析。工業(yè)系統(tǒng)運(yùn)行產(chǎn)生的大數(shù)據(jù)來源于設(shè)計(jì)、制造和生產(chǎn)等環(huán)節(jié),涉及各類型軟硬件設(shè)備,這些數(shù)據(jù)信息資源存在極大的關(guān)聯(lián)關(guān)系,比如簡(jiǎn)單關(guān)聯(lián)關(guān)系、時(shí)序關(guān)聯(lián)關(guān)系、設(shè)備-軟件關(guān)聯(lián)關(guān)系、日志操作關(guān)聯(lián)關(guān)系等。
(2)分類預(yù)測(cè)。應(yīng)用工業(yè)大數(shù)據(jù)的過程中,許多信息數(shù)據(jù)保存得較為繁亂,比如設(shè)備種類和數(shù)量多,設(shè)備購(gòu)置、維修、更換等運(yùn)行記錄保存日期、位置、版本較多,容易產(chǎn)生不一致。因此,分類預(yù)測(cè)可以根據(jù)工業(yè)企業(yè)管理人員的需求,引入貝葉斯理論等構(gòu)件一個(gè)分類算法,挖掘數(shù)據(jù)中相同類別的信息,這些類別可以是維修記錄、購(gòu)置記錄,也可以是時(shí)間內(nèi)容等,并且可以利用預(yù)測(cè)管理功能,預(yù)測(cè)設(shè)備運(yùn)行趨勢(shì)。
(3)聚類分析。工業(yè)大數(shù)據(jù)多是設(shè)備運(yùn)行自動(dòng)產(chǎn)生的數(shù)據(jù),相關(guān)子數(shù)據(jù)集缺乏詳細(xì)的描述信息,此時(shí)可以采用聚類分析方法,將數(shù)據(jù)劃分為多個(gè)簇,簇內(nèi)保持高度的相似性、同構(gòu)性,簇間保持較大的差別性,這就可以把相同類別的數(shù)據(jù)劃分到一組,不同類別的數(shù)據(jù)劃分到多個(gè)簇。
(4)偏差檢測(cè)。數(shù)據(jù)挖掘發(fā)現(xiàn)數(shù)據(jù)集中的離群點(diǎn)或異常數(shù)據(jù)是一個(gè)重要的功能,比如工業(yè)生產(chǎn)網(wǎng)絡(luò)安全監(jiān)測(cè),該功能被稱為偏差檢測(cè)。偏差檢測(cè)主要包括分類中的反常實(shí)例、例外模式、觀測(cè)結(jié)果對(duì)期望值存在的偏離以及量值可以隨時(shí)間的變化而變化。偏差檢測(cè)包括尋找觀察結(jié)果、參照之間的有意義差別,偏差分析的一個(gè)非常重要的特征是可以有效地過濾掉大量不感興趣的信息。
2 工業(yè)大數(shù)據(jù)挖掘分析技術(shù)及模式
工業(yè)生產(chǎn)引入自動(dòng)化系統(tǒng)始于第二次工業(yè)革命,隨著傳感器、移動(dòng)通信等技術(shù)的快速改進(jìn),工業(yè)生產(chǎn)正在向著密度更高、效率更高的綜合信息化運(yùn)行模式發(fā)展,引入了許多先進(jìn)的計(jì)算機(jī)系統(tǒng),這些系統(tǒng)運(yùn)行產(chǎn)生了海量的數(shù)據(jù)信息資源,導(dǎo)致了人們不能夠繼續(xù)使用傳統(tǒng)的生產(chǎn)模式,必須從多個(gè)方面和切入點(diǎn)進(jìn)行有效研究和發(fā)展,引入大數(shù)據(jù)挖掘分析技術(shù),一般實(shí)現(xiàn)工業(yè)生產(chǎn)科學(xué)管理,有效地控制生產(chǎn)設(shè)備,形成一個(gè)全過程生產(chǎn)模式[3]。目前,工業(yè)大數(shù)據(jù)挖掘分析技術(shù)包括多種技術(shù),最常用的包括K均值、BP神經(jīng)網(wǎng)絡(luò)、遺傳算法和貝葉斯理論等,可以從海量的流量數(shù)據(jù)中發(fā)掘潛在的有價(jià)值的信息,利用這些信息可以指導(dǎo)、創(chuàng)新工業(yè)生產(chǎn)管理模式,構(gòu)建一個(gè)大數(shù)據(jù)挖掘系統(tǒng)[4]。
(1)基于K均值算法構(gòu)建聚類分析模式。K均值是常用的主流聚類分析算法,使用工業(yè)數(shù)據(jù)之前,許多用戶不知道期望的目標(biāo),并且無法獲取更多的數(shù)據(jù)應(yīng)用背景知識(shí),因此可以利用K均值算法構(gòu)建一個(gè)自動(dòng)聚類分析的大數(shù)據(jù)模式,比如可以自動(dòng)將工業(yè)設(shè)計(jì)數(shù)據(jù)劃分為高中低等檔次,可以把高檔設(shè)計(jì)案例推薦給企業(yè),提高企業(yè)工業(yè)設(shè)計(jì)能力。
(2)基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建分類預(yù)測(cè)模型。BP神經(jīng)網(wǎng)絡(luò)是一種數(shù)據(jù)挖掘方法,其可以通過學(xué)習(xí)獲取相關(guān)的風(fēng)險(xiǎn)關(guān)鍵特征,然后將待評(píng)估的工業(yè)設(shè)備運(yùn)行狀態(tài)數(shù)據(jù)輸入到系統(tǒng)中,自動(dòng)分析設(shè)備維護(hù)次數(shù)、更新次數(shù)、使用周期,這種工業(yè)設(shè)備運(yùn)行管理模型速度快,評(píng)估結(jié)果具有較高的準(zhǔn)確度。工業(yè)大數(shù)據(jù)分類預(yù)測(cè)可以采用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建一個(gè)分類預(yù)測(cè)系統(tǒng),這樣就可以準(zhǔn)確地判斷大數(shù)據(jù)的運(yùn)行維護(hù)記錄,判斷設(shè)備日常運(yùn)行趨勢(shì),能夠提高工業(yè)設(shè)備的運(yùn)行維護(hù)效率。
3 工業(yè)大數(shù)據(jù)挖掘作用及前景
隨著自動(dòng)化控制、多媒體通信等技術(shù)的快速發(fā)展,大數(shù)據(jù)挖掘技術(shù)可以在船舶設(shè)計(jì)制造、工業(yè)生產(chǎn)安全監(jiān)測(cè)等領(lǐng)域得到應(yīng)用,實(shí)現(xiàn)自動(dòng)化制造和工業(yè)安全生產(chǎn)管理等,進(jìn)一步實(shí)現(xiàn)工業(yè)生產(chǎn)過程的智能化。
3.1 智能制造
目前,隨著工業(yè)4.0、互聯(lián)網(wǎng)+等深入發(fā)展和應(yīng)用,大數(shù)據(jù)挖掘技術(shù)可以有效地提升智能制造的相關(guān)產(chǎn)品設(shè)計(jì)、制造、生產(chǎn)和展示等階段的性能,大數(shù)據(jù)挖掘在完善產(chǎn)品設(shè)計(jì)功能、優(yōu)化產(chǎn)品性能、改進(jìn)產(chǎn)品質(zhì)量等方面具有重要的作用,可以大大提高工業(yè)產(chǎn)品的生產(chǎn)成功率和降低開發(fā)成本。比如在鋼鐵工業(yè)制造中,帶鋼生產(chǎn)工序較為復(fù)雜,涉及多個(gè)環(huán)節(jié),每一個(gè)環(huán)節(jié)的工藝設(shè)置參數(shù)較多,造成帶鋼成品很容易產(chǎn)生各類型的缺陷,比如擦傷、邊裂、劃痕、輥印、結(jié)疤和氧化鐵皮壓入等,大數(shù)據(jù)挖掘可以構(gòu)建一個(gè)集成多方面優(yōu)勢(shì)的構(gòu)建一個(gè)帶鋼缺缺陷識(shí)別模型,能夠利用圖像處理技術(shù)分析帶鋼上的各種缺陷類型,及時(shí)發(fā)現(xiàn)不合格的產(chǎn)品。
3.2 安全監(jiān)測(cè)
工業(yè)生產(chǎn)過程中,安全生產(chǎn)一直是生產(chǎn)監(jiān)管的重要方面,大數(shù)據(jù)挖掘技術(shù)可以在工業(yè)安全生產(chǎn)中發(fā)揮重要的作用。比如電力工業(yè)生產(chǎn)可以利用大數(shù)據(jù)分析技術(shù)監(jiān)控電網(wǎng)的運(yùn)行狀態(tài),并且將其輸入到虛擬仿真系統(tǒng)中,可以實(shí)時(shí)觀察電網(wǎng)運(yùn)行是否存在故障和漏洞。鋼鐵工業(yè)生產(chǎn)環(huán)境多處于高溫、封閉狀態(tài),并且已經(jīng)不利于人們的行動(dòng),可以利用傳感器、視頻攝像頭采集鋼鐵生產(chǎn)作業(yè)環(huán)境的實(shí)時(shí)狀況,并且構(gòu)建一個(gè)鋼鐵工業(yè)生產(chǎn)現(xiàn)場(chǎng)監(jiān)控系統(tǒng),可以采集鋼鐵工業(yè)生產(chǎn)、加工的實(shí)時(shí)數(shù)據(jù),將其輸入到鋼鐵工業(yè)服務(wù)器中,能夠?qū)崟r(shí)的顯示在監(jiān)控終端,比如電視墻、大屏幕上,分析鋼鐵工業(yè)的生產(chǎn)設(shè)備、作業(yè)環(huán)境等信息,確保鋼鐵工業(yè)生產(chǎn)的安全性。
4 結(jié)束語
工業(yè)生產(chǎn)涉及環(huán)節(jié)較多,每一個(gè)環(huán)節(jié)都需要采用不同種類和數(shù)量的軟件系統(tǒng)和硬件設(shè)備,這些軟硬件資源在運(yùn)行過程中產(chǎn)生了海量的數(shù)據(jù),利用K均值、BP神經(jīng)網(wǎng)絡(luò)等構(gòu)件大數(shù)據(jù)挖掘與分析系統(tǒng),能夠有效提升工業(yè)大數(shù)據(jù)分析和挖掘能力,從海量數(shù)據(jù)資源中發(fā)現(xiàn)潛在的有價(jià)值信息,提高工業(yè)生產(chǎn)決策的準(zhǔn)確度,進(jìn)一步改進(jìn)工業(yè)生產(chǎn)效率。
參考文獻(xiàn)
[1]陳良臣.大數(shù)據(jù)挖掘與分析的關(guān)鍵技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用, 2015(11):93.
[2]鄭茂寬,徐志濤,明新國(guó),等.船舶工業(yè)大數(shù)據(jù)技術(shù)應(yīng)用與發(fā)展前景分析[C]//長(zhǎng)三角地區(qū)船舶工業(yè)發(fā)展論壇,2014.
[3]宮宇,呂金壯.大數(shù)據(jù)挖掘分析在電力設(shè)備狀態(tài)評(píng)估中的應(yīng)用[J].南方電網(wǎng)技術(shù),2014,8(6):74-77.
[4]嚴(yán)明良.電力行業(yè)大數(shù)據(jù)技術(shù)及應(yīng)用研究[J].南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2015(2):1-5.