鐘放鴻 林翌臻 舒夢 林聰 沈冬暉 姚海濱
[摘? ? 要] 香煙包裝機通過綜合檢測平臺接入了大量的外掛檢測器,可以獲得大量的一線實時數(shù)據(jù)。本文研究利用香煙包裝機綜合檢測平臺,利用大數(shù)據(jù)分析方法開發(fā)大數(shù)據(jù)分析軟件,從中挖掘有用信息,用來指導故障定位,改進工藝過程,降低廢品廢料,提高生產效率和產品質量,不斷提高生產制造水平。
[關鍵詞] 檢測器;包裝機;大數(shù)據(jù)分析;集控
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 21. 031
[中圖分類號] F270.7? ? [文獻標識碼]? A? ? ? [文章編號]? 1673 - 0194(2018)21- 0080- 03
0? ? ? ?引? ? 言
香煙的包裝是卷煙生產中非常重要的工序,包裝質量不合格的產品流入市場會給企業(yè)聲譽帶來嚴重影響。現(xiàn)在香煙生產企業(yè)為提高產品質量在包裝機上加裝了很多檢測裝置,但已安裝的檢測裝置只實現(xiàn)了檢測缺陷后剔除或告警的功能,并沒有對生產的異常產品的原因進行分析,無法指導用戶提高生產水平,減少殘次品的比例。
這些檢測裝置可以集成到香煙包裝機綜合檢測平臺上,香煙包裝機綜合檢測平臺即能獲取到大量的實時檢測數(shù)據(jù),一線實時檢測數(shù)據(jù)直接反映了當前的生產狀況、設備狀況和包裝質量,對這些數(shù)據(jù)運用大數(shù)據(jù)分析方法,進行提取分析,結果可以及時通知用戶解決當前的故障,并通過具體的分析定位到具體的故障點,可以大大降低使用者和維護者的技術要求及工作強度。利用信息化手段進行煙草生產過程數(shù)據(jù)的監(jiān)測、預測、控制,對煙草成品質量的提升具有重要意義,最終推動生產制造水平的不斷提升。
1? ? ? 設計思路
1.1? ?香煙包裝機綜合檢測平臺
香煙包裝機為檢測包裝質量不合格的產品在各個工位加裝了很多外掛檢測器,這些外掛檢測器一般都獨自運行,香煙包裝機綜合檢測平臺是為了把香煙包裝機上大量的外掛檢測器集中起來進行控制。所有外掛檢測器的邏輯處理都在該平臺上運行。該平臺包含若干個虛擬機,每個虛擬機對應一個或多個外掛檢測器的功能,這些虛擬機上就擁有了對應的大量實時運行和檢測數(shù)據(jù)。這些數(shù)據(jù)體現(xiàn)了機器運行狀況、產品質量、異常狀況等。
1.2? ?大數(shù)據(jù)
大數(shù)據(jù)的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。
大數(shù)據(jù)需要特殊的技術,以有效地處理大量的容忍經過時間內的數(shù)據(jù)。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網和可擴展的存儲系統(tǒng)。
1.3? ?大數(shù)據(jù)分析
1.3.1? ?可視化分析
不管是對數(shù)據(jù)分析專家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求??梢暬梢灾庇^地展示數(shù)據(jù),讓數(shù)據(jù)自己說話,讓觀眾聽到結果。
1.3.2? ?數(shù)據(jù)挖掘算法
可視化是給人看的,數(shù)據(jù)挖掘就是給機器看的。集群、分割、孤立點分析還有其他的算法讓我們深入數(shù)據(jù)內部,挖掘價值。這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。
1.3.3? ?預測性分析能力
數(shù)據(jù)挖掘可以讓分析員更好地理解數(shù)據(jù),而預測性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結果做出一些預測性的判斷。
1.3.4? ?語義引擎
我們知道由于非結構化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新的挑戰(zhàn),我們需要一系列的工具去解析、提取、分析數(shù)據(jù)。語義引擎需要被設計成能夠從“文檔”中智能提取信息。
1.3.5? ?數(shù)據(jù)質量和數(shù)據(jù)管理
數(shù)據(jù)質量和數(shù)據(jù)管理是一些管理方面的最佳實踐。通過標準化的流程和工具對數(shù)據(jù)進行處理可以保證一個預先定義好的高質量的分析結果。
1.3.6? ?數(shù)據(jù)存儲,數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是為了便于多維分析和多角度展示數(shù)據(jù)按特定模式進行存儲所建立的關系型數(shù)據(jù)庫。為智能系統(tǒng)提供數(shù)據(jù)抽取、轉換和加載(ETL),并按主題對數(shù)據(jù)進行查詢和訪問,為聯(lián)機數(shù)據(jù)分析和數(shù)據(jù)挖掘提供數(shù)據(jù)平臺。
1.4? ?大數(shù)據(jù)處理
具體的大數(shù)據(jù)處理方法其實有很多,但是根據(jù)長時間的實踐,筆者總結了一個基本的大數(shù)據(jù)處理流程,并且這個流程應該能夠對大家理順大數(shù)據(jù)的處理有所幫助。整個處理流程可以概括為四步,分別是采集、導入和預處理、統(tǒng)計和分析以及挖掘。
1.4.1? ?采集
大數(shù)據(jù)的采集是指利用多個數(shù)據(jù)庫來接收發(fā)自客戶端(Web、App或者傳感器形式等)的數(shù)據(jù),并且用戶可以通過這些數(shù)據(jù)庫來進行簡單的查詢和處理工作。在大數(shù)據(jù)的采集過程中,其主要特點和挑戰(zhàn)是并發(fā)數(shù)高,因為同時有可能要收集成千上萬的數(shù)據(jù)。
1.4.2? ?導入/預處理
雖然采集端本身會有很多數(shù)據(jù)庫,但是如果要對這些海量數(shù)據(jù)進行有效的分析,還是應該將這些來自前端的數(shù)據(jù)導入到一個集中的大型數(shù)據(jù)庫,并且可以在導入基礎上做一些簡單的清洗和預處理工作。導入與預處理過程的特點和挑戰(zhàn)主要是導入的數(shù)據(jù)量大,每秒鐘的導入量經常會達到百兆。
1.4.3? ?統(tǒng)計/分析
統(tǒng)計與分析主要利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內的海量數(shù)據(jù)進行普通的分析和分類匯總等,以滿足大多數(shù)常見的分析需求。統(tǒng)計與分析的主要特點和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對系統(tǒng)資源,特別是I/O會有極大的占用。
1.4.4? ?挖掘
數(shù)據(jù)挖掘主要是在現(xiàn)有數(shù)據(jù)上面進行基于各種算法的計算,從而起到預測(Predict)的效果,實現(xiàn)一些高級別數(shù)據(jù)分析的需求。比較典型的算法有用于聚類的K-Means、用于統(tǒng)計學習的SVM和用于分類的Naive Bayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰(zhàn)主要是用于挖掘的算法很復雜,并且計算涉及的數(shù)據(jù)量和計算量都很大,常用數(shù)據(jù)挖掘算法都以單線程為主。
2? ? ? 系統(tǒng)設計
香煙包裝機綜合檢測平臺的核心是中心服務器,外掛檢測裝置硬件通過路由器以以太網方式接入中心服務器。中心服務器是整個平臺的核心,部署了若干個虛擬機,完成所有的檢測功能。從各個虛擬機上可以獲取所有的實時檢測數(shù)據(jù),大數(shù)據(jù)分析的來源就是這些數(shù)據(jù)。本系統(tǒng)結構可以分為兩部分,一部分是數(shù)據(jù)端,另一部分是處理端。
2.1? ?數(shù)據(jù)端
本研究需要的數(shù)據(jù)來源比較單一,各個虛擬機上運行的功能軟件均能提供。如下所述。
2.1.1? ?煙支空頭檢測
用于檢測煙支兩個端面,過濾嘴側檢查是否缺失過濾嘴,煙絲側檢測是否煙絲內陷、空頭??梢蕴峁┑臄?shù)據(jù)有濾嘴圖像、空頭圖像、煙支生產速度、剔除率、生產效率、異常報警等。
2.1.2? ?五輪檢測
用于檢測煙盒內襯紙是否缺失、褶皺、歪斜等。可以提供的數(shù)據(jù)有小包內襯紙圖像、當前位置小包的生產速度、剔除率、生產效率、異常報警等。
2.1.3? ?小包外觀檢測
用于檢測包裝機主機出口處的小包外觀包裝是否錯牌、缺失、褶皺、歪斜、圖案是否清晰等。可以提供的數(shù)據(jù)有小包外觀圖像、當前位置小包的生產速度、剔除率、生產效率、異常報警等。
2.1.4? ?散包檢測
用于檢測包裝機輔機入口處的小包包裝是否錯牌、缺失、褶皺、歪斜、圖案是否清晰等。可以提供的數(shù)據(jù)有小包外觀圖像、當前位置小包的生產速度、剔除率、生產效率、異常報警等。
2.1.5? ?大條外觀檢測
用于檢測大條外觀包裝是否錯牌,條盒缺失、褶皺、歪斜,透明紙褶皺、拉線錯位,圖案是否清晰等??梢蕴峁┑臄?shù)據(jù)有大條外觀圖像、當前位置大條的生產速度、剔除率、生產效率、異常報警等。
2.1.6? ?條缺包檢測
用于檢測大條里小包是否缺失、小包是否缺支等??梢蕴峁┑臄?shù)據(jù)有大條X光透視圖像、當前位置大條生產速度、剔除率、生產效率、異常報警等。
2.2? ?處理端
處理端是大數(shù)據(jù)分析的核心,針對香煙包裝機綜合檢測平臺的特性,從實用性出發(fā),結合日常生產中的實際需求,從以下方面展開分析。
2.2.1? ?運行狀況分析
計算各個檢測器的運行速度,并結合各個檢測器的安裝位置,設計一套運行狀況模型,根據(jù)不斷獲得的數(shù)據(jù)去匹配運行狀況模型,一旦發(fā)現(xiàn)偏移模型,說明有檢測器運行不正常,可以及時進行報警。
例如某品牌煙生產速度模型為煙支生產速度8 000支/分鐘,小包生產速度為400包/分鐘,大條生產速度為40條/分鐘。假如某一時段煙支空頭檢測上報的煙支生產速度為6 000支/分鐘,小包外觀檢測上報的小包生產速度為200包/分鐘,依據(jù)生產模型和煙支空頭檢測的上報,小包外觀檢測上報的生產速度應該在300包/分鐘左右,實際上獲取的是200包/分鐘,說明小包外觀檢測很有可能出現(xiàn)故障,此時就會報警,提示操作人員排查問題。
2.2.2? ?異常分析
建立異常處理庫,從上報的異常進行匹配處理方法,不斷完善異常處理庫,這樣日積月累后會覆蓋所有的異常場景,使得維護處理人員越來越方便操作,越來越省事。
例如某個檢測器時不時地報CCD1連接異常,但又沒有實際報警,此時很有可能是網絡接頭松動,系統(tǒng)自動及時提醒維護人員排查網絡接線。
例如某個檢測器獲取的圖像模糊不清晰,說明有可能是相機鏡頭松動,系統(tǒng)通過軟件進行圖像分析可以及時識別出來圖像已經模糊了,系統(tǒng)自動及時提醒維護人員進行排查CCD相機鏡頭相關問題。
2.2.3? ?數(shù)據(jù)統(tǒng)計展示
依據(jù)上報的實時數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計,建立理論統(tǒng)計模型,以動態(tài)曲線等方式進行展示,各個檢測器的狀況一目了然,界面統(tǒng)一清晰。實際運行中實時與理論統(tǒng)計模型進行比較分析,如果出入較大,說明相關的檢測器可能存在異常,系統(tǒng)自動及時提醒維護人員進行排查。
2.2.4? ?預警
設定預警指標庫,依據(jù)上報的實時數(shù)據(jù)進行分析,如果達到了某一預警指標,則系統(tǒng)自動進行提示,提醒操作人員及時排查處理。
例如某一檢測器單位時間內剔除率超過某一設定值,則進行預警,提醒及時排查原因。例如某一檢測器單位時間內平均生產率高于最大生產率,說明該檢測器檢測異常,可能是硬件原因導致,系統(tǒng)指示操作人員進行排查。
3? ? ? 結? ? 語
本文對香煙包裝機綜合檢測平臺的大數(shù)據(jù)分析進行了研究,經過前期充分的理論分析和方案論證,首臺分析系統(tǒng)經測試達到了設計要求,給用戶帶來了很大的使用便利,得到用戶的高度認可。但同時該平臺還有一些改進的空間,如香煙包裝機本身的數(shù)據(jù)沒有接入進來,還有很多待進一步分析整理挖掘的方面,后續(xù)工作應繼續(xù)改進提高并加以推廣,以充分發(fā)揮平臺的價值。
主要參考文獻
[1]周濤.為數(shù)據(jù)而生[M].成都:電子科技大學出版社,2016.
[2]何金池.大數(shù)據(jù)處理之道[M].北京:電子工業(yè)出版社,2016.
[3]陳明.大數(shù)據(jù)基礎與應用[M].北京:北京師范大學出版社,2016.