摘要:在生產(chǎn)線上出現(xiàn)產(chǎn)量突然降低時,關(guān)鍵要找準(zhǔn)主要原因,然后就可及時采取有效的措施。本文介紹的是如何使用基于粗糙集理論的數(shù)據(jù)挖掘技術(shù),使用統(tǒng)計(jì)分析方法對壓縮機(jī)生產(chǎn)線的成品率和生產(chǎn)率進(jìn)行快速的預(yù)測。
關(guān)鍵詞:商業(yè)智能;壓縮機(jī)生產(chǎn)線;粗糙集
1 前言
目前,學(xué)術(shù)界對商業(yè)智能的定義并不統(tǒng)一。商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識。幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策的工具。為了將數(shù)據(jù)轉(zhuǎn)化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術(shù)。因此,從技術(shù)層面上講,商業(yè)智能就是數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術(shù)的綜合運(yùn)用。
粗糙集理論作為一種分析不確定性數(shù)據(jù)的數(shù)學(xué)工具,與經(jīng)典集合理論是不同的。粗糙集理論認(rèn)為知識即是將對象進(jìn)行分類的依據(jù),通過這些知識可以將其劃分為不同的類別,對于知識可以用屬性和相應(yīng)的值來描述。
本文將基于粗糙集理論的的數(shù)據(jù)挖掘技術(shù),應(yīng)用于制造業(yè)的壓縮機(jī)生產(chǎn)線數(shù)據(jù)分析中,主要是因?yàn)檎麄€生產(chǎn)線數(shù)據(jù)的處理量非常大,人工處理非常困難,但隨著電子信息技術(shù)的發(fā)展,可以通過先進(jìn)計(jì)算機(jī)對大量的數(shù)據(jù)進(jìn)行技術(shù)處理,而粗糙集理論則可以簡潔高效地預(yù)測該壓縮機(jī)生產(chǎn)線的生產(chǎn)率和成品率。同時,當(dāng)生產(chǎn)過程中突然出現(xiàn)產(chǎn)量異常變化時,用統(tǒng)計(jì)學(xué)相關(guān)的分析方法依托數(shù)據(jù)庫可以迅速找出主要原因。
2 問題的提出
縮短工件生產(chǎn)流動的循環(huán)時間,提高產(chǎn)品質(zhì)量、降低次品率,降低生產(chǎn)成本,同時獲得盡可能多的經(jīng)濟(jì)效益,是生產(chǎn)企業(yè)共同追求的目標(biāo)。圖1是本課題組在黃石某壓縮機(jī)生產(chǎn)企業(yè)調(diào)研時統(tǒng)計(jì)的該廠每年生產(chǎn)100萬臺合格的壓縮機(jī)在各個次品率階段下所需的成本。由圖中可以看出,所需的成本隨著次品率的增加成正比。因此,要保證生產(chǎn)中獲得較高的成品率,必須在產(chǎn)量降低的時候,快速找出主要原因在那里,進(jìn)而提出對癥的措施。但該壓縮機(jī)企業(yè)規(guī)模不斷擴(kuò)大,產(chǎn)品越來越豐富,要分析的數(shù)據(jù)變得巨大且維數(shù)較高,很難較好地進(jìn)行人工分析。為此,必須借助更加高效率的數(shù)據(jù)挖掘技術(shù)。
3 建立壓縮機(jī)生產(chǎn)數(shù)據(jù)庫
為了對該企業(yè)生產(chǎn)線進(jìn)行有效的數(shù)據(jù)挖掘,首先要建立較完善的數(shù)據(jù)庫。首先,必須及時準(zhǔn)確地了解整個企業(yè)的生產(chǎn)狀況,以便建立合適的數(shù)據(jù)庫,做出正確的決策。
本文使用圖2所示的數(shù)據(jù)庫模型,主要包括以下數(shù)據(jù)他的信息:
第一,生產(chǎn)類數(shù)據(jù)。包括生產(chǎn)機(jī)床(類型,數(shù)量)以及壓縮機(jī)生產(chǎn)必須的一些機(jī)器設(shè)備;
第二,加工類數(shù)據(jù)。指每一零部件通過整個生產(chǎn)線的過程,包括加工的時間、用量以及每一個加工操作或加工的步驟;
第三,產(chǎn)品類數(shù)據(jù)。指產(chǎn)品的主要屬性,如每一壓縮機(jī)所含部件數(shù)量、每一部件加工完畢所需的時間等,同時,也包括制成品數(shù)據(jù)和需求數(shù)據(jù)等;
第四,設(shè)備類數(shù)據(jù)。主要指設(shè)備的狀態(tài)性數(shù)據(jù)(如運(yùn)行和損壞的時間)、切換的時間及閑置時間等等。
4 使用基于粗糙集的數(shù)據(jù)挖掘技術(shù)生產(chǎn)線數(shù)據(jù)
4.1預(yù)測生產(chǎn)率和成品率的主要步驟
主要運(yùn)用的方法是,從抽樣的數(shù)據(jù)中分析并導(dǎo)出規(guī)則,再用導(dǎo)出的規(guī)則去預(yù)測生產(chǎn)率和成品率。因條件的局限,獲得數(shù)據(jù)資源有限。本文主要介紹使用粗糙集預(yù)測成品率和生產(chǎn)率的過程步驟。
4.1.1對生產(chǎn)數(shù)據(jù)進(jìn)行預(yù)處理
一般來說,初步建立的數(shù)據(jù)庫因?yàn)楸容^冗繁,并不一定很適用于用來數(shù)據(jù)挖掘,往往需要對數(shù)據(jù)進(jìn)行一定的預(yù)處理后才能用于數(shù)據(jù)挖掘。數(shù)據(jù)庫的預(yù)處理一般是從分析初始數(shù)據(jù)庫中可能存在的問題入手,通過分析出問題,選擇合適的算法。這個步驟中一般使用數(shù)據(jù)校驗(yàn)分析;連續(xù)值離散化分析、概念泛化和數(shù)據(jù)轉(zhuǎn)換等。
4.1.2對知識進(jìn)行約簡并提煉規(guī)則
把生產(chǎn)數(shù)據(jù)預(yù)處理后,可以得到一個較完備的決策表系統(tǒng),一般來說可以進(jìn)行數(shù)據(jù)挖掘了。但是為了實(shí)現(xiàn)簡潔迅速的決策,還必須進(jìn)行知識的約簡,提煉規(guī)則。知識的約簡主要包括屬性的約簡和值的約簡。屬性的約簡可以找出制約成品率和生產(chǎn)率提高的“瓶頸”;而值的約簡能刪除掉冗余的屬性值,最后形成的決策表是一個完善而簡潔的數(shù)據(jù)庫,同時也是決策規(guī)則集合。再根據(jù)給定的正常閾值,在規(guī)則中使用高正確率和高覆蓋率的作為主要的預(yù)測規(guī)則。
4.2分析出現(xiàn)產(chǎn)量突然下降時的流程和方法
我們要達(dá)到的目的是,當(dāng)產(chǎn)量突然下降或出現(xiàn)異常時,能迅速產(chǎn)生合適的數(shù)據(jù)集來解釋原因。具體的方法主要采用統(tǒng)計(jì)學(xué)的相關(guān)方法,主要流程是:
第一,對產(chǎn)量的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行識別信號對比,對次品率高低不同的批次分別分批列表。
第二,在取得不同次品率的信號對比表之后,用統(tǒng)計(jì)學(xué)方法對這些表自動進(jìn)行假想性測試,找出制約產(chǎn)量的所有線索。
第三,運(yùn)用統(tǒng)計(jì)方法對線索進(jìn)行分析,找出關(guān)鍵的線索并排序。
第四,按照線索通過工作站的記錄和實(shí)驗(yàn),按照順序?qū)Ω鱾€步驟的相關(guān)設(shè)備、程序、零部件等進(jìn)行詳細(xì)地調(diào)查。
這種預(yù)測方法必須使用統(tǒng)計(jì)方法,不然會可能會產(chǎn)生很多錯誤。同時,在找出了關(guān)鍵的線索后,要對各種出現(xiàn)問題的加工過程所相關(guān)的設(shè)備進(jìn)行嚴(yán)格地調(diào)查,以確定是否在此處出現(xiàn)問題或者是否與其相關(guān)。同時,如果實(shí)際問題與線索不一致,則要反推復(fù)查線索,看是否數(shù)據(jù)庫或規(guī)則有不完善的地方,并迅速修正。這種方法不僅可以在發(fā)生產(chǎn)量出現(xiàn)異常變化的時候迅速檢查原因,還可以對生產(chǎn)過程進(jìn)行監(jiān)控,自動對潛在問題進(jìn)行檢測,保障生產(chǎn)率始終處于較高的水平。產(chǎn)品出現(xiàn)次品率高的情況,必然有一些因素是制約合格率的瓶頸。例如:將這種方法用于黃石某壓縮機(jī)生產(chǎn)企業(yè)的仿真應(yīng)用模型中。該模型的生產(chǎn)序號最大到43步。仿真過程發(fā)現(xiàn)標(biāo)號為12,22,43,54,等批的次品率較高,列出這些批次的加工路徑,如標(biāo)號12的批加工路徑為1→5→6→7→9→54→60。將這些次品率高的加工過程紀(jì)錄下來,與正常生產(chǎn)的紀(jì)錄利用統(tǒng)計(jì)方法進(jìn)行分析比較,發(fā)現(xiàn)編號為4,8,11和21號設(shè)備可能出現(xiàn)了問題,再將得到的信息反饋給設(shè)備運(yùn)行工程師。工程師進(jìn)行檢測,發(fā)現(xiàn)11號設(shè)備出現(xiàn)故障,立即著手維修。據(jù)廠方模擬統(tǒng)計(jì),使用這種方法找出產(chǎn)量下降的原因比常規(guī)方法所需的時間縮短8%以上。
5 總結(jié)
在產(chǎn)量突然發(fā)生異常的變化時,使用基于粗糙集的數(shù)據(jù)挖掘技術(shù)分析數(shù)據(jù),可以得到合適的分析規(guī)則,再使用統(tǒng)計(jì)分析的方法可以迅速找出主要原因,進(jìn)而及時采取對癥的措施,無狀況發(fā)生時還可以有效監(jiān)控生產(chǎn)線狀況,保障生產(chǎn)線的穩(wěn)定生產(chǎn)。該方法還存在不足的地方,主要體現(xiàn)在線索與線索之間可能存在連鎖關(guān)系,還需進(jìn)一步完善。