郅芬香,王留芳,梁 碩
(1.鶴壁汽車(chē)工程職業(yè)學(xué)院,河南 鶴壁 458030;2.河南工業(yè)職業(yè)技術(shù)學(xué)院,河南 南陽(yáng) 473000)
粗糙集理論是由波蘭數(shù)學(xué)家Z.Pawlak 在20世紀(jì)80年代初提出的一種處理模糊和不精確性問(wèn)題的新型數(shù)學(xué)工具,利用粗糙集理論進(jìn)行數(shù)據(jù)挖掘,最重要的就是基于粗糙集理論的屬性約簡(jiǎn)。通過(guò)約簡(jiǎn)操作降低屬性的緯數(shù),總結(jié)出適用于決策支持的知識(shí)規(guī)則,是粗糙集理論最重要的應(yīng)用之一。數(shù)據(jù)挖掘是從大量的、不完整的、有噪聲的、模糊的、隨機(jī)的大型數(shù)據(jù)中提取隱含在其中的、人們事先未知的、具有潛在價(jià)值的信息和知識(shí)的過(guò)程,在拖拉機(jī)裝配方案的選擇過(guò)程中,調(diào)度系統(tǒng)為了快速選擇合理的工藝方案,可以采用數(shù)據(jù)挖掘的方法從多套方案中進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,指定合理的工藝方案評(píng)價(jià)方法,提高車(chē)間調(diào)度系統(tǒng)的作業(yè)效率具有重要的意義。
在確定拖拉機(jī)裝配工藝路線時(shí),由于可供備選的工藝路線有多種,最好采用數(shù)據(jù)挖掘的方法對(duì)工藝路線進(jìn)行優(yōu)選,確定出最佳的評(píng)價(jià)方法。粗糙集是數(shù)據(jù)挖掘算法的一種,在進(jìn)行數(shù)據(jù)挖掘時(shí)可以對(duì)信息數(shù)據(jù)進(jìn)行屬性簡(jiǎn)約,將粗糙集和其他算法進(jìn)行結(jié)合,還可以明顯地提高數(shù)據(jù)挖掘的效果,如采用遺傳算法。其主要流程是首先對(duì)提供的數(shù)據(jù)缺失的部分進(jìn)行補(bǔ)充,然后根據(jù)數(shù)據(jù)的特點(diǎn)利用已經(jīng)定義的可辨識(shí)矩陣,通過(guò)屬性簡(jiǎn)約算法進(jìn)行簡(jiǎn)約和知識(shí)發(fā)現(xiàn),最后對(duì)知識(shí)發(fā)現(xiàn)的規(guī)則利用遺傳算法進(jìn)行優(yōu)化,得到主要的規(guī)則。
在進(jìn)行數(shù)據(jù)挖掘之前,首先要對(duì)待處理的數(shù)據(jù)進(jìn)行采樣和整理,因?yàn)楹芏鄶?shù)據(jù)是冗余的,要通過(guò)數(shù)據(jù)處理去掉一部分無(wú)效的信息,然后是數(shù)據(jù)的離散化和缺損信息的補(bǔ)充。粗糙集數(shù)據(jù)挖掘方法在進(jìn)行數(shù)據(jù)處理時(shí)只能處理離散數(shù)據(jù),因此還要對(duì)數(shù)據(jù)進(jìn)行離散化。在進(jìn)行離散化時(shí)必須選擇合適的斷點(diǎn),才能進(jìn)行有效的離散化,斷點(diǎn)的選取可以根據(jù)數(shù)據(jù)的屬性特點(diǎn),數(shù)據(jù)的補(bǔ)齊可以通過(guò)經(jīng)驗(yàn)進(jìn)行填補(bǔ),或者利用均值處理和頻率統(tǒng)計(jì)等方法進(jìn)行填補(bǔ)。
屬性簡(jiǎn)約是粗糙集數(shù)據(jù)挖掘的重要步驟,通過(guò)屬性簡(jiǎn)約可以用最少的屬性區(qū)分不同的決策,得到約減集合。經(jīng)過(guò)粗糙集減約后,屬性的個(gè)數(shù)會(huì)減少很多,但得到的規(guī)則數(shù)量可能還是比較大的,因此還要根據(jù)數(shù)據(jù)的共性來(lái)進(jìn)行關(guān)聯(lián)規(guī)則的提取,這就是數(shù)據(jù)挖掘過(guò)程中數(shù)據(jù)的優(yōu)化問(wèn)題。數(shù)據(jù)優(yōu)化可以使用遺傳算法進(jìn)行優(yōu)化,其主要步驟如圖1所示。
在數(shù)據(jù)挖掘過(guò)程中,為了得到最佳的關(guān)聯(lián)規(guī)則,采用了遺傳算法。首先是數(shù)據(jù)的編碼,可以根據(jù)拖拉機(jī)工藝方案的性質(zhì)和需求,對(duì)其評(píng)價(jià)的關(guān)聯(lián)規(guī)則進(jìn)行編碼處理,采用二進(jìn)制數(shù)字編碼對(duì)關(guān)聯(lián)屬性進(jìn)行編碼。編碼完成后,便可以進(jìn)行遺傳算法操作:首先選取初試種群,可以用工藝方案的任何一個(gè)個(gè)體作為初始種群;遺傳算法實(shí)現(xiàn)過(guò)程中一個(gè)非常重要的步驟是確定評(píng)價(jià)函數(shù),評(píng)價(jià)函數(shù)可以將關(guān)聯(lián)規(guī)則中聯(lián)系最多的進(jìn)行匹配;最后便是遺傳操作,包括交叉和變異,交叉是對(duì)編碼數(shù)據(jù)進(jìn)行位置變換,變異是對(duì)編碼數(shù)據(jù)進(jìn)行取反,經(jīng)過(guò)評(píng)價(jià)函數(shù)確定最優(yōu)后,得到拖拉機(jī)裝配工藝方案選取的最佳評(píng)價(jià)方法。
圖1 關(guān)聯(lián)規(guī)則遺傳算法處理步驟
在先進(jìn)的現(xiàn)代化裝配車(chē)間,生產(chǎn)管理調(diào)度是非常重要的。為了實(shí)現(xiàn)車(chē)間生產(chǎn)部門(mén)大量的業(yè)務(wù)處理工作,必須使用計(jì)算機(jī)進(jìn)行現(xiàn)代化的調(diào)度管理。在拖拉機(jī)裝配車(chē)間調(diào)度系統(tǒng)功能設(shè)計(jì)時(shí),需要設(shè)計(jì)車(chē)間裝配的作業(yè)計(jì)劃、作業(yè)拆解、任務(wù)排序與自動(dòng)分配管理等幾個(gè)方面的功能,實(shí)現(xiàn)全面化的計(jì)算機(jī)管理。其基本功能框架如圖2所示。
圖2 拖拉機(jī)裝配車(chē)間調(diào)度系統(tǒng)基本功能框架
拖拉機(jī)裝配車(chē)間調(diào)度系統(tǒng)總體的功能主要分為查詢、調(diào)度和數(shù)據(jù)處理等。其中,數(shù)據(jù)處理包括前邊介紹的粗糙集數(shù)據(jù)挖掘算法,處理數(shù)據(jù)包括設(shè)備屬性和工藝屬性等。設(shè)備屬性框架如圖3所示。
圖3 設(shè)備屬性功能框架
設(shè)備屬性包括設(shè)備的類(lèi)別編號(hào)、類(lèi)別名稱、使用年限、數(shù)量和備注等。設(shè)備選用之前,可以利用數(shù)據(jù)挖掘算法對(duì)設(shè)備進(jìn)行篩選,得到最佳的設(shè)備類(lèi)型。
工藝路線信息如圖4所示。拖拉機(jī)裝配工藝的路線信息較多,包括一些產(chǎn)品圖號(hào)和名稱、工序編號(hào)和名稱,還包括標(biāo)準(zhǔn)工時(shí)、人工數(shù)量、使用設(shè)備等,其類(lèi)型、主鍵和長(zhǎng)度信息如表1所示。
表1 工藝路線信息表
圖4 工藝路線信息
拖拉機(jī)裝配工藝路線包含的信息量非常大,在工藝路線方案確定時(shí),可以采用數(shù)據(jù)挖掘方法對(duì)工藝路線所包含的信息屬性進(jìn)行約減,然后通過(guò)關(guān)聯(lián)規(guī)則的提取確定最佳評(píng)價(jià)方案。
基于粗糙集和數(shù)據(jù)挖掘的調(diào)度系統(tǒng)優(yōu)化如圖5所示。粗糙集和數(shù)據(jù)挖掘主要是使用在拖拉機(jī)裝配系統(tǒng)的數(shù)據(jù)處理模塊優(yōu)化設(shè)計(jì)上,基于粗糙集的數(shù)據(jù)信息關(guān)聯(lián)規(guī)則挖掘主要分為3步:首先是數(shù)據(jù)的預(yù)處理,然后利用粗糙集對(duì)數(shù)據(jù)的屬性進(jìn)行約減,最后通過(guò)遺傳算法優(yōu)化,提取關(guān)聯(lián)規(guī)則。通過(guò)優(yōu)化處理后得到最佳的拖拉機(jī)裝配工藝評(píng)價(jià)標(biāo)準(zhǔn),以對(duì)備選的工藝方案進(jìn)行篩選。
圖5 基于粗糙集和數(shù)據(jù)挖掘的調(diào)度系統(tǒng)優(yōu)化
為了驗(yàn)證基于粗糙集和數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則在拖拉機(jī)裝配工藝設(shè)計(jì)中使用的可行性,以拖拉機(jī)裝配車(chē)間(見(jiàn)圖6)調(diào)度系統(tǒng)的優(yōu)化為例進(jìn)行驗(yàn)證。在拖拉機(jī)進(jìn)行裝配時(shí),其工藝流程中有許多要注意的問(wèn)題,如裝配誤差、裝配干涉及工序?qū)崿F(xiàn)的難易等。為了使拖拉機(jī)的裝配達(dá)到最優(yōu)化,在工藝選擇的過(guò)程中,需要以某幾個(gè)需要注意的問(wèn)題為重點(diǎn)來(lái)決定使用何種工藝方案。
圖6 拖拉機(jī)裝配車(chē)間示意圖
在進(jìn)行裝配時(shí),需要通過(guò)系統(tǒng)優(yōu)化選擇合理的裝配工藝方案。在進(jìn)行裝配工藝設(shè)計(jì)時(shí),設(shè)計(jì)企業(yè)一般會(huì)制定多種裝配工藝方案。為了使裝配工藝方案達(dá)到最優(yōu),可以制定一套統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。在評(píng)價(jià)標(biāo)準(zhǔn)制定時(shí),有以往的一些裝配工藝方案進(jìn)行借鑒,本次主要選取幾種以往用過(guò)的方案進(jìn)行評(píng)價(jià),并利用粗糙集對(duì)屬性進(jìn)行簡(jiǎn)約,然后利用數(shù)據(jù)挖掘來(lái)最后決定使用何種方案,從而使裝配工藝得到優(yōu)化。
以往用過(guò)的8種裝配方案如表2所示。其中“?”表示屬性表中沒(méi)有寫(xiě)明的情況。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后, 對(duì)缺失數(shù)據(jù)進(jìn)行了填補(bǔ)及屬性離散化后得到了表3所示的拖拉機(jī)裝配工藝信息表。
表2 拖拉機(jī)裝配工藝屬性表
表3 拖拉機(jī)裝配工藝信息表
得到表3的拖拉機(jī)裝配工藝信息表后,按粗糙集理論的屬性簡(jiǎn)約的算法, 通過(guò)數(shù)據(jù)挖掘管理規(guī)則決策表的可辯識(shí)距陣, 可以得到算法第3步后的合取范式表達(dá)式為
F(d,e,f,a)=(e∨a)∧(d∨e∨a)
∧(d∨e)∧(e∨f∨a)∧(d∨e∨f)
∧(d∨e∨a)∧(d∨e∨a)∧(d∨e∨a)
∧(d∨a)∧(e)(e∨a)∧(d∨e∨f∨a)
∧(d∨e∨f)∧(d∨e∨f∨a)
∧(d∨e∨f)∧(d∨e∨a)
(1)
其中,可辨矩陣中的元素對(duì)應(yīng)每個(gè)分析項(xiàng),d、e、f、a分別對(duì)應(yīng)屬性裝配誤差、工序簡(jiǎn)單、裝配錯(cuò)誤、裝配干涉。按算法簡(jiǎn)化后可得
F(d,e,f,a)=(e∧a)∨(e∧d)
(2)
由公式(2)可以看出:對(duì)于信息表中的數(shù)據(jù),與決策相關(guān)的主要有d、e、a。通過(guò)粗糙集理論的屬性簡(jiǎn)約,可以得到以往使用的拖拉機(jī)裝配工藝的重要信息和屬性,然后可以通過(guò)遺傳算法得到主要的關(guān)聯(lián)規(guī)則。如表2中某一個(gè)裝配工藝上裝配誤差、工序簡(jiǎn)單、裝配干涉值為201,其編碼可以表示為10、00、01。假設(shè)初始種群的個(gè)體為8個(gè),評(píng)價(jià)函數(shù)以可以匹配表中最多行屬性為關(guān)聯(lián)規(guī)則,定義8元組為
SGA=(C,E,P0,M,Φ,Γ,Ψ,T)
(3)
其中,C為對(duì)個(gè)體采用的二進(jìn)制編碼;評(píng)價(jià)遺傳算法適應(yīng)度函數(shù)f(x)用E表示;初始種群的個(gè)體8個(gè)規(guī)則為P0;比例選擇算子為Φ;中間位單點(diǎn)交叉算子為Γ;變異算子為Ψ;迭代計(jì)算30次的停止符號(hào)為T(mén)。通過(guò)計(jì)算,最終得到了最佳的工藝方案?jìng)€(gè)體為00、01、 01,即裝配誤差為0.1cm,工序簡(jiǎn)單,裝配干涉一般為評(píng)價(jià)標(biāo)準(zhǔn),通過(guò)此標(biāo)準(zhǔn)可以對(duì)提供的農(nóng)機(jī)裝配方案進(jìn)行優(yōu)化,進(jìn)而對(duì)裝配系統(tǒng)進(jìn)行優(yōu)化。
為了提高拖拉機(jī)車(chē)間裝配調(diào)度系統(tǒng)的作業(yè)效率,基于粗糙集理論和遺傳算法。提出了一種新的調(diào)度系統(tǒng)數(shù)據(jù)處理挖掘算法。通過(guò)對(duì)工藝方案數(shù)據(jù)的屬性約減和關(guān)聯(lián)規(guī)則挖掘,可以快速得到工藝路線的評(píng)價(jià)參數(shù)。為了驗(yàn)證方案的可行性,以拖拉機(jī)裝配工藝路線的選取為例,對(duì)其評(píng)價(jià)方案的制定進(jìn)行了數(shù)據(jù)挖掘計(jì)算。通過(guò)計(jì)算最終得到了最佳的工藝方案?jìng)€(gè)體為00、01、 01,即裝配誤差為0.1cm,工序簡(jiǎn)單,裝配干涉一般為評(píng)價(jià)標(biāo)準(zhǔn),為拖拉機(jī)裝配車(chē)間調(diào)度系統(tǒng)工藝方案的選取提供了重要的數(shù)據(jù)依據(jù)。