亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模糊c均值聚類算法的控制圖模式識(shí)別

        2021-11-23 08:28:22張和平李俊武
        工業(yè)工程 2021年5期
        關(guān)鍵詞:模式識(shí)別能力

        張和平,李俊武

        (南昌大學(xué) 經(jīng)濟(jì)管理學(xué)院,江西 南昌 330031)

        控制圖作為統(tǒng)計(jì)過程控制的重要工具,在制造過程的質(zhì)量控制中起著重要的作用,廣泛應(yīng)用于加工過程的監(jiān)控。通常對控制圖原理的解釋為當(dāng)控制圖中的某些點(diǎn)超出了控制限或控制圖顯示了一個(gè)異常模式,則表明制造過程失去控制[1]。其中,前者是比較容易識(shí)別的,但后者需要利用一些特定的方法進(jìn)行識(shí)別,主要可以歸類為專家系統(tǒng)方法和機(jī)器學(xué)習(xí)方法。其中,專家系統(tǒng)方法存在著局限性,因而對于此方面的研究比較少。1987年,Swift[2]為控制圖模式識(shí)別設(shè)計(jì)了第一個(gè)專家系統(tǒng)。此后,有學(xué)者對專家系統(tǒng)也進(jìn)行了許多其他研究。Bag等[3]設(shè)計(jì)了一個(gè)專家系統(tǒng),用于在線監(jiān)測控制圖模式,使質(zhì)量控制人員能夠?qū)κЭ氐闹圃爝^程及時(shí)采取糾偏措施。由于專家系統(tǒng)方法的識(shí)別規(guī)則存在缺陷,導(dǎo)致其識(shí)別性能不佳[4]。

        控制圖模式識(shí)別的機(jī)器學(xué)習(xí)方法主要包括人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)。人工神經(jīng)網(wǎng)絡(luò)分為監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)。對于控制圖模式的識(shí)別,使用較多的監(jiān)督式人工神經(jīng)網(wǎng)絡(luò)方法有多層感知器[5](multilayer perceptron, MLP)、徑 向 基 函 數(shù)[6](radial basis function, RBF)、學(xué)習(xí)向量量化[7](learning vector quantization, LVQ)等;另一方面,非監(jiān)督式學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)如自組織映射[8](self-organizing map, SOM)神經(jīng)網(wǎng)絡(luò)和自適應(yīng)共振理論[9](adaptive resonance theory, ART)也被應(yīng)用于控制圖的識(shí)別。近年來隨著深度學(xué)習(xí)熱潮的高漲,有部分學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于控制圖模式的識(shí)別[10-11]。然而傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)需要大量的訓(xùn)練數(shù)據(jù),存在收斂速度慢、容易陷入局部極值[12]等缺點(diǎn),深度神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)量的需求較之傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更多,并且對參數(shù)設(shè)置的要求較高。支持向量機(jī)由于其良好的泛化能力在控制圖模式識(shí)別領(lǐng)域得到較多的應(yīng)用,適用于小樣本的情形[13]。在機(jī)器學(xué)習(xí)中,控制圖模式識(shí)別輸入數(shù)據(jù)的樣本點(diǎn)數(shù)較多,會(huì)產(chǎn)生高維數(shù)據(jù),但機(jī)器學(xué)習(xí)方法對應(yīng)用高維數(shù)據(jù)時(shí)的分類表現(xiàn)并不令人滿意。因此,有學(xué)者研究了控制圖模式的特征提取以便實(shí)現(xiàn)對高維數(shù)據(jù)的降維處理,其中主要的特征提取有形狀特征[14]、統(tǒng)計(jì)特征[15]、小波分析特征[16]以及混合特征[17]等。

        綜上所述,現(xiàn)有控制圖模式識(shí)別的研究仍然存在優(yōu)化空間。其中,專家系統(tǒng)的識(shí)別性能相關(guān)研究較少且有待提升。傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)對原始數(shù)據(jù)的識(shí)別能力欠優(yōu),對原始數(shù)據(jù)特征值的提取存在著諸多的困難和不足,尤其是當(dāng)提取的特征值不能夠代表每種控制圖模式之間的差異性時(shí),對機(jī)器學(xué)習(xí)的識(shí)別能力提升有限甚至出現(xiàn)下降。同時(shí),二者的參數(shù)設(shè)置對控制圖模式識(shí)別的性能影響較大;以卷積神經(jīng)網(wǎng)絡(luò)為例,現(xiàn)有的深度神經(jīng)網(wǎng)絡(luò)對控制圖模式的原始數(shù)據(jù)具有較好的識(shí)別效果,但其結(jié)構(gòu)較為復(fù)雜,參數(shù)選擇較為困難。因此,本文提出利用小波變換處理原始數(shù)據(jù),再利用模糊c均值(fuzzy c-means, FCM)聚類算法進(jìn)行控制圖模式識(shí)別。相較于已有的控制圖模式識(shí)別研究,此方法具有特征值提取簡易、算法參數(shù)設(shè)置較少、訓(xùn)練集數(shù)量少、識(shí)別性能較好等優(yōu)點(diǎn)。

        1 控制圖模式和FCM聚類算法

        1.1 控制圖模式

        現(xiàn)實(shí)的生產(chǎn)制造活動(dòng)中,質(zhì)量因素的來源可以分為5M1E(即人、機(jī)、料、法、環(huán)、測量)6個(gè)方面。這6個(gè)方面從總體而言,可以分為隨機(jī)因素與異常因素。其中,隨機(jī)因素是始終存在的,對質(zhì)量影響微小且難以除去;異常因素出現(xiàn)頻率較低且對質(zhì)量影響大,但通過一定的技術(shù)手段可以除去。統(tǒng)計(jì)過程控制圖的實(shí)質(zhì)就是區(qū)分隨機(jī)因素與異常因素。其中,只受隨機(jī)因素影響時(shí)的控制圖為正常模式控制圖;當(dāng)質(zhì)量特性數(shù)據(jù)出現(xiàn)周期、階躍、趨勢等狀態(tài)時(shí),表明過程受到異常因素的影響。控制圖模式主要分為6種情形,如圖1所示。

        圖1 6種控制圖模式Figure 1 Six patterns of control chart

        1.2 FCM聚類算法

        聚類分析是把相似的樣本歸為一類的方法,是多元統(tǒng)計(jì)分析的一個(gè)分支,也是非監(jiān)督模式識(shí)別的一個(gè)重要分支。FCM聚類算法是聚類分析的方法之一,同樣具有無監(jiān)督式學(xué)習(xí)簡便的優(yōu)點(diǎn),尤其是在聚類數(shù)量已知時(shí),該方法對模式識(shí)別具有良好的效果。當(dāng)數(shù)據(jù)集X、聚類類別數(shù)c和權(quán)重r值已知時(shí)(一般采用r=2),利用FCM算法便能確定最佳模糊分類矩陣和模糊聚類中心;當(dāng)給定FCM算法的停止閾值ε時(shí),可以利用迭代算法來求解。FCM聚類算法步驟[18]如下。

        步驟1 初始化。設(shè)總樣本集Xi,給定權(quán)重r= 2,聚類數(shù)c= 6,初始隸屬矩陣U(0),設(shè)定停止閾值ε,設(shè)置迭代計(jì)數(shù)器b= 0。

        步驟2 當(dāng)?shù)螖?shù)為b(b= 1, 2, ···)時(shí),計(jì)算聚類中心向量

        2 仿真實(shí)驗(yàn)分析

        2.1 仿真實(shí)驗(yàn)分析流程

        按照一般的機(jī)器學(xué)習(xí)算法流程,首先,采用一維離散小波變換對數(shù)據(jù)提取特征并將樣本劃分為訓(xùn)練集與測試集,再利用訓(xùn)練集來對FCM聚類算法的控制圖模式識(shí)別進(jìn)行訓(xùn)練,最終利用測試集來測試該算法的識(shí)別準(zhǔn)確率,具體的技術(shù)路線按圖2進(jìn)行。

        圖2 仿真實(shí)驗(yàn)流程圖Figure 2 The flow chart of simulation experiment

        2.2 控制圖數(shù)學(xué)表達(dá)式

        由于實(shí)際生產(chǎn)過程中的異??刂茍D模式數(shù)據(jù)量較少,在此采用蒙特卡洛方法生產(chǎn)6種控制圖模式的樣本數(shù)據(jù)。其中,6種控制圖可以看成4種類型的數(shù)學(xué)模型,其表達(dá)式分別如下。

        正常模式:

        其中,y(t)為制造過程中的質(zhì)量特征參數(shù)觀測值;μ為處于系統(tǒng)控制狀態(tài)下的質(zhì)量特征參數(shù)的平均值;w(t)為服從正態(tài)分布N(μ,σ2)的白噪聲,σ為標(biāo)準(zhǔn)差;t為采集特征參數(shù)的時(shí)間值;d為啞變量,在異常模式發(fā)生之前取值為0,發(fā)生之后取值為1,其中異常模式在第6和第7點(diǎn)中隨機(jī)發(fā)生。此外,周期模式中,A表示振幅,T表示循環(huán)周期;趨勢模式中,k為向上或者向下偏移的斜率;階躍模式中,s為向上或向下偏移的振幅。根據(jù)式(3) ~ (6),不同控制圖模式的相關(guān)具體參數(shù)如表1所示。

        表1 控制圖模式的相關(guān)參數(shù)Table 1 The parameters of the patterns of control chart

        2.3 樣本數(shù)據(jù)生成

        現(xiàn)有的研究中,每種控制圖模式包含的樣本點(diǎn)數(shù)大都為60個(gè)或者更多,這樣的樣本設(shè)置能夠更好地體現(xiàn)不同控制圖模式之間的特征差異性,從而便于區(qū)分,有利于提高識(shí)別準(zhǔn)確率。為了便于及時(shí)發(fā)現(xiàn)制造過程中的異常,減少損失,每個(gè)控制圖模式選取的樣本點(diǎn)數(shù)為25個(gè)[10]。不過這會(huì)使得不同控制圖模式之間變得非常相似,尤其是趨勢模式和階躍模式,將增加算法對控制圖模式識(shí)別的難度。此外,由于FCM聚類算法不需要大量樣本進(jìn)行訓(xùn)練,因此暫且采用蒙特卡洛方法產(chǎn)生180個(gè)訓(xùn)練樣本,符合訓(xùn)練集的數(shù)量要求,其中,每種控制圖模式的樣本量為30個(gè)。測試樣本量設(shè)置為720個(gè),并進(jìn)行1 000次測試。

        2.4 一維離散小波變換

        控制圖一般分為6種模式,每種模式的特征及其變化趨勢各不相同,不同的小波函數(shù)對同一種控制圖模式的特征提取都不完全相同。因此,對于不同控制圖模式的特征提取會(huì)更加不一致。根據(jù)文獻(xiàn)[19],對控制圖模式進(jìn)行特征提取的小波函數(shù)需要滿足正交性、對稱性、緊支性等特性。由于某小波函數(shù)并不完全滿足上述全部特性,因此選取盡可能符合相關(guān)特性的小波函數(shù),如表2所示。

        表2 用以提取控制圖特征的小波函數(shù)Table 2 The wavelet function used for extracting the features of control chart

        由于數(shù)據(jù)采用蒙特卡洛仿真方法產(chǎn)生,數(shù)據(jù)樣本中會(huì)不可避免地產(chǎn)生人工噪聲,從而影響對控制圖模式識(shí)別的準(zhǔn)確率。此外,機(jī)器學(xué)習(xí)算法往往對較低維度的數(shù)據(jù)樣本具有更好的學(xué)習(xí)表現(xiàn)。因此,需要對原始數(shù)據(jù)進(jìn)行降噪和降維處理??紤]到小波變換的方法能夠?qū)υ紨?shù)據(jù)的信息表達(dá)同時(shí)兼顧時(shí)間域與頻率域[19],較好地過濾高頻噪聲,保留低頻的主要信息,因而也能滿足降維的需求。因此,將對原始數(shù)據(jù)進(jìn)行一維離散小波變換。根據(jù)實(shí)際情況,不宜對樣本進(jìn)行層數(shù)過多的小波分解,這是由于每個(gè)樣本所包含的樣本量較少,進(jìn)行較多層的小波分解容易丟失主要信息,所以采用層數(shù)為1的一維離散小波變換對原始數(shù)據(jù)進(jìn)行降噪和降維處理。

        圖3中以周期模式為例對原始信號(hào)采用一維離散小波變換,其中小波函數(shù)為coif 2。從圖中可以看到,當(dāng)對原始信號(hào)進(jìn)行層數(shù)為1的一維離散小波變換時(shí),低頻近似系數(shù)cA1較好地保留了周期模式的主要特征,并有效地去除了隨機(jī)擾動(dòng)的噪聲,但是,對原始信號(hào)進(jìn)行層數(shù)為2的一維離散小波變換時(shí),得到的低頻近似系數(shù)cA2的信號(hào)圖像與周期模式并不吻合,這也證明采用層數(shù)為1的一維離散小波變換的合理性。

        圖3 不同層數(shù)分解的小波變換圖像Figure 3 Images decomposed by different layers of wavelet transform

        2.5 最優(yōu)超參數(shù)設(shè)置

        由于FCM聚類算法中的參數(shù)設(shè)置較為簡單,僅僅停止閾值ε的大小會(huì)對控制圖模式識(shí)別的效果產(chǎn)生影響。但是,本研究中采用一維離散小波變換的方法對原始數(shù)據(jù)進(jìn)行降維、降噪處理,因此不同小波函數(shù)的選擇也會(huì)影響控制圖模式識(shí)別的效果。綜上所述,停止閾值的設(shè)置和不同小波函數(shù)的選擇將作為尋找控制圖模式最佳識(shí)別效果的超參數(shù)設(shè)置。文獻(xiàn)[17]中,采用db4小波函數(shù)取得較好的識(shí)別效果。因此,選擇db4為默認(rèn)小波函數(shù),來探究不同停止閾值的取值對控制圖模式識(shí)別的影響,以尋求較優(yōu)的識(shí)別效果。

        如圖4和圖5所示,在停止閾值ε =5×10?4時(shí),對原始數(shù)據(jù)采用FCM聚類算法后,有些模式的隸屬度十分接近且最大隸屬度值較小,因而對于后續(xù)的控制圖模式的識(shí)別測試結(jié)果影響較大。因此,這里將不進(jìn)行基于原始數(shù)據(jù)的FCM聚類算法的識(shí)別效果測試。相反,當(dāng)對原始數(shù)據(jù)進(jìn)行小波變換處理后,某一種控制圖模式對特定的聚類中心具有明顯超出其他控制圖模式的隸屬度值,產(chǎn)生了較好的聚類效果。但是,從圖4中的聚類中心1可以看到,不同控制圖模式之間,有極少數(shù)的隸屬度值會(huì)產(chǎn)生交叉,可能會(huì)影響測試樣本的識(shí)別效果。通過對訓(xùn)練數(shù)據(jù)的清查,發(fā)現(xiàn)產(chǎn)生隸屬度值交叉現(xiàn)象的是向下趨勢模式與向下階躍模式。綜上所述,經(jīng)過一維離散小波變換后,F(xiàn)CM聚類算法對6種控制圖模式的聚類效果較好,能夠?qū)Σ煌目刂茍D模式進(jìn)行識(shí)別。

        圖4 原始數(shù)據(jù)對各聚類中心的隸屬度值Figure 4 Membership grade of original data to each clustering center

        圖5 小波變換處理后的數(shù)據(jù)對各聚類中心的隸屬度值Figure 5 Membership grade of processed data to each clustering center

        當(dāng) ε =1時(shí),按照最大隸屬度原則清晰化,F(xiàn)CM聚類算法對每種控制圖模式的識(shí)別效果如表3所示。從表3中可以看出,周期模式容易與正常模式產(chǎn)生誤判,趨勢模式與階躍模式也會(huì)產(chǎn)生誤判。由于單個(gè)樣本的樣本點(diǎn)數(shù)較少,在提取不同控制圖模式之間的特征時(shí)會(huì)加大難度,尤其是兩種模式間的特征相近時(shí),識(shí)別的難度會(huì)繼續(xù)增加。但是,當(dāng)停止閾值的取值比較合理時(shí),產(chǎn)生誤判的現(xiàn)象會(huì)減少,合適的停止閾值會(huì)提高FCM算法的識(shí)別準(zhǔn)確率。在本研究中,識(shí)別準(zhǔn)確率取值為6種控制圖模式識(shí)別準(zhǔn)確率的算術(shù)平均值。

        表3 每種控制圖模式的識(shí)別效果Table 3 The recognition effect of each control chart patterns

        表4可以看到,隨著停止閾值的取值不斷減小,F(xiàn)CM聚類算法對控制圖模式識(shí)別的準(zhǔn)確率不斷增加,其識(shí)別能力的穩(wěn)定性也在提高,但是,當(dāng)ε=10?5時(shí),識(shí)別準(zhǔn)確率有較大幅度的下降,這可能是因?yàn)镕CM聚類算法對訓(xùn)練樣本聚類時(shí)出現(xiàn)了“過擬合”現(xiàn)象,從而降低泛化能力,最終導(dǎo)致識(shí)別準(zhǔn)確率和識(shí)別能力穩(wěn)定性的降低。此外,當(dāng) ε取值為[10?4, 10?3](區(qū)間1)之間時(shí),F(xiàn)CM聚類算法對控制圖模式的識(shí)別準(zhǔn)確率是相對更優(yōu)的。為了追求更好的識(shí)別效果,采用二分法對區(qū)間1進(jìn)行分割,逐次逼近更合適的停止閾值。區(qū)間1經(jīng)過二分法分割后的識(shí)別準(zhǔn)確率如表5所示。

        表4 不同停止閾值下的控制圖模式識(shí)別準(zhǔn)確率Table 4 The recognition accuracy of each control chart patterns under different stop threshold values

        表5 區(qū)間1采用二分法的控制圖模式識(shí)別準(zhǔn)確率Table 5 The recognition accuracy of control chart patterns using binary method to range 1

        由表5可知,在對區(qū)間1采用二分法進(jìn)行2次區(qū)間分割后,并沒有取得比 ε=10?4時(shí)更佳的識(shí)別效果。因此,下一步考慮對[10?5, 10?4](區(qū)間2)區(qū)間采用二分法進(jìn)行分割以求得相對更優(yōu)的識(shí)別。準(zhǔn)確率如表6所示。

        表6 區(qū)間2采用二分法的控制圖模式識(shí)別準(zhǔn)確率Table 6 The recognition accuracy of control chart patterns using binary method to range 2

        從表6可以看出,經(jīng)過3次二分法后,在ε=8.25×10?5時(shí),F(xiàn)CM聚類算法的識(shí)別準(zhǔn)確率達(dá)到98.76%,相較于 ε=10?4時(shí)的識(shí)別準(zhǔn)確率提高了0.47%,雖然對于識(shí)別準(zhǔn)確率的提升有限,但是對于工業(yè)大數(shù)據(jù)環(huán)境下的控制圖模式識(shí)別而言,尤其是在具有較高的識(shí)別準(zhǔn)確率后,識(shí)別能力的提高是存在其實(shí)際意義的。但是考慮到識(shí)別能力的提升限度對研究的意義有限,因而將不對停止閾值繼續(xù)進(jìn)行二分法取值。綜合上述研究的結(jié)果,當(dāng)小波函數(shù)為db4,ε=8.25×10?5時(shí),識(shí)別準(zhǔn)確率為98.76%,其標(biāo)準(zhǔn)差為0.004 5。

        對原始數(shù)據(jù)進(jìn)行一維離散小波變換時(shí),選擇不同的小波函數(shù)也會(huì)對FCM聚類算法的識(shí)別準(zhǔn)確率產(chǎn)生影響。當(dāng) ε =8.25×10?5時(shí),采用表2中包含的小波函數(shù)對原始數(shù)據(jù)進(jìn)行處理,并利用FCM聚類算法進(jìn)行樣本的訓(xùn)練與測試,最終得到的識(shí)別準(zhǔn)確率及其標(biāo)準(zhǔn)差如表7所示。

        表7 不同小波函數(shù)對控制圖模式識(shí)別的影響Table 7 The recognition effect of control chart patterns under different wavelet functions

        由表7和圖6可知,當(dāng)選用小波函數(shù)coif4對原始數(shù)據(jù)進(jìn)行降噪處理時(shí),能夠使FCM聚類算法對控制圖模式獲得最佳的識(shí)別能力。從圖6可以看出,在FCM聚類算法中,小波函數(shù)coif 2、coif 3、sym4、sym5、db4對識(shí)別能力的影響是較為接近的;小波函數(shù)sym2、sym3、db2、db3的識(shí)別能力較低,小波函數(shù)coif5對識(shí)別能力的影響介于此二類之間。當(dāng)ε=8.25×10?5時(shí),F(xiàn)CM聚類算法對6種控制圖模式的識(shí)別準(zhǔn)確率到達(dá)99.31%,相較于最初的識(shí)別準(zhǔn)確率值97.43%提高1.88%,比試驗(yàn)中出現(xiàn)的最低識(shí)別準(zhǔn)確率值93.24%高出6.07%,并且通過標(biāo)準(zhǔn)差可以發(fā)現(xiàn)識(shí)別能力的穩(wěn)定性有所提高。這表明上述的參數(shù)設(shè)置使得FCM聚類算法具有較好的泛化能力,能夠?qū)刂茍D模式進(jìn)行有效的識(shí)別。同時(shí),該設(shè)置有效降低了不同模式之間的誤判率。

        圖6 不同小波函數(shù)對FCM聚類算法識(shí)別能力的影響Figure 6 The effect of recognition level of FCM clustering algorithm under different wavelet functions

        根據(jù)表8可知,在對FCM聚類算法進(jìn)行參數(shù)尋優(yōu)后,在選取合適小波函數(shù)的情況下,不同控制圖模式之間的誤判率有顯著的降低,平均的模式識(shí)別準(zhǔn)確率相比于初次試驗(yàn)時(shí)也有較大幅度的提升。因此,由上述研究可以得出FCM聚類算法中的最佳參數(shù)設(shè)置以及識(shí)別能力,如表9所示。

        表8 最優(yōu)參數(shù)設(shè)置下6種控制圖模式的識(shí)別效果Table 8 The recognition result of six control chart patterns under optimal parameter setting

        表9 最佳參數(shù)設(shè)置及識(shí)別效果Table 9 The optimal parameter setting and its recognition effect

        此外,考慮到機(jī)器學(xué)習(xí)算法中,訓(xùn)練集的數(shù)量可能會(huì)對控制圖模式識(shí)別的準(zhǔn)確率產(chǎn)生影響。當(dāng)訓(xùn)練集的數(shù)量較少的時(shí)候可能會(huì)出現(xiàn)“欠擬合”的現(xiàn)象,由于算法在樣本較少時(shí)容易導(dǎo)致特征學(xué)習(xí)不夠集中,從而無法較好提取樣本特征,該情況下算法在訓(xùn)練集和測試集的表現(xiàn)效果均不佳;相反的,當(dāng)訓(xùn)練集數(shù)量較大時(shí),容易出現(xiàn)“過擬合”現(xiàn)象,這是因?yàn)樗惴ǔ霈F(xiàn)過度適配的情況,過于關(guān)于數(shù)據(jù)集中的噪聲和細(xì)節(jié),從而導(dǎo)致在訓(xùn)練集上表現(xiàn)良好,卻不具有遷移能力,因此在測試集上會(huì)出現(xiàn)識(shí)別能力下降的情形。當(dāng)進(jìn)行樣本量對識(shí)別能力的影響試驗(yàn)時(shí),在單組訓(xùn)練樣本量為5的情況下,算法的訓(xùn)練識(shí)別能力也較好,這說明該算法在訓(xùn)練集較少的情況下,也不容易出現(xiàn)“欠擬合”現(xiàn)象,并且隨著訓(xùn)練集數(shù)量的增加,算法表現(xiàn)出的識(shí)別能力越來越好,但在訓(xùn)練集增加到一定數(shù)量時(shí),出現(xiàn)了有限的識(shí)別能力下降的情形,具體試驗(yàn)結(jié)果如圖7所示。

        圖7 不同訓(xùn)練樣本量下的識(shí)別準(zhǔn)確率Figure 7 Recognition accuracy under different training sample sizes

        由圖7可知,算法在訓(xùn)練集較少的情況下,隨著訓(xùn)練集的增加,識(shí)別能力有顯著的提升;在單組訓(xùn)練樣本量達(dá)到20個(gè)時(shí),識(shí)別能力出現(xiàn)較為平穩(wěn)的情況并表現(xiàn)出一定的區(qū)間性;當(dāng)訓(xùn)練集接著增大時(shí),識(shí)別能力進(jìn)一步提升并保持穩(wěn)定;最后由于訓(xùn)練集的繼續(xù)增加,識(shí)別能力開始下降,此時(shí)可能出現(xiàn)“過擬合”現(xiàn)象。具體而言,在單組訓(xùn)練樣本量為5,即訓(xùn)練集數(shù)量為30時(shí),識(shí)別準(zhǔn)確率相對較低,僅為98.31%;隨著訓(xùn)練集的增加,算法的識(shí)別準(zhǔn)確率提升較快。在單組訓(xùn)練樣本量介于區(qū)間(20, 75)之內(nèi)時(shí),識(shí)別能力較為穩(wěn)定,識(shí)別準(zhǔn)確率在99.30%左右;當(dāng)單組訓(xùn)練樣本量介于區(qū)間(100, 500)之內(nèi)時(shí),識(shí)別能力進(jìn)一步提升并維持在99.40%左右,其中在訓(xùn)練集為1 800的時(shí)候取得最大識(shí)別準(zhǔn)確率為99.43%,標(biāo)準(zhǔn)差為0.002 8;當(dāng)單組訓(xùn)練樣本量位于(600, 2 000)時(shí),算法的識(shí)別能力下降,尤其是當(dāng)單組訓(xùn)練樣本量位于(1 000, 2 000)時(shí),識(shí)別能力進(jìn)一步下降,最低為99.14%。

        3 方法比較

        在選取樣本點(diǎn)數(shù)為25的控制圖模式的情況下會(huì)使得不同控制圖模式之間的特征難以分辨,并對控制圖模式的識(shí)別產(chǎn)生影響,從而導(dǎo)致識(shí)別能力的降低。但是經(jīng)過對停止閾值的設(shè)置和不同小波函數(shù)以及訓(xùn)練集數(shù)量的選擇,基于FCM聚類算法的控制圖模式識(shí)別,實(shí)現(xiàn)了99.43%的識(shí)別準(zhǔn)確率,達(dá)到較好的識(shí)別水準(zhǔn)。為了進(jìn)一步評估和證明本文選取方法的有效性,在此選取較近年份的具有代表性的不同方法與FCM聚類算法進(jìn)行比對。各種方法在不同的訓(xùn)練集數(shù)量、樣本點(diǎn)數(shù)、特征提取方法以及分類器的試驗(yàn)條件下,其最優(yōu)識(shí)別準(zhǔn)確率的具體情況如表10所示。

        根據(jù)表10可知,本文選取學(xué)術(shù)界比較有代表性的其他機(jī)器學(xué)習(xí)方法,其中包括SVM、傳統(tǒng)神經(jīng)網(wǎng)絡(luò),以及深度神經(jīng)網(wǎng)絡(luò),并且這些方法用到了混合特征、形狀特征和統(tǒng)計(jì)特征等特征提取方法。首先,與其他機(jī)器學(xué)習(xí)算法相比,F(xiàn)CM聚類算法具有參數(shù)設(shè)置簡易的特點(diǎn)。其次,在特征提取方面,本文僅使用一維離散小波變換,與文獻(xiàn)[6]、[17]相比具有特征提取簡單的特點(diǎn);在訓(xùn)練集數(shù)量的選取方面,在達(dá)到最優(yōu)識(shí)別準(zhǔn)確率時(shí),F(xiàn)CM聚類算法所需要的訓(xùn)練集數(shù)量較深度神經(jīng)網(wǎng)絡(luò)少,在考慮到實(shí)際生產(chǎn)過程中異常模式發(fā)生較少的情況下,需要較少的訓(xùn)練集數(shù)量意味著更加容易實(shí)地獲取數(shù)據(jù),實(shí)地?cái)?shù)據(jù)相較于仿真數(shù)據(jù)更能體現(xiàn)質(zhì)量過程的真實(shí)性。最后,在識(shí)別準(zhǔn)確率方面,F(xiàn)CM聚類算法的識(shí)別準(zhǔn)確率顯著優(yōu)于文獻(xiàn)[17],并且略高于文獻(xiàn)[10],但是比文獻(xiàn)[6]和文獻(xiàn)[11]的識(shí)別準(zhǔn)確率大約低0.20%,不過由于本文相較于這兩篇文獻(xiàn)而言選取的樣本點(diǎn)數(shù)較少,因此識(shí)別準(zhǔn)確率略微的降低是可以接受的。綜上所述,F(xiàn)CM聚類算法為控制圖模式識(shí)別研究拓展了新的途徑,同時(shí)還具有簡便、識(shí)別準(zhǔn)確率高的特點(diǎn),能夠滿足控制圖模式識(shí)別的需求。

        表10 本文方法與其他方法的比較情況Table 10 The comparison of this method with other methods

        4 結(jié)論

        為了克服現(xiàn)有研究的局限性,本文提出FCM聚類算法具有結(jié)構(gòu)簡單的特點(diǎn),能夠在樣本點(diǎn)較少的情況下正確地區(qū)分每一種控制圖模式,并且識(shí)別能力較為穩(wěn)定。具體而言,本文的研究結(jié)論如下。

        1) 不同的停止閾值取值對FCM聚類算法的識(shí)別能力影響較大。在其他條件一定的情況下,當(dāng)ε=8.25×10?5和 ε=10?5時(shí),其識(shí)別準(zhǔn)確率分別為最高98.76%和96.02%。

        2) 由于不同的小波函數(shù)具有不完全相同的特性,利用不同的小波函數(shù)處理原始數(shù)據(jù)也會(huì)影響該方法的識(shí)別性能,其中利用coif4小波函數(shù)進(jìn)行特征提取后的數(shù)據(jù)進(jìn)行識(shí)別訓(xùn)練表現(xiàn)出較好的識(shí)別能力。

        3) FCM聚類算法對訓(xùn)練集的數(shù)量要求較低,在訓(xùn)練集為120個(gè)時(shí)已經(jīng)能達(dá)到99.27%的識(shí)別準(zhǔn)確率,并且FCM聚類算法對樣本量的需求具有明顯的區(qū)間性,在特定數(shù)量區(qū)間的訓(xùn)練集下能夠獲得相近的識(shí)別準(zhǔn)確率。同其他機(jī)器學(xué)習(xí)算法類似,隨著訓(xùn)練集的增加,該方法也會(huì)出現(xiàn)“過擬合”現(xiàn)象。

        盡管該方法對6種控制圖模式的識(shí)別準(zhǔn)確率也達(dá)到較高的水準(zhǔn),但不同控制圖模式之間的誤判仍然存在,對特定控制圖模式的識(shí)別準(zhǔn)確率仍存在提高的空間。此外,本文是以單一模式的控制圖作為識(shí)別對象,實(shí)際生產(chǎn)過程中的控制圖模式可能是混合存在的,這也是需要進(jìn)一步研究的方向。

        猜你喜歡
        模式識(shí)別能力
        消防安全四個(gè)能力
        幽默是一種能力
        大興學(xué)習(xí)之風(fēng) 提升履職能力
        紫地榆HPLC指紋圖譜建立及模式識(shí)別
        中成藥(2018年2期)2018-05-09 07:19:52
        你的換位思考能力如何
        努力拓展無人機(jī)飛行能力
        無人機(jī)(2017年10期)2017-07-06 03:04:36
        淺談模式識(shí)別在圖像識(shí)別中的應(yīng)用
        電子測試(2017年23期)2017-04-04 05:06:50
        第四屆亞洲模式識(shí)別會(huì)議
        可拓模式識(shí)別算法中經(jīng)典域的確定方法
        抄能力
        亚洲一区二区三区免费网站| 国产精品久久一区二区蜜桃| 国产欧美另类精品久久久| 中文字幕大乳少妇| 亚洲综合免费在线视频| 美女丝袜诱惑在线播放蜜桃| 久久综合九色综合97婷婷| 极品少妇被黑人白浆直流| 怡红院av一区二区三区| 伊人久久大香线蕉av一区| 国产一区二区三区美女| 欧美三级超在线视频| 一区二区三区免费观看在线视频| 亚洲福利一区二区不卡| 少妇熟女天堂网av天堂| 国产av剧情一区二区三区| 亚洲av午夜福利精品一区| 成人网站免费看黄a站视频| 亚洲精品毛片一区二区三区| 亚洲AV无码久久久一区二不卡| 久久精品视频按摩| 亚洲av熟女天堂久久天堂| 男人的天堂手机版av| 国产办公室秘书无码精品99| 99精品国产在热久久| 色av综合av综合无码网站| 国产午夜视频免费观看| av资源在线永久免费观看| 午夜男女靠比视频免费| 亚洲精品电影院| a级毛片免费观看在线| 精品人妻无码中文字幕在线| 国产在线观看网址不卡一区 | 亚洲精品一区二区三区国产| 综合色免费在线精品视频| 日本最新免费二区三区| 激情综合色五月丁香六月亚洲| 波多野结衣视频网址| 中文字幕亚洲区第一页| 亚洲性日韩一区二区三区| 成人特黄a级毛片免费视频|